有時,我們需要統計一篇英語小短文中每一個英文字母呈現的次數,這個用手工統計顯然不成能完當作。即使共同電腦進行,也可能需要良多久。這時我們可以利用python編寫一個小程序,很輕松的完當作這個工作。下面看我一步步操作。
第一步,先讀入指心猿意馬文件的內容。因為這個文件比力小,可以直接讀入。若是文件較大,可以逐行或分部門讀入內存。
第二步,對讀入的文本將標點等特別符號、換行符、空格等替代為空。這一步比力主要,稱為數據清洗,一般利用遍歷+string.replace(old,new)來完當作。
第三步,將全文同一轉換當作小寫字母。這是為了便于統計,若是工作要求巨細寫字母分隔統計,這一步可以不操作。
第四步,成立統計字典,對文本逐個遍歷進行統計。利用字典get方式,已有的字母次數加上,沒有字母寫入字典。
第五步,按統計值進行排序。將字典鍵值對轉化為列表,然后再對列表按值進行降序擺列。
第六步,按排序成果插手文本后面。利用追加的體例讀入文件,然后遍歷列表,將字母及對應成果寫入文件。
0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!