#《毛主席语录》的词频统计
心血来潮,写了一个Python脚本统计《毛主席语录》的词频,前五名为:
$ pip install jieba
$ python seg.py && cat mao_out.txt | sort | uniq -c | sort -rg | head -5
405 我们
220 人民
145 革命
145 他们
136 工作
简而言之,我们是人民,主要工作就是革命掉他们,即敌人!——主席V5!Orz.Orz..Orz...
特别感谢中文分词库:结巴。
#《毛主席语录》的词频统计
心血来潮,写了一个Python脚本统计《毛主席语录》的词频,前五名为:
$ pip install jieba
$ python seg.py && cat mao_out.txt | sort | uniq -c | sort -rg | head -5
405 我们
220 人民
145 革命
145 他们
136 工作
简而言之,我们是人民,主要工作就是革命掉他们,即敌人!——主席V5!Orz.Orz..Orz...
特别感谢中文分词库:结巴。