2024-11-28 09:39:22
导读:今天首席CTO笔记来给各位分享关于python统计文本有多少个单词的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
如何用python统计一个txt文件中各个单词出现的次数1、首先,定义一个变量,保存要统计的英文文章。
2、接着,定义两个数组,保存文章中的单词,以及各单词的词频。
3、从文章中分割出所有的单词,保存在数组中。
4、然后,计算文章中单词的总数,保存在变量中。
5、用for循环,统计文章中各单词的词频。
6、最后,输出文章中各单词的词频。
7、运行程序,电脑会自动统计输入文章中各单词的词频。
python统计个单词数目楼上的程序存在诸多问题,如没有处理标点,文件读取方法错误等。
请问楼主要区分大小写吗?如果区分的话,就按照下面的来:
importre
defget_word_frequencies(file_name):
dic={}
txt=open(filename,'r').read().splitlines()
#下面这句替换了除了'-'外的所有标点,因为'-'可能存在于单词中。
txt=re.sub(r'[^\u4e00-\u94a5\w\d\-]','',txt)
#替换单独的'-'
txt=re.sub(r'-','',txt)
forlinein:
forwordinline.split():
#如果不区分大小写,那就一律按照小写处理,下面那句改为dic.setdefault(word.lower(),0)
dic.setdefault(word,0)
dic[word]+=1
printdic
if__name__='__main__':
get_word_frequencies('test.txt')
有问题继续追问吧
用python统计一段文本中单词出现的次数
python有个特别简单的方法就可以实现,直接用str的count方法就可以了,如下
python统计字符串中单词数量使用比较基本的方法写的参考代码:
#!/usr/bin/env?python
#??-*-?coding:?utf-8?-*-
#python?2.7
import?re
print?u'请输入字符串:'
wz?=?raw_input()
s?=?wz.lower()
#小写单词的正则表达式
r='[a-z]+'
#找到所有单词
ws?=?re.findall(r,s)
#定义一个字典来存储单词和次数
dt?=?{}
for?w?in?ws:
dt[w]?=?dt.setdefault(w,0)+1
#wd来存储单词集合,可能有几个,比如2个单词,都出现30次
wd?=?[]
#max用来存储单词出现的最多的次数
max?=?0
for?word,times?in?dt.items():
if?timesmax:
wd?=?[]
wd.append(word)
max?=?times
elif?times?==?max:
wd.append(word)
print?u'有%s个单词,出现频率最高:'%len(wd)
for?x?in?wd:
print?"%s\t%s"%(x,max)
测试
请输入字符串:
A?good?beginning?makes?a?good?ending!!!
有2个单词,出现频率最高:
a???????2
good????2
python,字符串怎么统计单词个数如果你是指一串单词,空格隔开的,统计词频,就用列表和字典来。
比如输入的是这样:thisoneokthisonetwothreegoendatend
dic1={}
n=input().split()
foriinn:
缩进ifiindic1:dic1[i]+=1
缩进else:dic1[i]=1
print(dic1)
python中怎么样统计一篇文章中的单词个数你好,楼主,可以使用字符串的统计函数来完成。
详细代码如下:
w='python,我爱python,hellopython。'
print("python出现了%s次"%w.count('python'))
结语:以上就是首席CTO笔记为大家整理的关于python统计文本有多少个单词的全部内容了,感谢您花时间阅读本站内容,希望对您有所帮助,更多关于python统计文本有多少个单词的相关内容别忘了在本站进行查找喔。