python统计文本有多少个单词(2023年最新分享)

大哥大姐们有没有人讲详细点的,我想教下,python统计文本有多少个单词(2023年最新分享)
最新回答
爱你让我明白

2024-11-28 09:39:22

导读:今天首席CTO笔记来给各位分享关于python统计文本有多少个单词的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

如何用python统计一个txt文件中各个单词出现的次数

1、首先,定义一个变量,保存要统计的英文文章。

2、接着,定义两个数组,保存文章中的单词,以及各单词的词频。

3、从文章中分割出所有的单词,保存在数组中。

4、然后,计算文章中单词的总数,保存在变量中。

5、用for循环,统计文章中各单词的词频。

6、最后,输出文章中各单词的词频。

7、运行程序,电脑会自动统计输入文章中各单词的词频。

python统计个单词数目

楼上的程序存在诸多问题,如没有处理标点,文件读取方法错误等。

请问楼主要区分大小写吗?如果区分的话,就按照下面的来:

importre

defget_word_frequencies(file_name):

dic={}

txt=open(filename,'r').read().splitlines()

#下面这句替换了除了'-'外的所有标点,因为'-'可能存在于单词中。

txt=re.sub(r'[^\u4e00-\u94a5\w\d\-]','',txt)

#替换单独的'-'

txt=re.sub(r'-','',txt)

forlinein:

forwordinline.split():

#如果不区分大小写,那就一律按照小写处理,下面那句改为dic.setdefault(word.lower(),0)

dic.setdefault(word,0)

dic[word]+=1

printdic

if__name__='__main__':

get_word_frequencies('test.txt')

有问题继续追问吧

用python统计一段文本中单词出现的次数

python有个特别简单的方法就可以实现,直接用str的count方法就可以了,如下

python统计字符串中单词数量

使用比较基本的方法写的参考代码:

#!/usr/bin/env?python

#??-*-?coding:?utf-8?-*-

#python?2.7

import?re

print?u'请输入字符串:'

wz?=?raw_input()

s?=?wz.lower()

#小写单词的正则表达式

r='[a-z]+'

#找到所有单词

ws?=?re.findall(r,s)

#定义一个字典来存储单词和次数

dt?=?{}

for?w?in?ws:

dt[w]?=?dt.setdefault(w,0)+1

#wd来存储单词集合,可能有几个,比如2个单词,都出现30次

wd?=?[]

#max用来存储单词出现的最多的次数

max?=?0

for?word,times?in?dt.items():

if?timesmax:

wd?=?[]

wd.append(word)

max?=?times

elif?times?==?max:

wd.append(word)

print?u'有%s个单词,出现频率最高:'%len(wd)

for?x?in?wd:

print?"%s\t%s"%(x,max)

测试

请输入字符串:

A?good?beginning?makes?a?good?ending!!!

有2个单词,出现频率最高:

a???????2

good????2

python,字符串怎么统计单词个数

如果你是指一串单词,空格隔开的,统计词频,就用列表和字典来。

比如输入的是这样:thisoneokthisonetwothreegoendatend

dic1={}

n=input().split()

foriinn:

缩进ifiindic1:dic1[i]+=1

缩进else:dic1[i]=1

print(dic1)

python中怎么样统计一篇文章中的单词个数

你好,楼主,可以使用字符串的统计函数来完成。

详细代码如下:

w='python,我爱python,hellopython。'

print("python出现了%s次"%w.count('python'))

结语:以上就是首席CTO笔记为大家整理的关于python统计文本有多少个单词的全部内容了,感谢您花时间阅读本站内容,希望对您有所帮助,更多关于python统计文本有多少个单词的相关内容别忘了在本站进行查找喔。