欢迎访问宙启技术站
智能推送

使用Python生成中文词云展示的简易方法

发布时间:2023-12-17 05:09:55

生成中文词云的方法有很多,以下是一个使用Python的例子,步骤如下:

1. 安装依赖库:首先需要安装jieba用于中文分词,以及wordcloud用于生成词云图。可以使用以下命令安装这两个库:

pip install jieba
pip install wordcloud

2. 导入库:在Python脚本中,导入jiebawordcloud库。

import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt

3. 准备中文文本:将要生成词云的中文文本保存在一个文本文件中,例如text.txt

4. 读取文本:使用Python读取文本文件,并进行中文分词。

with open('text.txt', 'r', encoding='utf-8') as f:
    text = f.read()

wordlist = jieba.lcut(text)  # 对文本进行中文分词,返回分词后的词列表

5. 生成词云:使用wordcloud库生成词云图。

wordcloud = WordCloud(font_path='SimHei.ttf', width=800, height=400).generate(' '.join(wordlist))

plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()

在生成词云时,我们指定了字体文件SimHei.ttf用于显示中文字符,可以根据需求更换为其他合适的字体文件。另外,我们也可以通过设置widthheight参数调整词云图的大小。

完整的示例代码如下:

import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt

with open('text.txt', 'r', encoding='utf-8') as f:
    text = f.read()

wordlist = jieba.lcut(text)

wordcloud = WordCloud(font_path='SimHei.ttf', width=800, height=400).generate(' '.join(wordlist))

plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()

这样就可以使用Python生成中文词云图了。根据自己的需求,可以对词云的样式、字体、大小等进行进一步的调整。