欢迎访问宙启技术站
智能推送

用Python创建中文WordCloud词云图

发布时间:2023-12-18 12:52:00

使用Python创建中文词云图需要安装一些库,包括wordcloudjiebamatplotlib。以下是一个使用例子,通过分析儿童故事《小猪佩奇》的文本并生成词云图。

1. 安装所需的库

pip install wordcloud
pip install jieba
pip install matplotlib

2. 导入所需的库

import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt

3. 读取文本文件并进行分词

# 读取文本文件
with open('peppa_pig.txt', 'r', encoding='utf-8') as file:
    text = file.read()

# 进行中文分词
seg_list = jieba.cut(text, cut_all=False)
words = " ".join(seg_list)

4. 创建词云图

# 设置词云参数
wordcloud = WordCloud(font_path='msyh.ttc', width=800, height=600, max_words=100)

# 生成词云图
wordcloud.generate(words)

# 显示词云图
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()

在上述例子中,peppa_pig.txt 是包含《小猪佩奇》文本的文本文件,通过调整max_words参数可以控制显示的词语数量,font_path参数用于指定中文字体文件(此处使用了微软雅黑中文字体 msyh.ttc)。示例中使用的是基本的词云图创建方式,还可以调整其他参数来优化词云图的效果。

通过以上步骤,就可以创建一个展示《小猪佩奇》文本词云图的Python程序了。用户可以根据自己的需求选择其他文本进行词云图生成,或者根据实际情况对程序进行进一步的优化。