欢迎访问宙启技术站
智能推送

常用STOPWORDS及其在中文词云中的应用

发布时间:2023-12-25 04:50:45

常用的stopwords是一些在文本分析中起到噪音作用的常用词,它们对于提取出文本的关键内容并进行词云展示是很有帮助的。以下是一些常用的stopwords及其在中文词云中的应用,带有使用例子。

1. 的:中文文章中最常见的字,一般不包含在词云中。

例子:这是一段包含停用词的例句。

2. 是:表示等式或者陈述性的动词,常常出现在句子中,不包含在词云中。

例子:这是一个包含停用词的句子。

3. 了:表示完成或者变化的动词,不包含在词云中。

例子:这是另外一个包含停用词的例子。

4. 我: 人称代词,一般不包含在词云中。

例子:我今天去了一个很好的地方。

5. 你:第二人称代词,一般不包含在词云中。

例子:你今天看到了什么有趣的事情?

6. 是的:用于回答肯定的问题或者陈述性句子,不包含在词云中。

例子:你是不是很喜欢这个地方?

7. 在:表示位置或者状态的介词,一般不包含在词云中。

例子:我在家里等你。

8. 等:表示待在某个地方或者情况,不包含在词云中。

例子:我在家等你的到来。

9. 有:表示拥有或者存在的动词,一般不包含在词云中。

例子:我有一个好消息告诉你。

10. 好:表示好的品质或者程度的形容词,一般不包含在词云中。

例子:这是一个很好的机会。

以上是一些常用的stopwords及其在中文词云中的应用,这些词在文本分析中一般不会被包含在词云中,因为它们不具备用来反映文本关键内容的特征。在进行中文词云展示时,应该去除这些stopwords,以突出展示文本中更加有意义和重要的词语。