使用jieba库的posseg.cut()函数实现中文文本分词的Python例子
发布时间:2023-12-19 02:21:01
import jieba
import jieba.posseg as pseg
def cut_text(text):
words = pseg.cut(text)
result = []
for word, flag in words:
result.append((word, flag))
return result
text = "今天天气很好,适合出去游玩。"
result = cut_text(text)
for word, flag in result:
print(word, flag)
# 输出结果:
# 今天 t
# 天气 n
# 很好 d
# , x
# 适合 v
# 出去 v
# 游玩 v
# 。 x
text = "我喜欢吃苹果。"
result = cut_text(text)
for word, flag in result:
print(word, flag)
# 输出结果:
# 我 r
# 喜欢 v
# 吃 v
# 苹果 n
# 。 x
text = "我有一个梦想,希望有一天能够环游世界。"
result = cut_text(text)
for word, flag in result:
print(word, flag)
# 输出结果:
# 我 r
# 有 v
# 一个 m
# 梦想 v
# , x
# 希望 v
# 有一天 t
# 能够 v
# 环游 v
# 世界 n
# 。 x
