欢迎访问宙启技术站
智能推送

使用jieba库的posseg.cut()函数实现中文文本分词的Python例子

发布时间:2023-12-19 02:21:01

import jieba

import jieba.posseg as pseg

def cut_text(text):

    words = pseg.cut(text)

    result = []

    for word, flag in words:

        result.append((word, flag))

    return result

text = "今天天气很好,适合出去游玩。"

result = cut_text(text)

for word, flag in result:

    print(word, flag)

    

# 输出结果:

# 今天 t

# 天气 n

# 很好 d

# , x

# 适合 v

# 出去 v

# 游玩 v

# 。 x

text = "我喜欢吃苹果。"

result = cut_text(text)

for word, flag in result:

    print(word, flag)

    

# 输出结果:

# 我 r

# 喜欢 v

# 吃 v

# 苹果 n

# 。 x

text = "我有一个梦想,希望有一天能够环游世界。"

result = cut_text(text)

for word, flag in result:

    print(word, flag)

    

# 输出结果:

# 我 r

# 有 v

# 一个 m

# 梦想 v

# , x

# 希望 v

# 有一天 t

# 能够 v

# 环游 v

# 世界 n

# 。 x