使用TeleBot()创建一个爬虫机器人

发布时间：2024-01-11 08:07:45

使用TeleBot()创建一个爬虫机器人的例子：

import telebot
import requests
from bs4 import BeautifulSoup

TOKEN = 'YOUR_TELEGRAM_BOT_TOKEN'

bot = telebot.TeleBot(TOKEN)


@bot.message_handler(content_types=['text'])
def handle_command(message):
    command = message.text.lower()
    
    if command == '/start':
        bot.reply_to(message, '欢迎使用爬虫机器人！发送一个网址，我会帮您抓取网页内容！')
    elif command.startswith('http'):
        try:
            response = requests.get(command)
            soup = BeautifulSoup(response.text, 'html.parser')
            text = soup.get_text()
            bot.reply_to(message, text)
        except requests.exceptions.RequestException as e:
            bot.reply_to(message, f'抓取网页失败：{e}')
    else:
        bot.reply_to(message, '无效的指令，请发送一个网址或者使用 /start 开始')


bot.polling()

以上代码示例了如何使用TeleBot库创建一个爬虫机器人。首先，我们需要提供一个Telegram Bot的令牌（TOKEN）。接下来，我们创建了一个TeleBot对象，并将令牌传递给它。

然后，我们定义了一个处理命令的函数handle_command，它将在收到用户的消息时被调用。当用户发送/start命令时，机器人将回复一个欢迎消息。当用户发送一个以http开头的文本时，我们将认为它是一个网址，并尝试抓取该网页的内容。我们使用requests库发送一个GET请求获取网页内容，并使用BeautifulSoup库解析HTML文档。然后，我们从解析后的文档中提取文本，并将其回复给用户。

最后，我们通过调用bot.polling()启动机器人，并使其等待用户的消息。

请注意，这个例子只是一个简单示例，并没有处理所有可能的边界情况和错误处理。在实际应用中，您可能需要添加更多的代码来处理各种情况和异常。