欢迎访问宙启技术站
智能推送

使用Python编写的get_source()函数:直接获取网页的源代码

发布时间:2024-01-14 09:05:25

下面是一个使用Python编写的get_source()函数的示例,用于直接获取网页的源代码。

import requests

def get_source(url):
    try:
        response = requests.get(url)
        if response.status_code == 200:
            return response.text
        else:
            return None
    except requests.exceptions.RequestException as e:
        print("Error: ", e)
        return None

# 使用例子
url = 'https://www.example.com'  # 请替换为你想要获取源代码的网页的URL
source_code = get_source(url)
if source_code:
    print('网页源代码:', source_code)
else:
    print('无法获取该网页的源代码')

使用上述代码,我们将获取指定URL的网页源代码。首先,我们定义了一个get_source()函数,它接受一个URL作为参数。在函数内部,我们使用requests库发送HTTP GET请求,以获取指定URL的响应。如果响应的状态码是200,表示请求成功,我们将返回响应的文本内容,即网页的源代码。如果请求失败或出现异常,我们将返回None。

在使用例子中,我们指定了一个URL,并使用get_source()函数获取其网页源代码。如果函数成功返回源代码,我们将打印出来;否则,我们将提示无法获取该网页的源代码。

请注意,使用上述代码需要先安装requests库,你可以通过运行

命令来安装它。另外,当请求发生异常时,我们捕获并打印了异常信息,以便更好地处理错误情况。

这个get_source()函数是一个基本的示例,你可以根据实际需求对其进行扩展和修改。例如,你可以添加错误处理逻辑,或者将获取的源代码保存到文件中等。