欢迎访问宙启技术站
智能推送

获取网页源代码的简单方法:Python中的get_source()函数

发布时间:2024-01-14 09:02:20

在Python中,我们可以使用requests库来发送HTTP请求并获取网页源代码。下面是一个使用get_source()函数获取网页源代码的简单方法的示例代码:

import requests

def get_source(url):
    # 发送GET请求
    response = requests.get(url)
    
    # 检查请求是否成功
    if response.status_code == 200:
        # 返回网页源代码
        return response.text
    else:
        # 请求失败,返回空字符串
        return ""

# 使用例子
url = "https://www.example.com"
source_code = get_source(url)
print(source_code)

在上述示例代码中,我们定义了一个get_source()函数来获取网页的源代码。该函数接受一个参数url,表示要获取源代码的网页地址。在函数内部,我们使用requests.get()方法发送GET请求,并将响应保存在response变量中。

然后,我们检查响应的状态码response.status_code是否为200,如果是200表示请求成功,我们可以通过response.text获取网页的源代码。如果响应的状态码不是200,则表示请求失败,我们返回一个空字符串。

在使用例子中,我们指定了一个URL,然后调用get_source()函数来获取网页源代码,并将其打印出来。

需要注意的是,使用requests库需要事先安装。你可以通过以下命令来安装该库:

pip install requests

通过上述方法,你可以简单地获取网页的源代码,并在Python中进行进一步的处理和分析。