获取网页源代码的简单方法:Python中的get_source()函数
发布时间:2024-01-14 09:02:20
在Python中,我们可以使用requests库来发送HTTP请求并获取网页源代码。下面是一个使用get_source()函数获取网页源代码的简单方法的示例代码:
import requests
def get_source(url):
# 发送GET请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 返回网页源代码
return response.text
else:
# 请求失败,返回空字符串
return ""
# 使用例子
url = "https://www.example.com"
source_code = get_source(url)
print(source_code)
在上述示例代码中,我们定义了一个get_source()函数来获取网页的源代码。该函数接受一个参数url,表示要获取源代码的网页地址。在函数内部,我们使用requests.get()方法发送GET请求,并将响应保存在response变量中。
然后,我们检查响应的状态码response.status_code是否为200,如果是200表示请求成功,我们可以通过response.text获取网页的源代码。如果响应的状态码不是200,则表示请求失败,我们返回一个空字符串。
在使用例子中,我们指定了一个URL,然后调用get_source()函数来获取网页源代码,并将其打印出来。
需要注意的是,使用requests库需要事先安装。你可以通过以下命令来安装该库:
pip install requests
通过上述方法,你可以简单地获取网页的源代码,并在Python中进行进一步的处理和分析。
