用Python编写的get_source()函数帮助你获取网页源代码
发布时间:2024-01-14 09:02:35
在Python中,要获取网页的源代码,可以使用requests库来发送HTTP请求,并使用其中的text属性来获取网页的源代码。下面是一个用Python编写的get_source()函数,用于获取网页源代码的例子:
import requests
def get_source(url):
try:
response = requests.get(url)
if response.status_code == 200:
return response.text
else:
print('Error:', response.status_code)
except requests.exceptions.RequestException as e:
print('Error:', e)
# 使用例子
url = 'https://www.example.com'
source = get_source(url)
print(source)
在上面的例子中,我们首先导入了requests库,并定义了一个get_source()函数,它接受一个URL作为参数来获取该URL对应网页的源代码。
在get_source()函数中,我们使用了requests.get()方法来发送GET请求,并将响应保存在response对象中。然后,我们检查响应的状态码是否为200,如果是200,则表示请求成功,我们可以通过response.text属性获取网页的源代码。
如果请求失败(例如网页不存在或网络连接问题等),requests库会引发requests.exceptions.RequestException异常,我们可以在except语句块中处理这些异常。
在使用例子中,我们提供了一个URL(https://www.example.com)作为参数调用get_source()函数,并将返回的源代码保存在source变量中。最后,我们打印出源代码。
请注意,在实际使用时,你需要根据自己的需求和情况对该函数进行适当的修改和优化。例如,你可以添加对重定向、超时等情况的处理,或者通过修改请求头部信息来模拟浏览器发送请求。
