使用Python编写的get_source()函数:直接获取网页的源代码
发布时间:2024-01-14 09:05:25
下面是一个使用Python编写的get_source()函数的示例,用于直接获取网页的源代码。
import requests
def get_source(url):
try:
response = requests.get(url)
if response.status_code == 200:
return response.text
else:
return None
except requests.exceptions.RequestException as e:
print("Error: ", e)
return None
# 使用例子
url = 'https://www.example.com' # 请替换为你想要获取源代码的网页的URL
source_code = get_source(url)
if source_code:
print('网页源代码:', source_code)
else:
print('无法获取该网页的源代码')
使用上述代码,我们将获取指定URL的网页源代码。首先,我们定义了一个get_source()函数,它接受一个URL作为参数。在函数内部,我们使用requests库发送HTTP GET请求,以获取指定URL的响应。如果响应的状态码是200,表示请求成功,我们将返回响应的文本内容,即网页的源代码。如果请求失败或出现异常,我们将返回None。
在使用例子中,我们指定了一个URL,并使用get_source()函数获取其网页源代码。如果函数成功返回源代码,我们将打印出来;否则,我们将提示无法获取该网页的源代码。
请注意,使用上述代码需要先安装requests库,你可以通过运行
命令来安装它。另外,当请求发生异常时,我们捕获并打印了异常信息,以便更好地处理错误情况。这个get_source()函数是一个基本的示例,你可以根据实际需求对其进行扩展和修改。例如,你可以添加错误处理逻辑,或者将获取的源代码保存到文件中等。
