使用Python的requests.utils.urlparse()函数来解析URL地址

发布时间：2023-12-14 02:10:20

Python的requests库提供了urlparse()函数来解析URL地址。这个函数可以将URL拆分成若干个组成部分，包括协议、域名、路径、查询参数等等。下面是一个示例，演示了如何使用该函数来解析URL地址：

import requests
from urllib.parse import urlparse

# 定义一个URL地址
url = "https://www.example.com/path?param1=value1&param2=value2"

# 使用urlparse()函数解析URL
parsed_url = urlparse(url)

# 获取URL的协议
protocol = parsed_url.scheme
print("协议：" + protocol)

# 获取URL的域名
domain = parsed_url.netloc
print("域名：" + domain)

# 获取URL的路径
path = parsed_url.path
print("路径：" + path)

# 获取URL的查询参数
query_params = parsed_url.query
print("查询参数：" + query_params)

# 将查询参数解析成字典形式
query_dict = dict(qc.split("=") for qc in query_params.split("&"))
print("查询参数字典：" + str(query_dict))

运行上述代码，将会输出以下结果：

协议：https
域名：www.example.com
路径：/path
查询参数：param1=value1&param2=value2
查询参数字典：{'param1': 'value1', 'param2': 'value2'}

首先，我们导入了requests库和urlparse函数。然后，定义一个URL地址作为示例。接下来，使用urlparse()函数解析URL地址，结果存储在parsed_url变量中。

我们可以通过parsed_url.scheme获取URL的协议，通过parsed_url.netloc获取URL的域名，通过parsed_url.path获取URL的路径，通过parsed_url.query获取URL的查询参数。

最后，我们将查询参数解析成字典形式，可以方便地获取查询参数的键值对。

通过使用requests.utils.urlparse()函数，我们能够轻松地解析URL地址的各个组成部分，从而更好地处理和利用URL。