使用Python的requests.utils.urlparse()函数解析URL
发布时间:2023-12-14 02:00:30
requests.utils.urlparse()函数是Python中requests库的一个函数,用于解析URL。
URL(Uniform Resource Locator)是指定了访问服务器资源的路径的地址,一般由协议、主机名、路径等几部分组成。对于一个URL字符串,我们可以使用urlparse函数将其解析成一个具有6个属性的元组,包括scheme(协议)、netloc(主机名)、path(路径)、params(参数)、query(查询参数)和fragment(片段)。
下面是使用requests.utils.urlparse()函数解析URL的例子:
import requests.utils
# 定义一个URL字符串
url = 'https://www.example.com/path/page?param1=value1¶m2=value2#fragment'
# 使用urlparse函数解析URL
parsed_url = requests.utils.urlparse(url)
# 获取并打印解析后的各个属性
print("Scheme:", parsed_url.scheme)
print("Netloc:", parsed_url.netloc)
print("Path:", parsed_url.path)
print("Params:", parsed_url.params)
print("Query:", parsed_url.query)
print("Fragment:", parsed_url.fragment)
上述例子中,我们定义了一个URL字符串'https://www.example.com/path/page?param1=value1¶m2=value2#fragment',然后使用urlparse函数解析该URL。
解析结果将会被存储在一个名为parsed_url的变量中,此变量是一个元组,包含了6个属性。
接下来,我们使用print语句将解析后的各个属性打印出来。
运行上述代码,将会得到如下输出:
Scheme: https Netloc: www.example.com Path: /path/page Params: Query: param1=value1¶m2=value2 Fragment: fragment
从输出结果中可以看出,解析URL后,我们可以通过访问元组中的属性来获取URL的各个部分。
