six.moves.urllib.parse中的urljoin()方法及其使用示例
发布时间:2023-12-23 04:54:45
urljoin()方法是six.moves.urllib.parse模块中的一个函数,用于拼接URL地址。它将一个基础URL和一个相对URL作为参数,返回一个完整的URL。
使用示例:
from six.moves.urllib.parse import urljoin base_url = 'https://www.example.com/' relative_url = 'images/image.jpg' full_url = urljoin(base_url, relative_url) print(full_url)
在这个例子中,我们有一个基础URL https://www.example.com/ 和一个相对URL images/image.jpg。我们使用urljoin()函数将这两个URL拼接在一起,并存储在full_url变量中。然后,我们打印出full_url的值。
输出结果:
https://www.example.com/images/image.jpg
当基础URL以斜杠结尾时(例如https://www.example.com/),urljoin()函数会自动忽略相对URL中的第一个斜杠。这意味着images/image.jpg会被拼接在基础URL的末尾,形成完整的URL。
如果基础URL不以斜杠结尾,而相对URL以斜杠开头,urljoin()函数会将两个URL连接起来,其中基础URL的最后一个斜杠之后的内容将被丢弃。
使用示例:
from six.moves.urllib.parse import urljoin base_url = 'https://www.example.com' relative_url = '/images/image.jpg' full_url = urljoin(base_url, relative_url) print(full_url)
输出结果:
https://www.example.com/images/image.jpg
在这个例子中,我们去掉了基础URL的末尾斜杠,并在相对URL的开头添加了一个斜杠。 urljoin()函数会将这两个URL连接起来,得到完整的URL。
urljoin()函数还可以正确处理网络协议。如果相对URL包含完整的网络协议(例如https://),urljoin()函数会将基础URL替换为相对URL并返回。
使用示例:
from six.moves.urllib.parse import urljoin base_url = 'https://www.example.com/' relative_url = 'https://www.otherwebsite.com/image.jpg' full_url = urljoin(base_url, relative_url) print(full_url)
输出结果:
https://www.otherwebsite.com/image.jpg
在这个例子中,urljoin()函数将基本URL替换为相对URL,因为相对URL已经包含完整的网络协议。
