如何使用urllib库进行文件下载

发布时间：2024-01-14 13:57:44

urllib库是Python中用于进行URL操作（如打开网页、发送请求、获取响应等）的标准库。它提供了一个简单且功能丰富的方式来下载文件。接下来我将介绍如何使用urllib库进行文件下载，并提供一个使用例子。

1. 引入urllib库

首先需要在Python代码中引入urllib库的相关模块，包括urllib.request和urllib.parse，用于进行URL操作和文件下载。

import urllib.request
import urllib.parse

2. 构建URL和文件路径

接下来需要构建待下载文件的URL和本地文件的保存路径。

url = "http://example.com/file.txt"  # 待下载文件的URL
file_path = "/path/to/save/file.txt"  # 本地文件保存路径

3. 发送下载请求

使用urllib.request模块中的urlretrieve()函数发送下载请求。该函数接受两个参数：待下载文件的URL和保存文件的路径。它会将请求的文件下载到本地保存路径并返回保存路径。

saved_file_path, _ = urllib.request.urlretrieve(url, file_path)
print(f"文件已保存到: {saved_file_path}")

4. 下载进度显示

可以通过urlretrieve()函数的第三个参数回调函数来显示下载进度。

def progress(block_num, block_size, total_size):
    downloaded = block_num * block_size
    percent = downloaded * 100 / total_size
    print(f"已下载: {downloaded} bytes / 总大小: {total_size} bytes / 完成进度: {percent:.2f}%")

saved_file_path, _ = urllib.request.urlretrieve(url, file_path, progress)
print(f"文件已保存到: {saved_file_path}")

在这个例子中，我们定义了一个名为progress的回调函数，它接受三个参数：下载的块数、每块大小和总大小。根据这些参数，我们可以计算出已下载的文件大小和下载进度，并打印出来。然后将回调函数progress作为urlretrieve()函数的第三个参数传递，每当有数据块下载完成时，就会调用该回调函数。

这就是使用urllib库进行文件下载的基本步骤。根据具体需求，你可以在下载之前对URL进行解析和处理，也可以在下载过程中添加其他逻辑。

总结一下：

1. 引入urllib库的相关模块。

2. 构建待下载文件的URL和本地文件的保存路径。

3. 使用urlretrieve()函数发送下载请求，并指定保存文件的路径。

4. 可选：通过回调函数显示下载进度。

希望上述介绍对你有帮助，祝你在使用urllib库进行文件下载时顺利！