如何在python中实现断点续传功能

发布时间：2023-12-16 00:58:52

断点续传是指在文件传输过程中，出现中断或者网络中断等问题时，能够记录已经传输的数据位置，并在恢复传输时从上次中断的位置继续传输，而不需要重新开始传输整个文件。

在Python中，可以通过使用requests库来实现网络请求和文件下载，通过读写文件的方式实现断点续传功能。

以下是一个实现断点续传功能的示例代码：

import requests
import os

def download_file(url, file_path):
    # 检查文件是否已经下载过一部分
    if os.path.exists(file_path):
        file_size = os.path.getsize(file_path)
        headers = {'Range': f'bytes={file_size}-'}
        mode = 'ab'  # 以追加的方式打开文件
    else:
        headers = {}
        mode = 'wb'  # 以写入的方式打开文件

    response = requests.get(url, headers=headers, stream=True)
    total_size = int(response.headers.get('Content-Length'))

    with open(file_path, mode) as file:
        if mode == 'ab':
            print(f'Resuming download from {file_size} bytes')
        else:
            print('Starting download')

        for chunk in response.iter_content(chunk_size=1024):
            if chunk:
                file.write(chunk)
                file.flush()

    print('Download completed')

# 使用示例
url = 'http://example.com/file.txt'  # 文件的URL地址
file_path = 'downloaded_file.txt'  # 下载文件保存的路径
download_file(url, file_path)

上述代码中，download_file函数接受两个参数：文件的URL地址和下载文件保存的路径。函数首先检查文件是否已经下载过一部分，如果已下载过，则设置请求头的Range字段为已下载的文件大小，表示从该位置开始继续下载。如果文件没有下载过，则直接开始下载。

然后，通过requests库发送GET请求获取文件数据，并使用文件的写模式打开文件。迭代读取数据块，并写入文件中，每写入一个数据块后，刷新文件缓冲区。最后，在完成下载后输出提示信息。

这样，当网络断开或者程序中断后，再次运行程序时，会检查已下载的文件大小，从上次中断的位置开始继续下载文件。

注意：这只是一个简单的实现示例，实际使用中还需要考虑异常处理、多线程下载等问题。