如何使用Python函数下载文件

发布时间：2023-06-09 12:44:57

Python是一种高级编程语言，被广泛应用于各种领域，比如数据科学、机器学习、Web开发等。在大多数应用程序中，文件的下载和上传是至关重要的一环。Python提供了各种函数和库，可以轻松地实现文件下载。本文将介绍如何使用Python函数下载文件。

一、使用urlretrieve()函数下载文件

Python中最简单的下载文件方法之一是使用urllib库中的urlretrieve()函数。该函数可以从Cookie或HTTP头中自动处理请求，并将所请求的文件下载到指定位置。urlretrieve()函数的语法如下：

urllib.urlretrieve(url[, filename[, reporthook[, data]]])

其中，url是文件的URL地址，filename是保存文件的本地路径（可以不填，默认为当前目录下与URL相同的文件名），reporthook是可选的一个回调函数，用于返回下载进度信息，data是可选的传递给回调函数的参数。

例如，以下代码下载了一个图片文件，并将其保存在本地：

import urllib.request

url = 'http://example.com/images/picture.jpg'

urllib.request.urlretrieve(url, 'picture.jpg')

在运行此代码后，你会在当前目录下看到一个名为picture.jpg的文件。

二、使用requests库下载文件

requests是Python中最常用的HTTP库之一，它提供了简单而强大的API，可以发送各种HTTP请求，并处理响应。requests库中的get()方法可以用于从指定的URL下载文件。get()方法的语法如下：

requests.get(url, params=None, **kwargs)

其中，url是文件的URL地址，params是可选的请求参数，在GET请求中传递。**kwargs是关键字参数，可以设置请求头、超时时间等参数。

以下代码使用GET请求从指定URL下载文件，并将文件保存到本地文件系统：

import requests

url = 'http://example.com/images/picture.jpg'

response = requests.get(url)

with open('picture.jpg', 'wb') as f:

f.write(response.content)

在上述代码中，我们首先使用requests库中的get()方法从指定的URL获取文件的二进制内容。然后，我们使用Python内置的open()函数创建一个名为picture.jpg的新文件，并使用"wb"模式写入文件。最后，我们将获取到的文件二进制内容通过Python的文件句柄写入新文件中。

三、使用wget库下载文件

wget是一个非常流行的Linux命令行工具，用于从网络上下载文件。因为它拥有多种可定制的选项和能力，wget库已经被移植到Python中。使用wget库下载文件的语法如下：

import wget

file = wget.download(url)

使用上述代码，wget库会自动从指定的URL下载文件，并将文件保存到Python脚本的当前工作目录中。若需要将文件保存到其他目录中，可以通过添加目录路径来实现。

wget库还提供了其他一些可选参数，例如指定HTTP头、设置下载进度条等。

四、使用urllib2库下载文件

urllib2是Python 2.x中前端请求网络资源时最常使用的库之一。通过使用urllib2库中的urlopen()函数，可以从指定的URL打开文件，然后使用Python的内置文件操作函数进行读写。使用urllib2库下载文件的示例如下：

import urllib2

response = urllib2.urlopen('http://example.com/images/picture.jpg')

with open('picture.jpg', 'wb') as f:

f.write(response.read())

在上述代码中，我们首先使用urlopen()函数打开指定的URL，获取到了文件的二进制内容。然后，我们使用Python的内置open()函数创建一个名为picture.jpg的新文件，将获取到的文件二进制内容通过Python的文件句柄写入新文件中。

需要注意的是，urllib2库已经没有维护更新了，包括在Python 3.x中标准库中也已被移除，因此推荐使用Python 3.x中的requests库和urllib库进行文件下载。

五、使用urllib库进行文件下载

Python中的urllib库是一个包含一系列模块的库，里面包含各种功能，例如：HTTP协议请求、处理URL编码字符、管理cookie等。其中，urllib.request作为HTTP客户端的封装，可以完成GET、POST等HTTP请求。

通过使用urllib库中的urlretrieve()函数，可以从指定的URL下载文件并将其保存到本地文件系统。使用urlretrieve()函数进行文件下载的示例如下：

import urllib.request

url = 'http://example.com/images/picture.jpg'

urllib.request.urlretrieve(url, 'picture.jpg')

在上述代码中，urllib库中的urlretrieve()函数可以从指定URL下载文件并将其保存到本地文件系统。个参数是文件的URL地址，第二个参数是保存文件的本地路径（可以不填，默认为当前目录下与URL相同的文件名）。

六、总结

文件下载是许多应用程序中很重要的一环。Python提供了许多功能库和函数，可以轻松地实现文件下载。本文介绍了使用urlretrieve()函数、requests库、wget库、urllib2库和urllib库中的urlretrieve()函数进行文件下载的方法。这些方法的简单易用性和广泛性使它们成为处理文件下载的合理选择。