Python爬虫实现图片的批量下载

发布时间：2023-12-04 22:25:34

Python是一种功能强大的编程语言，提供了许多模块和库，可以用来实现各种各样的任务，包括网络爬虫。在本文中，我们将介绍如何使用Python编写一个简单的网络爬虫，用于批量下载图片。

首先，我们需要安装一个名为requests的Python库。它是一个简单而优雅的HTTP库，可以轻松地发送HTTP请求。你可以在命令行中使用以下命令来安装它：

pip install requests

安装完requests库后，我们可以开始编写我们的爬虫代码了。以下是一个简单的示例：

import requests

def download_image(url, filename):
    response = requests.get(url)
    with open(filename, "wb") as file:
        file.write(response.content)

def batch_download_images(urls, folder):
    for i, url in enumerate(urls):
        filename = f"{folder}/image_{i+1}.jpg"
        download_image(url, filename)
        print(f"Image {i+1} downloaded.")

# 根据需要替换为你自己的图片链接
image_urls = [
    "https://example.com/image1.jpg",
    "https://example.com/image2.jpg",
    "https://example.com/image3.jpg"
]

# 创建一个文件夹来保存下载的图片
folder = "images"
if not os.path.exists(folder):
    os.makedirs(folder)

# 批量下载图片
batch_download_images(image_urls, folder)

在上面的代码中，我们定义了两个函数。download_image函数接受一个图片URL和一个文件名作为参数，在给定的文件名下将图片保存到本地。batch_download_images函数接受一个图片URL的列表和一个文件夹名字作为参数，使用download_image函数循环下载列表中的图片。

在示例代码中，我们创建了一个image_urls列表，其中包含了三个图片的链接。你可以根据自己的需要修改这个列表，或者从其他位置动态获取这些链接。

我们还使用os模块对下载的图片进行保存。在示例中，我们将所有的图片保存在一个名为images的文件夹中。如果该文件夹不存在，我们会在开始下载之前创建它。

你可以根据需要更改文件夹的名称，或者使用一个相对路径来指定图片保存的位置。

在运行这段代码之后，你将看到下载的图片保存在指定的文件夹中，并且终端中将打印出每张图片的下载进度。

总结起来，使用Python编写一个图片下载器并不复杂。你只需要几行代码，就可以批量下载图片并保存到本地。这个例子只是爬虫的一个简单示例，你可以根据自己的需要进行修改和扩展。