如何通过Python爬取网络图片并保存到本地

发布时间：2024-01-09 06:59:56

网络爬虫是一种自动获取网络信息的程序，可以通过Python编写实现。在Python中，我们可以使用第三方库如requests和beautifulsoup来实现爬虫并下载网络图片到本地。

下面是一个使用Python爬取网络图片并保存到本地的示例代码：

import requests
import os

def download_image(url, save_dir):
    # 获取图片文件名
    file_name = url.split('/')[-1]
    # 拼接保存路径
    save_path = os.path.join(save_dir, file_name)
    
    try:
        # 发送HTTP请求，获取图片内容
        response = requests.get(url)
        if response.status_code == 200:
            # 保存图片到本地
            with open(save_path, 'wb') as f:
                f.write(response.content)
            print(f"图片保存成功：{save_path}")
        else:
            print(f"图片下载失败：{url}")
    except Exception as e:
        print(f"图片下载异常：{url}，{str(e)}")

def main():
    url = "https://example.com/image.jpg"  # 网络图片的URL
    save_dir = "images"  # 图片保存目录
    
    if not os.path.exists(save_dir):
        os.makedirs(save_dir)
    
    # 调用下载函数
    download_image(url, save_dir)

if __name__ == "__main__":
    main()

在上述代码中，我们定义了一个download_image函数，用于下载图片并保存到本地。函数接受两个参数：url表示网络图片的URL地址，save_dir表示保存图片的目录。

首先，我们通过url.split('/')[-1]获取图片的文件名，然后使用os.path.join(save_dir, file_name)拼接保存路径。

接下来，我们使用requests.get发送HTTP请求，获取图片的内容。如果返回的状态码为200，表示请求成功，我们将图片内容保存到本地文件。最后，我们在终端打印出保存成功或失败的信息。

在main函数中，我们可以设置要下载的图片的URL和保存目录，然后调用download_image函数进行下载。

注意，我们还使用os.makedirs(save_dir)创建了保存目录。这是因为如果目录不存在，open函数会报错。以防万一，我们可以在下载之前先检查目录是否存在，并创建它。

你可以将上述代码保存为一个Python文件，运行它即可下载网络图片并保存到本地。

需要注意的是，爬取网络图片存在一定的法律和道德风险，需要遵守相关法律法规并尊重他人的知识产权。请确保你有合法的权限来下载和使用这些图片。