
Python利用文本保存的链接批量下载不存在的文件
发布日期:2021-05-07 21:44:57
浏览次数:21
分类:精选文章
本文共 1371 字,大约阅读时间需要 4 分钟。
Python脚本实现自动下载图片模块
本文将介绍一个基于Python编程语言的自动图片下载脚本,该脚本能够通过指定的URL链接自动下载并保存图片文件。本文将详细解释脚本的核心功能以及实现方法。
核心功能模块分析
脚本主要包含两个主要功能模块:
- 文件读取模块:该模块负责从指定的文本文件中读取所有需要下载的图片链接地址。
- 图片下载模块:基于每个图片链接地址,使用模拟浏览器请求头进行下载操作,并将图片文件保存到指定目录中。
技术实现细节
脚本的核心代码逻辑如下:
def read_txt(path): mt = [] f = open(path, 'r') for t in f.readlines(): mt.append(t.strip()) f.close() return mtdef down_load(img, my_headers): # 生成图片文件名 file_name = img.split('/')[-1].replace('\n', '') # 检查文件是否已存在 if not os.path.exists("pic/" + file_name): request = urllib2.Request(url=img, headers=my_headers) response = urllib2.urlopen(request) pic = response.read() # 保存图片文件 with open("pic/" + file_name, "wb") as f: f.write(pic) print("下载完成:", file_name)def main(): txt_path = "data.txt" mt = read_txt(txt_path) for url in mt: down_load(url, my_headers) print("下载完成!".center(40, '-'))
使用说明
在使用本脚本前,请确保:
- 已在当前工作目录中创建一个名为"pic"的下载目录。
- 确保文本文件"data.txt"中包含所有需要下载的图片链接地址。
- 模拟浏览器请求头设置已正确填写。
注意事项
本脚本基于Python编程环境(建议版本为Python 3.x),运行前请确保所有依赖库已安装:
- urllib2库
- requests库
- uuid库
- os库