零代码编程: 用Kimichat从PDF文件中批量提取图片

部落人有文化2024-05-03 08:21:59  71

在借助kimi智能助手中输入提示词:

你是一个Python编程专家,要完成一个网页爬取Python脚本的任务,具体步骤如下:

打开文件夹:E:6451

注意:图片体积较大,占用内存高,要将PDF文件中的图片分批次提取,而不是一次性提取所有图片

kim生成的Python源代码:

import os

# 定义文件夹路径

folder_path = 'E:\6451'

# 确保文件夹存在

if not os.path.exists(folder_path):

print(f"The folder {folder_path} does not exist.")

else:

for filename in os.listdir(folder_path):

pdf_path = os.path.join(folder_path, filename)

# 逐页提取图片

for page_number in range(len(doc)):

page = doc[page_number]

img_list = page.get_images(full=True)

# 分批次提取页面中的图片

for img_index, img in enumerate(img_list, start=1):

try:

xref = img[0]

info = doc.extract_image(xref)

image_bytes = info["image"]

# 为图片构造一个唯一的文件名

image_filename = f"{os.path.splitext(filename)[0]}_{page_number + 1}_img_{img_index}.png"

image_save_path = os.path.join(folder_path, image_filename)

# 保存图片

with open(image_save_path, "wb") as image_file:

image_file.write(image_bytes)

print(f"Image saved: {image_save_path}")

except Exception as e:

print(f"Error saving image from page {page_number + 1}: {e}")

# 释放内存

del page, img_list

doc.close

print(f"Finished extracting images from {filename}")

# 输出信息到屏幕

# 确保屏幕输出信息

input("按任意键退出...")

在vscode中运行Python程序,成功提取所有图片:

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/414913.html
0
随机主题
新华都-9.95%跌停, 总市值50.18亿元雷曼光电4天翻倍, 金瑞矿业有望七连板! 5月22日复盘及翌日计划杨紫在时尚圈弯道超车,拿下第二封五大峥嵘二十载, 一图细数文博会的“高光时刻”陈建斌老婆新加坡度假, 48岁蒋勤勤坐街边啃螃蟹, 素颜没人认识vivo x100pro更新频繁,我认为没有负优化!跌跌不休!“疫苗大王”,没了295亿德甲保级推送: 波鸿VS杜塞尔多夫, 不败金身再添一局, 德甲升降机名不虚传!骁龙8Gen2旗舰直降400,金属边框+索尼大底,体验不输一加1224年,叶挺向李秀文提亲失败,未来岳父:你什么时候当了团长再来5月23日译名发布: B-52“同温层堡垒”战略轰炸机虎牢关时期, 谁能抵挡吕布100招? 仅2人可以, 关羽张飞赵云都不行夏威夷是如何变成美国的第五十个州的,美国的第一次干涉别国内政第十一代索纳塔, 简直是个五边形战士!《闯关东》: 看懂朱传武对朱家的报复, 才知鲜儿被他利用得有多狠希望杨紫火到人尽皆知的时候同时也要平平安安浏览器主页被篡改了怎么办?一招教你解决它如何选择适合你的CPU?一分钟教会你认识CPU!中国男篮归化爆发 李凯尔成森林狼头号奇兵 替补12分钟7中5太抢镜大众SUV起家的旗舰车型, 途观L在众多人眼里依旧能打苦命的人! 叙利亚第一夫人又被确诊癌了, 老美称: 她等于一个师
最新回复(0)