[Original] PDF文件转存图片

目录
今天同事要把很多个PDF文件里的页面图片贴到文档里,但没有找到好方法可以把图片导出,截图质量又不够好。这类工具问题从来是我最喜欢的,于是我把文件要来尝试批量转图片。
因为PDF都是扫描件,依照常规经验直接批量导出图片就可以,我手边一直收藏着两款命令行PDF软件都包含批量导出图片功能。但经过一番折腾却发现这些PDF文件都会导出很多异常图片,猜测可能是扫描仪采用的非标准保存方式。又尝试了手边多款不同PDF阅读器都没有合适的导出图片功能,只有一款有页面截图功能可以手工逐页截图但无法直接保存,还需要另找工具保存截图。最终只找到通过图片编辑工具Gimp可以以图片格式打开PDF,之后再逐页保存为图片,虽然不够方便但至少能够解决当下的问题。
手工转存了一波文件之后觉得还有提升空间,于是又祭出chatGPT寻求解决方案,思路是用万能编程语言Python解决这个问题。chatGPT很快给出答案,自己觉得不够好又反复问了几次,第三次给出一个使用pdf2image库的解决方案代码看起来很合心意。
安装相应的库,将代码贴进Python程序文件运行调试排查异常,现在用的chatGPT 3.5接口生成的代码大体结构一般问题不大但总有些小地方容易有问题需要调试修复,虽然如此前后也没有花费一二十分钟就搞定了。
正好同事又拿来一波将近十个PDF文件,这次运行脚本大约等待三五秒钟之后一堆导出良好命名规范的图片摆在目录里,这才是自己想要的结果。
代码在公司忘记同步回家,这里就不贴源码了。
今天忽然又翻出Rime小狼毫输入法,之前反反复复用过很多次都半途而废,今天又忽然想要再次尝试,经过一些波折之后终于搞定,现在越来越喜欢这种自己配置的简单工具风格。