项目需求: 通过Python将PDF转化为图片进行后续处理
项目所需组件: fitz PyMuPDF
安装组件 // 注意安装顺序 , 否则执行会报错
pip install fitz
pip PyMuPDF
import datetime
import os
import fitz
def pyMuPDF_fitz(pdfPath, imagePath):
startTime_pdf2img = datetime.datetime.now() # 开始时间
print("imagePath="imagePath)
pdfDoc = fitz.open(pdfPath)
for pg in range(pdfDoc.page_count):
page = pdfDoc[pg] rotate = int(0)
# 每个尺寸的缩放系数为1.3 , 这将为我们生成分辨率提高2.6的图像 。
# 此处若是不做设置,默认图片大小为:792X612, dpi=96
zoom_x = 2.33333333
# (1.33333333-->1056x816) (2-->1584x1224)
zoom_y = 2.33333333
mat = fitz.Matrix(zoom_x, zoom_y).prerotate(rotate)
pix = page.get_pixmap(matrix=mat, alpha=False)
if not os.path.exists(imagePath):
os.makedirs(imagePath) # 若图片文件夹不存在就创建
pix.save(imagePath'/''images_%s.png' % pg)
endTime_pdf2img = datetime.datetime.now()
if __name__ == "__main__":
pdfPath = r'C:UsersAdministratorDesktoptemptest.pdf'
# 2、需要储存图片的目录
imagePath = r'C:UsersAdministratorDesktoptemp'
【基于PyMuPDF 1.20.2 Python系列 - PDF转图片】pyMuPDF_fitz(pdfPath, imagePath)