网上下载的 pdf 学习资料有一些会带有水印,win7怎么打开oxps文件,非常影响阅读。比如下面的图片就是在 pdf 文件上截取出来的。,
安装模块
私信小编01即可获取大量Python学习资源
PIL:Python Imaging Library 是 python 上非常强大的图像处理标准库,但是只能支持 python 2.7,于是就有志愿者在 PIL 的基础上创建了支持 python 3的 pillow,并加入了一些新的特性。
pip install pillow
pymupdf 可以用 python 访问扩展名为*.pdf、.xps、.oxps、.epub、.cbz或*.fb2的文件。还支持了许多流行的图像格式,包括多页TIFF图像。
Windows 7 用户可以安装 KB2732059 补丁打开 OXPS 文件,Windows XP 不支持安装这个补丁,所以 Windows XP 无法打开OXPS 文件。可以用工具 XpsConverter 转换 OXPS 文件为 PDF 文件, XpsConverter 包含在Windows Driver Kit 。
pip install PyMuPDF
导入需要用到的模块
from PIL import Imagefrom itertools import productimport fitzimport os
获取图片的 RGB
pdf 去水印的原理和图片去水印的原理差不多,小编先从去除上面那张图片的水印开始。
学过计算机的小伙伴们都知道 ,计算机中用 RGB 代表红绿蓝,用 (255,0,0) 表示红色,(0,255,0) 表示绿色,(0,0,255) 表示蓝色,(255,255,255) 表示白色,(0,0,0) 表示黑色,去水印的原理就是将水印的颜色变成白色(255,255,255)。
首先获取图片宽和高,用 itertools 模块获取宽和高的笛卡尔积作为像素点。每个像素点的颜色都由 前三位的 RGB 和 第四位的 Alpha 通道构成。Alpha 通道不需要,只要 RGB 数据。
图片去水印
用微信截图的方式查看水印像素点的 RGB。
1、在开始菜单中点击一下,然后在搜索中输入:xpsrchvw.exe,再看到的如下图所示的地方点击进入。2、打开了xps查看器后,然后再点击文件,再点击打开 3、再选择xps文件所在的位置再点击打开 4、此时就可以看到打开的xps文件。
可以看到水印的 RGB 是 (210,210,210),这里用 RGB 的和超过 620 就判定是水印点,此时将像素颜色替换为白色。最后保存图片。
oxps文件怎么打开 1、点击开始图标,点击设置。2、点击应用。3、点击管理可选功能。4、点击添加功能后,安装XPS查看器。5、使用xps查看器打开oxps文件即可。本文以华为matebookxpro2021为例适用于window 10系统 。
示例结果:
PDF 去水印
Paper Specification(XML文件规格书),是一种微软推出的电子文件格式,使用者不需拥有制造该文件的软件就可以浏览或打印该文件,为微软对抗Adobe PDF格式的利器。微软下一版的办公室软件Office 12将提供XPS可携式文件格式的。
def remove_pdf():page_num = 0pdf_file = input(&34;)pdf = fitz.open(pdf_file);for page in pdf:pixmap = page.get_pixmap()for pos in product(range(pixmap.width),range(pixmap.height)):rgb = pixmap.pixel(pos[0],pos[1])if(sum(rgb) >= 620):pixmap.set_pixel(pos[0],pos[1],(255,255,255))pixmap.pil_save(f&34;)print(f&34;)page_num = page_num + 1
示例结果:
图片转为 pdf
图片转 pdf 需要注意的是图片的排序,数字文件名必须先转换为 int 类型后排序。用 PyMuPDF 模块打开图片后将图片用 convertToPDF() 函数转成单页的 pdf。插入到新的 pdf 文件中。
总结
pdf 和图片上恼人的水印终于可以在强大的 python 面前消失了。小伙伴们学会了吗?
1、第一步,打开计算机的桌面,单击开始菜单,然后单击“设置”选项,如下图所示,然后进入下一步。2、其次,完成上述步骤后,在Windows设置中单击“应用”按钮,如下图所示,然后进入下一步。3、接着,完成上述步骤后,。