起因
来自于工作中一个任务,有一批Word,里面记录了一些卡片式的文件,卡片里面有一些流程图 — 用Visio画的。
需求是需要将所有的Visio提取出来,然后重命名为卡片里面两个位置标识组成的新名字。
冻手冻手
这种重复性的活,手动做,真的很恶心,而且浪费时间,做的过程中心里全是怨念hhh。我学Python为的不就是不干这种活?
所以最开始就没想过自己动手,Word罢了,解析解析看看。
首先介绍下文件的情况
需要处理的文件格式是
docx
,这肯定是一个好消息,因为docx
中的资源肯定是有办法可以搞到的。docx
文件是一个基于 Office Open XML (OOXML) 标准的文件格式,它由多个 XML 文件和其他资源(如图像、嵌入对象等)组成,这些都打包在一个 ZIP 容器中。手动操作的话是双击
visio
图像,然后会自动调用电脑上的visio
,此时再去做另存和重命名