起因

来自于工作中一个任务,有一批Word,里面记录了一些卡片式的文件,卡片里面有一些流程图 — 用Visio画的。

需求是需要将所有的Visio提取出来,然后重命名为卡片里面两个位置标识组成的新名字。

冻手冻手

这种重复性的活,手动做,真的很恶心,而且浪费时间,做的过程中心里全是怨念hhh。我学Python为的不就是不干这种活?

所以最开始就没想过自己动手,Word罢了,解析解析看看。

首先介绍下文件的情况

  • 需要处理的文件格式是docx,这肯定是一个好消息,因为docx中的资源肯定是有办法可以搞到的。

    docx 文件是一个基于 Office Open XML (OOXML) 标准的文件格式,它由多个 XML 文件和其他资源(如图像、嵌入对象等)组成,这些都打包在一个 ZIP 容器中。

  • 手动操作的话是双击visio图像,然后会自动调用电脑上的visio,此时再去做另存和重命名

阅读全文 »

阅读

1、五分钟读懂UML类图

介绍UML类图如何阅读的博客,来自博客园。UML类图经常在书籍和程序说明种看到,其可以很清楚的表达不同类型直接的关系于构成,了解其元素是什么是非常有必要的。

  • 对象的属性
  • 对象的方法
  • 类型直接的关联关系
  • 类型之间的聚合关系
  • 类型之间的组合关系
  • 类型之间的依赖关系
  • 类型之间的继承关系
  • 类型之间的接口实现关系

在官方文档 — Merge, join, concatenate and compare中,在介绍完join的常用方法后,在后续的note中有这样一段话。

When DataFrame are joined using only some of the levels of a MultiIndex, the extra levels will be dropped from the resulting join. To preserve those levels, use DataFrame.reset_index() on those level names to move those levels to columns prior to the join.

DataFrame 仅使用 MultiIndex 中的部分级别进行连接时,额外的级别将从连接结果中删除。要保留这些层级,请在这些层级名称上使用 DataFrame.reset_index() 将这些层级移动到连接前的列中。

也是我阅读的问题,没有注意到它的位置。现在再回头去看,这一节是在 「Merging on a combination of columns and index levels」这一栏下面的,因此其实这个注释是给merge的,但当时大标题是join因此我以为是针对join的。

因此产生了一个疑问,join并不会抛弃 「extra level」 啊,在官方文档的上面还有一个例子,就是关于join处理 MultiIndex 时,右侧的表的index必须是左侧表index的子集。

阅读全文 »

我的网易云黑胶会员断了快两年了,21和22的时候网易云使用频率还是很高的,现在用的越来越少了,可以说基本没用了,尤其是打开网易云首先会在网易云标志界面等一会,然后弹出冗长的广告以及超小的跳过按钮,还有点击跳过按钮时仍然会卡顿的那几秒或者误触进入其他软件。

光写着我血压就上来了,还好有李跳跳可以略微减轻一下这种难受。

今天看到QMD公众号发的一篇文章,随着QMD、歌词适配、洛雪的相继「阵亡」以及用户借洛雪尸还魂,有点想记录下我的听歌历程。

我是一个闲的时候或者学习游戏的时候,耳朵不塞点东西不舒服的人,总想放点歌听听,所以也算半个小曲库?但现在使用各个主流音乐软件真的太难受了。

所以就想要BB一下。

阅读全文 »

正常作息了

经过半年的沟通,终于磨动了,目前放到白班去了,不需要倒班了,emmm,精神状态好,空余时间够的话,我应该可以狠狠的coding和记录阅读了

浅浅的舒服一下,后续记录应该周更?

尽力尽力!

FreeFileSync是一款自动同步软件,由于自己有资源备份/同步的需求,因此接触到了这款软件,也可以说一步到位,省去了很多寻找折腾的地方。

免费+功能明确强大,这款应用应该属于是比较出名的。

先上官网地址,直接下载即可

官网界面非常简单,没有任何广告,舒服的,主页也有官方自己的使用教程,主要是视频教程,但个人觉得上手还是很简单的,尤其是我这种需求比较明确的情况。

我的使用场景主要是备份,同步其实用的不多

  • 备份个人笔记的数据 — 比如思源笔记的个人数据库、logseq的数据库等等
  • 备份某些非常关键的资源 — 我用于记录某些关键信息(某些token、密码等等)的文件
阅读全文 »

什么是deque

deque即队列队列的一种 — 双端队列(double-ended queue的缩写),是一种数据结构,它允许你在队列的两端进行添加(append)和弹出(pop)操作。

队列是操作受限的线性表,只允许在一端进行插入 (入队),另一端进行删除 (出队)

  • 操作特性:先进先出 FIFO
  • 队头(Front):允许删除的一端
  • 队尾(Rear):允许插入的一端
  • 空队列:不含任何元素的空表

而双端队列就是在队列的基础上,两边都可以作对头和队尾。

Python中deque和列表有很多相似地方,基本使用非常类似。

阅读全文 »

满足至极的微信输入法

此前从少数派上一篇文章看到对于微信输入法的推荐,于是乎从手机尝试一一周,然后熟悉再探索,大概用了两周左右。目前全面更换为微信输入法。简单聊一下怎么个好用法。

此前,在手机端基本是使用讯飞或者系统自己带的,桌面端则是使用微软自带以及Rime小狼毫(一开始想折腾下,但是也没折腾明白,使用文档感觉是在学Python文档)。手机端基本使用需求是满足的,联想功能方面还行。但是现在对比下来就存在许多缺点,单纯就输入功能来说

  • 小狼毫没有配置对应文件的话,对于诗词以及一些谚语之类的,基本是没有自动联想相关方面词条的功能。对比下来微软感觉反而是遇到微信输入法之前的最优解。
  • 手机方面,除了明显舒服的优化输入以及自动补全外,微信输入法值得一提的就是删除时向上滑动可以清屏,向下滑可以恢复清理的内容。方便删大量文字,同时删过头了还可以反悔。
阅读全文 »

2023:蓦然回首

今年有很多想说的,但其实没有太多表达的欲望,表达欲最近真的很低,取而代之的内耗则是愈加强烈。

自己一直在和自己争吵。

思来想去,回首仔细捋捋还是有话可说,也算挺好。

此时,正在听 Merry Christmas Mr.Lawrence 与 如愿。

阅读全文 »

这周自己状态很差,所以拖了三天了,翻来覆去还是觉得应该写一下。

迫切的想离开现在环境

不知道有没有提过,我目前的工作是需要倒班的,当时选的时候其实并没有害怕,自认为在大学也不是没通宵过,熬的夜也不少,所以这点强度应该是没什么问题的。但是事实告诉我,大错特错。熬夜规律与日夜颠倒、作息紊乱真的不是一个东西,那种想睡睡不着,干活眼皮打架,空闲时间浑浑噩噩的感觉真是太差了。更不用提身体方面,内分泌紊乱,时不时出现胸口骤疼的情况了。

阅读全文 »