谢谢你留下时光匆匆
记 Python itertools.groupby 数据为空的坑

在进行数据清洗时候,遇到这样一个需求,抽象后如下:

原数据为一个文本文件,文本按照问题和答案分行交替出现,一个问题后面可能会跟着多行答案,例如:

1
2
3
4
5
6
7
8
9
x = """
Q:1+1=?
A:2

Q:水果有哪些
A:苹果
A:香蕉
A:桔子
"""

Github Action 推送项目到 Vercel

最近在做一个小的项目,项目会生成静态网页,并通过Vercel进行部署发布。项目并未采用Vercel监听Github repo的commit变化,自动进行同步的方式,而是利用Github Action,通过Vercel CLI提交到Vercel,这篇笔记记录一下相关配置的细节,以方便后续其它项目部署使用。


消费降级下如何高性价比娱乐

在经济下行的背景下,现在消费者普遍降低支出、增加储蓄,以应对未来的不确定性。如果我们不改变我们所消费的内容,我们从消费中获得的快乐就会下降。所以,我们可以寻求更高性价比的娱乐方式,在娱乐消费降级的情况下,保持精神快乐获取的稳定。本文总结了一些自己在低成本娱乐方式上探索的经验,包括一些具体的方案,以及一些思想方面的经验。


有趣实用的网站软件(四)

自己是一个很喜欢尝试新软件、探索新网站的人,这个系列文章,把自己觉得有趣的玩意,或者能提高效率的工具汇总起来,分享给大家。

本期关键词:娱乐,效率,优惠


工作效率提升的经验谈

本文记录本人在工作中提升办公效率的一些经验,主要讨论与开发工作相关的效率提升的方法,当然,其中一些方法也可以被其它岗位工作者借鉴。


PyWebIO 文本输入输出模版

PyWebIO 是一个python框架,可以轻松为程序创建一个网页交互页面。我经常用python写一些输入文本返回文本结果的脚本,例如:输入一个长的json字符串,通过python函数返回一个格式化带缩进的json文本;又或是输入一个时间戳,返回一个中文年月日时间文本。这些脚本都可以通过PyWebIO建立起对应的网页交互界面。自己花了一点时间,面向此类文本输入输出任务,开发了一个简单的一个Pywebio页面模板。

模版界面
模版界面


Pandas 列名变量生成辅助工具

在用Python Pandas处理数据时候,我们经常会去做选取某一列的操作(e.g. df['some_col'])。这段代码需要敲击引号然后输入字符串,如果列名为中文,还需要切换输入法,非常影响开发的流畅性。

一个解决办法是,将 DataFrame 中的每一列的列名赋值成一个变量,在需要输入列名时,只需要输入对应的变量即可,借助于编辑器的代码补全功能,可以让选取列代码的开发更为便捷、流畅。


有趣实用的网站软件(三)

自己是一个很喜欢尝试新软件、探索新网站的人,这个系列文章,把自己觉得有趣的玩意,或者能提高效率的工具汇总起来,分享给大家。

本期关键词:生活,工具,娱乐


Pandas 选取行、选取列方式梳理

这篇笔记对Pandas DataFrame取数的各种写法与对应的各种返回结果做一个梳理。

如没有特殊声明,df变量的数据如下:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
>>> df

   col_1 col_2
a      0   foo
b      1   foo
c      2   bar
d      3   bar
e      4   foo
f      5   foo
g      6   bar
h      7   bar

在100个实践例子中学习Pandas

熟练掌握Pandas是一个比较漫长的过程,阅读入门教程或API文档只是上手的一部分。在实际操作中,数据各式各样,需要转换的格式也各不相同,在不熟练的情况下,一时间可能想不到用什么恰当的Pandas函数,导致写出的Pandas代码会比较复杂,既浪费时间也让代码难以阅读。一个比较好的学习方法是,能够结合实际任务中的用例,仔细阅读背后实现对应Pandas函数。这样在自身遇到类似的情况时,很容易联想到可以使用的Pandas命令。这篇文章收集了在实际工作中常见的Pandas数据清洗用例,每一个用例给出原来的表格式与数据、处理后的表格式与数据,以及相应的pandas代码,在一些函数后,我也附上一些注释,进行一些拓展讲解。比较推荐读者熟悉Pandas基础用法后再进行阅读,入门学习时,官方教学User Guide是一个不错的资源。