在进行数据清洗时候,遇到这样一个需求,抽象后如下:
原数据为一个文本文件,文本按照问题和答案分行交替出现,一个问题后面可能会跟着多行答案,例如:
|
|
在进行数据清洗时候,遇到这样一个需求,抽象后如下:
原数据为一个文本文件,文本按照问题和答案分行交替出现,一个问题后面可能会跟着多行答案,例如:
|
|
最近在做一个小的项目,项目会生成静态网页,并通过Vercel进行部署发布。项目并未采用Vercel监听Github repo的commit变化,自动进行同步的方式,而是利用Github Action,通过Vercel CLI提交到Vercel,这篇笔记记录一下相关配置的细节,以方便后续其它项目部署使用。
在经济下行的背景下,现在消费者普遍降低支出、增加储蓄,以应对未来的不确定性。如果我们不改变我们所消费的内容,我们从消费中获得的快乐就会下降。所以,我们可以寻求更高性价比的娱乐方式,在娱乐消费降级的情况下,保持精神快乐获取的稳定。本文总结了一些自己在低成本娱乐方式上探索的经验,包括一些具体的方案,以及一些思想方面的经验。
PyWebIO 是一个python框架,可以轻松为程序创建一个网页交互页面。我经常用python写一些输入文本返回文本结果的脚本,例如:输入一个长的json字符串,通过python函数返回一个格式化带缩进的json文本;又或是输入一个时间戳,返回一个中文年月日时间文本。这些脚本都可以通过PyWebIO建立起对应的网页交互界面。自己花了一点时间,面向此类文本输入输出任务,开发了一个简单的一个Pywebio页面模板。
在用Python Pandas处理数据时候,我们经常会去做选取某一列的操作(e.g. df['some_col']
)。这段代码需要敲击引号然后输入字符串,如果列名为中文,还需要切换输入法,非常影响开发的流畅性。
一个解决办法是,将 DataFrame 中的每一列的列名赋值成一个变量,在需要输入列名时,只需要输入对应的变量即可,借助于编辑器的代码补全功能,可以让选取列代码的开发更为便捷、流畅。
这篇笔记对Pandas DataFrame取数的各种写法与对应的各种返回结果做一个梳理。
如没有特殊声明,df变量的数据如下:
|
|
熟练掌握Pandas是一个比较漫长的过程,阅读入门教程或API文档只是上手的一部分。在实际操作中,数据各式各样,需要转换的格式也各不相同,在不熟练的情况下,一时间可能想不到用什么恰当的Pandas函数,导致写出的Pandas代码会比较复杂,既浪费时间也让代码难以阅读。一个比较好的学习方法是,能够结合实际任务中的用例,仔细阅读背后实现对应Pandas函数。这样在自身遇到类似的情况时,很容易联想到可以使用的Pandas命令。这篇文章收集了在实际工作中常见的Pandas数据清洗用例,每一个用例给出原来的表格式与数据、处理后的表格式与数据,以及相应的pandas代码,在一些函数后,我也附上一些注释,进行一些拓展讲解。比较推荐读者熟悉Pandas基础用法后再进行阅读,入门学习时,官方教学User Guide是一个不错的资源。