用Python简单批量处理数据

近期碰到一个问题，两套系统之间数据同步出了差错，事后才发现的，又不能将业务流程倒退，但是这么多数据手工处理量也太大了，于是决定用Python偷个小懒。

1 、首先分析数据。

两边数据库字段的值都是一样，先将这边数据库的数据查询导出，正好是 2 列 120 多行的数据。那么目标就是拼接成 update from_name set data= where id= 格式，将导出内容中的第 1 列和第 2 列内容放到等号 = 后面即可。

FnERraN.png!web

2 、下面开始动手。

前提肯定是要有一个 python 环境的，没有的去下载安装一个也很快。有了环境之后打开编辑器，这里用自带的 IDLE 或者 pycharm 都行，代码简单用哪个都不影响。

2.1 打开文件（注意文件存放路径），默认打开为 r 模式， seek(0) ：从起始位置读取内容。

quMV7nf.png!web

2.2 读取文件中的数据，得到一个列表，用以 for 循环

eiuIjef.png!web

输出 f1 查看数据格式，可以看出中间的制表符 \t 和换行符 \n

YZBbQvB.png!web

2.3 先将列表内容的换行符 \n 替换为 ; ，再从指标表 \t 位置进行切割，分开为两个字符。

UzMJfuv.png!web

输出结果：

RNzEna2.png!web

2.4 然后就可以进行拼接了，使用最简单拼接方式，再将所有内容存到一个对象中

bmUFBbN.png!web

2.5 最后将成果封装写入到一个文件当中

BRJvEn2.png!web

检查电脑存放的路径中是否存在最终输出的文件，大功告成， 11 行代码就完了，简单粗暴又有效。

Recommend