来源于两个读者的学习/工作需求,很巧,这两个读者提的需求都是关于批量合并sheet(检索需要的信息)。

本文所用数据样式,经读者同意,可以公开,文件中的数据为Excel中的Rand函数生成,确保大家在学习、使用代码过程中不会遇到障碍,数据和代码获取方式见文末。

首先我们先看第一个读者的需求:原始数据有18个Excel文件,每个Excel文件里有34个sheet(34个省的相关数据),需要取出每个sheet中指定的几行数据,然后全部合并起来,存储到一个新的文件,命名为2000_2017年各省份碳排放数据。

经过沟通,我确定了最终输出文件的样式,以下数据都是用Excel中的随机函数生成:

0、新建一个Excel1、打开第一个Excel2、复制出每个sheet中需要的几行数据3、将复制出来的数据粘贴到新建的Excel中4、重复1-3,直到取出所有Excel中的数据5、保存新建的Excel

如果只是1-2个文件,动手还可以接受,但是要是有几十个,几百个,如果靠动手就头大了。现在我们看看以上手动操作换成代码操作需要那些步骤:

0、新建一个数据存储对象(我们用pandas中的Dataframe)1、读取目标Excel文件2、遍历取出每个sheet中需要的几行数据,存储到新建的Dataframe中3、for循环遍历,读取所有目标Excel数据,并存储到新建的Dataframe中4、将新建的Dataframe数据保存为一个Excel文件

我们来看第二个读者的需求:原数据只有一个文件,里面有8个sheet,需要将每个sheet中的几列取出来,然后根据日期存储为一个一个的csv文件。

0、打开Excel文件1、复制出每个sheet中需要的几行数据2、根据日期进行排序3、按日期将不同的数据存入不同csv文件

看似很简单,但实际却是复杂的,比如要手动创建保存365个csv文件,文件名字还不一样,想着就头大!

0、新建一个数据存储对象(我们用pandas中的Dataframe)1、读取目标Excel文件2、遍历取出每个sheet中需要的几行数据,存储到新建的Dataframe中3、根据日期进行分组,将不同日期数据存储到对应的文件

了解了这些后,我们就开始愉快的代码之旅吧:0、新建一个数据存储对象(我们用pandas中的Dataframe)

如果今天的分享对你有帮助的话,请毫不犹豫:关注、分享、点赞、在看、收藏呀~你的鼓励将会是我创作的最大动力。

发表回复

您的电子邮箱地址不会被公开。