您的当前位置:首页正文

pandas快速处理Excel,替换Nan,转字典的操作

来源:独旅网
pandas快速处理Excel,替换Nan,转字典的操作

pandas读取Excel

import pandas as pd

# 参数1:⽂件路径,参数2:sheet名

pf = pd.read_excel(path, sheet_name='sheet1')

删除指定列

# 通过列名删除指定列

pf.drop(['序号', '替代', '签名'], axis=1, inplace=True)

替换列名

# 旧列名 新列名对照columns_map = {

'列名1': 'newname_1', '列名2': 'newname_2', '列名3': 'newname_3', '列名4': 'newname_4', '列名5': 'newname_5', # 没有列名的情况

'Unnamed: 10': 'newname_6',}

new_fields = list(columns_map.values())

pf.rename(columns=columns_map, inplace=True)pf = pf[new_fields]

替换 Nan

通常使⽤

pf.fillna('新值')

替换表格中的空值,(Nan)。

但是,你可能会发现 fillna() 会有不好使的时候,记得加上 inplace=True

# 加上 inplace=True 表⽰修改原对象pf.fillna('新值', inplace=True)

官⽅对 inplace 的解释

inplace : boolean, default False

If True, fill in place. Note: this will modify any other views on this object, (e.g. a no-copy slice for a column in aDataFrame).

全列输出不隐藏

你可能会发现,输出表格的时候会出现隐藏中间列的情况,只输出⾸列和尾列,中间⽤ … 替代。加上下⾯的这句话,再打印的话,就会全列打印。

pd.set_option('display.max_columns', None)print(pf)

将Excel转换为字典

pf_dict = pf.to_dict(orient='records')

全部代码

import pandas as pd

pf = pd.read_excel(path, sheet_name='sheet1')

columns_map = {

'列名1': 'newname_1', '列名2': 'newname_2', '列名3': 'newname_3', '列名4': 'newname_4', '列名5': 'newname_5', # 没有列名的情况

'Unnamed: 10': 'newname_6',}

new_fields = list(columns_map.values())

pf.drop(['序号', '替代', '签名'], axis=1, inplace=True)pf.rename(columns=columns_map, inplace=True)pf = pf[new_fields]

pf.fillna('Unknown', inplace=True)

# pd.set_option('display.max_columns', None)# print(smt)

pf_dict = pf.to_dict(orient='records')

补充:python pandas replace 0替换成nan,bfill/ffill

0替换成nan

⼀般情况下,0 替换成nan会写成

df.replace(0, None, inplace=True)

然⽽替换不了,应该是这样的

df.replace(0, np.nan, inplace=True)

nan替换成前值后值

df.ffill(axis=0) # ⽤前⼀个值替换df.bfill(axis=0) # ⽤后⼀个值替换

以上为个⼈经验,希望能给⼤家⼀个参考,也希望⼤家多多⽀持。如有错误或未考虑完全的地⽅,望不吝赐教。

因篇幅问题不能全部显示,请点此查看更多更全内容