最近在做一个日志存储的业务,这个日志的每一份数据都是一个一万三千行的复杂json格式。 我需要抓取json内部不同level的有效信息然后将他们编成一张表table存储起来。

这自然而然就想到了用python pandas存储table。 1) Json content to Pandas f=open(FILE_PATH) dta=json.load(f)

df = pd.json_normalize(data[‘json_key’])

2) Update column value #e.g: change rejected in status col to ‘failed’ df.loc[df[‘status’] ==’rejected’, ‘status’] = ‘failed’

3)Filter rows #filter out empty steps df_nested_list=df[df[‘environment_deploySteps’].apply(lambda x: len(x)>0)]

4)expand list to new row: https://stackoverflow.com/questions/39011511/pandas-expand-rows-from-list-data-available-in-column

explode_df=df_nested_list.explode(‘environment_deploySteps’).reset_index(drop=True)