如何使用python把json文件转换为csv文件
发布日期:2021-05-09 07:00:27 浏览次数:10 分类:博客文章

本文共 1313 字,大约阅读时间需要 4 分钟。

@

目录

了解json整体格式

这里有一段json格式的文件,存着全球陆地和海洋的每年异常气温(这里只选了一部分):global_temperature.json

{  "description": {    "title": "Global Land and Ocean Temperature Anomalies, January-December",    "units": "Degrees Celsius",    "base_period": "1901-2000"  },  "data": {    "1880": "-0.1247",    "1881": "-0.0707",    "1882": "-0.0710",    "1883": "-0.1481",    "1884": "-0.2099",    "1885": "-0.2220",    "1886": "-0.2101",    "1887": "-0.2559"  }}

通过python读取后可以看到其实json就是dict类型的数据,description和data字段就是key

由于json存在层层嵌套的关系,示例里面的data其实也是dict类型,那么年份就是key,温度就是value

转换格式

现在要做的是把json里的年份和温度数据保存到csv文件里

提取key和value

这里我把它们转换分别转换成int和float类型,如果不做处理默认是str类型

year_str_lst = json_data['data'].keys()year_int_lst = [int(year_str) for year_str in year_str_lst]temperature_str_lst = json_data['data'].values()temperature_int_lst = [float(temperature_str) for temperature_str in temperature_str_lst]print(year_int)print(temperature_int_lst)

使用pandas写入csv

import pandas as pd# 构建 dataframeyear_series = pd.Series(year_int_lst,name='year')temperature_series = pd.Series(temperature_int_lst,name='temperature')result_dataframe = pd.concat([year_series,temperature_series],axis=1)result_dataframe.to_csv('./files/global_temperature.csv', index = None)

axis=1,是横向拼接,若axis=0则是竖向拼接

最终效果

注意

如果在调用to_csv()方法时不加上index = None,则会默认在csv文件里加上一列索引,这是我们不希望看见的

上一篇:Spark中普通集合与RDD算子的sortBy()有什么区别
下一篇:scala:分别使用懒汉式和饿汉式实现单例模式

发表评论

最新留言

关注你微信了!
[***.104.42.241]2025年04月18日 10时50分53秒