python_数据分析_广东省历年专利申请数量和类别
发布日期:2021-06-29 19:49:29
浏览次数:4
分类:技术文章
本文共 1030 字,大约阅读时间需要 3 分钟。
因为手上有相关专利数据,想着还是做点分析吧,万一对社会有价值呢?
原始数据如下:处理分析后的数据如下:
分析的代码如下:
import pandas as pdimport osimport matplotlib.pyplot as pltos.chdir(r'D:\data\广东省\\')dir = r'D:\data\广东省\\'save = r'D:\data\专利数据\\''''本文件重要统计分析内容:1、统计广东省历年专利公告数量2、专利分类统计'''ton = pd.read_csv(save + '专利统计分析数据.csv', engine='python')ton['size'] = ton['size'].map(lambda x:int(x))def count_data(): files = os.listdir(dir) for file in files: data = pd.read_excel(dir+file) data['category'] = data['分类号'].map(lambda x:x[:1]) year = file.split('.')[0].split('_')[1] groups = data.groupby('category').size() groups = groups.reset_index(name='size') groups['year'] = year groups.to_csv(save+'专利统计分析数据.csv',index=False,header=False,mode='a')def year_size(): year_count = ton.groupby('year').agg({ 'size':sum}) year_count.plot() plt.show()year_size()def category_size(): year_count = ton.groupby('category').agg({ 'size':sum}) year_count.plot() plt.show()category_size()
如需要更详细的分析、或者需要数据,请到我其他文章找到我的qq
转载地址:https://data-mining.blog.csdn.net/article/details/113743941 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
很好
[***.229.124.182]2024年04月28日 04时21分10秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
免费的天气预报webservice接口
2019-04-30
Server.Transfer VS Response.Redirect
2019-04-30
asp.net页面出错时常用的处理方法
2019-04-30
ASP.NET State Service
2019-04-30
web.config中的InProc模式 与 StateServer模式
2019-04-30
C#泛型集合揽胜
2019-04-30
如何选择书籍
2019-04-30
linux下清空文件内容
2019-04-30
Linux查看某目录占用空间以及其下有多少个文件
2019-04-30
ORA-01950:+对表空间+'USERS'+无权限
2019-04-30
CSS样式语法基础
2019-04-30
oracle 执行存储过程返回值
2019-04-30
C#调用存储过程的通用类
2019-04-30
如何使<a>标签中的 href 属性动态绑定
2019-04-30
cellpadding和cellspacing属性来控制表格边框的间距。
2019-04-30
HTML <td> 标签的 colspan 属性
2019-04-30