python爬虫爬取_高德地图_主要城市迁徙意愿排行榜_19年至今数据
发布日期:2021-06-29 19:49:24 浏览次数:2 分类:技术文章

本文共 1445 字,大约阅读时间需要 4 分钟。

在这里插入图片描述

我已拿到从16年至今此网站能提供的城市迁徙大数据,请自行确认自己想要的城市此网站是否提供,部分三四线城市不提供

还有一点:网站不提供具体人数,如果需要具体人数的话我有联通的2020年1-6月份的扩样后的具体人数数据
如需数据请加我qq,在我博客的其他文章里可以找到

爬取简单思路:

1、获取URL
2、遍历从19年至今的日期
3、访问URL,记得捕获异常,不然有可能会断掉
4、抓完还需要处理数据成csv或者Excel

import osfrom datetime import datetime, timedeltaimport requestsfrom utils.read_write import writeOneJsonfrom utils.time_change import getBetweenDayos.chdir(r'D:\data\高德迁徙\迁徙意愿json\\')headers = {
"User-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 " "(KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0"}# 发送请求def requerts_url(url, riqi): try: response = requests.get(url, timeout=1000, headers=headers) json = eval(response.text) writeOneJson(json, riqi + ".json") except Exception as e: print(datetime.now()) print(e) print(url) begin_date = datetime.strptime(riqi, "%Y-%m-%d") begin_date += timedelta(days=1) date_change(riqi)city_list = []# 先将数据下载为Json文件def city_range(riqi): file = "城市迁徙意愿_" + "_" + riqi + ".json" if not os.path.exists(file): firsturl = "https://trp.autonavi.com/cityTravel/line.do?adcode=100000&dt={}&willReal=WILL&size=200".format(riqi) requerts_url(firsturl, riqi)def date_change(date): date_list = getBetweenDay(date) for riqi in date_list: print(riqi) city_range(riqi)if __name__ == '__main__': date_change('2019-01-01')

喜欢请一键三连

转载地址:https://data-mining.blog.csdn.net/article/details/111573389 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:联通手机信令大数据的处理分析与可视化
下一篇:python爬虫爬取_腾讯位置大数据_人口迁徙图16年至今数据

发表评论

最新留言

很好
[***.229.124.182]2024年04月18日 20时02分19秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章

grid布局介绍(容器、项目、网格线、单元格、容器和项目属性template-columns|rows相关函数和相关关键字\gap\areas\flow\content\justify\align) 2019-04-30
ES6 let注意点、解构(重命名、默认值、结构给已有变量)、模块化(注意点、导入导出语法)、对象属性扩展写法 2019-04-30
知乎热议:未来3到5年内,哪个方向机器学习人才最稀缺? 2019-04-30
推荐几款好用的文本编辑器 2019-04-30
上海有哪些牛逼的互联网公司? 2019-04-30
美团外卖批量投放智能安全头盔:骑手可语音处理订单 2019-04-30
指甲盖大小塞了500亿晶体管!领先台积电,IBM打造世界首款2纳米芯片!能耗仅为7纳米的1/4!... 2019-04-30
武汉最牛批的互联网基本都在这了~ 2019-04-30
全网最全Python操作Excel教程,建议收藏! 2019-04-30
导弹如何自动追踪目标?这其实是个数学问题 2019-04-30
Mac电脑使用:Mac电脑查看本机的IP和公网IP的方法 2019-04-30
前端开发:自定义时间轴的使用 2019-04-30
Flutter开发:iOS 14+系统的iPhone在debug模式下运行App报错的解决方法 2019-04-30
Mac电脑使用:Mac电脑查看本机的IP和公网IP的方法 2019-04-30
NOI 2020 解题报告 2019-04-30
一道神奇的几何题 2019-04-30
【UR #5】怎样跑得更快 题解 2019-04-30
二分图经典技巧 2019-04-30
Codeforces Round #728 (Div. 1) B Tree Array 题解 2019-04-30
P5292 [HNOI2019 D2T1]校园旅行 总结 2019-04-30