
有哪些比较好的相亲软件呢?爬取三大相亲软件评论,惨不忍睹
发布日期:2021-05-17 02:13:09
浏览次数:20
分类:精选文章
本文共 2108 字,大约阅读时间需要 7 分钟。
下面是优化后的文章内容:
三款比较流行的相亲软件分别是世纪佳缘、百合婚恋和有缘网。以下将通过Python爬取这些软件的评论区用户评价,并通过词云展示用户对这些软件的反馈。
1. 下载量与用户评价
首先来看这三款软件的下载量和用户好评与差评占比情况(以下图示以万次为单位)。通过对比可以发现,世纪佳缘在下载量和好评率方面表现较为突出。但具体的用户评价内容仍需进一步挖掘。
[注:此处图片为三款软件的下载量和好差评比例对比图]
2. 爬取评论区
以世纪佳缘为例,首先在搜索框中输入“世纪佳缘”进行搜索。随后点击进入软件详情页,一旦滑动页面到达评论区,即可看到用户留下的评论内容。
[注:此处图片为爬取评论区的步骤示意图]
3. 获取评论数据
通过开发者工具查看网络请求,可以发现评论区的数据获取通过getComments
请求实现。该请求的参数包括star
(开始的评论索引)和count
(每次加载的评论数量),还可以通过callback
和baike
指定不同的应用。以下是爬取评论的代码示例:
headers = { "Accept": "*/*", "Accept-Encoding": "gzip, deflate, sdch", "Accept-Language": "zh-CN, zh;q=0.8", "Connection": "keep-alive", "Host": "comment.mobilem.360.cn", "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36 LBBROWSER"}def comment_spider(param, file_name): base_url = "http://comment.mobilem.360.cn/comment/getComments?c=message&a=getmessage&count=50" for i in range(1, 50): url = base_url + param + f"start={i}" response = requests.get(url, headers=headers) data = re.findall(r'{"errno": (.*))}', response.text) try: jdata = json.loads(f'{{"errno":{data[0]})') for message in jdata["data"]["messages"]: content = message["content"] print(content) with open(file_name + ".txt", "a", encoding="utf-8") as f: f.write(content) start += 50 time.sleep(2) except: pass
4. 生成词云展示
爬取到的评论数据可以用Python进行词云展示。以下是生成词云的代码示例:
with open("yy.txt", "r", encoding="utf-8") as f: content = f.read() stylecloud.gen_stylecloud( text=content, max_words=600, collocations=False, font_path="SIMLI.TTF", icon_name="fas fa-heart", size=800, output_name="yy.png" )Image("yy.png")
5. 词云展示结果
通过上述方法,我们可以生成以下三个软件的词云图:
世纪佳缘词云:
[图片描述:用户评论中多次提到的词汇如“优质”、“推荐”、“ Matching” 等集中体现在词云图中]
百合婚恋词云:
[图片描述:主要反映用户对该软件的评价聚焦于“婚恋”相关词汇和服务体验]
有缘网词云:
[图片描述:用户评论中经常出现的词汇如“人缘”、“缘分”、“ Matching” 等被表现出来]
以上方法可以帮助理解用户对三款相亲软件的评价情况,并通过词云直观地反馈用户反馈数据。
发表评论
最新留言
路过按个爪印,很不错,赞一个!
[***.219.124.196]2025年04月21日 11时39分50秒
关于作者

喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
数组去重的常用的几种方法
2019-03-14
Linux yum提示Loaded plugins错误的解决方法
2019-03-14
MySQL常见问题解决方案
2019-03-14
npm切换镜像
2019-03-14
算法——203、移除链表元素(力扣)
2019-03-14
算法——102、二叉树的层序遍历(力扣)
2019-03-14
Netty的体系结构及使用
2019-03-14
直播预告 | 从“制造”到“智造”,IT赋能企业数字化转型实践分享
2019-03-14
xshell解决文本粘贴格式错误
2019-03-14
webpack新手教程2021
2019-03-14
AAX 首席商务官 Michael Wong:安全可信的市场环境将促进增量市场发展
2019-03-14
什么是证券型代币?
2019-03-14
Android中获取并设置屏幕亮度
2019-03-14
Windows抓包工具-Fiddler
2019-03-14
Swift中使用DispatchGroup分组管理异步任务
2019-03-14
21-JS中常见的函数
2019-03-14
19-认识bootstrap
2019-03-14
为什么要使用UTF-8?
2019-03-14
Android多线程与双缓冲
2019-03-14
MVVM_Template
2019-03-14