
统计了50万人的身高数据才发现:大家都爱虚报身高
发布日期:2021-05-07 12:35:55
浏览次数:25
分类:精选文章
本文共 747 字,大约阅读时间需要 2 分钟。
大数据分析:解读身高分布的真相
近年来,身高逐渐成为公众关注的热点话题。据统计,我国成年人平均身高为170cm,但具体分布情况却并非大家想象的那么简单。本文通过大数据分析相亲网站用户的身高信息,探讨身高分布的真相。
数据背景
本次统计数据来自某大型相亲网站,涵盖北京、上海、广州和重庆四个城市。这些城市因地理位置不同,汇聚了来自全国各地的人才。数据来源于用户自述,具有一定的代表性。
数据特点
年龄分布
- 总体样本年龄以27岁为峰值,显示年轻群体占比较大。
- 针对性别分层:
- 女性:峰值出现在27岁。
- 男性:峰值稍高于女性,出现在29岁。
- 平均年龄:
- 总体:32.33岁
- 男性:33.24岁
- 女性:31.93岁
性别分布
- 女性占比绝对优势,比例约为60%。
- 数据收集顺序为先抓取女性,再抓取男性,可能存在性别分布的小偏差。
身高分布
-男性身高集中在170cm左右,呈现较为紧凑的分布。-女性身高集中在160cm,峰值远高于其他身高值。正态分布的验证
身高数据是否符合正态分布是衡量数据真实性的重要指标。
- 正态分布特征:峰值居中,两侧对称递减。
- 数据显示男性身高分布略有偏离正态分布,女性则明显偏离。
数据背后的意义
城市差异
- 城市化程度较高的地区,用户平均身高较高。
- 数据偏高可能源于用户自报偏高或城市环境影响。
年龄因素
- 年轻群体普遍偏向高身高,可能与生理发育相关。
性别差异
- 女性普遍身材较矮,可能与生理构造或社会影响有关。
结论与思考
- 数据显示相亲网站身高统计值偏高,可能与用户自报偏高有关。
- 城市化和年轻化趋势可能推高总体身高平均值。
- 性别差异在身高分布中表现明显,值得进一步探讨。
这份数据分析为身高分布研究提供了新的视角,也提醒我们在数据分析中关注数据来源的可靠性和统计方法的选择。
发表评论
最新留言
能坚持,总会有不一样的收获!
[***.219.124.196]2025年03月23日 01时17分49秒
关于作者

喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
Js函数
2019-03-05
Python机器学习算法基础概述
2019-03-05
关于OCR的一些有用的技术博客文章链接
2019-03-05
jquery中用on事件委托的方式绑定事件
2019-03-05
蓝桥杯 2016c/c++A组 方格填数
2019-03-05
L1-039 古风排版 (20分)
2019-03-05
L1-009 N个数求和 (20 分)
2019-03-05
L2-031 深入虎穴 (25 分)
2019-03-05
Unity之PlayerPrefs
2019-03-05
简单的xml读取存储方法(未优化)
2019-03-05
Flower
2019-03-05
Nginx---惊群
2019-03-05
Redis未授权漏洞
2019-03-05
供应ASTM D3475认证丨ASTM D3475防儿童包装测试费用
2019-03-05
2种解法 - 获取一条直线上最多的点数
2019-03-05
项目中常用的审计类型概述
2019-03-05
新生儿不建议吃鱼肝油,这些你知道吗
2019-03-05
新生儿哭是因为什么
2019-03-05