Python Collections.Counter()函数详解(统计字符频率
发布日期:2021-11-15 14:58:09
浏览次数:37
分类:技术文章
本文共 1882 字,大约阅读时间需要 6 分钟。
前言
以后出现统计字符的题目,不要再先排序,在一个一个统计;或者使用dict。可以使用更简单的Counter()函数
一、Collections模块的综述
Collections模块使用了高性能容器数据类型,并且包含许多有用的数据结构,它的性能超过了内置的类型如 list,dict and tuple等。
二、Counter概念和使用
Counter是一个容器,用来统计值出现的频率
使用前需要先导入模块>>>from collections import Counter
1.初始化Counter
Counter支持三种形式的初始化,在它的构造器被调用时可以传入可迭代的序列(字符串,列表,元组等),包含keys和values的字典或mapping`
>>>Counter(['a', 'b', 'c', 'a', 'b', 'b'])Counter({ 'b': 3, 'a': 2, 'c': 1})>>>Counter({ 'a':2, 'b':3, 'c':1})Counter({ 'b': 3, 'a': 2, 'c': 1})>>>Counter(a=2, b=3, c=1)Counter({ 'b': 3, 'a': 2, 'c': 1})
2.创建并且更新Counter
初始可以创建空的Counter,随后用update()添加元素
>>>a=Counter()>>>a.update('adhasfa')>>>aCounter({ 'a': 3, 'd': 1, 'h': 1, 's': 1, 'f': 1})>>>a.update({ 'a':2,'f':1})>>>aCounter({ 'a': 5, 'f': 2, 'd': 1, 'h': 1, 's': 1})#所以update但是在前者的基础上进行的,尽管传入的类型不一样
3.访问Counter的元素
从上面的结果可以发现,Counter很像字典…的确是,可以用访问字典的方式访问Counter
>>> a.items()dict_items([('a', 5), ('d', 1), ('h', 1), ('s', 1), ('f', 2)])>>> a.keys()dict_keys(['a', 'd', 'h', 's', 'f'])>>> a.values()dict_values([5, 1, 1, 1, 2])>>>a['a']5>>>a['a']=9 #直接对Counter进行修改>>>aCounter({ 'a': 9, 'f': 2, 'd': 1, 'h': 1, 's': 1})
4.most_common()函数
根据Counter().most_common(k)可以返回出现频率最高的k个值和他们相应的频率,默认是返回所有值
>>> a.most_common() 返回的是列表类型[('a', 9), ('f', 2), ('d', 1), ('h', 1), ('s', 1)]
5.算术运算和集合操作
Counter对象支持算术运算和集合操作
>>>c1=Counter(['a', 'b', 'c', 'a', 'b', 'b'])>>>c2=Counter('alphabet')>>>c1Counter({ 'b': 3, 'a': 2, 'c': 1})>>>c2Counter({ 'a': 2, 'b': 1, 'e': 1, 'h': 1, 'l': 1, 'p': 1, 't': 1})#相加>>>c1+c2Counter({ 'a': 4, 'b': 4, 'c': 1, 'l': 1, 'p': 1, 'h': 1, 'e': 1, 't': 1})#相减>>>c1-c2Counter({ 'b': 2, 'c': 1})#交集>>>c1&c2Counter({ 'a': 2, 'b': 1})#并集>>>c1|c2Counter({ 'b': 3, 'a': 2, 'c': 1, 'l': 1, 'p': 1, 'h': 1, 'e': 1, 't': 1})
参考资料
http://www.doughellmann.com/PyMOTW/collections/
http://docs.python.org/2/library/collections.html#collections.Counter转载地址:https://blog.csdn.net/qq_39751320/article/details/104354745 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
逛到本站,mark一下
[***.202.152.39]2024年04月06日 04时25分02秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
【第15周复盘】B站是个学习的网站
2019-04-27
黄家懿:河北高校邀请赛 -- 二手车交易价格预测决赛答辩
2019-04-27
如何利用pyecharts绘制酷炫的桑基图?
2019-04-27
王朝阳:河北高校邀请赛 -- 二手车交易价格预测决赛答辩
2019-04-27
Scratch等级考试(二级)模拟题
2019-04-27
如何在Jupyter Lab中显示pyecharts的图形?
2019-04-27
什么是Python之禅?
2019-04-27
【青少年编程】【Scratch】01 运动模块
2019-04-27
json的序列化与反序列化
2019-04-27
【第16周复盘】学习的飞轮
2019-04-27
如何利用pyecharts绘制炫酷的关系网络图?
2019-04-27
NCEPU:线下组队学习周报(007)
2019-04-27
【青少年编程】【二级】寻找宝石
2019-04-27
牧小熊:Adobe Illustrator 在科研作图中的应用!
2019-04-27
【青少年编程】【Scratch】03 声音模块
2019-04-27
【青少年编程】马雷越:商品价格竞猜
2019-04-27
【第17周复盘】拿到红本本喽!
2019-04-27
谢文睿:西瓜书 + 南瓜书 吃瓜系列 1. 一元线性回归
2019-04-27
Scratch等级考试(二级)模拟题
2019-04-27
谢文睿:西瓜书 + 南瓜书 吃瓜系列 2. 多元线性回归
2019-04-27