3,统计序列中相同元素出现的频率
发布日期:2021-05-18 11:08:37 浏览次数:20 分类:精选文章

本文共 736 字,大约阅读时间需要 2 分钟。

统计序列中相同元素出现的频率最高的三个

体现数据分布特征时,可以通过字典记录每个数字出现的频率。以下方法基于标准库快速实现:

  • 使用icty从序列生成频率字典: orta

  • 统计单词频率,直接调用Counter:

  • create a list of split words from text file

    频率统计结果:

    output the top 10 words withtheir counts

    建议使用 Counter,优点是高效且直观

    代码示例:

    展示优化后的代码片段:

    from collections import Counter
    def count_sequence_frequency():
    data = [randint(1, 20) for _ in range(30)]
    frequency_dict = dict.fromkeys(data, 0)
    for i in data:
    frequency_dict[i] += 1
    return Counter(frequency_dict).most_common(3)
    def count_word_frequency():
    text = open(r'english.txt', encoding="utf-8").read()
    words = re.split(r'\W+', text)
    return Counter(words).most_common(10)

    代码解释:

  • 首先生成数据序列
  • 创建字典记录初始频率
  • 更新字典统计实际频率
  • 使用Counter快速统计
  • 获取排序结果
  • 推荐这种方法的优势是直观且高效,简化实现过程。

    上一篇:4,如何根据字典中值的大小,对字典中的项进行排序
    下一篇:2,如何为元组中的每个元素命名,提高程序可读性

    发表评论

    最新留言

    留言是一种美德,欢迎回访!
    [***.207.175.100]2025年04月16日 07时51分25秒