• 设为首页
  • 收藏本站
  • 积分充值
  • VIP赞助
  • 手机版
  • 微博
  • 微信
    微信公众号 添加方式:
    1:搜索微信号(888888
    2:扫描左侧二维码
  • 快捷导航
    福建二哥 门户 查看主题

    Python统计不同整数的出现次数的三种方法

    发布者: 福建二哥 | 发布时间: 2025-6-17 08:08| 查看数: 64| 评论数: 0|帖子模式

    一、问题定义:什么是"不同整数的计数"?

    假设有一个包含重复整数的列表:[1, 2, 3, 4, 2, 3, 4, 5],我们需要统计其中有多少个不重复的整数。答案显然是5个(1,2,3,4,5)。
    这个问题看似简单,但实际应用中常伴随复杂场景:

    • 数据量庞大(百万级甚至亿级)
    • 需要实时统计
    • 内存资源有限
    • 需要同时获取出现次数

    二、解决方案一:集合去重法(适合基础场景)

    核心思路:利用集合(Set)元素的唯一性自动去重。
    1. my_list = [1, 2, 3, 4, 2, 3, 4, 5]
    2. unique_values = set(my_list)  # 转换为集合
    3. count = len(unique_values)    # 获取集合长度
    4. print(count)  # 输出:5
    复制代码
    原理说明:

    • set()函数将列表转换为集合,自动过滤重复元素
    • 集合的查找时间复杂度为O(1),适合快速判断元素存在性
    • 最终通过len()函数获取集合大小,即不同整数数量
    性能特点:

    • 时间复杂度:O(n)(转换集合)
    • 空间复杂度:O(n)(存储唯一值)
    • 优点:代码简洁,执行速度快
    • 缺点:无法获取具体出现次数

    三、解决方案二:字典计数法(适合需要频次的场景)

    核心思路:用字典存储每个整数的出现次数,最后统计字典键的数量。
    1. my_list = [1, 2, 3, 4, 2, 3, 4, 5]
    2. count_dict = {}

    3. for num in my_list:
    4.     count_dict[num] = count_dict.get(num, 0) + 1  # 存在则+1,否则初始化为1

    5. count = len(count_dict)
    6. print(count)  # 输出:5
    复制代码
    原理说明:

    • 遍历列表时,用get()方法安全获取当前计数值
    • count_dict.get(num, 0)表示:若num存在则返回计数值,否则返回0
    • 最终通过字典的键数量获取不同整数数量
    扩展应用:

    • 获取具体出现次数:print(count_dict) 输出{1:1, 2:2, 3:2, 4:2, 5:1}
    • 查找最频繁整数:max(count_dict, key=count_dict.get)
    性能特点:

    • 时间复杂度:O(n)(单次遍历)
    • 空间复杂度:O(n)(存储所有键值对)
    • 优点:可获取详细频次信息
    • 缺点:相比集合法需要额外存储空间

    四、解决方案三:collections.Counter(专业统计工具)

    核心思路:使用Python标准库中的Counter类,专为计数设计。
    1. from collections import Counter

    2. my_list = [1, 2, 3, 4, 2, 3, 4, 5]
    3. counter = Counter(my_list)  # 自动统计频次
    4. count = len(counter)        # 获取唯一值数量
    5. print(count)  # 输出:5
    复制代码
    进阶用法:
    1. # 获取出现次数最多的3个整数
    2. print(counter.most_common(3))  # 输出:[(2, 2), (3, 2), (4, 2)]

    3. # 数学运算(支持加减交并集)
    4. counter2 = Counter([5,6,6,7])
    5. print(counter + counter2)  # 合并统计
    6. print(counter & counter2)  # 交集统计
    复制代码
    性能特点:

    • 时间复杂度:O(n)(与字典法相当)
    • 空间复杂度:O(n)
    • 优点:内置丰富统计方法,代码最简洁
    • 缺点:需要导入标准库

    五、性能对比与选型建议

    方法时间复杂度空间复杂度适用场景集合去重法O(n)O(n)仅需简单计数字典计数法O(n)O(n)需要频次信息的中小型数据Counter类O(n)O(n)需要复杂统计的大型数据选型建议:

    • 数据量小且无需频次信息 → 集合去重法
    • 需要频次但数据量中等 → 字典计数法
    • 专业数据分析/大数据场景 → collections.Counter

    六、实战案例:日志分析中的IP统计

    需求:统计服务器日志中不同IP的访问次数,找出访问最频繁的10个IP。
    1. from collections import Counter

    2. # 模拟日志数据(每行包含IP地址)
    3. log_lines = [
    4.     "192.168.1.1 - - [timestamp] "GET / HTTP/1.1"",
    5.     "10.0.0.5 - - [timestamp] "POST /api"",
    6.     "192.168.1.1 - - [timestamp] "GET /css/style.css"",
    7.     # ...(百万级日志数据)
    8. ]

    9. # 提取IP地址
    10. ips = [line.split()[0] for line in log_lines]

    11. # 统计并输出结果
    12. ip_counter = Counter(ips)
    13. print("不同IP数量:", len(ip_counter))
    14. print("Top10 IP:", ip_counter.most_common(10))
    复制代码
    代码解释:

    • 使用列表推导式高效提取IP地址
    • Counter自动处理百万级数据统计
    • most_common(10)直接获取高频IP

    七、总结:智能时代的计数利器

    不同整数的计数问题看似简单,实则蕴含多种解决方案。在Python生态中:

    • 集合提供了最基础的去重能力
    • 字典实现了频次统计的基础需求
    • collections.Counter则是专业级统计工具
    随着数据规模的增长,合理选择数据结构变得尤为重要。对于智能时代的开发者而言,掌握这些计数方法,就如同拥有了精准的数字显微镜,能够高效洞察数据背后的规律。
    以上就是Python统计不同整数的出现次数的三种方法的详细内容,更多关于Python统计不同整数出现次数的资料请关注脚本之家其它相关文章!

    来源:https://www.jb51.net/python/339675dcm.htm
    免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

    最新评论

    QQ Archiver 手机版 小黑屋 福建二哥 ( 闽ICP备2022004717号|闽公网安备35052402000345号 )

    Powered by Discuz! X3.5 © 2001-2023

    快速回复 返回顶部 返回列表