【Linux命令面试高频】- 对文本进行分组并统计每个值出现的次数
发布日期:2021-06-29 15:36:38 浏览次数:3 分类:技术文章

本文共 964 字,大约阅读时间需要 3 分钟。

3.对文本进行分组并统计每个值出现的次数?

(1) grep+wc统计某个字符出现的次数

grep -o '404' nginx.conf | wc -l输出4grep -o '404\|8081' nginx.conf | wc -l输出5

(2) 统计文件中某个字符出现的次数

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mAJFn3ZM-1620829451614)(imgs/22.png)]

从某行取出分割的串

cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'

cat读取当前文件;awk -F 进行分割字符,并打印第二列的字符;在这里 ‘(txt=|&client)’是分隔符,它是一个正则表达式。

sdate=2017-09-20 23:59:32&com.ford.fordmobile_id=x

之后排序

cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'|sort

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UnfxzgP8-1620829451616)(imgs\23.png)]

之后统计数量与去重

cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'| sort | uniq -c

uniq -c 中的-c 代表在每列旁边显示该行重复出现的次数

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aXrca4i9-1620829451624)(imgs\24.png)]

之后再按重复次数排序

cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'| sort | uniq -c | sort -nr

sort -n 按照数值的大小排序;-r按照相反顺序

最后将结果输出到文件中

cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'| sort | uniq -c | sort -nr > testfile

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YhBQ7nGO-1620829451627)(imgs\25.png)]

面试真题:

对第二列进行group,得到每个值出现次数。

123|weixin|314

45|zfb|321

12|weixin|14

先将这些写到一个test.log文件当中。

cat test.log | awk -F '|' 'print $2' | sort | uniq -c | sort -nr > res.log

转载地址:https://codingchaozhang.blog.csdn.net/article/details/116723160 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:【Linux命令面试高频】-linux下命令查看TCP连接数
下一篇:【Linux命令面试高频】- linux在多个文件查找字符串

发表评论

最新留言

很好
[***.229.124.182]2024年04月12日 05时15分36秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章

功能更新!C 函数也能在 MicroPython 中被调用啦 2019-04-29
东软载波携ES32+RT-Thread走进海尔集团 2019-04-29
今晚8点直播预告:RT-Thread Studio等相关主题答疑 2019-04-29
Linux内核在中国大发展的黄金十年-写于中国Linux存储、内存管理和文件系统峰会十周年之际... 2019-04-29
物联网 20 年简史大揭秘! 2019-04-29
开源项目|RT-Thread 软件包应用作品:水墨屏桌面台历 2019-04-29
珠联璧合!基于i.MX RT和RT-Thread的物联网云接入方案 2019-04-29
基于RTT-MicroPython制作自带BGM的新型肺炎晴雨表 2019-04-29
Arm宣布推出Cortex-M55核心和Ethos-U55 microNPU,瞄准低功耗Edge AI 2019-04-29
开源项目|RT-Thread 软件包应用作品:小闹钟 2019-04-29
在 RT-Thread Studio 上使用 RT-Thread Nano 2019-04-29
开源项目|软件包应用作品:通用物联网系统平台 2019-04-29
【经验分享】RT-Thread UART设备驱动框架初体验(中断方式接收带\r\n的数据) 2019-04-29
单片机里面的CPU使用率是什么鬼? 2019-04-29
推荐一个优质Linux技术公众号-作者都是一线Linux代码贡献者们哦 2019-04-29
RT-Thread 编程风格指南 2019-04-29
95后高校电子教师,软硬兼修有趣有料! 2019-04-29
使用 STM32 通用 Bootloader ,让 OTA 更加 Easy 2019-04-29
Cache 的基本概念与工作原理 2019-04-29
装机量超亿台 RISC-V +IoT OS!中科蓝讯与RT-Thread战略合作,共推自主物联网生态发展 2019-04-29