正则表达式匹配特定字母后面的数字
发布日期:2021-05-07 14:14:24 浏览次数:12 分类:原创文章

本文共 270 字,大约阅读时间需要 1 分钟。

需求场景,爬虫数据提取。

  1. 通过text = request.get().text()得到目标网页的内容
  2. 通过text_html = BeautifulSoup(text)得到html形式
  3. 通过tag = text_html.find_all(label)[i]得到目标数据所在标签
  4. 通过NavigableString = tag.get_text()得到目标标签内的字符串内容
  5. 通过正则表达式匹配出特定字母后面的数据,就是想要的数据

本文遇到的是爬取链家二手房在售数目,最后得到这样一段字符串

在这里插入图片描述

所用正则表达式:count:\s\d{1,9}

上一篇:通过xshell从Linux服务器下载文件夹
下一篇:实用案例学DolphinDB:tushare数据保存、WorldQuant因子(附完整代码)

发表评论

最新留言

第一次来,支持一个
[***.219.124.196]2025年03月20日 16时38分46秒