html文档解析的三方库beautifulsoup4

什么是beautifulsoup?

学习资源：

1.安装

pip install beautifulsoup4

2.使用

至少要对html有一定的了解。

from bs4 import BeautifulSoup

举例：获取一个页面中的所有链接

def get_link(url="http://www.zhihu.com"):    hrefs = []    html = urllib2.urlopen(url=url).read()    soup = BeautifulSoup(html, "html.parser")    for link in soup.find_all('a'):        href = link.get('href')        if not href.startswith('http'):            href = url + href        hrefs.append(href)    return hrefs

上一篇：coddenomicon工具

下一篇：CSS层叠样式表

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

推荐文章

8051单片机(STC89C52)八个LED灯闪烁 2019-03-05

8051单片机(STC89C52)以定时器中断模式实现两倒计时器异步计时 2019-03-05

8051单片机(STC89C52)实现可修改初值(并可命令启停)的单倒计时器(Version1.1) 2019-03-05

基于8051实现的双倒计时器(Version1.0) 2019-03-05

8051单片机(STC89C52)之蜂鸣器发声 2019-03-05

参数检验之t检验 2019-03-05

ament: command not found ROS2 2019-03-05

双变量的t检验 2019-03-05

用 wxPython 打印你的 App 2019-03-05

wxPython：引用、展示图片、Stock IDs、操作剪切板、拖拽 2019-03-05

网页设计所需要的工具，各个岗位的职能，都在这里了 2019-03-05

android GPS JAVA 获取GPS功能是否禁用 2019-03-05

vue项目通过vue.config.js配置文件进行proxy反向代理跨域 2019-03-05

Linux下安装MySql过程 2019-03-05

原生vue实现VantUI中IndexBar索引导航栏功能 2019-03-05

解决：android TextView上响应部分文字的事件 2019-03-05

android:使用audiotrack 类播放wav文件 2019-03-05

vue通过better-scroll 封装自定义的下拉刷新组件 2019-03-05

android解决：使用多线程和Handler同步更新UI 2019-03-05

vue自定义封装Loading组件 2019-03-05

白红宇的个人博客 - 记录点点滴滴的事 - 您是第 457156311 位访客