Requests库的入门
发布日期:2021-06-29 15:39:09 浏览次数:2 分类:技术文章

本文共 1548 字,大约阅读时间需要 5 分钟。

1.cmd(管理员权限)--->pip install requests

 

2.Requests库的7个方法

requests.request() 构造一个请求,支撑以下各方法的基础方法

requests.get()     获取HTML网页的主要方法,对应于HTTP的GET

requests.head()    获取HTML网页头信息的方法,对应于HTTP的HEAD

requests.post()    向HTML网页提交POST请求的方法,对应于HTTP的HEAD

requests.put()     向HTML网页提交PUT请求的方法,对应于HTTP的PUT

requests.patch()   向HTML网页提交局部修改请求,对应于HTTP的PATCH

requests.delete()  向HTML页面提交删除请求,对应于HTTP的DELETE

 

 

requests.get(url,params=None,**kwargs)

url:拟获取页面的url链接

params:url中的额外参数,字典或字节流格式,,可选

**kwargs:12个控制访问的参数

 

3.requests对象的属性

r.status_code     HTTP请求的返回状态,200表示连接成功,404表示

r.text            HTTP响应内容的字符串形式,即url对应的页面内容

r.encoding        从HTTP header中猜测的响应内容编码方式

r.apparent_encoding 从内容中分析的响应内容编码方式

r.content         HTTP响应内容的二进制形式

 

4.requests库的异常

requests.ConnectionError 网络连接错误,如DNS查询失败、拒绝连接

requests.HTTPError  HTTP错误异常

requests.URLRequired  URL缺失异常

requests.TooManyRedirects  超过最大重定向次数,产生重定向异常

requests.ConnectTimeout  连接远程服务器超时异常

requests.Timeout  请求URL超时,产生超时异常

 

5.理解requests的异常

r..raise_for_status()  如果不是200,产生异常requests.HTTPError

 

6.爬取网页通用代码

import requestsdef getHTMLText(url):    try:        r=requests.get(url,timeout=30)        r.raise_for_status()        r.encoding=r.apparent_encoding        return r.text    except:        return "产生异常" if __name__=="__main__":    url="http://taxq.sdust.edu.cn"    print(getHTMLText(url))

 

7.HTTP协议

HTTP,Hypertext Transfer Protocol 超文本传输协议

HTTP是一个基于“请求与响应”模式的、无状态的应用层协议

HTTP协议采用URL作为定位网络资源的标识

 

URL格式

host:合法的Internet主机域名或IP地址

port:端口号,缺省端口为80

path:请求资源的路径

 

8.requests小结

requests.request()

requests.get()

requests.head()

requests.post

requests.put()

requests.patch()

requests.delete()

 

转载地址:https://codingchaozhang.blog.csdn.net/article/details/76423066 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:Robots协议
下一篇:Python语言开发工具

发表评论

最新留言

很好
[***.229.124.182]2024年04月03日 11时25分06秒