网络请求库的导入

pip install requests
安装 pip 包管理器相关:点击前往

import requests         #引入网络请求库库   
r = requests.get(url)   #发送get请求
r.status_code           #状态码,返回200意味着请求成功

正则表达式库的引入和使用

#引入 re 库
import re 

#利用正则表达式查找全部的a标签,包括链接              
regex = r'<a class="url"href=(.*?)>'

#findall 方法用于索引html文件下的文本内容
re.findall(regex,html)


有关 Response 对象的各方面属性


属性说明
Response.status_codeHTTP请求的返回状态,200表示链接成功,404表示失败
Response.textHTTP响应内容的字符串形式,即,url对应的页面内容
Response.encoding从HTTP header 中猜测的响应内容编码方式
Response.apparent_encoding从内容中分析出的响应内容编码方式(备选编码方式)
Response.contentHTTP响应内容的二进制形式


Requests 库的异常


异常说明
requests.ConnectionError网络连接错误异常,如DNS查询失败/拒绝连接等
requests.HTTPErrorHTTP错误异常
requests.URLRequiredURL缺失异常
requests.TooManyRedirects超过最大重定向次数,产生重定向异常
requests.ConnectTimeout连接远程服务器超时异常
requests.Timeout请求URL超时,产生超时异常
raise_for_status()如果返回值不是200,产生异常requests.HTTPError



待更新img