使用python进行抓包的时候需要的一个链接,“https%3A%2F%2Fwww.phper163.com%2Flist%2F6.html”,这是一种url编码过的链接,其中“%3A”表示“:”、“%2F”代表“/”。URL为何要编码、解码?为了避免url中有的字符造成歧义问题。例如,url参数字符串中使用key=value键值对这样的形式来传参,键值对之间以&符号分隔,如/s?q=php&page=2。如果你的value字符串中包含了=或者&,那么势必会造成接收Url的服务器解析错误,因此必须将引起歧义的&和=符号进行转义,也就是对其进行编码。
python3中如何对url进行编码与解码了,使用 urllib库下parse模块。parse.quote()进行url编码,parse.unquote()进行解码
from urllib import parse url='http://www.phper163.com/?s=python&page=2' print(parse.quote(url,safe='')) #url编码,输出 http%3A%2F%2Fwww.phper163.com%2F%3Fs%3Dpython%26page%3D2 url2='http%3A%2F%2Fwww.phper163.com%2F%3Fs%3Dpython%26page%3D2' print(parse.unquote(url2)) #url解码,输出 http://www.phper163.com/?s=python&page=2
发表评论 取消回复