Python网络爬虫_URL封装【5】

Almango

天真永不消逝，浪漫至死不渝。

Announcement

Welcome to my blog! This is a sample announcement.

Learn More

438 字

2 分钟

Python网络爬虫_URL封装【5】

2023-07-14

学习笔记

Python

/

Socket

/

网络编程

为了达到便于管理的目的，大多网站会对网页的URL地址采取封装措施。

URL封装#

在我们访问网站时，通常会看到不一样的网址，就如豆瓣电影的动作片排行榜的网页路径一样。并不是一个很层级形式的路径。
这就是URL封装。

3. 可以发现，URL路径中，从里面的问号开始往后就是封装的内容。

4. 像URL路径这样的，一般以Json的形式存在于请求的Request Payload，内参数用于指定路径。准确来说应该是一种请求体。 5. 我们打开检查查看Payload 6. 可以发现，Payload参数完全对应着URL的后半部分。

如果我们把这个Payload放入代码中拼接起来会咋样呢因为像这样的参数我们需要将它们写成字典再传入Params可选参数，即可。

1
import requests  # 导入请求库
2

3
tou = {    # 伪装浏览器
4
    "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36',
5
    }
6
ts = {   # 组装封装参数
7
    "type_name" : "动作",
8
    "type" : "5",
9
    "interval_id" : "100:90",
10
    "action" : "",
11

12
}
13
resposn = requests.get('https://movie.douban.com/typerank/', headers=tou,  params=ts)
14

15
print(resposn.text)   # 输出