Python3使用urllib爬取简单页面

 时间:2026-04-22 15:30:31

1、打开Python开发工具IDLE,新建‘url.py’文件,编写代码如下:

from urllib.request import urlopen

resp = urlopen('http://www.baidu.com')

print (resp.read())

Python3使用urllib爬取简单页面

2、F5运行程序,获取到百度的首页的页面,打印源代码到Shell

Python3使用urllib爬取简单页面

3、改写代码,打印百度返回状态码

from urllib.request import urlopen

resp = urlopen('http://www.baidu.com')

print (resp.getcode())

Python3使用urllib爬取简单页面

4、F5运行程序,打印出请求返回状态码200

200 代表正常

500 服务器出错

400 请求参数异常

Python3使用urllib爬取简单页面

5、改写代码,打印请求url地址

from urllib.request import urlopen

resp = urlopen('http://www.baidu.com')

print (resp.getcode())

print (resp.geturl())

Python3使用urllib爬取简单页面

6、F5运行程序,打印出发起访问百度url

Python3使用urllib爬取简单页面

7、改写代码,打印返回头部信息

from urllib.request import urlopen

resp = urlopen('http://www.baidu.com')

print (resp.getcode())

print (resp.geturl())

print (resp.info())

Python3使用urllib爬取简单页面

8、F5运行程序,打印出返回头部信息

Python3使用urllib爬取简单页面

  • win10更新后无法上网解决方法
  • 怎么设置下载速度
  • 显卡怎么拆下来
  • Windows11如何设置新网络
  • win10无法访问internet
  • 热门搜索
    瘦金体怎么练 电脑怎么清理缓存 空格怎么打出来 我的世界怎么建房子 房间面积怎么算 万花筒怎么做 手机怎么解锁 鬼剃头是怎么回事 玛吉斯轮胎怎么样 安全套怎么用