Python怎么获取网页返回的状态码?Python爬虫返回状态码是什么意思

python爬虫是一种需要和网页进行请求,然后成功响应将网页上所有数据都抓取过来再返回的程序 。而在有些时候爬虫可能会返回错误信息或者没有数据,那么此时可以查看状态码来知道请求发生了什么问题 。下文会介绍python获取返回状态码的方法,以及它们的含义 。

Python怎么获取网页返回的状态码?Python爬虫返回状态码是什么意思


一、获取网页返回状态码
在python爬虫之中能够使用urllib、requests、httplib等内置模块和标准库来完成请求和响应的操作从而获取数据,而在这些获取的数据之中就已经包含了Http状态码,下面为使用requests模块获取网页返回状态码的代码实例,如下所示:
import requestscode=requests.get("//www.jb51.net https://links.jianshu.com/go?to=%2F%2Fwww.jb51.net").status_codeprint(code)二、状态码含义
爬虫返回数据中取到的状态码实际名称应该叫做HTPP状态码,它是用来表示客户端与服务端请求和响应情况的一种标识符 。所有的状态码总共分为四种,分别使用1234数字开头,并且长度不会超过三个字符 。
而这四种状态码表示的意思都是不同的,其中1xx表示的意思就是单纯返回了消息,服务端已经接收到了客户端请求但是还没完成实际操作,还需要客户端继续采取其他行动 。
而2xx就是各种意义上都希望看到的状态码了,因为它表示的意思为当前请求成功被服务端接收了,而其中状态码200的意思就表示请求成功处理并且以响应返回数据 。
3xx的意思为重定向,这个重定向指的是当前请求的网站不存在或者是请求的方法不正确,需要换个方法或者更改链接 。
最后4xx状态码表示请求或者响应出错误了,其中404就是最常见的一个,它的意思是网站不存在所以无法响应请求 。
【Python怎么获取网页返回的状态码?Python爬虫返回状态码是什么意思】以上就是关于“Python怎么获取网页返回的状态码?Python爬虫返回状态码是什么意思”的全部内容了,希望对你有所帮助 。

    猜你喜欢