Python怎么获取网页返回的状态码？Python爬虫返回状态码是什么意思 _python

python爬虫是一种需要和网页进行请求，然后成功响应将网页上所有数据都抓取过来再返回的程序。而在有些时候爬虫可能会返回错误信息或者没有数据，那么此时可以查看状态码来知道请求发生了什么问题。下文会介绍python获取返回状态码的方法，以及它们的含义。

一、获取网页返回状态码
在python爬虫之中能够使用urllib、requests、httplib等内置模块和标准库来完成请求和响应的操作从而获取数据，而在这些获取的数据之中就已经包含了Http状态码，下面为使用requests模块获取网页返回状态码的代码实例，如下所示：
import requestscode=requests.get("//www.jb51.net https://links.jianshu.com/go?to=%2F%2Fwww.jb51.net").status_codeprint(code)二、状态码含义
爬虫返回数据中取到的状态码实际名称应该叫做HTPP状态码，它是用来表示客户端与服务端请求和响应情况的一种标识符。所有的状态码总共分为四种，分别使用1234数字开头，并且长度不会超过三个字符。
而这四种状态码表示的意思都是不同的，其中1xx表示的意思就是单纯返回了消息，服务端已经接收到了客户端请求但是还没完成实际操作，还需要客户端继续采取其他行动。
而2xx就是各种意义上都希望看到的状态码了，因为它表示的意思为当前请求成功被服务端接收了，而其中状态码200的意思就表示请求成功处理并且以响应返回数据。
3xx的意思为重定向，这个重定向指的是当前请求的网站不存在或者是请求的方法不正确，需要换个方法或者更改链接。
最后4xx状态码表示请求或者响应出错误了，其中404就是最常见的一个，它的意思是网站不存在所以无法响应请求。
【Python怎么获取网页返回的状态码？Python爬虫返回状态码是什么意思】以上就是关于“Python怎么获取网页返回的状态码？Python爬虫返回状态码是什么意思”的全部内容了，希望对你有所帮助。

Python怎么获取网页返回的状态码？Python爬虫返回状态码是什么意思

猜你喜欢