署理加盟 2019全新署理方案 挣钱+省钱左右开弓,独立途径,丰盛赢利!

您现在的方位: unibet网 > 站长学院 > SEO资讯 >

搜索引擎蜘蛛匍匐日志 回来代码

来历:不知道 发布时刻:2012-11-29热度:我要谈论
作为一名合格的SEO专员,一定要了解以及理解搜索引擎蜘蛛过来匍匐您的网站回来的日志代码,这样才干更好的掌握,去了解,深入研究搜索引擎的习性和您的网站存在的问题。...

unibet注册免费下载,无需注册无需充值

在网站日志中,咱们常常会看到许多回来的http代码,如201、304、404、500等等。可是这些详细的回来的HTTP代码终究什么意义呢,在此做一下常识遍及吧,记不住没关系,到时候看看就行了,但最主要的几个还要要清楚的。

一些常见的状况码为:站长必备:

200 - 服务器成功回来网页
404 - 恳求的网页不存在
503 - 服务器超时

下面供给 HTTP 状况码的完好列表。点击链接可了解概况。您也能够拜访 HTTP 状况码上的 W3C 页获取更多信息。

1xx(暂时呼应)
表明暂时呼应并需求恳求者持续履行操作的状况码。
100(持续)恳求者应当持续提出恳求。服务器回来此代码表明已收到恳求的榜首部分,正在等候其余部分。
101(切换协议)恳求者已要求服务器切换协议,服务器已承认并预备切换。
2xx (成功)  表明成功处理了恳求的状况码。
站长必备:200(成功)服务器已成功处理了恳求。一般,这表明服务器供给了恳求的网页。假如是对您的 robots.txt 文件显现此状况码,则表明 Googlebot 已成功检索到该文件。
201(已创立)恳求成功而且服务器创立了新的资源。
202(已承受)服务器已承受恳求,但没有处理。
203(非授权信息)服务器已成功处理了恳求,但回来的信息或许来自另一来历。
204(无内容)服务器成功处理了恳求,但没有回来任何内容。
205(重置内容)服务器成功处理了恳求,但没有回来任何内容。与 204 呼应不同,此呼应要求恳求者重置文档视图(例如,铲除表单内容以输入新内容)。
206(部分内容)服务器成功处理了部分 GET 恳求。

3xx (重定向)
要完结恳求,需求进一步操作。一般,这些状况码用来重定向。Google 主张您在每次恳求中运用重定向不要超越 5 次。您能够运用网站管理员东西检查一下 Googlebot 在抓取重定向网页时是否遇到问题。确诊下的网络抓取页列出了因为重定向过错导致 Googlebot 无法抓取的网址。
300(多种挑选)针对恳求,服务器可履行多种操作。服务器可根据恳求者 (user agent) 挑选一项操作,或供给操作列表供恳求者挑选。
站长必备:301(永久移动)恳求的网页已永久移动到新方位。服务器回来此呼应(对 GET 或 HEAD 恳求的呼应)时,会主动将恳求者转到新方位。您应运用此代码告知 Googlebot 某个网页或网站已永久移动到新方位。
302(暂时移动)服务器现在从不同方位的网页呼应恳求,但恳求者应持续运用原有方位来呼应今后的恳求。此代码与呼应 GET 和 HEAD 恳求的 301 代码相似,会主动将恳求者转到不同的方位,但您不该运用此代码来告知 Googlebot 某个网页或网站现已移动,因为 Googlebot 会持续抓取原有方位并编制索引。
303(检查其他方位)恳求者应当对不同的方位运用独自的 GET 恳求来检索呼应时,服务器回来此代码。关于除 HEAD 之外的一切恳求,服务器会主动转到其他方位。
304(未修改)自从前次恳求后,恳求的网页未修改正。服务器回来此呼应时,不会回来网页内容。

假如网页自恳求者前次恳求后再也没有更改正,您应将服务器装备为回来此呼应(称为 If-Modified-Since HTTP 标头)。服务器能够告知搜索引擎的蜘蛛/机器人 自从前次抓取后网页没有改变,从而节约带宽和开支。
305(运用署理)恳求者只能运用署理拜访恳求的网页。假如服务器回来此呼应,还表明恳求者应运用署理。
307(暂时重定向)服务器现在从不同方位的网页呼应恳求,但恳求者应持续运用原有方位来呼应今后的恳求。此代码与呼应 GET 和 HEAD 恳求的 301 代码相似,会主动将恳求者转到不同的方位,但您不该运用此代码来告知 Googlebot 某个页面或网站现已移动,因为 Googlebot 会持续抓取原有方位并编制索引。

4xx(恳求过错)
这些状况码表明恳求或许犯错,阻碍了服务器的处理。
400(过错恳求)服务器不理解恳求的语法。
401(未授权)恳求要求身份验证。关于登录后恳求的网页,服务器或许回来此呼应。
403(制止)服务器拒绝恳求。假如您在 Googlebot 测验抓取您网站上的有用网页时看到此状况码(您能够在 Google 网站管理员东西确诊下的网络抓取页面上看到此信息),或许是您的服务器或主机拒绝了 Googlebot 拜访。
站长必备:404(未找到)服务器找不到恳求的网页。例如,关于服务器上不存在的网页常常会回来此代码。
假如您的网站上没有 robots.txt 文件,而您在 Google 网站管理员东西"确诊"标签的 robots.txt 页上看到此状况码,则这是正确的状况码。可是,假如您有 robots.txt 文件而又看到此状况码,则阐明您的 robots.txt 文件或许命名过错或坐落过错的方位(该文件应当坐落尖端域,名为 robots.txt)。
假如关于 Googlebot 抓取的网址看到此状况码(在"确诊"标签的 HTTP 过错页面上),则表明 Googlebot 跟从的或许是另一个页面的无效链接(是旧链接或输入有误的链接)。
405(办法禁用)禁用恳求中指定的办法。
406(不承受)无法运用恳求的内容特性呼应恳求的网页。
407(需求署理授权)此状况码与 401(未授权)相似,但指定恳求者应当授权运用署理。假如服务器回来此呼应,还表明恳求者应当运用署理。
408(恳求超时)服务器等候恳求时发作超时。
409(抵触)服务器在完结恳求时发作抵触。服务器必须在呼应中包括有关抵触的信息。服务器在呼应与前一个恳求相抵触的 PUT 恳求时或许会回来此代码,以及两个恳求的差异列表。
410(已冥具)假如恳求的资源已永久冥具,服务器就会回来此呼应。该代码与 404(未找到)代码相似,但在资源曾经存在而现在不存在的情况下,有时会用来代替 404 代码。假如资源已永久移动,您应运用 301 指定资源的新方位。
411(需求有用长度)服务器不承受不含有用内容长度标头字段的恳求。
412(未满意前提条件)服务器未满意恳求者在恳求中设置的其间一个前提条件。
413(恳求实体过大)服务器无法处理恳求,因为恳求实体过大,超出服务器的处理才干。
414(恳求的 URI 过长)恳求的 URI(一般为网址)过长,服务器无法处理。
415(不支撑的媒体类型)恳求的格局不受恳求页面的支撑。
416(恳求规模不符合要求)假如页面无法供给恳求的规模,则服务器会回来此状况码。
417(未满意希望值)服务器未满意"希望"恳求标头字段的要求。

5xx(服务器过错)
501(没有施行)服务器不具备完结恳求的功用。例如,服务器无法辨认恳求办法时或许会回来此代码。
502(过错网关)服务器作为网关或署理,从上游服务器收到无效呼应。
503(服务不可用)服务器现在无法运用(因为超载或停机维护)。一般,这场所暂时状况。
504(网关超时)服务器作为网关或署理,可是没有及时从上游服务器收到恳求。
505(HTTP 版别不受支撑)服务器不支撑恳求中所用的 HTTP 协议版别。

本文地址:https://www.m88nob1.com/搜索引擎优化/65.html

责任编辑:unibet网

    宣布谈论

    谈论列表(条)