离线下载
PDF版 ePub版

SEO 自学网 · 更新于 2017-11-24 13:00:55

网站日志

1、什么是网站日志

网站日志是记录 web 服务器接收处理请求以及运行时错误等各种原始信息的以•log 结尾的文件,确切的讲,应该是服务器日志。网站日志最大的意义是记录网站运营中比如空间的运营情况,被访问请求的记录。通过网站日志可以清楚的得知用户在什么 IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功

所谓的网站日志,就是网站所在服务器接受用户的各种请求的时候进行的处理状况的记录,无论是正常处理或者是出了各种错误,都会在网站日志中记录下来,其文件结尾以。log 为扩展名。

2、网站日志举例

从网站上下载下的网站日志,在 txt 文本中就可以看到以下数据: 222.208.186.66--GET/HTTP/1.1-200-32229-http://www.yzfdjz.net-Mozilla/4.0(compatible;MSIE6.0;WindowsNT5.0

222.208.186.66——这是用户的 IP 地址,相信大家都能轻易看懂。知道了用户的 IP,你甚至可以通过查询来得知用户是来自哪个国家、哪个省份、哪个城市的。查询得知,这个 IP 来自国内北京地区。不同的网站其用户群会有比较明显的区别,比如我的博客肯定大多数访问者是来自沈阳的,而有的网站其用户没有什么明显的地域区别。用户 IP 配合下面的关键词等信息可以让你更加有效的分析网站的用户体验做得够不够好。

——这里讲的是发生该处理请求的具体时间。这里的时间是 2014 年 8 月 30 日 7 点 16 分 41 秒,后面的+0800 则指的是时区,即所在地方相对应英国伦敦格林尼治时间,+0800 代表的是东八区的时间。

GET——这是服务器的处理动作,一共只有两种:GET 和 POST。在网站日志中绝大部分都是 GET,只有在进行 CGI 处理的时候才会出现 POST,否则绝大多数时间服务器的响应都是 GET,也就是用户从服务器上获取了页面或者别的文件。注意了,GET 后面还有一个“/”,这里代表的是用户访问的页面,只有一个斜杠自然代表访问的是网站首页。

HTTP/1.1——这个代表用户访问该页面的时候,是通过 HTTP1.1 协议进行传输的,也就是超文本传输 1.1 版本协议。这个我们不必理会,因为网站日志中除了你可能用 FTP 之外,普通用户基本都是通过 HTTP 协议来进行访问的(个别提供 FTP 下载的网站除外)。

200-32229——代表的是用户访问页面的时候返回的状态码。以下就一些代码做个解释:

  • 1**:请求收到,继续处理
  • 2**:操作成功收到,分析、接受
  • 3**:完成此请求必须进一步处理
  • 4**:请求包含一个错误语法或不能完成
  • 5**:服务器执行一个完全有效请求失败

  • 100——客户必须继续发出请求
  • 101——客户要求服务器根据请求转换 HTTP 协议版本
  • 200——交易成功
  • 201——提示知道新文件的 URL
  • 202——接受和处理、但处理未完成
  • 203——返回信息不确定或不完整
  • 204——请求收到,但返回信息为空
  • 205——服务器完成了请求,用户代理必须复位当前已经浏览过的文件
  • 206——服务器已经完成了部分用户的 GET 请求
  • 300——请求的资源可在多处得到
  • 301——删除请求数据
  • 302——在其他地址发现了请求数据
  • 303——建议客户访问其他 URL 或访问方式
  • 304——客户端已经执行了 GET,但文件未变化
  • 305——请求的资源必须从服务器指定的地址得到
  • 306——前一版本 HTTP 中使用的代码,现行版本中不再使用
  • 307——申明请求的资源临时性删除
  • 400——错误请求,如语法错误
  • 401——请求授权失败
  • 402——保留有效 ChargeTo 头响应
  • 403——请求不允许
  • 404——没有发现文件、查询或 URl
  • 405——用户在 Request-Line 字段定义的方法不允许
  • 406——根据用户发送的 Accept 拖,请求资源不可访问
  • 407——类似 401,用户必须首先在代理服务器上得到授权
  • 408——客户端没有在用户指定的饿时间内完成请求
  • 409——对当前资源状态,请求不能完成
  • 410——服务器上不再有此资源且无进一步的参考地址
  • 411——服务器拒绝用户定义的 Content-Length 属性请求
  • 412——一个或多个请求头字段在当前请求中错误
  • 413——请求的资源大于服务器允许的大小
  • 414——请求的资源 URL 长于服务器允许的长度
  • 415——请求资源不支持请求项目格式
  • 416——请求中包含 Range 请求头字段,在当前请求资源范围内没有 range 指示值,请求也不包含 If-Range 请求头字段
  • 417——服务器不满足请求 Expect 头字段指定的期望值,如果是代理服务器,可能是下一级服务器不能满足请求
  • 500——服务器产生内部错误
  • 501——服务器不支持请求的函数
  • 502——服务器暂时不可用,有时是为了防止发生系统过载
  • 503——服务器过载或暂停维修
  • 504——关口过载,服务器使用另一个关口或服务来响应用户,等待时间设定值较长
  • 505——服务器不支持或拒绝支请求头中指定的 HTTP 版本。

以上就是简单对一段网站日志进行的分析,当然实际上大多数时候我们根本不需要这样人工去查看网站日志,有大把的网站日志工具可以供我们使用分析网站日志。不过当你的网站出现了一些问题的时候,那么一般的日志分析软件就无法帮助你进行分析的,你必须需要自己去查看日志了。