使用AWK总结日志
1. HTTPD日志文件格式
在处理任何文件时,首先要熟悉文件的结构。我们将处理Apache HTTPD Web服务器的访问日志文件。日志文件的位置可通过httpd.conf文件控制。在基于Debian的系统中,默认日志文件位置是/var/log/apache2/access.log,其他系统可能使用httpd目录代替apache2。
可以使用tail命令查看日志文件末尾:
$ tail /var/log/apache2/access.log该日志文件以空格分隔,各字段含义如下表所示:
| 字段 | 用途 |
| — | — |
| 1 | 客户端IP地址 |
| 2 | 根据RFC 1413和ident客户端定义的客户端身份。除非启用IdentityCheck,否则不读取该字段,未读取时值为连字符 |
| 3 | 若启用用户认证,则为用户ID;若未启用,值为连字符 |
| 4 | 请求的日期和时间,格式为day-month-year hour:minute:second timezone|
| 5 | 实际请求和方法 |
| 6 | 返回状态码,如200或404 |
| 7 | 文件大小(字节) |