日志是用来进行数据统计、问题排错的重要手段。在Nginx中,日志相关的配置非常灵活且功能丰富。本文将详细介绍Nginx中与日志相关的配置。
Nginx中与日志相关的配置包括:
每个级别的配置可以有其独立的访问日志,而日志格式则可以通过log_format命令来自定义。
在Nginx中,access_log指令用于定义如何记录客户端的请求。这些日志通常对分析网站流量、性能调优等非常有用。
access_log path [format [buffer=size [flush=time]]]; access_log path format gzip[=level] [buffer=size] [flush=time]; access_log syslog:server=address[,parameter=value] [format]; access_log off; # 不记录日志
path:
format:
buffer=size:
flush=time:
gzip[=level]:
syslog:server=address[,parameter=value]:
off:
如果没有为access_log指定格式,则默认使用combined格式。这是一个常用的格式,与Apache的combined格式相似。
access_log logs/access.log combined;
使用access_log可以帮助您详细跟踪Nginx服务器的访问模式,这对于诊断问题、分析流量和监视安全性都非常有用。以下是一些在各个层级中使用access_log的示例配置:
这会影响所有的服务器(server)和位置(location)块,除非它们有自己的access_log定义。
http { access_log /var/log/nginx/global_access.log combined; ... }
只会影响这个特定的server块。
server { listen 80; server_name example.com; access_log /var/log/nginx/example.com_access.log combined; ... }
这会影响这个特定的location块。
server { ... location /api/ { access_log /var/log/nginx/api_access.log combined; ... } location /static/ { access_log off; # 不记录静态内容的访问日志 ... } }
在http级别定义一个自定义的日志格式,然后在server或location级别使用它。
http { log_format main_extended '$remote_addr - $remote_user [$time_local] "$request" ' '$status $body_bytes_sent "$http_referer" ' '"$http_user_agent" "$http_x_forwarded_for"'; server { ... location / { access_log /var/log/nginx/special_access.log main_extended; ... } } }
这是一个在server级别将访问日志发送到syslog服务器的示例。
server { ... access_log syslog:server=192.168.1.100,facility=local7,tag=nginx combined; }
这是一个只记录返回404状态码的请求的示例。
map $status $loggable { ~^[23] 0; default 1; } server { ... access_log /var/log/nginx/404s.log combined if=$loggable; }
在Nginx中,log_format指令允许您自定义日志的输出格式,这对于满足特定日志解析工具的要求或提供更多的日志详情非常有用。
log_format name string ……;
Nginx提供了一个名为combined的默认日志格式,它非常接近Apache的同名格式:
log_format combined '$remote_addr - $remote_user [$time_local] ' '"$request" $status $body_bytes_sent ' '"$http_referer" "$http_user_agent"';
还有许多其他的变量可以用于log_format,例如$http_host(请求的主机名)、$request_time(请求处理时间)等。选择哪些变量取决于您希望从日志中获取哪些信息。
log_format 指令使您可以自定义 Nginx 的日志输出格式。这在多种场景中非常有用,例如当您需要与特定的日志分析工具集成,或者需要更多详细的日志信息时。
以下是一些在不同场景中使用 log_format 的示例配置:
这是 Nginx 提供的默认日志格式,与 Apache 的 combined 格式非常相似。
log_format combined '$remote_addr - $remote_user [$time_local] ' '"$request" $status $body_bytes_sent ' '"$http_referer" "$http_user_agent"';
此格式提供了与 combined 格式相似的信息,并增加了几个额外的字段,如请求时间和连接请求次数。
log_format main_extended '$remote_addr - $remote_user [$time_local] ' '"$request" $status $body_bytes_sent ' '"$http_referer" "$http_user_agent" ' 'request_time=$request_time connection_requests=$connection_requests';
此格式可以与现代日志分析工具(如 ELK Stack 或 Graylog)结合使用,这些工具通常更容易解析 JSON 格式的日志。
log_format json_combined '{' '"remote_addr":"$remote_addr",' '"remote_user":"$remote_user",' '"time_local":"$time_local",' '"request":"$request",' '"status":$status,' '"body_bytes_sent":$body_bytes_sent,' '"http_referer":"$http_referer",' '"http_user_agent":"$http_user_agent"' '}';
当您使用 Nginx 作为反向代理和缓存服务器时,此格式可以帮助您跟踪缓存的行为。
log_format cache_status '$remote_addr - $remote_user [$time_local] ' '"$request" $status $body_bytes_sent ' '"$http_referer" "$http_user_agent" ' 'cache_status=$upstream_cache_status';
如何在配置中使用 log_format:
定义完 log_format 后,您可以在 http、server 或 location 配置块中使用 access_log 指令来引用它。
例如,使用上面定义的 json_combined 格式:
server { ... access_log /var/log/nginx/access_json.log json_combined; }
Nginx中的rewrite_log指令是用于控制是否记录URL重写日志的。当您使用rewrite指令来改变请求的URI或进行其他URL重写操作时,这个日志可以帮助您跟踪和调试这些操作。
rewrite_log on | off;
默认情况下,rewrite_log是关闭的,即:
rewrite_log off;
这意味着在默认设置下,Nginx不会记录任何与URL重写相关的日志信息。
rewrite_log指令是由ngx_http_rewrite_module模块提供的,该模块为Nginx提供了强大的URL重写功能。
当您在配置文件中使用rewrite指令进行URL重写或重定向时,启用rewrite_log可以帮助您了解重写规则是如何被应用的,尤其是在处理复杂的重写逻辑时。
例如,如果您有一个重写规则将所有/old-path/下的请求重定向到/new-path/,并且某些请求没有按预期进行重定向,那么启用rewrite_log就非常有用。
此配置将对所有的 server 和 location 块生效,除非它们有自己的 rewrite_log 配置。
http { rewrite_log on; ... }
这将仅影响此特定 server 块。
server { listen 80; server_name example.com; rewrite_log on; ... }
这将仅影响此特定 location 块。
server { ... location /api/ { rewrite_log on; ... } }
在Nginx中,error_log指令是用于定义错误日志的存储位置和记录级别的。错误日志是系统管理员和开发人员诊断问题、监视系统行为的关键工具。
error_log file | stderr | syslog:server=address[,parameter=value] [debug | info | notice | warn | error | crit | alert | emerg];
file:
stderr:
syslog:server=address[,parameter=value]:
debug | info | notice | warn | error | crit | alert | emerg:
如果没有明确指定,Nginx会使用以下默认配置:
error_log logs/error.log error;
这意味着错误日志将被写入logs/error.log文件,并记录级别为error的消息及其以上的级别。
此配置将对所有的 server 块生效,除非它们有自己的 error_log 配置。
http { error_log /var/log/nginx/main_error.log warn; ... }
此配置仅影响此特定 server 块。
server { listen 80; server_name example.com; error_log /var/log/nginx/example.com_error.log warn; ... }
如果某个 location 处理敏感的操作或频繁出错,您可能希望为它启用更详细的日志记录。
server { ... location /api/ { error_log /var/log/nginx/api_error.log info; ... } }
此配置将错误日志发送到指定的 syslog 服务器。
error_log syslog:server=192.168.1.100,facility=local7,tag=nginx warn;
有时,您可能不希望为某个特定的 location 记录错误日志。
location /static/ { error_log /dev/null crit; ... }
注意:这里我们使用 /dev/null 作为路径,这意味着所有的日志都被丢弃,并设置日志级别为 crit,这意味着只有严重的错误才会被记录(但由于路径是 /dev/null,所以实际上不会有任何记录)。
选择合适的日志级别是很重要的。在开发环境中,使用 debug 级别可能很有帮助,但在生产环境中,这可能会导致大量的日志输出和性能开销。
定期检查和清理您的错误日志,以确保它们不会消耗所有的磁盘空间。
如果您使用的是外部日志系统(如 ELK Stack 或 Graylog),确保您的 Nginx 配置与之兼容。
由于 Nginx 自身没有内置日志切割功能,所以长时间运行的 Nginx 实例的日志文件可能会变得非常大。为了管理这些日志,我们可以创建一个脚本来定期切割它们。
📂 重命名当前日志文件:我们可以将 access.log 重命名为日期格式,如 access_20211012.log。即使文件已重命名,Nginx 仍会继续向该文件写日志,直到它被告知要使用一个新的日志文件。
📡 发送信号给 Nginx:通过向 Nginx 主进程发送 USR1 信号,Nginx 会重新打开日志文件。此时,Nginx 会停止向旧的(已重命名的)日志文件写入,并开始向新的 access.log 文件写入。
以下是一个简单的 bash 脚本来实现上述逻辑:
#!/bin/bash # 📁 日志文件的路径 logs_path='/usr/local/nginx/logs/' # 🔑 Nginx 的 PID 文件路径 pid_path='/usr/local/nginx/nginx.pid' # 🔄 重命名当前的日志文件 mv ${logs_path}access.log ${logs_path}access_$(date -d 'yesterday' +'%Y%m%d').log # 🚀 通过发送 USR1 信号来告诉 Nginx 重新打开日志文件 kill -USR1 `cat ${pid_path}`
为了自动执行上述脚本,我们可以使用 cron 来定期运行它。例如,下面的 crontab 任务会每天凌晨 12 点执行上述脚本:
0 0 * * * bash /path_to_script/nginx_log.sh
💡 确保您已为脚本设置了可执行权限,并将 /path_to_script/ 替换为您保存脚本的实际路径。