Nginx 【location配置路径详解、反向代理、负载均衡】
作者:mmseoamin日期:2023-12-21

文章目录

  • 前言
  • 一、匹配语法及规则
    • 1.基本语法
    • 2.匹配修饰符
    • 3.匹配优先级
    • 二、常用的一些操作
      • 1.url反向代理
      • 2.负载均衡
      • 三、set、if 语句
      • 四、语句的放置位置
      • 五、常用的location 配置项
      • 六、nginx常用命令
      • 七、常用的内置变量

        前言

        在使用nginx时,我们配置最多的就是location项了。方向代理、负载均衡、静态资源服务器这些高频使用的共能点,几乎主要都在location配置。本文内容将包含上诉功能,并详细介绍location的匹配规则

        一、匹配语法及规则

        1.基本语法

        location [=|^~|~|~*] /uri {
        	...
        }
        

        location的匹配语法分成两个部分,[]括号中的时匹配符,决定以何种方式进行匹配,uri表示请求路径,例如http://www.baidu.com:8888/index/abc的uri就是/index/abc


        2.匹配修饰符

        注意下面表格中的优先级描述是针对同类型匹配规则的描述,不同类型匹配优先级,请看匹配优先级[^1]

        字符串匹配

        修饰符例子匹配路径描述优先级
        =location = /index匹配/index
        不匹配 /index/abc /index2
        uri必须完全一致才能匹配一旦被匹配,则不执行后续匹配
        ^~location ^~ /index匹配 /index /index234 /index/bb
        不匹配 /index2
        匹配开头为/index的uri优先完全匹配 ,否则匹配规则最长的
        规则1:location ^~ /index1
        规则2:location ^~ /index12
        uri=/index1 则匹配规则1
        uri=/index1234则匹配规则2
        • 字符串匹配不区分大小写 location = /index 同时匹配 /index | /INDEx
        • location = index | location ^~ index 不能匹配 /index ,因为字符串匹配是从uri开头开始匹配的
        • 如果没有使用匹配修饰符,则默认为普通匹配,如: location /index 等效于 location ^~ /index

          正则匹配

          修饰符例子匹配路径描述优先级
          ~location ~ index[0-9]匹配 /index23 /aa/index23 /aa/index23/bb根据正则表达式匹配uri,区分大小写匹配后停止匹配
          ~*location ~* index[0-9]匹配/index1 /Index2 /InDex23根据正则规则匹配uri,不区分大小写匹配后仍继续匹配,取最长规则命中

          如果想从uri最开头进行匹配则可以通过控制正则表达式来实现 location ~ ^/index$,只匹配/index

          内部定义 @

          在使用过程我们一般还会使用@符号,它的作用相当于一个跳转规则的变量

          location /index {
          	error_page 404 @index_error; // 如果没有匹配到服务 则使用@index_error的跳转规则
          }
          location @index_error{
          	...
          }
          

          3.匹配优先级

          =为精准匹配、^~为普通匹配 、 ~* ~*为正则匹配

          匹配类别优先级
          类型之间的优先级精准匹配>普通匹配>正则匹配>/默认根路径匹配。
          普通匹配同类型location之间的优先级最长前缀优先。普通匹配的优先级与location在配置文件中所处的先后顺序无关,而与匹配到的前缀长度有关。
          正则匹配同类型location之间的优先级顺序优先。只要匹配到第一个正则规则的location,就停止后面的正则规则的测试。正则匹配与location规则定义在配置文件中的先后顺序强相关。

          二、常用的一些操作

          1.url反向代理

          location /index {
          	// 这里只能替换ip和端口,即便设置成http://127.0.0.1:80/index2 也只替换ip和端口
          	proxy_pass http://127.0.0.1:80; 
          	
          	rewrite /index /index2 break;
          	// 使用正则表达式 $1为匹配到的值,在此为/index,本语句将/index => /index/index2
          	rewrite ^\/index $1/index2;
          }
          

          • 1.rewrite

            是一个比较常用的指令,它的语法是这样的

            rewrite regex|string replacement [flag];
            
            flag描述
            brack执行本条匹配后不在执行后面的匹配,一般用在server或if中
            last执行本条匹配后继续下次匹配
            redirect返回302临时重定向,地址栏会显示跳转后的地址;
            permanent返回301永久重定向,地址栏会显示跳转后的地址;

            • 2.控制请求头
              location /index {
              	add_header key value; # 添加自定义响应头
              	// 反向代理
              	proxy_set_header key value; # 反向代理,向目标服务器转发的请求添加请求头
              	proxy_hide_header key; # 反向代理,隐藏目标服务器响应头字段
              	
              }
              

              小提示:

              • 有时候明明设置了响应头,但是前端确没有得到,那是因为浏览器约束了前端能够获取到的响应头字段,可以通过色设置Access-Control-Expose-Headers:headerKey,headerKey2响应头进行放开
              • nginx进行代理时会将请求头字段及参数全量传递给下一级服务器

              请注意! add_header只会在最底层生效,如果你在server 和 server内部的location中都定义了add_header。那么只有最底层的location中的add_header会生效

              server {
              	add_header key val; # 如果底层存在add_header语句,则此语句不生效
              	location / {
              		add_header key2 val;
              	}
              }
              

              2.负载均衡

              一个基本的负载均衡配置

              http {
              	# 建立模拟服务器
              	server {
              		listen 3001;
              		server_name 127.0.0.1;
              		location / {
              			return 200 

              服务器3001

              ; } } server { listen 3002; server_name 127.0.0.1; location / { return 200

              服务器3002

              ; } } server { listen 3003; server_name 127.0.0.1; location / { return 200

              服务器3003

              ; } } # 定义服务器上游 名为myServerName upstream myServerName { server 127.0.0.1:3001 weight=1; # weight表权重,这里有 1 / (1+1+1)的几率访问到这个服务器 server 127.0.0.1:3002 weight=1; server 127.0.0.1:3003 weight=1; } # 访问服务器 server { listen 3000; server_name 127.0.0.1; location / { proxy_pass http://myServerName break; # 这里myServerName 为上游服务器名 } } }

              上面的配置只包含了最基础的负载均衡处理,一个成熟的负载均衡策略应该还要包含以下几点特性:

              • 热备:当主服务器出现问题时,应该自动将请求转发至备用服务器
              • 分配策略:不同的情况应该有不同的分配策略,详细情况下面会有表格描述
              • 服务器超时处理:当某一个或多个服务器处理请求长时间无响应时,
              • 服务器宕机处理

                以上这些特性都可以在upstream项中进行配置

                upstream myServerName {
                	server 127.0.0.1:3004 backup; # 热备
                	server 127.0.0.1:3005 down; #宕机 暂不参与负载均衡
                	server 127.0.0.1:3006 max_fails=5 fail_timeout=300; # 失败次数5次之后 停止负载均衡300秒; max_fails默认1 fail_timeout默认10
                }
                

                分配策略有多种,这里我们列一个表格预览

                策略描述
                轮询默认的分配策略,服务器轮流分配请求,适用于所有服务器性能一致的情况
                weight由权重分配服务器访问几率,适用与服务器性能出现参差不齐的场景,高性能的服务器高权重访问
                ip_hash由ip分配,同一个ip分配到同一个服务器,一般适合带有token性质的场景,当这个ip在一台服务器上登陆后,保证他后续需要验证的请求,能够访问到存有它登录信息的服务器
                least_conn根据最少连接分配,分配到最少连接的服务器地址。
                url_hash根据url进行分配,同一个url分配到同一个服务器,这个一般配合缓存处理资源请求,当资源第一次请求,被分配到一个服务器上之后,服务器会将资源结果缓存,如果下次进入它请求另外一台服务器,那么之前服务器的缓存就被有起到效果,而且新的服务器还要进行一次缓存,这样缓存的利用率就不好。现在资源一般由浏览器进行缓存,场景使用较少

                还有一种第三方的负载均衡策略,可以根据页面大小、加载时间长短智能地进行负载均衡。它的使用需要第三方模块的支持

                下载地址

                https://github.com/gnosek/nginx-upstream-fair
                

                解压\重命名

                unzip nginx-upstream-fair-master.zip
                mv nginx-upstream-fair-master fair
                

                编译

                ./configure --add-module=/root/fair # nginx加入模块
                make # 编译
                

                在编译的过程中可能出现

                error // nginx_http_upstream_srv_conf_t结构中缺少default_port
                // 解决方案
                # step1:在Nginx的源码中src/http/nginx_http_upstream.h,找到ngx_http_upstream_srv_conf_s,
                # step2:在模块中添加default_port属性:in_port_t default_port
                

                然后再进行make。

                更新nginx

                #step1:将sbin目录下的nginx进行备份
                mv /usr/local/nginx/sbin/nginx /usr/local/nginx/sbin/nginxold
                 
                #step2:将安装目录下的objs中的nginx拷贝到sbin目录
                cd objs
                cp nginx /usr/local/nginx/sbin
                 
                #step3:更新
                cd ../
                

                使用

                upstream myServerName {
                	fair;
                	server 127.0.0.1:3001;
                }
                

                三、set、if 语句

                if 可以作为判断语句,set可以定义内部变量。它们的放置位置为server、location、if。

                定义的变量也是有作用域的,定义在location中的变量不能被它的外层位置server中引用,定义在server中的位置可以被内层中location引用

                location /index {
                	
                	set $key value; # 变量名需要以$开头
                	set $key2 $key;# 使用其他变量作值
                	set $key3 $host;# 使用内置变量
                	
                	
                	
                	if ($key = 1) {
                		return 101;
                	}
                	
                	# 正则匹配 正则匹配值必须使用双引号包裹
                	if($key ~ "123"){
                		return 102;
                	}
                }
                

                四、语句的放置位置

                语句放置位置值得注意的
                proxy_passlocation、location>if-
                rewritelocation、location>if-
                add_headerserver、location、if最底层块生效
                proxy_set_headerserver、location、if最底层生效
                setserver、location、if-
                if任意位置-

                五、常用的location 配置项

                location / {
                	root html;
                	index index.html index.hml;
                	
                	try_files $uri /filePath...;
                }
                
                配置项描述
                root指定根目录
                index默认显示的文件,文件地址相对root配置
                try_files尝试以给定$uri响应请求,如果 $uri没有不存在,则使用下一个配置文件响应。如果所有给定的文件都没有则返回404。注意文件路径需要加/

                六、nginx常用命令

                window

                start nginx  或  nginx.exe # 启动nginx
                nginx.exe -s stop # 停止当前启动的nginx
                nginx.exe -s reload # 重启nginx
                tasklist /fi "imagename eq nginx.exe" # 查看当前nginx进程
                tasklist /fi "imagename eq nginx.exe" # 查看所有nginx进程
                taskkill /f /t /im nginx.exe # 停止所有nginx进程
                

                七、常用的内置变量

                变量说明
                $agrs请求中的参数,如www.123.com/1.php?a=1&b=2的$args就是a=1&b=2
                $uri $document_uri当前请求中不包含指令的URI,如www.123.com/1.php?a=1&b=2的$uri就是1.php,不包含后面的参数
                $http_referer记录此次请求是从哪个连接访问过来的,可以根据该参数进行防盗链设置
                $host主机头,也就是域名
                $http_cookie客户端cookie信息
                $http_x_forwarded_for当前端有代理服务器时,设置web节点记录客户端地址的配置,此参数生效的前提是代理服务器也要进行相关的x_forwarded_for设置
                $remote_addr客户端公网ip
                $remote_port客户端端口
                $remote_user如果nginx有配置认证,该变量代表客户端认证的用户名
                $request请求的URI和HTTP协议,如“GET /article-10000.html HTTP/1.1”
                $request_body_file做反向代理时发给后端服务器的本地资源的名称
                $request_method请求资源的方式,GET/PUT/DELETE等
                $request_filename当前请求的资源文件的路径名称,相当于是 d o c u m e n t r o o t / document_root/ documentr​oot/document_uri的组合
                $request_uri请求的链接,包括 d o c u m e n t u r i 和 document_uri和 documentu​ri和args
                $scheme请求的协议,如ftp,http,https
                $server_protocol客户端请求资源使用的协议的版本,如HTTP/1.0,HTTP/1.1,HTTP/2.0等
                $server_addr服务器IP地址
                $server_name服务器的主机名
                $server_port服务器的端口号
                $statushttp状态码,记录请求返回的状态码,例如:200、301、404等
                $uri和$document_uri相同
                $http_referer客户端请求时的referer,通俗讲就是该请求是通过哪个链接跳过来的,用curl -e可以指定
                $time_local记录访问时间与时区,如18/Jul/2014:17:00:01 +0800