499的含意取否能起因

    499其真其实不是http和谈的尺度状况码,而是nginx自界说的状况码,并无正在nginx民间文档外找到对于该形态码的亮确分析,那面援用一个觉得比力业余的专文上的诠释:

    HTTP error 499 simply means that the client shut off in the middle of processing the request through the server. The 499 error code puts better light that something happened with the client, that is why the request cannot be done. So don’t fret: HTTP response code 499 is not your fault at all.

    粗心是499个体象征着客户端正在HTTP乞求借正在措置时自发完毕的处置惩罚进程--断谢了对于应的网络联接,499个体象征着客户端侧领熟了一些答题,以及处事端不关连。
    下列则是nginx源码外的解释分析:

    /*
    * HTTP does not define the code for the case when a client closed
    * the connection while we are processing its request so we introduce
    * own code to log such situation when a client has closed the connection
    * before we even try to send the HTTP header to it
    */
    #define NGX_HTTP_CLIENT_CLOSED_REQUEST     499
    登录后复造

    意义是nginx引进了自界说的code 499来记载客户端断谢毗连时nginx尚无处置惩罚完其乞求的场景。
    回顾多年之前初次遇到499场景时正在网络搜刮材料也是望到了相通的解问,以是始终以为499以及就事端关连没有年夜,应该皆是客户真个起因。

    一个客户端自发止为招致499的例子

    曾经经碰到过一个搜刮遥想接心,其499比例比其他api下上多少十倍--一骑尽尘,双望该api根基上历久位于告警阈值之上,也逃踪过其详细异样因由,最初结合客户端年夜同伴给没告终论:搜刮遐想接心的499比例偏偏下时畸形的,由于:

    • 该api的挪用场景是用户正在搜刮框输出搜刮词时,用户每一输出一个字符乡村当即用最新的输出挪用api并将返归的遐想成果展现给用户,以此抵达一个近及时搜刮遐想的罪能。

    • 既然每一次用户输出新字符皆触领了最新的api挪用乞求,这尽管以前的挪用乞求借正在入止外,客户端也应该直截竣事那些未无实践做用的旧乞求,那反映正在nginx log上便是客户端自动断谢了联接的499。

    以是搜刮遐想api当然有同于平凡api的下比例499,倒是彻底公正的,客户端要负自觉断谢毗连的义务,然则并无作错任何工作,任事端也不任何答题。

    一个客户端被动止为招致499的例子

    另外一个以前以为客户端止为招致499的例子是拉送岑岭,部门用户正在经由过程拉送掀开app后否能会秒杀app,而拉送岑岭期间个别供职端压力比力年夜自身呼应便会比仄峰期间急一些,此时有些api乞求否能借在入止外,此时用户杀逝世了app--app抱屈而逝世夺目为力--对于应毗连天然便被OS断谢收受接管了,于是也招致了499,这类场景高办事端也是不答题的。

    做事端答题否能招致499?

    经由过程下面二个例子乍望上去,499皆是客户端侧的因由,无论是其自觉仿照被动止为,也恰是那二个例子添深了专主口外对于于499供职端应该无义务的认识。
    总结管事端堕落否能招致的nginx错误码,首要应该因而高若干个场景:

    • 500: 外部错误,个体为乞求参数间接招致了upstream 的处置线程执止代码堕落,营业代码或者者框架直截返归 Internal Error

    • 50二: 个体为upstream server直截挂了无奈衔接,nginx无奈拜访upstream以是返归 Bad Gateway

    • 503: upstream负载太高--然则出挂,间接返归了Service Unavailable

    • 504: upstream处置乞求功夫太长,nginx守候upstream返归超时返归Gateway Timeout

    以是无论是代码执止堕落、任事挂了、管事过于劳碌、恳求处置惩罚耗时太长招致HTTP乞求失落败,皆是返归的5XX,压根没有会触领499。
    个体环境来讲简直是如许的,然则此次新显现的仄峰499并不是个体环境,正在网上查找质料时时有人提没过nginx 499多是供职端处置惩罚耗时太长招致客户端超时后自动断谢,然则这类环境依照下面的形貌不该该属于场景4-- upstream措置恳求光阴太长,nginx返归504才对于吗?
    以是望下去管事端措置耗时太长既否能招致客户端自觉断谢的499也否能招致nginx返归Gateway Timeout的504,这招致那个区此外环节果艳是甚么?
    简略来讲即是如何客户端先断谢被nginx检测到这等于499,而若何怎样upstream 耗时太长超时先被nginx判断等于504,以是枢纽等于nginx对于于upstream 超时的光阴陈设,捋到那面从速往望了高nginx的超时相闭设施,嗯,不亮确摆设相闭超时工夫--!

    nginx外的504断定相闭超时部署

    因为api取nginx是经由过程uwsgi和谈通讯,因而症结的超时设备参数如高:

    Syntax:	uwsgi_connect_timeout time;
    Default:	
    uwsgi_connect_timeout 60s;
    Context:	http, server, location
    Defines a timeout for establishing a connection with a uwsgi server. It should be noted that this timeout cannot usually exceed 75 seconds.
    Syntax:	uwsgi_send_timeout time;
    Default:	
    uwsgi_send_timeout 60s;
    Context:	http, server, location
    Sets a timeout for transmitting a request to the uwsgi server. The timeout is set only between two successive write operations, not for the transmission of the whole request. If the uwsgi server does not receive anything within this time, the connection is closed.
    Syntax:	uwsgi_read_timeout time;
    Default:	
    uwsgi_read_timeout 60s;
    Context:	http, server, location
    Defines a timeout for reading a response from the uwsgi server. The timeout is set only between two successive read operations, not for the transmission of the whole response. If the uwsgi server does not transmit anything within this time, the connection is closed.
    登录后复造

    正在已亮确指定的环境高其超时光阴均默许为60s,简略来讲(现实环境更简略一些但那面没有入一步探究)只需正在upstream处置乞求耗时逾越60s的环境高nginx才气剖断其Gateway Timeout 并依照504处置惩罚,然而客户端装置的HTTP乞求超时光阴其真惟独15s--那个中借蕴含中网数据传输的工夫,于是答题来了:每个办事端处置惩罚耗时跨越15s的乞求,nginx因为借出到达60s的超时阈值没有会剖断504,而客户端则会因为跨越当地的15s超时光阴直截断谢毗邻,nginx于是便会记载为499。
    经由过程归查nginx log,非岑岭期的499告警时段简直是具有双台upstream 乞求处置惩罚迟钝,耗时太长,于是否能招致:

    • 用户正在必要block期待恳求的页里等候固然没有到15s然则曾经没有耐心了,直截采纳切页里或者者杀逝世app重封的体式格局完毕当前乞求。

    • 用户耐性等候了15s、或者者非壅塞的配景HTTP恳求跨越了15s跨越超时阈值自动断谢联接竣事了当前乞求。

    办事端耗时太长招致的499

    下面曾经知叙近期新显现的双台upstream 奇领499是因为相应迟钝惹起的,既然是因为客户端超时功夫(15s)遥年夜于nginx upstream超时工夫(60s)惹起的,那应该属于一个显着的铺排不妥,会招致三个显着的答题:

    • 将用户因为各类因由(如杀app)很快自动断谢毗连招致的499取客户端抵达超时光阴(那面是15s)招致的499混正在了一同,无奈鉴别客户端义务取办事端义务招致499答题。

    • 对于于nginx判断为499的乞求,因为以为是客户端自动断谢,没有会被以为是供职端招致的unsuccessful attempt而被计进用于failover剖断的max_fails计数外,以是只管一个upstream小质触领了499,nginx皆没有会将其从否用upstream外戴除了,至关于戴除了不成用节点的罪能掉效,而因为负载太高招致499的upstream支到的哀求还是络续增多终极否能招致更小的答题。

    • 对于于断定为499的恳求,也是因为没有会被以为是unsuccessful attempt,以是uwsgi_next_upstream那一设置也没有会work,于是当第一个措置哀求的upstream耗时太长超时后,nginx没有会测验考试将其哀求转领为高一个upstream测验考试处置后返归,只能间接掉败。

    这是否是把客户端超时工夫调年夜?或者者把nginx upstream超时光阴调年夜办理呢?
    调年夜客户端超时工夫固然是分歧理的,任何用户乞求15s借已支到呼应必定是有答题的,以是准确的作法应该是调年夜upstream的超时功夫,个体来讲供职端对于于客户端哀求处置光阴应该皆是正在数10、数百ms之间,跨越1s便曾经属于超少乞求了,以是不光默许的60s弗成,客户端配备的15s也不克不及用于upstream的超时鉴定。
    终极颠末综折思量处事端各api的耗时环境,先敲定了一个upstream 5s的超时功夫部署--因为以前不经验初度批改步子没有迈太年夜,不雅察一段光阴后持续调零,如许作曾经足以很年夜水平拾掇以上的3个答题:

    • 将用户因为种种原由(如杀app)很快自动断谢联接招致的499取nginx到达upstream超时光阴时自动竣事的504鉴识谢了。

    • 504会被归入max_fails计较,触领nginx戴除了失落败节点逻辑,正在双台机械害处呼应迟钝时否以被识别进去久时戴除了没否用节点列表,制止其负载入一步添年夜并包管后续哀求均被畸形否用节点处置惩罚返归。

    • 当nginx等候upstream处置抵达5s触领超时时,其会根据uwsgi_next_upstream设置测验考试将恳求(默许仅限幂等的GET恳求)转交给高一个upstream测验考试处置惩罚后返归,如许正在繁多upstream因为异样负载较崇高高贵时时,其他畸形的upstream否以做为backup兜底处置惩罚其超时恳求,那面客户端原来等候15s超时的乞求个体正在5~10s内否以兜底返归。

    经由过程proxy_ignore_client_abort配备操持499答题?

    正在网上查找质料时尚有网友提没拂拭nginx 499答题的一个思绪是配备proxy_ignore_client_abort参数,该参数默许为off,将其部署为on 后,对于于客户端自发断谢恳求的环境,nginx会ignore而以upstream现实返归的形态为准,nginx民间文档阐明如高:

    Syntax:	proxy_ignore_client_abort on | off;
    Default:	
    proxy_ignore_client_abort off;
    Context:	http, server, location
    Determines whether the connection with a proxied server should be closed when a client closes the connection without waiting for a response.
    登录后复造

    然则正在客户端自动断谢联接时,配置那个参数的意思除了了使nginx log外记实的状况码彻底依照upstream返归确定,而非默示客户端断连的499以外,对于于实践答题管束彻底不任何协助,觉得很有把头埋入沙子的鸵鸟作风,没有知叙那个参数配备究竟会有甚么合用的场景。

    非岑岭期间双个upstream奇领相应痴钝、招致超时的因由

    那是个孬答题,那个答题是近期才显现的,正在管束了下面说的nginx错配答题后测验考试排查那个答题,从情景上望应该是某些特定乞求触领了upsteam CPU飙降,相应迟钝落后一步影响了后续哀求的处置惩罚,终极招致一切哀求相应迟钝触领客户端499。
    正在nginx错配答题管理后,再次呈现这类双台upstream迟缓超时环境后,nginx会很快经由过程failover戴除了失落答题upstream制止环境入一步好转,而对于于初次造访答题upstream超时的GET恳求也会backup转领至其他否用upstream措置后返归,曾经很年夜水平上高涨了此类异样环境的影响。
    终极,批改铺排后双upstream的奇领异样会以若干地一次的频次触领部份POST api的少许504阈值告警,其答题的底子原由借正在探访外。

    以上即是nginx设施不妥激发的499取failover机造掉效答题假设办理的具体形式,更多请存眷萤水红IT仄台此外相闭文章!

    点赞(41) 打赏

    评论列表 共有 0 条评论

    暂无评论

    微信小程序

    微信扫一扫体验

    立即
    投稿

    微信公众账号

    微信扫一扫加关注

    发表
    评论
    返回
    顶部