在QPS为0的时间点10:10:39,Arrival Rate的值在472-102之间(性能监视器上点不出这个时间点的数值),说明有请求到达了HTTP.SYS。
那这能不能说明HTTP.SYS当时是正常呢?
HTTP.SYS不能逃脱嫌疑,因为Arrival Rate表示的是"Rate at which requests are arriving in the queue",只是代表请求到了HTTP.SYS的队列。如果HTTP.SYS的线程卡住了,请求还是能照常到达HTTP.SYS的队列。
通过Arrival Rate的数据分析,造成QPS为0的嫌疑对象只剩下3个:HTTP.SYS,WWW service,WAS。
分析到这里,自然就想起了去年遭遇的“黑色10秒”,当时的表现也是QPS为0,最后发现是卡在了WAS(Windows Process Activation Service),详见云计算之路-阿里云上:超级奇怪的“黑色10秒钟”。
这次会不会也是卡在WAS呢?
上次将最大的嫌疑对象锁定在WAS是因为在故障期间,IIS日志中有静态文件的响应记录(从HTTP.SYS缓存返回的),证明了HTTP.SYS当时是正常的。
所以,接下自然要去看IIS日志。 3. QPS为0的前1秒IIS日志中竟然无任何记录
在QPS为0发生的时间点10:10:39的前1秒——10:10:38,IIS日志中竟然无任何记录(这也是无意中发现的,开始是通过10:10:39这个时间点去查询,是有记录的)。而这个时间点(10:10:38)的前1秒、后1秒都有记录。