PHP-CGI 进程 CPU 100% 与 file_get_contents 函数的关系
有时,运行Nginx和PHP-CGI(php-fpm)网络服务的Linux服务器突然出现系统负载增加。使用top命令查看,很多php-cgi进程的CPU占用率接近100%。后来通过跟踪发现,这种情况的出现与PHP的file_get_contents()函数密切相关。 (北京网站建设)
在大中型网站中,基于HTTP协议的API接口调用司空见惯。 PHP程序员喜欢用简单方便的file_get_contents('http://example.com/')函数来获取一个URL的返回内容,但是如果http://example.com/网站响应慢,file_get_contents()会一直卡在那里,不会暂停。
我们知道在php.ini中,有一个参数max_execution_time可以设置PHP脚本的最长执行时间,但是在php-cgi(php-fpm)中,这个参数是不会生效的。真正控制PHP脚本最大执行时间的是php-fpm.conf配置文件中的以下参数:
作为单个请求服务的超时(以秒为单位),之后工作进程将被终止
应在“max_execution_time”ini 选项因某种原因未停止脚本执行时使用
“0s”表示“关闭”
valuename='request_terminate_timeout'0s/值
默认值为0 秒,即PHP 脚本将永远执行。这样,当所有的php-cgi进程都卡在file_get_contents()函数中时,这个Nginx+PHP WebServer就不能再处理新的PHP请求,Nginx就会返回“502 Bad Gateway”给用户。需要修改该参数来设置PHP脚本的最大执行时间,但治标不治本。比如改成30s,如果file_get_contents()获取网页内容慢,说明150个php-cgi进程每秒只能处理5个请求,WebServer也很难避免“502 Bad网关”。
要实现完整的解决方案,PHP程序员只能改掉直接使用file_get_contents('http://example.com/')的习惯,而是稍微修改一下,加个timeout,按照下面的方式实现HTTP GET请求。如果觉得麻烦,可以自己将下面的代码封装成一个函数。
?
="tag-name">php当然,导致 php-cgi 进程 CPU 100% 的原因不只有这一种,那么,怎么确定是 file_get_contents() 函数导致的呢?
首先,使用 top 命令查看 CPU 使用率较高的 php-cgi 进程。
- top - 10:34:18 up 724 days, 21:01, 3 users, load average: 17.86, 11.16, 7.69
- Tasks: 561 total, 15 running, 546 sleeping, 0 stopped, 0 zombie
- Cpu(s): 5.9%us, 4.2%sy, 0.0%ni, 89.4%id, 0.2%wa, 0.0%hi, 0.2%si, 0.0%st
- Mem: 8100996k total, 4320108k used, 3780888k free, 772572k buffers
- Swap: 8193108k total, 50776k used, 8142332k free, 412088k cached
- PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
- 10747 www 18 0 360m 22m 12m R 100.6 0.3 0:02.60 php-cgi
- 10709 www 16 0 359m 28m 17m R 96.8 0.4 0:11.34 php-cgi
- 10745 www 18 0 360m 24m 14m R 94.8 0.3 0:39.51 php-cgi
- 10707 www 18 0 360m 25m 14m S 77.4 0.3 0:33.48 php-cgi
- 10782 www 20 0 360m 26m 15m R 75.5 0.3 0:10.93 php-cgi
- 10708 www 25 0 360m 22m 12m R 69.7 0.3 0:45.16 php-cgi
- 10683 www 25 0 362m 28m 15m R 54.2 0.4 0:32.65 php-cgi
- 10711 www 25 0 360m 25m 15m R 52.2 0.3 0:44.25 php-cgi
- 10688 www 25 0 359m 25m 15m R 38.7 0.3 0:10.44 php-cgi
- 10719 www 25 0 360m 26m 16m R 7.7 0.3 0:40.59 php-cgi
找其中一个 CPU 100% 的 php-cgi 进程的 PID,用以下命令跟踪一下:
- strace -p 10747
如果屏幕显示:
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
那么,就可以确定是 file_get_contents() 导致的问题了。
我们专注高端建站,小程序开发、软件系统定制开发、BUG修复、物联网开发、各类API接口对接开发等。十余年开发经验,每一个项目承诺做到满意为止,多一次对比,一定让您多一份收获!