百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 优雅编程 > 正文

linux后台开发中避免僵尸进程的方法总结

sinye56 2025-02-06 16:19 7 浏览 0 评论

一、什么是僵死进程?

一般情况下,程序调用exit(包括_exit和_Exit,它们的区别这里不做解释),它的绝大多数内存和相关的资源已经被内核释放掉,但是在进程表中这个进程项(entry)还保留着(进程ID,退出状态,占用的资源等等),你可能会问,为什么这么麻烦,直接释放完资源不就行了吗?这是因为有时它的父进程想了解它的退出状态。在子进程退出但还未被其父进程“收尸”之前,该子进程就是僵死进程,或者僵尸进程。如果父进程先于子进程去世,那么子进程将被init进程收养,这个时候init就是这个子进程的父进程。

所以一旦出现父进程长期运行,而又没有显示调用wait或者waitpid,同时也没有处理SIGCHLD信号,这个时候init进程就没有办法来替子进程收尸,这个时候,子进程就真的成了“僵尸”了。

二、僵死进程与孤儿进程的区别?

回答这个问题很简单,就是爸爸(父进程)和儿子(子进程)谁先死的问题!

如果当儿子还在世的时候,爸爸去世了,那么儿子就成孤儿了,这个时候儿子就会被init收养,换句话说,init进程充当了儿子的爸爸,所以等到儿子去世的时候,就由init进程来为其收尸。

如果当爸爸还活着的时候,儿子死了,这个时候如果爸爸不给儿子收尸,那么儿子就会变成僵尸进程。

三、僵死进程的危害?

  1. 僵死进程的PID还占据着,意味着海量的子进程会占据满进程表项,会使后来的进程无法fork.
  2. 僵死进程的内核栈无法被释放掉(1K 或者 2K大小),为啥会留着它的内核栈,因为在栈的最低端,有着thread_info结构,它包含着 struct_task 结构,这里面包含着一些退出信息。

四、避免僵死进程的方法

网上搜了下,总结有三种方方法:

① 程序中显示的调用signal(SIGCHLD, SIG_IGN)来忽略SIGCHLD信号,这样子进程结束后,由内核来wai和释放资源

② fork两次,第一次fork的子进程在fork完成后直接退出,这样第二次fork得到的子进程就没有爸爸了,它会自动被老祖宗init收养,init会负责释放它的资源,这样就不会有“僵尸”产生了

③ 对子进程进行wait,释放它们的资源,但是父进程一般没工夫在那里守着,等着子进程的退出,所以,一般使用信号的方式来处理,在收到SIGCHLD信号的时候,在信号处理函数中调用wait操作来释放他们的资源。

五、对每个避免僵死进程方法的解析与总结

首先我们让我们来看一个生成僵尸进程的程序zombie.c如下:

#include???
#include???
#include???
??
int?main(int?argc,?const?char?*argv[])??
{??
????int?i;??
????pid_t?pid;??
??
????for?(i?=?0;?i?

运行程序,在10s睡眠期间使用ps查看进程,你会发现有10个标记为“defunct”的僵尸进程:

需要C/C++ Linux服务器架构师学习资料私信“资料”(资料包括C/C++,Linux,golang技术,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker,TCP/IP,协程,DPDK,ffmpeg等),免费分享

接下来看第一种方法,程序avoid_zombie1.c如下:

#include???
#include???
#include???
#include???
#include???
??
int?main(int?argc,?const?char?*argv[])??
{??
????pid_t?pid;??
??
????if?(SIG_ERR?==?signal(SIGCHLD,?SIG_IGN))?{??
????????perror("signal?error");??
????????_exit(EXIT_FAILURE);??
????}??
??
????while?(1)?{??
????????if?((pid?=?fork())?==?0)????/*?child?*/??
????????????_exit(0);??
????}??
??
????exit(EXIT_SUCCESS);??
}??

程序运行期间通过ps命令的确没有发现僵尸进程的存在。

在man文档中有这段话:

Note that even though the default disposition of SIGCHLD is "ignore", explicitly setting the disposition to SIG_IGN results in different treatment of zombie process children.

意思是说尽管系统对信号SIGCHLD的默认处理就是“ignore”,但是显示的设置成SIG_IGN的处理方式在在这里会表现不同的处理方式(即子进程结束后,资源由系统自动收回,所以不会产生僵尸进程),这是信号SIGCHLD与其他信号的不同之处。

在man文档中同样有这样一段话:

The original POSIX standard left the behavior of setting SIGCHLD to SIG_IGN unspecified. 看来这个方法不是每个平台都使用,尤其在一些老的系统中,兼容性不是很好,所以如果你在写一个可移植的程序的话,不推荐使用这个方法。

第二种方法,即通过两次fork来避免僵尸进程,我们来看一个例子avoid_zombie2.c:

#include???
#include???
#include???
#include???
#include???
??
int?main(int?argc,?const?char?*argv[])??
{??
????pid_t?pid;??
??
????while?(1)?{??
????????if?((pid?=?fork())?==?0)?{??/*?child?*/??
????????????if?((pid?=?fork())?>?0)??
????????????????_exit(0);??
????????????sleep(1);??
????????????printf("grandchild,?parent?id?=?%ld\n",??
????????????????????????????(long)getppid());??
????????????_exit(0);??
????????}??
????????if?(waitpid(-1,?NULL,?0)?!=?pid)?{??
????????????perror("waitpid?error");??
????????????_exit(EXIT_FAILURE);??
????????}??
????}??
??
????exit(EXIT_SUCCESS);??
}??

这的确是个有效的办法,但是我想这个方法不适宜网络并发服务器中,应为fork的效率是不高的。

最后来看第三种方法, 也是最通用的方法

先看我们的测试程序avoid_zombie3.c

#include???
#include???
#include???
#include???
#include???
#include???
#include???
#include???
#include???
??
??
void?avoid_zombies_handler(int?signo)??
{??
????pid_t?pid;??
????int?exit_status;??
????int?saved_errno?=?errno;??
??
????while?((pid?=?waitpid(-1,?&exit_status,?WNOHANG))?>?0)?{??
????????/*?do?nothing?*/??
????}??
??
????errno?=?saved_errno;??
}??
??
int?main(int?argc,?char?*argv[])??
{??
????pid_t?pid;??
????int?status;??
????struct?sigaction?child_act;???
??
????memset(&child_act,?0,?sizeof(struct?sigaction));??
????child_act.sa_handler?=?avoid_zombies_handler;??
????child_act.sa_flags?=?SA_RESTART?|?SA_NOCLDSTOP;???
????sigemptyset(&child_act.sa_mask);??
????if?(sigaction(SIGCHLD,?&child_act,?NULL)?==?-1)?{??
????????perror("sigaction?error");??
????????_exit(EXIT_FAILURE);??
????}??
??
????while?(1)?{??
????????if?((pid?=?fork())?==?0)?{??/*?child?process?*/??
????????????_exit(0);??
????????}?else?if?(pid?>?0)?{????????/*?parent?process?*/??
????????}??
????}??
??????
????_exit(EXIT_SUCCESS);??
}??

首先需要知道三点:

1. 当某个信号的信号处理函数被调用时,该信号会被操作系统阻塞(默认sa_flags不设置SA_NODEFER标志)。

2.当某个信号的信号处理函数被调用时,该信号阻塞时,该信号又多次发生,那么操作系统并不将它们排队,而是只保留第一次的,后续的被抛弃。

还有一点我们必须清楚的是

3. wait系列函数与信号SIGCHLD是没有任何关系的,即wait系列函数并不是信号SIGCHLD驱动的。

这个时候,肯定有人有疑问了,既然会丢弃信号,那怎么保证可以收回所有的僵尸进程呢?

关于这个问题,我们可以这样来理解,当子进程结束时,不管有没有产生SIGCHLD信号,或者子进程产生了SIGCHLD信号,而不管父进程有没有收到SIGCHLD信号,这都与子进程已经终止这个事实无关,就是说,子进程终止与信号其实没有任何关系,只是操作系统在子进程终止时会发送信号SIGCHLD给父进程,告之其子进程终止的消息,这样的话,父进程就可以做相应的操作了。而wait系列函数的目的就是收回子进程终止时残留在进程列表中的信息,所以任何时候调用while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0)都可以收回所有的僵尸进程信息(可以参考下面的程序)。但是这里为什么放在信号处理函数中处理了,这样做的原因是:子进程什么时候结束是个异步事件,而信号机制就是用来处理异步事件的,所以当子进程结束时,可以迅速的收回其残余信息,这样系统中就不会积累大量的僵尸进程了。

也可以这样来理解:系统把所有的僵尸进程串在一起形成一个僵尸进程链表,而while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0)就是来清空这个链表的,直到waitpid()返回0,表明已经没有僵尸进程了,或者返回-1,表明出错(当错误码errno为ECHILD的时候同样表明已经不存在僵尸进程了)。

了解了以上知识点,就能理解为什么while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0)能够回收所有的僵尸进程了。

我们可以在上面的信号处理函数中加入相应的打印信息:

static?int?num1?=?0??
static?int?num2?=?0;??
void?avoid_zombies_handler(int?signo)??
{??
????pid_t?pid;??
????int?exit_status;??
????int?saved_errno?=?errno;??
??
????printf("num1?=?%d\n",?++num1);??
????while?((pid?=?waitpid(-1,?&exit_status,?WNOHANG))?>?0)?{??
????????printf("num2?=?%d\n",?++num2);??
????}??
??
????errno?=?saved_errno;??
}??

打印的结果你会发现,当num1递增1的时候,即每调用一次信号处理函数,num2一般会递增很多,即while循环了很多次,所以尽管有的SIGCHLD信号被丢弃了,但是我们不用担心子进程的残余信息会收不回来。退出while循环时,证明此时系统中已经没有僵尸进程了,所以退出信号处理函数后,阻塞的唯一SIGCHLD信号会再次触发该信号处理函数,这样我们就不用担心了。我们不防做个最坏的打算,即之前的信号全部被丢弃了,只有最后一次的SIGCHLD信号被捕获,从而触发了信号处理函数,这样我们也不用担心,因为while循环会一次性收回全部的僵尸进程信息,只是这次循环的次数要多得多罢了,当然这只是假设,一般系统不会出现这样的情况(可以参考本文最后一个程序事例)。

为了证明wait系统函数与信号SIGCHLD没有任何关系,我们可以做个简单的实验,代码如下:

#include???
#include???
#include???
#include???
#include???
??
int?main(int?argc,?char?*argv[])??
{??
????int?i;??
????pid_t?pid;??
??
????for?(i?=?0;?i??0)?{??
????????/*?do?nothing?*/??
????}??
????sleep(10);??
??
????_exit(EXIT_SUCCESS);??
}??

以下是打印结果:

可以看到第一次sleep时系统中积累了5个僵尸进程,第二次sleep时,那5个僵尸进程都被收回了。这个也明显的看到了使用信号处理函数的优势,即可以保证系统不会积累大量的僵尸进程,它可以迅速的清理掉系统中的僵尸进程。

相关推荐

程序员:JDK的安装与配置(完整版)_jdk的安装方法

对于Java程序员来说,jdk是必不陌生的一个词。但怎么安装配置jdk,对新手来说确实头疼的一件事情。我这里以jdk10为例,详细的说明讲解了jdk的安装和配置,如果有不明白的小伙伴可以评论区留言哦下...

Linux中安装jdk并配置环境变量_linux jdk安装教程及环境变量配置

一、通过连接工具登录到Linux(我这里使用的Centos7.6版本)服务器连接工具有很多我就不一一介绍了今天使用比较常用的XShell工具登录成功如下:二、上传jdk安装包到Linux服务器jdk...

麒麟系统安装JAVA JDK教程_麒麟系统配置jdk

检查检查系统是否自带java在麒麟系统桌面空白处,右键“在终端打开”,打开shell对话框输入:java–version查看是否自带java及版本如图所示,系统自带OpenJDK,要先卸载自带JDK...

学习笔记-Linux JDK - 安装&配置

前提条件#检查是否存在JDKrpm-qa|grepjava#删除现存JDKyum-yremovejava*安装OracleJDK不分系统#进入安装文件目...

Linux新手入门系列:Linux下jdk安装配置

本系列文章是把作者刚接触和学习Linux时候的实操记录分享出来,内容主要包括Linux入门的一些理论概念知识、Web程序、mysql数据库的简单安装部署,希望能够帮到一些初学者,少走一些弯路。注意:L...

测试员必备:Linux下安装JDK 1.8你必须知道的那些事

1.简介在Oracle收购Sun后,Java的一系列产品就被整合到Oracle官网中,打开官网乍眼一看也不知道去哪里下载,还得一个一个的摸索尝试,而且网上大多数都是一些Oracle收购Sun前,或者就...

Linux 下安装JDK17_linux 安装jdk1.8 yum

一、安装环境操作系统:JDK版本:17二、安装步骤第一步:下载安装包下载Linux环境下的jdk1.8,请去官网(https://www.oracle.com/java/technologies/do...

在Ubuntu系统中安装JDK 17并配置环境变量教程

在Ubuntu系统上安装JDK17并配置环境变量是Java开发环境搭建的重要步骤。JDK17是Oracle提供的长期支持版本,广泛用于开发Java应用程序。以下是详细的步骤,帮助你在Ubuntu系...

如何在 Linux 上安装 Java_linux安装java的步骤

在桌面上拥抱Java应用程序,然后在所有桌面上运行它们。--SethKenlon(作者)无论你运行的是哪种操作系统,通常都有几种安装应用程序的方法。有时你可能会在应用程序商店中找到一个应用程序...

Windows和Linux环境下的JDK安装教程

JavaDevelopmentKit(简称JDK),是Java开发的核心工具包,提供了Java应用程序的编译、运行和开发所需的各类工具和类库。它包括了JRE(JavaRuntimeEnviro...

linux安装jdk_linux安装jdk软连接

JDK是啥就不用多介绍了哈,外行的人也不会进来看我的博文。依然记得读大学那会,第一次实验课就是在机房安装jdk,编写HelloWorld程序。时光飞逝啊,一下过了十多年了,挣了不少钱,买了跑车,娶了富...

linux安装jdk,全局配置,不同用户不同jdk

jdk1.8安装包链接:https://pan.baidu.com/s/14qBrh6ZpLK04QS8ogCepwg提取码:09zs上传文件解压tar-zxvfjdk-8u152-linux-...

运维大神教你在linux下安装jdk8_linux安装jdk1.7

1.到官网下载适合自己机器的版本。楼主下载的是jdk-8u66-linux-i586.tar.gzhttp://www.oracle.com/technetwork/java/javase/downl...

window和linux安装JDK1.8_linux 安装jdk1.8.tar

Windows安装JDK1.8的步骤:步骤1:下载JDK打开浏览器,找到JDK下载页面https://d.injdk.cn/download/oraclejdk/8在页面中找到并点击“下载...

最全的linux下安装JavaJDK的教程(图文详解)不会安装你来打我?

默认已经有了linux服务器,且有root账号首先检查一下是否已经安装过java的jdk任意位置输入命令:whichjava像我这个已经安装过了,就会提示在哪个位置,你的肯定是找不到。一般我们在...

取消回复欢迎 发表评论: