网络安全检测|网络安全服务|网络安全扫描-香港墨客投资移动版

主页 > 业界资讯 > 网络安全预防措施

出了Linux故障找不到方法?看大牛简单、朴实的解决思路(2)

3、通过shell脚本

#/bin/bash  RM_DIR=’/var/spool/clientmqueue’  cd $RM_DIR  for I in `ls`  do  rm –f $i  done 

4、重新编译内核

需要手动增加内核中分配给命令行参数的页数,打开kernel source 下面的include/linux/binfmts.h文件,找到如下行:

#denfine MAX_ARG_PAGES 32 

将32改为更大的值,例如64或者128,然后重新编译内核

问题3:inode耗尽导致应用故障

客户的一台Oracle数据库如武器在关机重启后,Oracle监听无法启动,提示报错 Linux error : No space left on device

从输出信息看出来是因为磁盘耗尽导致监听无法启动,因为Oracle在启动监听时需要创建监听日志文件,于是首先查看磁盘空间使用情况

# df –h 

从磁盘输出信息可知,所有的分区磁盘空间都还有剩余不少,而Oracle监听写日志的路径在/var分区下,/var下分区空间足够。

解决思路:

既然错误提示语磁盘空间有关,那就深入研究关于磁盘空间的问题,在linux系统中对磁盘空间的占用分为三个部分:第一个是物理磁盘空间,第二个是inode节点所占用的磁盘空间,第三个是linux用来存放信号量的空间,而平时接触较多的是物理磁盘空间。既然不是物理磁盘空间的问题,接着就检查是否是inode节点耗尽的问题,通过执行命令“df -i”查看可用的inode节点。由输出结果看出确实是因为inode耗尽导致无法写入文件。

可以通过下面的命令查看某个磁盘分区inode的总数

# dumpe2fs –h /dev/sda3 |grep ‘Inode count’ 

每个inode都有一个号码,操作系统用inode号码来区分不同的文件,通过‘ls -i’命令可以查看文件名对应的inode号

如果要查看这个文件更详细的inode信息,可以通过stat命令来实现

# stat install.log 

解决问题

# find /var/spool/clientmqueue/ -name “*” –exec rm –rf {} ; 

问题4:文件已经删除,但是空间没有释放的原因

运维监控系统发来通知,报告一台服务器空间满了,登陆服务器查看,根分区确实满了,这里先说一下服务器的一些删除策略,由于linux没有回收站功能,所以线上服务器上所有要删除的文件都会先移到系统/tmp目录下,然后定期清除/tmp目录下的数据。这个策略本身没有什么问题,但是通过检查发现这台服务器的系统分区中并没有单独划分/tmp分区,这样/tmp下的数据其实占用根分区的空间,既然找到了问题,那么删除/tmp目录下一些占用空间较大的数据文件即可。

# du –sh /tmp/* | sort –nr |head -3 

通过命令发现在/tmp目录下有个66G大小的文件access_log,这个文件应该是apache产生的访问日志文件,从日志大小来看,应该是很久没有清理的apache日志文件了,基本判定是这个文件导致的根空间爆满,在确认此文件可以删除后,执行如下删除命令,

# rm /tmp/access_Iog  # df –h 

从输出来看,根分区空间仍然没有释放,这是怎么回事

一般来说不会出现删除文件后空间不释放的情况,但是也存在例外,比如文件进程锁定,或者有进程一直在向这个文件写数据,要理解这个问题,就需要知道linux下文件的存储机制和存储结构。

一个文件在文件系统中存放分为两个部分:数据部分和指针部分,指针位于文件系统的meta-data中,在将数据删除后,这个指针就从meta-data中清除了,而数据部分存储在磁盘中。在将数据对应的指针从meta-data中清除后,文件数据部分占用的空间就可以被覆盖并写入新的内容,之所以出现删除access_log文件后,空间还没有释放,就是因为httpd进程还在一直向这个文件写入内容,导致虽然删除了access_Ilog文件,但是由于进程锁定,文件对应的指针部分并未从meta-data中清除,而由于指针并未删除,系统内核就认为文件并未被删除,因此通过df命令查询空间并未释放。

问题排查:

既然有了解决思路,那么接下来看看是否有进程一直在向access_log文件中写入数据,这里需要用到linux下的losf命令,通过这个命令可以获取一个仍然被应用程序占用的已删除文件列表

# lsof |grep delete 

从输出可以看出,/tmp/access_log文件被进程httpd锁定,而httpd进程还一直向这个文件写入日志数据,最后一列的‘deleted’状态说明这个日志文件已经被删除,但是由于进程还在一直向此文件写入数据,因此空间并未释放。

解决问题:

(责任编辑:admin)