centos 7.6 总是重启

记得有一次在公司,半夜被电话吵醒,服务器突然重启蓝屏。
屏幕闪了一下,然后又黑了。
感觉相当惊慌。
第二天查看日志,发现内存模块有问题。
其中一个存储单元不稳定,导致系统出错并重启。
这次事件之后,我非常仔细地检查了服务器的硬件,特别是内存和电源。

电源线是否已牢固插入?风扇转动是否顺畅?这些都是小事,但有时也只是这些小事,比如风扇转得不快、机箱灰尘太厚导致散热不良、CPU过热时系统自动重启保护等。
冬天,朋友电脑空调开得太高,机房暖气也没开。
结果硬盘过热,不断重启。

对于内存测试,我建议使用memtest8 6 +。
这个工具非常强大,可以发现你内存中的所有小问题。
我家里使用的旧电脑的记忆棒已经用了快五年了。
有一次我运行了Memtest几十个小时,发现了几个坏块,于是我赶紧更换了新的。
现在电脑运行非常稳定。

为了检查硬盘的健康状况,我通常喜欢使用smartctl,这个工具非常有用。
我曾经检查过朋友的硬盘,发现某个硬盘的“Reallocated_Sector_Ct”值很吓人。
一问才知道硬盘是买来用过的,长期闲置几乎坏掉了。
因此,最好购买新的硬盘或至少检查一下历史记录。

说到系统更新,我相信“小而快”。
我一般都是使用yum update来更新。
如果出现问题,我可以及时回滚。
我有一个同事喜欢保存很多更新,但是当他更新系统时,系统崩溃了,他花了几天时间才恢复正常。
因此,更新补丁时,最好按时接收,不要保存。

日志分析,我平时喜欢读/var/log/messages和/var/log/dmesg。
在这两个日志中我有时可以看到系统出了什么问题。
我朋友的计算机的日志中有一个“内核恐慌”条目。
经过长时间的搜索,我发现内核与某个驱动程序不兼容。
后来我更新了内核,问题就解决了。

电源管理配置我一直没太关注,但想了想,确实有必要检查一下。
有时系统中的某个设置,例如关机按钮,会被意外更改,导致系统一关机就自动重启。
因此,这些小配置也需要注意。

与第三方软件的冲突也是一个令人头疼的问题。
我有一个朋友安装了新的显卡驱动程序,但系统每天都会重新启动。
经过长时间的检查,他发现显卡驱动程序与某些虚拟化软件不兼容。
后来我卸载了虚拟化软件,问题就解决了。
所以安装软件时,首先要检查兼容性。

Crontab 配置检查,我经常这样做。
系统重新启动后,我有时会先检查 crontab,看看是否有任何计划任务导致了问题。
我有一个朋友的计算机,在 crontab 中有一个计划的重新启动任务。
这将导致系统每天自动重新启动。
后来我删除了这个任务,问题就解决了。

Kdump崩溃分析:我对这个话题没有做过多的研究,但是想了想,它其实是一个很好的工具。
有时系统崩溃,你却找不到原因。
这时,可以使用kdump保存系统崩溃信息,然后分析查找问题所在。
在我朋友的电脑上,我使用kdump来查找内存模块问题。

一般情况下,服务器频繁重启,需要先从硬件开始,然后是系统更新,然后是日志分析,最后是软件配置。
如果问题太复杂,就需要使用kdump和系统监控工具。
但不管怎样,这些小细节有时可以解决大问题。
但你是否也遇到过如此奇怪的重启问题,并且找了很久也找不到原因呢?

ThinkServer TS250配置Raid1后,在CentOS7.6操作系统进行分区

上周,朋友在一台ThinkServerTS2 5 0服务器上配置了RAID1 来备份数据。
首先在CentOS7 .6 系统下找到两个硬盘(sdb、sdc)。
然后确保RAID1 状态正常。
然后使用Parted对md1 2 6 分区进行分区,并将文件系统设置为xfs,从1 GB到3 0GB。
最后将新分区挂载到/mnt目录下,并在fstab中设置自动挂载。
这样就完成了数据备份,安全高效。
这取决于你,你也可以尝试一下。