本文简要地介绍了如何通过常见的COM口进行Linux服务器的控制台的扩展,具有实用性和简易性,不受服务器网络等条件的限制,可以方便地管理实际生产环境中的Linux服务器。 说到管理Linux服务器,大家会有很多种不同的办法:键盘+显示器、通过网络登陆、基于WEB的工具、X系统下的图形工具等等,这些方法用在普通的服务器或者自己 的PC服务器上是没有任何问题的,但是要管理一台24X7模式的服务器,确保在任何情况下都能直接快捷地管理到服务器,就不是那么容易了。
对比以上说到的几种方式: X系统下的图形工具。这当然是界面很友好的方式了,而且X系统也可以通过网络扩展到远程,但网络毕竟不是这么可靠,如果服务器的网络瘫痪了,你正好需要远程解决网络的问题,那该怎么做? 基于WEB的工具。这种方式的界面也是相当友好,如webadmin,但是由于安全方面的问题,这些工具是不会安装在真正重要的服务器上的,另外这种方式也受限于网络; 通过网络登陆。这是常用的办法,一般服务器会对信赖的远程站点开放SSH服务,以便维护人员可以远程登陆进行日常维护,这是很安全的,但很不幸它还是基于网络的,当然也受限于网络; 键盘+显示器。这是最保险的办法,笔者都建议使用这种最保险的办法,但是很不幸这也是有缺陷的,就是有很多服务器都不配备显示器和键盘,就算有,也只是安装系统时使用,一旦投入生产运行就不再使用显示器和键盘了。 其实对于UNIX/Linux系统的服务器,可以通过COM口即串行口来扩展系统的控制台,作为另外的途径管理服务器。 CONSOLE,即控制台,是系统输出管理信息的字符输出设备,这些管理信息是由内核产生,比如系统日志、告警信息等。Linux下默认的控制台就是键盘和显示器,而一些老式的SUN、HP、IBM服务器则使用串行口接Text Terminal[1](字符终端,如著名的DEC的VT100)作为控制台,这也是这次将要介绍的方式。 字符终端在大型机时代用得比较多,一个大型机通常联接许多终端,每个终端没有处理能力,只是简单地用键盘输入和从屏幕输出结果,处理过程都是由大型机完成。字符终端屏幕多为黑白字符型的,不具备图形显示功能。这里介绍的Text Terminal和大型机的终端是一样的,只不过市场上早就没有新的终端设备了,现在都是通过应用程序模拟一个终端,叫虚拟终端,如WINDOWS的超级终端就是常用的一个虚拟终端程序,在管理工作站上用打开超级终端(使用正确的速率),就相当于一个终端了。 这种通过串行口实行CONSOLE功能是广泛使用的,如CISCO的路由器,都是通过这种方式进行设备的管理,小小的一条CONSOLE线就相当于一台PC的显示器加键盘,这无疑为路由器省下了许多不必要的配件,而事实上部分CISCO的设备就是一台PC,如思科PIX515防火墙,只要你插上一块PCI的显卡到PCI槽,接上显示器,按下PIX的开关,你就可以看到一台BX主板、奔腾II代350MHZ处理器、128M内存电脑的启动信息,和一台普通电脑启动是没有任何区别的。当PIX完成自检后,控制台就转到CONSOLE口上了,而那个RJ45接口的CONSOLE口,其实就是一个COM口,只是接口形式不是9针D形口而己。 现在可以明确我们需要做的工作了:使用管理工作站的虚拟终端程序模拟一个字符终端设备,通过COM口对COM口的形式将Linux的CONSOLE重定向到该虚拟终端,以实现从虚拟终端控制Linux服务器。步骤如下:
1、制作交叉线 两台电脑要用COM口互联起来需要一种"NULL MODEM CABLE","NULL MODEM CABLE"直译过来大致是"交叉MODEM线",和网线的交叉线意思相近,这是用来"背靠背"联接两个DTE设备的,两头都是9针D型母接头,分别插入管理工作站和服务器的COM口中,为了方便标识建议都接第一个COM口。这种线可以自己制作,也可以去电脑城买,最方便的是有CISCO的标准CONSOLE线加RJ45转9针D型母接头的转接头(部件号74-0495-01),可以直接使用。自己制作可以参考以下的线序: 制作时需要把Txd与Rxd、CTS与RTS、GND与GND、DTR与DSR&DCD交叉相联,DSR&DCD表示这两个引脚串联在一起作为一个引脚信号。更多的详细介绍参见Serial-HOWTO[3]。
2、测试联通性 管理工作站和服务器接上交叉线后,可以简单地来测试一下这条线是否起作用。在管理工作站上用超级终端新建一个联接,速率9600,8数据位,1停止位,无奇偶校验位,无硬件"Flow control";在服务器上echo '1'>/dev/ttyS0(需要ROOT权限),在管理工作站超级终端里观察是否能收到数字1,如果能收到就表明联接无问题。如果不能收到则要在服务器上检查一下各信号引脚是否正确,使用命令"statserial /dev/ttyS0"可以查看当前串行口的状态(在CABLE对端不接管理工作站时或者线序错误时DSR状态为0),联接状态如下:
3、从POST开始 这是很多电脑都无法实现的功能,这主要取决于主板BIOS是否支持。POST(Power On Self Test)即我们通常说的自检,我们可以看到系统的基本信息及检查过程,当然也有可能有出错的提示信息及相应的处理提示,有一些型号的服务器主板(如INTEL原装NL440BX)可以将POST重定向到COM口,这样我们可以接一个终端在COM口上便能看到POST过程,当然也可以通过终端操作,完全不需要键盘和显示器。可惜一般情况下我们的主板并不支持这项功能,但是没有关系,我们可以先设定好BIOS参数(Halt On 设置为None)忽略无关紧要的出错信息,让每次系统自检都顺利通过,这样系统便能顺利进入硬盘启动了。
4、重定向GRUB 也许你有几个系统(如FreeBSD),或者有新的内核需要进行测试,你可能希望通过COM口来选择系统,将GRUB重定向到COM口也是可能的。我们在GRUB的manual页[4]可以看到其支持seriral终端,在GRUB配置文件第一条Title的前面加入两行如下: serial --unit=0 --speed=38400 terminal serial console 我们便能从接在COM口上的终端中看到GRUB的提示信息,通过上、下键选择光带就可以正确地进入各个系统了。LILO的用法类似,请参阅LILO的手册页。
5、重定向CONSOLE 为了能够控制Linux服务器启动过程,我们需要传递一些参数到Linux内核中,从serial-console[2]中我们可以看到只需要将console=ttyS0,9600传递到内核中就可以实现CONSOLE重定向到串口。当然9600的速度太慢,我们可以使用38400的速率,这样显示的速度就和启动时显示器上显示的速度差不多了。我的服务器使用GRUB,所以我的/boot/grub/menu.lst文件中kernel语句如下: kernel /vmlinuz-2.4.20-8 ro root=LABEL=/ console=tty0 console=ttyS0,38400 现在重新启动Linux服务器,打开超级终端,不出意外就能看到平时在显示器上才看得到的启动信息,当然你也可以按"i"键进入交互式的启动模式,当然在不小心踢掉电源后也能轻松输入"Y"进行文件系统检测,是不是很好用?不过启动完了系统后怎么就停在那里不动了?好像Linux很笨啊,它居然不知道我想从这里登录进系统?不要怪Linux,我们马上就来解释为什么会这样以及解决办法。
6、开启ttyS0登陆 其实Linux启动时的信息都是由KERNEL显示的,缺省情况下启动完毕了后init再运行mingetty来提供6个虚拟终端来登陆系统,这可以在/etc/inittab文件中清楚地看到。其实login和内核是没有关系的,所以如果只是在内核中加入参数使其能从COM口交互式地操作并不代表能从超级终端登录系统,我们需要另外运行一个提供从串口登录能力的程序,这个程序就是agetty,它是属于util-Linux软件包中的一员,大家可以参考其man手册页以获得更多的信息,这些信息在其他的文档[1][3]中也都提及到了。我在服务器的/etc/inittab文件中加了一行如下: S0:2345:respawn:/sbin/agetty -L 38400 ttyS0 这样我们就能从超级终端登录系统了,很好用吧。
7、一些经验 使用ttyS0登录还有一些小的窍门和经验,以下是我的经验: COM口的传输距离有限制,普通的线缆只有15米的有效距离,建议使用5类双绞线,可以扩展到50米仍能正常操作; 大家一般会想使用root从ttyS0登录,但是默认的这是不行的,我们需要把该终端加入到文件/etc/securetty中,就是说终端ttyS0是安全的终端,可以使用root登录; 如果服务器长时间开着的话,最好每次都使用exit退出该终端,因为如果不退出来的话,下次再登陆可能会出现输入乱码导致终端不可用等问题,而在登录提示符下输入乱码则无关紧要; 如果你是通过这种方法管理一台实际24X7开着的服务器的话,你可能会有时发现在终端中按回车没有任何反映,有一种可能性就是系统在停电后再开机出现不能启动NFS和sendmail之类的服务,就这样卡在那里死锁住了,这在电源不稳定的情况下尤其多见,所以一定要给你的Linux服务器接上UPS不间断电源,或者在系统BIOS里设置断电后不再启动系统(如果它不是太重要的话),在这种情况下只有按键盘重新启动或者直接断电再重新启动一次,检查启动过程到底发生了什么事情,一般只需要检查一遍硬盘就没有问题了; 如果你的ttyS0出现乱码没有办法使用的话,可以尝试着从网络登陆,把/etc/inittab中ttyS0那一行注释,使用"init q"命令停止通过inittab启动的agetty,然后再重新取消/etc/inittab中的注释,再次"init q"命令启动agetty,不出意外就能恢复正常了。
结束语 到此我们就方便地管理没有显示器
[1] [2] 下一页
(出处:http://www.sheup.com)
上一页 [1] [2]