现在系统基本上搞好了,8个节点正在欢快地奔腾着,客户端支持rsh,并行环境是MPICH-1.2。在此特别感谢各位给予我大力帮助的朋友们,给他们添了很多麻烦,主要功劳是他们的!谢谢!
他们是:
A_Ha,Andrew_Lee,Badman_Big,Chern_Yf,Fengguang_Wu,Marquis_Weng,
Qun_Liu,Richard_Tao,Rone_Gao,Who_Ever,Zqiang_Zhou,等!谢谢!
为了回报大家并交流经验,我写了一下,不对之处还请指教!更加欢迎提出建议,校内的请发[email protected],校外的朋友请发[email protected],谢谢!(BTW:我刚开始学LINUX,现在回答问题,我想我没这本事,抱歉!)
欢迎来http://202.38.85.81/linux/
参照文献:
Linux远程启动 http://www.linuxaid.com.cn/(或者http://202.38.85.81/Linux/aid.htm)
在此就差不多照抄了(//shy)
一、远程启动原理
客户端在启动前,既无操作系统,又无启动的软盘或者硬盘,它只有计算机的基本部件: CPU, 内存,主板等。但最重要的必须有网卡和启动的BootRom。客户机只能通过网络获得操作系统。Linux的无盘远程启动与Novell、WinNT下的无盘启动技术不一样,不是采用RPL( Remote Initial Program Loader),而是基于标准的BootP/DHCP和TFTP协议,并通过NFS文件系统建立文件系统。相对前两种,更具有其通用性和适应性。可以基于Linux系统远程启动Dos,Win95,WinNT和Linux客户。
由于自己的网卡(3c905b-tpo100,有BUG,按照etherboot的说明没修正成功,现在是用软盘代替网卡的EPROM,不好多说,还请自己直接到http://sourceforge.net/下载所需要源码等或者编译自己所需要源码.
下面简单介绍Linux启动原理:
1.客户端个人电脑开机后, 在 TCP/IP Bootrom 获得控制权之前先做自我测试.
2.Bootprom 送出 BOOTP/DHCP 要求而取得 IP.
3.如果服务器收到个人电脑所送出的要求, 就会送回 BOOTP/DHCP 回应,内容包括客户端的 IP 地址, 预设网关及开机影像文件.否则, 服务器会忽略这个要求.
4.Bootprom 由 TFTP 通讯协议从服务器下载开机影像文件。
5.个人电脑通过这个开机影像文件开机, 这个开机文件可以只是单纯的开机程式也可以是操作系统.
6.开机影像文件将包含 kernel loader 及压缩过的 kernel, 此 kernel 将支持NFS root系统。
7.远程客户端根据下载的文件启动机器.
一切OK!!! 简单吧!好用吧!下面具体介绍如何建立Linux远程启动.
二、远程启动实例
作为例子定义以下:
Linux 服务器: server(IP:192.168.0.254)
第一个客户机:pc01(IP:192.168.0.1)
第二个客户机:pc02(IP:192.168.0.2)
所有远程启动客户目录:/client
第一个远程启动客户机目录:/client/pc01
第二个远程启动客户机目录:/client/pc02
支持rsh
首先重新编译Linux内核。
make menuconfig
注意网络的支持,NFS-Root 支持,BootP(DHCP) 的支持必须包括在内。
make clean
make dep
make bzImage
make modules
make modules_install
以上命令之后,你会发现客户端启动的影像文件在 /usr/src/linux/i386/boot 目录中,编译出新内核之后,用 mknbi-linux(mknbi-linux bzImage vmlinuz.nb)处理,将vmlinuz.nb 放在/tftpboot下即可。
然后执行以下命令:mknod /dev/nfsroot b 0 255 修改启动设备,让其指向NFSRoot.
下面为远程客户机修改服务器,用于建立远程客户机的文件系统。
在服务器/etc/exports 中加入:
/client/pc01 192.168.0.1(rw, no_root_squash)
/client/pc02 192.168.0.2(rw, no_root_squash)
/home 192.168.0.1/255.255.255.0(rw,no_root_squash)
使用DHCP,在/etc/dhcpd.conf 加入对远程客户的支持,其中server地址是192.168.0.254:
# dhcpd.conf
# Global options
option domain-name "server.ustc.edu.cn";
option domain-name-servers 202.38.64.1;
# Intranet
subnet 192.168.0.0 netmask 255.255.255.0 {
range 192.168.0.1 192.168.0.250;
default-lease-time -1;
# option root-path "/client/pc01";
option dhcp-server-identifier 192.168.0.254;
option broadcast-address 192.168.0.255;
# option routers 198.168.0.254;
server-name "server";
next-server 192.168.0.254;
filename "/boot/vmlinuz";
host pc01{
option root-path "/client/pc01";
hardware ethernet 00:01:02:96:65:92;
fixed-address 192.168.0.1;
}
host pc02{
option root-path "/client/pc02";
hardware ethernet 00:01:02:98:92:55;
fixed-address 192.168.0.2;
}
}
subnet 202.38.64.0 netmask 255.255.255.0 {
}
请参阅:DHCP-Howto
在服务器上建立远程客户机目录:
/client
/client/pc01
/client/pc02
下面说一下pc01的做法.
pc01目录下包括:bin,dev,etc,home,lib,mnt,proc,root,sbin,tmp,usr,var目录。
我们是把bin,dev,etc,lib,sbin,usr,var直接完全复制过来,home,mnt,proc,root,tmp是新建的空目录,(当时是重新安装了一个包括DHCP,NFS,RSH等支持的尽量小、尽量干净的Linux,然后完全将它们完全复制过来,这样一来必然有很多不必要的东西可以删除,可惜现在水平不照,按参考文献做不成功,只好用了这种省事的法子:(,等以后慢慢删除不必要的文件)
注意必须修改/client/pc01/etc/rc.d 启动文件:改 mount -avt nonfs 为 mount -av.允许使用NFS Root文件系统。(我们的是Debian Woody,这个文件变为了/client/pc01/etc/init.d/mountall.sh,并且我们的是mount -a -t noproc,nosmbfs )
以如下格式修改/client/pc01/etc/fstab文件:
192.168.0.254:/client/pc01 / nfs defaults,rw 0 0
192.168.0.254:/home /home nfs rw,bg 0 0
proc /proc proc defaults 0 0
修改client/pc01/etc/hostname:
pc01
修改client/pc01/etc/hosts:
127.0.0.1 localhost
192.168.0.254 pc00
192.168.0.1 pc01
192.168.0.2 pc02
修改client/pc01/etc/hosts.equiv:
+
server
pc01
pc02
修改client/pc01/etc/mtab:
192.168.0.254:/client/pc01 / nfs rw 0 0
proc /proc proc rw 0 0
devpts /dev/pts devpts rw,gid=5,mode=620 0 0
192.168.0.254:/home /home nfs rw,bg,addr=192.168.0.254 0 0
修改client/pc01/etc/network/interfaces
face eth0 inet static
address 192.168.0.1
netmask 255.255.255.0
network 192.168.0.0
broadcast 192.168.0.255
gateway 192.168.0.254
接下来必须建立一个链,将远程客户机的IP地址链接到/client/pc01目录。
$:ln -s pc01 192.168.0.1
做pc02则可以复制pc01过来,并将上述几个文件修改一下.
下面在个人目录下设置rsh支持:
home/username/.rhosts
192.168.0.254 username
192.168.0.1 username
192.168.0.2 username
最后请确认服务器上的nfsd,tftpd 和 bootpd daemons是否启动。
一切完事!远程启动很快十秒钟左右就可享用Linux.
关于NFS,TFTP,BOOTP(DHCP)的设置请参阅How-to.
一点经验之谈, 最好把client的所有文件放在一个独立分区里面,这样就可以在这给分区里装上一个基本的系统(就像普通的安装一样).然后作为修改的基础(建议使用Debian,比较易于裁剪). 如果以后需要在客户端安装什么软件的话,可以这样做:
chroot /client/pc01
dselect或者apt -get
再次对给予我帮助的各位朋友表示感谢!谢谢,朋友们!