LATCH HA 是X0;Linux Latch 系列的高可靠性的服务器集群系统解决方案。
今天各行业的顺利运转都依赖于计算机系统。商品的订货、配送、客户服务、财务结算、保险及预约都需要高度可靠的信息服务系统。这自然要求计算机的宕机时间越短越好。LATCH HA能够自动检测系统的故障。同时,一旦发现计算机出现故障,LATCH HA将把该计算机上的所有进程转移到备份计算机上,从而为客户提供不间断的服务。
一旦计算机宕机,LATCH HA能够将宕机时间缩短到几分钟甚至几秒钟。而且能够将系统恢复到宕机以前的状态,从而保证计算机的稳定运行。在LATCH HA的保护下,计算机系统再也不用因为硬件故障或日常性的维护而中断运行。LATCH HA就是利用这些方法来提供最佳的服务可靠性,将计算机的宕机时间减少到最低程度。要知道,一分钟的宕机时间也许会给银行,铁路,航空等行业的运营带来不可估量的损失。
还具有系统崩溃的智能检测与处理系统。她利用各种手段来检测硬件、存储设备、网络及系统软件的故障。同时,一旦发现计算机出现故障, LATCH HA将把该计算机上的所有进程转移到备份计算机上,从而为客户提供不间断的服务。
高可用性的实现的另一大关键就是的冗余策略,简言之就是对主机,网络设备,备份设备的多台备份(当然不只是简单的备份机):LATCH HA拥有多种冗余模式,其中包括双机在线待机模式、双机就绪模式及三机模式。所有的模式都提供了对各种备份资源-如文件系统、数据库、网络IP地址、系统进程、SCSI设备及NFS-的支持。
此外,高可用性的实现还要有丰富的应用程序支持: LATCH HA能够应用在各种集中式、客户机-服务器模式或OLTP系统中。同时其与市场上各种主流的数据库系统与OLTP软件-如Oracle、 SYBASE、 Informix与Tuxedo-也都保持兼容。LATCH HA同时提供了各种应用程序接口。因此,客户能够在其私有软件中集成各种功能来保证系统的高可靠性,这样也保护了客户的投资。
正文
1. 系统架构
上图是典型的LATCH HA解决方案系统结构:两台主机A,B共享一个磁盘阵列,A为工作机,B为备份机。它们之间以一根心跳线来连接,这被称为“心跳检测”,主要通过一条RS232检测链路来完成。LATCH HA也采用了网络ping检测来验证系统宕机检测的准确性。安装在主机上的HA软件通过心跳线来实时监测对方的运行状态,一旦正在工作的主机A因为各种硬件故障-如电源失效、主要部件失效或者启动盘失效等导致系统发生故障,主机B立即投入工作。
LATCH HA实现了“高可靠性共享存储”架构。该架构由两个或三个冗余服务器、一个共享冗余磁盘阵列、一个可选DBMS及LATCH HA系统软件构成。在LATCH HA的保护下,企业的计算机系统能够提供不间断的信息服务,避免由于硬件故障或日常维护所带来的宕机,因而能够首先最佳的可靠性及最大程度地减少宕机时间。
共享存储设备故障的检测
LATCH HA能够判断由于下列原因所带来的共享存储设备故障:SCSI适配卡失效、SCSI连线失效或RAID控制器失效。共享存储设备故障同时也会造成访问这些设备的软件的误操作或甚至系统宕机。
网络失效检测
LATCH HA能够判断由于下列原因所带来的网络联接故障:网络适配器失效或网络连线的失效。这些故障将使得所有依赖于网络的操作都无法进行。
进程终止检测
LATCH HA能够检测软件进程是否是正常退出。这意味着,随着某一进程的结束状态的不同,可以采取不同的行动。
可调整的检测超时设定
系统宕机检测及网络检测的超时设定都是可以调整的。更短的超时设定意味着能更快地发现故障与进行服务器切换;但是,这可能会导致检测的可靠性下降。
2. 服务器切换模式
自动或手动切换
一般LATCH HA自动对系统故障进行检测,并将服务从失效的服务器转移到备份服务器上。当然,管理员同样也能够手动地切换到备份服务器以进行某些日常维护工作。
切换的自动恢复
一旦失效的服务器修复完毕,你可以让服务切换到原来的计算机上。这项功能也能自动完成。
3. 可靠性
网络可靠性
LATCH HA能够实现高可靠性的TCP/IP网络。当一个服务器上的网络联接失效时,备份服务器将以同样的IP向用户提供服务。举例来说,NFS服务的切换对用户来说就是完全透明的。
[1] [2] [3] 下一页
共享RAID的可靠性
共享RAID可以拥有两个或三个联接端口与冗余磁盘。这些特性保证了LATCH HA不会因为某一SCSI硬盘的故障而失效。
共享文件系统的可靠性
当一个服务器宕机后,共享存储设备上的文件系统可能会不完整。在服务器进行切换后,备份服务器能自动修复共享文件系统。
进程可靠性
LATCH HA将所需要的进程放置在共享文件系统中,并且在两个服务器上都加以记录。这样,在两个服务器切换时就可以启动同一组进程了
数据库可靠性
LATCH HA可以与一系列的DBMS协作。当然数据库必须创建在共享存储设备上。当数据库服务器宕机时,LATCH HA就将DBMS切换到备份数据库服务器上。对共享数据库的回溯操作(rollback recovery )可以保证该数据库数据的完整性。
4. 应用
LATCH HA能够应用在各种集中式、客户机-服务器模式或OLTP系统中。同时其与市场上各种主流的数据库系统与OLTP软件-如Oracle、 SYBASE、 Informix与Tuxedo-也都保持兼容。LATCH HA同时提供了各种应用程序接口。因此,客户能够在其私有软件中集成各种功能来保证系统的高可靠性。
a) LATCH HA/HS2000 在线待机模式
在这种模式下,一个服务器作为主服务器。正常情况下其承当所有的服务。另外一台服务器作为待机服务器,正常情况下除了监控主服务器的状态,不进行其他的操作。一旦主服务器宕机,待机服务器就接手工作,成为新的主服务器。客户仍然可以拥有同样的服务器IP地址、NFS、数据、数据库及其他……这种应用模式近似于上面介绍的典型应用模式—A与B实际上是在完成同一个功能应用,安装在主机上的HA软件通过心跳线来实时监测对方的运行状态,一旦正在工作的主机A因为各种硬件故障-如电源失效、主要部件失效或者启动盘失效等导致系统发生故障,主机B立即投入工作。
b) LATCH HA/DA2000双机就绪模式
在这种模式下,两个主机都作为主服务器,共享自己的磁盘阵列,各自承当一部分服务。例如服务器A在执行应用A, 服务器B在执行应用B, 两个主机在正常情况下各自独立运行自己的应用逻辑,两个主机同时又都作为对方的待机服务器,通过心跳线监控对方的状态。一旦某一服务器宕机,另一台服务器就承担所有的服务,为所有的客户服务。及一旦服务器A发生故障,服务器B马上接管服务器A上原来的应用;或者服务器B发生故障,服务器A马上接管服务器B上原来的应用,这是一种互为冗余的模式。
很明显,一旦某一服务器宕机,另一台服务器的工作服但就比较重,于是就有了下面的三主机模式。
c) LATCH HA/HC2000 三主机模式
这种应用模式是最高端的HA应用模式,它既保证了系统的设备冗余,避免系统宕机,而且又能保证在一旦宕机的情况下有足够的系统资源以供使用。
在这种模式中,待机服务器C同时监控主服务器A与B的状态。一旦服务器A或B宕机,服务器C将承担其服务,为客户服务。这种系统结构既保证了系统的安全运行,又保证了系统资源。
Marketing forecast
目前,对于高可用性的系统级解决方案还被IBM,HP等知名厂商所垄断,而0;linux的应用还限于桌面及中小企业的应用。不过我相信,随着电子商务和0;linux的发展以及人们对应用环境的要求日益提高,0;linux的高可用性应用必将被大家所普遍采用。
基于LATCH HA的高可用性解决方案具有各种应用模式的应用实例(HS2000,DA2000,HC2000),可以满足各个行业对计算机系统的要求。相信在0;linux的时代,构建在上面的高可用性群集系统X0;linux Latch/LATCH HA系列必将成为推动行业0;linux应用的原动力之一,和大家共同把0;linux推向一个新的领域!
附录:
X0;linux 介绍
电子商务及其应用的飞速壮大促进了0;linux的发展,而0;linux本身的功能也
在不断的被各个0;linux厂家和爱好者们所完善。但0;linux在易用性和可靠性上依然和其他诸如Windows和Unix有差距。而X0;linux正在把这种差距不断的缩小。X0;linux是美商网虎公司最新推出的0;linux操作系统。她与其他我们熟悉的0;linux的区别主要有两个:
1.基于核心的多语种支持:
X0;linux采用全新结构的「地球文字库」——GCS(万语码),可以处理多种语言,具有超强的语言兼容性,可处理包含UNICODE、繁体中文、简体中文、日文、韩文、泰文、藏语、越南以及各种西方语言等等,包含人造外星语言「克林贡语」均在支援范围内(信不信由你!!!)。为发扬各国的文化智慧资产,系统包容了多种内码,更可支持高达75,000+字CCCII中文,使全球各种文字支持总数达到数十万字以上。
2.简单易用的操作与安装界面:
针对烦琐的0;linux设制程序与命令,X0;linux还提供了智慧型设定精灵Genie,以菜单方式轻松完成硬件、时区、系统服务、局域网内各种服务、Xwindow设定,轻松完成0;lin
上一页 [1] [2] [3] 下一页
(出处:http://www.sheup.com)
上一页 [1] [2] [3]