在Vsphere5最终版本里,VMware高可用性有一些改变,但表面看起来并不明显。当VMware管理员升级Vshpere5的时候,必须了解VMware高可用性的新特点,还有如何去确保这些新特点能充分利用。
VMware高可用性的新设计
VMware高可用性(以下简称VMwareHA)是VMware里的一个核心基础组件。特别是群集环境里的虚拟机宕机重启的时候尤其重要。重启虚拟机的时候就意味着虚拟机处于非运行状态,就像突然电脑掉电而重新插电启动一样。而VMware HA和VMware分布式资源调度(DRS)在群集里是协同工作的,它们重新分配群集里的虚拟机和资源。
在vSpere5之前,VMware HA只是基于一些具有自动恢复功能的老旧软件。虽然这些软件也还凑合,但这样的HA基本结构很复杂而且排错也很麻烦。因为群集里可以多达5台ESXi服务器作为主节点,而其他的服务器都作为第二节点。然而除非出现了故障或者你使用PowerCLI脚本,否则你没办法分辨服务器的节点类型。因此,像这篇文章指出,当5个主节点服务器不工作的时候,VMware HA将不可用。
在vSpere5里,VMwareHA功能的的基础体系结构和工作方式都被重新设计,使之能适应新的需要。也不需要使用老旧的HA软件,使之代替的是VMware的FDM(Fault Domain Manager)机制。
和vSphere4。1不同的是,vSphere5只信任一台主服务器,而其他的服务器在HA群集里都是可用状态,当主服务器宕机的时候,其他服务器都可以作为备用服务器工作。这样一来,主服务器并非一个单一的节点,当它宕机时,将很快枚举出新的主服务器。
vSphere5 HA的新特性
在重新设计过的VMwareHA,还有许多其他的特性你应该了解。
心跳监控。vSphere4.1里的VMwareHA功能有一个缺陷,它会过度依靠网络和域名服务(DNS)来建立心跳以访问数据储存,而且它使用网络进行心跳测试去确定哪个服务器处于活动状态。所以,当网络发生故障时,VMwareHA将会进行错误的判定把虚拟机重启,从而导致没必要的停机时间。而在vSphere5里的VMwareHA,网络和共享数据存储都可以用来检查哪个主机可用,从而排除不必要的虚拟机重启。
vSphere5HA也不再使用DNS。DNS是通过主机名和IP来执行管理任务的,这样也就消除另一个旧版vSphere的缺陷。
主机隔离探测也改进了。由于数据储存也可以用作心跳检测,VMwareHA可以决定是否隔离网络中的主机(因为HA仍然可以通过数据储存设备来通讯)或者确认主机完全关闭(因为它不再经过网络或者数据设备通讯)。
vSphere5的VMwareHA支持IPv6
简化日志文件和配置文件。在vSphere5里,VMwareHA和Fault Domain Manager (简称FDM)的日志路径是/var/log/fdm。log,配置文件的路径是/etc/opt/vmware/fdm/fdm。cfg。如果你想学习怎么运用这两个文件,请经常关注以下两个VMware Knowledge Base(VMware官方的资料库)文章:Changing the verbosity of the VMware High availability Management Agent(FDM) logs和Troubleshooting Fault Domain Manager(FDM) issue。
更快的初始安装。如果你启用过VMwareHA(VMware高可用性)在一個至少10个宿主机的老版本vSphere群集,你会发现要花费很长的时间。而用vSphere5的话,你会发现启用VMwareHA简直是秒速—无论是2个还是10个宿主机。这是因为FDM的效率更高了,而且和ESXi的集成更好。
用户界面的改进。从vSphere5的客户端看,管理VMwareHA和之前的vSphere版本非常相似,其中的一个改进是群集状态的不同。下面就是在群集状态界面的三个标签。
图解1 在主机标签的群集状态界面。
图解2 在虚拟机标签的群集状态界面。
图解3 在心跳标签的群集状态界面。
请注意到最后一个标签,心跳数据设备显示两个数据储存可用,这刚好印证了我刚才最后的观点。
最常见的VMwareHA设置错误
设置vSphere5的VMwareHA和vSphere4。1没什么不同。其中最大的区别在于你必须在HA群集的所有主机上有最少两个共享的数据储存。
大的群集可能已经有5-10个共享的数据储存,但对于小型的群集通常只有一个,这里vSphere5相对于之前的版本有改变。
启动和运行VMwareHA最好的方法是使用群集状态窗口。如下图所示,在启动VMwareHA 的时候提示有一个错误,是由于我的VMwareHA群集里没有两个或者以上的心跳共享储存,从而导致不满足VMwareHA的最小需求。
图解4 这里可以看到有一个心跳数据储存数量不足的错误。
和vMotion(虚拟机动态迁移)和DRS(分布式资源调度)一样,VMwareHA(VM高可用性)可能是VMware管理中三个最先进的特征之一。在vSphere5里,高可用性有更好的修复能力和建立100%的VMware节点上,这个特征有更好的可扩展性,使用更少的时间去运行管理员的策略和重新配置。呵呵,在你实际部署和获得VMware认证专家测试的时候,你肯定就会明白VMwareHA的改变,好好干。 |