在生产环境中,由于各种因素,会存在“前人栽树,后人填坑”的潜在未知风险。当莫名其妙的故障发生时,在尝试各种排查方法后,无法寻根问底。灵机一动,恍然大悟,此错误正在右下方。Soga。正所谓“千查万排,皆因时间”。

环境

4个节点的Hyper-V 群集

故障现象

  1. Hyper-V管理器无法远程管理群集中所有Hyper-V

  2. 群集中的某些VM无法成功迁移

故障原因

群集节点时间不一致

详细描述和排查过程

Hyper-V管理器无法远程管理群集中所有Hyper-V,分别出现

  • 计算机上的操作失败。

  • 无法连接到计算机RPC服务。请确保RPC服务正常运行。

如图:

wKioL1Z35YPRooJ-AAF1pV8iTcM478.png

创建测试VM时出现警报“无法验证节点,原因是此应用程序/服务的有效主机是”如图:

 wKioL1Z35ZjBt_WPAAB2K2_f1Ec739.png

查看报告

wKioL1Z35ayj-e2zAACL0J7dbD0013.png

VM是可以正常创建的,但在尝试迁移VM时。

同一群集中不同节点间迁移VM时出现“启动VM迁移出错。”查看详细信息“无法通过WMI连接到该节点主机。原因可能是网络问题或该节点主机上的防火墙配置出现了特定的安全程序包错误。(异常来自 HRESULT:0x80070721)”

wKiom1Z35cyySVjVAABEEMwJvSE238.png

在其他节点将已创建的VM尝试迁移到(04主机)后,在尝试回迁,发现无法回迁成功,在测试更多的VM迁移是,发现04节点无法迁移任何VM到其他3个节点 。

 

查看Hyper-V日志,日志路径Microsoft-Windows-Hyper-V-High-Availability/Admin

 wKioL1Z35e_j6e2sAACFGIg_9D8172.png

日志名称:         Microsoft-Windows-Hyper-V-High-Availability-Admin
来源:            Microsoft-Windows-Hyper-V-VMMS
日期:            2015/12/17 17:07:27
事件 ID:         22012
任务类别:          无
级别:            错误
关键字:          
用户:            SYSTEM
计算机:           
描述:
无法对远程节点进行身份验证:客户端和服务器计算机上的时钟是不一致的。 (0x80090324)

查看4个节点的时间

 wKiom1Z35fSxyipmAABwNgEYoT8573.png

w32tm /query/source

检查时间同步源,居然为空

wKiom1Z35gXTdQCAAAAbZb-rRQo530.png

net time \\IP /set

手动指定时间源服务器

wKioL1Z35iPQD_qJAAAfFNlbqO4914.png

设置成功后,VM即可迁移成功。


附:微软官方Hyper-V群集操作手册(部分)

配置虚拟机的高可用性的步骤

  1. 确保已安装 Hyper-V 角色。

  2. 如果“故障转移群集管理器”管理单元中没有显示要配置的群集,请右键单击控制台树中的“故障转移群集管理器”,单击“管理群集”,然后选择或指定需要的群集。

  3. 如果控制台树已折叠,则展开要配置的群集下面的树。

  4. 单击“服务和应用程序”

  5. 如果您已创建虚拟机,请跳至步骤     6。否则,使用新建虚拟机向导创建虚拟机并为其配置高可用性:

    1. “操作”窗格中,单击“虚拟机”,指向“虚拟机”,然后单击某个节点。
                 
                 最初将在该节点上创建虚拟机,然后将其添加到群集中,以便可以根据需要将其移动到其他一个或多个节点。

    2. 如果显示新建虚拟机向导的“开始之前”页面,请单击“下一步”

    3. 指定虚拟机的名称,然后选择“将虚拟机存储在其他位置”并指定共享存储中的一个磁盘,或者如果已启用群集共享卷,则指定一个群集共享卷(应位于节点的系统驱动器上的      \ClusterStorage 文件夹下的卷)。

    4. 按照向导中的说明进行操作。您既可以现在指定详细信息(如内存大小、网络和虚拟硬盘文件),也可在以后添加或更改配置详细信息。

    5. 单击“完成”后,向导将创建虚拟机并为其配置高可用性。跳过此过程的其余步骤。

  6. 如果您已创建虚拟机并且只需要为其配置高可用性,请首先确保该虚拟机未处于运行状态。然后,使用高可用性向导配置虚拟机的高可用性:

    1. “操作”窗格中,单击“配置服务或应用程序”

    2. 如果显示高可用性向导的“开始之前”页面,请单击“下一步”

    3. “选择服务或应用程序”页中,单击“虚拟机”,然后单击“下一步”

    4. 选择要为其配置高可用性的虚拟机,然后完成向导。

    5. 在高可用性向导运行并且显示“摘要”页时,如果要查看向导所执行任务的相关报告,请单击“查看报告”

测试群集虚拟机的故障转移的步骤

  1. 如果“故障转移群集管理器”管理单元中没有显示要配置的群集,请右键单击控制台树中的“故障转移群集管理器”,单击“管理群集”,然后选择或指定需要的群集。

  2. 如果控制台树已折叠,则展开要配置的群集下面的树。

  3. 展开“虚拟机”,然后单击要测试故障转移的虚拟机。

  4. “操作”(位于右侧)下面,单击“将虚拟机移动到另一个节点”
             在虚拟机移动时,状态会显示在结果窗格(中心窗格)中。

  5. (可选)重复步骤 4,将虚拟机移动到其他节点或移回原始节点。