技术分享

金山云 > 物联网 > 服务器集群故障怎样检测

服务器集群故障怎样检测

发布时间: 2020-01-22 12:01:02

在集群节点之间的通信允许集群服务检测节点故障和状态改变并且将集群作为一个实体进行管理。可以为这种节点到节点的通信设立多重网络以便于消除单一点的故障。在集群节点上运行的集群服务跟踪集群中节点的当前状态,并且确定组及其资源何时故障转移到备用节点。这种通信采用在每个节点的集群服务之间定期发送消息的形式进行。这些消息被称为“检测信号”,或称“心跳气”。


通过心跳通信,每个节点可以恰查其他节点及它们的应用程序的可用性。如果服务器设有对心跳通信;做出响应,则正常工作的服务器会启动故障转移过稳(包括对故障服务器拥有的资源和应用程序的所有权进行仲裁)。仲裁是使用质询和辩护协议来执行的。换而言之,如果某个节点似乎发生了故障,则会在给定的时间内允许它以几种方式中的任何一种表明它仍处于正常运行当中,并且可以向其他正常的节点通信。如果它无法证明自己正在正常运行,则此时会将它移出集群。


多种事件都可能导致节点无法响应心跳消息,如计算机故障、网络接口故障、网络放障,甚于在可能是由于少有的高峰活动期。通常来说,当所有节点进行通信时,配置数据库管理器会向每个节点发送全局性的配置数据库更新。当心跳通信失败时,日志管理锦还会将配置数据库的变更保存到仲裁资源中。这保证了幸存的节点可以在恢复过程中访问最新的集群配置和本地节点的注册表数据。


服务器集群故障怎样检测?以上文章为大家介绍的是检测节点故障的方式检测服务器集群故障,提醒大家的是故障检测算法比较保守,所以我们要尽量多的给那些明显发生故障的节点有质询的机会,才能进入故障转移过程。



以上就是金山云为您带来的服务器集群故障怎样检测的相关内容,如果您还想了解更多服务器集群故障怎样检测的相关问题您可以点击页面中的链接进行具体了解。金山云提供云服务器,云主机,云存储,私有云,数据库,物理主机,RDS,KS3,SLB,KEC的全套产品服务,部分产品可以免费体验,而且会有定期的优惠、代金券等相关的活动。成立7年来,金山云始终坚持以客户为中心的服务理念,提供安全、可靠、稳定、高品质的云计算服务。以上是对服务器集群故障怎样检测相关介绍,如果觉得对您有帮助可以收藏。欢迎随时查看。

以上就是金山云为您带来的物联网的全部内容,如果还想了解更多内容可访问金山云官网www.ksyun.com了解其它资讯。
*免责声明:部分文章信息来源于网络以及网友投稿,本网站只负责对文章进行整理、排版、编辑,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如本站文章和转稿涉及版权等问题,请作者在及时联系本站,我们会尽快处理。