技术分享

金山云 > 安全 > 服务器集群的故障检测需要做些什么工作

服务器集群的故障检测需要做些什么工作

发布时间: 2020-01-22 08:01:04


a.发送信号。对于发送信号,活动服务器以定义好的时间间隔将指定信号发送到备用服务器。如果备用服务器在某个时间间隔内未收到信号,则确定活动服务器发生了故障并担任活动角色。例如,活动服务器每隔30s 将状态消息发送到备用服务器,如果设定的备用服务器注意到在90s (3 个时间间隔〉内未收到任何状态消息,那么它会接管活动服务器的工作。


b.接收信号。对于接收信号, 备用服务器向活动服务器发送请求。如果活动服务器没有响应,则备用服务器按特定次数重复发送此请求。如泉活动服务吉普仍然没有响院,则备用服务器接管活动服务器的工作。例如,备用服务器可能每一分钟将Get Customer Details 消息发送给活动服务器。如果备用服务器发送Get Customer Details请求3次,但未收到响应,此时,备用服务器将接管活动服务缕的工作。


集群可以使用多个级别的信号。例如,集群可以在服务器级别使用发送信号,并在应用程序级别使用一组接收信号。在此配置中,每当活动服务器启动并连接到网络时它都将心跳消息发送到备用服务器。这些心跳消息是按比较频繁的时间间隔(如每隔Ss)发送的,而备用服务器可能通过编程设置为仅当未收到两个心跳消息,就接管活动服务榕的工作。也就是说,在活动服务器发生故障后不超过10s 的时间内,备用服务器将检测到这一故障并启动备用进程。


以上发送和接收信号是通过专用通信通道发送的,以使网络拥塞和一般网络问题不会导致假的故障转移。此外,备用服务器可能将查询消息发送到运行在活动服务器上的一个或多个关键应用程序,并在指定的时间间隔内等待响应。如果备用服务器收到正确的响的,则不采取任何进一步的行动。为了将对活动服务器性能的影响减少到最小,应用程序级别的查询通常要经过比较长的时段,如每隔一分钟或更长。备用服务器可能通过编程设置为:一直等到至少已经发送5次请求但未收到响应,然后才接管活动服务器的工作。这意味着,可能在长达5min之后,备用服务器才会启动故障转移进程。所以,集群故障转移也是有一个时间间隔的,并不能保证无缝接管。


以上就是对服务器集群的故障检测需要做些什么工作的具体内容介绍了,希望对你有所帮助。



以上就是金山云为您带来的服务器集群的故障检测需要做些什么工作的相关内容,如果您还想了解更多服务器集群的故障检测需要做些什么工作的相关问题您可以点击页面中的链接进行具体了解。金山云提供云服务器,云主机,云存储,私有云,数据库,物理主机,RDS,KS3,SLB,KEC的全套产品服务,部分产品可以免费体验,而且会有定期的优惠、代金券等相关的活动。成立7年来,金山云始终坚持以客户为中心的服务理念,提供安全、可靠、稳定、高品质的云计算服务。以上是对服务器集群的故障检测需要做些什么工作相关介绍,如果觉得对您有帮助可以收藏。欢迎随时查看。

以上就是金山云为您带来的安全的全部内容,如果还想了解更多内容可访问金山云官网www.ksyun.com了解其它资讯。
*免责声明:部分文章信息来源于网络以及网友投稿,本网站只负责对文章进行整理、排版、编辑,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如本站文章和转稿涉及版权等问题,请作者在及时联系本站,我们会尽快处理。