如今Stratus正在通过打破这一模式,以“故障预防”为目标,致力于实现“零宕机”。
备胎,
本意是指给汽车准备的备用轮胎,
一旦哪个轮子爆胎了或出问题了,
备用轮胎就能用上,
不至于中途抛锚。
所以备胎最大的好处是,
一旦“正牌”出问题,
“备胎”就能立马转正。
车如此,服务器也如此。
服务器——企业信息化的核心IT设备。
承载着企业最核心的数据资产,
一旦出故障,
轻则数据丢失,重则生产停顿。
从信息化时代开始,
保障服务器安全,
就是IT部门工作的重中之重。
为降低服务器宕机风险,
一代代的IT人员可谓是想尽办法,
从单机备份到双机热备,
再到异地容灾,
以当前对服务器可用性的评估标准,
如果正常运行时间达到99.999%,
即认为服务器达到了较高的可用性水平。
如果能再提升一个安全数量级,
达到99.9999%,
即每年停机时间不超过30秒,
从根本上讲,
其实就已经实现了“零停机”。
那么这堪称极致的性能指标,
到底有没有可能实现呢?
Stratus技术人员告诉你,
当然有,就是在下!
通常来说,
提升服务器可用性最可行的手段就是找“备胎”。
但此“备胎”与传统双机热备有所不同。
传统双机热备实施不仅复杂,
而且成本非常高,
不是所有企业都有条件去实践的,
而且双机热备也无法做到真正意义上的瞬时切换。
为了解决这个问题,
Stratus开创了全新的变革思路,
采用了一种全新的技术架构——冗余系统。
通过单一系统下两个完全一样的计算单元实现高容错能力。
这种容错方式分两种:
软件容错和硬件容错。
软件容错

图为 ztC Edge 110i / ztC Edge 250i
基于软件提供容错的应用程序和保护数据
代表产品:
Stratus ztC Edge和everRun软件。
everRun是持续可用性软件,
Stratus ztC Edge是边缘计算硬件平台,
ztC Edge有两个节点。
ztC Edge作为一个冗余对部署时,
数据会自动跨平台复制,
一个节点发生故障时,
将在另一个节点上
自动重新启动应用程序(高可用性模式)
或连续不停顿运行(容错模式)。
但软件容错最大的技术挑战是,
如何降低数据复制过程对系统资源的占用,
这需要在数据复制和系统资源之间掌握一个“度”,
而Stratus有专门的算法动态调整检查点的频率。
使这一过程对资源占用率非常低。
硬件容错
是基于硬件的方法提供容错的应用和数据
代表产品:
ftServer服务器,
ftServer内部也有两个相同的客户可更换单元(CRU)并行运行,
每个单元在同一时间执行相同的进程。
但ftServer采用的是硬件容错。
为确保两个CRU单元数据同步,
ftServer系统设计采用了专有的现场可编程门阵列(FPGA),
只要一个CRU出现故障时,
另一个CRU能瞬时接替。
由于是硬件容错,
这一过程切换非常快,秒完成。

对于不能容忍哪怕是一秒钟的计划外停机的企业,
ftServer是一个可行的选择。
服务器作为企业必备的IT基础架构产品,
从部署那一刻起,
就时刻面临着可能出现的故障风险,
传统服务器安全以“故障恢复”为目标,
即在故障出现后寻求快速恢复的能力,
这种情况下,
数据丢失和生产停顿在所难免。
如今Stratus正在通过打破这一模式,
以“故障预防”为目标,
致力于实现“零宕机”。
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。