对企业而言,服务器停机即影响正常的经营生产,其成本既有直接的(工资损失、销售损失、客户损失),也有间接的(员工生产力损失、声誉损失、机会成本),服务器停机虽然存在,但并非不可避免。Stratus的目标就是帮助企业解决这个问题,完全防止故障的发生。
服务器停机是绝大多数企业都无法逃避的问题,当服务器停机时,可能某些关键业务系统无法发挥功能,从而导致生产无法继续,造成停工停产损失。也许你说,这些年企业都在上云,很多业务系统已经迁往云端,还存在停机情况么?实际上,目前上云企业以中小企业居多,且多以管理系统上云为主。生产车间系统,由于对延时较为敏感,基本无法部署到云端,承载生产系统的仍以传统服务器为主。
我们是否有算过服务器停机到底给企业造成了多大的经济损失?
现实情况是,很少有人测量应用程序停机的成本。即使有人测量,也很少能做到精确的测量。实际上,服务器停机给企业带来的影响,远不止直接工资损失这么简单。停机时间的成本包括直接成本和间接成本。直接成本是指可以完全归因于特定商品的生产或特定的功能或服务的费用,而间接成本更难以量化,但对组织的损害可能更大。
计算服务器停机成本
为了比较准确地测出服务器停机给企业带来的成本损失和影响,我们总结出了以下几类:
第一,生产成本。
停机期间,员工不能履行日常职责。这种空闲时间的影响因行业而异。例如,在办公室环境中,员工可能无法访问互联网,但可以在桌面电子表格程序上工作,所以工作效率可能会降低一半。但在制造环境中,如果生产线停止运行,员工可能是100%的无效率的。计算生产率损失的一种常见方法是:(员工平均工资x生产停止的小时数)+员工加班费。
第二,业务成本。
可以想象一下,如果一家连锁零售商,在节假日碰到系统无法正常运营,客户可能将没有时间或耐心来等待,他们将会把业务转移到其他地方。毫无疑问,这不仅造成了短期的业务收入的降低,也对企业的品牌造成负面影响。如果经常出现这种情况,以前忠诚的客户可能会失去信心,把他们的业务推给竞争对手。一旦一家公司被其客户认为不可靠,那么就可能很难消除这种看法。
第三,回收成本。
包括修复系统所支付的价格、IT人员加班费以及恢复服务所需的第三方顾问或技术人员。另一个考虑因素是:当IT需要专注于系统恢复而不是处理组织的其他关键项目时,牺牲了机会成本。
第四,市场影响。
对于一些上市大企业,特别是平台企业,由于用户多,影响大,如果因服务器停机而带来数据丢失等问题,其负面新闻会使这家公司股票贬值,并降低其市值。尤其是在经济不稳定的时期,股市会对有关一家公司的负面新闻做出反应。
降低服务器停机风险
在了解了服务器停机带来的各种成本和影响之后,为避免这些问题的出现,企业必须考虑提升服务器的稳定性、可用性和可靠性。其中,最重要的是提升服务器可用性级别。
目前传统服务器大多基于x86架构,通常将数据存储在RAID(独立磁盘的冗余阵列)存储设备上,但是x86服务器大多可能只有基本的备份、数据复制和故障转移,其设计并不是为了防止停机或数据丢失。如果发生崩溃,服务器停止所有处理,用户失去对其应用程序和信息的访问,因此可能导致数据丢失。标准服务器也不为传输中的数据提供保护,这意味着如果服务器宕机,这些数据也会丢失。如果仅就服务器本身,而不通过软件做任何可靠性优化,其可用性可能保持在99%左右,即一年可能停机时间可能达到几十个小时。
如果想提高传统X86服务器的可用性,通常的做法是让两个或多个服务器运行相同的配置,并与集群软件连接,以保持在两个/所有服务器上更新应用程序数据。这就是传统服务器下搭建高可用解决方案所采取的方法,其可用性通常可以达到99.95%。这种高可用性集群中的服务器通过不断检查和确认集群中其他服务器已经启动并正在运行的心跳来相互通信。如果服务器发生故障,集群中的另一台服务器(指定为故障转移服务器)将自动接管,理想情况下,对用户的干扰最小。
但由于集群中的服务器通过局域网(LAN)或广域网(WAN)进行连接,并由集群软件进行管理。故障转移群集需要一个存储区域网络(SAN)来提供对启用故障转移功能所需的数据的共享访问。这意味着需要提供到公司SAN的专用共享存储或冗余连接。虽然提高了可用性,但它们的有效性高度依赖于专业IT人员的技能。
由于集群的部署非常复杂且耗时,它们需要编程、测试和持续的管理监督。因此,总拥有成本(TCO)往往很高,还需要注意的是,高可用性集群并没有消除停机时间。如果服务器出现故障,当前连接到该服务器的所有用户都将失去连接。因此,尚未写入数据库的数据将丢失。
那么有没有更先进的高可用性解决方案,即能降低企业部署的难度和实施周期和成本,又能进一步提升高可用性,让每年停机时间达到分钟级别吗?
容错解决方案:可用性达99.999%
容错解决方案,即连续可用性解决方案。与传统服务器以故障恢复为目的的容灾备份方式不同,容错服务器的目的是预防故障,以在故障发生时进行“零宕机”切换为目标。Stratus公司就是以专门提供容错服务器解决方案的全球领先公司,他们的ftServer和ztC Edge两大产品,在几乎全行业都有着广泛应用,其高达99.999%的高可用性,为各行业提供最高的可用性,因为它具有系统组件冗余,没有单点故障。这意味着最终用户不会遇到服务器可用性中断及停机。
Stratus容错服务器通过在系统中拥有第二组完全冗余的硬件组件来实现容错性。服务器的软件自动同步复制的组件,以同步步骤执行所有处理,以便在传输中的数据始终受到保护。这两组CPU、RAM、主板和电源都在同时处理相同的信息。因此,如果一个组件出现故障,它的配套组件已经在那里,系统将继续运行。
Stratus容错服务器易于安装、使用和维护。不需要进行软件修改或特殊配置,而复杂的后端技术在后台运行,任何管理系统的人都不可见。从始至终,Stratus的技术研发人员都追求“将复杂留给自己,将便捷留给用户”的产品开发理念。
对企业而言,服务器停机即影响正常的经营生产,其成本既有直接的(工资损失、销售损失、客户损失),也有间接的(员工生产力损失、声誉损失、机会成本),服务器停机虽然存在,但并非不可避免。Stratus的目标就是帮助企业解决这个问题,完全防止故障的发生。
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。