• 信息安全
  • 无线安全
  • 等级保护
  • 虚机安全
  • 数据备份
  •  背景

    近年来自然灾害的频发为各行业的安全敲醒了警钟,对于IT系统来说如何通过灾备保证系统安全及业务连续性成为广大IT人关注的问题。特别是对于一些市级、省级、国家级的数据中心,单个数据中心已经满足不了可靠性的高要求,而双活数据中心则是热门的解决方案。

     双活数据中心,区别于一个数据中心、一个灾备中心的模式。灾难是一个小概率事件,采用一主一备这种方式,备份数据中心只在灾难发生时才能起到作用,这对于某些用户来说是IT资源和资金的浪费。而双活数据中心的特点是两个数据中心都是在线运行的,如果断了一个数据中心,另外一个数据中心还是在正常运行的,对用户来说是不可感知的,业务几乎不受影响。这样就充分利用了资源,从而避免一个数据中心常年处于闲置状态而造成浪费。并且通过资源整合,“双活”数据中心的乐虎国际娱乐app 能力是双倍的。

    双活数据中心组网拓扑如下:

    1502184467525920.png

    双活的实现方式:数据库双活、应用双活、存储双活、网络双活


    Ø网络双活

    从网络上来看,双活数据中心需要将同一个网络扩展到多个数据中心,在数据中心间需要大二层网络连接并且实现乐虎国际娱乐app 器和应用的虚拟化数据中心互联技术。

    大二层的网络技术有IRF、TRILL、SPB、EVI等。IRF是将多台网络设备(成员设备)虚拟化为一台网络设备(虚拟设备),并将这些设备作为单一设备管理和使用。

    TRILL的全称就是Transparent Interconnection of Lots of Links,顾名思义,其本质就是将很多条链路透明地组织在一起,以致于上层IP应用感觉这只是一条链路似的。它本质上是一个2.5层的技术,使用最短路径、多路径等三层路由技术来讲多条链路组织成为一个大二层网络,并支持VLAN、自配置、多播等二层功能。TRILL目前最大可以支持10核心组网,其最大能力可以无阻塞的接入27648台双网卡千兆乐虎国际娱乐app 器,但TRILL技术目前在芯片实现上存在客观缺陷,核心层不能支持三层终结,也就是说TRILL的核心层不能做网关设备。必须要在核心层上再增加一层设备来做网关,这导致网络结构变得复杂,管理难度增加,网络建设、运维成本都会增加。

    SPB的组网方案和TRILL基本相同(同样可支持接入27648台),其优势在于能够方便的支持VLAN扩展功能,但同样存在网关与SPB核心必须分离的芯片缺陷,导致网络层次增加,管理、运维成本增加。

    EVI可以通过汇聚层和核心层之间的IP网络实现二层互通,所以通过EVI扩展多个二层域的时候不需要更改布线或是设备,仅仅需要在汇聚设备上启用EVI特性即可,这样可以平滑的扩展二层网络的规模。其技术成熟、架构稳定,能够支持大规模二层网络(接入规模221184),运维也简单方便。思科的Cisco OTV技术与EVI同理;另外,也有部分虚拟化

    和软件厂商提出了软件的L2 over L3技术解决方案。例如VXLAN、NVGRE,前者是由VMware和思科提出的标准(使用了L2oUDP的封装方式),后者是由HP和微软提出的标准(使用了L2oGRE封装方式),在虚拟化层的vSwitch中将二层数据封装在UDP、GRE报文中,在物理网络拓扑上构建一层虚拟化网络层,从而摆脱对网络设备层的二层、三层限制。这两种技术的主要特点是隧道的起点和终点主要在vswitch上,而不是物理交换机上。隧道的封装在乐虎国际娱乐app 器内部的vswitch就已经打好,然后将物理网络当作大的IP背板加以穿透,大二层范围可以跨DC。以期达到快速部署,灵活创建虚拟化网络的目的。但这些技术由于性能、扩展性等问题,也没有得到广泛的使用。

    在数据中心之间建设一张虚拟的大二层网络是实现网络双活的基础。通过大二层网络,可以实现跨数据中心的集群、资源共享和故障探测,它是保证故障发生后到故障切换中间过程不丢包的重要手段。

    另外通过负载均衡技术,可以实现流量在不同数据中心间的调度以及在单数据中心内多乐虎国际娱乐app 器的负载分担;同时,负载均衡设备也是探测业务故障实现自动切换的关键实现点。


    Ø存储双活

    存储双活使信息能在数据中心内部以及数据中心之间共享、存取或移动,从而将各种不同的存储系统联合成为单一资源。它允许地理上分离的两个数据中心间的存储系统同时进行数据存取,对客户透明,且保证了数据的可靠性和可用性。

    利用跨数据中心的存储虚拟化功能和数据镜像功能,结合上层应用集群,使两个数据中心都处于运行状态,可同时承担相同业务,提高数据中心的整体乐虎国际娱乐app 能力和系统资源利用率,并且互为生产和备份,当单数据中心故障时,业务自动切换到另一数据中心,实现RPO=0,RTO≈0,解决了传统灾备中心不能承载业务和业务无法自动切换的问题。

    典型的技术有IBM的SVC和EMC的VPLEX、HDS的GAD等。IBM SVC是一个软硬件集成化的产品,专业的虚拟存储软件运行在集群式的硬件引擎上。主机集群可通过两边存储同时访问同一个虚拟卷,双中心同时提供对外乐虎国际娱乐app ,可提高资源利用率。EMC的VPLEX Metro技术则可以将在100公里之内的两个VPLEX集群连接起来,也就是会有8个VPLEX引擎,通过这些引擎能将两个数据中心内最多1.6万个虚拟存储卷整合在一起,并且将最大响应时间控制在5ms以内,同时保证两个数据中心中的应用都能访问这些存储卷。HDS GAD基于阵列,用户数据可以在两台存储中实时同步复制,并提供对外的数据访问乐虎国际娱乐app ,用户主机可以访问任意一台存储的数据,如果一台存储设备出现故障,业务可以不间断地访问另一台存储设备。HDS GAD解决方案可以为客户解决两个难题:当生产系统出现了问题,业务可以自动地不停机切换到另外一台存储设备上,两数据中心之间的理论距离为100公里之内。

     存储双活是数据中心双活的重要基础。


    Ø数据库双活

    数据库双活则是指两个数据库系统可以在相隔比较远的情况下同时运行、支持相同的应用负载,并且在一方出现故障时能够迅速切换到另一方(分钟级),保证业务高可用性。比如ORACLE扩展的RAC和DB2的purescale技术( 注:DB2 pureScale 是DB2的可选特性,它允许你通过“双机(active-active)”配置将数据库扩展到一组乐虎国际娱乐app 器上,以便交付高水平的可用性和可伸缩性。在这种配置中,运行于各主机(或乐虎国际娱乐app 器)上的 DB2 副本可以同时读取和写入相同的数据。)。但数据库的双活前提必须是网络和存储双活。以ORACLE扩展的11G RAC为例,其ASM卷则需要在两边存储做镜像绑定,以保证读写一致。

    在双活数据中心模式下,Oracle RAC数据库可以实现跨站点部署。两个Oracle RAC节点分别部署在两个数据中心(Oracle RAC 1部署在数据中心1,Oracle RAC 2部署在数据中心2),即使数据中心1发生故障,也不会影响到运行在数据中心2里的Oracle RAC 2应用。结合HA技术,还可以保证数据中心2自动重启原来运行在数据中心1的Oracle RAC 1应用。相比运行在物理架构上RAC,则运行在云计算平台之上的Oracle RAC不仅可以实现更高级别的业务连续性,而且可以在线进行维护和扩容。借助云计算虚机迁移技术,还可以在线迁移Oracle RAC节点,从而避免了硬件维护时的应用部分中断。此外,通过云计算DRS技术,我们还可以在线增加RAC节点虚拟机的CPU数量以及内存容量,从而避免了硬件扩容时的应用中断。


    Ø应用双活

    数据中心双活在应用处理层面上实现了完全冗余,业务通过负载均衡自动路由到不同数据中心的应用乐虎国际娱乐app 器,所有的业务系统同时在同城的两个数据中心运行,同时为用户提供乐虎国际娱乐app 。当某个数据中心的应用系统出现问题时,有另一个数据中心的应用来持续的提供乐虎国际娱乐app 。好处是乐虎国际娱乐app 能力是双倍的,业务连续性和稳定性得到了大大的提高且对用户来说乐虎国际娱乐app 体验更好,故障无需感知。

    真正的双活,要在数据中心的从上到下各个层面,都要实现双活。存储、乐虎国际娱乐app 器、网络、数据库、应用,各层面都要有双活的设计,这样才能真正意义上实现数据中心层面的双活。


    总结

    以上阐述了4种数据中心的建设模式,不同的模式适合不同的应用场景,小型企业数据中心多采用传统模式,随着超融合架构的到来,传统数据中心会逐渐消失,向云架构数据中心靠拢,几台超整合一体机便可组建一套小型云架构数据中心;软件定义数据中心多用于行业云、医疗云、政务云、公有云等;双活数据中心有异地和同城,同城的多为医院、教育等,异地双活数据中心多为大型企业、金融行业等。