脸书开源数据中心灾备工具,可自动化执行部署,缩短恢复时间

服务器 数据中心 自动化
Facebook开源了其状态机即服务(State Machine as a Service)StateService,自动化的从系统灾难中恢复。

 Facebook开源了其状态机即服务(State Machine as a Service)StateService,自动化的从系统灾难中恢复。

 

Facebook大多数的生产服务都是自家构建的,多为抵抗重大故障设计,比如从自然灾害造成的数据中心数据遗失中恢复,但是在企业基础设施中使用的第三方服务,由于部署过程可能需要多步骤,跨多个虚拟机调度协调,因此很难自动恢复,Facebook决定解决这些第三方服务的部署,以缩短服务中断恢复所需要的时间。

为此Facebook开发了StateService,这是一个状态机即服务(State Machine as a Service),透过复杂的部署过程来指引虚拟机的状态。StateService采用本身就是文件(Self-documenting)的设计,各个状态成为配置管理(Configuration Management,CM)软件的一部分,透过重新播放先前虚拟机器的状态,StateService可以将服务返回到***已知的状态。

StateService能够与如Chef的CM软件一起使用以部署服务,Facebook用YAML来表示状态机的状态,以描述一个或多个虚拟机可进入状态,和每个状态转换到另一个状态的方式和时间,每个状态可表示为一个步骤或是一系列的步骤,如部署期间所发生的事件等。

Facebook的企业基础设施团队使用StateService,来减少部署服务所需要的手动工作,现在Facebook将其开源,让任何企业也能自动执行复杂的部署工作。

责任编辑:武晓燕 来源: 今日头条
相关推荐

2021-06-25 14:34:07

自动化数据中心人工智能

2018-07-13 06:46:35

数据中心自动化微服务

2009-05-19 15:48:43

2017-07-05 08:22:21

AIM数据中心自动化

2020-12-24 14:10:17

数据中心数据中心灾备灾备

2010-12-06 09:56:52

数据中心网络

2024-06-11 10:41:14

2020-11-17 05:52:08

数据中心自动化数据中心

2020-11-16 13:58:08

数据中心

2018-12-18 10:50:13

数据中心自动化数字化

2018-12-26 05:37:09

数据中心自动化运维管理

2020-06-28 11:10:19

数据中心工具技术

2015-07-03 10:59:19

数据中心灾备

2022-03-09 10:15:10

数据中心自动化数据

2023-02-07 08:11:15

2014-12-18 10:08:13

虚拟数据中心

2022-02-28 11:13:21

数据中心自动化数据中心网络

2020-06-17 09:13:21

数据中心网络技术

2017-01-17 16:12:26

数据中心运维技术故障

2011-01-13 10:16:37

点赞
收藏

51CTO技术栈公众号