网络安全检测|网络安全服务|网络安全扫描-香港墨客投资移动版

主页 > 业界资讯 > 网络安全预防措施

红帽软件 魏新宇:金融行业自动化运维的探讨与(2)

根据不完全统计,在传统行业里,IT成熟度较高的用户,其OS成熟度大多处于三级,也就是基本实现了运维制度化、规范化,但仍处于半手工运维的阶段。

而作为对IT运维要求更高的金融行业,显然需将OS运维成熟度至少提升到四级,实现集中化;甚至五级,也就是自动化和运维开发一体化。

客户理想的自动化平台是:首先要有一个自动化运维门户(unified portal),理想状态是这个门户与客户的云门户统一对接。其次,当IT系统出现问题/需要变更的时候,自动/手动触发处理工单 (这个工单系统符合ITIL流程 ,与行里现有流程和审计对接)。这个工单IT主管可以看到,审批以后、自动执行,把问题修复。比如:linux的根分区不够了,自动触发预运维平台的对应操作是自动扩容,但需要自动触发创建工单。工单到IT主管那,批准之后,自动扩容。

如果按照上一小节的“OS运维成熟度模型”来衡量该架构,上图这个架构不仅实现了自动化,也实现了集中监控。因此其等级至少为4+,接近于5级。

构建自动化运维平台中,红帽的左膀右臂分别是Ansible Tower和Satellite。

Ansible Tower作为一款优秀的自动化运维工具,它有四大特点:

· 使用简单而功能强大(它可以支撑整个IT架构,从物理机、操作系统、虚拟化、云、容器到网络设备。语言简单易学)

· 操作安全可控(ansible tower基于RBAC方式对用户进行授权,AD,LDAP等认证方式做对接)

· 适应传统行业客户与互联网行业(ansible是git hub上最受欢迎,使用最广的自动化工具)

· 在金融行业已经积累了海量的playbook(红帽的的用户可以直接拿来用,红帽在很多金融行业客户积累的经验)。

satellite则在系统部署、订阅管理、软件管理、配置管理四方面帮助客户实现IT运维标准化。

红帽云管平台Cloudforms,可以与AnsibleTower和Satellite对接,实现云平台管理与运维统一。

那么,IT自动化运维平台架构如何落地?

首先我们先看自动化运维平台的架构:从下往上:IT环境、基础架构管理、数据展示层。

IT环境层,指的是自动化运维平台需要纳管的对象。在一个复杂的数据中心中,运维绝不是仅仅针对一种操作系统,或者一种型号的服务器。而是整个数据中心,包括(但不限于):

1.系统层面:从Linux(物理机、虚拟机、云环境), Unix,到Windows。

2.虚拟化平台:VMware、Docker、Cloudstack、LXC、Openstack等。

3.商业化硬件:F5、ASA、Citrix、Eos以及各种服务器设备的管理。

4.系统应用层:Apache、Zabbix、Rabbitmq、SVN、GIT等.

5.商业化软件如:Openshift、Ceph、Gluster、Oracle等。

6.云平台:支持的云平台有AWS、Azure、Cloudflare、Red Hat CloudForms、Google、Linode、Digital Ocean等。

基础架构管理层

基础架构管理层的职责分为三大块:集中监控、运维自动化平台、内控平台。

1.集中监控平台包含平台(如虚拟化平台)监控和应用(如oracle数据库)监控。

2.运维自动化平台,它是基础架构管理层的核心组件。它需要完成四类操作:作业调度、自动巡检、批量发布、容灾管理。也就是说,运维自动化平台必须能够驱动IT环境层的七种对象。

3.内控平台,主要负责合规控制。它完成:合规管理、风险管理、用户管理、访问控制。

整体而言,在基础架构管理层中,运维自动化平台是最关键的,它是管理层的发动机。而集中监控平台和内控平台则是辅助自动化平台的。前者负责运维自动化的全生命周期管理,后者负责运维自动化平台的合规和安全。

服务管理层

服务管理层通常通过ITIL等架构理念,与客户的规章制度与业务流程匹配,需要做定制化开发。目前绝大多数金融行业用户都有流程,只是体现在纸面上。需要做的是将纸面上的流程IT工具化。

数据展示层:

主要是面向企业内部IT和非IT部门的内容用户。做统一的门户。过这个统一的平台,内部用户可以访问这个平台。通常情况,运维门户会与客户的云门户统一。

金融行业客户自动化运维平台实施步骤

任何一个大型平台,无论是混合云平台,还是自动化运维平台,它们的构建都不是一蹴而就的。都需要客户结合自身的情况,分步骤、分阶段走。

下面我们看一下自动化运维平台常见的几类工作,按照OS运维成熟度模型进行评估,六类工作都能实现自动化的话,IT成熟度可达到接近于5级的水平。

在这六类工作中,按照难易程度,大致可以分为三类:

· 比较容易实现的是批量作业自动化、自动巡检。(通过Ansible Tower+ 专业服务实现)

· 实现难度中等的是:软件批量分发部署和配置与版本管理。(通过Ansible Tower + Satellite + 专业服务/其他开源工具实现)

· 实现起来最复杂的是:应急故障检查和容灾管理。(通过Ansible Tower + Satellite + ITIL + BPM + 专业服务/其他开源工具实现)

(责任编辑:admin)