深圳Linux培训:从零起步到Linux运维经理,你要怎(4)
时间:2018-04-27 19:49 来源:网络整理 作者:墨客科技 点击:次
上报可能是每次调用就上报一次,统计工具负责统计出一分钟内的次数。上报也可能是每5秒上报一次数值,统计工具负责统计出一分钟内的最大值。统计工具的存在是为了上报的方便。流行的开源方案是 statsd,也有大公司基于 storm 来做二次开发的。 4.时间序列数据库 所有定时指标会落地到数据库里。监控告警所需要的数据库需要能够支撑非常大的数据量,但是并没有很严格的 ACID 要求。 5.运维事件数据库 记录所有的告警。包括从其他系统获得告警,以及对现网的所有变更操作记录。这些数据用于支撑告警的原因定位。 6.指标异常检测工具 基于数学模型发现指标是否与过去的稳定模式背离,而推测出现网状态的变化。 7.拨测工具 定时 PING 或者 HTTP GET,模拟实际用户发现服务是否中断,产生告警。同时也产生指标上报给收集系统。拨测又分为本地拨测,和远程拨测。本地拨测可以用于发现磁盘只读等本机告警。远程拨测可以模拟用户的地理分布,把网络的链路状况也包含在拨测覆盖的范围内。 8.告警收敛工具 综合所有来源的告警,进行频率收敛,根源分析。统一汇总成报告催促人工修复。 9.告警自动修复工具 接受告警进行自动化的处理。帮运维完成固定的故障机下架退库等操作。或者在业务本身没有做高可用的情况下,做故障机替换,ip漂移等现网修复操作,一定程度地提高业务可用性。 10.告警通知工具 重要的告警需要升级为电话。需要有高可用的电话,短信,微信等通知接口。 11.监控告警统一界面 屏蔽下层各种工具,提供统一的agent安装,指标采集设置,指标曲线展示,告警查询的界面。一个地方知道现网的所有的问题。 优秀运维经理的能力 1、系统架构的设计和规划能力。做为一个技术工程师,你关注更多的是具体的技术和问题分析、故障处理等细节,而做为一名运维经理,则需要你站在全局的高度,把控各环节的应用来规划和设计系统架构,以实现高效稳定的IT系统。 2、量化和问题管理的能力。熟悉ITIL以及相关运维工具,通过运维管理工具,跟踪事件的流程,实现整个IT系统的统一与协调;通过运维管理工具,帮助运维人员监控和定位问题根源;通过知识库的积累可以有效解决人员变更后的管理问题。可以说,IT系统不仅仅需要人的运维,为了发挥IT系统的最大作用,利用工具来量化、标准化管理更是有必要的。我们可以运用自动化的一些工具来采集输出更为全面的监控预警信息,化被动运维为主动运维;通过自动化的运维工具把多点的管理集中减少到一点都能更好的简化运维工作量和提高运维的效率。标准的流程清晰明确了,这样当问题出现时,就不会出现A部门找B部门反馈,B部门又找C部门处理,C可能说是D部门的问题,这样导致很简单的问题无法得到及时有效的处理,影响的不仅仅是业务本身,部门之间也会怨声载道。 3、管理团队和协调能力。大多数时候,运维人员都在进行着简单重复的工作,且很难得到最终用户的肯定。曾有一个词“穷忙族”形容运维工程师,工位上不见人影,一坐下电话不断,是不是你该解决的问题都有人来找你。这样的场景,大家应该都有体会。标准化流程的制定非常重要,不仅方便问题的梳理而且能让对应的问题找到对应的人,这对运维是很重要的,同时有利于团队的协作。作为运维经理还要关心团队中的每一个成员,协调每名工程师的工作时间和CASE,合理安排工作任务。另外肯定每个工程师的付出,对他们优秀完成的工作给予积极肯定和表扬,这些都有助于凝聚人心和培养团队的荣誉感。 4、资产管理与审计能力。准确了解公司现有的IT资产和设备,对设备进行清查,明确每一个设备的损耗和维保信息。当公司需要购置新机时,都会有明确的数据来支撑你的采购申请。当设备出故障或发生变更时,通过前期的数据都可以做到实时掌握第一手准确数据。而且随着公司的业务发展,分支机构和员工的增多,资产管理与审计都会变得更重要,对IT运维支持的意义就更大了。 5、组建运维梯队,合理搭配运维资源的能力。人员管理问题,在运维当中是比较重要的。很多时候由于运维工作分配不合理,业绩无法准确考核。若将运维人员分成一、二、三线支持,不同运维人员各司其职,就能使有限的运维力量得到合理利用,整体工作效率将明显提升;同时也方便对各自的工作业绩进行评估。再据此制定相应奖惩措施,或针对不同岗位提供不同服务技能培训,亦能提高员工工作积极性。比如:将所有IT问题统一汇总到技术服务台,对于绝大多数(80%以上)问题,服务台可直接解决;服务台解决不了的,再按照问题处理优先级,统一分配不同级的运维力量,来确保不同问题的处理,同时运维人员也不会错过需要及时处理的重大问题。 (责任编辑:admin) |
- 上一篇:以太网络运维,痛苦Vs轻松
- 下一篇:“十三五”国家信息化规划:推动出台网络安全