SACC运维专场:不一样的运维 一样的精彩
时间:2018-04-16 11:01 来源:网络整理 作者:墨客科技 点击:次
【IT168系统架构师大会报道】2013年9月5日,由IT168、ITPUB、ChinaUnix主办的SACC2013第五届中国系统架构师大会迎来了第二天。大会围绕“云架构、IT基础架构优化、大数据下的IT架构变迁”三个热点话题展开。在今天下午专场7运维开发实践中,来自七牛云存储的CTO韩拓、360 Web平台部高级技术经理孔德亮、淘宝 电商云-IT咨询团队负责人玄羽,以及58同城架构部资深工程师郝新斌给我们奉献了一场精彩的技术盛宴。 七牛运维Devops实践 在七牛运维Devops实践中,韩拓给我们分享了什么是DevOps,以及七牛基于DevOps的实践经验。的确,技术每时每刻都在发生着改变,很多技术的新词都在不断的涌现,最近在技术圈,DevOps成了热词,到底什么是"DevOps"呢? 韩拓认为,就是不断优化的生产过程,让所有的公司成员都能参与到生产过程中,并不是运维的全部,只是工作运维中的一个分支。
▲七牛云存储CTO韩拓 Devops是研发与运维之间的那点事儿,体现了精益管理中的客户价值原则,我们也可以把DevOps看作是一种能力,在缺乏这种能力的组织中,开发与运维之间存在着信息"鸿沟"。 同时,韩拓从七牛实践角度,展示七牛是如何实践Devops,如何优化生产过程。 何为跳板机? 1、它是Devops体系的总入口,提供权限管理,提供Devops工具链,记录并审所有的操作历史。2、公司的每一个员工都有跳板机的账号。3、工具链:Linux、C、python、bash。4、跳板机的root有最高的运维权限(登录、命令、运维信息、日志等)。5、个人用户运行命令。6、跳板机内部跟据配置提权,执行受控的动作。现在已经在每个大的节点上都有一套跳板机,目前已经做到了高可用。 指令 用于编排、执行服务器操作命令:qdo bj3 op.some_service.reload;qdo -f colddown_some_idc.do 抽象服务器物理信息,提供逻辑层面管理服务器的能力:qdo op.all_mysql op.mysql.backup 权限控制:a -- bj* -- op.nginx.*;b -- * -- view.*.logs 工具链:bash、python、salt 预设指令集(基于salt) 建立新指令的 提交-审核-部署 流程 建立权限控制的配置文件 使用salt执行命令 部署过程 1、管理一切静态的部署、配置 -- 软件包、用户、磁盘挂载、服务、配置文件……2、提供 提交-审核-部署 的流程;3、配合指令系统提供部署的指令 qdo op.all_nginx op.deploy;4、提供冲突检查功能;5、部署信息整理与汇总,日报、周报、月报; 工具链:github.com、puppet、bash、python git库组织: deploy.git/nodes/nb1/root/opt/nginx/nginx.conf deploy.git/nodes/nb2/puppet/memcached.p deploy.git/nodes/nb3/xxx qbin {"/home/qboxserver/memcached": packagepath => "optools/memcached-1.4.15-linux-x86_64.tar.gz", owner => "qboxserver",}qfile {"/home/qboxserver/memcached/m.conf": owner => "qboxserver"} 运维揭秘-让产品失败的更廉价 这个主题激发了很多听众的兴趣,其中一句在红海中要用蓝来的模式去思考给大家留下了深刻的印象。确实,互联网领域风云变幻,而且360这个公司在整个互联网领域也极具个性,一方面是360的老大周鸿祎敢说敢做的风格让人颇为喜欢,另一方面,360在不断的推出新产品,实现自我颠覆方面也着实让业界感到震惊。从360自身的产品成长过程中如何面临失败也是我们非常关心的。 ▲360 Web平台部高级技术经理孔德亮 360 Web平台部高级技术经理孔德亮从三个角度给我们阐述了如何让产品失败的更廉价。主要包括:1.如何适应360小团队文化。2.小步快跑、快速迭代对运维自动化的要求。3.微创新,将运维平台产品化,提供一站式解决方案。 小米加步枪时代 两个IDC,一根光纤;各种型号服务器;运维环境:你搞、我搞、大家搞。 360老板周鸿祎时不时的爱收购,而且产品迅速的要求上线,对运维要求非常高。在孔德亮看来,企业只需要把成熟的产品和服务拿过来用就行,几台服务器没必要自己搞一个平台。 刨根问底解决问题: 数据备份丢失?为什么?不仅仅是存储故障的问题,有可能是调度算法的问题。存储备份一些细节点存在问题,导致了存储故障。 宽容第一次错误,360是一家对技术非常宽容的公司,但是不接受同样的问题发生第二次。 第二次升级:平台化 (责任编辑:admin) |