运维思索:自动化运维体系如何入手-程序员宅基地

技术标签: 运维思索  自动化运维  

需求

运维是事件驱动,还是自驱动可能是我们在运维工作中不太关注的问题。事件驱动让运维止步于故障,而自驱动让运维不止于建设。持续性的运维建设就需要一套自动化的运维体系,那么我们应该从何入手?

其实前期《运维思考》一系列文章已经给我们答案了,就是从运维框架入手分层建设、打好基础,记住“万丈高楼平地起,勿在浮沙筑高台”。

运维框架

在这里插入图片描述

通常讲到运维建设,我们脑海中首先浮现的是“一团麻”,因为这不是一个人、一个岗位的工作,而是一整个团队的工作;所以我们将“这团麻”进行由底层向上可划分为:

  • IT基础设施层

    IT基础设施层,主要由基础运维团队负责,主要包括存储、网络、服务器、安全设备等硬件设施;

  • 数据层

    数据层,主要由DBA团队、大数据团队负责,主要包括数据库、缓存、数仓等;

  • 应用层

    应用层,主要由应用运维团队负责,主要包括基础服务、业务应用、中间件等;

  • 管理层

    管理层,主要由配置管理团队、安全团队、应用运维团队负责,主要包括各种自动化操作、安全管理、监控管理等;

  • 展示层

    展示层,主要由各团队综合管理,主要包括各种管理工具、监控工具等;

通过对运维框架的分解,对各种资源的逻辑隔离,让各个团队明确当前运维建设中的现状与不足。 如果我们能做到对运维框架的持续性关注,通过图片就可以明晰的知道哪个团队的不足,以及日后各团队的重点发力方向。

运维依据

如果你觉得运维框架还不够细致,那么针对框架中各个层次的工作拆解就来了,我们在此将其称之为运维依据

针对这些个运维依据,我们可以展开一些列的针对性措施,如制定规范、自动化流程,如此就能够不断丰富各个团队的制度、规范、流程,何乐而不为?

在这里插入图片描述

1.基础设施层

在基础的硬件设施管理之上,比较重点的工作是

  • 网络分区与隔离

    网络分区应考虑互联网接入区、普通生产区、数据区、外联区等各个区域,保证各区域的合理接入。

    网络隔离对测试、准生产、生产环境各环境进行隔离,避免访问权限混乱。

  • CMDB资产纳管

    CMDB用于管理基础设施层的各项资产,为上层应用提供数据支撑。使用CMDB一定要和业务应用紧密结合,一旦脱离于业务使用,那么CMDB将成为花瓶。

    相关场景可参考《运维思索:接地气的运维自动化建设》。

  • 内部dns

    通过内部dns可以将应用与IP解耦,一旦ip变更则不需要变更代码,生产环境应该尽量少做此种类型变更操作。

  • 服务器快速上架

    为满足业务日益增长的需求,应该具备服务器快速上架、资产实时记录至CMDB等一系列自动化流程。

  • 网络权限变更

    根据应用需求,快速登记并开通网络权限。

等等。

2.数据库

数据库除了特有的集群外,可以考虑数据库工单、sql审核优化等流程。

3.系统应用

  • 容量规划

容量规划是指根据业务用户流量增长、现有容量等一定的基础数据之上进行周期性的评估,如果有条件的话可结合压测实际情况,这样数据会更准确。通过容量规划可有效控制服务器规范,避免资源溢出。

  • 环境维护与部署

为避免因环境差异导致的问题,各环境应用部署需要遵循统一的目录规范,统一的自动化部署方式,分离的应用配置文件。

等等

4.配置管理

  • 统一账号管理

    所有和用户登录相关的平台、管理工具,尽量接入ldap统一账号管理,这样一个账号可以实现所有系统的统一登录。

  • 自动化配置中心

    在此秉承基础设施即代码的思想,通过ansible作为配置中心,在操作系统层面实现系统初始化、环境初始化、组件初始化、自动化备份等中心化管理,各环境交付统一规格的服务器。

  • 流程管理

    结合jira等工作流工具实现操作的流程化管理。

等等

5.CI/CD

基于统一的运维规范前提下,CI/CD可以真正的做到将以上各个层面的想法、解决方案进行落地。因此CI/CD能力很大程度上决定了我们自动化运维的高度。

  • 持续集成

    代码质量测试、单元测试、打包测试、自动化测试等。

  • 操作系统交付

    遵循统一的运维规范,交付统一规格的操作系统,完成对运维平台各个管理节点的资源注册。

  • 版本发布

支持版本平滑发布、回滚、重启等。

  • 自动打包

    Android/IOS 自动打包并上传至应用商店。

6.监控系统

  • 系统建设

    多维度收集、分析监控数据,实现不同层面的告警;

    对于多维度的数据能够进行分析,实现故障自愈;

  • 监控管理

    监控并不是只要做到告警进行了,而是要做到告警的准确性,因此对告警级别、告警收敛、故障自愈策略等的管理需要我们进行重点关注。

7.安全防护

通过必要的WAF、IDS、防火墙等安全设备进行安全防护、流量分析外,还要结合安全渗透去主动发现问题。

8.数据分析

通过对应用数据、业务数据、运营数据进行集中分析、展示,帮助我们更好的了解系统运行状况。

总结

通过以上各个层面的运维框架和运维依据,希望大家能够结合实际情况进行头脑风暴,做到不止于此。

当然自动化运维建设不是一蹴而就的,需要结合规范、制度、流程去逐步实现。

记住运维建设是过程,不仅仅是目标,我们需要跟随技术潮流趋势,持续的优化与丰富这个过程。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/yanggd1987/article/details/121602551

智能推荐

Linux下升级MySQL版本_linux mysql升级后版本不变-程序员宅基地

文章浏览阅读9.7k次。升级MySQL的方法其实就是将原来的安装的MySQL彻底的卸载,然后在安装新的版本。卸载MySQL:1.先查看安装的MySQL的软件,命令如下:rpm -qa|grep -i mysql可以看到如下图的所示显示安装了 mysql-community-libs-5.7.22-1.el7.x86_64mysql-community-common-5.7.22-1.e..._linux mysql升级后版本不变

puppeteer-不需重构,无痛加强vue单页面应用的SEO,提升百度收录排名_puppeteer seo-程序员宅基地

文章浏览阅读1.6k次,点赞2次,收藏5次。puppeteer-不需重构,无痛加强vue单页面应用的SEO,提升百度收录排名_puppeteer seo

《网络空间安全概论》课程笔记及心得(3)_学习巜网络空间安全概论》收获-程序员宅基地

文章浏览阅读3k次。《网络空间安全概论》课程笔记及心得(3)第五章 网络攻防技术1.信息收集技术·网络踩点( Footprinting)了解攻击目标的隐私信息、网络环境和信息安全状况。根据踩点结果,攻击者寻找出攻击目标可能存在的薄弱环节。在入侵一个目标系统之前,必须了解目标系统可能存在的:管理上的安全缺陷和漏洞、网络协议安全缺陷与漏洞、系统安全缺陷与漏洞;在入侵实施过程中,还需要进一步掌握:目标..._学习巜网络空间安全概论》收获

Linux下Eclipse使用NDK开发Android应用_ndk 编写安卓应用 eclipse-程序员宅基地

文章浏览阅读1.3k次。Google提供的Android SDK 已经能够满足绝大多数场景下的Android_ndk 编写安卓应用 eclipse

二阶sql注入里面隐藏了一些东西-程序员宅基地

文章浏览阅读433次。Summary : 总结: Everyone knows what is SQL Injection, but just to give you a brief about SQL Injection, it is a code injection technique that might destroy your database. It usually occurs when you ask...

swift 中隐藏导航栏_在Swift中隐藏和显示导航栏和标签栏-程序员宅基地

文章浏览阅读3k次。swift 中隐藏导航栏Since everyone wants their app to look neat, attractive, and fascinating, non-standard UI elements and animations are becoming very popular. HidingNavigationBar is such a framework. It hel...

随便推点

STM32MP1系列教程连载-华清远见FS-MP1A开发板使用_fs-mpia开发教程-程序员宅基地

文章浏览阅读5.2k次,点赞11次,收藏23次。华清远见FS-MP1A开发板使用(STM32MP1开发)1.1 FS_MP1A硬件资源介绍FS-MP1A采用STM32MP157A处理器。STM32MP157A是基于Cortex-A7 32bit RISC核心加Cortex-M4 32bit RISC核心的高性能双核心处理器,是华清远见研发中心专门为个人学习和工业控制量身定制的一套开发平台。最高工作频率为800MHz。Cortex-A7处理器为每个CPU内置一个32 kbyte L1指令缓存,一个32 kbyte L1数据缓存为每个CPU内置一个256_fs-mpia开发教程

[C++] C/C++高精度时间及其延时_c++ 高精度延时-程序员宅基地

文章浏览阅读6.6k次,点赞5次,收藏27次。文章目录1. 写在前面5. 写在后面参考资料1. 写在前面…————————————————————————————————5. 写在后面参考资料C++11 新的计时方法——std::chrono 大法好cppreference - chronoC++11 std::chrono库详解..._c++ 高精度延时

keil中关于使用_at_绝对地址定位问题-程序员宅基地

文章浏览阅读1.5w次,点赞2次,收藏17次。 在网上看到有人提到在keil中使用_at_进行绝对地址定位问题,我简单介绍一下它的用法。 使用_at_关键字对存储器进行绝对地址定位程序如下#i nclude<reg51.h>char xdata LED_Data[50] _at_ 0x8000;main(){ LED_Data[0] = 0x23;}在keil中运行以上程序可以在存储器窗口中输入 x:0x8000 可以看到...__at_

智慧地球(iEarth): 服务可持续发展的跨学科框架 | NSR观点-程序员宅基地

文章浏览阅读294次。联合国可持续发展目标(SDGs)关系着人类的未来生存和发展问题,为了更好地实现可持续发展目标,香港大学宫鹏教授研究组和中国科学院郭华东院士研究组联合提出了智慧地球(iEarth)的跨学科框架。该项研究以“iEarth: an interdisciplinary framework in the era ofbig data and AI for sustainable development”为...

基于JavaWeb实现ATM机模拟取款系统实战(用户端操作)_atm机用java实现怎么从数据库里查到余额-程序员宅基地

文章浏览阅读292次。这篇文章主要介绍项目用户端的操作,包括查看余额,存钱,取钱,转账,和退卡操作,以及分页设置_atm机用java实现怎么从数据库里查到余额

备忘录形成html乱码,浏览器icloud网页版备忘录乱码不能显示中文汉字-企业网站设计之中的字体坑...-程序员宅基地

文章浏览阅读2.2k次。iphone备忘录是一个很好用的功能,能方便我们记录一些临时的想法和内容,但是这些内容怎么复制到电脑呢,网页版icloud是一个很好的选择。但是最近icloud网页版却出现了兼容问题不能正常的显示中文。如下图所示选中的部分其实是有文字的,但是在网页上却看不到中文内容只有英文可以正常显示。这其实是网页字体带来的问题。解决办法一:1、打开浏览器,并打开开发人员工具(试用系统自带的edge,按f12);..._网页版的icloud备忘录不显示符号