運維監控能夠實現自動化嗎?

一個非常好的問題。運維監控能夠實現自動化,而且建議實現自動化。

云服務已經成為IT技術的核心基礎設施,充分利用云服務帶來的彈性和分布式優勢,賦能自動化運維。

一,自動化部署

CI/CD持續化集成和自動化部署,比如常用的Jenkins,配置Git代碼提交時觸發構建,然后自動部署。

二,Docker容器技術

Docker將應用以及依賴打包到一個可移植的鏡像中,可以實現虛擬化,有助于快捷高效的交付應用。

搭建阿里云容器鏡像服務+Git+Docker自動構建系統,結合資源編排服務,實現自動部署更新,不再需要常用的Jenkins構建服務器。

三,AutoScaling自動伸縮

配置一定的觸發條件,滿足時自動增加或者釋放服務器資源。比如當CPU使用率達到80%或者內存占用率達到80%時,根據配置好的服務器和數量,自動觸發。

四,系統日志收集處理系統

1,ELK是常見的日志收集管理系統,包括ElasticSearch, LogStash, Kibana三個服務,架構示意圖如下:

2,在ELK系統中,Kibana是一個圖形化展示工具,配置查詢條件,運維人員隨時可以搜索指定日志資訊,分析處理故障。

五,服務監控

1,云監控CloudMonitor

主流云服務商都將監控功能集成到了基礎架構中,以阿里云為例,云監控提供了多種配置,多維度全方位監控。

比如配置CPU使用率到達80%時,自動觸發動作,增加服務器實例,同時郵件通知運維人員。

2,應用監控

以監控寶為例,配置服務地址,選擇分布在不同地區和運營商的監測點。當監測點不能正常調用配置的服務地址時,將收到警告資訊,可以選擇郵件、短信、電話等通知方式。

六,云原生

云原生是指從開始設計應用時,就充分考慮并且利用云服務的特點,比如彈性和分布式,可以簡單的理解為:云原生 = 微服務 + DevOps + 持續交付 + 容器化。

在云原生應用系統里,運營、維護和監控,完全是自動化的。


我是工作多年的Web應用架構師,陸續發布關于軟體開發方面的文章,歡迎關注我,了解更多IT專業知識。

2 条回复 A文章作者 M管理員
  1. 如果不使用這些自動化工具,你要不停的看服務運行狀態,怎么看?手動點。 使用了自動化工具,要每天看數據,因為沒有配置自動報警和自動觸發動作。 配置自動報警和預定義處置動作模板,就是自動化處理,只需例行檢查。//@阿拉伯文化廣場舞大媽:這種東西多了之后你就不覺得是自動化了[捂臉]每天去各個平臺看數據煩得要死。還得寫個平臺集中展示

  2. 這種東西多了之后你就不覺得是自動化了[捂臉]每天去各個平臺看數據煩得要死。還得寫個平臺集中展示