Filecoin挖礦必備戰略能力:集群架構與運維能力

目前Filecoin挖礦以集群為主流形式,越大型的集群越需要較強的運維能力,Filecoin為了保證網路的穩定和長久,設計了復雜的證明系統和經濟模型,一旦集群出現故障將會面臨著算力丟失或質押罰沒的風險,因此運維能力是至關重要的,

運維流程化

隨著業務的發展,運維逐漸發展為一個獨立的服務,對于Filecoin而言,流程化的運維可以理清業務脈絡,通過優化升級提高集群的效率和穩定性,最終帶來收益的穩定增長。

資源評估:對于整個運維體系來講,業務最開始的環節是進行資源的評估,當下能夠投入的資源情況,比如帶寬、服務器等,

資產管理:在資產評估完成后,運維方會制定初步的運維方案,所有的資產會被錄入管理。運維資產可以分為硬件資產與虛擬資產,比如交換機、服務器、存儲磁盤等等都屬于硬件資產,虛擬服務器、IP資源等等都屬于虛擬資產。同時,運維工程師會借助CMDB資產管理系統對所有資產進行管理和配置,以便于對資產使用展示一目了然。

集群部署:集群部署就像是組裝家用電腦一樣,先將硬件安裝好然后安裝系統和軟體,當資產理清后可以進行集群的部署,部署主要分為兩部分:硬件與軟體,硬件部署包括IDC機房、服務器、網路帶寬等的部署,IDC機房的部署可以根據標準來實施。在硬件IDC機房部署完成后進行軟體部署,將運行的程式組件即可。

運維支撐:集群部署完成且可以正常運轉之后,運維工作的重頭戲才剛剛開始,Filecoin復雜的證明系統和經濟模型要求集群需要7*24小時不間斷運轉,異構集群的運維也有更高的要求,因此工具化、流程化的作業方式對于運維工程師來講事半功倍,原力區通過自研的CMDB資產管理系統、定風珠以及其它監控工具實現數據的實時監測,保障集群的穩定運行,以下是運維支撐的一些慣用工具:

  • CMDB資產管理系統:通過自研的CMDB資產管理系統可以整合集群的資產資訊,理清硬件、軟體之間的邏輯關系,準確及時的同步消息,從而讓工程師可以全局管控整個集群;

  • 數據管理、監控器:對集群的數據進行監控,可以實現數據的實時監控,包括硬件、業務、任務、服務的運行狀況;
  • 運維優化:當集群穩定運行后,通過集群運行的狀態和數據監控來進一步進行優化,提升集群的性能,

總之而言,形成閉環的集群管理,配合一系列自研工具的使用,是運維工程師們維護Filecoin挖礦節點運行穩定的必備能力。

0 条回复 A文章作者 M管理員
    暫無討論,說說你的看法吧