2月25日,基調聽云虎年首場線上直播正式開播,本次直播以《讓業務系統不再深不可測》為主題,通過對可觀測體系的整體介紹以及DIALOG方案詳解,更直觀的展現基調聽云可觀測能力,幫助企業了解可觀測性作用于系統、業務以及用戶體驗等方面的價值。
IT架構變遷對系統及監控的影響
隨著IT架構在經歷數據中心時代、分布式時代,到如今云原生時代的變遷,帶來了諸多變化:應用的數量和容器的數量越來越多的情況下,系統復雜程度也隨之不斷加深;多云混合云場景下,整個容器的創建速度、生命周期以及整體規模,都已經遠遠超過原有數據中心時代靠人或者靠固定模式所能管理的邊界;在資源仍然有限的今天,不斷增加的系統復雜性和故障排查的難度加大,正在竊取企業的創新的時間,降低企業的用戶體驗。而對企業來講,數字化轉型使得企業或者企業的客戶都非常依賴于體系化的it系統來實現高速的增長,此時用戶體驗和應用可用性比以往任何時候都重要。以上種種都對企業在云原生時代下的復雜系統管理以及監控運營提出了非常高的要求。
如下圖案例所示,我們可直觀感受到復雜系統下對于系統性能的要求,無論從深度還是廣度來說,都呈現了極為繁雜的調用關系。

因此,在整個IT演變過程中創新了多種監控方式,傳統監控能解決的是在一定范圍內,通過收集監控數據,告知系統的狀態(運行、停止、有問題等),通過數據聚合、異常檢測和根因分析推導系統性能下降的原因。但因為數據割裂、監控范圍受限等原因,在系統出現故障時,無法快速找到故障原因,因此我們需要借助可觀測性來深入挖掘。
究竟何為可觀測性?
In control theory, observability is a measure of how well internal states of a system can be inferred from knowledge of its external outputs.-- Wikipedia Observability
根據維基百科對可觀測性的定義,我們可以理解為可觀測性是一種方法,通過檢查系統的外部輸出來衡量系統內部狀態的能力。是一個關于解決"未知的已知"和"未知的未知(意外)"問題域的能力模型。可以讓你在系統不可用時,快速了解問題的現狀及影響,并能夠深入探索、跟蹤問題的根因。
綜上所述,我們可以了解,監控是根據某些領域模型去推導出問題出現在哪里,而可觀測性是通過探索發現系統不可用的原因。因此,監控是為了提升系統可觀測性的手段。而可觀測性是系統的核心能力,用以提升系統性能。
實現可觀測性三大支柱
實現可觀測性有三大支柱:Metrics、Logging、Tracing,在三大支柱支撐下,通過不同的工具融合去實現可觀測性。

傳統意義上三大支柱是割裂的,在海量負載的系統下,每一個應用、每一個服務會產生各樣的指標及日志,而存儲這些又需要特定的工具,一來二去存儲的成本就會變高。當出現故障時,從離散的日志文件中尋找跟故障強相關的信息是一個耗時耗力的過程,而結果往往缺差強人意,因此通過催生以Tracing為核心將所有數據進行關聯,才可以實現深度可觀測性,創造更大價值。

基調聽云可觀測平臺

基調聽云通過對300+技術棧進行適配擴展,將追蹤、日志、指標、行為、業務、OpenTelemetry等多源數據、統一采集、處理和分析模型,構建基調聽云可觀測中臺,納入現有技術實踐成果,對其進行融合分析,通過OneTrace模型展示整個生態下的調用結構,結合獨有的AI能力實現根因診斷、異常監測、智能告警,最終建立基于業務分析的可視化模型,更深入的幫助用戶實現業務可能性。基于基調聽云可觀測性平臺,構建5大場景可觀測,并且在每個領域中建立相應能力,形成完整的可觀測體系。
DIALOG作為貫通全棧IT與業務的智能可觀測性平臺解決方案,分別涵蓋六個層面的能力升級:一是全棧數據采集,二是多維多源智能分析,三是以應用和業務為中心,四是可觀測數據的縱橫融合打通,五是全方位可觀測,六是助力業務增長。可簡單概括為“融匯,融通,融智”三大核心優勢。通過DIALOG,企業在用戶體驗至上的時代能夠深入感知用戶,感知業務波動情況,從而實現系統的優化,降本增效,最終基于基調聽云可觀測平臺數據驅動力輔助企業智慧決策,決勝數字時代!






