基調聽云協辦的“智能觀測進化論”第二期沙龍精彩回顧
2025年3月7日,由中國信通院穩定性保障實驗室主辦、基調聽云協辦的“智能觀測進化論”系列沙龍第二期圓滿召開。本期沙龍邀請眾多業界大咖齊聚一堂,就AI Agent和大模型在可觀測領域的應用潛力與實踐路徑展開深入探討,分享了前沿學術研究進展和最佳實踐經驗,吸引了上千名業內人士的熱情參與。下面,就讓我們一起來回顧會議精彩內容!
01智觀全局,智能體技術在運維和可觀測領域的實踐探討
中國信通院云大所云計算部工程師劉坤擔任沙龍主持人,他首先介紹了系列沙龍的召開背景,大模型、智能體等技術在加速可觀測性技術向更加智能的形態演進,然后分享了QwQ-32B模型和現象級產品Manus的發布,引出了本場沙龍的圓桌討論話題,激發了與會者對于沙龍內容的期待與思考。
字節跳動服務端可觀測平臺算法負責人 董善東 發表了《Agentic AI 在可觀測領域的應用潛力與實踐路徑探討》主題演講。他首先分享了Agentic AI對于可觀測、SRE帶來的潛力思考,構建SRE Agent數字分身, 實現對多個場景的串聯、 協作, 助力SRE解決“日常瑣事”,然后介紹了Agentic AI的概念、特點和MCP通信協議,分析了業界使用Agents在可觀測和SRE方向的應用,提出了multi-agents到Agentic AI的關鍵點是反思和學習,描繪了SRE場景下的 Agentic AI 大圖,最后進行總結展望。
咪咕視訊科技有限公司技術總監 朱孫偉 發表了《智能體技術賦能可觀測平臺場景分析》主題演講。他首先分享了結合RAG+大語言模型快速構建專業運維輔助決策體系,并結合歷史數據實現專業問題解答和決策輔助的應用路線,然后介紹了基于自然語義理解,大模型輔助實現異常數據的智能化清洗、分析、提取訓練數據集和測試數據集的實踐經驗,以及通過圖像識別、自然語義理解等技術構建新一代交互方式,最后展望了AGI模式下“數據感知-智能決策-行動執行”的智能體完整能力。
移動云運維架構師 李蔚發表了《基于大模型AI技術的高階智能運維發展與規劃》主題演講。他首先介紹了DS等模型運維應用與邊界,對DeepSeek等大模型在運維領域的應用案例進行分析,盤點出當前大模型技術的能力邊界,然后分享了基于大模型的智能運維影響因素,最后介紹了移動云在智能運維領域的發展與規劃,包括運維業務架構、智能運維研發協作和大模型技術加持下的故障自動駕駛設計。
02圓桌對話,面向實踐痛點碰撞觀點
在圓桌環節,基調聽云AI負責人韋遠奎與各位與會嘉賓現場一起連線對話,同頻探討 AI 大模型和可觀測性技術的發展脈絡與趨勢,嘉賓們針對大模型對于運維的將本增效、人類專家與AI系統的有效協作、AI Agent決策的可解釋性、通用Agent對于領域Agent的影響等議題,進行了熱烈的探討與交流。
【觀點總結】
1)運維大模型的基建不像原來基于規則和數據的基建那么完善,在做基建的過程中,本身就要耗這種大量的成本。
2)大模型在運維領域有其適合發揮能力的優勢項目,也有超過其能力邊界的一些劣勢項目,現階段多在優勢項目去發力,才能提高效率。
3)大模型在運維領域的落地效果與模型本身的準確率息息相關,如果模型準確率沒有突破,在實踐過程中會產生很多新問題。
4)隨著技術的發展進步,大模型的能力會越來越強,企業會逐漸完善內部基建,智能化一定是未來的趨勢,因此需要從現在開始就進行實踐探索。
【觀點總結】
1)控制AI的隨機性,如使用知識庫、模型微調等方法。
2)對關鍵運維操作分級分類,涉及高風險和影響面大的關鍵動作節點,人類要介入審核。
3)三是進行多輪校驗,對于模型生成的決策要設置多輪審核機制。
4)目前的人機協同范式,還應遵循模型做生成工作,人類完成審核工作。
5)要增加模型的可解釋性,讓人更能夠理解他是怎么樣決策的。
6)加強模型反思,通過反思讓模型對自己的輸出結果進行評估和改進。
【觀點總結】
1、將CoT輸出,顯示大模型的推理步驟。
2、對大模型決策路徑的關鍵環節做結構化處理。
3、使用可觀測性技術對大模型和Agent進行觀測,特別是包含大模型的完整調用鏈路。
4、使用流程編排對大模型的思維鏈做限制,以人腦的思維鏈輔助大模型的自主決策過程。
5、使用RPA機制和小模型輔助大模型得出相應結論。
【觀點總結】
1、垂直領域的數據是私有的,這是通用Agent所不具備的,領域Agent對特定領域的問題的效果優于通用Agent。
2、從專業性的深度、合規和安全方面考慮,Agent要嵌入公司內部的專業工作流,領域Agent更具備優勢。
3、通用Agent對于算力的消耗大于領域Agent,考慮成本和效率,現階段企業仍然會選擇領域Agent。