買幣行情現貨交易合約GOLD 理財活動中心

更多

USD1 創世盛典

Anyscale 的 Ray Serve LLM 更新為 vLLM WideEP 部署啟用了 DP 群組容錯功能，降低了分散式 AI 推理系統的停機風險。（閱讀Anyscale 的 Ray Serve LLM 更新為 vLLM WideEP 部署啟用了 DP 群組容錯功能，降低了分散式 AI 推理系統的停機風險。（閱讀

Ray 2.55 為大規模 AI 模型部署新增容錯功能

來源：BlockChain News

2026/04/03 02:35

閱讀時長 5 分鐘

分享

Raydium

RAY$0.5939-3.86%

如需對本內容提供反饋或相關疑問，請通過郵箱 crypto.news@mexc.com 聯絡我們。

Ray 2.55 為大規模 AI 模型部署新增容錯功能

Joerg Hiller 2026年4月2日 18:35

Anyscale 的 Ray Serve LLM 更新為 vLLM WideEP 部署啟用了 DP 群組容錯功能,降低了分散式 AI 推理系統的停機風險。

Ray 2.55 為大規模 AI 模型部署新增容錯功能

Anyscale 發布了其 Ray Serve LLM 框架的重大更新,解決了執行大規模 AI 推理工作負載的組織所面臨的關鍵營運挑戰。Ray 2.55 為 vLLM Wide Expert Parallelism 部署引入了資料平行(DP)群組容錯功能——這項功能可防止單一 GPU 故障導致整個模型服務叢集停擺。

此更新針對專家混合(MoE)模型服務中的特定痛點。與每個副本獨立運作的傳統模型部署不同,像 DeepSeek-V3 這樣的 MoE 架構會將專家層分片到必須協同工作的 GPU 群組中。當這些配置中的一個 GPU 故障時,整個群組——可能跨越 16 到 128 個 GPU——就會無法運作。

技術問題

MoE 模型將專門的「專家」神經網路分散到多個 GPU 上。例如,DeepSeek-V3 每層包含 256 個專家,但每個標記只啟動 8 個。標記會透過調度和合併操作路由到持有所需專家的 GPU,這些操作需要所有參與的節點保持健康狀態。

以前,單一節點故障會破壞這些集體操作。查詢會繼續路由到受影響群組中倖存的副本,但每個請求都會失敗。恢復需要重啟整個系統。

Ray 如何解決問題

Ray Serve LLM 現在透過群組排程將每個 DP 群組視為原子單元。當一個節點故障時,系統會將整個群組標記為不健康,停止將流量路由到該群組,拆除故障群組,並將其作為一個單元重建。其他健康群組在整個過程中繼續處理請求。

此功能在 Ray 2.55 中預設啟用。現有的 DP 部署不需要更改程式碼——框架會自動處理群組級別的健康檢查、排程和恢復。

自動擴展也遵守這些界限。擴展和縮減操作以群組大小為增量進行,而不是以個別副本為單位,從而防止建立無法處理流量的部分群組。

營運影響

此更新帶來了一個重要的設計考量:群組寬度與群組數量的對比。根據 Anyscale 引用的 vLLM 基準測試,在專家平行大小為 32、72 和 96 時,每個 GPU 的吞吐量保持相對穩定。這意味著營運人員可以在不犧牲效率的情況下調整為更小的群組——而更小的群組意味著故障發生時影響範圍更小。

Anyscale 指出,這種編排層級的彈性補充了 vLLM 社群中正在進行的引擎層級彈性工作。vLLM Elastic Expert Parallelism RFC 解決了執行時如何動態調整群組內拓撲的問題,而 Ray Serve LLM 則管理哪些群組存在並接收流量。

對於大規模部署 DeepSeek 風格模型的組織來說,實際好處很明確:GPU 故障成為局部事件,而非全系統性的停機。程式碼範例和重現步驟可在 Anyscale 的 GitHub 儲存庫中取得。

圖片來源:Shutterstock

Ray
vLLM
AI 基礎設施
機器學習
分散式運算

市場機遇

Raydium 圖標

Raydium實時價格 (RAY)

$0.5939

$0.5939$0.5939

-5.11%

USD

Raydium (RAY) 實時價格圖表

只要一分鐘，20 USDT 免費拿！

只要一分鐘，20 USDT 免費拿！

只要一分鐘，20 USDT 免費拿！

充值 $100，多拿 $300 GOLD 倉位！

免責聲明: 本網站轉載的文章均來源於公開平台，僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利，請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證，並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考，不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

BlackRock ETH 拋售引發華爾街疑慮

BlackRock ETH 拋售引發華爾街疑慮

貼文《BlackRock ETH拋售引發華爾街質疑》出現在BitcoinEthereumNews.com上。BlackRock拋售超過5000萬美元的Ethereum，ETH ETF出現4200萬美元資金流出

BitcoinEthereumNews2026/04/05 13:48

美國救出飛行員，川普與以色列在截止日期前對伊朗施壓

美國救出飛行員，川普與以色列在截止日期前對伊朗施壓

美國總統唐納德·川普先前曾威脅若伊朗不滿足其要求將攻擊伊朗發電廠,現告知伊朗其達成協議結束的最新期限

Rappler2026/04/05 14:04

DeFi 的文藝復興：AI 審計正重啟大實驗時代

DeFi 的文藝復興：AI 審計正重啟大實驗時代

AI 正以驚人速度降低安全成本，從 2020 年 DeFi Summer 留下的心理創傷中走出。新一代 AI […] 〈DeFi 的文藝復興：AI 審計正重啟大實驗時代〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

Blocktempo ZH2026/04/05 13:50

1,500,000 WLFI 靜待領取

1,500,000 WLFI 靜待領取

1,500,000 WLFI 靜待領取

越早投入收益越高，質押 USD1 賺 WLFI！

熱門新聞

Swift、Chainlink 解鎖跨鏈金融

Swift 攜手 Chainlink 和主要銀行達成區塊鏈互通性里程碑

ZETA 上漲 +10.55%,BTC +0.00%,Zebec Network 成為今日代幣 – 2026 年 4 月 5 日每日市場更新 | CoinCodex

聯準會預計維持利率不變，市場完全排除 2026 年降息可能 – Bitcoin News

比特幣水龍頭 16 年後重開！Jack Dorsey 旗下 Block 4/6 上線 btc.day 擬送 100 萬美元 BTC

實時快訊

比特幣對照 1972 年的黃金走勢。型態顯示先上漲、回調，然後可能再度飆升。強調耐心等待。

作者：無名先生16:36

加密市場情緒持續低迷；用戶對於長期的低迷行情與投資虧損感到挫折與不滿。

作者：Rockerfeller16:21

巨鯨正積極尋找新的山寨幣機會，這表明市場關注與投資焦點可能正在發生轉移。

作者：CRYPTO THRO15:39

比特幣周期在新的熊市底部後重置，顯示潛在的市場階段轉換。

作者：Mags15:31

SIREN 今日位居熱門趨勢代幣榜首，顯示市場關注度與交易活躍度明顯提升。

作者：Nehal14:19

快速閱讀

Cardano (ADA) 最新價格：最新市場動態

Cardano (ADA) 看漲價格預測

XRP 2026年價格預測：能否重回歷史高點？機構、分析師全面解讀

BEEG是什麼意思？起源、用例和生態系統

BEEG是什麼？2026最新版完整指南

加密貨幣價格

比特幣圖標

比特幣

BTC

$66,847.29$66,847.29

-0.80%

Stakestone 圖標

Stakestone

STO

$0.21364$0.21364

+18.96%

以太幣圖標

以太幣

ETH

$2,037.38$2,037.38

-0.90%

Solana 圖標

Solana

SOL

-1.72%

SIREN 圖標

SIREN

SIREN

+3.73%

$30,000 等值 PRL + 15,000 USDT

$30,000 等值 PRL + 15,000 USDT

$30,000 等值 PRL + 15,000 USDT

充值並交易 PRL，即可提升您的獎勵！