C114通信網(wǎng)  |  通信人家園

人工智能
2025/2/28 11:06

DeepSeek 開源進(jìn)度 5/5:高性能并行文件系統(tǒng) 3FS 實(shí)現(xiàn)聚合吞吐 6.6 TiB/s

IT之家  故淵

DeepSeek 在開源周第五天發(fā)布了 3FS(Fire-Flyer File System),這是一個(gè)專為充分利用現(xiàn)代 SSD 和 RDMA 網(wǎng)絡(luò)帶寬而設(shè)計(jì)的并行文件系統(tǒng),具備驚人的數(shù)據(jù)訪問(wèn)性能,為深度學(xué)習(xí)等數(shù)據(jù)密集型應(yīng)用提供了強(qiáng)大的支持。

IT之家附上開源地址:https://github.com/deepseek-ai/3FS。

基于 3FS 的數(shù)據(jù)處理框架 Smallpond:https://github.com/deepseek-ai/smallpond。

3FS 性能亮點(diǎn)

集群高吞吐:在 180 節(jié)點(diǎn)集群中,3FS 實(shí)現(xiàn)了高達(dá) 6.6 TiB/s 的聚合讀取吞吐量。

基準(zhǔn)測(cè)試優(yōu)異:在 25 節(jié)點(diǎn)集群的 GraySort 基準(zhǔn)測(cè)試中,3FS 達(dá)到了 3.66 TiB / min 的吞吐量。

單節(jié)點(diǎn)高性能:每個(gè)客戶端節(jié)點(diǎn)的 KVCache 查找峰值吞吐量超過(guò) 40 GiB/s。

架構(gòu)先進(jìn): 3FS 采用去中心化架構(gòu),并具備強(qiáng)一致性語(yǔ)義。

3FS 應(yīng)用場(chǎng)景

3FS (Fire-Flyer File System) 是一款高性能的分布式文件系統(tǒng),旨在解決 AI 訓(xùn)練和推理工作負(fù)載帶來(lái)的挑戰(zhàn),利用現(xiàn)代 SSD 和 RDMA 網(wǎng)絡(luò)提供共享存儲(chǔ)層,簡(jiǎn)化分布式應(yīng)用程序的開發(fā)。

其核心優(yōu)勢(shì)在于高性能、強(qiáng)一致性和易用性,能夠有效支持各種 AI 工作負(fù)載,包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)加載、檢查點(diǎn)設(shè)置和推理緩存。

3FS 在 DeepSeek 的 V3 / R1 版本中得到廣泛應(yīng)用,涵蓋了訓(xùn)練數(shù)據(jù)預(yù)處理、數(shù)據(jù)集加載、檢查點(diǎn)保存 / 重新加載、嵌入向量搜索以及推理過(guò)程中的 KVCache 查找等關(guān)鍵環(huán)節(jié)。

Smallpond

此外,DeepSeek 還開源了基于 3FS 的數(shù)據(jù)處理框架 Smallpond,是一款構(gòu)建于 DuckDB 和 3FS 之上的輕量級(jí)數(shù)據(jù)處理框架。它擁有高性能數(shù)據(jù)處理能力,可擴(kuò)展至 PB 級(jí)數(shù)據(jù)集,并且操作簡(jiǎn)便,無(wú)需長(zhǎng)期運(yùn)行的服務(wù)。

給作者點(diǎn)贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡(jiǎn)介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號(hào)

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141