omniture

一级片在线播放-国产高清不卡-男女黄色片-国产精品黄色片-亚洲在线视频观看-日韩欧美偷拍-亚洲va在线-君岛美绪在线-69av在线播放-久久精品a-总裁憋尿呻吟双腿大开憋尿-成年人免费观看视频网站-人妻巨大乳hd免费看-在线观看中文字幕2021-比利时xxxx性hd极品

詳解:本土AI超節(jié)點元腦SD200如何率先實現(xiàn)token生成速度8.9ms

2025-11-10 11:19

北京2025年11月10日 /美通社/ -- 近日,在2025人工智能計算大會上,浪潮信息公布,基于元腦SD200超節(jié)點AI服務(wù)器,DeepSeek R1大模型token生成速度僅需8.9毫秒,創(chuàng)造國內(nèi)大模型最快token生成速度。


元腦SD200創(chuàng)新設(shè)計滿足低延遲推理需求

智能體時代的標志性特征是多模型協(xié)同與實時決策,每個智能體具備感知-決策-執(zhí)行的閉環(huán)能力,涉及復(fù)雜的、多步驟的工作流,需要任務(wù)分解、自主決策以及持續(xù)的規(guī)劃和執(zhí)行。在智能體推理的過程中,即使是單個推理步驟中的延遲也會在多步驟任務(wù)中被指數(shù)級放大,導致用戶體驗遲滯。因此,token生成速度正成為影響用戶評價的一個關(guān)鍵指標。

元腦SD200超節(jié)點AI服務(wù)器基于高帶寬、低延時、原生內(nèi)存語義的開放總線協(xié)議,通過構(gòu)建高性能交換單元打造3D Mesh高性能互連超擴展系統(tǒng),支持64張本土AI芯片高密度算力擴展,能夠很好地滿足DeepSeek等大模型的低延遲推理需求,加快token生成速度。


  • 精簡互連協(xié)議:采用事務(wù)層-數(shù)據(jù)鏈路層-物理層三層精簡互連協(xié)議,事務(wù)層天然支持Load/Store內(nèi)存語義;數(shù)據(jù)鏈路層支持基于信用的流控機制和鏈路級錯誤重傳保障;物理層建立10-12低誤碼率的高可靠物理通道,報文有效數(shù)據(jù)利用率達成96%以上。
  • 全局統(tǒng)一編址:為解決跨主機域通信難題,設(shè)計獨立于主機域的交換域全局地址空間,將多個獨立主機域下的GPU在交換域進行統(tǒng)一的顯存編址,為GPU互訪提供基礎(chǔ)保障。
  • 全局地址映射與數(shù)據(jù)路由:創(chuàng)新研發(fā)影子設(shè)備技術(shù),通過影子設(shè)備將遠端GPU映射到本地主機域,實現(xiàn)所有獨立主機對全局GPU的顯存訪問,通過端口高效轉(zhuǎn)發(fā)技術(shù)實現(xiàn)跨主機P2P訪問。


定制通信算法深度適配元腦SD200

除了硬件方面的創(chuàng)新,浪潮信息AI團隊也針對DeepSeek、Kimi等模型的計算特征和元腦SD200的硬件架構(gòu)特征,完成了通信庫、計算框架層面等多方面的優(yōu)化,充分發(fā)揮了元腦SD200的計算性能,最終實現(xiàn)了低延遲推理。同時,也支持預(yù)填充-解碼 (Prefill-Decode) 分離推理,在滿足客戶業(yè)務(wù)場景SLO需求的基礎(chǔ)上提供更高性能。

通信庫層面,針對Allreduce、Allgather、Alltoall等典型通信算子,浪潮信息制定了與元腦SD200深度適配的通信算法。例如,對于Allreduce,為了充分發(fā)揮元腦SD200的低延遲優(yōu)勢,專為Allreduce設(shè)計了分層算法策略:針對小數(shù)據(jù)量,采用全量收集,本地規(guī)約的低延遲定制One-Shot算法,旨在最小化GPU間的同步與通信開銷;針對大數(shù)據(jù)量,采用高吞吐的定制化環(huán)形算法,以徹底解決帶寬瓶頸并實現(xiàn)最優(yōu)帶寬利用率。而對于模型應(yīng)用中最常見的中等數(shù)據(jù)量,則采用兼顧延遲與帶寬的定制Two-Shot算法。浪潮信息更結(jié)合芯片緩存特性對此核心場景進行了深度優(yōu)化:對中小數(shù)據(jù)量啟用無緩存方案以追求極致延遲;對中大數(shù)據(jù)量則啟用緩存方案,從而最大化吞吐效率。

實測數(shù)據(jù)表明,在64 GPU集群上進行DeepSeek R1 671B模型的BF16推理時,針對Batch Size為1的decode階段(其Allreduce數(shù)據(jù)量約為14 KB),優(yōu)化后的算法將通信時延降低了5.8倍。此外,在16 KB至16 MB這一核心數(shù)據(jù)量區(qū)間內(nèi),定制優(yōu)化算法的通信時延相較于未優(yōu)化前的實現(xiàn)降低了1.6至5.8倍;與傳統(tǒng)scale-out系統(tǒng)相比,時延降低幅度則進一步擴大至4.5至12.7倍。

全方位框架優(yōu)化保障計算低延遲

框架層面,浪潮信息AI團隊完成了并行方式、算子融合、多流水線等多方面優(yōu)化,來保證計算的低延遲。

首先,在并行方式上,選擇了整網(wǎng)的張量并行。在此并行模式下,通過模型均勻切分實現(xiàn)了設(shè)備間計算負載的完全均衡、各個計算板卡之間計算的完全并行和同步,消除了流水線氣泡與負載不均衡問題。同時,元腦SD200的高帶寬、低延遲確保了AllReduce、AllGather等通信算子性能的大幅提升,使得通信時間大幅下降,從而實現(xiàn)了超低延遲的推理性能。

其次,在算子上,實現(xiàn)了極致的算子融合等優(yōu)化。GPU的計算速度遠遠超過了內(nèi)存帶寬的訪問速度,從內(nèi)存中讀寫數(shù)據(jù)的時間成本,大部分時候比實際進行計算的時間成本還要高。算子融合可以通過減少不必要的內(nèi)存讀寫和計算開銷,來顯著提升推理速度、降低延遲并減少內(nèi)存占用,所以基于SGlang框架的已有實現(xiàn),進行了多個算子的融合。

  • 對MLA模塊中attn_mla計算前的算子進行融合,該融合算子以Query和Key向量進行RMSnorm計算后的輸出為輸入,以attn_mla計算的輸入q_input、k_input、v_input等為輸出,包含bmm計算、rotary_emb計算以及向量拆分轉(zhuǎn)置等計算;
  • RMSNorm和add計算融合;
  • 實現(xiàn)int8精度的量化和RMSNorm、silu等激活函數(shù)的融合;
  • 將路由專家分組選擇中多個算子的融合為一個算子。

最后,也進行了多stream的優(yōu)化。多個算子計算時,默認在單stream模式下,所有操作都排成一條隊,一個接一個地執(zhí)行。當算子本身的計算量不是很大時,會導致GPU的部分硬件單元在計算時處于空閑狀態(tài),也就浪費了計算資源。多stream優(yōu)化就是為了讓這些硬件單元"同時忙起來",對于相互之間沒有依賴關(guān)系的操作,可以放到不同的stream中并行執(zhí)行,提高硬件的利用效率,同時減小整體的計算時間。在多stream并行優(yōu)化方面,浪潮信息實現(xiàn)了MLA層的多個layernorm計算的并行,并實現(xiàn)了MoE階段和共享專家計算和路由專家分組選擇的并行等,實現(xiàn)了約10%的性能提升。

預(yù)填充-解碼分離軟件提高整體計算性能

此外,浪潮信息開發(fā)了預(yù)填充-解碼 (Prefill-Decode) 分離軟件,針對預(yù)填充與解碼不同的計算特性,使用不同的并行計算策略、硬件配置等,提高系統(tǒng)整體的計算性能。同時在業(yè)務(wù)部署中,支持節(jié)點服務(wù)的動態(tài)擴展;支持利用負載均衡和鍵值緩存(KV cache)命中率進行任務(wù)分配,把任務(wù)下發(fā)到鍵值緩存匹配度相對較高、任務(wù)負載相對較小的節(jié)點,減少重復(fù)計算,同時最大化計算資源利用率。另外,PD分離軟件還實現(xiàn)了鍵值緩存offload技術(shù),可把鍵值緩存到CPU端內(nèi)存與分布式存儲系統(tǒng)上,增大緩存空間。


元腦SD200超節(jié)點AI服務(wù)器通過高帶寬和超低延遲通信、超大顯存池、智能路由優(yōu)化、PD分離推理等創(chuàng)新技術(shù),大幅提升了DeepSeek、Kimi等大模型的推理輸出速度。元腦SD200搭載64張本土AI芯片運行DeepSeek R1大模型,當輸入長度為4096、輸出長度為1024時,單用戶token生成達到112 tokens/s,每token生成時間僅為8.9ms,率先實現(xiàn)國內(nèi)AI服務(wù)器token生成速度低于10ms,將推動萬億參數(shù)大模型在金融、科研、智能制造等領(lǐng)域快速落地。

消息來源:浪潮信息
免费av在线 | 久久久久久电影 | 91网站在线免费观看 | 丰满岳跪趴高撅肥臀尤物在线观看 | 国产男男gay体育生白袜 | 麻豆视频免费看 | 久久精品视频免费观看 | 91欧美精品 | 日韩无码专区 | 91在线视频免费观看 | 综综综综合网 | 久久午夜电影 | 国产伦精品一区二区三区 | 国产女人高潮毛片 | 久久久久伊人 | 国产精彩视频 | 国产91白丝在一线播放 | 国产成人精品免费视频 | 人妻精品久久久久中文字幕69 | www国产| 欧美无遮挡 | 欧美视频在线观看 | 亚洲小说春色综合另类电影 | 三级网站在线 | 影音av资源 | 国产a毛片 | 嫩草嫩草嫩草 | 午夜999 | 日韩免费看 | 亚洲人午夜射精精品日韩 | 国产九色| 国产免费视频 | 在线观看免费黄色 | 色翁荡息又大又硬又粗又爽 | 久久久久成人精品免费播放动漫 | 在线免费观看黄色 | 黄色av免费 | 成年人视频在线免费观看 | 黄色在线观看免费 | 日韩欧美色| 日韩精品久久 | 成人av一区 | 中文字幕日本在线 | 91导航| 日韩欧美一级片 | 国产精品久久久久久久久动漫 | 日本xxxxxⅹxxxx69| 最近中文字幕在线观看 | 久久免费电影 | 欧美久久久久久久 | 国产精品一区二区三区免费 | 97人妻精品一区二区三区软件 | 中文字幕人妻一区 | 蜜臀av在线观看 | 91成人在线视频 | 中文字幕一区二区三区乱码 | 亚洲精品久久久久久久久久久 | 人人插人人射 | 日本少妇高潮抽搐 | 在线观看污 | 中文字幕国产精品 | 一本色道久久综合 | 成人激情五月天 | 亚洲一区自拍 | 高清国产mv在线观看 | 苏晴忘穿内裤坐公交车被揉到视频 | 黄色片一级片 | 涩涩视频在线 | 国模一区二区三区 | 久久精品噜噜噜成人 | 91超碰在线观看 | 亚洲高清av | 四虎精品 | 闷骚老干部cao个爽 91中文 | 蜜臀在线视频 | 成年人视频网站 | 欧美激情网址 | 在线欧美日韩 | 久久久电影| 免费高清av | 波多野结衣一区 | 国产稀缺真实呦乱在线 | 天天射视频| 亚洲一区二区在线 | 人妻丰满熟妇aⅴ无码 | 国产理论片在线观看 | 亚洲小说春色综合另类电影 | 乳女教师の诱惑julia | 色综合一区 | 免费a级 | 大尺度做爰床戏呻吟舒畅 | 超碰在线 | 日韩精品在线免费观看 | 波多野结衣电影免费观看 | 中文字幕一区在线观看 | 人妻一区二区三区四区 | 韩国三级中文字幕hd久久精品 | 成人激情综合网 | 你懂得在线 | 久青草视频 | 国产精品tv| aaa级片 | 国产视频一区在线观看 | 日韩综合在线 | 天天干天天拍 | 国产视频一二三区 | 日韩精品一区二区在线观看 | 精品一区视频 | 欧美日韩大片 | av黄色在线观看 | 韩国大尺度电影在线观看 | 精品第一页 | 日本久久久久久久 | 91免费看视频 | a黄色片| 日本中文字幕在线 | 麻豆免费在线观看 | 最新中文字幕在线 | 91在线观看免费高清 | 在线观看欧美日韩视频 | 久久久久女人精品毛片九一 | 全部免费毛片在线播放高潮 | 国产精品你懂的 | 麻豆射区 | 国产毛片毛片 | 妖精视频在线观看 | 四虎成人网 | 极度诱惑香港电影完整 | 亚洲同性gay激情无套 | 亚洲免费精品 | 欧美人性生活 | 天天拍天天干 | 亚洲三级电影 | 欧美日韩一二三区 | 一本大道久久久久精品嫩草 | 免费在线看a | 91天堂在线 | 色男人的天堂 | 亚洲一区中文字幕 | 欧美成人毛片 | 亚洲一区二区三区在线视频 | 欧美一级在线 | 一区二区视频在线观看 | 欧美精品乱码视频一二专区 | 男生操女生网站 | 中文字幕欧美人妻精品一区蜜臀 | 日韩在线视频播放 | 九九国产| 九九精品免费视频 | 麻豆传媒在线看 | 中文字幕在线视频观看 | 狠狠操天天操 | 亲女小嫩嫩h乱视频 | 中文字幕乱妇无码av在线 | 亚洲精品资源 | 日韩欧美亚洲 | 国产免费一级片 | 成人激情视频 | 日本理论片午伦夜理片在线观看 | 久久久电影 | 91成人精品 | 91美女视频 | 女性裸体下面张开 | 手机在线免费观看av | 久久精品一区 | 秘密的基地 | 老妇高潮潮喷到猛进猛出 | 亚洲三级av | 美女黄色免费网站 | 国产精品久久久午夜夜伦鲁鲁 | 国产精品91视频 | 国产在线网站 | 光明影院手机版在线观看免费 | 午夜少妇| 麻豆久久久 | 天堂在线 | 亚洲视频在线看 | 成人av一区二区三区 | 日韩综合av | 国产一二三四区 | 欧美色图网站 | 高清乱码毛片入口 | 视频一区在线观看 | 3p在线观看| 在厨房拨开内裤进入毛片 | 狠狠操狠狠操 | 国产伦精品一区二区三区免费视频 | 丁香花电影免费播放在线观看 | 给我看免费高清在线观看 | 美剧19禁啪啪无遮挡大尺度 | www一区二区 | 日本裸体视频 | 粗大的内捧猛烈进出 | 黄色网址在线播放 | 高h视频在线观看 | 欧美乱妇狂野欧美在线视频 | 天天爽天天爽 | 一本色道综合久久欧美日韩精品 | 欧美精品在线播放 | 国产成人无码一区二区在线观看 | 美女久久 | 中文字幕中文字幕一区 | 黄色精品 | 污网站免费看 | 亚洲免费在线观看视频 | 国产电影一区二区三区 | 一级片日本 | 男人操女人网站 | 日韩高清国产一区在线 | 亚洲午夜精品久久久久久人妖 | 91导航| 色欲狠狠躁天天躁无码中文字幕 | 亚洲爱爱视频 | 91在线观看视频 | 中文字幕一区二区三区四区 | 91在线网站 | 暖暖爱免费观看高清在线遇见你 | 高跟肉丝丝袜呻吟啪啪网站av | 两性囗交做爰视频 | 成人av免费 | 婷婷久久五月天 | 久久久精品一区二区涩爱 | 国产一区视频在线 | 欧美呦呦 | 人妻饥渴偷公乱中文字幕 | www.蜜桃视频 | www国产视频 | 999在线视频 | 国产精品一区二 | 国产午夜精品久久久 | 色综合av | 国产精品毛片久久久久久久 | 日本国产视频 | 日日夜夜精品视频 | 中文字幕码精品视频网站 | 亚洲av无一区二区三区久久 | 天天干天天做 | 久久精品国产精品 | 国产在线小视频 | 狠狠干狠狠撸 | 成人免费在线电影 | 特级特黄aaaa免费看 | av在线免费观看网址 | 国产av一区二区三区 | 黄网站免费看 | 在线观看污 | 久久精品小视频 | 宝贝乖h调教灌尿穿环 | 在线看国产 | 99在线观看 | 粗大黑人巨茎大战欧美成人免费看 | 亚洲av激情无码专区在线播放 | 97精品国产露脸对白 | av自拍| 精品久久久久久久久久久久久久 | 做爰无遮挡三级 | 无码免费一区二区三区 | 蜜臀久久精品久久久久 | 911视频高清完整版在线观看 | 日韩三级在线观看 | 欧美性天天影院 | 处女朱莉 | 国产无精乱码一区二区三区 | 1000部做爰免费视频 | 老妇高潮潮喷到猛进猛出 | 国产一区久久 | 天堂中文| 国产成人+综合亚洲+天堂 | www.香蕉视频 | 欧美日韩在线一区二区 | 日韩在线免费观看视频 | 荫蒂被男人添免费视频 | 成人精品一区二区三区中文字幕 | xxx性欧美 | 福利片在线观看 | 夜色在线影院 | 污视频在线免费观看 | 成人免费看片视频 | 亚洲综合免费观看高清完整版 | 色就是色欧美 | 日韩福利 | 国产日韩一区二区三区 | 华丽的外出在线 | 无码一区二区三区 | 一级片久久| 日本少妇裸体做爰 | 人人爽人人| 国产成人无码一区二区在线观看 | 国产成人无码一区二区在线观看 | 免费在线观看黄 | 欧美色图第一页 | 天天干,夜夜操 | 性一交一乱一区二区洋洋av | 成人免费小视频 | 久久这里有精品 | 超碰在线 | 色导航 | 嫩草嫩草嫩草嫩草 | 国产三级做爰高清在线 | 黄色资源网 | 丰满肥臀噗嗤啊x99av | 欧美91视频| 艳妇臀荡乳欲伦交换h漫 | 国产成人免费 | 不卡在线 | av一二三| 在线观看国产精品入口男同 | 黄色片免费观看 | 天天操夜夜撸 | 免费观看黄色网址 | 成人免费高清视频 | 免费看女生隐私 | 婷婷中文字幕 | 99精品99| 91麻豆精品国产91久久久久久 | 无码精品一区二区三区在线播放 | 香蕉综合网 | 美女爆吸乳羞羞免费网站妖精 | 72种无遮挡啪啪的姿势 | 午夜高清 | 成人免费视频网站在线看 | 奇米影视大全 | 男男做性免费视频网 | 怡红院视频 | 特黄视频| 波多野结衣在线电影 | 国产精品国产精品国产专区不卡 | 亚洲精品99 | 日韩一二三区 | 美国毛片基地 | 欧美黄页 | 国产十八熟妇av成人一区 | 日本丰满少妇 | 黄色一级生活片 | 日本理论片午伦夜理片在线观看 | 欧美日韩高清在线 | 亚洲资源在线观看 | 91好色先生 | 成人精品一区二区三区 | 小泽玛利亚在线 | 日韩欧美在线一区 | 欧美老肥婆性猛交视频 | 一区二区三区久久久 | 国产免费av在线 |