综合网在线视频,亚洲精选久久久,又色又爽又激情的59视频,日韩天堂av,国产精品videos,99r在线视频,久久久久久久97

當前位置:職教網 ☉ 專業(yè)信息 ☉ 其它 ☉ 其它 ☉ 昇騰生態(tài)硬核賦能!上交大攻克超長推理難題
昇騰生態(tài)硬核賦能!上交大攻克超長推理難題
求鑒定:更多分享
發(fā)布時間:2025-11-27   到期時間:長期有效   瀏覽:2
舉報信息收藏信息

信息管理:置頂修改信息

  • 信息詳情
  • 留言點評

隨著大語言模型在文本分析、智能問答等場景的廣泛應用,處理1M超長文本推理時,常常面臨顯存不足、運算速度卡頓的行業(yè)痛點,嚴重限制了超長文本場景的應用。近日,上海交通大學李健教授團隊依托上海交通大學 鯤鵬昇騰科教創(chuàng)新卓越中心的算力支持,基于vLLM-Ascend 推理框架研發(fā)出一套針對超長上下文推理的稀疏注意力 KV Cache 分層緩存管理系統(tǒng)。在昇騰 AI 軟硬件平臺的全方位賦能下,該項目成功破解單卡支持超長上下文推理的顯存與性能雙重難題,同時大幅提升吞吐量。

圖片 1

項目核心創(chuàng)新在于設計了 KV Cache 分級緩存集成機制。該機制先對推理任務進行實時分析,智能識別Top-K 重要塊并集中算力處理,從源頭提升計算效率;同時采用數據冷熱分層存儲策略,根據數據訪問頻率,將生成數據動態(tài)劃分為高頻熱數據與低頻冷數據,再針對性優(yōu)化存儲位置,減少資源浪費。這一機制的落地依托昇騰CANN異構計算架構靈活的動態(tài)調度能力,能精準控制冷熱數據在顯存與主存間的流轉,大幅降低數據遷移開銷。最終,該方案實現單卡流暢處理超過1M的超長文本推理任務,系統(tǒng)推理吞吐量超過39%,徹底突破傳統(tǒng)系統(tǒng)在長序列處理上的顯存與性能瓶頸。

同時項目進行了元數據結構優(yōu)化與緩存機制設計,其中數據索引與掩碼是關鍵支撐 —— 通過精簡索引結構、合并掩碼維護步驟,有效減少重復運算,使昇騰NPU算力更集中于注意力計算與文本生成等核心任務,提升硬件利用效率。相關優(yōu)化已通過vLLM-Ascend推理框架靈活集成,保障了技術方案的順利落地。

目前,該項目源代碼已在 Gitee 社區(qū)中開源,后續(xù)將進一步推送到昇騰開源生態(tài),合入GitHub社區(qū) vLLM-Ascend 項目專區(qū)。此次技術突破,不僅為超長文本推理提供了高效解決方案,更印證了昇騰生態(tài)在AI創(chuàng)新中的賦能價值。未來,隨著該系統(tǒng)在更多行業(yè)場景的落地,昇騰將持續(xù)為AI技術研發(fā)提供算力與技術保障,推動大語言模型在長文本分析、智能辦公、數字孿生等千行百業(yè)的深度應用,加速人工智能產業(yè)化進程。

聯系我時請說明是在“職教網www.yyk001.com”看到的,謝謝!

網站簡介-聯系我們-合作洽談-廣告服務-免責申明-隱私保護- 學校動態(tài)-SiteMap-返回首頁
回到頂部