久久久久久综合精品视频_精品久久午夜电影_a国产激情视频在线观看品善_在线一级视频欧美亚洲

您的位置:首頁 >股票 > 正文

曠視科技發(fā)布全新輕量級 LLM 模型推理框架 InferLLM,助力大模型實現(xiàn)落地


【資料圖】

來源:新浪證券

ChatGPT的火爆出圈讓大家看到了大型語言模型的潛力,多家企業(yè)開始自研大型語言模型,開源社區(qū)也已經(jīng)出現(xiàn)了非常多優(yōu)秀的模型。曠視科技也發(fā)布了全新輕量級 LLM 模型推理框架 InferLLM,助力大模型實現(xiàn)落地。雖然大型語言模型在文案生成、內(nèi)容創(chuàng)作、代碼編程等方面展現(xiàn)了強大能力,但其海量的參數(shù)和巨大的模型體積,讓大語言模型在邊緣端設備上運行仍面臨許多挑戰(zhàn)。為加速大語言模型落地應用,曠視天元開發(fā)了 InferLLM 工程,提供一個比 llama.cpp 更簡單更容易上手的本地部署框架,讓大語言模型在本地或者端上部署成為可能。 曠視天元開源深度學習框架MegEngine是曠視科技自主研發(fā)的國產(chǎn)工業(yè)級深度學習框架,是曠視科技新一代AI生產(chǎn)力平臺Brain++的最核心組件,在2020年3月正式向全球開發(fā)者開源。

曠視科技天元憑借其訓練推理一體、超低硬件門檻和全平臺高效推理3大核心優(yōu)勢,能夠幫助企業(yè)與開發(fā)者大幅節(jié)省產(chǎn)品從實驗室原型到工業(yè)部署的流程,真正實現(xiàn)小時級的轉化能力。曠視天元不斷優(yōu)化,推出了一系列實用功能,降低 AI 算法生產(chǎn)門檻,助力 AI 應用快速落地,其中包括:引入動態(tài)圖顯存優(yōu)化(DTR)技術,大幅減少顯存占用,節(jié)省開發(fā)者硬件成本,用有限硬件資源訓練出更大模型;開源面向計算機視覺應用的流式計算框架MegFlow,開發(fā)者基于MegFlow 提供的視覺解析服務方案,最快 15 分鐘即可完成客制化所需功能,AI 應用落地不再難;開發(fā)出創(chuàng)新性的TracedModule 方案以及 MegEngine Lite,基于曠視科技海量業(yè)務打磨出的模型推理最佳實踐,化解模型轉換部署難題……

除了開源深度學習框架曠視天元外,曠視科技的科研成果包括AI生產(chǎn)力平臺Brain++、AI算法生產(chǎn)平臺AI Service、移動端高效卷積神經(jīng)網(wǎng)絡ShuffleNet等多項創(chuàng)新技術和產(chǎn)品。目前,曠視已在ICCV、CVPR、ECCV 等國際學術會議、期刊上發(fā)表論文200余篇,在各項國際人工智能頂級競賽中累計攬獲 56 項世界冠軍或最高榮譽。

當下,大模型已成為 AI 重要的技術發(fā)展方向。曠視科技一直堅定投入大模型研發(fā),具備領先的大模型原創(chuàng)科研能力。面向未來,曠視科技將積極擁抱多模態(tài)大模型,同時將大模型與硬件結合,面向物聯(lián)網(wǎng)場景打造不同類型的行業(yè)應用。

免責聲明:本文不構成任何商業(yè)建議,投資有風險,選擇需謹慎!本站發(fā)布的圖文一切為分享交流,傳播正能量,此文不保證數(shù)據(jù)的準確性,內(nèi)容僅供參考

關鍵詞:

熱門資訊