国产精品久久人妻互换,亚洲乱码av中文一区二区,亚洲国产精品第一区二区,大地资源二中文在线观看官网,免费看毛片

12月11日面壁智能宣布公司完成新一輪數(shù)億元融資,本輪融資后,面壁智能將進一步提速以端側AI為代表的高效大模型商業(yè)化布局,面壁智能CEO李大海表示,更高知識密度的小模型和端側智能,成為大模型發(fā)展的新階段。如今,因為端側智能發(fā)展的深刻影響,主流消費電子和新興硬件正演變成一個個在不同場景、執(zhí)行特定任務的超級智能體,成為新一輪科技創(chuàng)業(yè)大風口。

隨著AI PC和AI手機的推出以及Apple Intelligence等產(chǎn)品不斷改進,以及其他在小型語言模型上運行的應用程序正在形成,一部分AI查詢會在邊緣或設備上進行處理,Barclays最新的一篇AI推理計算的未來發(fā)展趨勢報告指出,邊緣查詢從2024年總查詢的1%上升到2025年的10%。估計到2026年,將有15%的查詢在終端設備上進行,到2028年約為25%,一些專家估計,未來端側AI的占比預計會增長至50%。

隨著大模型能力持續(xù)增強,應用場景持續(xù)突破,大模型應用架構也逐漸清晰,其中在應用層中agent成為業(yè)內(nèi)關注的焦點,智能體是大模型能力的擴展,彌補大模型在操作和執(zhí)行方面的不足,具備記憶、搜索、規(guī)劃、決策、執(zhí)行等能力。

Barclays的最新報告認為,目前AI行業(yè)發(fā)展的處于Chatbot及Copilot時代,2025—2026年即將迎來agent時代。12月11日谷歌發(fā)布最新模型Gemini 2.0的同時推出了一系列agent,智能體正成為大模型的下一站。

端側大模型和智能體正成為AI的新階段,未來AI算力需求或?qū)⒂瓉硇伦兓?。Barclays的最新報告認為推理計算將逐漸主導AI算力需求。隨著像GPT-5這樣的大型語言模型和新的AI基礎設施(如NVIDIA Blackwell GPU)的出現(xiàn),AI應用,尤其是agent系統(tǒng),將迎來爆發(fā)式增長,消費者和企業(yè)人工智能市場可能會真正開始騰飛。

報告預測,隨著agent系統(tǒng)推出,很大一部分計算可能會轉移到對這些服務的推理上,約占推理市場的30%。隨著采用的增加,整體推理可能會超過訓練計算,報告預測,到2026年,如果消費者AI采用率超過10億DAU,agent在企業(yè)任務滲透率超過5%,那么所需的總計算量約為1500億EFLOPs,其中推理計算將占近75%,訓練計算占25%。

基于企業(yè)級agent的采用估計,企業(yè)推理需求的計算量在2026年約為50億EFLOPs,隨著B200從明年開始安裝,H100應該用于企業(yè)推理,報告估計只有未滿足的30億EFLOPs企業(yè)推理需求需要在2026年使用新芯片。

企業(yè)推理需求的計算量在2026年約為 50億EFLOPs

企業(yè)推理需求的計算量在2026年約為 50億EFLOPs

NVIDIA GPU目前占據(jù)推理市場約80%的份額,但到2028年這一比例將下降至約50%,主要原因是最大型的超大規(guī)模云服務商都在定制構建定制ASIC(亞馬遜的Inferentia、Meta的MTIA、谷歌TPU v6、Grok和其他),報告預測ASIC芯片市場份額將持續(xù)增長,到2028年,這些ASIC可以處理高達40%的消費者推理計算。

定制ASIC芯片上推理工作負載比例的增加,預計將進一步降低每token的單位成本,推理單元成本(每百萬tokens)正以每18個月超過90%的速率持續(xù)下降。不過,報告指出,單位成本的降低并沒有導致產(chǎn)能過剩,而是帶來了更多的使用,刺激了更多AI產(chǎn)品的開發(fā)和應用,從而增加了對算力的總需求。

定制ASIC芯片上推理工作負載比例的增加

定制ASIC芯片上推理工作負載比例的增加

此外,市場對算力相關資本支出的估計過低,Barclays的半導體研究團隊預測,到2026年,僅AI芯片相關的資本支出就需要近3000億美元,這比市場共識預測高出370%以上,如果將其他計算和數(shù)據(jù)中心資產(chǎn)的資本支出考慮在內(nèi),總資本支出可能高達7000億美元。

到 2026 年,僅 AI 芯片相關的資本支出就需要近 3000 億美元

到 2026 年,僅 AI 芯片相關的資本支出就需要近 3000 億美元

端側大模型算力需求方面,報告認為,雖然端側AI可以處理一部分AI查詢,但占比相對較小,由于設備的算力、內(nèi)存和功耗限制,大型語言模型難以在端側有效運行,云端數(shù)據(jù)中心仍將是滿足AI算力需求的主力軍。

明年端側大模型和AI智能體將會迎來怎樣的發(fā)展,agent時代將如何重塑計算需求?11月19日,第十九屆中國IDC產(chǎn)業(yè)年度大典,中國工程院院士鄔賀銓將帶來《端側大模型與AI智能體》的主旨演講。大會聚焦“智算崛起”“賦能協(xié)同”“環(huán)球布局”“誰主沉浮”“算力新十年”幾大議題模塊,歡迎掃描以下二維碼即可報名。

“多元重構 算力躍遷” 第十九屆中國IDC產(chǎn)業(yè)年度大典 報名二維碼

“多元重構 算力躍遷” 第十九屆中國IDC產(chǎn)業(yè)年度大典 報名二維碼

關注中國IDC圈官方微信:idc-quan 我們將定期推送IDC產(chǎn)業(yè)最新資訊

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高興

  • 震驚

  • 憤怒

  • 無聊

  • 無奈

  • 謊言

  • 槍稿

  • 不解

  • 標題黨
2025-04-30 10:25:31
國內(nèi)資訊 總投資超31億元,通榆云針5000P智算中心項目一期建設即將投產(chǎn)
該項目全面投運后預計年營收約15億元,年納稅1.1億元,新增就業(yè)崗位500個 <詳情>
2025-03-12 10:43:07
國際資訊 “星際之門”重要進展:即將安裝6.4萬張GB200
2025年3月10日,預算高達5000億美元的“星際之門“項目傳來新消息:Nvidia將為位于美國德克薩斯州阿比林市的“星際之門”一號站提供64,000個GB200 AI芯片。這些芯片將分階 <詳情>
2025-03-12 10:22:00
國內(nèi)資訊 智算中心還是不夠——兩會熱議AI,落點還在算力
理所當然的,AI成為了今年兩會上最熱門的產(chǎn)業(yè)話題。諸位代表各抒己見,從不同角度提出了高瞻遠矚的建言。但無論如何發(fā)展,AI的發(fā)展還是離不開算力的支撐,也是當前我國AI產(chǎn) <詳情>
800V HVDC落地 將給智算中心帶來什么改變?
2025-10-24 16:09:41
全球智慧·全鏈驅(qū)動 維諦技術AIDC技術研討會華西站
2025-10-24 11:19:00
寶德易主 國產(chǎn)化、自主化算力產(chǎn)業(yè)生態(tài)如何發(fā)展?
2025-10-23 16:48:00
重磅!廣東印發(fā)人工智能賦能制造業(yè)高質(zhì)量發(fā)展行動方案(2025—2027年)
2025-10-23 16:45:21
總投資9.5億元,湖北移動襄陽云計算中心數(shù)字信息化服務項目開工
2025-10-23 16:43:00
“美式”算電協(xié)同:智算中心“自供電”成必選
2025-10-22 15:34:28
總投資113億元,中國建設銀行貴州貴安數(shù)據(jù)中心項目一期工程全面封頂
2025-10-22 15:31:13
數(shù)道智算智能算力調(diào)度平臺于京蒙兩地正式搭建完成
2025-10-22 09:36:31
從概念愿景到工程就緒:維諦攜手NVIDIA推進800 VDC 平臺設計,助力下一代AI工廠建設
2025-10-21 16:36:00
寧聚算力,奔赴皖江 2025寧夏算力產(chǎn)業(yè)鏈供需對接活動合肥站即將啟幕
2025-10-21 16:01:45
突發(fā)!AWS服務器大規(guī)模故障 多個全球性平臺癱瘓
2025-10-21 16:00:00
城域算力中心互聯(lián)時延<1毫秒 工信部啟動城域“毫秒用算”專項行動
2025-10-21 15:57:37
600個10KW機架!??诮瓥|綜合機房樓項目全面啟動建設
2025-10-21 15:54:11
綠色發(fā)展驅(qū)動格局重塑,數(shù)據(jù)中心邁向“全生命周期”降碳新紀元
2025-10-21 14:32:00
【數(shù)字匠人】鷹碩集團陳東明:聚焦“東數(shù)西算”,構建國產(chǎn)化算力生態(tài)
2025-10-20 14:01:01