雷火競技首頁

騰訊云總裁邱躍鵬:騰訊云已全面適配主流國產(chǎn)芯片

小編

  雷火競技新浪科技訊 9月16日上午消息,今日,在2025騰訊全球數(shù)字生態(tài)大會(huì)上,騰訊集團(tuán)副總裁、騰訊云總裁邱躍鵬表示,騰訊云持續(xù)深度參與并回饋開源社區(qū),同時(shí)依托異構(gòu)計(jì)算平臺(tái)整合多種芯片資源,向外界提供高性價(jià)比的 AI 算力。目前,該平臺(tái)已全面適配主流國產(chǎn)芯片。

  在推理加速方面,騰訊云深入?yún)⑴c開源貢獻(xiàn),向DeepSeek、vLLM、SGLang等社區(qū)提交了多項(xiàng)優(yōu)化技術(shù)。針對(duì)大模型推理面臨的內(nèi)存瓶頸,騰訊云自研并開源FlexKV 多級(jí)緩存技術(shù),大幅降低KVCache的占用,將首字時(shí)延降低多達(dá)70%。

  他提到,騰訊云基礎(chǔ)設(shè)施已覆蓋全球 55 個(gè)可用區(qū),部署 3200 多個(gè)加速節(jié)點(diǎn),為上萬款游戲提供安全防護(hù),在過去一年抵御了同比增長 183% 的 DDoS 攻擊。騰訊云加快國際化布局,并計(jì)劃在日本大阪和沙特新建可用區(qū),目前全球已經(jīng)設(shè)立 9 個(gè)技術(shù)支持中心,并獲得400 多項(xiàng)專業(yè)認(rèn)證。今年,依托適配全球技術(shù)生態(tài)的產(chǎn)品能力和本地化服務(wù),騰訊云完成印尼版“滴滴+美團(tuán)”超大規(guī)模遷移,過程中僅用 5 個(gè)月建成印尼第三可用區(qū)。

  大模型產(chǎn)業(yè)重心從訓(xùn)練到推理的轉(zhuǎn)變,已經(jīng)成為行業(yè)共識(shí)。從騰訊自身的實(shí)踐,我們也看到了同樣的趨勢(shì),同時(shí)客戶對(duì)于使用大模型和建設(shè)Agent迸發(fā)出強(qiáng)烈熱情,這都帶來了推理需求的暴漲。從IDC咨詢公司的數(shù)據(jù)可以看到,Agent也將進(jìn)一步推動(dòng)推理需求的爆發(fā)。這也意味著,我們的AI基礎(chǔ)設(shè)施,也要同步升級(jí)。

  下面想和大家一起探討如何通過AI Infra的升級(jí),來加速Agent的規(guī)?;涞?。

  從技術(shù)角度來看,開源社區(qū)與推理相關(guān)的技術(shù)范式正在快速迭代。騰訊在推理加速上一直有非常多的積累,我們積極參與到社區(qū)貢獻(xiàn)中,共建推理加速技術(shù)生態(tài)。

  今年2月,DeepSeek 一口氣開源了五大代碼庫,為社區(qū)注入了前所未有的活力。其中,專注 GPU 通信的 DeepEP,與我們長期積累的 TRMT技術(shù)方向高度契合。我們?cè)诖嘶A(chǔ)上優(yōu)化了 DeepEP,使其在 IB 網(wǎng)絡(luò)性能提升了 30%,在數(shù)據(jù)中心常用的 RoCE 網(wǎng)絡(luò)環(huán)境中性能更是翻倍。DeepSeek 在社區(qū)公開致謝,并用“huge speedup”形容這次貢獻(xiàn)。

  第二個(gè)重點(diǎn)是 KV Cache 優(yōu)化。隨著大模型參數(shù)規(guī)模激增,推理對(duì)顯存的需求急劇上升。同時(shí),智能客服、代碼助手等場景,對(duì)上下文長度的要求不斷擴(kuò)展,導(dǎo)致推理過程中產(chǎn)生的 KV Cache 線性增長,GPU 顯存成為瓶頸。對(duì)此,我們將KV Cache逐層緩存至內(nèi)存、SSD及云端擴(kuò)展存儲(chǔ),充分利用整個(gè)推理集群節(jié)點(diǎn)上的存儲(chǔ)資源,以及外置擴(kuò)展資源,以存換算,提高性價(jià)比和系統(tǒng)吞吐,并極大降低TTFT等延遲指標(biāo)。

  為了解決分布式KV Cache和多級(jí)緩存的精細(xì)管理,并建起推理引擎到云存儲(chǔ)的橋梁,我們研發(fā)并正式開源了 FlexKV。在知名SSD廠商“群聯(lián)電子”的測(cè)試中,F(xiàn)lexKV 將首字時(shí)延最高降低 70%,對(duì)線%。

  推理框架優(yōu)化對(duì)于提升推理效率也非常重要。圍繞用戶體驗(yàn)、成本控制和應(yīng)用拓展,我們貢獻(xiàn)了多項(xiàng)核心技術(shù),補(bǔ)充到了不同社區(qū)框架中。

  例如,我們集成了多 token 聯(lián)合預(yù)測(cè) (MTP) 技術(shù),讓模型一次運(yùn)算生成多個(gè) token,將生成速度提升了 35%。我們還幫助社區(qū)打通了注意力數(shù)據(jù)并行 (Attention DP) 功能,將吞吐量提升了 30%。

  此外,通過集成 MoE-Chunk 技術(shù),成功使推理框架能夠處理超過 256K 的超長輸入,使其在長文檔分析、復(fù)雜代碼生成等場景中也能保持高效。

  這些成果背后,是騰訊軟硬件協(xié)同全棧優(yōu)化的長期戰(zhàn)略投入,騰訊始終堅(jiān)持積極參與和回饋開源社區(qū),并通過騰訊云異構(gòu)計(jì)算平臺(tái)的軟件能力,整合不同類型的芯片,對(duì)外提供高性價(jià)比的AI算力,目前我們已經(jīng)全面適配主流的國產(chǎn)芯片。

  當(dāng)Agent從前沿技術(shù)走向企業(yè)生產(chǎn)環(huán)境,如何確保其在一個(gè)安全可信的環(huán)境中高效運(yùn)行成為新的挑戰(zhàn)。為此,我們推出了全新的 Agent infra 解決方案——Agent Runtime。

  它集成了執(zhí)行引擎、云沙箱、上下文服務(wù)、網(wǎng)關(guān)、安全可觀測(cè)服務(wù)等多項(xiàng)產(chǎn)品和能力??梢哉f,Agent Runtime 為Agent提供了堅(jiān)實(shí)可靠的“手”和“腳”,以及至關(guān)重要的安全隔離云端執(zhí)行環(huán)境,真正打通了Agent從技術(shù)到應(yīng)用的最后一公里。

  比如大家最關(guān)注的沙箱技術(shù)。云沙箱是 Agent Runtime 的核心組件,基于自研的Cube沙箱技術(shù),通過“運(yùn)行時(shí)快照”、“資源預(yù)創(chuàng)建池化”等多種技術(shù)手段,實(shí)現(xiàn)了 100毫秒的極速啟動(dòng),并能支持?jǐn)?shù)十萬Agent實(shí)例同時(shí)并發(fā),這意味著Agent無需等待,隨時(shí)可以投入使用,具備卓越的資源彈性和秒級(jí)調(diào)度能力。

  云沙箱也支持多種靈活的接入方式,無論通過 MCP、SDK 還是 API,都能快速集成,滿足不同業(yè)務(wù)場景的需求。我們還提供了全方位的安全保障,包括嚴(yán)格的身份權(quán)限管理和數(shù)據(jù)安全防護(hù),確保每一個(gè)Agent都能在一個(gè)安全可信的環(huán)境中高效運(yùn)行。

  除了面向Agent升級(jí)基礎(chǔ)設(shè)施,我們也在思考如何將Agent能力應(yīng)用在客戶的云上旅程,幫助客戶更好的用云、管云,很高興向大家介紹騰訊云的專家服務(wù)智能體——Cloud Mate。

  Cloud Mate由一系列凝聚了各個(gè)云上領(lǐng)域經(jīng)驗(yàn)的子Agent構(gòu)成,它不僅僅是一項(xiàng)技術(shù),更是騰訊云海量實(shí)踐的匯總,能夠可視化治理云上架構(gòu)、前置攔截風(fēng)險(xiǎn),并大幅提升問題處理效率,改變我們管理云的方式。

  在云上架構(gòu)治理方面,具備Agent能力的智能顧問就像一個(gè)全能的數(shù)字架構(gòu)師,可以無縫集成超過 90% 的騰訊云產(chǎn)品,對(duì)整個(gè)云上架構(gòu)進(jìn)行全面感知和可視化。

  例如,在新游上線前必做的重保演練,它能將整個(gè)周期從原來的 1周縮短至1天,目前,騰訊云智能顧問已經(jīng)為云上客戶提供,超過100萬次的智能架構(gòu)治理服務(wù),是真正值得信賴的云上伙伴。

  在風(fēng)險(xiǎn)防范場景,慢查詢或低效SQL是長期困擾開發(fā)與DBA的難題,這種業(yè)務(wù)代碼一旦上線,可能嚴(yán)重拖慢數(shù)據(jù)庫性能,甚至導(dǎo)致服務(wù)宕機(jī)。

  Cloud Mate非常擅長數(shù)據(jù)庫業(yè)務(wù),能夠深入到代碼環(huán)節(jié),在開發(fā)提交代碼前,自動(dòng)進(jìn)行風(fēng)險(xiǎn)檢測(cè)與攔截,從源頭保障線上數(shù)據(jù)庫的安全穩(wěn)定。從內(nèi)部實(shí)踐看,Cloud Mate對(duì)風(fēng)險(xiǎn)SQL的攔截率高達(dá)95%,累計(jì)檢測(cè)了超過770萬行代碼。

  在排障方面,Cloud Mate 帶來的改變尤為顯著。當(dāng)客戶云上業(yè)務(wù)系統(tǒng)日益復(fù)雜時(shí),如何快速定位問題,是一個(gè)巨大的挑戰(zhàn)。過去,解決一個(gè)復(fù)雜問題平均需要30小時(shí)以上,并且高度依賴于個(gè)人經(jīng)驗(yàn)和手動(dòng)操作。

  而現(xiàn)在,通過 Cloud Mate 強(qiáng)大的自動(dòng)化和并行編排能力,我們能夠?qū)⑵骄耪蠒r(shí)間,從小時(shí)級(jí)縮短至分鐘級(jí),最快僅需3分鐘。Cloud Mate 能夠自動(dòng)執(zhí)行診斷工具鏈,并行處理多個(gè)任務(wù),極大地提升了運(yùn)維效率,讓故障定位不再是難題。

  我們持續(xù)打磨產(chǎn)品性能,通過堅(jiān)實(shí)的基礎(chǔ)設(shè)施建設(shè),助力客戶在全球范圍拓展業(yè)務(wù)。

  騰訊云自研的星星海服務(wù)器從SA5到SA9持續(xù)迭代,通過硬件架構(gòu)創(chuàng)新,在有限空間內(nèi),最大化提升計(jì)算密度與能效,旗艦SA9單機(jī)規(guī)格,從前一代的512核進(jìn)一步提升到768核,星星海服務(wù)器目前在全球累計(jì)部署核數(shù)超過2億,為客戶持續(xù)提供穩(wěn)定可靠的計(jì)算能力。

  我們還推出了新一代架構(gòu)的TDSQL數(shù)據(jù)庫, 讓分布式數(shù)據(jù)庫像單機(jī) MySQL一樣好用,同時(shí)享受到單機(jī)數(shù)據(jù)庫的易用性,以及分布式數(shù)據(jù)庫的海量存儲(chǔ)與高并發(fā)能力,具備無限的TP擴(kuò)展性與輕量AP能力。 同時(shí),我們還將AI和數(shù)據(jù)庫的優(yōu)化器結(jié)合,在復(fù)雜查詢場景下,總時(shí)延能下降 80%以上。

  專有云TCE在國內(nèi)政企客戶中備受好評(píng),當(dāng)我們推向國際市場,“高可用性”也得到了國際客戶的肯定。我們持續(xù)提升TCE容災(zāi)切換的一致性、準(zhǔn)確性和實(shí)時(shí)性,目前已經(jīng)達(dá)到RTO 2分鐘級(jí)別,具備近金融6級(jí)的容災(zāi)能力。

  游戲體驗(yàn)的流暢性、穩(wěn)定性和安全性,直接決定著一款產(chǎn)品能否成功走向全球。在今年Omdia的報(bào)告中,我們與AWS、Google、Microsoft等企業(yè),一同被評(píng)為全球游戲云平臺(tái)的領(lǐng)導(dǎo)者。

  為了讓精品游戲都能高效進(jìn)入全球市場,我們不斷打磨基礎(chǔ)設(shè)施的健壯性。目前,我們的服務(wù)已覆蓋全球55個(gè)可用區(qū),擁有超過3200個(gè)加速節(jié)點(diǎn),確保游戲能夠以極低的延遲觸達(dá)全球玩家。我們還為全球超過1萬款游戲保駕護(hù)航,成功抵御的DDoS攻擊次數(shù)同比增長了183%,為游戲的平穩(wěn)運(yùn)營筑起了堅(jiān)實(shí)的防線。同時(shí),我們通過WeTest和ACE等一系列產(chǎn)品,為游戲開發(fā)者提供全方位的測(cè)試與安全服務(wù),幫助他們?cè)谟螒蛏暇€前,就徹底排除潛在隱患。

  以韓國頭部頭部游戲集團(tuán)Com2uS為例,他們不僅是成功的游戲開發(fā)商,更打造了面向開發(fā)者的游戲后端服務(wù)平臺(tái)Hive。借助騰訊云40多款云產(chǎn)品的支撐,Hive構(gòu)建了上百個(gè)游戲開發(fā)和部署組件,并被90多家游戲公司接入使用,成功支撐了250款游戲上線億游戲玩家。今年,他們準(zhǔn)備從亞太啟航,進(jìn)一步進(jìn)軍北美市場,而騰訊云依然是他們最信賴的合作伙伴。

  我們與創(chuàng)夢(mèng)天地的合作也持續(xù)深化。他們的全新游戲《卡拉彼丘》在全球發(fā)行后,不到2小時(shí)就登頂Steam排行榜榜首,背后正是我們WeTest、大模型服務(wù)等能力保障的結(jié)果,大幅提升了游戲質(zhì)量優(yōu)化和多語言輿情處置的效率,讓創(chuàng)夢(mèng)天地能夠更加專注于核心業(yè)務(wù),擁抱全球市場。

  面向AI時(shí)代,我們持續(xù)升級(jí)產(chǎn)品,助力客戶輕松進(jìn)入低門檻的開發(fā)新時(shí)代。EdgeOne是我們面向國際市場推出的下一代安全加速產(chǎn)品,今年我們進(jìn)一步將大模型與MCP Server結(jié)合,推出了EdgeOne Pages,當(dāng)用戶使用Codebuddy、Cursor、VScode等AI編程工具時(shí),可以便捷調(diào)用EdgeOne Pages的MCP,在幾分鐘內(nèi)完成涵蓋注冊(cè)、支付、加速和安全防護(hù)的完整電商網(wǎng)頁部署。產(chǎn)品上線萬用戶走向全球市場,成為中小企業(yè)和獨(dú)立開發(fā)者的出海首選平臺(tái)。

  如果客戶希望進(jìn)一步豐富產(chǎn)品的互動(dòng)能力,我們提供低代碼、模塊化的互動(dòng)直播組件,結(jié)合目前市面上主流的AI編程工具,可以將開發(fā)周期從月級(jí)壓縮至天級(jí),同時(shí)支持千萬級(jí)規(guī)模的單房間直播。組件上線半年以來,客戶數(shù)增長超300% 。

  我們致力于通過“邊加端”的AI整體方案,以極低門檻和極快速度,將創(chuàng)新想法落地為全球產(chǎn)品,釋放開發(fā)者的生產(chǎn)力。

  產(chǎn)品技術(shù)的升級(jí),也能讓騰訊云的用戶更從容應(yīng)對(duì)全球化復(fù)雜場景,尤其是瞬時(shí)流量洪峰。

  過去一年,我們成功護(hù)航了多個(gè)高并發(fā)場景。例如,騰訊云平穩(wěn)支撐了國家級(jí)大型活動(dòng)的直播,支撐了全球超過8000萬觀眾同時(shí)在線觀看,直播平臺(tái)全程無卡斷。我們還支持并保障了亞太地區(qū)超過一半的正版英超直播。其中的智能媒體處理技術(shù),為客戶實(shí)現(xiàn)了提質(zhì)增效,保障了音視頻全鏈路的流暢體驗(yàn)。

  在安全防護(hù)方面,騰訊云的防護(hù)容量相比去年增長了70%,達(dá)到了25T,帶寬儲(chǔ)備增長100%,達(dá)到400T。在服務(wù)某頭部潮玩企業(yè)火爆發(fā)售的過程中,我們成功應(yīng)對(duì)了全球業(yè)務(wù)十倍級(jí)的流量突發(fā),并通過AI實(shí)時(shí)防刷引擎,將高峰時(shí)段黑產(chǎn)比例從80%大幅壓縮到0.2% 。

  騰訊云在海外完善的基礎(chǔ)設(shè)施和本地化服務(wù),也在吸引越來越多的海外本地企業(yè)跨云遷移。印尼 GoTo 就是一個(gè)典型案例:

  GoTo是東南亞最大的科技集團(tuán),合并了印尼兩大獨(dú)角獸企業(yè)——負(fù)責(zé)即時(shí)配送和出行服務(wù)的Gojek和電商平臺(tái)Tokopedia。騰訊云負(fù)責(zé)的Gojek業(yè)務(wù),是這場遷移中復(fù)雜度最高的部分,相當(dāng)于把印尼的“滴滴+美團(tuán)”云上搬家。

  我們面對(duì)的,是一個(gè)超大體量的平臺(tái):擁有超過1億的注冊(cè)用戶, 管理著超過10000臺(tái)云主機(jī)、730多個(gè)數(shù)據(jù)庫實(shí)例和1000多個(gè)微服務(wù)。同時(shí),其系統(tǒng)極其復(fù)雜 :四大核心業(yè)務(wù)線、九個(gè)工程子系統(tǒng),模塊間高度耦合。這無疑是一個(gè)世界級(jí)的云業(yè)務(wù)遷移挑戰(zhàn)。

  面對(duì)如此復(fù)雜的項(xiàng)目,團(tuán)隊(duì)駐扎雅加達(dá)現(xiàn)場,與GoTo緊密協(xié)作:高效完成了500多項(xiàng)定制化需求交付,讓客戶50多個(gè)產(chǎn)品模塊在遷移前后的體驗(yàn)和功能無縫延續(xù)。為了確保萬無一失,進(jìn)行了5輪全鏈路演練,制定了20多項(xiàng)應(yīng)急預(yù)案。

  更值得一提的是,為了滿足GoTo的高可用需求,我們僅用5個(gè)月就在印尼建成了第三個(gè)可用區(qū),為遷移提供了堅(jiān)實(shí)的本地基礎(chǔ)設(shè)施保障。

  過去一年,是騰訊云在海外快速發(fā)展的一年。我們?cè)谌毡敬筅婧蜕程匦陆丝捎脜^(qū),并已在全球范圍內(nèi)設(shè)立9個(gè)技術(shù)支持中心,持續(xù)為本地客戶提供卓越服務(wù)。同時(shí),我們通過了400多項(xiàng)專業(yè)認(rèn)證,為企業(yè)在安全合規(guī)的前提下穩(wěn)健前行保駕護(hù)航。

  全球化市場充滿挑戰(zhàn),也蘊(yùn)藏著無限機(jī)遇。對(duì)于正在或即將出海的中國企業(yè)而言,如何穩(wěn)扎穩(wěn)打、因地制宜,抓住AI技術(shù)浪潮驅(qū)動(dòng)創(chuàng)新提效,是每一步都需要認(rèn)真思考的課題。

  騰訊云愿以扎實(shí)的準(zhǔn)備和開放的心態(tài),幫助全球企業(yè)用好云,陪伴中國企業(yè)走得更穩(wěn)、更遠(yuǎn)。

  9月17日,陜西平利縣遭遇強(qiáng)降雨,城關(guān)鎮(zhèn)一處老土房在居民被緊急轉(zhuǎn)移后倒塌,有車輛遭泥沙埋壓,一加油站也被泥沙沖入。城關(guān)鎮(zhèn)一名目擊者稱,居住于房內(nèi)的兩位老人凌晨被安全轉(zhuǎn)移,“老倆口剛出門房子就塌了”。

  9月17日,從中國裁判文書網(wǎng)獲悉,最高人民法院日前公布一起刑事裁定書,核準(zhǔn)廣東省高級(jí)人民法院對(duì)被告人周某組織、領(lǐng)導(dǎo)黑社會(huì)性質(zhì)組織罪,罪,尋釁滋事罪,盜竊罪,聚眾斗毆罪,強(qiáng)制猥褻罪,組織未成年人進(jìn)行違反治安管理活動(dòng)罪,敲詐勒索罪,故意傷害罪,決定執(zhí)行死刑,剝奪政治權(quán)利終身,并處

  女子攜黃碟過安檢被查稱自己看,被行拘3日!律師:大媽違法不在于自己看,而在于運(yùn)輸

  近日,吉林敦化站安檢人員發(fā)現(xiàn)一名60歲女子背包內(nèi)有大量光盤,隨即通報(bào)民警。民警依法開包檢查,發(fā)現(xiàn)包內(nèi)有兩個(gè)DVD播放器及36張光盤,光盤上貼有男女裸體畫面并印有淫穢字樣,遂將其口頭傳喚至派出所。女子王某表示光盤為自己觀看。經(jīng)鑒定,光盤均為淫穢物品。

  禮泉#街頭隨拍 ,早上六點(diǎn)多,他們?cè)诼愤叺然?,一輛車停下,好多人圍過去,生活不易,賺錢太難,致敬每個(gè)努力奮斗的人

  “一人收200元班費(fèi),全班近一萬元要用到什么時(shí)候”?家長質(zhì)疑(極目新聞)

  當(dāng)?shù)貢r(shí)間9月17日,特斯拉設(shè)計(jì)總監(jiān)Franz von Holzhausen接受采訪透露,特斯拉正重新設(shè)計(jì)其飽受安全爭議的車門把手系統(tǒng),新設(shè)計(jì)旨在讓乘客在“緊急情況下”更直觀地操作車門。 本周早些時(shí)候,美國國家公路交通安全管理局對(duì)特斯拉部分車型的車門缺陷展開調(diào)查,涉及約17.

  近期,國家稅務(wù)總局西安市稅務(wù)局第三稽查局聯(lián)合公安經(jīng)偵部門,依法查處陜西盛明宏盛能源有限公司虛開增值稅專用發(fā)票案件。

  劉某某是典型的茶飲愛好者:年輕的時(shí)候開始喝茶,到如今已經(jīng)有68歲了,依然每天都要喝點(diǎn)茶。近段時(shí)間,劉某某總感覺喉嚨里有東西卡著,吐不出來也咽不下去,本來以為是咽炎,可買了藥服用卻不見好轉(zhuǎn)。