日韩欧美在线综合,国产色综合一区,亚洲玖玖视频,淫视频在线观看,草逼国产,国内精品视频成人一区二区,欧美日韩国产中文字幕

數(shù)字報(bào)
小程序
公眾號(hào)
清程極智AI全鏈路基礎(chǔ)設(shè)施方案 讓國(guó)產(chǎn)自主Token流通更高效
2026-05-27 16:44:49
來(lái)源:中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào)  作者: 羅曉燕

本報(bào)訊(記者 羅曉燕)5月26日,中科創(chuàng)星硬科技媒體行——清程極智專(zhuān)場(chǎng)活動(dòng)在北京舉行。活動(dòng)現(xiàn)場(chǎng),北京清程極智科技有限公司(以下簡(jiǎn)稱(chēng)“清程極智”)團(tuán)隊(duì)與到場(chǎng)媒體圍繞大模型推理降本、國(guó)產(chǎn)算力生態(tài)適配、Token服務(wù)質(zhì)量與性?xún)r(jià)比三大行業(yè)關(guān)鍵痛點(diǎn)進(jìn)行深入交流,并集中展示多項(xiàng)核心技術(shù)突破與規(guī)?;涞爻晒?,以技術(shù)創(chuàng)新推動(dòng)中國(guó)AI產(chǎn)業(yè)從“能用”邁向好用、低成本、自主可控的新階段。

當(dāng)前,全球AI產(chǎn)業(yè)已進(jìn)入規(guī)?;涞氐年P(guān)鍵時(shí)期。Token作為AI時(shí)代的“水電煤”,正成為大模型服務(wù)與智能應(yīng)用的核心生產(chǎn)要素。數(shù)據(jù)顯示,2024年初至2026年3月,中國(guó)Token日均調(diào)用量激增約1400倍,規(guī)模突破140萬(wàn)億。隨著Agent智能體、多模態(tài)應(yīng)用的快速普及,Token正從交互用量轉(zhuǎn)向生產(chǎn)用量,對(duì)推理效率、部署成本、服務(wù)穩(wěn)定性提出更高要求。清程極智首席科學(xué)家、清華大學(xué)計(jì)算機(jī)系教授翟季冬在活動(dòng)中指出:“Agent應(yīng)用會(huì)有多步執(zhí)行,頻繁調(diào)用大模型,將Token調(diào)用量顯著增加。中國(guó)的Token增長(zhǎng)速度比全球還高,這背后是供給側(cè)和需求側(cè)共同的爆發(fā)。”

與此同時(shí),國(guó)產(chǎn)算力與國(guó)產(chǎn)模型雖迎來(lái)高速發(fā)展,但推理環(huán)節(jié)長(zhǎng)期依賴(lài)海外引擎,難以充分釋放國(guó)產(chǎn)硬件性能。Token服務(wù)市場(chǎng)也面臨“亂、貴、慢、選型難”等突出問(wèn)題。翟季冬以電力和Token做對(duì)比:“家里用電不用擔(dān)心只有國(guó)網(wǎng)的電力,但Token有幾十家供應(yīng)商,每家質(zhì)量參差不齊,同樣的模型在不同服務(wù)商那里可能聰明程度不一樣,價(jià)格和緩存命中率也千差萬(wàn)別。”

針對(duì)上述痛點(diǎn),清程極智打造了覆蓋“生產(chǎn)—流通—應(yīng)用”全鏈路的三大產(chǎn)品體系。公司成立于2023年12月,核心團(tuán)隊(duì)來(lái)自清華大學(xué)計(jì)算機(jī)系高性能計(jì)算所,已順利完成天使輪、Pre-A、Pre-A+三輪融資,獲得中科創(chuàng)星、中金資本、考拉基金、聯(lián)想創(chuàng)投、中關(guān)村科學(xué)城公司等多家機(jī)構(gòu)加持。

赤兔推理引擎是清程極智完全自主研發(fā)的國(guó)產(chǎn)推理引擎,從第一行代碼開(kāi)始自研,面向昇騰、海光、沐曦、摩爾線程等國(guó)產(chǎn)芯片深度優(yōu)化。清程極智聯(lián)合創(chuàng)始人唐適之博士解釋?zhuān)骸巴评硪媸沁\(yùn)行在AI算力上的計(jì)算機(jī)程序,用戶提一個(gè)問(wèn)題,引擎根據(jù)大模型定義計(jì)算后給出回答。國(guó)產(chǎn)芯片各有特點(diǎn),我們不能簡(jiǎn)單把英偉達(dá)的技術(shù)挪過(guò)來(lái),必須針對(duì)國(guó)產(chǎn)算力進(jìn)行原生優(yōu)化?!?/p>

據(jù)介紹,赤兔推理引擎通過(guò)軟件方案在不具備FP4/FP8硬件能力的設(shè)備上支持低位寬浮點(diǎn)數(shù)量化,使用FP8量化可降低50%算力門(mén)檻,F(xiàn)P4量化可降低75%算力門(mén)檻。同樣使用浮點(diǎn)數(shù)計(jì)算部署DeepSeek-V3滿血版模型時(shí),僅需1臺(tái)8卡華為910B服務(wù)器即可替代傳統(tǒng)4臺(tái)8卡機(jī),硬件成本從600萬(wàn)元降至150萬(wàn)元。目前,赤兔推理引擎已在券商、能源央企等場(chǎng)景落地,某能源央企實(shí)現(xiàn)3500+員工全國(guó)產(chǎn)化算力穩(wěn)定使用,算力效率提升近40%,相關(guān)案例榮獲2025人工智能應(yīng)用大賽銅獎(jiǎng)。

面對(duì)Token服務(wù)市場(chǎng)服務(wù)商林立、指標(biāo)混亂、選型成本高的行業(yè)亂象,清程極智打造AI Ping一站式大模型服務(wù)評(píng)測(cè)與API智能路由平臺(tái),成為國(guó)內(nèi)首個(gè)集“信息匯總、客觀評(píng)測(cè)、智能路由”于一體的Token服務(wù)樞紐。清程極智聯(lián)合創(chuàng)始人、產(chǎn)品副總裁師天麾介紹,AI Ping接入30多家服務(wù)商、600多個(gè)大模型服務(wù),7×24小時(shí)多地域分布式監(jiān)測(cè),輸出延遲、吞吐、可靠性、價(jià)格等真實(shí)可核驗(yàn)的指標(biāo)。同時(shí),該平臺(tái)依托智能路由算法,以統(tǒng)一API接口為用戶自動(dòng)匹配最優(yōu)服務(wù)商,實(shí)現(xiàn)成本降低超37%、吞吐提升超90%、延遲降低超20%。

師天麾進(jìn)一步表示:“Token是一個(gè)黑盒,你買(mǎi)之前不知道服務(wù)質(zhì)量。很多企業(yè)只看標(biāo)價(jià),不懂緩存命中率。有的服務(wù)商標(biāo)價(jià)低,但沒(méi)有緩存折扣,最終成本反而高好幾倍。我們會(huì)把這些坑幫用戶踩掉,把開(kāi)箱即用的穩(wěn)定體驗(yàn)留給客戶?!?/p>

此外,清程極智還推出八卦爐智能軟件棧,面向大模型訓(xùn)練、微調(diào)場(chǎng)景提供高效Token生產(chǎn)與智能調(diào)度能力,與赤兔推理引擎、AI Ping平臺(tái)形成協(xié)同,覆蓋AI“訓(xùn)練—推理—應(yīng)用”全流程。

清程極智相關(guān)負(fù)責(zé)人表示,公司將持續(xù)深耕AI基礎(chǔ)設(shè)施領(lǐng)域,堅(jiān)持核心技術(shù)自主可控,不斷迭代赤兔推理引擎對(duì)國(guó)產(chǎn)芯片的適配能力,完善AI Ping評(píng)測(cè)與路由服務(wù),聯(lián)動(dòng)國(guó)產(chǎn)算力、國(guó)產(chǎn)模型、行業(yè)應(yīng)用等產(chǎn)業(yè)鏈伙伴,打造高效、普惠、安全的國(guó)產(chǎn)AI基礎(chǔ)設(shè)施體系,積極響應(yīng)國(guó)家“人工智能+”行動(dòng),以技術(shù)創(chuàng)新推動(dòng)中國(guó)AI產(chǎn)業(yè)高質(zhì)量發(fā)展。

(本報(bào)記者 羅曉燕/攝)

編輯:韓夢(mèng)晨
相關(guān)閱讀:
高新視頻 更多
高新熱榜 全部本月
編輯推薦 更多

友情鏈接: 政府 高新園區(qū)合作媒體

Copyright 1999-2026 中國(guó)高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號(hào)-5

電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證060344號(hào)主辦單位:《中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào)》社有限責(zé)任公司