|
作者 | 周智宇 編輯 | 張曉玲 過去兩年,注入靈魂我們談?wù)?AI 時(shí),阿里大多談?wù)摰脑平o硬件是屏幕里的那個(gè)光標(biāo),是注入靈魂對話框里不斷生成的文字。它很強(qiáng),阿里但也總是云給硬件離生活遠(yuǎn)了點(diǎn)。 各家科技公司也在嘗試各種智能硬件,注入靈魂但能夠嘗鮮的阿里,只是云給硬件少數(shù)人。 阿里云試圖捅破了這層窗戶紙。注入靈魂1 月 8 日,阿里阿里云發(fā)布多模態(tài)交互開發(fā)套件,云給硬件其實(shí)就講了一件事:AI 應(yīng)用落地,注入靈魂終于有了具象化的阿里模樣。 它試圖讓 AI 不再是云給硬件虛無縹緲的云端大腦,而是讓用戶鼻梁上的眼鏡,孩子懷里的玩具熊,都擁有靈魂。 阿里云通義大模型業(yè)務(wù)總經(jīng)理徐棟指出,大模型跟硬件結(jié)合,會(huì)帶來新的流量。 這不再是一個(gè)關(guān)于云服務(wù)賣得有多好的淺層故事,而是一場關(guān)于入口遷移的戰(zhàn)略博弈。在徐棟看來,手機(jī)雖然占據(jù)了我們?nèi)藗兇罅繒r(shí)間,但它更多是 " 單向輸入 ";而即將爆發(fā)的 AI 硬件,正在用一種更碎片、更粘性的方式,試圖接管人們的記憶與生活。 阿里云發(fā)布的這款 " 多模態(tài)交互開發(fā)套件 ",正是為了在這片新大陸上,給淘金者們遞上一把最趁手的鏟子。 什么是 AI 落地的具象化?首先是速度。 在虛擬世界,你可以容忍 ChatGPT 轉(zhuǎn)圈思考三秒;但在物理世界,如果你問眼鏡 " 前面是什么 ",三秒后的回答毫無意義。物理世界的交互,必須是即時(shí)的。 阿里云這次發(fā)布的套件,最核心的突破就在于把 " 云端大腦 " 的反應(yīng)速度壓到了物理極限。端到端語音交互延遲低至 1 秒,視頻交互延遲低至 1.5 秒。 這意味著什么?意味著機(jī)器的反饋終于追上了人類的語速。比如雷鳥創(chuàng)新與阿里云合作的 AI 眼鏡,實(shí)現(xiàn)了平均 1.3 秒的同聲傳譯和多模態(tài)交互。 當(dāng) " 看懂 " 和 " 反饋 " 幾乎同步發(fā)生時(shí),AI 就不再是一個(gè)需要刻意調(diào)用的工具,而變成了硬件本身的本能反應(yīng)。 這種變化是從 "Chatbot"(聊天機(jī)器人)的平面世界,進(jìn)入了 " 立體 " 的硬件交互世界。 這種極致的低延遲,正是 AI 從 " 嘗鮮 " 走向 " 落地 " 的物理基礎(chǔ)。 這會(huì)是 AI 加速進(jìn)入人們生活的重要一步。 以往云廠商做生意,盯著的是每一個(gè) Token(算力單位)賺多少錢。這導(dǎo)致硬件廠商不敢用,用不起。一個(gè)幾百塊的硬件,每個(gè)月云服務(wù)費(fèi)可能比硬件本身還貴。 為了讓 AI 真正落地,阿里云這次直接把門檻 " 砸 " 穿了。將計(jì)費(fèi)模式從不可控的 Token 改為更符合硬件銷售邏輯的 " 按設(shè)備 License" 計(jì)費(fèi)或低成本套餐。 阿里云不僅提供模型,還預(yù)置了十多款 Agent(智能體)和 MCP 工具,讓硬件廠商通過簡單的拖拉拽就能開發(fā)出具備復(fù)雜能力的設(shè)備。 這也是阿里云對未來的賭注:當(dāng)成千上萬的物理設(shè)備都裝上了通義的 " 靈魂 ",這些設(shè)備產(chǎn)生的數(shù)據(jù)、粘性和入口價(jià)值,將遠(yuǎn)超賣那點(diǎn)算力的收入。 AI 落地的另一個(gè)具象化體現(xiàn),是軟硬一體的標(biāo)準(zhǔn)確立。 在展會(huì)上,阿里云展示了與 RISC-V 架構(gòu)(玄鐵芯片)的深度綁定。阿里巴巴集團(tuán)副總裁戚肖寧將其比喻為:CPU 是軀體,AI 是靈魂。 這是一個(gè)非常明確的信號(hào):在碎片化的物理世界(IoT),阿里云試圖用 " 通義大模型 + RISC-V 芯片 " 這套組合拳,建立一個(gè)新的 Wintel 聯(lián)盟。 未來,通義大模型還將與玄鐵 RISC-V 實(shí)現(xiàn)軟硬全鏈路的協(xié)同優(yōu)化,實(shí)現(xiàn)通義大模型家族在 RISC-V 架構(gòu)上的極致高效部署和推理性能。 這對于深圳華強(qiáng)北的開發(fā)者來說,意義重大。他們不需要懂復(fù)雜的算法,不需要自己去適配芯片,只要拿著阿里云的這套 " 鑰匙 ",就能打開 AI 硬件的大門。這直接催生了大量 " 新物種 " 的誕生。 在徐棟看來,2026 年將是這些新硬件爆發(fā)的一年。比如聽力熊,它不是一個(gè)冷冰冰的復(fù)讀機(jī),而是一個(gè)能理解兒童獨(dú)特表達(dá)方式、有情感共鳴的成長伙伴。 它能聊一個(gè)多小時(shí)不冷場,這種高粘性的交互,是手機(jī) APP 做不到的。 又比如 AI 眼鏡,它解放了雙手,通過攝像頭看懂世界。當(dāng)用戶看到路邊的球滾出來,它能推斷出后面可能有小孩,這種對因果關(guān)系的理解,是物理 AI 最迷人的地方。 徐棟甚至提到了像 " 閃念膠囊 " 這樣的小眾硬件,它們雖然看起來不起眼,但在特定場景下(如寶媽記錄、會(huì)議紀(jì)要)解決了大問題。 當(dāng) AI 落地變得具象,我們看到的不再是千篇一律的手機(jī),而是形態(tài)各異的 " 新物種 "。 阿里云今天所做的一切,把計(jì)費(fèi)模式改得更親民,把開發(fā)門檻降到拖拉拽,把模型塞進(jìn)國產(chǎn)芯片里,都是在為那個(gè)新物種爆發(fā)的時(shí)刻蓄力。 它也試圖,去物理世界,去碎片化的場景里,尋找下一個(gè)流量的泉眼。 正如徐棟所言,互聯(lián)網(wǎng)的流量已經(jīng)見頂,但物理世界的流量才剛剛開始。 從發(fā)布開發(fā)套件開始,阿里云想給所有的硬件廠商發(fā)了一張進(jìn)入新時(shí)代的船票。這或許不是最賺錢的生意,但絕對是最正確的路——因?yàn)橹挥挟?dāng) AI 真的落地到物理世界,那個(gè)被憧憬了無數(shù)次的智能時(shí)代,才算真正拉開了序幕。 |
