AI硬件如何擺脫“曇花一現(xiàn)”的魔咒|甲子光年
到底是硬件+AI,還是AI+硬件?
作者|王藝 ??
編輯|王博
“我真的不喜歡當前的消費電子產(chǎn)品。比如,無論怎樣都會默認每年更新一代。”
近期,智能硬件Rabbit創(chuàng)始人呂騁在接受科技媒體The Verge主編Nilay Patel的專訪時談到了此前飽受爭議的Rabbit R1以及對AI硬件產(chǎn)品的看法。
Rabbit R1自從在今年年初的CES上推出以來,就因為AI硬件的標簽而廣受關注,但是數(shù)據(jù)造假、套殼安卓、炒作概念等質(zhì)疑紛至沓來,全球擁有近2000萬粉絲的知名數(shù)碼評測博主Marques Brownlee(MKBHD)對Rabbit R1的評價是:“這很難評( Barely Reviewable)。”
Rabbit R1,圖片來源:@MKBHD
「甲子光年」從AI硬件行業(yè)知情人士處了解到,Rabbit還計劃推出一款新的AI硬件。
而在國內(nèi),字節(jié)跳動近期發(fā)布了集成了豆包大模型的智能耳機Ola Friend。用戶戴上該智能耳機后,可以通過語音對話隨時使用豆包,同時在豆包App上也可以操控這款耳機。
和Rabbit R1發(fā)布后一樣,這款產(chǎn)品也遭受了質(zhì)疑,例如:為什么必須要用一款專門的耳機來跟豆包對話;Ola Friend和普通耳機加個大模型chatbot沒什么本質(zhì)差別,不是真正的AI硬件。
但不管怎么樣,AI硬件的熱潮是翻起來了,無論是大廠還是初創(chuàng)公司都在紛紛入局。「甲子光年」統(tǒng)計,自2019年以來,包括呂騁在內(nèi),已經(jīng)有十多位大廠或知名公司的高管下場進行AI硬件的創(chuàng)業(yè)。
AI硬件領域大公司高管創(chuàng)業(yè)匯總,整理及制圖:甲子光年
AI硬件的賽道中,并不缺少現(xiàn)象級產(chǎn)品,但是部分產(chǎn)品似乎陷入了一種 “曇花一現(xiàn)”的魔咒——它們短時間內(nèi)吸引了大量關注,卻沒有形成足夠的產(chǎn)品力,也沒有獲得更廣泛的市場認可。
雖然如此,但是正如呂騁所說的,如今的消費電子產(chǎn)品缺乏創(chuàng)新,即使一些AI硬件不盡如人意,但AI硬件的市場前景仍不容忽視。
那么,AI硬件當前存在什么問題,又有哪些解決之道?什么樣的AI硬件才是理想的產(chǎn)品?
1.AI硬件:市場很大,焦慮很多
AI硬件幾乎是和GPT-4等大模型在同一時間出現(xiàn)在市場上的,但是其發(fā)展速度并沒有追上大模型的步伐。
2023年11月,Humane AI Pin橫空出世,以刷屏的姿態(tài)引爆了當時的科技圈。這款以自然語音交互為基礎、以增強現(xiàn)實(AR)的投影功能為亮點的AI別針被當時的媒體類比為“初代iPhone”。還未正式發(fā)布的時候,Ai Pin就被《時代》雜志評為「2023 年最佳發(fā)明」之一,并獲得了超過2億美元的投資。
Humane AI Pin 圖源:官網(wǎng)
然而,就是這樣一款“出道即巔峰”的明星產(chǎn)品,其銷售量卻不及退貨量。
今年6月份,《紐約時報》援引兩位匿名消息人士的話稱,Humane公司已售出10000臺 AI Pin。但據(jù)The Verge在8月援引一位“直接知情人士”的話報道,如今只有7000臺售出的設備沒有被退回,內(nèi)部銷售數(shù)據(jù)顯示退貨量超過了設備/配件銷售額(約900萬美元)。The Verge還透露,有1000臺AI Pin的訂單在發(fā)貨前就被取消了。
AI Pin之所以遭遇銷售滑鐵盧,主要是因為產(chǎn)品功能太雞肋。
AI Pin只能打電話、發(fā)信息、拍照,缺少App調(diào)用的能力,唯一靠譜的功能是播報時間;此外,續(xù)航和發(fā)熱等也是其經(jīng)常被用戶吐槽的問題。前文提到的博主MKBHD甚至做了一期視頻吐槽AI Pin,標題是《目前為止我測評過最差勁的產(chǎn)品(The Worst Product I've Ever Reviewed... For Now)》。
AI Pin測評,圖片來源:@MKBHD
AI Pin推出之后,Rabbit R1也上演了類似的故事。此外,去年蘋果推出的Apple Vision Pro、索尼XR頭顯等大模型時代誕生的AI硬件,也都在發(fā)布后的不同時期遭遇了銷售的滑鐵盧。
蘋果粉絲正在退回Vision Pros,圖片來源:The Verge
AI硬件之所以總是復制這種“曇花一現(xiàn)”的發(fā)展路徑,主要還是產(chǎn)品定義上存在缺失。它們要么是沒有找到用戶真正的需求、提供了冗余功能,要么是只滿足了用戶某一部分的需求,但是仍然需要依賴手機運行,無法作為獨立的個人計算設備出現(xiàn)。
即便如此,大廠和初創(chuàng)公司還是一窩蜂地投入到AI硬件的創(chuàng)業(yè)浪潮中去,試圖搶占AI時代的流量入口。Emergen Research數(shù)據(jù)顯示,AI硬件在2022年的市場規(guī)模為92.1億美元,年復合增長率為17.7%,預計到2032年將達到465.9億美元的市場規(guī)模。?cè)绱她嫶蟮氖袌觯?任何一個玩家都想提前進場分一杯羹。
字節(jié)推出Ola Friend耳機就是最典型的例子。
一位接近字節(jié)的人士對「甲子光年」印證了這一說法。他表示,字節(jié)想建立一個以C端應用為基礎,橫跨C端(消費端)和B端(企業(yè)端)的“大而全”的AI體系,然后以此為支點,進一步打入云計算等底層技術的基建生態(tài)。豆包大模型是字節(jié)在B端的布局,在占住B端生態(tài)位之后,字節(jié)要在C端也搶占生態(tài)位,而AI硬件就是不可或缺的流量入口。
市場如此廣闊,玩家卻普遍焦慮。AI硬件,到底該怎么做才好?
「甲子光年」認為,或許可以從“硬件”和“軟件”兩個方面思考這一問題,思考是“硬件+AI”還是“AI+硬件”。
做新的硬件產(chǎn)品一般有兩種思路:一,在已有品類上做創(chuàng)新和提升;二,定義全新的品類。
第一種思路是“硬件+AI”的邏輯,用AI賦能本就存在的硬件產(chǎn)品,做功能的迭代升級,或者找準細分市場需求做差異化的創(chuàng)新。
第二種思路是“AI+硬件”的邏輯。AI作為一種新的技術形式,是可以從根本上變革個人計算設備的產(chǎn)品形態(tài)的。正如互聯(lián)網(wǎng)催生了PC和筆記本電腦,移動互聯(lián)網(wǎng)催生了智能手機、iPad,AI大模型也催生了Humane AI Pin、Rabbit R1等新的AI硬件形態(tài)。換句話說,可以通過軟件定義硬件。
2.硬件+AI:潤物細無聲
在原有產(chǎn)品功能已經(jīng)非常強大的情況下,“硬件+AI”要怎么才能做出讓用戶眼前一亮的花樣來呢?
或許可以從科技發(fā)展的歷史規(guī)律中找答案。
科技行業(yè)一直有一個“普適計算(ubiquitous computing)”的思想,它來自美國計算機科學家馬克·維瑟。
馬克·維瑟,圖片來源:維基百科
1991年,時年39歲馬克·維瑟在《科學美國人》上發(fā)表了《21世紀的計算機(The Computer for the 21st Century )》。在這篇文章中,馬克·維瑟對普適計算做了如下描述:
計算機的目的是幫助你做其他事情;
最好的計算機是安靜的、看不見的仆人;
你越能按直覺做事,就越聰明。計算機應該擴展你的潛意識;
技術應該創(chuàng)造寧靜。
用一句話概括,就是“ 潤物細無聲”。
在普適計算理念之下,馬克·維瑟認為21世紀的計算機會融入網(wǎng)絡、融入環(huán)境、融入生活。為此,計算機會更小、更廉價;同時,它們會有網(wǎng)絡連接、超越圖形界面、可以與環(huán)境和人做更多的交互; 他認為最偉大的計算技術是那些從人們的視線中消失,融入到日常生活用品當中的技術,讓人們意識不到計算的存在。他甚至為這種“融入網(wǎng)絡、融入環(huán)境、融入生活”的智能設備定義了三種形式:
Tabs :尺寸以厘米計算,可穿戴。
Pads :尺寸以分米計算,手持。
Boards :尺寸以米計算的大型設備。
盡管馬克·維瑟在1999年與世長辭,但他的思想對喬布斯產(chǎn)生了巨大的影響。2001年,iPod誕生;2007年,iPhone發(fā)布,開啟了真正意義上的“普適計算”時代;2010年,iPad發(fā)布,連名字都與馬克·維瑟的預言吻合了。
馬克·維瑟的普適計算預言不僅幫助喬布斯締造了蘋果這樣一個龐大的商業(yè)帝國,后來TWS耳機、AR眼鏡、藍牙音箱等智能硬件和可穿戴設備的出現(xiàn)更是印證了這一預言的有效性。
也就是說, 想要在“硬件+AI”領域做出花樣,第一種可行策略可以借鑒馬克·維瑟和蘋果的思路,將產(chǎn)品做得更便利,更有陪伴性,更具沉浸感。
Rewind(后更名為Limitless)公司推出的Pendant吊墜就是這種“陪伴性”的體現(xiàn)。Limitless吊墜可以像無線麥克風一樣別在襯衫上,也可以像項鏈一樣用繩子系起來,掛在脖子上。該設備不受天氣影響,電池壽命長達100小時,可通過USB-C端口輕松充電,因此可以保持一種“always on”的狀態(tài),隨時記錄用戶一天的談話內(nèi)容,并借助后臺AI軟件自動生成轉(zhuǎn)錄內(nèi)容。
Limitless的Pendant吊墜 圖源:官網(wǎng)
這種吊墜的存在,使得用戶無需開啟手機錄音就可以自然地記錄自己2到3天的全場景信息,并隨時調(diào)用后臺生成的轉(zhuǎn)錄做復盤,是一種“潤物細無聲”的信息記錄者。
銷量證明了這一產(chǎn)品的成功:僅僅發(fā)布5天,Limitless Pendant吊墜的銷量就突破了2萬條,其中美國用戶占一大半。
除了陪伴性和沉浸感,對AI硬件領域的新玩家來說,第二種可行策略是 尋找到一條足夠細分差異化的賽道,用AI升級原有硬件,尋找新的需求。
科大訊飛就是其中的一個典型代表。他們瞄準了“商務辦公”場景,圍繞各種痛點需求,用AI升級原有硬件的能力。
在辦公場景,針對辦公場景下80%使用的是臺式機、沒有麥克風的痛點,科大訊飛推出了AI智能鼠標,在鼠標里內(nèi)置了麥克風,能夠?qū)⒂脩舻恼Z音轉(zhuǎn)換成文字輸入到電腦中;同時,用戶的語音輸入還能調(diào)起訊飛星火大模型,幫助用戶快速生成PPT大綱、分析數(shù)據(jù)表格。
針對會議場景下手機錄音嘈雜、整理不便的痛點,科大訊飛推出了iFLYBUDS Pro 2耳機,該耳機擁有“紅點錄”功能,開盒按壓耳機盒內(nèi)置的“紅點”按鈕,無需開啟APP,即可開啟現(xiàn)場閃錄,訊飛星火大模型會自動整理錄音、做會議紀要;此外,針對商務洽談多語言場景,該耳機接入大模型,實現(xiàn)近乎實時的翻譯體驗。
iFLYBUDS Pro 2耳機,圖片來源:科大訊飛
除了鼠標和耳機,科大訊飛還用AI升級了翻譯機、辦公本等產(chǎn)品。
這種針對一個細分場景、圍繞原有硬件用AI做功能升級的策略為科大訊飛帶來了正向的回報:2023年公司的智能硬件營收為16.17億元,同比增長22.35%。剛剛發(fā)布的2024半年報也顯示,科大訊飛在2024年上半年的營業(yè)收入達到了93.25億元,其中智能硬件業(yè)務實現(xiàn)了營收9億元,同比增長56.61%。
自2023年5月科大訊飛正式發(fā)布星火大模型以來,訊飛星火大模型的變現(xiàn)方式就分為賦能現(xiàn)有業(yè)務、API授權(quán)付費、企業(yè)定制化模型3類,目前來看,C端硬件的營收增長是最明顯的。可以說,在當下大模型商業(yè)化的普遍困境下,用“硬件+AI”的方式做大模型的落地變現(xiàn)似乎也是大模型企業(yè)的一條破局之道。
3.AI+硬件:軟件定義硬件
除了“硬件+AI”,還有一種方式是“AI+硬件”,也就是用軟件定義硬件。
黃仁勛今年7月在和《連線》雜志資深撰稿人勞倫·古德(Lauren Goode)的爐邊談話中,給以GPU為代表的AI計算下了一個定義叫“ 加速計算”。之所以叫“加速計算”,是因為要和之前的“經(jīng)典計算”做出根本性的區(qū)別。2G—5G時代的個人計算設備算力是運行在云端的,它是在馮諾依曼結(jié)構(gòu)的計算機上跑的確定性的代碼, 輸入與輸出是由人編寫的代碼定義的精確的關系,類似農(nóng)耕民族以種地謀生的方式,一分耕耘一分收獲;而AI加速算力是在Transformer等神經(jīng)網(wǎng)絡上訓練出來的,它是一個黑盒,動態(tài)性更高、結(jié)果更不可預測,類似游牧民族以放羊、狩獵為生。
不同的文明催生不同的經(jīng)濟形態(tài),不同的算力催生不一樣的產(chǎn)品。此次AI算力變革的力度之大讓科技領域直接從農(nóng)耕時代進入了游牧時代,也讓AI硬件產(chǎn)品的形態(tài)發(fā)生了巨大的變革——從以窗口和命令為主導的Photoshop到只輸入一段Prompt就能生成圖片的Midjourney,從智能手機通過屏幕交互的GUI(Graphic User Interface,圖形用戶界面)型的硬件,到后來Humane AI Pin、Rabbit R1等通過語音與用戶交互的LUI(Language User Interface,語音用戶界面)型的硬件,算力和軟件的變化對硬件形態(tài)的更新起到了舉足輕重的作用。
個人計算設備的演變 圖源:*“鹿其鹿粦chilling”
大模型廠商提供的產(chǎn)品和服務千篇一律,新的AI硬件形態(tài)具體是什么也并沒有收斂和達成共識。那如何才能做好“軟件定義硬件”這件事、做出有商業(yè)化變現(xiàn)能力的AI硬件產(chǎn)品呢?
軟件定義硬件,最重要的不是發(fā)揮硬件的價值,而是發(fā)揮軟件的價值,將硬件作為流量入口來設計。這就倒逼AI硬件廠商從需求端想問題。
用AI重塑需求,或許是軟件定義硬件的一種解決思路。
正在探索“AI+養(yǎng)老”方向創(chuàng)業(yè)的陳正翔認為,正如語言可以塑造人的想象,具有語言理解能力的AI也可以重新塑造需求。
“以TWS/OWS耳機為例,我們大多數(shù)人是用它們來聽音頻的,極少主動跟耳機對話。但是AI耳機相較于傳統(tǒng)的TWS/OWS耳機來說,最大的變量就在于用戶是在跟大模型、跟一個‘虛擬的人’對話。一開始你可能只是對耳機說,我今天心情不好,你給我講個笑話吧,AI耳機會在聊天過程中主動提議,那你把手里的工作放一放,咱們?nèi)ズ缺Х确潘梢幌拢?然后觸發(fā)大眾點評或者滴滴打車的接口,這就成為了這些App的流量入口,可以獲得App收益的流量分成。”陳正翔說。
在陳正翔描述的這一案例中,AI耳機讓一個原來只想吐槽工作,并不想喝咖啡的人通過大模型下了一單咖啡外賣,或者驅(qū)使他?cè)チ?咖啡館散心,這就是成功的需求塑造。
假如AI耳機調(diào)用了滴滴或者馬蜂窩的接口,在用戶勞累的時候主動觸發(fā)用戶出門旅游的需求,給用戶做行程規(guī)劃、路線安排并發(fā)起一個100公里的順風車訂單,那么在馬蜂窩、滴滴等互聯(lián)網(wǎng)服務商受益的同時,AI耳機的運營商也可以從中獲得抽成,這甚至已經(jīng)為AI耳機趟出一條清晰可見的商業(yè)模式—— 在吉印通業(yè)的利潤只有1%、2%的艱難處境下,單賣硬件是不賺錢的,必須要靠軟件獲取增值收益;而AI耳機對需求的重塑,就是放大這種增值收益的絕佳杠桿。
而要想真正做出這種能重塑需求的AI硬件,首先就需要在 硬件技術上做升級和革新。
值得一提的是,前魅族副總裁、怒喵科技創(chuàng)始人李楠就在籌備帶有攝像頭的AI耳機產(chǎn)品。
這和馬克·維瑟在《21世紀的計算機》里提出的另一條構(gòu)想不謀而合。他認為,更多 傳感器的加入可以給AI設備帶來更多新的交互手段,“隨身攜帶的智能設備+傳感器”將擁有人和環(huán)境的感知能力,拿到環(huán)境數(shù)據(jù)的新型硬件產(chǎn)品形態(tài)將越來越理解人,越來越能滿足甚至重新定義人的需求,逐步替代掉原有的GUI時代的王牌產(chǎn)品,谷歌搜索甚至都將成為歷史。
這也是蘋果這么多年來一直在升級傳感器的原因。每一個傳感器的加入、每一代產(chǎn)品的革新,都解決了上一代產(chǎn)品解決不了的問題;更多傳感器的加入,也讓蘋果積累了更多的用戶行為數(shù)據(jù),為發(fā)現(xiàn)更多新的需求、推出更多新的功能做準備。
連續(xù)創(chuàng)業(yè)者、Airbnb前中國區(qū)產(chǎn)品負責人Roc Yu告訴「甲子光年」,AI硬件中有一個非常好的打法是 超級單品路徑,他認為,Tesla電動汽車就是一個“超級大單品”,它擁有海量的傳感器和上億公里的FSD自動駕駛數(shù)據(jù),用數(shù)據(jù)資產(chǎn)搭建起了自己的護城河。AI硬件產(chǎn)品創(chuàng)業(yè)也可以參考這種打法,讓自己的產(chǎn)品形成一個Data-Information-Knowledge-Wisdom的閉環(huán)。
但 除了硬件技術,軟件和交互方式的突破同樣重要。某前沿科技基金管理合伙人、專注于AI和機器人方向投資的Aaron Qian就在自己的文章中提出了在多模態(tài)大模型出現(xiàn)之后,AI硬件的三層架構(gòu):
多模態(tài)信號輸入 - 傳感器
模型處理和計算 - 計算中心
交互方式 - UIUX設計
Aaron認為,現(xiàn)階段的AI硬件,特別是新品類新團隊的機會大多在第一層,即新式傳感器,但長期中如果不能將價值向第二和第三層延伸,則會陷入消費電子卷成本的深淵無限競爭(參考激光雷達之于自動駕駛)。因此,如何在“軟件定義硬件”的基礎上,更加充分地發(fā)揮軟件的能力,AI硬件創(chuàng)業(yè)者需要考慮的最根本問題。
Roc Yu持有同樣的觀點。他認為, 硬件是入口,真章全在入口后面,垂直的小模型,端側(cè)模型,豐富的場景數(shù)據(jù),機器深度的綁定垂直場景,精密協(xié)作的分工和詳細的Agentic Flow(智能體工作流),才有機會基于數(shù)據(jù)資產(chǎn)和數(shù)據(jù)網(wǎng)絡效應,形成AI時代的護城河——正所謂“冰山底下見真章”。
Roc Yu表示,在超級單品路徑之外,AI硬件的第二類創(chuàng)業(yè)思路是 大生態(tài)路徑,類似蘋果的打法,圍繞硬件這一基礎的載體去做開發(fā)者生態(tài),形成一個類似App Store一樣的開發(fā)者平臺,比如可以以AI耳機為載體,在里面做足夠多的Agent,用戶可以隨時通過語音調(diào)用Agent,滿足自己各樣的需求。
“外在的形式是很容易做的,中國作為制造業(yè)大國,外在function的能力不是難題,核心能力是能否更深層次地觸達、了解用戶,傾聽他、輔導他,陪伴他,這比單純做硬件是難上加難。”Roc Yu說。
尤瓦爾·赫拉利在他的新書《Nexus(智人之上)》中寫道:“計算機在人類之間充當中介,有時候甚至會控制人類。這些計算機與人的連接不同于傳統(tǒng)的人與文件的連接,因為計算機現(xiàn)在能夠自行做出決策、創(chuàng)造想法,并深度偽造親密關系,對人類發(fā)揮過去文件做不到的影響力。”
正如尤瓦爾·赫拉利所說,曾經(jīng)算法驅(qū)動的注意力經(jīng)濟,正逐步演變成AI驅(qū)動的深層次親密關系經(jīng)濟。無論是AI軟件還是AI硬件,他們都是作為一種個人助手,也就是Agent存在的。“未來無論是軟件這種虛擬的Agent還是AI硬件這種實體的Agent,所有的Agent都將成為relationship Agent。”Roc Yu說。
盡管到底是走“硬件+AI”還是“AI+硬件”的道路,市場和工業(yè)界仍然沒有達成共識,但是在多模態(tài)大模型、強化學習、傳感器和新材料技術的突飛猛進下,一個更加智能的、用AI驅(qū)動深層次親密關系的個人計算設備時代離人們將不會遙遠。
*參考資料:
《Rabbit CEO Jesse Lyu isn’t thinking too far ahead》,The Verge
《萬字探討:AI硬件的突圍方向和可能性未來》,鹿其鹿粦chilling
《和怒喵李楠聊AI硬件:取代iPhone的可能是耳機、項鏈、眼鏡,“AI手機”不是正確答案》,腦放電波
(封面圖來源:「甲子光年」使用AI工具生成)
END.