庫克在Vision Pro旁擺勝利手勢也不願做這事 Apple對它沒信心?

撰文:機器之心
出版:更新:

「這是明天的工程,」蘋果開發者大會WWDC 23 後,蘋果 CEO 庫克接受《早安美國》聯合主持人羅賓·羅伯茨採訪時說,「所以,你要活在未來,今天就要這樣做。」

昨天凌晨(北京時間),蘋果在 WWDC 23 上正式發布了首款頭顯設備 Apple Vision Pro。這款外觀酷似滑雪鏡的產品被特意留到了發布會最後「One more thing」保留環節,這一首創於喬布斯(1999年)的最高規格待遇,過去僅見於 MacBook Air、Apple Watch 等代表性硬件。

Apple Vision Pro 使用 MR(混合現實),允許用戶在不完全脱離周圍環境的情況下利用該技術(Apple)

不同於 VR,Apple Vision Pro 使用 MR(混合現實),允許用戶在不完全脱離周圍環境的情況下利用該技術。售價 3499 美元(很蘋果),計劃於明年上市。

相比之下,Meta 宣佈的 Quest 3 (也可以實現 MR )售價為 499 美元,而 Quest 2 的零售價僅為 299 美元。

01、又一個典型的蘋果式創新

貴,有貴的理由。

全球頂尖硬件製造商的一貫優勢,特別是性能和工業設計,又一次成為蘋果豔壓群芳的力量。

+14

Apple Vision Pro 外形非常流暢,酷似滑雪護目鏡。正面部分系一整塊以 3D方式成型的玻璃,經拋光處理。玻璃線條流暢,與定製鋁合金邊框融為一體,微妙貼合用戶臉部曲線輪廓。

設備頂部有一個按鈕和一個數字表冠(還記得蘋果手錶的工業設計?)。轉動錶冠,用戶就能從一個極端(比如完全沉浸)平滑過渡到另一個極端(比如透視),自由控制在環境中的沉浸程度。

為了追求性能和體驗的極致,蘋果的硬件配置從不吝嗇(所以也從來不便宜)。

顯示屏很瘋狂。Vision Pro 採用超高分辨率顯示系統,兩個微型 OLED 顯示器(約郵票大小)具有 2300 萬像素,相當於給每隻眼睛配備了一台 4K 以上的電視。你甚至可以用它在 Safari 中閲讀文字文本。

微型 OLED 顯示器的結構與傳統顯示器不同。它直接建立在晶片晶圓上,而不是玻璃基板上,這使得顯示器更薄、更小、更省電。

由於靠近眼睛,技術上只允許像素尺寸在 4 至 20 微米之間,而標準 OLED 面板的像素尺寸為 40 至 300 微米。

此外,它們必須具有更快的微秒級響應時間,這樣才能夠成為 AR/VR 應用的理想選擇。

兩年多前,蘋果已與台積電合作開發這種微型 OLED。當時還處於試產階段,媒體曾報道稱,需要數年時間才能實現量產。

深層動物腦的作用下,如果很長一段時間內看不到周圍的環境,很多人會感到非常不舒服(這也是庫克批評 Meta VR 所在)。

戴上 Vision Pro,你不會完全「與世隔絕」。設備具有一個外向顯示屏,創新 EyeSight 系統幫助用戶與周圍的人保持連接:

當有人靠近使用者時,設備的視區會變透明,讓用戶可以看見這個人,同時走近的人也會看到用戶的眼睛。

除了隔絕帶來的不適,如果你試過 VR ,一定也嘗過延遲導致的暈眩和噁心。

Vision Pro 採用雙晶片設計,搭載 Mac 級別的 M2 晶片單元,同時為實時傳感器配備了一個新的處理器 R1。

R1 專門處理來自設備周圍十多個攝像頭、傳感器和麥克風的輸入,能夠在 12 毫秒內將新圖像傳輸到顯示器,比眨眼還快 8 倍。這意味着幾乎消除延遲,視覺體驗上感受不到抖動或降幀。

「Apple Vision Pro 分辨率是我體驗過的最好的。」有專業人士在大會後表示,它絕對實現了我們都相信總有一天會實現的沉浸感。

(AR 與 VR 之間無縫切換的)See-Through 體驗方面,沒有延遲,非常高的品質,它只會變得更好。

不出所料,蘋果同時發布了與之相配的操作系統 VisionOS,稱之為「全球首創的空間操作系統。」

該操作系統引入了專為低延遲空間計算而設計的新功能,例如實時執行引擎和動態注視點渲染管道,可最大限度地提高用戶眼睛聚焦的圖像質量。

還有多應用程序 3D 引擎,允許不同的應用程序在同一個模擬中同時運行,為多任務處理和協作開闢了新的可能性。

Vision Pro 不依賴手持設備(控制器),完全基於語音、視覺以及手感操控。用戶可以根據虛擬鍵盤進行文字輸入,也可通過手指進行畫面的放大縮小,實現現實世界和虛擬世界的融合。

這也是為什麼你會在設備周圍數出 12 個攝像頭、一個 LIDAR 傳感器、一個原深感攝像頭還有紅外泛光照明器以及幾個麥克風(聽見美元的聲音了嗎?):

這些先進的傳感器陣列,包括高分辨率攝像頭、精確的眼動追蹤和實時 3D 映射,可實現迅速響應且直觀的輸入,擺脱硬件控制器的束縛。

蘋果花了 10 年時間打造隱私品牌,現在卻推出了一款配備十幾個始終開啟的攝像頭的設備。

不難發現,蘋果式創新的顯著特點都在頭顯設備上展現出來。蘋果一直很樂意也有耐性橫跨幾代產品,為新功能打基礎。

比如,Apple Pay 首次出現在 iPhone 6, 但 iPhone 5S 上就有了作為基礎的Touch ID 和安全元素;2014年推出 Apple Watch ,必要的硬件從 iPhone 4S 開始陸續登陸手機。

2017 年,蘋果推出 ARKit, 截止 2022 年 AR Kit 已經更新到 6.0 版本,所以基於原來手機的生態,蘋果已經在 AR 上做過很多開發應用生態的嘗試。

蘋果也表示,iPhone 已經是世界上最大的增強現實平台,而 VisionOS 充分利用了其中的許多功能。

另一方面,這些年蘋果的創新一直聚焦在連續改進、完善和縮小組件,進而催生了類似手錶、耳機這樣的小型硬件設備。

這一次,無論是自研還是收購,微創新(比如 3D sensing )、更好的攝像頭(比如,iPhoneX 就配備了原深感攝像頭)和晶片(比如 M 系列晶片)等組合起來,又催生了頭顯設備。

02、許多用途?蘋果有點慌

如何與蘋果已有的生態優勢(包括硬件與軟件)打成一片,是 Vision Pro 的另一個賣點。

VisionOS 建立在 macOS、iOS 和 iPadOS 的基礎上,意味着它將與許多現有應用程序和生態兼容,通過新的交互方式落地娛樂、辦公等場景。

換句話說,你可以用更加沉浸的方式使用熟悉的 iPhone 和 iPad Apps,包括消息、音樂、照片、FaceTime、遊戲等。

例如,在瀏覽全景照片時,它可以把你拉回拍攝某張照片時的具體場景,這是之前蘋果的其他設備所做不到的。

除了自己的生態,蘋果已經表示,這款頭顯設備可以與 Microsoft Office 應用程序以及 WebEX 和 Zoom 等視頻會議服務配合使用。

但是,等等,這裏並沒有真正的AR應用程序,而是漂浮在空中的桌面應用程序。3499 美元的價值就在於可以將一個大屏帶到任何地方,為已有的簡單 2D 應用程序提供身臨其境的體驗?

難怪有人吐槽 Vision Pro 更像一個「昂貴的開發工具包」。這倒也符合蘋果選擇在開發者大會上發布的初衷——智能手機平台的數字地主,為廣大開發者打開了一個新的「數字西部」。

至於蘋果的開發者社區能否為 Vision Pro 生成殺手級應用程序,仍然懸而未決。

3499 美元與續航兩小時的反差,是另一個槽點。計算機的所有工作最終都以熱量的形式結束,歸根結底是能耗問題,但 Vision Pro 顯然沒有解決了。誰會在工作場合帶着它?這是營銷還是勸退?

庫克寧可在 Vision Pro 身邊擺出勝利的手勢,也不願意戴上它讓媒體拍照。(Apple)

庫克寧可在 Vision Pro 身邊擺出勝利的手勢,也不願意戴上它讓媒體拍照,或許透露出蘋果對一代產品的成功不太有信心,不想成為笑點,但又必須推出它。

不妨看看 Meta 的數據。現在出售的頭顯中 90% 是 VR, Quest 佔據了約 80% VR 市場。其中 Oculus Quest 2 目前在 VR/AR 設備領域一枝獨秀。

2021 年,Quest 2 出貨量 1120 萬左右。業內一般認為,在一個平台上需要有約 1000 萬人使用及購買 VR 內容才能使開發人員持續研發以及獲利,而一旦超過這個門檻, 內容與生態系統將會實現跨越式發展。

顯然,Meta 希望低價出售更多設備,儘快跨越用戶規模的臨界值。除了廣告收入,這也意味着他能複製蘋果在智能手機時代對自己做過的事:

不再依賴硬件製造商來分發自己的應用,自己就是新平台的地主,並對應用商店裏的每一筆雁過拔毛。

而對於蘋果來說,無論是為了增長、為了市值,一定時候仍然需要媲美 iphone 的下一個硬件平台。與距離自己基因更遠的汽車(手錶、耳機用不上變速箱、發動機)相比,頭顯設備更不容有失。

03、 AIGC ?從 Siri 到 Jarvis?

不過,除了領先下一代硬件平台的緊迫性,本次大會上,蘋果依舊沒有就類似於 ChatGPT 或 Google 的 Bard 搜索引擎的生成式 AI 產品發布任何重大公告。

除了悄悄地在幾個較小的功能中注入了 AI。

比如,一個由大型語言模型(LLM)驅動的鍵盤。由於在設備上運行了Transformer 模型,鍵盤能學習你的打字模式,自動糾錯。

大型語言模型(LLM)驅動的鍵盤,便有自動糾錯功能。

至於 Siri ,存在感弱得就像「打了一場醬油」。

使用頭顯設備時,「有了 Siri,你可以快速打開關閉應用,播放音樂,還有更多。」

不過,如果 Siri 在手機上的語音轉錄目前不能很好地工作,那麼頭顯設備的語音控制又會有多好?之前有媒體爆料,在蘋果內部,Siri 仍然因其缺乏功能和改進而受到嘲笑,包括 Vision Pro 團隊。

在 iOS17 更新中,喚醒詞不需要 「Hey Siri 」,直接說 「Siri 」即可。

直接說 「Siri 」即可。

不得不說,讓古早的 Siri 成功逆襲,挑戰 ChatGPT 這樣的創意助手,是一件非常困難的事。

Siri 發布於 2011 年,遠在深度學習在 2012 年席捲人工智能社區之前。本質上還是一種命令控制系統,僅能理解有限的問題和請求列表,比如「北京天氣怎麼樣?」或者「打開卧室的燈。」

由於缺乏上下文感知,Siri 只擅長它被訓練做的事情,這限制了它的能力。

Siri 的設計也很笨重,以至於在這個巨大的數據庫裏添加一些新短語,就要花六個禮拜的時間重建這個數據庫。如果增加更復雜的功能,比如新的搜索工具,可能需要一年。

不過,弔詭的是,十年來一直將隱私一致性置於中心的蘋果,因其對 AI 與隱私、安全的平衡能力,又在 AIGC 時代佔據了一個很獨特的位置:

「我們正朝着在邊緣設備上使用個性化模型的未來邁進。」Stability CEO Emad Mostaque 在一次採訪中提及。在這個過程中,蘋果的神經引擎 (NE) 可能會發揮關鍵作用。

大多數 iPhone 、iPad 都有神經引擎,一種特殊處理器(NPU),非常適合讓機器學習在蘋果硬件上快速運行。如果能將這些設備的機器學習能力與保存在設備上的個人數據訪問相結合,蘋果有可能創建一個獨特的私人解決方案,將 Siri 從零變成英雄(Jarvis)。

在 Emad Mostaque 看來,這個神經引擎可以解決當前大型語言模型 (LLM) 的一些侷限性,而這一優勢使蘋果處於平衡強大 AI 功能與用戶隱私和安全的最前沿。

「 蘋果正在等待大多數用戶使用帶有神經引擎的 Soc,將 Siri 升級到 Jarvis 的水平。」 他認為。

04、什麼最重要?

但 AIGC 並不是蘋果眼下最重要的事情。

準確地說,蘋果沒有在今年的開發者大會上宣佈基於大語言模型的主要功能,對 Siri 造成了挑戰,但不是蘋果本身。

蘋果在智能手機時代的主導地位,其整體體驗由軟件質量,卓越的硬件和生態系統所決定,並沒有受到 Siri 令人失望的表現的困擾。

在可預見的未來,蘋果仍然主導着 AI 應用的平台——畢竟,ChatGPT 首先在 iPhone 上發布了他們的應用程序。

一個更大、更重要的賭注在於頭顯設備是否止步於一個配件,還是會成為真正 iPhone 一樣的平台?如果是後者,需要多長時間?

無論如何,推出 Vision Pro 就像走上鋼絲。3499 美元的數字雖令人咋舌,但也是明智的,雖然很可能暗含商業上的失敗:創新的成本總是隨着時間的推移而不斷下降,而為全新產品類別提供引人注目的體驗應該得到優先考慮。

著名分析師曾算了一筆賬,將一些代表性硬件初上市價格折算成當下的美元價格。消費類計算機的降價速度非常快,蘋果硬件初上市價格也曾貴得要死。

也別忘了,在迅速迭代直到該設備成為原始概念的最佳版本,吸引人們在零售門店外排起長隊,改變市場軌跡的能力上,蘋果依舊無以倫比。

延伸閱讀:用4K電視看舊片卻出現低畫質? 箇中原因拆解 教你獲取高清片源

+18

【本文轉自「機器之能」,微信公眾號:almosthuman2017】