Kinect或將成為第三次人機交互革命的原點,不僅因為其全新的操作方式,更因為其背后所蘊含的創新精神。
2010年11月初,微軟家用視頻游戲主機Xbox 360的體感外設Kinect正式公開銷售,之后在包含圣誕假期在內的60天內,Kinect共賣出去800萬臺。
“在大多數商店,Kinect確實都已經賣光了。”微軟亞洲硬件中心總經理胡君明在接受采訪時說。他還提到一件趣事,微軟亞太研發集團主席張亞勤在 CES(美國消費電子展)期間,想在洛杉磯買幾臺Kinect,卻發現到處斷貨,連微軟自己的員工商店都賣光了。最后他回到雷德蒙,在微軟總部的商店才買到。由此可見市場的火爆。
在如此短的時間內賣出800萬臺,這實在是一個令人咋舌的數字。如果簡單對比,Kinect的銷售速度是iPad的兩倍;再以收入規模考量,只用了兩個月的時間,它就變成了一個價值10億美元以上的生意。
毫無疑問,Kinect已經成為微軟最為耀眼的新星,也是這家軟件巨人歷史上在硬件外設領域最成功的產品。微軟在硬件上如此吸引人眼球,還是在5年前Xbox 360游戲機發售的時候。
在全球一片暮氣沉沉的家用游戲機市場,Kinect重新喚回了大眾的激情——用它近乎神奇的人機交互方式。借助Kinect,普通人不需要使用任何手柄、搖桿、鼠標或者其他遙控器,即可用身體直接控制游戲。
比如要玩體育游戲,你只需要接通電源,然后站到電視機前面即可。所有對游戲角色的操控都用一種最自然的方式完成,不管是乒乓球的揮拍還是保齡球的擊打,你只需要像現實中那樣擺出動作即可。
又比如賽車,如何控制方向?想象你真的在開車,把雙手舉到空中就像握著一個方向盤,左右轉動就行了。對了,你還可以在空中模擬掛擋。
與其將這稱之為“體感”,不如說是“自然人機交互”。在拋開遙控器之后,人能夠以身體最自然的方式與終端進行信息的交互并完成互動。Kinect有句廣告語——“You are the controller”(你就是遙控器),不需要去適應游戲手柄上的搖桿和按鍵,普通人玩游戲的門檻被大大降低。
有許多變革是由娛樂開始,而Kinect或許正是人機交互方式變革的又一個起點。
Kinect是如何煉成的
對微軟而言,Kinect的重要性表現在兩個方面:它大大延長了Xbox 360游戲機的生命周期,并成功為它帶來了大量新用戶;它證明了微軟有時候并不保守,在創新上仍然具有巨大的能量,不管是觀念的前瞻性還是對新產品的執行力上。
但這樣一款產品,在其研發階段的初期卻并不被人所看好。“我們最初都覺得這個項目難以成功,它涉及太多技術,包括紅外線視頻捕捉等,而其中一些技術并不是微軟的。”微軟亞洲工程院院長張宏江說,“但最后圍繞產品,通過合作等形式,Kinect整合了微軟內外部的種種技術,走到了最后。它不僅是一個產品的成功,也為我們從工程學的角度去思考如何做產品,提供了一個很好的例證。”
時間回到2008年夏天,以色列一家名為Prime Sense的公司來到硅谷,向許多企業展示他們革命性的3D圖像識別及動作捕捉技術,這一技術能夠讓用戶以身體替代遙控器。技術迅速引起了一票游戲、科技和消費數碼公司的注意,其中就包括了剛以多點觸摸的技術引領潮流的蘋果公司。
據該公司首席執行官Inon Beracha回憶,“蘋果實在討厭”,雖然這一技術與蘋果公司有著許多天然的共性,但蘋果迅速拿出一系列法律文檔和保密協議,嚇退了Beracha。
與此同時,微軟游戲開發部門也盯上了該技術。此時,正是任天堂Wii游戲機如日中天的時候,Wii游戲手柄新奇的人機互動方式激發微軟和索尼開始尋找相關領域的機會。雖然有許多人認為“Natal”(Kinect開發代號)的想法過于激進,對其能否量產化存在疑慮,但“讓用戶有與Wii完全不同的體驗”最終占據了上風。
在1年多的時間里,從技術概念到產品實現,中間許多設計幾經改動。胡君明舉了一個例子:美國設計的產品原型要求Kinect必須放兩個麥克風,這樣就能隔離噪音,但麥克風的角度應該怎么放才能達到最好效果?“在我們深圳的聲學實驗室嘗試了很多次,原來是45度,再到46度,現在改成50度。這個變化并不大,但許多細節累積起來,指引我們向著最佳體驗的方向走。”
真正游戲的時候,這種感覺更加明顯。當玩家的虛擬形象站在大體育場上的時候,如果揮動手臂,會發現觀眾會與你互動;擲標槍的時候,玩家跑步的頻率會決定他的速度,投擲的角度也被完全識別,并最終表現在成績上。
革命性的技術——3D圖片識別與視頻捕捉,加上硬件體驗的不斷優化,再加上對應其特性的專屬游戲開發,在游戲這一特定的應用場景對技術的強化,最終塑造了Kinect這一人機互動的革命性產品。
跳出游戲
雖然從Xbox和相關游戲出發,但Kinect生來具有強大的外延性。捕捉動作、識別成命令、在終端中執行,當它從以色列Prime Sense那幫軍工工程師的實驗室中走出來,在微軟的推動與整合下成為普通人可以輕易獲取的具體產品之后,它馬上引爆了全球用戶的想象力。
雖然不符合商業規范,但Kinect的破解方法迅速流傳在互聯網上,用戶主動地去不停延展它的邊界。首先,開發者或說“黑客”們想辦法讓它與PC連接起來,在此基礎上,許多富有想象力的應用場景開始陸續出現。
有些是惡搞,比如有人將它連在了“超級馬里奧”游戲上,用身體去控制馬里奧頂磚頭、下水管、吃蘑菇,樂趣雖然增添了很多,但要想救下公主,玩家身體要頻繁運動,需要足夠的體力支撐。還有一些是實用派,直接用體感來打開瀏覽器上網,將身體的各種運動方法變成了鼠標點擊的各項命令。最近出來的一項應用,是在一個虛擬世界,讓玩家能以各種動作來搭建萬物,體驗做上帝的樂趣。
顯然,微軟也看到了Kinect的外延趨勢勢不可當,但其路線將會符合微軟的自身戰略。在2011年的CES上,微軟展示了Kinect基于虛擬形象的又一項應用場景——社交。因為本身自帶攝像頭、麥克風,Kinect能夠迅速識別人臉并轉化為每個人獨有的虛擬形象,而新的應用場景允許多個虛擬形象聚集在一個房間之中聊天說話,所有的動作實時捕捉。這使得相隔很遠的朋友們能夠在一個互聯網中的房間更加充分地互動,同時又具有游戲的某些樂趣。在 Kinect的社交方式強化了Xbox Live之后,后者能夠延伸到其他終端產品上,比如Windows Phone 7,并借助大量的新用戶信息,串起這些產品。
據悉,微軟的下一代操作系統Windows 8將會支持Kinect,這或許是一次里程碑式的兼容——它將標志著Kinect從游戲外設的定位中走出來,與鼠標、鍵盤、攝像頭一起,成為新的普遍意義上的人機交互工具。
人機交互的三次革命
從世界上有計算機開始,人機交互就伴隨著計算機的進化而進化。這在很大程度上是顯而易見的,因為我們必須讓計算機讀懂我們所輸入的命令,并根據命令來運算和反饋。所謂人機交互,就是人與計算機打交道的方式。
這一歷史最早可追溯到1880年,美國人口調查局的赫曼·霍列瑞斯由于疲于手工處理人口普查數據,開始尋求用機器制表的方式。其成果是穿孔卡計算機的出現,而霍列瑞斯也因此被稱為“數據處理之父”。現在的人很難想象,原始的人機交互就是通過“卡槽”來定位信息,然后用機器來讀懂它。
一直到真正的計算機出現,都沿用著打字機時代“鍵盤”這一傳統人機交互方式。但1983年,鼠標出現了。
鼠標的學名叫“顯示系統縱橫位置指示器”,其原理和用法不用贅述。與鍵盤中的方向鍵相比,它顯然更加符合人的自然習慣。這是人機交互的第一次革命,鼠標也已經成為今天絕大多數電腦用戶不可或缺的工具。
值得一提的是鼠標的普及路徑。1983年,第一款鼠標是伴隨蘋果公司Lisa電腦發布的;隨后不久,微軟操作系統Windows 3.1宣布對其兼容,然后從Windows 95開始,鼠標伴隨操作系統和電腦的普及開始變成標配產品——這與今天Kinect的路徑似乎異曲同工,只不過我們還不知道微軟能將操作系統與 Kinect兼容到何種程度,或者是否會為Kinect開發出全新的操作界面與操作方式。
鍵盤與鼠標的人機交互組合,從PC時代一直延續到互聯網時代,并無太大改變,直到智能手機和多點觸摸的出現。
迅速普及的多點觸摸技術,是人機交互史上的第二次革命,而引領它的又是蘋果公司與它的革命性手機iPhone。
在iPhone問世之前,智能手機一直在沿襲鍵盤和鼠標的信息輸入方式。鍵盤是必須有的,不能少于10個;鼠標太大,對位置的指示采用觸摸的方式完成。
但多點觸摸打開了另外一扇窗戶,它讓所有人意識到其實鍵盤可以成為觸摸的一部分,而很多命令其實能通過多個手指在觸摸屏上劃動方式的不同來完成,比如放大和縮小圖片。
這樣的整合,讓移動終端真正擺脫了傳統PC終端的思維桎梏。多點觸摸以手勢來完成人機交互,更易于上手,同時也更加自然。
對有過iPad使用體驗的人,感受將尤為明顯。“學電腦”一度是一個名詞,孩子可能需要長到七八歲才能開始學習并熟練使用鍵盤,但現在一個不到兩歲的孩子已經能熟練地在iPad上進行娛樂,甚至據說不足3歲的孩子就可以自行從軟件商店中下載游戲。
得益于新的人機交互技術,人對機器的使用門檻在進一步降低,因為計算機已經越來越能讀懂人在自然狀態所傳遞的命令。
由此看Kinect,其普適化的征程才剛剛開始。
未來照進現實
很難相信就在兩個月前,微軟對Kinect的期望還是“將游戲推進千家萬戶”。當許多新用戶買Kinect不是為了游戲,而是為了體驗更加未來與 “科幻”的操控方式,為了體驗全新的人機交互體驗,所有具備敏銳洞察力的企業都不會忽視人們的這種渴望。“這對微軟來說是一個驚喜,現在來看,這件事的意義遠遠比游戲要大。”胡君明說,“Kinect將會是一個歷史性產品,這樣的人機交互方式一定會用在其他產品上,一定會用在PC上。”
不難想象有了Kinect之后的電腦操控方式。鍵盤或許還在,但鼠標將逐漸消失,因為只要在紅外攝像頭所能捕捉的有效范圍內,手指的任意移動都能精確地進行位置確認。五指張開,頁面放大;手上下揮動,頁面移動;雙手合攏,頁面關閉……在更加自然的操控界面中進行更加自然的人機交互,這一切還僅僅是基本。
而在視頻捕捉技術之外,語音識別技術或許也將由此激發。Kinect自帶的麥克風可供用戶進行簡單的命令操作,但很多人都不知道其實從 Windows Vista開始,PC操作系統就自帶了非常強大的語音識別功能,且能天然識別包括中文在內的主要語言。語音技術實際上已經非常成熟,它所缺乏的只是一個普遍使用的應用場景,就如游戲之于Kinect。
這樣的場景正在開始出現、積聚。比如在谷歌地圖和許多手機的谷歌客戶端中,已經支持語音輸入,如果你在地圖中已經用GPS定位了自己的位置,說“咖啡”一詞,馬上地圖上就會顯示在你周圍的咖啡館信息。蘋果新的iOS系統中,也已經集成了語音識別,長摁屏幕下方的Home鍵呼叫出界面之后,你能用“打給某某人”的語音命令來直接撥打電話,或者用“播放誰誰誰”來播放某個歌星的歌曲。
更加富于想象力的人機交互方式其實已經產生。在麻省理工學院,一個名叫Pranav Mistry學生極富想象力地將手勢識別、攝像頭、投影和云計算結合在一起,發明了名為“第六感”的技術——不用攜帶任何大尺寸的東西,所有的終端都濃縮在胸口的掛飾和貼在手指的膠片中,當你想要拍照時,只需要用四根手指擺出一個框的形狀;當你想要玩游戲,比如賽車時,隨手拿過一張紙,它就能瞬間變成顯示屏,而手指則是方向盤。
許許多多的創新交互方式,實際上缺少的是應用到何種產品、何種場景中,以及如何量產化銷售的難題。很多時候連技術所能應用的場景都已經具備,新的人機交互與民眾普及之間,只有“量產化”這一層薄薄的窗戶紙。
是的,這層窗戶紙現在已經被Kinect捅破了。
當第一個顯得甚至有些“激進”的全新交互產品出現并大獲成功,可以預見的是,必然會有追隨者出現。起碼在家用游戲機領域,任天堂和索尼不會聽任微軟攜Xbox 360和Kinect一騎絕塵。如果Kinect的互動方式經由Windows 8而得到更廣泛的普及,蘋果也不會坐視不理。
在人機交互領域,更加大膽的創新精神正在被喚醒,而在此之前,它正是那些技術積累豐厚、產品實踐強悍、聰明卻又保守的大公司遲遲無法邁出的一步。