還記得《阿凡達(dá)》嗎?電影裏,人類一按啓動鍵,一幅全息立體的操作界面即呈現(xiàn)在眼前,隨手一點,順序就打開了,隨手一劃,數(shù)據(jù)就按意愿移動。
公衆(zhòng)何時能夠擁有這樣的計算機?這一問題,也在日前在京舉行的2010年中國人機交互研討會上引發(fā)熱議。
中國科學(xué)院軟件研究所戴國忠傳授認(rèn)爲(wèi),2020年,人和計算機的生理界限將漸漸排除。
人機交互是什麼?
人機交互,簡單來說,就是人類與計算機交流互動。兩者之間有這樣一個傳導(dǎo)鏈:通過人機接口技術(shù),使人能夠與計算機發(fā)生聯(lián)系;而計算機則通過一種界面,使人能了解聯(lián)系後的結(jié)果。
想必生于上世紀(jì)70年代的人還記得,爲(wèi)了使用計算機,學(xué)習(xí)DOS命令的辛勞階段吧?
沒錯,這就是人機交互的早期階段。人們只有熟練掌握大批命令語言後,才能高效地操縱計算機。
然而,隨著計算機技術(shù)的飛速發(fā)展,人機接口技術(shù)不斷改進:從早期的穿孔紙帶、面板開關(guān)和顯示燈等交互裝置,發(fā)展到今天的動作追蹤、語音識別、感覺反饋等具有多種感知能力的交互裝置。
用戶界面的發(fā)展也曆經(jīng)了批處理、命令行、圖形界面三個階段。
自圖形界面問世以來,使不懂計算機的一般用戶也可以熟練地使用,計算機開始走向大衆(zhòng)。因此,用戶的需求被空前激發(fā),變得越來越“懶惰”,希望不再通過鍵盤、鼠標(biāo)而是通過雙手、語言等直接對計算機下“命令”。
“人類自然形成的與自然界溝通的認(rèn)知習(xí)慣和形式必定是人機交互的發(fā)展方向。”微軟創(chuàng)始人比爾·蓋茨如是說。因此,研究者們也正在努力讓未來的計算機能聽、能看、能說、能感覺。
“過去,一直基本上人類去適應(yīng)計算機,學(xué)習(xí)計算機語言。”戴國忠說,“未來計算機將朝著適應(yīng)人類的方向發(fā)展,計算機要明白人類的語言和動作。”從計算機發(fā)展來看,戴國忠認(rèn)爲(wèi)有四大趨勢,即移動化、平板化、智能化、3D化。
現(xiàn)實離理想還有多遠(yuǎn)?
未來,人類只要通過語言、手勢、表情等輸入,機器就知道該做什麼,這就是人機交互的理想狀態(tài)。但問題是這樣的“人機交互”離我們在線還有多遠(yuǎn)?
實際上,許多改進的人機交互技術(shù)已在我們在線生活中獲得應(yīng)用。
觸屏技術(shù)被視作通往理想人機交互途中的一個節(jié)點。以蘋果iPhone手機爲(wèi)代表,觸屏技術(shù)爲(wèi)我們在線帶來了新奇的、簡單易用的人機接口,也帶來了夢幻般的操控體驗。其實,1971年,觸摸屏技術(shù)已經(jīng)問世,但是這項技術(shù)真正進入百姓生活,卻是上世紀(jì)90年代。
目前普遍采用的觸屏要緊有電阻式、外表電容式、投射電容式、外表聲波式和紅外線式等5種類型,iPhone用的就是透射電容式觸屏。在2007年以前,投射電容式觸屏的影響力並不大,正是iPhone以及LG普拉達(dá)手機的風(fēng)靡讓這項技術(shù)走俏。
語音成爲(wèi)未來最被看好的人機交互方法。語音識別的研究工作可以追溯到20世紀(jì)50年代貝爾實驗室的Audry系統(tǒng),此後研究者們逐步突破了大詞彙量、連續(xù)語音和非特定人這三大障礙。20世紀(jì)90年代前期,許多著名的大公司如IBM、蘋果等都對語音識別系統(tǒng)的實用化研究投以巨資。目前,國內(nèi)外已經(jīng)出現(xiàn)了一些商業(yè)化的國產(chǎn)產(chǎn)品,譬如語音識別在身份確認(rèn)上的應(yīng)用,準(zhǔn)確率已經(jīng)達(dá)到99%,一句“芝麻開門”打開房門已經(jīng)不是傳說。
而體感技術(shù)的突破,讓我們在線看到離開鍵盤、鼠標(biāo)的希望。
玩網(wǎng)球、釣魚這些遊戲時,遊戲者要像真打網(wǎng)球那樣揮舞手柄。這就是2006年日本任天堂公司推出的家用遊戲主機Wii。通過加速度感知與光學(xué)定位,Wii遙控器可以準(zhǔn)確掌握玩家手持控制器的一舉一動。
還有更厲害的,微軟亞洲研究院院長洪小文博士說,微軟研究出一個叫做Natal的系統(tǒng),不需要拿任何東西,就可以實現(xiàn)和機器的互動。
據(jù)介紹,這個系統(tǒng)還可以辨識人臉,讓玩家自動連上遊戲。另外,它還能辨認(rèn)聲音和同意聲控命令。比爾·蓋茨堅信這項技術(shù)將從遊戲領(lǐng)域走入辦公領(lǐng)域。
以上種種應(yīng)用于屏幕上的操控,可以看做未來應(yīng)用的基礎(chǔ)。
中國技術(shù)何去何從?
目前人機交互應(yīng)用技術(shù)大部分是國外的,那麼中國技術(shù)力量如何呢?
據(jù)了解,國內(nèi)對這項技術(shù)的研究起步較晚。
中國科學(xué)院軟件研究所人機交互技術(shù)及智能信息處理實驗室是最早開始多模態(tài)人機交互研究和開發(fā)的單位之一。並且,該所和北京大學(xué)計算機系、杭州大學(xué)工業(yè)心理學(xué)國家專業(yè)實驗室合作承擔(dān)“多通道用戶界面研究”,在我國首次對智能人機界面中多通道交互方法進行了系統(tǒng)性的研究。
“我們在線要告別跟蹤、仿制的發(fā)展之路。”戴國忠說,“IT企業(yè)不要跟著國外大企業(yè)的思維,只有比照中國人需要的去做,結(jié)合中國傳統(tǒng)文化發(fā)展,才會有突破。”
在洪小文的眼裏,人機交互是一個跨學(xué)科的領(lǐng)域。“其研究需要計算機專家,需要心理學(xué)家,需要社會學(xué)家,需要研究行爲(wèi)科學(xué)的,還需要設(shè)計。中國的機會在于各行各業(yè)都有很多人才。”
洪小文說,“微軟亞洲研究院90%-95%的員工是中國的。我們在線在中國的創(chuàng)新,確實就是中國創(chuàng)新。”同時,他建議,人機交互的發(fā)展應(yīng)該跟中國的生産鏈結(jié)合在一起。
公衆(zhòng)何時能夠擁有這樣的計算機?這一問題,也在日前在京舉行的2010年中國人機交互研討會上引發(fā)熱議。
中國科學(xué)院軟件研究所戴國忠傳授認(rèn)爲(wèi),2020年,人和計算機的生理界限將漸漸排除。
人機交互是什麼?
人機交互,簡單來說,就是人類與計算機交流互動。兩者之間有這樣一個傳導(dǎo)鏈:通過人機接口技術(shù),使人能夠與計算機發(fā)生聯(lián)系;而計算機則通過一種界面,使人能了解聯(lián)系後的結(jié)果。
想必生于上世紀(jì)70年代的人還記得,爲(wèi)了使用計算機,學(xué)習(xí)DOS命令的辛勞階段吧?
沒錯,這就是人機交互的早期階段。人們只有熟練掌握大批命令語言後,才能高效地操縱計算機。
然而,隨著計算機技術(shù)的飛速發(fā)展,人機接口技術(shù)不斷改進:從早期的穿孔紙帶、面板開關(guān)和顯示燈等交互裝置,發(fā)展到今天的動作追蹤、語音識別、感覺反饋等具有多種感知能力的交互裝置。
用戶界面的發(fā)展也曆經(jīng)了批處理、命令行、圖形界面三個階段。
自圖形界面問世以來,使不懂計算機的一般用戶也可以熟練地使用,計算機開始走向大衆(zhòng)。因此,用戶的需求被空前激發(fā),變得越來越“懶惰”,希望不再通過鍵盤、鼠標(biāo)而是通過雙手、語言等直接對計算機下“命令”。
“人類自然形成的與自然界溝通的認(rèn)知習(xí)慣和形式必定是人機交互的發(fā)展方向。”微軟創(chuàng)始人比爾·蓋茨如是說。因此,研究者們也正在努力讓未來的計算機能聽、能看、能說、能感覺。
“過去,一直基本上人類去適應(yīng)計算機,學(xué)習(xí)計算機語言。”戴國忠說,“未來計算機將朝著適應(yīng)人類的方向發(fā)展,計算機要明白人類的語言和動作。”從計算機發(fā)展來看,戴國忠認(rèn)爲(wèi)有四大趨勢,即移動化、平板化、智能化、3D化。
現(xiàn)實離理想還有多遠(yuǎn)?
未來,人類只要通過語言、手勢、表情等輸入,機器就知道該做什麼,這就是人機交互的理想狀態(tài)。但問題是這樣的“人機交互”離我們在線還有多遠(yuǎn)?
實際上,許多改進的人機交互技術(shù)已在我們在線生活中獲得應(yīng)用。
觸屏技術(shù)被視作通往理想人機交互途中的一個節(jié)點。以蘋果iPhone手機爲(wèi)代表,觸屏技術(shù)爲(wèi)我們在線帶來了新奇的、簡單易用的人機接口,也帶來了夢幻般的操控體驗。其實,1971年,觸摸屏技術(shù)已經(jīng)問世,但是這項技術(shù)真正進入百姓生活,卻是上世紀(jì)90年代。
目前普遍采用的觸屏要緊有電阻式、外表電容式、投射電容式、外表聲波式和紅外線式等5種類型,iPhone用的就是透射電容式觸屏。在2007年以前,投射電容式觸屏的影響力並不大,正是iPhone以及LG普拉達(dá)手機的風(fēng)靡讓這項技術(shù)走俏。
語音成爲(wèi)未來最被看好的人機交互方法。語音識別的研究工作可以追溯到20世紀(jì)50年代貝爾實驗室的Audry系統(tǒng),此後研究者們逐步突破了大詞彙量、連續(xù)語音和非特定人這三大障礙。20世紀(jì)90年代前期,許多著名的大公司如IBM、蘋果等都對語音識別系統(tǒng)的實用化研究投以巨資。目前,國內(nèi)外已經(jīng)出現(xiàn)了一些商業(yè)化的國產(chǎn)產(chǎn)品,譬如語音識別在身份確認(rèn)上的應(yīng)用,準(zhǔn)確率已經(jīng)達(dá)到99%,一句“芝麻開門”打開房門已經(jīng)不是傳說。
而體感技術(shù)的突破,讓我們在線看到離開鍵盤、鼠標(biāo)的希望。
玩網(wǎng)球、釣魚這些遊戲時,遊戲者要像真打網(wǎng)球那樣揮舞手柄。這就是2006年日本任天堂公司推出的家用遊戲主機Wii。通過加速度感知與光學(xué)定位,Wii遙控器可以準(zhǔn)確掌握玩家手持控制器的一舉一動。
還有更厲害的,微軟亞洲研究院院長洪小文博士說,微軟研究出一個叫做Natal的系統(tǒng),不需要拿任何東西,就可以實現(xiàn)和機器的互動。
據(jù)介紹,這個系統(tǒng)還可以辨識人臉,讓玩家自動連上遊戲。另外,它還能辨認(rèn)聲音和同意聲控命令。比爾·蓋茨堅信這項技術(shù)將從遊戲領(lǐng)域走入辦公領(lǐng)域。
以上種種應(yīng)用于屏幕上的操控,可以看做未來應(yīng)用的基礎(chǔ)。
中國技術(shù)何去何從?
目前人機交互應(yīng)用技術(shù)大部分是國外的,那麼中國技術(shù)力量如何呢?
據(jù)了解,國內(nèi)對這項技術(shù)的研究起步較晚。
中國科學(xué)院軟件研究所人機交互技術(shù)及智能信息處理實驗室是最早開始多模態(tài)人機交互研究和開發(fā)的單位之一。並且,該所和北京大學(xué)計算機系、杭州大學(xué)工業(yè)心理學(xué)國家專業(yè)實驗室合作承擔(dān)“多通道用戶界面研究”,在我國首次對智能人機界面中多通道交互方法進行了系統(tǒng)性的研究。
“我們在線要告別跟蹤、仿制的發(fā)展之路。”戴國忠說,“IT企業(yè)不要跟著國外大企業(yè)的思維,只有比照中國人需要的去做,結(jié)合中國傳統(tǒng)文化發(fā)展,才會有突破。”
在洪小文的眼裏,人機交互是一個跨學(xué)科的領(lǐng)域。“其研究需要計算機專家,需要心理學(xué)家,需要社會學(xué)家,需要研究行爲(wèi)科學(xué)的,還需要設(shè)計。中國的機會在于各行各業(yè)都有很多人才。”
洪小文說,“微軟亞洲研究院90%-95%的員工是中國的。我們在線在中國的創(chuàng)新,確實就是中國創(chuàng)新。”同時,他建議,人機交互的發(fā)展應(yīng)該跟中國的生産鏈結(jié)合在一起。