信息來源:新戰(zhàn)略機(jī)器人網(wǎng) 文章整理:機(jī)械院市場部
目前的機(jī)器人已經(jīng)能夠勝任精確、重復(fù)性的工作,但很多時候,它還不能夠靈活地為新任務(wù)進(jìn)行自我調(diào)整,也不能應(yīng)付一個不熟悉的或不確定的情景。不過,這些情況都在發(fā)生改變,機(jī)器人正在變得更加智能。我們不禁要問,讓機(jī)器人實現(xiàn)智能的關(guān)鍵技術(shù)到底是什么?這些技術(shù)在最近十年會發(fā)展到什么程度?整個產(chǎn)業(yè)的應(yīng)用前景將會如何?
隨著家用機(jī)器人的應(yīng)用需求不斷增加,人工智能相關(guān)技術(shù)不斷進(jìn)步,硬件性能的增長,服務(wù)機(jī)器人近年來開始從實驗室走向家庭,并從掃地機(jī)器人等單一功能向多功能的個人機(jī)器人發(fā)展。
感知、認(rèn)知和行為控制
機(jī)器人的技術(shù)按照通常的理解分為三個部分,感知、認(rèn)知和行為控制。感知主要是基于視覺,聽覺及各種傳感器的信息處理;認(rèn)知部分則負(fù)責(zé)更高層的語義處理,如推理,規(guī)劃,記憶,學(xué)習(xí)等;行為控制部分專門對機(jī)器人的行為進(jìn)行控制。
提到機(jī)器人,一個最近經(jīng)常提及的詞是人工智能。人工智能是用計算機(jī)來實現(xiàn)類似于人的智能行為的一門學(xué)科。機(jī)器人本身即是人工智能的一個終極應(yīng)用目標(biāo)之一。所以談到機(jī)器人,人們很容易聯(lián)想到人工智能。人工智能的確對于機(jī)器人非常重要,上面提到的三個部分的技術(shù)都與人工智能相關(guān)。
從應(yīng)用角度看,機(jī)器人由于有一定的自主性,能與人和環(huán)境交互,與之前的計算設(shè)備(包括電腦,手機(jī)等)相比,對智能的要求較高,這也是人工智能逐漸受到關(guān)注的一個原因。
傳統(tǒng)的人工智能做為一門學(xué)科,起源于20世紀(jì)50年代的達(dá)特茅斯會議,后來經(jīng)過幾次大起大落,在基礎(chǔ)理論和方法上積累了豐富的成果。從早期的符號計算系統(tǒng),到專家系統(tǒng),再到90年代發(fā)展起來的機(jī)器學(xué)習(xí),大數(shù)據(jù)分析,都可以算是人工智能的范疇。在圖像、語音、搜索、數(shù)據(jù)挖掘、社會計算等領(lǐng)域,又派生出了一些相關(guān)的應(yīng)用研究。其中與機(jī)器人聯(lián)系較為緊密的包括計算機(jī)視覺,語音和自然語言處理,還有智能體(Agent)等。
從技術(shù)上看,人工智能要達(dá)到人類級別的智能,要走的路還非常遠(yuǎn),因為目前對人的智能機(jī)理尚未研究清楚。但從實用角度看,根據(jù)目前技術(shù)的進(jìn)展,如果能夠部分模擬人的智能行為(比如認(rèn)出主人并進(jìn)行相應(yīng)的交互)并達(dá)到較好的用戶體驗,將會在短期內(nèi)取得突破性進(jìn)展。當(dāng)然這在技術(shù)研發(fā)上還需進(jìn)一步解決技術(shù)的實用性、魯棒性問題。畢竟以往的不少機(jī)器人都還在實驗室或者受限的環(huán)境中(比如養(yǎng)老院)進(jìn)行研發(fā)和測試,而新興的家庭服務(wù)機(jī)器人,將在家庭環(huán)境中獨(dú)立或者半獨(dú)立地(通過與人的協(xié)作)完成某些服務(wù),這對技術(shù)的魯棒性提出了更高要求。其中的一些,如計算機(jī)視覺、語音識別等核心技術(shù)還在不斷地改進(jìn)中,還沒有發(fā)展到完全成熟。所有這些,都決定了需相當(dāng)深入的研發(fā)工作,才能實現(xiàn)真正的實用化、智能化的家庭服務(wù)機(jī)器人系統(tǒng)。
機(jī)器人不是一堆機(jī)械和芯片
在以往對服務(wù)機(jī)器人的研究中,一個典型的目標(biāo)應(yīng)用是機(jī)器人可以做家務(wù)勞動,這就要求機(jī)器人可以用手臂去操作物體(抓放)。在這些方面的研究雖然較多,但從目前的技術(shù)進(jìn)展看,在幾年內(nèi)實現(xiàn)機(jī)器人做家務(wù)勞動,仍有諸多的挑戰(zhàn)。
1、目前的機(jī)器人,尤其是人形機(jī)器人的成本過高。舉例說,一條機(jī)器人的手臂可能需幾萬美元,而機(jī)器人的手部就需要1萬多美元,整個機(jī)器人的造價,更是普通家庭無法承受的。
2、機(jī)械手的靈巧程度,仍然難以和人手相媲美。
3、在安全性方面也存在需要解決的問題。有著鋼鐵之軀的機(jī)器人一旦進(jìn)入家庭,由于程序錯誤,不小心揮揮手、伸伸胳膊,都可能對血肉之軀的人造成巨大傷害。
機(jī)器人如果暫時不能做家務(wù)勞動那又有何用,這是不少人關(guān)心的一個問題。如果不能應(yīng)用,機(jī)器人不過是一堆機(jī)械和芯片而已。目前除了類似掃地機(jī)器人這樣能夠?qū)崿F(xiàn)比較單一功能的機(jī)器人外,還有不少機(jī)器人的用途正在發(fā)展之中。
機(jī)器人作為一個新型智能設(shè)備,普通用戶最關(guān)心的是機(jī)器人可以為他們做些什么?如前文所述,機(jī)器人目前還難以實現(xiàn)類似做家務(wù)這樣的應(yīng)用。而要達(dá)到人的智力水平,也還需要較長的發(fā)展時間。所以在應(yīng)用方面也需要針對人工智能技術(shù),特別是感知認(rèn)知技術(shù)的現(xiàn)狀進(jìn)行設(shè)計,要充分利用最新技術(shù),實現(xiàn)在過去看來不可能實現(xiàn)的功能。預(yù)計未來十年,市場上出現(xiàn)的服務(wù)機(jī)器人將具有以下特點。
1、機(jī)器人將實現(xiàn)低成本。在前文中提到,如果讓服務(wù)機(jī)器人進(jìn)入專業(yè)或家庭服務(wù)領(lǐng)域,成本需足夠低。專業(yè)服務(wù)機(jī)器人的成本可以相對高些,而家庭服機(jī)器人則需嚴(yán)格控制成本。
2、機(jī)器人將擁有多功能特點。目前在家庭中使用的服務(wù)機(jī)器人主要是掃地機(jī)器人這樣能夠?qū)崿F(xiàn)單一功能的機(jī)器人。未來多功能的機(jī)器人將有較大的發(fā)展,出于成本考慮,機(jī)器人中的某些處理器將可以用于多種應(yīng)用。同時隨著技術(shù)的發(fā)展,機(jī)器人的應(yīng)用將越來越多,機(jī)器人將可以像人一樣完成不同的任務(wù)。
3、具有獨(dú)特的應(yīng)用。這是用戶購買使用服務(wù)機(jī)器人的主要動機(jī),這些應(yīng)用不是簡單移植已有的電腦或手機(jī)的應(yīng)用,而是具有獨(dú)特的機(jī)器人應(yīng)用的特點,如自主性,操控類似于人并能夠與人進(jìn)行互動等。
4、可與人協(xié)作完成任務(wù)。因為機(jī)器人是為人服務(wù)的,所以需要與人進(jìn)行多方面的互動,以了解主人對服務(wù)的需求。另一方面是受制于機(jī)器人的智能和人相比還是有很大差距,所以有些任務(wù)還不能獨(dú)立完成,需借助于人的幫助才能完成。
5、機(jī)器人將有高安全性特點。這包含信息安全和物理安全兩方面。即不給用戶帶來安全隱患,甚至能主動檢測并制止一些有潛在安全威脅的行為。著名的阿西莫夫三大定律,規(guī)定了基本的機(jī)器人安全規(guī)則。當(dāng)然如何具體實現(xiàn)這些安全性,尤其是物理安全,還需要在機(jī)器人硬件和軟件上下功夫。
家庭服務(wù)機(jī)器人和專業(yè)服務(wù)機(jī)器人的未來將會如何發(fā)展,已成為業(yè)界關(guān)心的話題。
家庭服務(wù)機(jī)器人將會實現(xiàn)如下幾類較典型的應(yīng)用。
1、家庭服務(wù)機(jī)器人將實現(xiàn)各種助手類的應(yīng)用。智能手機(jī)上流行的個人助理軟件(Siri,Cortana等),將從虛擬的無形演變?yōu)橛形锢硗庑蔚臋C(jī)器人能夠?qū)崿F(xiàn)的功能??梢栽O(shè)想,機(jī)器人助手可以幫用戶查詢一些如:天氣,限行尾號等信息,或?qū)τ脩暨M(jìn)行提醒。聽上去好像與手機(jī)上的體驗并無區(qū)別,但實際上在體驗上已有不少改變。用戶和機(jī)器人互動的時候可用更自然的方式,像和人交流一樣,甚至可以看到機(jī)器人的表情,使服務(wù)顯得更加個性化。除了這些應(yīng)用,服務(wù)機(jī)器人還可在更多的場景中作為人的助手。比如服務(wù)機(jī)器人可以作為人的健身助手,當(dāng)人在健身的時候,機(jī)器人可像健身教練一樣提供一些建議。相信此類應(yīng)用隨著技術(shù)的發(fā)展,將會越來越豐富。
2、家庭服務(wù)機(jī)器人將助力少兒教育。因為服務(wù)機(jī)器人具有自主性和移動性,將會為少兒教育帶來無限的可能和更廣泛的應(yīng)用空間。
3、家庭服務(wù)機(jī)器人將可實現(xiàn)老人看護(hù)。包括中國在內(nèi)的許多國家,正在或?qū)⒁饺肜淆g化社會。中國的老人一般希望居家養(yǎng)老,而子女又忙于工作,即使住在一起也無法一直在身邊照看老人。諸如提醒老人吃藥或緊急情況時及時救助等,如果能由家庭服務(wù)機(jī)器人來完成,將大大提高老人居家養(yǎng)老的生活質(zhì)量,也使得子女更放心。老人看護(hù)將是未來機(jī)器人的一個應(yīng)用熱點,具有極大的社會價值。機(jī)器人能完成的事還有很多,除了與健康輔助直接相關(guān)的功能,還可幫助老人讀書讀報,與老人簡單聊天等,進(jìn)行情感方面的關(guān)懷。
對于專業(yè)服務(wù)機(jī)器人,其應(yīng)用根據(jù)專業(yè)應(yīng)用領(lǐng)域的不同,而有較大區(qū)分。
1、在物流中心進(jìn)行貨物分發(fā)。據(jù)悉,這項應(yīng)用已開始在亞馬遜等公司實際使用。未來將不斷地升級,如能夠自動取貨等。
2、在零售店,柜臺,前臺等處為客戶服務(wù)。這些服務(wù)機(jī)器人能夠和客人打招呼,并回答一些基本問題,還可以幫客戶提包,端茶送水,并為客戶指路。
3、機(jī)器人攝影師。機(jī)器人攝影師可以不知疲倦地穿梭于賓客之間,幫人們拍出高質(zhì)量的照片。當(dāng)然此功能在家庭服務(wù)機(jī)器人上,同樣是個新鮮的功能。
4、智能安防機(jī)器人。在一些警力不足的地方,如果有智能安防機(jī)器人24小時巡邏,則會有很好的震懾力,減少犯罪的發(fā)生。
關(guān)鍵技術(shù)與挑戰(zhàn)
可以預(yù)見,未來服務(wù)機(jī)器人有不少有趣的應(yīng)用,但從技術(shù)實現(xiàn)的角度看還存在諸多挑戰(zhàn)。
前面提到過機(jī)器人的三大技術(shù)領(lǐng)域,包括感知、認(rèn)知和行為控制。其中行為控制技術(shù)相對來說,已經(jīng)有不少技術(shù)積累。而對于在不久的將來可以實際大規(guī)模應(yīng)用的服務(wù)機(jī)器人,將會更偏向于發(fā)展低成本的機(jī)器人。諸如機(jī)械結(jié)構(gòu)比較簡單的輪式機(jī)器人(只有輪式移動平臺加上一個可活動的頭,一般沒有手臂或者手臂比較簡單),由于其控制部分較為簡單,因此在感知和認(rèn)知方面的技術(shù),顯得尤為重要。根據(jù)以往機(jī)器人領(lǐng)域的研究進(jìn)展和對應(yīng)用的初步分析可以認(rèn)為如下的感知、認(rèn)知技術(shù),將是實現(xiàn)應(yīng)用的關(guān)鍵。
1、三維導(dǎo)航定位技術(shù)。不管什么機(jī)器人,只要可移動,即需要在家庭或其他環(huán)境中進(jìn)行導(dǎo)航定位。其中SLAM(Simultaneous Localization and Mapping)技術(shù)可同時進(jìn)行定位和建圖,在學(xué)術(shù)研究方面已經(jīng)有不少技術(shù)積累。但對于實際系統(tǒng),由于實時性低成本(比如無法采用比較昂貴的雷達(dá)設(shè)備)的要求和家庭環(huán)境的動態(tài)變化(物品的擺放),因而對導(dǎo)航定位技術(shù)提出了更高要求,仍需進(jìn)一步研發(fā)。
2、視覺感知技術(shù)。其中包含人臉識別、手勢識別、物體識別和情緒識別等相關(guān)技術(shù)。視覺感知技術(shù),是機(jī)器人和人交互的一個非常重要的技術(shù)。
3、語言交互技術(shù)。其中包含語音識別、語音生成、自然語言理解和智能對話系統(tǒng)等。
4、文字識別技術(shù)。生活中有不少文字信息,如書報和物體的標(biāo)簽信息,這也要求機(jī)器人能夠通過攝像頭來進(jìn)行文字識別。與傳統(tǒng)的掃描后識別文字相比,其可通過攝像頭來進(jìn)行文字的識別。
5、認(rèn)知技術(shù)。機(jī)器人需要逐步實現(xiàn)規(guī)劃、推理、記憶、學(xué)習(xí)和預(yù)測等認(rèn)知功能,從而變得更加智能。
從目前的研究現(xiàn)狀看,服務(wù)機(jī)器人面對的關(guān)鍵技術(shù)均有了長足進(jìn)步,但還有相當(dāng)多的問題要解決。
推動技術(shù)的研發(fā)與實際應(yīng)用結(jié)合
英特爾中國研究院的一個重要研究方向是服務(wù)機(jī)器人,研究范圍主要包括魯棒的三維導(dǎo)航定位、人和環(huán)境的視覺感知以及人-機(jī)器人交互(包含感知、認(rèn)知、行為控制的結(jié)合)等領(lǐng)域,致力于為英特爾的合作伙伴提供先進(jìn)的服務(wù)機(jī)器人技術(shù)。
研究方法以特定的目標(biāo)應(yīng)用領(lǐng)域為出發(fā)點,并以此來推動技術(shù)的研發(fā)和在實際應(yīng)用中的測試。前面提到的助手類應(yīng)用、少兒教育應(yīng)用、老人看護(hù)應(yīng)用,是研究重點。
為了進(jìn)行應(yīng)用測試,英特爾中國研究院建立了實際的機(jī)器人硬件原型。左邊是其內(nèi)部結(jié)構(gòu),由一個帶有英特爾Realsense攝像頭的電腦來控制一個全向移動底盤和頭部的轉(zhuǎn)動,其高度可調(diào),以便適應(yīng)成人與兒童的互動要求。
目前研究院已經(jīng)在視覺感知等領(lǐng)域取得了階段性成果。顯示了利用Realsense攝像頭和SLAM技術(shù)生成家庭環(huán)境地圖,這在后續(xù)就可用來定位導(dǎo)航。研究院還開發(fā)了魯棒的跟蹤技術(shù),可在多人同時出現(xiàn)的情況下,長時間正確地跟蹤一個特定用戶。在未來還會研發(fā)出更多相關(guān)技術(shù)和應(yīng)用,這些技術(shù)也將服務(wù)于業(yè)界的合作伙伴助力開發(fā)出先進(jìn)的服務(wù)機(jī)器人產(chǎn)品。
推動技術(shù)的研發(fā)與實際應(yīng)用結(jié)合
對于機(jī)器人技術(shù),大家關(guān)心的一個問題是,是否需要采用專用的人工智能芯片。
目前探索的一個方向被稱作混血計算(Hybrid computing),其是指用通用處理器和其他架構(gòu)一起合作來進(jìn)行計算。不過,還處于早期探索的階段。
一個架構(gòu)是否能成功地應(yīng)用于服務(wù)機(jī)器人,需要看性能是否滿足應(yīng)用的需求,功耗等是否合適,這是一個考慮多種因素平衡的選擇。
可以說現(xiàn)在的通用處理器與已有的一些其他計算單元(如向量處理單元、GPU),已經(jīng)可以為服務(wù)機(jī)器人提供一個理想的硬件架構(gòu),尤其是多功能的具有感知、認(rèn)知功能的服務(wù)機(jī)器人。目前機(jī)器人主要的瓶頸,還是在應(yīng)用需求的開發(fā)和感知、認(rèn)知技術(shù)上。當(dāng)然,未來的架構(gòu),也會隨著對應(yīng)用的深入開發(fā)而不斷創(chuàng)新。硬件設(shè)計面臨的挑戰(zhàn)越來越大,需要不斷地適應(yīng)未來發(fā)展的演變。同時也可以考慮用FPGA架構(gòu)來為一些比較專門的應(yīng)用提供加速,這樣在應(yīng)用發(fā)生變化的時候,將具有更多的靈活性。