近日,我們有幸采訪了加州理工學院(Caltech)控制與動力系統(tǒng)的Bren講席教授Soon-Jo Chung。Chung教授也是NASA噴氣推進實驗室(JPL)的高級研究科學家。他的研究重點是分布式航天器系統(tǒng)和空間機器人,特別關注控制、估計和學習理論在自主空間和飛行器導航問題中的應用。
Chung教授的研究總是充滿創(chuàng)意和驚喜。他開發(fā)的"蝙蝠機器人"(Bat Bot)曾在德國漢堡的工藝美術博物館展出,向公眾展示了仿生機器人的魅力。這款超輕型飛行器靈感源自蝙蝠,利用超柔性機翼和多關節(jié)設計實現(xiàn)了高度靈活的機動飛行。Nature雜志曾用"空中芭蕾"來形容它優(yōu)雅的飛行姿態(tài)。
另一項腦洞大開的研究是"變形金剛"衛(wèi)星。受科幻電影的啟發(fā),Chung教授提出利用模塊化設計和自主組裝技術,實現(xiàn)太空中的衛(wèi)星變形與協(xié)同。數(shù)百個微小衛(wèi)星可以根據(jù)任務需求自行組合成不同構型,完成通信、探測、服務等各種任務。這一概念有望大幅提升太空設施的適應性和魯棒性。
類似的創(chuàng)意還有很多,如會飛的仿人機器人"Leonardo"、會打球的四足機器人、會畫畫的機械臂等。Chung教授總能從日常生活中找到靈感,將機器人技術與藝術、體育、教育等領域結(jié)合起來,令人耳目一新。
當然,這些有趣的想法背后是扎實的數(shù)學功底和嚴謹?shù)墓こ虒嵺`。Chung教授是控制理論的專家,發(fā)表了100多篇期刊論文,擁有20多項專利。他領導的機器人實驗室成果豐碩,與NASA、DARPA等機構有著廣泛合作。他本人也獲得了眾多獎項,包括美國空軍科學研究青年研究員獎、美國國家自然科學基金CAREER獎等。
讓我們一起聆聽這位集科學家、工程師、藝術家于一身的杰出學者,對機器人學習前沿的獨到見解。相信您一定會被他的學識之廣、思維之活躍所折服。
"我認為機器學習最好的應用場景之一,是利用它強大的表征能力和適應能力。" Chung教授開門見山地說,"傳統(tǒng)的機器人控制往往依賴于精確的數(shù)學模型,但現(xiàn)實世界的環(huán)境千變?nèi)f化,存在著大量不確定因素,如風擾動、地面摩擦、執(zhí)行器磨損等。這些因素很難事先建模,給控制器設計帶來巨大挑戰(zhàn)。而機器學習恰恰擅長處理這類復雜多變的情況。通過從數(shù)據(jù)中學習,機器學習算法可以自適應地估計出那些未知參數(shù),補償建模誤差,讓機器人更加靈活智能。"
但Chung教授也指出,機器學習在為系統(tǒng)帶來適應性的同時,也引入了新的不確定性。"大多數(shù)機器學習算法本質(zhì)上是一個黑箱,缺乏可解釋性。你無法準確預測神經(jīng)網(wǎng)絡這樣的黑盒子會對一個未見過的輸入做出什么反應。如果這個黑盒子掌控著機器人的行為決策,而它突然采取了一個意外的、不安全的動作,后果將不堪設想。"
這就是Chung教授強調(diào)"數(shù)學保證"和"穩(wěn)定性"的原因。"控制科學的核心就是穩(wěn)定性。我們要確保系統(tǒng)狀態(tài)不會在有限的時間內(nèi)發(fā)散到無窮大。對于機器人這樣的安全攸關系統(tǒng),穩(wěn)定性不僅關乎性能,更關乎生命。傳統(tǒng)控制理論已經(jīng)發(fā)展出一套完備的穩(wěn)定性分析工具,如李雅普諾夫理論。但如何將它們應用到具有學習能力的非線性系統(tǒng)中,仍是一個開放的問題。"Chung說。
為了解決這一問題,Chung教授和他的團隊提出了一種被稱為"收縮理論"(Contraction Theory)的全新視角。傳統(tǒng)的控制理論大多分析系統(tǒng)在平衡點附近的穩(wěn)定性,如機械臂的目標位置。但實際上,機器人大多數(shù)時候是在軌跡上運動,如自動駕駛汽車沿著道路前進。收縮理論不關注單個平衡點,而是考察系統(tǒng)在整條軌跡上的"增量穩(wěn)定性",即任意兩個初值差距是否會隨時間指數(shù)收斂。
"收縮理論有兩個重要性質(zhì)。"Chung解釋道,"一是對初值的指數(shù)遺忘性。即無論從哪個初值出發(fā),系統(tǒng)最終都會收斂到一條軌跡上。二是有界輸入有界輸出。即使存在有界擾動,系統(tǒng)偏離軌跡的距離也將在一個有限范圍內(nèi)。這兩個性質(zhì)對魯棒控制器設計意義重大。"
事實上,Chung教授證明,對于一大類非線性系統(tǒng),如果其"虛擬位移"滿足某種收縮條件,那么該系統(tǒng)一定是增量指數(shù)穩(wěn)定的。"虛擬位移可以理解為無窮小擾動在相空間傳播的方向。如果它們能以指數(shù)速率衰減到零,那整個系統(tǒng)就像一個漏斗,無論從哪個初值出發(fā),最終都會被吸引到漏斗的中心線上。"Chung打了一個形象的比喻。
基于這一點,他們進一步提出了"分層收縮控制"的架構。"底層是一個收縮控制器,保證被控對象的增量穩(wěn)定性。中層是一個軌跡規(guī)劃器,負責生成期望軌跡。上層是一個基于機器學習的自適應模塊,用于補償建模誤差。"Chung介紹說,"三個層級互為補充。規(guī)劃器給控制器提供參考軌跡,控制器驅(qū)動執(zhí)行器跟蹤軌跡,適應層輔助修正軌跡。由于有收縮性的保證,這個系統(tǒng)在面對未知擾動時,最壞的情況也只是偏離軌跡一個有界的距離,而不會完全失控。"
這種分層收縮架構在Chung教授的多個機器人平臺上得到了成功應用。例如,他們開發(fā)的"Neural-Fly"四旋翼無人機可以在強風擾動下精準降落。"風場高度非線性,很難建模。我們用深度神經(jīng)網(wǎng)絡擬合這個未知項,同時用一個低維線性自適應器校正神經(jīng)網(wǎng)絡的逼近誤差。整個自適應過程附加在nominal軌跡上,即使神經(jīng)網(wǎng)絡參數(shù)發(fā)生變化,閉環(huán)系統(tǒng)的增量穩(wěn)定性也不受影響。"Chung說。實驗表明,該系統(tǒng)可以在GPS失效的情況下實現(xiàn)厘米級的懸停。
除了無人機,他們還將這一思想應用于漫游車。"輪胎和地面的摩擦也高度非線性。傳統(tǒng)模型如庫倫摩擦難以準確描述真實接觸。我們利用車載傳感器采集的數(shù)據(jù),訓練了一個摩擦力神經(jīng)網(wǎng)絡模型,并將其集成到軌跡跟蹤控制器中。"Chung說,"借助學習得到的先驗,漫游車可以在崎嶇地形上平穩(wěn)行駛。即使輪胎打滑,也能快速修正方向。這對未來的星球探測任務大有裨益。"
"機器學習為機器人注入了適應性和智能,但同時也帶來了不可預測性和不穩(wěn)定性。"Chung教授總結(jié)道,"收縮理論在二者之間搭建了一座橋梁。它既能保證系統(tǒng)在不確定性中的魯棒性,又不會限制學習的靈活性。我認為這將是機器人技術發(fā)展的一個重要方向。未來的自主系統(tǒng)必須在保證安全的前提下,具備持續(xù)學習與進化的能力。這需要控制論與人工智能的深度融合。"
在機器人學習中,運動規(guī)劃是一個核心問題。它決定了機器人如何從當前狀態(tài)移動到目標狀態(tài)。傳統(tǒng)的運動規(guī)劃算法,如A*搜索、RRT等,大多假設環(huán)境是靜態(tài)已知的。但在實際應用中,機器人往往面臨動態(tài)、未知的環(huán)境,需要根據(jù)傳感器反饋實時調(diào)整規(guī)劃。現(xiàn)有的做法大多是將運動規(guī)劃與反饋控制割裂開來,先用簡化模型規(guī)劃出一條粗略的路徑,再用反饋控制器實時修正偏差。這種做法的問題在于,規(guī)劃和控制是兩個獨立的模塊,很難協(xié)同優(yōu)化。
"很多人在做強化學習時,會計算出一條路徑,然后直接發(fā)送給執(zhí)行器。問題是,在存在建模誤差和外界干擾的情況下,你如何保證系統(tǒng)能準確跟蹤這條路徑?如何保證這條路徑在真實環(huán)境中仍然安全可行?"Chung教授指出了其中的問題。事實上,不少自動駕駛事故的原因之一,就是決策規(guī)劃與控制執(zhí)行的脫節(jié)。
為了解決這個問題,Chung教授提出了一種"安全導向的分層規(guī)劃架構"。"我最喜歡的方法是在運動規(guī)劃階段就顯式地考慮安全性約束。比如,在做軌跡優(yōu)化時,除了考慮機器人的動力學限制,還要把障礙物避讓作為硬約束加進去。即使動力學模型有偏差,即使有外界干擾,只要反饋控制器能穩(wěn)定地跟蹤參考軌跡,安全性就有保障。"
這種思路的關鍵在于如何量化"跟蹤誤差"與"安全裕度"。傳統(tǒng)的運動規(guī)劃大多基于簡化的動力學模型,如三次樣條、B樣條等。這類模型計算簡單,但與真實系統(tǒng)往往有較大偏差。為了縮小這種偏差,Chung教授的團隊采用了基于采樣的運動規(guī)劃方法。"我們先用Monte Carlo方法在狀態(tài)空間中采樣出大量可行軌跡,然后用數(shù)值優(yōu)化的方法在這些軌跡中搜索最優(yōu)解。這個過程是迭代的,每一輪迭代都會根據(jù)當前的最優(yōu)解調(diào)整采樣分布,產(chǎn)生更接近最優(yōu)的軌跡。同時,我們把跟蹤誤差作為一個高斯分布隨機變量,它的方差反映了動力學模型的不確定性。通過對這個高斯分布求積分,我們可以得到一個'統(tǒng)計魯棒性約束',表示在一定置信水平下,跟蹤誤差不會超過安全裕度。把這個約束加入到優(yōu)化目標中,就得到了一個考慮建模不確定性的魯棒運動規(guī)劃器。"
這種基于采樣和優(yōu)化的運動規(guī)劃方法可以在一定程度上處理環(huán)境的不確定性,但計算開銷較大,難以滿足實時性的需求。為了進一步加快計算速度,Chung教授的團隊利用深度神經(jīng)網(wǎng)絡來逼近最優(yōu)控制策略。"我們先用上述方法離線求解大量的最優(yōu)控制問題,得到一個'軌跡-控制'對的數(shù)據(jù)集。然后用這個數(shù)據(jù)集訓練一個深度神經(jīng)網(wǎng)絡,輸入是當前狀態(tài)和目標狀態(tài),輸出是最優(yōu)控制量。這個神經(jīng)網(wǎng)絡實際上起到了一個'策略函數(shù)'的作用,可以實時地把感知信息映射到控制指令。一旦訓練完成,它的計算速度就非常快了,基本上是一個前向傳播的過程。"
Chung教授強調(diào),這個深度網(wǎng)絡只是用來逼近最優(yōu)控制策略,并不參與動力學約束的求解。"動力學約束是一個比較強的先驗知識,完全交給端到端的深度學習去學很困難,既費時又不可靠。我們把動力學約束顯式地用數(shù)學模型描述出來,再把控制量的求解轉(zhuǎn)化為一個參數(shù)優(yōu)化問題。這實際上就是'運動規(guī)劃'。神經(jīng)網(wǎng)絡只是用來逼近這個最優(yōu)化問題的解,或者說,逼近從狀態(tài)到最優(yōu)控制量的映射。訓練好的網(wǎng)絡可以直接部署到機器人上,而不需要再做在線求解,大大提高了實時規(guī)劃的效率。"
運動規(guī)劃的outro在環(huán)境復雜、變化快的情況下,即便有了上述的魯棒優(yōu)化和實時逼近技術,也未必能找到令人滿意的解。一個主要原因是這些方法大多基于貪心搜索,缺乏對不確定性的長期考慮。為了克服這個問題,Chung教授的團隊受AlphaGo的啟發(fā),將深度強化學習與蒙特卡洛樹搜索(MCTS)結(jié)合,提出了一種"隨機運動規(guī)劃"(Stochastic Motion Planning)的方法。
"MCTS的基本思想是通過反復模擬來評估每個決策的長期效用。它先根據(jù)當前的最優(yōu)策略執(zhí)行一個'探索性的模擬',得到一個累積獎勵值;然后根據(jù)這個獎勵值更新樹上每個節(jié)點的統(tǒng)計量,進而調(diào)整最優(yōu)策略;如此迭代,直到找到一個令人滿意的解。這個過程有點像人下棋時的'讀秒'。神經(jīng)網(wǎng)絡在這里的作用是指導樹的生長。它可以根據(jù)歷史數(shù)據(jù)預測每個決策的效用,引導樹向更有希望的方向拓展"。
隨機運動規(guī)劃的一個關鍵優(yōu)勢是能夠權衡"探索"與"利用"。"傳統(tǒng)的優(yōu)化算法大多是決定性的,總是貪婪地選擇當前最優(yōu)的決策。這在靜態(tài)環(huán)境下沒有問題,但在動態(tài)環(huán)境下很容易陷入局部最優(yōu)。MCTS通過引入隨機性,鼓勵智能體去探索那些當前看起來并不那么優(yōu)的決策,但從長遠來看可能帶來更大收益的決策。這種權衡在不確定環(huán)境下是非常必要的。"Chung教授解釋道。
分層架構是運動規(guī)劃領域的另一個重要話題。"運動規(guī)劃問題往往具有多尺度、多層次的特點。比如,一個自動駕駛汽車,不僅要規(guī)劃出一條到達目的地的全局路徑,還要考慮如何變道超車、如何在十字路口左轉(zhuǎn)或右轉(zhuǎn)。這些決策的時間尺度、空間尺度是不一樣的。"Chung教授說,"我們的做法是將其分解為多個層級,每個層級負責不同粒度的決策。高層負責全局路徑規(guī)劃,中層負責局部路徑規(guī)劃,低層負責具體的速度、轉(zhuǎn)向控制。每一層的決策都要服從更高一層的約束。"
這種分層決策結(jié)構在Chung教授的"Leonardo"雙足機器人項目中得到了充分體現(xiàn)。"Leonardo的運動規(guī)劃包括三個層級:頂層是一個'中央模式發(fā)生器',決定步態(tài)的頻率和相位;中層是一個步態(tài)規(guī)劃器,根據(jù)地形和障礙物分布規(guī)劃落腳點;底層是一個全身控制器,控制各個關節(jié)的協(xié)調(diào)運動。三個層級通過不同頻率的反饋回路連接,既保證了決策的實時性,又實現(xiàn)了全局和局部的協(xié)調(diào)。"
"分層規(guī)劃與分層控制密不可分。每一個規(guī)劃層級的輸出,都是更低層級的控制器的輸入。反過來,每個控制層級也會將反饋信息傳遞給更高的規(guī)劃層級。這就形成了一個多尺度、多通道的感知-決策-控制閉環(huán)。" Chung教授強調(diào),"這種閉環(huán)結(jié)構賦予了機器人面對不確定性的適應能力。高層感知到環(huán)境變化,可以及時調(diào)整決策;底層控制器根據(jù)決策的變化,實時調(diào)節(jié)執(zhí)行。即使規(guī)劃有誤差,只要誤差在控制的容錯范圍內(nèi),整個系統(tǒng)就能穩(wěn)定運行。這就是分層架構的魅力所在。"
在機器人領域,運動規(guī)劃負責找出一條從起點到目標的可行路徑,而控制系統(tǒng)的任務則是讓機器人精準地沿著這條路徑運動。乍一看,只要規(guī)劃出的路徑足夠好,控制系統(tǒng)的任務應該不難完成。但實際上,機器人在執(zhí)行過程中經(jīng)常會遇到各種意外情況,如風力干擾、路面摩擦、機械磨損等,導致它偏離預定軌道。如果控制系統(tǒng)不能及時修正這些偏差,輕則達不到預期目標,重則可能釀成事故。因此,一個好的機器人控制系統(tǒng)必須能夠感知這些干擾,并自動調(diào)節(jié)控制策略,確保機器人在動態(tài)環(huán)境下的運動性能。這就是自適應控制的任務。
傳統(tǒng)的控制理論大多基于線性系統(tǒng),分析其在平衡點附近的穩(wěn)定性。然而,絕大多數(shù)實際系統(tǒng),尤其是機器人系統(tǒng),都是非線性的。它們的狀態(tài)空間不是歐氏空間,而是一個黎曼流形。對這類系統(tǒng),平衡點穩(wěn)定性的概念難以準確刻畫其動態(tài)特性。Chung教授及其團隊提出的"收縮理論"給出了一種全新的視角。
"收縮理論研究的是系統(tǒng)在軌跡上的穩(wěn)定性,即增量穩(wěn)定性。"Chung教授解釋道,"所謂增量穩(wěn)定,就是系統(tǒng)對初值變化的敏感程度。如果從兩個非常接近的初值出發(fā),系統(tǒng)的兩條軌跡能隨時間快速收斂到一起,我們就說系統(tǒng)具有增量穩(wěn)定性。"
這個過程有點像放大鏡下的光線。當光線通過會聚透鏡時,會變得越來越集中,最終匯聚到一點。這一點就是系統(tǒng)的"漸近軌道"。增量穩(wěn)定性意味著,無論初始狀態(tài)多么分散,系統(tǒng)最終都會被吸引到這條漸近軌道上。
"增量穩(wěn)定性有兩個重要性質(zhì)。"Chung教授繼續(xù)說,"一是指數(shù)收斂。如果系統(tǒng)是增量指數(shù)穩(wěn)定的,那兩條軌跡之間的距離會以指數(shù)速度衰減到零,而不是線性衰減或者多項式衰減。換句話說,增量穩(wěn)定系統(tǒng)對初值的依賴會隨時間飛快地消除,這個性質(zhì)叫做'初值遺忘性'。"
遺忘初值意味著增量穩(wěn)定系統(tǒng)具有自我修復的能力。即使由于干擾或測量誤差導致軌跡偏離,系統(tǒng)也能自動調(diào)節(jié),快速回到正軌。這就是自適應控制的理論基礎。
增量穩(wěn)定性的另一個性質(zhì)是魯棒性。Chung教授指出:"如果系統(tǒng)受到有界干擾,軌跡偏離漸近軌道的距離也將是有界的。這個上界由干擾的大小決定,與時間無關。也就是說,增量穩(wěn)定系統(tǒng)能將有界干擾的影響限制在一個可控范圍內(nèi),防止誤差無限放大。這個性質(zhì)叫做'有界輸入有界輸出穩(wěn)定性',是魯棒控制的理論基石。"
基于上述理論,Chung教授的團隊提出了一種自適應-神經(jīng)網(wǎng)絡復合控制框架。其核心思想是將深度學習嵌入到自適應控制器中,用神經(jīng)網(wǎng)絡逼近未知的系統(tǒng)動力學。
傳統(tǒng)的自適應控制大多針對線性系統(tǒng),采用有限維參數(shù)模型描述不確定性。這種方法對強非線性系統(tǒng)和高維不確定性捉襟見肘。深度神經(jīng)網(wǎng)絡具有優(yōu)越的非線性擬合能力,能學習任意復雜的函數(shù),是對傳統(tǒng)自適應控制的有力補充。但神經(jīng)網(wǎng)絡畢竟是個"黑盒子",缺乏可解釋性和魯棒性。為了克服這個問題,他們沒有完全依賴神經(jīng)網(wǎng)絡,而是將其與傳統(tǒng)的自適應控制相結(jié)合。
"具體來說,我們假設被控對象的動力學可以分解為兩部分:一部分是標稱模型,可以用物理定律準確描述;另一部分是建模不確定項,包含環(huán)境干擾和未建模動力學,用神經(jīng)網(wǎng)絡來逼近。" Chung教授介紹說,"自適應控制器的目標就是估計出這個不確定項,并設計反饋律抵消其影響。神經(jīng)網(wǎng)絡在這里起到一個'動力學補償器'的作用。"
為了讓神經(jīng)網(wǎng)絡有針對性地學習不確定項,他們在訓練過程中引入了"對抗性學習"的思想。"根據(jù)不確定項的物理特性,我們?yōu)槠湓O計一個參數(shù)化的'對抗模型',它產(chǎn)生的干擾最容易引起跟蹤誤差。然后就像對抗生成網(wǎng)絡一樣,我們讓神經(jīng)網(wǎng)絡去最小化在對抗干擾下的最壞情況跟蹤誤差。這個過程可以理解為一個智能體永無止境地和自己過不去,以此鍛煉自己應對變化的能力。"
這個自適應-神經(jīng)網(wǎng)絡復合控制器已經(jīng)在各種機器人平臺上得到驗證,展現(xiàn)出卓越的環(huán)境適應能力。例如,在"Neural-Fly"項目中,他們成功實現(xiàn)了四旋翼無人機在強風干擾下的精準懸停。即使風速、風向發(fā)生突變,無人機也能迅速調(diào)整姿態(tài),將位置偏差控制在厘米級以內(nèi)。
"風場擾動高度非線性,很難用簡單的數(shù)學模型描述。我們的做法是用深度神經(jīng)網(wǎng)絡去學習這個復雜的非線性映射。網(wǎng)絡的輸入是無人機的狀態(tài),如位置、速度、角度等;輸出是氣動力和力矩。通過反復訓練,網(wǎng)絡可以從飛行數(shù)據(jù)中總結(jié)出風擾動的一般規(guī)律。" Chung教授解釋說,"有了這個學習到的'氣動模型',自適應控制器就可以快速估計當前風擾動的大小和方向,并施加反向的控制力矩抵消其影響,保證無人機平穩(wěn)飛行。整個閉環(huán)系統(tǒng)表現(xiàn)出很強的魯棒性。"
除了無人機,他們還將這一方法應用到了漫游車、人形機器人等平臺。每個平臺都有其特定的環(huán)境不確定性。比如漫游車要應對不同地形的摩擦特性,人形機器人要克服關節(jié)柔性、重心偏移等擾動。得益于深度神經(jīng)網(wǎng)絡強大的表征能力,復合自適應控制器能學習各種復雜環(huán)境下的運動規(guī)律,大幅改善機器人的運動性能和環(huán)境適應能力。
增量穩(wěn)定性理論不僅為自適應控制提供了堅實的數(shù)學基礎,也為機器人系統(tǒng)的故障診斷與容錯控制開辟了新的途徑。Chung教授和學生利用增量穩(wěn)定性,提出了一種高效的執(zhí)行器故障檢測方法。
"傳統(tǒng)的故障檢測大多依賴硬件冗余,在每個執(zhí)行器上安裝傳感器,通過多傳感器信息融合判斷故障。這種做法成本高、可靠性低。" Chung教授說,"我們利用自適應控制的狀態(tài)信息,用稀疏表示的方法從數(shù)據(jù)中推斷故障源。核心思想是最小化故障的個數(shù),優(yōu)先考慮單點故障。一旦發(fā)現(xiàn)故障執(zhí)行器,就重構控制分配矩陣,用余下的正常執(zhí)行器補償故障造成的影響。"
他們在一個六旋翼無人機模型上驗證了這一方法。實驗設置了3個推進器完全失效的故障情形,該算法能在不到1秒的時間內(nèi)正確診斷出故障,并重新分配推力,保證無人機的姿態(tài)穩(wěn)定。相比傳統(tǒng)基于觀測器的診斷方法,這種基于增量穩(wěn)定性的故障診斷具有計算簡單、響應快速的優(yōu)點,有望用于未來的自主系統(tǒng)。
"自適應控制一直是機器人和自動化領域的前沿和難點問題。"Chung教授總結(jié)道,"環(huán)境的多樣性和不確定性對機器人的智能化提出了巨大挑戰(zhàn)。傳統(tǒng)的自適應控制理論局限于線性系統(tǒng)和有限維不確定性,難以應對日益復雜的應用需求。將深度學習引入自適應控制,開啟了環(huán)境感知、學習、推理、決策與控制一體化的新范式。同時,可證明穩(wěn)定性的理論保障了自適應系統(tǒng)的安全性和可靠性。這是'可證明AI'的重要一步。未來,機器人將通過不斷學習適應不斷變化的世界,像人類一樣從經(jīng)驗中總結(jié)規(guī)律,提煉策略。這需要智能科學和控制科學的持續(xù)交叉融合。"
采訪接近尾聲時,我們請教了Chung教授對機器人學習未來的展望。"我認為,控制理論家應該更多地參與到機器人學習的研究中來"。Chung教授說,"很多人工智能的研究者覺得,只要數(shù)據(jù)和算力足夠,是可以搞定一切的。但實際上,機器人系統(tǒng)是一個集感知、控制、規(guī)劃、執(zhí)行等多種能力于一體的復雜系統(tǒng)。我們既要讓機器人像人一樣思考,又希望它們比人更可靠、更安全。這需要人工智能和控制論的交叉融合。"
他以自動駕駛汽車為例:"如果只是單純堆砌機器學習模塊,一旦遇到訓練數(shù)據(jù)中沒有覆蓋的情況,極易發(fā)生致命事故。我們必須用可證明安全的控制器作為底座,將機器學習視為一種提升性能的輔助手段,而不是萬能的靈丹妙藥。"
對于機器人學習領域的新入門者,Chung教授特別強調(diào)了"對傳統(tǒng)控制理論的扎實理解"的重要性。"新的東西固然令人興奮,但很多時候,看似創(chuàng)新的想法其實源自幾十年前的杰作。控制論和人工智能歷史上有太多殊途同歸的例子了。" 他笑著說,"我的建議是,在追逐時髦概念的同時,也要修煉內(nèi)功,特別是優(yōu)化理論、動力系統(tǒng)理論和魯棒控制理論。它們是通向機器人學習的一劑良方。"
采訪在輕松愉悅的氛圍中結(jié)束。Chung教授學識淵博、見解獨到,為我們理解機器人學習這一前沿領域提供了一個全新的視角。控制與人工智能的融合是大勢所趨,但也充滿挑戰(zhàn)。如何在"智能"與"安全"之間找到平衡,是一個值得深思的問題。在科技飛速發(fā)展的今天, Chung教授最后提到:"未來的自主系統(tǒng)必須在保證安全的前提下,具備持續(xù)學習與進化的能力。這需要控制論與人工智能的深度融合。"
美國對中國商品加征10%關稅,對跨境電商的巨大沖擊
710 閱讀白犀牛副總裁王瀚基:無人配送帶來了哪些機遇與挑戰(zhàn)?
498 閱讀SCOR模型:數(shù)字化時代供應鏈管理的航海圖
563 閱讀快遞人2025愿望清單:漲派費、少罰款、交社保......
515 閱讀暖心護航春節(jié)返程,順豐確保每一份滿滿當當?shù)男囊馀c牽掛新鮮抵達!
392 閱讀1月27日-2月2日全國物流保通保暢運行情況
342 閱讀2025年1月20日-1月26日全國物流保通保暢運行情況
275 閱讀春節(jié)假期全國攬投快遞包裹超19億件
278 閱讀京東物流北京區(qū)25年331大件DC承運商招標
278 閱讀