久热精品在线视频,思思96精品国产,午夜国产人人精品一区,亚洲成在线a

<s id="x4lik"><u id="x4lik"></u></s>

      <strong id="x4lik"><u id="x4lik"></u></strong>

      水下滑翔蛇形機(jī)器人滑翔控制的強(qiáng)化學(xué)習(xí)方法

      張曉路; 李斌; 常健; 唐敬閣 東北大學(xué)信息科學(xué)與工程學(xué)院; 遼寧沈陽(yáng)110819; 中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室; 遼寧沈陽(yáng)110016; 中國(guó)科學(xué)院機(jī)器人與智能制造創(chuàng)新研究院; 遼寧沈陽(yáng)110016; 中國(guó)科學(xué)院大學(xué); 北京100049

      關(guān)鍵詞:強(qiáng)化學(xué)習(xí) 水下滑翔蛇形機(jī)器人 馬爾可夫決策過程 循環(huán)神經(jīng)網(wǎng)絡(luò) 

      摘要:研究了一種強(qiáng)化學(xué)習(xí)算法,用于水下滑翔蛇形機(jī)器人的滑翔運(yùn)動(dòng)控制.針對(duì)水動(dòng)力環(huán)境難以建模的問題,使用強(qiáng)化學(xué)習(xí)方法使水下滑翔蛇形機(jī)器人自適應(yīng)復(fù)雜的水環(huán)境,并自動(dòng)學(xué)習(xí)僅通過調(diào)節(jié)浮力來控制滑翔運(yùn)動(dòng).對(duì)此,提出了循環(huán)神經(jīng)網(wǎng)絡(luò)蒙特卡洛策略梯度算法,改善了由于機(jī)器人的狀態(tài)難以完全觀測(cè)而導(dǎo)致的算法難以訓(xùn)練的問題,并將水下滑翔蛇形機(jī)器人的基本滑翔動(dòng)作控制問題近似為馬爾可夫決策過程,從而得到有效的滑翔控制策略.通過仿真和實(shí)驗(yàn)證明了所提出方法的有效性.

      機(jī)器人雜志要求:

      {1}參考文獻(xiàn)必須在文中用[數(shù)字]標(biāo)出對(duì)應(yīng)標(biāo)號(hào),參考文獻(xiàn)統(tǒng)一列在文后。

      {2}著作類:作者(譯者)姓名、書名、出版地、出版社名稱、出版年份、頁(yè)碼(直接引文時(shí)標(biāo)明)。論文類:作者姓名、文章名、所載報(bào)刊名稱、年份、期號(hào)、頁(yè)碼。

      {3}如一旦發(fā)現(xiàn)一稿兩用,本刊將刊登該文系重復(fù)發(fā)表的聲明,并在3年內(nèi)拒絕以該文第一作者和通訊作者的任何來稿。

      {4}論文題目應(yīng)當(dāng)簡(jiǎn)潔明了,反映論文的主旨。論文題目應(yīng)便于讀者檢索、轉(zhuǎn)抄和引用,中文題名不宜超過20個(gè)字;外文題名不超過10個(gè)實(shí)詞。不宜采用抒情意味、反問意味的主標(biāo)題和副標(biāo)題。

      {5}任何來稿視為作者、譯者已經(jīng)閱讀或知悉并同意本須知約定。

      注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社

      機(jī)器人

      北大期刊
      預(yù)計(jì)1-3個(gè)月審稿

      期刊主頁(yè)
      相關(guān)期刊
      我們的服務(wù)