關(guān)鍵詞:深度增強(qiáng)學(xué)習(xí) 衛(wèi)星姿態(tài)控制 動(dòng)力學(xué)環(huán)境 自主姿態(tài)控制 質(zhì)量參數(shù)
摘要:針對(duì)衛(wèi)星在執(zhí)行丟棄載荷或捕獲目標(biāo)等復(fù)雜任務(wù)時(shí)遭遇的姿態(tài)突然發(fā)生變化的問(wèn)題,采用深度增強(qiáng)學(xué)習(xí)方法對(duì)衛(wèi)星姿態(tài)進(jìn)行控制,使衛(wèi)星恢復(fù)穩(wěn)定狀態(tài)。具體來(lái)說(shuō),首先搭建飛行器的姿態(tài)動(dòng)力學(xué)環(huán)境,并將連續(xù)的控制力矩輸出離散化,然后采用Deep Q Network算法進(jìn)行衛(wèi)星自主姿態(tài)控制訓(xùn)練,以姿態(tài)角速度趨于穩(wěn)定作為獎(jiǎng)勵(lì)獲得離散行為的最優(yōu)智能輸出。仿真試驗(yàn)表明,面向空間衛(wèi)星姿態(tài)控制的深度增強(qiáng)學(xué)習(xí)算法能夠在衛(wèi)星受到突發(fā)隨機(jī)擾動(dòng)后穩(wěn)定衛(wèi)星姿態(tài),并能有效解決傳統(tǒng)PD控制器依賴(lài)被控對(duì)象質(zhì)量參數(shù)的難題。所提出的方法采用自主學(xué)習(xí)的方式對(duì)衛(wèi)星姿態(tài)進(jìn)行控制,具有很強(qiáng)的智能性和一定的普適性,在未來(lái)衛(wèi)星執(zhí)行復(fù)雜空間任務(wù)中的智能控制方面有著很好的應(yīng)用潛力。
中國(guó)空間科學(xué)技術(shù)雜志要求:
{1}統(tǒng)計(jì)學(xué)符號(hào):按GB3358-1982《統(tǒng)計(jì)學(xué)名詞及符號(hào)》的有關(guān)規(guī)定書(shū)寫(xiě)。
{2}內(nèi)容突出理論性、學(xué)術(shù)性、實(shí)用性和探索性。
{3}參考文獻(xiàn):是對(duì)引文作者、作品、出處、版本等情況的說(shuō)明。文未依次排列參考文獻(xiàn)時(shí),按作者、書(shū)刊名或出版社、出版年(期)、起訖頁(yè)順序標(biāo)注。
{4}中英文摘要(200字左右)、中英文關(guān)鍵詞3-5個(gè)(均用分號(hào)隔開(kāi))。
{5}來(lái)稿請(qǐng)附作者詳細(xì)聯(lián)系方式(姓名、單位、通訊地址、郵編、郵箱、固定電話(huà)、手機(jī)等)。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社