久热精品在线视频,思思96精品国产,午夜国产人人精品一区,亚洲成在线a

<s id="x4lik"><u id="x4lik"></u></s>

      <strong id="x4lik"><u id="x4lik"></u></strong>

      通信資源調(diào)度對稱MARL問題策略估計誤差分析

      張昕然; 孫松林 北京郵電大學信息與通信工程學院; 北京100876; 北京郵電大學可信分布式計算與服務(wù)教育部重點實驗室; 北京100876; 北京郵電大學移動互聯(lián)網(wǎng)安全技術(shù)國家工程實驗室; 北京100876

      關(guān)鍵詞:強化學習 對稱多智能體強化學習 策略估計 

      摘要:針對通信資源調(diào)度場景下的多智能體強化學習(MARL)問題,提出了對稱MARL問題以及三類對稱性的定義和條件,并定義了策略融合和策略誤差;針對強對稱MARL問題,定義了三類評價指標,并對策略估計誤差進行分析,提出了強對稱MARL問題的策略誤差定理及推論.針對無線通信的接入控制問題建立了MARL問題,仿真結(jié)果驗證了強對稱MARL問題策略估計誤差的特性.結(jié)果表明,可以使用低復(fù)雜度的MARL子問題對高復(fù)雜度的強對稱MARL問題進行策略估計,且策略估計誤差和對網(wǎng)絡(luò)性能的影響均較小.

      北京郵電大學學報雜志要求:

      {1}請?zhí)貏e注意:著錄參考文獻出處時,期刊引文須注明的是引文所在具體頁碼,而非該文獻在期刊中的起訖頁碼;報紙引文必須在日期之后注明文獻所在的版次。

      {2}稿件的作者署名、保密和是否侵權(quán)等問題均由作者自行負責。

      {3}正文應(yīng)論點明確、論據(jù)充分、文字簡煉、通順、層次清楚。

      {4}結(jié)論之后,應(yīng)有致謝部分,對國家科學基金、資助者或支持者、提供指導和幫助者、給予轉(zhuǎn)載和引用權(quán)的資料、圖片、文獻、研究思想和設(shè)想的所有者,表示感謝。

      {5}關(guān)鍵詞每篇文章可選用3~5個能反映文章主題概念的詞、詞組或術(shù)語。

      注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社

      北京郵電大學學報

      北大期刊
      1-3個月下單

      關(guān)注 8人評論|0人關(guān)注
      相關(guān)期刊
      • 江蘇通信
        省級期刊 1個月內(nèi)下單
        江蘇省通信學會
      • 信息通信
        省級期刊 1個月內(nèi)下單
        湖北省通信學會
      • 當代通信
        部級期刊 1個月內(nèi)下單
        中國通信企業(yè)協(xié)會
      • 現(xiàn)代通信
        部級期刊 1個月內(nèi)下單
        中國通信學會
      服務(wù)與支付