久热精品在线视频,思思96精品国产,午夜国产人人精品一区,亚洲成在线a

<s id="x4lik"><u id="x4lik"></u></s>

      <strong id="x4lik"><u id="x4lik"></u></strong>

      期刊在線咨詢服務(wù),立即咨詢

      400-838-9662 購(gòu)物車(0)

      通信資源調(diào)度對(duì)稱MARL問(wèn)題策略估計(jì)誤差分析

      張昕然; 孫松林 北京郵電大學(xué)信息與通信工程學(xué)院; 北京100876; 北京郵電大學(xué)可信分布式計(jì)算與服務(wù)教育部重點(diǎn)實(shí)驗(yàn)室; 北京100876; 北京郵電大學(xué)移動(dòng)互聯(lián)網(wǎng)安全技術(shù)國(guó)家工程實(shí)驗(yàn)室; 北京100876

      關(guān)鍵詞:強(qiáng)化學(xué)習(xí) 對(duì)稱多智能體強(qiáng)化學(xué)習(xí) 策略估計(jì) 

      摘要:針對(duì)通信資源調(diào)度場(chǎng)景下的多智能體強(qiáng)化學(xué)習(xí)(MARL)問(wèn)題,提出了對(duì)稱MARL問(wèn)題以及三類對(duì)稱性的定義和條件,并定義了策略融合和策略誤差;針對(duì)強(qiáng)對(duì)稱MARL問(wèn)題,定義了三類評(píng)價(jià)指標(biāo),并對(duì)策略估計(jì)誤差進(jìn)行分析,提出了強(qiáng)對(duì)稱MARL問(wèn)題的策略誤差定理及推論.針對(duì)無(wú)線通信的接入控制問(wèn)題建立了MARL問(wèn)題,仿真結(jié)果驗(yàn)證了強(qiáng)對(duì)稱MARL問(wèn)題策略估計(jì)誤差的特性.結(jié)果表明,可以使用低復(fù)雜度的MARL子問(wèn)題對(duì)高復(fù)雜度的強(qiáng)對(duì)稱MARL問(wèn)題進(jìn)行策略估計(jì),且策略估計(jì)誤差和對(duì)網(wǎng)絡(luò)性能的影響均較小.

      北京郵電大學(xué)學(xué)報(bào)雜志要求:

      {1}請(qǐng)?zhí)貏e注意:著錄參考文獻(xiàn)出處時(shí),期刊引文須注明的是引文所在具體頁(yè)碼,而非該文獻(xiàn)在期刊中的起訖頁(yè)碼;報(bào)紙引文必須在日期之后注明文獻(xiàn)所在的版次。

      {2}稿件的作者署名、保密和是否侵權(quán)等問(wèn)題均由作者自行負(fù)責(zé)。

      {3}正文應(yīng)論點(diǎn)明確、論據(jù)充分、文字簡(jiǎn)煉、通順、層次清楚。

      {4}結(jié)論之后,應(yīng)有致謝部分,對(duì)國(guó)家科學(xué)基金、資助者或支持者、提供指導(dǎo)和幫助者、給予轉(zhuǎn)載和引用權(quán)的資料、圖片、文獻(xiàn)、研究思想和設(shè)想的所有者,表示感謝。

      {5}關(guān)鍵詞每篇文章可選用3~5個(gè)能反映文章主題概念的詞、詞組或術(shù)語(yǔ)。

      注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社

      北京郵電大學(xué)學(xué)報(bào)

      北大期刊
      預(yù)計(jì)1-3個(gè)月審稿

      期刊主頁(yè)
      相關(guān)期刊
      • 江蘇通信
        省級(jí)期刊
        預(yù)計(jì)1個(gè)月內(nèi)審稿
      • 信息通信
        省級(jí)期刊
        預(yù)計(jì)1個(gè)月內(nèi)審稿
      • 現(xiàn)代通信
        部級(jí)期刊
        預(yù)計(jì)1個(gè)月內(nèi)審稿
      • 當(dāng)代通信
        部級(jí)期刊
        預(yù)計(jì)1個(gè)月內(nèi)審稿
      我們的服務(wù)