資料介紹
針對(duì)確定性馬爾克夫決策過(guò)程,本文提出了一種基于支持樣本的快速增強(qiáng)學(xué)習(xí)算法。
文章首先把學(xué)習(xí)問(wèn)題形式化為一個(gè)確定性的馬爾可夫決策過(guò)程,并對(duì)問(wèn)題空間中每個(gè)狀態(tài)的總回報(bào)值進(jìn)行估計(jì),根據(jù)總回報(bào)估計(jì)值與累積總回報(bào)估計(jì)值的大小關(guān)系,提出了支持樣本的概念,即在大量的訓(xùn)練樣本中,提取出值得我們信賴(lài)的那些樣本;然后建立狀態(tài)空間與動(dòng)作空間之間的對(duì)應(yīng)關(guān)系,用得到的支持樣本進(jìn)行最小二乘逼近,得到了快速有效的策略函數(shù);最后,通過(guò)仿真實(shí)驗(yàn),證明了方法的有效性。
文章首先把學(xué)習(xí)問(wèn)題形式化為一個(gè)確定性的馬爾可夫決策過(guò)程,并對(duì)問(wèn)題空間中每個(gè)狀態(tài)的總回報(bào)值進(jìn)行估計(jì),根據(jù)總回報(bào)估計(jì)值與累積總回報(bào)估計(jì)值的大小關(guān)系,提出了支持樣本的概念,即在大量的訓(xùn)練樣本中,提取出值得我們信賴(lài)的那些樣本;然后建立狀態(tài)空間與動(dòng)作空間之間的對(duì)應(yīng)關(guān)系,用得到的支持樣本進(jìn)行最小二乘逼近,得到了快速有效的策略函數(shù);最后,通過(guò)仿真實(shí)驗(yàn),證明了方法的有效性。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 一種基于Q學(xué)習(xí)算法的增量分類(lèi)模型 3次下載
- 最小內(nèi)內(nèi)方差支持向量引導(dǎo)的字典學(xué)習(xí)算法 7次下載
- 機(jī)器學(xué)習(xí)的訓(xùn)練樣本數(shù)據(jù)選擇方法綜述 8次下載
- 基于深度學(xué)習(xí)的自然語(yǔ)言處理對(duì)抗樣本模型 39次下載
- 基于近鄰傳輸?shù)牧6?b class="flag-6" style="color: red">支持向量機(jī)學(xué)習(xí)算法 9次下載
- 基于共識(shí)率和加權(quán)樣本的標(biāo)記傳播算法CRLP 5次下載
- 基于深度學(xué)習(xí)的X射線(xiàn)胸部疾病診斷算法 17次下載
- 一種針對(duì)小樣本學(xué)習(xí)的雙路特征聚合網(wǎng)絡(luò) 9次下載
- 一個(gè)有效的快速迭代學(xué)習(xí)控制算法設(shè)計(jì)說(shuō)明 4次下載
- 用于自步學(xué)習(xí)的無(wú)監(jiān)督屬性選擇算法資料介紹 5次下載
- 機(jī)器學(xué)習(xí)教程之使用matlab研究機(jī)器學(xué)習(xí)的資料概述 32次下載
- 如何提高復(fù)雜環(huán)境下的人臉識(shí)別的增強(qiáng)算法資料概述 8次下載
- 基于自適應(yīng)探索改進(jìn)的深度增強(qiáng)學(xué)習(xí)算法 1次下載
- 基于增強(qiáng)學(xué)習(xí)算法的PID參數(shù)調(diào)整方法研究
- 一種基于類(lèi)支持度的增量貝葉斯學(xué)習(xí)算法
- 機(jī)器學(xué)習(xí)算法原理詳解 1235次閱讀
- 單樣本微調(diào)給ChatGLM2注入知識(shí) 3075次閱讀
- 小樣本學(xué)習(xí)領(lǐng)域的未來(lái)發(fā)展方向 872次閱讀
- 機(jī)器學(xué)習(xí)相關(guān)介紹:支持向量機(jī)(低維到高維的映射) 2215次閱讀
- 常見(jiàn)的小樣本學(xué)習(xí)方法 2003次閱讀
- 機(jī)器學(xué)習(xí)算法的基礎(chǔ)介紹 1978次閱讀
- CFA二級(jí)思維導(dǎo)圖分享:機(jī)器學(xué)習(xí) 1786次閱讀
- 對(duì)抗樣本真的是bug嗎?對(duì)抗樣本不是Bug, 它們是特征 4668次閱讀
- 如何構(gòu)建強(qiáng)化學(xué)習(xí)模型來(lái)訓(xùn)練無(wú)人車(chē)算法 4911次閱讀
- kNN算法是監(jiān)督學(xué)習(xí)中分類(lèi)方法的一種 1.1w次閱讀
- 自動(dòng)駕駛中機(jī)器學(xué)習(xí)算法主要分為哪四類(lèi)? 6391次閱讀
- Q Learning算法學(xué)習(xí) 3692次閱讀
- 機(jī)器學(xué)習(xí)算法之基于黑盒語(yǔ)音識(shí)別的目標(biāo)對(duì)抗樣本 3417次閱讀
- 機(jī)器學(xué)習(xí)-8. 支持向量機(jī)(SVMs)概述和計(jì)算 5250次閱讀
- 基于圖像增強(qiáng)的去霧快速算法的FPGA實(shí)現(xiàn) 5406次閱讀
下載排行
本周
- 1DC電源插座圖紙
- 0.67 MB | 2次下載 | 免費(fèi)
- 2AN158 GD32VW553 Wi-Fi開(kāi)發(fā)指南
- 1.51MB | 2次下載 | 免費(fèi)
- 3AN148 GD32VW553射頻硬件開(kāi)發(fā)指南
- 2.07MB | 1次下載 | 免費(fèi)
- 4AN111-LTC3219用戶(hù)指南
- 84.32KB | 次下載 | 免費(fèi)
- 5AN153-用于電源系統(tǒng)管理的Linduino
- 1.38MB | 次下載 | 免費(fèi)
- 6AN-283: Σ-Δ型ADC和DAC[中文版]
- 677.86KB | 次下載 | 免費(fèi)
- 7SM2018E 支持可控硅調(diào)光線(xiàn)性恒流控制芯片
- 402.24 KB | 次下載 | 免費(fèi)
- 8AN-1308: 電流檢測(cè)放大器共模階躍響應(yīng)
- 545.42KB | 次下載 | 免費(fèi)
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費(fèi)
- 2免費(fèi)開(kāi)源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機(jī)智能手環(huán)心率計(jì)步器體溫顯示設(shè)計(jì)
- 0.10 MB | 130次下載 | 免費(fèi)
- 4使用單片機(jī)實(shí)現(xiàn)七人表決器的程序和仿真資料免費(fèi)下載
- 2.96 MB | 44次下載 | 免費(fèi)
- 53314A函數(shù)發(fā)生器維修手冊(cè)
- 16.30 MB | 31次下載 | 免費(fèi)
- 6美的電磁爐維修手冊(cè)大全
- 1.56 MB | 24次下載 | 5 積分
- 7如何正確測(cè)試電源的紋波
- 0.36 MB | 17次下載 | 免費(fèi)
- 8感應(yīng)筆電路圖
- 0.06 MB | 10次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評(píng)論