基于自適應(yīng)線程束的GPU并行PSO算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
基于統(tǒng)一計(jì)算設(shè)備架構(gòu)( CUDA)對(duì)圖形處理器(GPU)下的并行粒子群優(yōu)化(PSO)算法作改進(jìn)研究。根據(jù)CUDA的硬件體系結(jié)構(gòu)特點(diǎn),可知Block是串行執(zhí)行的,線程束(Warp)才是流多處理器(SM)調(diào)度和執(zhí)行的基本單位。為了充分利用Block中線程的并行性,提出基于自適應(yīng)線程束的GPU并行PSO算法:將粒子的維度和線程相對(duì)應(yīng);利用GPU的Warp級(jí)并行,根據(jù)維度的不同自適應(yīng)地將每個(gè)粒子與一個(gè)或多個(gè)Warp相對(duì)應(yīng);自適應(yīng)地將一個(gè)或多個(gè)粒子與每個(gè)Block相對(duì)應(yīng)。與已有的粗粒度并行方法(將每個(gè)粒子和線程相對(duì)應(yīng))以及細(xì)粒度并行方法(將每個(gè)粒子和Block相對(duì)應(yīng))進(jìn)行了對(duì)比分析,實(shí)驗(yàn)結(jié)果表明,所提出的并行方法相對(duì)前兩種并行方法,CPU加速比最多提高了40。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于自適應(yīng)線程束的GPU并行PSO算法下載
相關(guān)電子資料下載
- 天數(shù)智芯亮相2024世界人工智能大會(huì) 314
- 擁抱多元化,Imagination迎來新機(jī)遇 103
- 英偉達(dá)H200芯片將大規(guī)模交付 214
- 浪潮信息推出AIGC存儲(chǔ)解決方案 255
- 愛普生(EPSON)陀螺儀傳感器的特點(diǎn)和應(yīng)用領(lǐng)域介紹 77
- 如何使用PyTorch構(gòu)建更高效的人工智能 75
- NVIDIA Grace Hopper超級(jí)芯片支持金融平臺(tái)Murex MX.3 393
- ai服務(wù)器和通用服務(wù)器的區(qū)別在哪 113
- 世強(qiáng)硬創(chuàng)榮膺EPSON(愛普生)FY23新項(xiàng)目拓展獎(jiǎng) 298
- AMD EPYC 9554處理滿足高頻率、多線程所需 296