資料介紹
一種適應(yīng)短文本的相關(guān)測(cè)度及其應(yīng)用:針對(duì)博客社區(qū)和BBS 論壇充斥Web 垃圾信息的問(wèn)題,提出相關(guān)度向量空間模型cVSM,并以此作為評(píng)論的特征,采用支持向量
機(jī)分類(lèi)算法自動(dòng)識(shí)別垃圾評(píng)論。cVSM 包括一種適合短文本的相關(guān)測(cè)度,用于衡量評(píng)論和文章的語(yǔ)義相關(guān)程度。在中文博客測(cè)試集和中文
BBS 測(cè)試集上的實(shí)驗(yàn)結(jié)果表明,相比純粹使用評(píng)論文本特征的方法,應(yīng)用該模型時(shí)F1 至少提高6%。
關(guān)鍵詞:博客;垃圾評(píng)論;支持向量機(jī);文本挖掘;相關(guān)測(cè)度
Relevancy Coefficient and Its Application Adapted to Short Texts
HE Hai-jiang
(Computer Center, Changsha University, Changsha 410003)
【Abstract】A relevancy coefficient vectort space model named cVSM is proposed to aim at Web spams which flood in blogosphere and forums.
The cVSM whose components are employed as features of comments and the support vector machine classification algorithms are used to
automatically identify comment spams. The relevancy coefficient included in the cVSM is presented, which is used to evaluate relevancy grade of
posts and comments. Chinese blog dataset and Chinese BBS dataset are tested. Experimental results show that compared with traditional method the
F1 has been improved at least 6% by this way.
【Key words】blog; comment spam; support vector machine; text mining; relevancy coefficient
機(jī)分類(lèi)算法自動(dòng)識(shí)別垃圾評(píng)論。cVSM 包括一種適合短文本的相關(guān)測(cè)度,用于衡量評(píng)論和文章的語(yǔ)義相關(guān)程度。在中文博客測(cè)試集和中文
BBS 測(cè)試集上的實(shí)驗(yàn)結(jié)果表明,相比純粹使用評(píng)論文本特征的方法,應(yīng)用該模型時(shí)F1 至少提高6%。
關(guān)鍵詞:博客;垃圾評(píng)論;支持向量機(jī);文本挖掘;相關(guān)測(cè)度
Relevancy Coefficient and Its Application Adapted to Short Texts
HE Hai-jiang
(Computer Center, Changsha University, Changsha 410003)
【Abstract】A relevancy coefficient vectort space model named cVSM is proposed to aim at Web spams which flood in blogosphere and forums.
The cVSM whose components are employed as features of comments and the support vector machine classification algorithms are used to
automatically identify comment spams. The relevancy coefficient included in the cVSM is presented, which is used to evaluate relevancy grade of
posts and comments. Chinese blog dataset and Chinese BBS dataset are tested. Experimental results show that compared with traditional method the
F1 has been improved at least 6% by this way.
【Key words】blog; comment spam; support vector machine; text mining; relevancy coefficient
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 面向搜索的微博短文本語(yǔ)義建模方法綜述 3次下載
- 面向短文本的中文真詞錯(cuò)誤檢測(cè)與修復(fù) 6次下載
- 面向短文本的中文真詞錯(cuò)誤檢測(cè)與修復(fù) 2次下載
- 基于BERT+Bo-LSTM+Attention的病歷短文分類(lèi)模型 13次下載
- 一種基于BERT模型的社交電商文本分類(lèi)算法 8次下載
- 基于BP神經(jīng)網(wǎng)絡(luò)分類(lèi)器的垃圾文本過(guò)濾模型 43次下載
- 一種針對(duì)中英混合文本的多維度多情感分析方法 16次下載
- 一種基于神經(jīng)網(wǎng)絡(luò)的短文本分類(lèi)模型 10次下載
- 結(jié)合BERT模型的中文文本分類(lèi)算法 6次下載
- 基于加權(quán)核非負(fù)矩陣分解的短文本聚類(lèi)算法的資料說(shuō)明 11次下載
- 中文短文本聚合模型研究 0次下載
- 基于短文本的突發(fā)事件過(guò)程展示 0次下載
- 融合詞語(yǔ)類(lèi)別特征和語(yǔ)義的短文本分類(lèi)方法 0次下載
- 一種多輸入多輸出系統(tǒng)中有限反饋預(yù)編碼的自適應(yīng)跟蹤測(cè)度
- 一種基于粒子濾波的自適應(yīng)相關(guān)跟蹤算法
- 基于文本到圖像模型的可控文本到視頻生成 983次閱讀
- OpenAI發(fā)布根據(jù)文字生成圖像的人工智能系統(tǒng) 1331次閱讀
- OpenAl提出了一種適用于文本、圖像和語(yǔ)音的稀疏Transformer 3315次閱讀
- 如何使用TensorFlow Hub文本模塊構(gòu)建一個(gè)模型,以根據(jù)相關(guān)描述預(yù)測(cè)電影類(lèi)型 3221次閱讀
- 如何使用EAST文本檢測(cè)器在自然場(chǎng)景下檢測(cè)文本 1.1w次閱讀
- 一種用于從文本簡(jiǎn)歷中挖掘相關(guān)信息的框架 2796次閱讀
- 【新專(zhuān)利介紹】一種精確的智能遠(yuǎn)傳水表及其工作系統(tǒng) 933次閱讀
- 【新專(zhuān)利介紹】一種智能電表付費(fèi)控制系統(tǒng)及其控制方法 1594次閱讀
- 【新專(zhuān)利介紹】一種物聯(lián)網(wǎng)智能水表及其管理系統(tǒng) 2616次閱讀
- 【新專(zhuān)利介紹】一種無(wú)磁感應(yīng)水表及其使用方法 3292次閱讀
- 【新專(zhuān)利介紹】一種水表校表系統(tǒng)及其校表方法 2870次閱讀
- 測(cè)試鏈路自適應(yīng)的一種新方法_IP網(wǎng)絡(luò)測(cè)試技術(shù) 1637次閱讀
- 智能天線(xiàn)技術(shù)研究及其相關(guān)介紹 827次閱讀
- 一種創(chuàng)新性DPD線(xiàn)性化電路特有的自適應(yīng)算法 2484次閱讀
- 一種新型帶寬自適應(yīng)全數(shù)字鎖相環(huán)的設(shè)計(jì)方案 3016次閱讀
下載排行
本周
- 1DC電源插座圖紙
- 0.67 MB | 2次下載 | 免費(fèi)
- 2AN158 GD32VW553 Wi-Fi開(kāi)發(fā)指南
- 1.51MB | 2次下載 | 免費(fèi)
- 3AN148 GD32VW553射頻硬件開(kāi)發(fā)指南
- 2.07MB | 1次下載 | 免費(fèi)
- 4AN111-LTC3219用戶(hù)指南
- 84.32KB | 次下載 | 免費(fèi)
- 5AN153-用于電源系統(tǒng)管理的Linduino
- 1.38MB | 次下載 | 免費(fèi)
- 6AN-283: Σ-Δ型ADC和DAC[中文版]
- 677.86KB | 次下載 | 免費(fèi)
- 7SM2018E 支持可控硅調(diào)光線(xiàn)性恒流控制芯片
- 402.24 KB | 次下載 | 免費(fèi)
- 8AN-1308: 電流檢測(cè)放大器共模階躍響應(yīng)
- 545.42KB | 次下載 | 免費(fèi)
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費(fèi)
- 2免費(fèi)開(kāi)源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機(jī)智能手環(huán)心率計(jì)步器體溫顯示設(shè)計(jì)
- 0.10 MB | 130次下載 | 免費(fèi)
- 4使用單片機(jī)實(shí)現(xiàn)七人表決器的程序和仿真資料免費(fèi)下載
- 2.96 MB | 44次下載 | 免費(fèi)
- 53314A函數(shù)發(fā)生器維修手冊(cè)
- 16.30 MB | 31次下載 | 免費(fèi)
- 6美的電磁爐維修手冊(cè)大全
- 1.56 MB | 24次下載 | 5 積分
- 7如何正確測(cè)試電源的紋波
- 0.36 MB | 17次下載 | 免費(fèi)
- 8感應(yīng)筆電路圖
- 0.06 MB | 10次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評(píng)論