資料介紹
作為一個(gè)自然語(yǔ)言處理的初學(xué)者,看書(shū)看到“訓(xùn)練模型”,這模型那模型的,一直不知道模型究竟是什么東西??戳诉@本書(shū),從預(yù)處理數(shù)據(jù)到提取特征集,訓(xùn)練模型,測(cè)試修改等,一步一步實(shí)際操作了之后,才對(duì)模型一詞有了直觀的認(rèn)識(shí)(算法的中間結(jié)果,存儲(chǔ)在計(jì)算機(jī)中的一個(gè)個(gè) pkl 文件,測(cè)試的時(shí)候直接用,前面計(jì)算過(guò)的就省了)。以后聽(tīng)人談“模型”的時(shí)候也有了底氣。當(dāng)然,模型還有很多其他含義。還有動(dòng)詞的“配價(jià)”、各種搭配、客觀邏輯對(duì)根據(jù)文法生成的句子的約束如何實(shí)現(xiàn)?不上機(jī)動(dòng)手做做,很難真正領(lǐng)悟。
自然語(yǔ)言處理理論書(shū)籍很多,講實(shí)際操作的不多,能講的這么系統(tǒng)的更少。從這個(gè)角度講,本書(shū)是目前世界上最好的自然語(yǔ)言處理實(shí)踐教程。初學(xué)者若在看過(guò)理論之后能精讀本書(shū),必定會(huì)有獲益。這也是翻譯本書(shū)的目的之一。
?
PYTHON 自然語(yǔ)言處理
從輸入法聯(lián)想提示(pre dictive text)、email 過(guò)濾到自動(dòng)文本摘要、機(jī)器翻譯,大量的語(yǔ)言相關(guān)的技術(shù)都離不開(kāi)自然語(yǔ)言處理的支持,而這本書(shū)提供了自然語(yǔ)言處理非常方便的入門(mén)指南。通過(guò)它,你將學(xué)到如何寫(xiě)能處理大量非結(jié)構(gòu)化文本的 Python 程序。你將獲得有豐富標(biāo)注的涵蓋語(yǔ)言學(xué)各種數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)集,而且你將學(xué)到分析書(shū)面文檔內(nèi)容和結(jié)構(gòu)的主要算法。
這是一本關(guān)于自然語(yǔ)言處理的書(shū)。所謂“自然語(yǔ)言”,是指人們?nèi)粘=涣魇褂玫恼Z(yǔ)言,如英語(yǔ),印地語(yǔ),葡萄牙語(yǔ)等。相對(duì)于編程語(yǔ)言和數(shù)學(xué)符號(hào)這樣的人工語(yǔ)言,自然語(yǔ)言隨著一代人傳給另一代人而不斷演化,因而很難用明確的規(guī)則來(lái)刻畫(huà)。從廣義上講,“自然語(yǔ)言處理”(Natural Language Processing 簡(jiǎn)稱 NLP)包含所有用計(jì)算機(jī)對(duì)自然語(yǔ)言進(jìn)行的操作,從最簡(jiǎn)單的通過(guò)計(jì)數(shù)詞出現(xiàn)的頻率來(lái)比較不同的寫(xiě)作風(fēng)格,到最復(fù)雜的完全“理解”人所說(shuō)的話,至少要能達(dá)到對(duì)人的話語(yǔ)作出有效反應(yīng)的程度。
基于 NLP 的技術(shù)應(yīng)用日益廣泛。例如:手機(jī)和手持電腦支持輸入法聯(lián)想提示和手寫(xiě)識(shí)別;網(wǎng)絡(luò)搜索引擎能搜到非結(jié)構(gòu)化文本中的信息;機(jī)器翻譯能把中文文本翻譯成西班牙文。通過(guò)提供更自然的人機(jī)界面和更復(fù)雜的存儲(chǔ)信息獲取手段,語(yǔ)言處理正在這個(gè)多語(yǔ)種的信息社會(huì)中扮演更核心的角色。這本書(shū)提供自然語(yǔ)言處理領(lǐng)域非常方便的入門(mén)指南。它可以用來(lái)自學(xué),也可以作為自然語(yǔ)言處理或計(jì)算語(yǔ)言學(xué)課程的教科書(shū),或是人工智能、文本挖掘、語(yǔ)料庫(kù)語(yǔ)言學(xué)課程的補(bǔ)充讀物。本書(shū)的實(shí)踐性很強(qiáng),包括幾百個(gè)實(shí)際可用的例子和分級(jí)練習(xí)。本書(shū)基于 Python 編程語(yǔ)言及其上的一個(gè)名為自然語(yǔ)言工具包(Natural Language Toolk it,簡(jiǎn)稱 NLTK)的開(kāi)源庫(kù)。NLTK 包含大量的軟件、數(shù)據(jù)和文檔,所有這些都可以從 http:/ /www.nltk.org/免費(fèi)下載。NLTK 的發(fā)行版本支持 Windows、Macintosh 和 Unix 平臺(tái)。我們強(qiáng)烈建議你下載 Python 和 NLTk,與我們一起嘗試書(shū)中的例子和練習(xí)。
本書(shū)前幾章按照概念的難易程度編排。先是實(shí)用性很強(qiáng)的語(yǔ)言處理的入門(mén)介紹,講述如何使用很短的 Python 程序分析感興趣的文本信息(1-3 章)。接著是結(jié)構(gòu)化程序設(shè)計(jì)章節(jié)(第 4 章),用來(lái)鞏固散布在前面幾章中的編程要點(diǎn)。之后,速度加快,我們用一系列章節(jié)講述語(yǔ)言處理的主要內(nèi)容:標(biāo)注、分類(lèi)和信息提取(5-7 章)。接下來(lái)的三章探索分析句子、識(shí)別句法結(jié)構(gòu)和構(gòu)建表示句意的方法(8-10 章)。最后一章講述如何有效管理語(yǔ)言數(shù)據(jù)(第 1 1 章)。本書(shū)結(jié)尾處的后記簡(jiǎn)要討論了 NLP 的過(guò)去和未來(lái)。
每一章中我們都在兩種不同的敘述風(fēng)格間切換。一種風(fēng)格是以自然語(yǔ)言為主線。我們分析語(yǔ)言,探索語(yǔ)言學(xué)概;在討論中使用編程的例子。我們經(jīng)常會(huì)使用尚未系統(tǒng)介紹的 Pytho n 結(jié)構(gòu),這樣你可以在鉆研這些程序如何運(yùn)作的細(xì)節(jié)之前了解它們的效能。就像學(xué)習(xí)一門(mén)外語(yǔ)的慣用表達(dá)一樣,你能夠買(mǎi)到好吃的糕點(diǎn)而不必先學(xué)會(huì)復(fù)雜的提問(wèn)句型。敘述的另一種風(fēng) 17 格是以程序設(shè)計(jì)語(yǔ)言為主線。我們將分析程序、探索算法,而語(yǔ)言學(xué)例子將扮演配角。每章結(jié)尾都有一系列分級(jí)練習(xí),用于鞏固學(xué)到的知識(shí)。練習(xí)按照如下的標(biāo)準(zhǔn)分級(jí):○初級(jí)練習(xí):對(duì)范例代碼作稍微修改等簡(jiǎn)單的練習(xí);?中級(jí)練習(xí):深入探索材料的一個(gè)方面,需要仔細(xì)的分析和設(shè)計(jì);●高級(jí)練習(xí):開(kāi)放的任務(wù),挑戰(zhàn)你對(duì)材料的理解并迫使你獨(dú)立思考解決的方案(新學(xué)編程的讀者應(yīng)該跳過(guò)這些)
- 現(xiàn)代無(wú)線電實(shí)驗(yàn)的PDF電子書(shū)免費(fèi)下載 285次下載
- 半導(dǎo)體收音機(jī)淺談的PDF電子書(shū)免費(fèi)下載 171次下載
- 深度學(xué)習(xí)入門(mén):基于Python的理論與實(shí)現(xiàn)電子書(shū) 32次下載
- 光學(xué)諧振腔的圖解分析與設(shè)計(jì)方法的PDF電子書(shū)免費(fèi)下載 132次下載
- 簡(jiǎn)明python教程的中文版PDF電子書(shū)免費(fèi)下載 0次下載
- 高級(jí)語(yǔ)言程序設(shè)計(jì)從菜鳥(niǎo)到大師深入C語(yǔ)言程序設(shè)計(jì)PDF電子書(shū)免費(fèi)下載 182次下載
- 寫(xiě)給文科生看的編程入門(mén)Python管窺PDF電子書(shū)免費(fèi)下載 7次下載
- python入門(mén)教材電子書(shū)合集免費(fèi)下載 31次下載
- SHARP電子元器件綜合目錄中文版PDF電子書(shū)免費(fèi)下載 0次下載
- 數(shù)字信號(hào)處理算法C語(yǔ)言實(shí)現(xiàn)PDF電子書(shū)免費(fèi)下載 79次下載
- 電冰箱快速維修PDF電子書(shū)免費(fèi)下載 51次下載
- 家電維修1128例PDF電子書(shū)免費(fèi)下載 207次下載
- STM8 C語(yǔ)言精品編程100例PDF版電子書(shū)免費(fèi)下載 0次下載
- 數(shù)字信號(hào)處理算法C語(yǔ)言實(shí)現(xiàn)PDF版電子書(shū)免費(fèi)下載 0次下載
- 《史蒂夫-喬布斯傳》官方正式中文版電子書(shū) 0次下載
- 自然語(yǔ)言處理前饋網(wǎng)絡(luò)綜述 346次閱讀
- Transformer架構(gòu)在自然語(yǔ)言處理中的應(yīng)用 904次閱讀
- 使用Python進(jìn)行自然語(yǔ)言處理 481次閱讀
- 用于自然語(yǔ)言處理的神經(jīng)網(wǎng)絡(luò)有哪些 1354次閱讀
- 什么是自然語(yǔ)言處理 (NLP) 1282次閱讀
- 自然語(yǔ)言處理技術(shù)的原理的應(yīng)用 620次閱讀
- 神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理中的應(yīng)用 557次閱讀
- 如何開(kāi)始使用PyTorch進(jìn)行自然語(yǔ)言處理 2563次閱讀
- 自然語(yǔ)言處理是什么?有什么用? 6260次閱讀
- 多個(gè)視角對(duì)自然語(yǔ)言處理領(lǐng)域進(jìn)行全面梳理 3636次閱讀
- 自然語(yǔ)言處理的ELMO使用 3359次閱讀
- 自然語(yǔ)言處理研究的基本問(wèn)題及發(fā)展趨勢(shì) 8625次閱讀
- 自然語(yǔ)言處理的優(yōu)點(diǎn)有哪些_自然語(yǔ)言處理的5大優(yōu)勢(shì) 2.8w次閱讀
- RNN在自然語(yǔ)言處理中的應(yīng)用 5730次閱讀
- 從語(yǔ)言學(xué)到深度學(xué)習(xí)NLP,一文概述自然語(yǔ)言處理 6400次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1491次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 95次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說(shuō)明
- 4.28 MB | 18次下載 | 4 積分
- 5開(kāi)關(guān)電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費(fèi)
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于單片機(jī)和 SG3525的程控開(kāi)關(guān)電源設(shè)計(jì)
- 0.23 MB | 4次下載 | 免費(fèi)
- 8基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專(zhuān)業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537793次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論