自然语言处理入门书

news/2024/5/18 22:03:06 标签: 自然语言处理, processing, 出版, 语言, 读书
 如果你刚接触语言处理>自然语言处理并对她感兴趣,最好读几本这方面的书籍,除了能让你知道语言处理>自然语言处理各个领域是干什么的外,还能培养一下NLP的感觉。 以下四本书是我读研期间阅读和接触过的,如果您还有好书推荐,欢迎补充。

1、 语言处理>自然语言处理综论》(Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition)
  这本书的权威自不用说,译者是冯志伟老师和孙乐老师,当年读这本书的时候,还不知道冯老师是谁,但是读起来感觉非常好,想想如果没有在这个领域积攒多年的实力,是不可能翻译的这么顺畅的。这本书在国内外的评价都比较好,对语言处理>自然语言处理的两个学派(语言学派和统计学派)所关注的内容都有所包含,但因此也失去一些侧重点。从我的角度来说更偏向于统计部分,所以需要了解统计语言处理>自然语言处理的读者下面两本书更适合做基础阅读。不过这本书的N-gram语言模型部分写得非常不错,是SRILM的推荐阅读参考。

2、《统计语言处理>自然语言处理基础》(Foundations of Statistical Natural Language Processing)
  我比较喜欢这本书,这两年的学习过程中也经常拿这本书作为参考,可能与我做统计机器翻译有关吧。看china pub上的评论说这本书的翻译比较差,自己的感觉是还行。当然,这是国内翻译图书的一个通病:除了很难有翻译的非常好的书外,另外一个原因就是滞后性。如果e文足够好的坏,就及时看英文版吧。这本书在统计基本部分的介绍很不错,另外n元语法部分讲得也比较好,也是SRILM的推荐阅读。

3、《统计语言处理>自然语言处理》
  这是北京自动化所宗成庆老师今年5月出版的一本专著,我有幸较早的阅读了这本书的很多章节。一个很强的感觉是:如果你想了解相关领域的国内外最新进展,这本书非常值得一读。上面两本书在由于出版稍早的缘故,很多领域最新的方法都没有介绍。而这本书刚刚出版,宗老师对国内外现状把握的也比较好,因此书中充分体现了这方面的信息。另外统计机器翻译这一部分写得很详细很不错,这可能与宗老师亦是这个领域的研究者有关吧。

4、《计算机语言处理>自然语言处理》
  这是我最早看的一部语言处理>自然语言处理方面的书籍,和上面几部大部头的书籍相比,这本书很薄,可以很快的看完。书的内容我都有点忘了,但是印象中可以在每个章节看到国内这个领域的研究历史和相关单位。这时才发现母校HIT在这个领域的超强实力,只是可惜这时候已经离开冰城了。

  这些书籍怎么读都行,泛览也罢,精读也行,只要有时间,多读书是没坏处的。我自己的经验是,先泛泛的浏览或阅读一篇,对于比较晦涩的部分可以先跳过去,然后对自己感兴趣的领域或者将要从事的领域的相关章节进行精读,当然,书籍一般在开始的几个章节讲些基础性的知识,这部分最好也仔细揣摩一下。真正要对自己研究的领域深刻了解,还得好好读一下本领域的相关论文。

卓越网:语言处理>自然语言处理书籍
当当网:语言处理>自然语言处理书籍

注:原创文章,转载请注明出处“我爱语言处理>自然语言处理”:www.52nlp.cn


http://www.niftyadmin.cn/n/1535487.html

相关文章

转:LRU算法

LRU是Least Recently Used的缩写,即最近最少使用页面置换算法,是为虚拟页式存储管理服务的,是根据页面调入内存后的使用情况进行决策了。由于无法预测各页面将来的使用情况,只能利用“最近的过去”作为“最近的将来”的近似&#…

自然语言处理应用方向和专业英语

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理处理的内容涉及到语言的各个层次,包括字、词、句、段落、篇章和语义。 目前自然语言处理的主要研究和应用方向有&a…

【树莓派】树莓派常用的一些源

树莓派更新或者下载一些软件资源的话,需要从国外下载,比较慢。 阿里云的镜像源: http://mirrors.aliyun.com/raspbian/raspbian/ 这是一些国内的源,可以参考使用: #替换国内源#中山大学 deb http://mirror.sysu.edu.cn/raspbian/r…

Linux中.a,.la,.o,.so文件的意义和编程实现

Linux下文件的类型是不依赖于其后缀名的,但一般来讲:   .o,是目标文件,相当于windows中的.obj文件   .so 为共享库,是shared object,用于动态连接的,和dll差不多   .a为静态库,是好多个.o合在一起,用于静态连接   .la为libtool自动生成的一些共享…

bootstrap table 前端搜索

1.bootstrap-table对于前端的搜索可以通过官网设置,但发现前端搜索出现bug,网上找到一个bootstrap-table的扩充js bootstrap-table-mytoolbar.js,可以通过结合bootstrap-table简单的配置就可以进行使用,结合实例说明:…

内存管理内幕-动态分配的选择、折衷和实现

http://www.ibm.com/developerworks/cn/linux/l-memory/ 为什么必须管理内存 内存管理是计算机编程最为基本的领域之一。在很多脚本语言中,您不必担心内存是如何管理的,这并不能使得内存管理的重要性有一点点降低。对实际编程来说,理解您的内…

React-Native 运行Github上的项目

一、运行终端、打开工程目录 1、使用WebStorm file - open - 选择项目工程所在文件 - 确定点击左下方的终端按钮-显示终端控制界面如图: 终端界面: 2、使用终端 打开终端,cd 项目路径,例如: 直接将项目拖到终端中&am…

自动作文评分与自然语言处理

自动作文评分与自然语言处理 前些天一个学弟发邮件咨询有关自动作文评分的问题,在了解了这是他们导师布置的一个任务后,出于做统计机器翻译的惯性思维,我马上想到的是利用语言模型对作文进行流利度方面的打分,但也意识到这是一个粗…