《数学之美》读后小结

Tags:

大学时候读过吴军博士的《浪潮之巅》,从中了解到了IT行业的近代史,形形色色的传奇人物和大事件,非常震撼,读完的同时也对作者的才华感到佩服,不仅是一名一流的计算机科学家,更是一位难得的历史研究者。

最近又拜读了吴博士的《数学之美》。入手前以为是一本和《编程之美》类似的书,无非讲讲算法、数学之类的。但等到开始读的时候才发现,这本书的特别之处,他将IT发展史和数学、算法一起介绍,却一点也不显乱,甚至是让枯燥的数学变得生动,读完的感觉就像读了一本小说。

大概记录下读书笔记吧。

第一个重要点是,自然语言处理。之前完全没了解这方面的技术,一直以为自然语言处理应该也是雷同编程语言的处理,文法分析语义分析什么的。但实际上,这是个大坑。前期研究自然语言处理的科学家,包括各种工程师和语言学家,都花了大量精力地研究怎么用“精确的语言解码器"来让计算机理解自然语言。

这条路是行不通的。一是因为自然语言很难建模,或者说很难建立一个完备的模型,使得任何自然语句计算机都能正确解析和翻译,想想上编译原理课的时候,(一个语法简单的tinyc编译器都折腾死人了);二是世界上有太多的语言了,不同的语言,语法不一样,无法用同一个数学模型,所有语言都要去分析研究、建模、开发程序,成本太高了。虽然到了21世纪,有人确实用“规则”的方法,实现了翻译精确度50%以上的翻译程序,但这个程度是不够的。特别是遇到强大的对手—基于统计的自然语言处理——的时候。

用了统计语言模型后,语音识别的准确度可以高达90%。这其中仅仅是用到了一些概率论和数论的定理,太神奇了。自然语言处理包括了各种各样小问题,但差不多都是用概率的方法来解决的,包括中文分词等。

第二个重要点是,信息的度量。怎么量化信息?一本《水浒传》有多少信息量?这个问题的答案是,信息熵。一条信息的信息量与其不确定性有着直接的关系。 信息量可以用比特数来表示,香农的公式这里就不贴了~

信息的作用呢,就是用来消除不确定性的。比如现在你想追隔壁班的一位女生,你对她一点都不了解,除了知道她长什么样。你不确定你能不能追到这个女生,或者说,你希望提高成功率。于是你需要消除这种不确定性,那就需要去获取关于这个女生的一些信息。

第三个重要点是,搜索和布尔代数。一直对搜索引擎的原理不了解,而吴军这位在google工作过的大牛,解答了我的疑问。原来搜索的核心技术,只是布尔代数。当前还有很多工程问题、优化问题、大数据、分布式问题,也不是开玩笑的。不过总的来说就是,用横向扩张物理服务器的方式来处理大访问量和存放处理大数据,而搜索的核心技术是布尔运算。数学ORZ。

其他的内容,和搜索、反作弊,关联比较多,因为我不是打算做这2个方向的,所以这里也不说太多了。入手这本书的原因是据说这本书讲了一些人工智能的技术。虽然和期待不太一样,不过也是收获颇丰了。

说到人工智能,其实自然语言处理就是现代人工智能技术的一个基础。因为它要解决的是自然语言->机器,这个输入问题。假设现在我们开发出了一个非常智能的程序,但是它不能直接理解自然语言(输入数据),那它也无法产生我们需要的输出了。以视觉为基础的机器人也是一样,如果不研究计算机视觉技术,那这个机器人就只能是个盲人,即时他大脑再聪明。

(未经授权禁止转载)
Written on July 24, 2015

博主将十分感谢对本文章的任意金额的打赏^_^