相信目前很多朋友都是所谓IT科技的“瘾君子”,很多人会对电子产品和信息科技革新兴奋不已,自己也有不少同学也在做相关方面的研究。凑巧的很,我自己的主要兴趣也是相关方面的学习和研究( 是在做研究么?鬼知道了:-) ),研究水平的高低暂且不论,相关的论文、文章和产品倒是接触了不少,多少也有点认识吧。

究竟IT科技能够给人们的日常生活和社会生产带来多大的正面促进,或者更确切的说就现有信息科技产业的发展水平其发展的作用究竟有多大,是值得深思的。美国是个商业利益至上的国度,许多IT技术革新都源那里,但是其中有多少是来自社会真实的需求,又有多少是”归功于”商业目的的操作和推广,是很难分辨的;在中国,很多信息系统项目的上马更多的是出自于政府或者企业的”政绩项目”,”面子工程”以及”公关需要”等,真正能发挥作用的系统相比美国就更少了,毕竟后者有广大的市场和投资者的监督。早在大学求学期间,自己的指导老师就曾对我戏言说”在中国,生产力最高的软件工具不是什么VC,而是Word和PowerPoint”,多少也说明了这个问题。通过一切方法把项目拿下来才是最重要的事情,接下来能不能做好,具体怎么做,会做的怎么样,怎么交付使用等,那就”八仙过海各显神通”了。现在社会经济不景气,在出口受阻的情况下,我们政府在鼓励为全面拉动内需努力。适在此时,国内的创业版也要马上上了,加上就业形势严峻,一股创业热潮即将到来,其中IT产业也必将占有很重要的一部分。事实上,好几个朋友也都在捣鼓这方面的事情,也许明天自己也将成为IT创业大军中的一员,这是后话了。只是希望新的IT项目和产品能够更多从实用的角度出发,切勿虚耗一气而只是为了满足某些人的商业利益和个人兴趣(很多人有”瘾”啊,呵呵)。因为在这个过程中,不光浪费的有大量的能源和物资,还有人类宝贵的智力资源。毕竟计算机只是工具而已,它完成为你工作以及适当娱乐的使命就够了。它以及它身后的互联网世界虽然很诱人且相对公平,来自现实生活的快乐才是最真实和持久的。
说完了对IT产业的牢骚和期许,也说说研究方面的事情。虽然信息科学研究领域很广,但现在大部分理论研究方法都是以数学为基础的,计算机系统更多的时候只是一种实现和展示的平台。除了数学之外,也有大量的算法是源自于生物学(例如人工神经网络,遗传算法等等),物理(例如仿真系统中的物理模型等)研究领域,这些新的算法也是通过数学方法建模,然后在计算机系统中实现的。因此可以说,数学是现在信息科技研究领域最重要的工具之一。就拿自己喜欢也正在从事的信息检索检索领域来说,其主要任务是如何建设一个强大的搜索引擎,其能够帮助用户快速找到其所需要的信息;这些信息还可以根据其重要性或者信息量排序,这样用户可以第一时间阅读到最重要(也是对其最有用的)的信息。当然要实现这个系统有很多理论上和技术上的问题需要解决。着重从理论上来说,要完成这个任务,首先是需要对文档中的信息内容有个定性描述和定量评估,目的是要让计算机系统知道这篇文档中含有什么样的信息内容以及信息量有多少(即使之变成“可计算”的数据);其次是如何度量用户的信息检索请求,一个好的信息检索系统应该能够根据用户”实际需要”来检索,而不是根据”其所输入的关键字”来检索,当然这需要通过了解用户的背景、搜索习惯和历史记录来推测出其真实的”检索要求”,例如”Apple”对于IT从业者可能指苹果电脑,对于像我爸妈那样的农民朋友们或家庭主妇们更多的时候是指”可以吃的苹果”吧;最后一个理论问题就是如何衡量文档和查询之间的相关性,即一个文档能够满足用户的信息检索需求,或者从多大程度上能够满足用户的这种需求。早期的研究主要是从人类自然语言的角度,从过分析词频、词义等方法来试图解决相关问题,这种方法往往会忽略含有丰富信息的上下文环境;近年来兴起的相关研究慢慢转向语义和认知的角度,试图让搜索引擎能够更加智能,能够达到”猜透人们的思想”,知道“人们真正需要的是什么”,理解“人们在文档中在讨论什么内容”等目的。数学模型和工具在信息检索领域起了很大的作用,例如表达信息量的”熵”理论,自然语言处理领域中的”统计语言模型”、”马尔科夫链”和”贝叶斯网络”。类似的数学模型和工具还可以用于很多其他相关的研究领域,例如”输入法”,”语音识别技术”,”动态规划”,”地址识别”等等。可以说,掌握和使用适当的数学理论和工具对于从事信息科学研究的人员是很重要的,相比之下特定的软件编程技术就是一些细枝末节等东西了。
说了这么多,最后要推出本文着重推荐的两个博文系列-”数学之美”和”浪潮之巅”。这两个系列博文均出自Google公司(中国)的资深研究员吴军博士之手,目前还在持续更新过程中(虽然频率不是很快)。新的内容可以通过文末提供的链接读取。”数学之美”主要是用通俗的语言和具体的例子介绍了在信息科学特别是信息检索和自然语言处理领域重要的数学方法及其应用,对于从事相关方面的研究人员应该有很大的帮助,至少能够得到不少的启发和鼓励。”浪潮之巅”根据作者在美国的亲身经历和所见所闻,细数了信息科技发展过程中重要公司和企业的兴衰,以及他们发展历史背后的技术、投资者、金融市场、政策等多方力量的角力,分析这些力量是如何影响信息科技发展方向的,该系列博文应该对有志于在该领域创业的人士有一定的参考价值。至少我自己读了这两个系列之后,感觉收获良多。
下面给出链接和博文提纲。
上午看了看《数学之美》,一下子就看进去了噢~~实在是好文,多谢分享!
By: Wan on 2009年03月25日
at 12:33 下午