语义化:未来搜索引擎的发展方向
发布于: May 17, 2009, 11:48 am 分类: IT大杂烩 作者: Saturn 0 个评论
最近几天,关于wolframalpha挑战Google搜索引擎霸主地位的新闻在业界抄的是沸沸扬扬。
一款名为WolframAlpha(简称WA)的新型网络搜索引擎于16日正式上线(英文网址为www.wolframalpha.com)。这种搜索引擎不会返回大量网页链接,而是基于新的算法和大型数据库,直接给出答案。
我并不认为现在的wolframalpha能够对Google造成任何形式的挑战和威胁,那些耸人听闻的说法不过是媒体的大肆炒作罢了。毕竟类似wolframalpha目前这种新式语义化搜索技术尚不成熟,而以一种不成熟的技术去颠覆Google苦心经营了十年的搜索帝国,这显然是天方夜谭。更何况,从心理学角度讲,用户对Google本身的依赖,并不只决定于Google搜索技术水平,还由Google在某一特定区域的品牌价值决定。
这也是就为什么Google在中国市场很难战胜Baidu的原因。2005年的时候,百度可以自豪的称,百度更懂中文。但经过若干年的本地化,谷歌对汉语搜索的支持似乎并不比百度差多少。不过,就目前的市场份额来看,Google仍然不能对百度造成太大的威胁。这主要是因为中国网民已经对百度,或者说这个品牌产生了依赖。
回到wolframalpha挑战Google这一话题上来。
人们对于wolframalpha作为“Google杀手”的愿景,实际上是对未来搜索引擎的愿景——语义化搜索。
传统搜索引擎,不管是雅虎,Google还是百度,对搜索结果的处理都是首先对搜索关键字进行分析,然后根据“网页受欢迎度”对其已索引的网页进行排序,然后展现给用户,由用户对信息进行进一步检索。这里所提到的“网页受欢迎度”就是我们通常所说的“网页评级”。
换句话说,搜索引擎本身并不理解用户输入关键字的具体意思,它只对字符本身进行匹配。
传统搜索引擎的诟病就出在这里:一个网页评级很高的网站所输出的某篇文章(比如国内的几大门户网站),或许文章的“质量”并不高,而且可能并不是用户所希望检索到的文章。但就是因为这篇文章所在网站的网页评级很高,导致这篇文章在搜索引擎的排序却很高。这其实在一定程度上是对用户的一种误导,因为用户失去了以最短时间获取最高质量文章的机会,他们得到的结果可能仅是一些牛头不对马嘴的文章,此时他们需要更多的时间来进一步对这些文章进行筛选甄别。换个角度,如果某个独立博客上有一篇非常优秀的文章,但正是因为这个博客本身的网页评级不高,导致这篇文章失去了被“曝光”的机会。
语义化搜索引擎所需要做的就是传统搜索引擎没有做到,或者说没有做好的这一部分。那就是:搜索引擎“理解”用户输入文字的意思,然后根据语义给出筛选结果。
Wolframalpha正是一个集成此思想的新型搜索引擎,它就像一个互联网的先知,负责回答用户的各种问题,比如在Wolframalpha上搜索"China",你会看到有关中国的各种统计信息,包括人口,GDP,语言等等很多信息。
假设你进一步精确你的搜索关键字,输入"Where is China"(中国在哪?),Wolframalpha会直接告诉你中国在世界地图中的位置。
至此,或许你已经不难理解为什么国外媒体喜欢将Wolframalpha当作Google杀手了。
语义化搜索引擎,国外比较有名的还有Hakia(国内的我还没有发现,如果谁发现了请告诉我),它同样以文章质量的评级来对搜索结果进行排名,而非受欢迎程度。Hakia还是一个SaaS的典型应用,在以后的文章中我还会提到。
毫不夸张的说,语义化搜索本身的确可以对Google造成致命一击,但问题是,现在的wolframalpha并不等于语义化搜索引擎。如果你多尝试输入几次关键字,就会发现它目前能回答的问题很少。但不管怎样,Wolframlapha的出现或许昭示着搜索引擎格局的重大变更。互联网的准则就是"Nothing is impossible"(没有什么不可能),不相信这句话的人结局会很悲惨,比如现在的雅虎。
但不管怎样,我斗胆预言,在未来二十年内,搜索引擎的格局势必会再次发生转变,而转变的重心之一即是搜索引擎的语义化。