阿卡 信息技术
 
搜索:
  购买 | 联系我们 | 站点地图 | 我的阿卡 | 帮助


当前位置: 阿卡首页 > 产品与服务> coreSearch海量中文检索系统

coreSearch海量中文检索系统

国际上文本信息检索的发展始于1950年代,文本检索也是目前多媒体内容的有效的辅助检索手段。中文文本信息检索最早见于748工程中的汉字情报检索。80年代中期后,由于计算机处理能力的大大提高和应用的普及化,中文文本信息检索的研究开始进入黄金期,各种汉字文本索引方法、检索算法以及实用化系统开始出现,各种全文检索商用系统的出现就是这个阶段的成果。经过10多年的发展,中文文本全文检索技术已经完全成熟。

互联网的发展大大促进了信息检索技术的发展和应用,一大批搜索引擎产品诞生,为网民提供了很好的快速信息获取和网络信息导航工具,目前最著名的搜索引擎包括Google, Altavista 等,国内百度的中文搜索引擎也取得了很好的成绩。搜索引擎服务和搜索引擎技术是完全不同的两个概念,每个门户网站都会提供搜索引擎服务,但背后的搜索引擎技术是一般用户看不见的。搜索引擎技术中也普遍采用了全文搜索技术,但互联网的信息和一般企业内部信息是不同的,有两个关键问题需要解决:一是速度,传统信息检索系统一般索引库规模度在G级,但互联网网页搜索需要处理几千万上亿的网页,二是相关性,信息太多,查准和排序就特别重要。解决第一个问题的基本策略都是采用检索服务器群集技术,解决第二个问题的方法包括象Google和百度等发展了的链接分析技术。

我公司的coreSearch海量中文检索系统目前解决了三个挑战性问题:一是检索的高质量,目前其它搜索引擎中基本上没有采用智能化技术,二是采用了知识压缩,互联网信息重复的太多,必须去重,有专家称为知识压缩,本系统可以对信息进行有效的压缩。三是可以方便的转向企业应用,搜索引擎技术的一些优势可以通过本软件,提供给有中文全文检索需求的机构进行二次开发。

 
相关链接
技术与服务
招聘信息 | 联系我们
© 2001 Aka Information Technology Co., Ltd. All Rights Reserved.
京ICP证020015号