达梦全文检索引擎
  全文检索引介绍
  企业信息化建设浪潮,催生了大量的内部信息资源。据统计,企业数据每年以200%的速度增长,其中80%的数据以文件、邮件、图片等非结构化数据形式存放在企业内计算机系统中的各个角落,而这些数据总量远远超过了互联网信息的总量。整合企业信息资源,构建企业搜索引擎,为组织内外部用户提供检索和个性化信息服务,已经成为企业信息化的一大热点。
  达梦全文检索引擎可以解决以下几个问题:
  1、信息量大时速度慢的问题
  比较常用的数据库有:Oracle、MySQL、MS SQL等,这些都是支持标准sql92语法的数据库,数据库的重点功能在存储,对于数据量达到千万级的时候,再执行sql语法的速度将会变得很慢,特殊是执行含有like的select语句时,比如一个采用mysql存储的客户信息表数据记录达到500万行以上时,就算增加再多的索引,采用标准select语句执行查询时,所需时间至少也在2分钟以上,Oracle数据库虽然可以采用分区,或采用Oracle的内置函数如instr来辅助查询,时间也在1分钟以上。
   达梦全文检索引擎采用全文检索技术,来解决搜索速度的问题。达梦全文检索引引擎为什么在检索时能达到零点零几秒返回结果呢?对要搜索的字段分好词,存成文件索引,搜索时再分词,直接去索引查找每个词有哪些索引后文档。
  2、信息形式多
  如果要建一个行业的信息库,如新闻库,可能就会分很多类别,如:互联网、应用软件、通信等,每类可能由一个部门来组织,并且有可能会涉及到各个部门,不但包括文字、图片、图表和视频等多种形式的信息资源,而且涵盖了其他语言的信息资源。达梦数据库搜索引擎能够提供一个统一的跨媒体检索。
  如果某集团公司原来多个部门都有自己的内部的ftp服务器,里面设置有复杂的权限,上面存放有各类文件,如word、excel、power point、wps、pdf等格式的文件,原来要查询某一个咨询文件,纯粹是靠记忆,总是想“好象记得什么时候做过类似的文档”,但就是一时找不到,又浪费一些时间来重写。如果能给这些内容提供一个综合的查询,将可以为企业节省很多人力成本。
  3、信息结构不一样
  如果以前有很多信息系统,并且数据库不同,也是用不同语言开发的,查询A信息要去A系统,查询B类信息又要去B系统查询,一是不方便查询,二是重复的数据多,没法充分的利用这些已有的数据资源。
  达梦数据库搜索引擎能够针对不同的数据源,采用灵活的定制,将这些数据统一成一个检索库,方便查询,达到数据的充分利用。
  主要案例
  东莞某印刷集团的内部知识库,该集团总部在香港,在东莞有多间工厂,内部有ERP系统,有FTP服务器,使用达梦全文检索引擎,另外做了权限方面的二次开发。
  长沙强化信息科技-空调制冷大市场搜索平台,search.hvacr.cn,从数据库实时更新,生成索引库,前台检索时从索引库检索,信息类别包括:供应产品信息、公司库、图片库、二手信息库、快报资讯、招商信息库。
 
联系我们 | 关于达梦 | 人才招聘 | 意见反馈 | 论坛
版权所有 2008-2011 (C) 广州达梦网络科技有限公司
Copyright © www.dmzg.com All Rights Reserved 粤ICP备05063743号