| |
达梦垂直搜索引擎 |
 |
|
 |
精确抓取,可以从任何网站抓取文字和图片,后台灵活定制,支持二次开发,提供各种语言接口。
如您需要做一个某方面的搜索网站,只需要简单几步就可以搭建起来,⑴ 定义好要抓取哪些字段;⑵ 定义抓取数据源;⑶ 定义如何抓取;⑷ 设置抓取深度;⑸ 执行抓取,从拟定的网站从头开始抓取,形成索引库,另外我们也提供网址提取工具,以便快速定位所需要的信息。支持各类复杂页面抓取。 |
|
 |
|
|
| |
达梦全文检索引擎V2010版 |
 |
|
 |
支持从各类数据库(如MySQL、Oracle、MS SQL、PGSQL、Access、DB2等) 的不同数据表的不同字段提取数据,可以任意定制多种数据源。
支持从ftp目录、网络共享盘、本地硬盘中读取数据,支持doc、pdf、txt、ppt、wps、html、eml等文件的分析。
将这些散落在各个角落的非结构化数据进行整合,为企业内部提供检索和个性化信息服务。 |
|
 |
|