电话: 020-28097514
E-mail: master@dmzg.com
 
 
 
达梦垂直搜索引擎主要特点
  主要特点
  支持各类信息的精确抓取,可以从任何网站抓取文字和图片,后台灵活定制,支持二次开发,可支持实时采集。
  内含一个功能强大的数据采集软件.使用它,您可以很容易的从网页上抓取文字,图片,文件等资源.程序支持远程下载图片文件,并生成缩略图,支持网站登陆后信息采集,支持探测文件真实地址,支持代理设置,支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等。同时,软件具有极高的稳定性,可以多线程,多任务的工作,您可以用它进行大批量数据的更新。程序还支持多页和分页的采集,支持数据跨页采集,再难的数据格式也可以找到解决方案。

  ⑴ 支持所有编码格式的数据采集,自动识别编码,您可以用它采集全世界的文章.程序还可以进行编辑间的完美转换。
  ⑵ 多接口:支持所有主流或非主流的CMS,BBS,下载站,ftp等,您可以通过系统的接口实现采集器和网站的完美结合.
  ⑶ 无人值守工作:您配置好程序以后,程序就可以按照您的设置自动运行,完全不需要人工干预。
  ⑷ 本地编辑采集数据:您可以在本地可视化编辑已采集的数据.
  ⑸ 采集内容测试功能:这是其它任何采集软件所不能比的,可直接查看结果并测试发布。
  ⑹ 管理方便:使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松。灵活的管理后台设定。

  应用范围
  ⑴ 行业搜索引擎
  如www.cangjingou.com,是一个佛教行业的搜索引擎,有网页、新闻、图片、视频、音乐等信息,都是通过定向抓取相关的网站。
  ⑵ 网站采编人员:打破传统的采编人员必须手工转载文章的现状,使他们更有时间去做数据的编辑加工,工作更有成效.程序可以完美结合TRS等采编系统,大型网站的信息采集将更加容易有效。常用于新闻采集、论坛采集、技术文章采集。
  ⑶ 内部网络:打破内网信息单一,获取困难的神话,内部网络也可以体验丰富多彩的互联网信息.可以解决形如军队等与因特网隔离的重要部门对于因特网的信息需求问题。
  ⑷ 政府机关:实时跟踪、采集与政府工作相关的国内外及地方新闻,政策法规,经济,产业等信息,解决政府主网站对各地级子网站的信息采集与整合问题.
  ⑸ 企业应用:实时而准确地采集国内外新闻,行业新闻,技术文章.可以很容易的进行数据整合,情报处理更快捷高效,大大减少业务成本。将不同系统不同结构的数据统一成相同的格式。
  ⑹ SEO人员或站长:数据的获得更加容易,可迅速增加网站信息量,可以将更多精力放在优化和推广上。
  操作举例
  如您需要做一个求职搜索的网站,只需要简单几步就可以搭建起来。
  ⑴ 定义好有哪些字段,如单位名称、城市、地区、性别要求、工作经验要求、工作能力要求、学历要求等;
  ⑵ 拟定你要从哪些网站进行抓取(我们会为您收集该行业的主要网站);
  ⑶ 定义每个站点从什么地方抓取什么样的字段(这个我们会为专人为您预先定义好);
  ⑷ 设置抓取深度,从拟定的网站从头开始抓取,另外我们也提供一些网址提取工具,以便快速定位所需要的信息;⑸ 执行抓取,形成索引库。
 
联系我们 | 关于达梦 | 人才招聘 | 意见反馈 | 论坛
版权所有 2008-2011 (C) 广州达梦网络科技有限公司
Copyright © www.dmzg.com All Rights Reserved 粤ICP备05063743号