应用介绍
杰灵采集器是一款为网页专业制作的采集列表、收集内容、发布内容的数据采集工具。为用户提供免费的多任务多线程快速抓取,让用户的网页内容数据进行批量采集,帮助用户更快的收集网页信息,需要的用户赶快来下载这款数据采集器吧!
杰灵采集器软件功能
全部功能免费开放,免费提供开源发布接口
支持单页抓取
支持指定URL网址 抓取内容
多线程抓取
多任务多线程快速抓取
批量采集
列表采集、内容采集、内容发布分步或合并批量采集
SQLite数据库
广泛使用的SQLite数据库存贮,轻型高效
图片附件下载保存
采集同时保存远程图片本地化
附件上传
支持图片附件自动上传至网站
通用网站接口
discuz,wordpress,dedecms,帝国cms等开源程序
自动缩略图
内容页提取首页图片为缩略图
图片水印
自定义logo或文字水印
正则表达式
支持正则提取或过滤内容
多级页面采集
支持无限级多级页面抓取
杰灵采集器软件更新
1、新增支持php插件,支持回调尊享其他字段(详见-->点击)
2、新增支持javascript插件,支持回调尊享其他字段(详见-->点击 )
3、新增数据库报表支持多选
4、新增过滤筛选支持文本导入,全局关键词过滤
5、新增列表区域提取 支持正则提取 如[\s\S]+提取全文
6、新增字段设置 内置大量常用规则,点击图标,快速选用即可
7、新增采集的时候可指定ssl版本号(设置1.1或1.2或留空)
8、新增EXCEL导入支持指定EXCEL起始行
9、新增数据查看器,sql语句历史纪录功能
10、新增网址包含 可用|(或)筛选网址
11、新增单篇发布,如404,500错误 ,将显示错误文本
12、修复WIN2012以上版本远程桌面特殊情况导致无法保存任务的BUG
13、修复内容页分页内存溢出bug
14、修复列表采集超长时间延时无法快速停止的bug
15、修复//开头的无协议链接,自动转化为对应协议http(s)://
小编点评:杰灵采集器非常方便实用,支持图片附件自动上传至网站,还能自定义logo或者文字水印,支持无限级多级页面抓取,是免费的网页数据采集器。