A5下载 - 努力做内容最丰富最安全的下载站!

A5站长下载站

当前位置:A5下载 > 其它源码 > CGI源码 > Pholcus(幽灵蛛)爬虫软件 v1.2
Pholcus(幽灵蛛)爬虫软件

Pholcus(幽灵蛛)爬虫软件

v1.2
  • 软件大小:8.18 MB
  • 软件语言:简体中文
  • 更新时间:2016-09-28
  • 软件类型:国产软件 / CGI源码
  • 运行环境:Go
  • 软件授权:自由软件
  • 官方主页:http://www.oschina.net/p/pholcus
  • 软件等级 :
  • 软件厂商:fang
立即高速安全下载
  • 介绍说明
  • 下载地址
  • 精品推荐
  • 相关软件
  • 网友评论
Pholcus(幽灵蛛)爬虫软件简介

holcus(幽灵蛛)是一款纯Go语言编写的支持分布式的高并发、重量级爬虫软件,定位于互联网数据采集,为具备一定Go或JS编程基础的人提供一个只需关注规则定制的功能强大的爬虫工具。

它支持单机、服务端、客户端三种运行模式,拥有Web、GUI、命令行三种操作界面;规则简单灵活、批量任务并发、输出方式丰富(mysql/mongodb/csv/excel等)、有大量Demo共享;另外它还支持横纵向两种抓取模式,支持模拟登录和任务暂停、取消等一系列高级功能。

框架特点:

1、为具备一定Go或JS编程基础的用户提供只需关注规则定制、功能完备的重量级爬虫工具;

2、支持单机、服务端、客户端三种运行模式;

3、GUI(Windows)、Web、Cmd 三种操作界面,可通过参数控制打开方式;

4、支持状态控制,如暂停、恢复、停止等;

5、可控制采集量;

6、可控制并发协程数;

7、支持多采集任务并发执行;

8、支持代理IP列表,可控制更换频率;

9、支持采集过程随机停歇,模拟人工行为;

10、根据规则需求,提供自定义配置输入接口

11、有mysql、mongodb、csv、excel、原文件下载共五种输出方式;

12、支持分批输出,且每批数量可控;

13、支持静态Go和动态JS两种采集规则,支持横纵向两种抓取模式,且有大量Demo;

14、持久化成功记录,便于自动去重;

15、序列化失败请求,支持反序列化自动重载处理;

16、采用surfer高并发下载器,支持 GET/POST/HEAD 方法及 http/https 协议,同时支持固定UserAgent自动保存cookie与随机大量UserAgent禁用cookie两种模式,高度模拟浏览器行为,可实现模拟登录等功能;

17、服务器/客户端模式采用Teleport高并发SocketAPI框架,全双工长连接通信,内部数据传输格式为JSON。

Pholcus(幽灵蛛)爬虫软件页面展示
Pholcus(幽灵蛛)爬虫软件
相关阅读

同类推荐:站长常用源码

下载地址

  • PC版

本地下载

相关软件

查看所有评论+

网友评论

网友
您的评论需要经过审核才能显示

本类排名

本类推荐

装机必备

换一批

相关资讯

公众号