• 如果您想对本站表示支持,请随手点击一下广告即可~
  • 本站致力于提供原创、优秀的技术文章~
  • 有任何疑问或建议 均可以在站点右侧栏处 通过各种方式联系站长哦~
  • 【暗恋不可耻但无用】QQ空间爬虫-Java版(jzone-crawler)

    爬虫 EXP 274阅读 0评论

    声明

    • 在你心中是否有一个默默关注的小姐姐?
    • 你是否想知道在遇见她之前在她身边的一切?
    • 确认过眼神,让你总在对的时间遇上对的人

    • 写这个程序纯粹是出于学习目的,此博文主要作用是功能展示
    • 之后会围绕这个程序,写一个系列的爬虫教程
    • 请勿使用此程序做不可描述的事情
    • 未经允许禁止出于商用目的使用此程序,违者列入授权黑名单并公开示众,所带来的一切后果自负

    源码

    Source : Github By EXP


    运行环境


    软件介绍

     此程序用于QQ空间,主要功能包括:

    • 模拟QQ登陆
    • 爬取目标QQ空间的【相册数据】,根据相册专辑分类,自动下载高清原图、以及图片描述等
    • 爬取目标QQ空间的【说说数据】,根据说说页数分类,自动下载高清原图、以及说说内容等
    • 自动整理所下载的【相册/说说数据】
    • 支持两种爬取数据的模式:
        【xhr】 默认模式,用于发布版,爬取速度快,但QQ空间协议经常变动,需定期更新协议避免失效
        【selenium-phantomjs】 仿真模式,仅限开发版,爬取速度慢,但能确保在QQ空间协议变动不大时依然有效

    运行界面展示

    ※ 登陆界面
    登陆界面


    ※ 爬取QQ空间相册
    爬取QQ空间相册


    ※ 爬取QQ空间说说
    爬取QQ空间说说


    ※ 分类整理所下载的图文数据
    分类整理所下载的图文数据


    下载


    安装与使用

    • 01. 安装JDK环境【jdk-7u72-windows-x64.exe】,一直 下一步 到完成即可(无需修改安装路径)
    • 02. 解压并运行【QQ空间爬虫.exe】
    • 03. 选择【爬取相册数据】或【爬取说说数据】即可自动批量下载 图片及其相关信息
    • 04. 所下载的数据会自动整理到程序根目录下的 data 文件夹:
        ○ 不同的QQ空间数据,存储在对应的 [QQ号文件夹] 内
        ○ [album] 文件夹下保存了目标QQ的每一个相册(非加密相册)的 [相册信息]、[照片]、[照片信息]
        ○ [mood] 文件夹下保存了目标QQ的所有说说的 [图文信息]
        ○ [mood/content] 文件夹根据页数保存了该页内所有说说的 [图文信息]
        ○ [mood/photos] 文件夹汇总了所有说说的图片

    注:
     此程序需要授权才能使用(防止恶意使用),请加QQ群209442488申请
     此程序不包含盗号后门,若不放心请勿使用
     此程序不包含破解功能,请确保登陆的QQ号有访问对方QQ空间和相册的权限


    升级记录

    v2.2版本 (2018-09-15) :

    • 01. 更新软件授权通道为SSL协议
    • 02. 修正因QQ空间升级导致xhr协议失效问题

    v2.1版本 (2018-08-06) :

    • 01. 修正软件授权校验接口

    v2.0版本 (2018-05-27) :

    • 01. 增加自动升级功能

    v1.1版本 (2018-05-26) :

    • 01. 相册爬取
    • 02. 优化相册和说说的爬取模式为XHR
    • 03. 同时支持前后端爬虫
    • 04. 增加软件授权校验

    v1.0版本 (2016-06-09) :

    • 01. 支持说说图文爬取

    版权声明

    Copyright (C) 2016-2018 By EXP License: GPL v3


    转载请注明:EXP 技术分享博客 » 【暗恋不可耻但无用】QQ空间爬虫-Java版(jzone-crawler)

    喜欢 (3) 分享 (0)
    发表我的评论
    取消评论

    表情

    Hi,您需要填写昵称和邮箱!

    • 昵称 (必填)
    • 邮箱 (必填)
    • 网址