• 如果您想对本站表示支持,请随手点击一下广告即可~
  • 本站致力于提供原创、优秀的技术文章~
  • 有任何疑问或建议 均可以在站点右侧栏处 通过各种方式联系站长哦~
  • 【暗恋不可耻但无用】QQ空间爬虫-Python版(pyzone-crawler)

    爬虫 EXP 334阅读 0评论

    声明

    • 在你心中是否有一个默默关注的小姐姐?
    • 你是否想知道在遇见她之前在她身边的一切?
    • 确认过眼神,让你总在对的时间遇上对的人

    • 这是Java平台的移植版,所以暂不提供界面
    • 写这个程序纯粹是出于学习目的,此博文主要作用是功能展示
    • 之后会围绕这个程序,写一个系列的爬虫教程
    • 请勿使用此程序做不可描述的事情
    • 未经允许禁止出于商用目的使用此程序,违者列入授权黑名单并公开示众,所带来的一切后果自负

    源码

    Source : Github By EXP


    运行环境


    软件介绍

     此程序用于QQ空间,主要功能包括:

    • 模拟QQ登陆
    • 爬取目标QQ空间的【相册数据】,根据相册专辑分类,自动下载高清原图、以及图片描述等
    • 爬取目标QQ空间的【说说数据】,根据说说页数分类,自动下载高清原图、以及说说内容等
    • 自动整理所下载的【相册/说说数据】

    运行界面展示

    ※ 登陆QQ空间
    登陆QQ空间


    ※ 爬取QQ空间相册
    爬取QQ空间相册


    ※ 爬取QQ空间说说
    爬取QQ空间说说


    ※ 分类整理所下载的图文数据
    分类整理所下载的图文数据


    安装与使用

    • 01. 安装Python环境【python-3.5.2-amd64.exe
    • 02. 导入pyzone-crawler项目源码并运行
    • 03. 根据命令行提示,选择【爬取相册数据】或【爬取说说数据】,即可自动批量下载 图片及其相关信息
    • 04. 所下载的数据会自动整理到程序根目录下的 data 文件夹:
        ○ 不同的QQ空间数据,存储在对应的 [QQ号文件夹] 内
        ○ [album] 文件夹下保存了目标QQ的每一个相册(非加密相册)的 [相册信息]、[照片]、[照片信息]
        ○ [mood] 文件夹下保存了目标QQ的所有说说的 [图文信息]
        ○ [mood/content] 文件夹根据页数保存了该页内所有说说的 [图文信息]
        ○ [mood/photos] 文件夹汇总了所有说说的图片

    注:
     此程序需要授权才能使用(防止恶意使用),请加QQ群209442488申请
     此程序不包含盗号后门,若不放心请勿使用
     此程序不包含破解功能,请确保登陆的QQ号有访问对方QQ空间和相册的权限


    升级记录

    v1.1版本 (2018-09-15) :

    • 01. 修正因QQ空间升级导致xhr协议失效问题

    v1.0版本 (2018-05-26) :

    • 01. 从Java平台移植

    版权声明

    Copyright (C) 2016-2018 By EXP License: GPL v3


    转载请注明:EXP 技术分享博客 » 【暗恋不可耻但无用】QQ空间爬虫-Python版(pyzone-crawler)

    喜欢 (1) 分享 (0)
    发表我的评论
    取消评论

    表情

    Hi,您需要填写昵称和邮箱!

    • 昵称 (必填)
    • 邮箱 (必填)
    • 网址