LittleCrawler – 多平台社交媒体爬虫-大海资源库

AI文摘此内容由AI根据文章内容自动生成

AI Summary

标签：

LittleCrawler 多平台内容采集多平台社交媒体爬虫社交媒体数据采集社交媒体监测工具社交平台信息爬取社媒内容抓取工具网络数据抓取自动化爬虫工具跨平台数据爬虫

LittleCrawler（小爬虫），支持小红书（xhs）｜知乎（zh）| 闲鱼（xy）平台的公开信息抓取。

项目介绍

一个基于 Python 的通用型社交媒体数据采集框架，主要面向小红书、知乎、闲鱼等平台的公开内容抓取。

它支持关键词搜索、详情页采集和用户主页采集等多种模式，能够批量获取笔记、文章、商品及作者相关信息，并将结果输出为 CSV、JSON、Excel 或存入数据库。

项目截图

项目架构

├── main.py                  # 程序入口
├── config/                  # 配置文件
├── src/                     # 核心源码
│   ├── core/                # 核心模块（基类、命令行、上下文变量）
│   ├── platforms/           # 平台爬虫实现
│   │   ├── xhs/             # 小红书爬虫
│   │   ├── xhy/             # 小黄鱼爬虫
│   │   └── zhihu/           # 知乎爬虫
│   ├── storage/             # 数据存储层
│   │   ├── base/            # 通用存储（DB、Excel、MongoDB）
│   │   ├── xhs/             # 小红书存储实现
│   │   ├── xhy/             # 小黄鱼存储实现
│   │   └── zhihu/           # 知乎存储实现
│   ├── models/              # Pydantic 数据模型
│   ├── services/            # 服务层
│   │   ├── cache/           # 缓存（本地/Redis）
│   │   └── proxy/           # 代理IP管理
│   └── utils/               # 工具函数
├── api/                     # Web API 后台
├── web/                     # 前端界面
├── tests/                   # 测试用例
├── docs/                    # 文档
├── data/                    # 数据输出
└── libs/                    # 第三方依赖（JS）

支持平台

平台	代号	功能
小红书	`xhs`	笔记、详情、作者
小黄鱼	`xhy`	商品、笔记、作者
知乎	`zhihu`	文章、详情、作者

下载地址

此处内容已隐藏，请评论后刷新页面查看.

NOTICE

DISCLAIMER

本站资源大多来自网络，如有侵犯权益请联系管理员，我们会第一时间审核删除。站内资源仅供学习测试，未经许可禁止商用，请在24小时内删除。

VIP PRIVILEGE

遇到付费内容？升级终身VIP即可全站免费畅享所有资源，可以联系我的微信进行开通。
大海聊天 QQ 3群：478065589

THE END

开源项目部署
# 社交媒体数据采集 # 跨平台数据爬虫 # 多平台社交媒体爬虫 # LittleCrawler # 自动化爬虫工具 # 社媒内容抓取工具 # 网络数据抓取 # 多平台内容采集 # 社交平台信息爬取 # 社交媒体监测工具

LittleCrawler – 多平台社交媒体爬虫

项目介绍

项目截图

项目架构

支持平台

下载地址

请登录后发表评论