Reddit 抓取工具（帖子、评论与多媒体数据）

01KRDCMRF72GF3379NFN2FGVXC

通过 URL 或关键词批量采集 Reddit 公开帖子、评论、点赞、视频图片等结构化数据，支持排序筛选，适用于舆情监控、市场研究与数据分析。

by Wahlberg

4.8

16次运行

最后更新:2026-05-12

免费试用

免费 2,000 条结果

什么是 Reddit 抓取器？

Reddit Scraper 是一个强大的数据采集工具，可以从公开的 Reddit 页面采集帖子和评论。无需登录，只需输入 Reddit 链接或关键词，即可获取完整的帖子和评论数据，包括所有关键元数据。

📊 可采集的数据字段

Reddit 帖子数据

字段	说明	示例
id	帖子 ID（Reddit 格式）	t3_vwi6jx
parsedId	解析后的帖子 ID	vwi6jx
url	帖子链接	https://www.reddit.com/r/pasta/comments/vwi6jx/...
title	帖子标题	Pasta Peperoni and Ricotta cheese...
body	帖子正文	null（如果是视频帖子）
username	发布者用户名	Cooking_Vito_e_Daisy
userId	发布者 ID	t2_nuyl7btq
communityName	子版块名称	r/pasta
createdAt	发布时间	2022-07-11T13:15:17Z
scrapedAt	采集时间	2026-05-12T05:53:14.941732Z
upVotes	投票数	302
upVoteRatio	投票比例	0.99
numberOfComments	评论数	21
flair	帖子标签	Homemade Dish
isVideo	是否为视频	true
videoUrl	视频 URL	https://v.redd.it/htn04py9vxa91/DASH_1080.mp4
thumbnailUrl	缩略图 URL	https://b.thumbs.redditmedia.com/nJH9DcMFOlQN4PF.jpg
imageUrls	图片 URL 数组	[]
over18	是否为 NSFW	false
isAd	是否为广告	false
authorFlair	作者标签	null
category	分类	pasta
html	HTML 内容	null

Reddit 评论数据

字段	说明	示例
id	评论 ID（Reddit 格式）	t1_ifpvu1o
parsedId	解析后的评论 ID	ifpvu1o
url	评论链接	https://www.reddit.com/r/pasta/comments/vwi6jx/.../ifpvu1o/
postId	所属帖子 ID	t3_vwi6jx
parentId	父级 ID（帖子或评论）	t3_vwi6jx
body	评论内容	For homemade dishes such as lasagna...
username	评论者用户名	AutoModerator
userId	评论者 ID	t2_12345678
communityName	子版块名称	r/pasta
createdAt	评论时间	2022-07-11T13:16:00Z
scrapedAt	采集时间	2026-05-12T05:53:20.123456Z
upVotes	评论得分	1
numberOfreplies	回复数	0
dataType	数据类型	comment
html	HTML 内容	For homemade dishes...
over18	是否为 NSFW	false
isAd	是否为广告	false

🚀 如何使用Reddit 抓取器

方式 1：按 URL 采集

输入一个或多个 Reddit 链接，采集该链接的所有帖子和评论。

支持的 URL 类型：

单个帖子：https://www.reddit.com/r/pasta/comments/vwi6jx/pasta_peperoni_and_ricotta_cheese_how_to_make/
子版块列表：https://www.reddit.com/r/webscraping/
子版块动态：https://www.reddit.com/r/webscraping/new/

优点：

采集特定帖子的完整讨论
采集子版块的最新/热门帖子
精准采集

方式 2：按关键词搜索

输入关键词和可选的子版块，搜索 Reddit 并采集结果。

参数：

keyword — 搜索关键词（必需）
community — 限制搜索的子版块，例如 r/webscraping（可选）
sort — 排序方式：Hot、New、Top、Rising、Relevance、Comments
time — 时间过滤：Hour、Day、Week、Month、Year、All
includeNSFW — 包含 NSFW 内容（默认：true）
skipComments — 仅返回帖子，跳过评论（默认：false）
maxItems — 最大返回行数
maxPosts — 最大帖子数
maxComments — 每个帖子的最大评论数

优点：

灵活的搜索和过滤
支持多种排序和时间过滤
可控的采集规模

📝 输入参数详解

基础参数

参数	类型	必需	说明	示例
url	string	否	Reddit 链接（优先级高于关键词）	https://www.reddit.com/r/pasta/...
keyword	string	否	搜索关键词	webscraping
community	string	否	限制搜索的子版块	r/webscraping

排序和过滤参数

参数	类型	默认值	说明	可选值
sort	string	new	排序方式	hot, new, top, rising, relevance, comments
time	string	all	时间过滤	hour, day, week, month, year, all
includeNSFW	boolean	true	包含 NSFW 内容	true, false

数量控制参数

参数	类型	默认值	说明
maxItems	number	-	最大返回行数（帖子+评论）
maxPostCount	number	-	最大帖子数
maxComments	number	-	每个帖子的最大评论数
skipComments	boolean	false	仅返回帖子，跳过评论

💻 使用示例

示例 1：按关键词搜索

json

{
  "requests": [
    {
      "url": "",
      "keyword": "webscraping",
      "community": "r/webscraping",
      "sort": "new",
      "time": "month",
      "maxItems": 5,
      "maxPostCount": 2,
      "maxComments": 3,
      "includeNSFW": true,
      "skipComments": false
    }
  ]
}

说明：

在 r/webscraping 子版块中搜索"webscraping"
按最新排序，过滤最近一个月的内容
最多返回 5 行数据（2 个帖子 + 3 条评论）

示例 2：按 URL 采集

json

{
  "requests": [
    {
      "url": "https://www.reddit.com/r/pasta/comments/vwi6jx/pasta_peperoni_and_ricotta_cheese_how_to_make/",
      "keyword": "",
      "community": "",
      "sort": "new",
      "time": "all",
      "maxItems": 10,
      "maxPostCount": 10,
      "maxComments": 10,
      "includeNSFW": true,
      "skipComments": false
    }
  ]
}

说明：

采集指定帖子的所有数据
最多返回 10 行（1 个帖子 + 最多 10 条评论）
按最新评论排序

示例 3：仅采集帖子，不采集评论

json

{
  "requests": [
    {
      "url": "",
      "keyword": "python",
      "community": "r/learnpython",
      "sort": "top",
      "time": "week",
      "maxItems": 20,
      "maxPostCount": 20,
      "maxComments": 0,
      "includeNSFW": false,
      "skipComments": true
    }
  ]
}

说明：

在 r/learnpython 中搜索"python"
仅采集帖子，不采集评论
按热评排序，过滤最近一周的内容
排除 NSFW 内容

📤 输出数据示例

Reddit 帖子示例

json

{
  "id": "t3_vwi6jx",
  "parsedId": "vwi6jx",
  "url": "https://www.reddit.com/r/pasta/comments/vwi6jx/pasta_peperoni_and_ricotta_cheese_how_to_make/",
  "postId": "t3_vwi6jx",
  "parentId": null,
  "username": "Cooking_Vito_e_Daisy",
  "userId": "t2_nuyl7btq",
  "authorFlair": null,
  "category": "pasta",
  "communityName": "r/pasta",
  "title": "Pasta Peperoni and Ricotta cheese...",
  "body": null,
  "html": null,
  "createdAt": "2022-07-11T13:15:17Z",
  "scrapedAt": "2026-05-12T05:53:14.941732Z",
  "upVotes": 302,
  "numberOfreplies": null,
  "dataType": "post",
  "link": "https://v.redd.it/htn04py9vxa91",
  "numberOfComments": 21,
  "flair": "Homemade Dish",
  "upVoteRatio": 0.99,
  "isVideo": true,
  "isAd": false,
  "over18": false,
  "videoUrl": "https://v.redd.it/htn04py9vxa91/DASH_1080.mp4",
  "thumbnailUrl": "https://b.thumbs.redditmedia.com/nJH9DcMFOlQN4PF.jpg",
  "imageUrls": []
}

Reddit 评论示例

json

{
  "id": "t1_ifpvu1o",
  "parsedId": "ifpvu1o",
  "url": "https://www.reddit.com/r/pasta/comments/vwi6jx/pasta_peperoni_and_ricotta_cheese_how_to_make/ifpvu1o/",
  "postId": "t3_vwi6jx",
  "parentId": "t3_vwi6jx",
  "username": "AutoModerator",
  "userId": "t2_12345678",
  "authorFlair": null,
  "category": "pasta",
  "communityName": "r/pasta",
  "title": "Pasta Peperoni and Ricotta cheese...",
  "body": "For homemade dishes such as lasagna...",
  "html": "<div class=\"md\"><p>For homemade dishes...</p></div>",
  "createdAt": "2022-07-11T13:16:00Z",
  "scrapedAt": "2026-05-12T05:53:20.123456Z",
  "upVotes": 1,
  "numberOfreplies": 0,
  "dataType": "comment",
  "link": "https://www.reddit.com/r/pasta/comments/vwi6jx/...",
  "numberOfComments": null,
  "flair": null,
  "upVoteRatio": null,
  "isVideo": null,
  "isAd": false,
  "over18": false,
  "videoUrl": null,
  "thumbnailUrl": null,
  "imageUrls": []
}

⚙️ 高级配置

本地测试 vs 用户运行

本地测试：使用 actor 的默认设置
用户运行：使用公开的输入表单

优化采集

按时间过滤 — 减少不必要的数据
限制评论数 — 控制采集规模
排除 NSFW — 过滤不需要的内容
按排序方式 — 获取最相关的数据

🔍 常见问题

采集速度有多快？

采集速度取决于数据量和网络连接。通常情况下，采集 100 个帖子及其评论需要 5-10 分钟。

可以采集多少数据？

没有硬性限制，但建议每次采集不超过 10,000 行数据，以保证性能和稳定性。

可以采集历史数据吗？

可以。使用时间过滤参数，可以采集任何时间范围的数据。

可以采集私密子版块吗？

不可以。只能采集公开的 Reddit 页面和子版块。

价格预估

结果上限

101,000 条结果

预估：

~$0.09

100 条结果 × $0.0009。仅为成功结果付费。

立即运行

立即购买

快捷提示

新用户可获得 2,000 个免费结果
失败请求免费
支持导出 JSON 或 CSV 结果

你可能也喜欢

探索商店中更多热门采集工具

查看全部采集工具

Product Hunt 抓取器

by Odin Kael

用于按关键词抓取 Product Hunt 上的热门产品，并输出结构化表格数据。

4.6

10 次运行

低至 $0.9/结果

Coursera and EDX Course Scraper

by Odin Kael

A powerful course scraper for extracting online courses from Coursera and EDX platforms.

4.7

8 次运行

低至 $0.9/结果

Jobspy - Linkedin, Glassdoor 抓取

by Odin Kael

稳定爬取 Indeed/LinkedIn 等招聘平台职位，支持远程 / 全职 / 薪资筛选、自定义代理、多维度精准搜索，一键部署即可获取海外职位数据。

4.6

13 次运行

低至 $0.9/结果

从 Yahoo Finance 获取全球股票行情数据，支持美股、港股、A股三大市场。可提取历史K线数据、公司信息、财务报表、分红拆股历史、分析师评级等全面数据。零代码操作，一键导出 CSV 或 JSON 格式。美股：苹果（AAPL）、微软（MSFT）、谷歌（GOOGL）、特斯拉（TSLA）等港股：腾讯控股（0700.HK）、阿里巴巴（9988.HK）等 A 股（中国大陆）：贵州茅台（600519.SS）、中国平安（000001.SZ）等

Reddit 抓取工具（帖子、评论与多媒体数据）

什么是 Reddit 抓取器？

📊 可采集的数据字段

Reddit 帖子数据

Reddit 评论数据

🚀 如何使用Reddit 抓取器

方式 1：按 URL 采集

方式 2：按关键词搜索

📝 输入参数详解

基础参数

排序和过滤参数

数量控制参数

💻 使用示例

示例 1：按关键词搜索

示例 2：按 URL 采集

示例 3：仅采集帖子，不采集评论

📤 输出数据示例

Reddit 帖子示例

Reddit 评论示例

⚙️ 高级配置

本地测试 vs 用户运行

优化采集

🔍 常见问题

采集速度有多快？

可以采集多少数据？

可以采集历史数据吗？

可以采集私密子版块吗？

价格预估

你可能也喜欢

Product Hunt 抓取器

Coursera and EDX Course Scraper

Jobspy - Linkedin, Glassdoor 抓取

Yahoo 财经数据抓取