

一款统一的 Instagram 数据采集工具,旨在通过多种输入方式从 Instagram 提取公开数据。借助 CoreClaw,您无需编写任何代码即可从 Instagram URL 或关键词搜索中获取帖子、档案详情、评论、Reels 和提及,赋能社交媒体研究、网红分析、内容监控和竞品情报。
一款统一的 Instagram 数据采集工具,旨在通过多种输入方式从 Instagram 提取公开数据。借助 CoreClaw,您无需编写任何代码即可从 Instagram URL 或关键词搜索中获取帖子、档案详情、评论、Reels 和提及,赋能社交媒体研究、网红分析、内容监控和竞品情报。
| 👤 档案数据 | 📝 帖子/Reel 数据 |
|---|---|
| 💬 评论 | 🏷️ 话题标签与地点数据 |
| 🔍 搜索结果 | ⚙️ 执行元数据 |
完整的字段参考请见下方的 输出 章节。
CoreClaw Instagram 爬虫在后台为您处理请求调度、数据提取和结果交付。只需几分钟,按照以下步骤即可抓取 Instagram 数据:
| 参数 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| resultsType | string | posts | 必填。 每个输入返回什么:posts(帖子流)、details(档案/话题标签/地点元数据)、comments(帖子评论,每个帖子最多 50 条)、reels(档案的 Reels)、mentions(标记了该档案的帖子)。Stories 需要登录,不支持。 |
| resultsLimit | integer | 20 | 每个输入源返回的最大项目数(每个 URL 和每个解析的搜索目标)。评论额外受 Instagram 限制,每个帖子最多 50 条。 |
| directUrls | array | [{"url": "https://www.instagram.com/nasa/"}] | 直接抓取的 Instagram URL:主页(/<username>/)、帖子(/p/<code>/)、Reel(/reel/<code>/)、话题标签(/explore/tags/<tag>/)或地点(/explore/locations/<id>/)。URL 类型必须与所选结果类型匹配。也接受裸用户名或 @用户名。 |
| search | string | — | 在 Instagram 上搜索话题标签、档案或地点的关键词(取决于搜索类型)。每个解析的目标然后按结果类型抓取。使用直接 URL 时留空。 |
| searchType | string | hashtag | 搜索关键词解析到什么:hashtag(话题标签)、profile(档案)或 place(地点)。user 与 profile 相同。 |
| searchLimit | integer | 5 | 从搜索关键词解析并抓取的最大搜索结果数(话题标签/档案/地点)。上限 250。 |
| onlyPostsNewerThan | string | — | 仅保留该日期当天或之后发布的帖子。接受绝对日期(YYYY-MM-DD)或相对窗口如 3 days、2 weeks、1 month。仅适用于帖子流,不适用于详情记录。 |
| onlyPostsOlderThan | string | — | 仅保留该日期之前发布的帖子。接受绝对日期(YYYY-MM-DD)或相对窗口如 3 days、1 month。仅适用于帖子流,不适用于详情记录。 |
| addParentData | boolean | false | 开启后,每条结果携带 dataSource 字段,标注其来源(主页/话题标签/地点/搜索)。 |
| maxConcurrency | integer | 6 | 同时获取多少个帖子详情。每个帖子是单独请求,因此过高的并发可能使代理过载并返回空响应。默认 6 平衡速度和可靠性;如看到空响应/403 错误则降低。 |
| perItemTimeoutSecs | integer | 45 | 单个帖子详情获取的超时时间(秒),防止一个卡住的条目阻塞整个运行(记录为 504)。设为 0 表示无限制。 |
| includeComments | boolean | true | 获取每条帖子的最新评论(含作者、点赞数和回复数)到 latestComments。关闭以跳过每条帖子的评论获取(更快,请求更少)。 |
| maxComments | integer | 24 | 每条帖子收集到 latestComments 的最大评论数(Instagram 预览页面最多返回约 24 条)。 |
示例 1:抓取主页帖子
https://www.instagram.com/nasa/示例 2:抓取帖子评论
https://www.instagram.com/p/C8m4hKqMx3a/示例 3:搜索话题标签
示例 4:抓取主页详情
https://www.instagram.com/nasa/示例 5:按日期筛选
https://www.instagram.com/nasa/为方便使用,输出结果以表格和标签页形式展示。您可以选择以您偏好的格式下载结果。
| 分组 | 关键字段 | 说明 |
|---|---|---|
| 📝帖子/Reel 核心 | type、shortCode、url、caption、timestamp、likesCount、commentsCount | 帖子/Reel 核心标识和内容 |
| 🖼️媒体 | displayUrl、images、videoUrl、dimensionsHeight、dimensionsWidth | 图片和视频 URL 及尺寸 |
| 👤作者 | ownerUsername、ownerFullName、ownerId、ownerProfilePicUrl | 帖子作者标识 |
| 🏷️内容标签 | hashtags、mentions、taggedUsers | 话题标签、@提及和标记用户 |
| 📊互动指标 | likesCount、videoViewCount、videoPlayCount、commentsCount | 点赞、浏览、播放和评论数 |
| 💬评论 | firstComment、latestComments | 预览评论,含作者和点赞数 |
| 🎵Reel/视频 | videoDuration、musicInfo、audioUrl、productType | 视频特定元数据 |
| 📍地点 | locationName、locationId | 标记的地点数据 |
| 👤档案详情 | username、fullName、biography、followersCount、followsCount、verified、private | 档案元数据(resultsType 为 details 时) |
| 🏷️话题标签/地点 | name、topPosts、latestPosts、postsCount、lat、lng | 话题标签或地点元数据 |
| 🔍搜索上下文 | queryTag、querySearch、sourceType | 搜索解析元数据 |
| ⚙️执行状态 | success、error、error_code、warning、degraded、missingFields | 执行状态和诊断信息 |
| 字段 | 类型 | 说明 |
|---|---|---|
type | string | 媒体类型:Image(图片)、Video(视频)或 Sidecar(轮播)。档案/话题标签/地点记录为空。 |
dataSource | string | 父级标签(主页/话题标签/地点/搜索)— 仅在 addParentData 开启时设置。 |
id | string | 记录的主 ID(帖子 pk / 档案 id / 评论 id / 话题标签 id / 地点 id)。 |
shortCode | string | 帖子/Reel 短码。 |
url | string | 记录的规范 URL。 |
inputUrl | string | 生成此记录的直接 URL(或 search:<term>)。 |
caption | string | 帖子描述文本。 |
hashtags | array | 从描述/评论中解析的话题标签(不含 #)。 |
mentions | array | 从描述中解析的 @-提及。 |
commentsCount | number | 帖子上的评论数。 |
firstComment | string | 第一条/预览评论的文本。 |
latestComments | array | 预览评论,含 ownerUsername、text、likesCount、ownerProfilePicUrl。 |
dimensionsHeight | number | 媒体高度(像素)。 |
dimensionsWidth | number | 媒体宽度(像素)。 |
displayUrl | image | 主显示图片 URL。 |
images | array | 图片 URL(轮播子图或单图)。 |
videoUrl | string | 视频文件 URL(视频/Reels)。 |
alt | string | 无障碍描述 / 替代文本。 |
likesCount | number | 点赞数。 |
videoViewCount | number | 视频浏览数。 |
videoPlayCount | number | 视频播放数。 |
timestamp | string | 发布时间,ISO 8601(如 2021-08-29T12:00:00.000Z)。 |
childPosts | array | 轮播子帖子(轻量帖子对象)。 |
ownerFullName | string | 帖子作者全名。 |
ownerUsername | string | 帖子/评论作者用户名。 |
ownerId | string | 帖子/评论作者 id。 |
ownerProfilePicUrl | image | 作者头像 URL。 |
productType | string | Instagram 产品类型(feed、clips/reel、igtv、carousel_container)。 |
isSponsored | boolean | 帖子是否为付费合作。 |
taggedUsers | array | 媒体中标记的用户,含 username、full_name、id、is_verified、profile_pic_url。 |
coauthorProducers | array | 帖子上共同署名的合作账户。 |
musicInfo | object | Reels/短视频的音频/原声信息。 |
audioUrl | string | Reels/短视频的音轨 URL(暴露时)。 |
videoDuration | number | 视频时长(秒)。 |
isPinned | boolean | 帖子是否在主页上置顶。 |
isCommentsDisabled | boolean | 帖子是否禁用评论。 |
locationName | string | 标记的地点名称。 |
locationId | string | 标记的地点 id。 |
username | string | 档案用户名(详情)。 |
fullName | string | 档案全名。 |
biography | string | 档案简介文本。 |
externalUrl | string | 主要外部/简介链接。 |
externalUrls | array | 所有外部/简介链接。 |
followersCount | number | 粉丝数。 |
followsCount | number | 关注数。 |
hasChannel | boolean | 档案是否有广播频道。 |
highlightReelCount | number | 快拍精选集数量。 |
isBusinessAccount | boolean | 是否为企业账户。 |
joinedRecently | boolean | 账户是否近期注册。 |
businessCategoryName | string | 企业分类名称。 |
private | boolean | 档案是否为私密。 |
verified | boolean | 档案是否已认证。 |
profilePicUrl | image | 头像 URL。 |
profilePicUrlHD | image | 高清头像 URL。 |
igtvVideoCount | number | IGTV 视频数(暴露时)。 |
relatedProfiles | array | 相关/推荐档案。 |
latestIgtvVideos | array | 最新 IGTV 视频(暴露时)。 |
postsCount | number | 帖子数(档案)/ 媒体数(话题标签/地点)。 |
latestPosts | array | 档案/话题标签/地点的最新帖子(轻量帖子对象)。 |
fbid | string | 链接到档案的 Facebook id(暴露时)。 |
postId | string | 父帖子的 id(用于评论)。 |
text | string | 评论文本。 |
position | number | 评论在帖子中的位置/顺序。 |
repliesCount | number | 评论的回复数。 |
replies | array | 评论回复(可用时)。 |
ownerIsVerified | boolean | 评论作者是否已认证。 |
name | string | 话题标签名称 / 地点名称。 |
topPosts | array | 话题标签/地点的热门帖子(轻量帖子对象)。 |
lat | number | 地点纬度。 |
lng | number | 地点经度。 |
slug | string | 地点 slug。 |
websiteUri | string | 地点网站。 |
phone | string | 地点电话号码。 |
addressStreetAddress | string | 地点街道地址。 |
addressZipCode | string | 地点邮编。 |
addressCityName | string | 地点城市名称。 |
addressRegionName | string | 地点州/省名称。 |
addressCountryCode | string | 地点国家代码。 |
queryTag | string | 此记录从哪个话题标签解析而来。 |
querySearch | string | 此记录从哪个搜索关键词解析而来。 |
sourceType | string | 内部来源类型(profile/post/reel/comment/hashtag/place/mentions)。 |
degraded | boolean | 当轮换/登录限制端点未返回数据且记录作为占位符发出时为 true。 |
missingFields | array | 此记录未能填充的字段。 |
error | string | 记录失败时的错误消息。 |
error_code | string | 记录失败时的错误状态码。 |
warning | string | 非致命警告(如可选端点被限制)。 |
warning_code | string | 警告状态码。 |
success | boolean | 记录无致命错误产生时为 true。 |
帖子记录:
本工具可从 Instagram 提取多种公开数据类型,包括:帖子、档案详情、评论、Reels 和提及。数据涵盖帖子元数据(描述、话题标签、媒体 URL、互动数)、档案信息(简介、粉丝数、认证状态)、评论(作者、文本、点赞数、回复)以及话题标签/地点元数据(热门帖子、坐标、联系方式)。
CoreClaw 支持 8 种导出格式,适配不同工作流:
| 格式 | 适用场景 | 说明 |
|---|---|---|
| JSON | 编程 / API 集成 | 完整保留层级结构 |
| CSV | 电子表格分析 | 直接导入 Excel、Google Sheets 进行排序、筛选和统计 |
| JSONL | 流式 / 逐行处理 | 每行一个独立 JSON 对象,适合大数据集和流式管道 |
| XLS | 旧版 Excel 兼容 | Excel 97-2003 经典格式,适配旧系统 |
| XLSX | 现代 Excel | 原生 Excel 格式,支持完整格式化、公式和多工作表 |
| HTML Table | 网页展示 / 报告 | 渲染为 HTML 表格,便于嵌入网页或邮件报告 |
| XML | 企业系统 / 遗留集成 | 标准标记格式,适配 SOAP API 和企业数据交换 |
| RSS | 订阅阅读器 / 监控 | 结构化订阅格式,用于跟踪更新和 RSS 工作流集成 |
推荐:JSON 适用于数据管道,CSV/XLSX 适用于手动分析,JSONL 适用于流式处理大数据集。
是的,本工具获取的数据是 100% 实时且最新 的。每次抓取请求直接从 Instagram 服务器拉取最新的公开数据。但请注意,话题标签和地点结果本质上是非确定性的 — "热门"和"最新"板块在不同调用和代理区域之间会发生变化。
不需要。 本爬虫完全通过 Instagram 的公开网页端点工作,不需要登录凭据。仅访问公开数据。注意 stories 需要登录会话,不支持。
您可以通过两种方式提供数据:
/<username>/)、帖子(/p/<code>/)、Reel(/reel/<code>/)、话题标签(/explore/tags/<tag>/)或地点(/explore/locations/<id>/)hashtag 话题标签、profile 档案或 place 地点)— 系统将关键词解析为匹配目标并逐个抓取| 结果类型 | 所需输入 | 获取内容 |
|---|---|---|
posts(帖子) | 主页、话题标签、地点或搜索 | 来源的帖子/Reels 流 |
details(详情) | 主页、话题标签或地点 | 来源的元数据(简介、统计等) |
comments(评论) | 帖子或 Reel URL | 该帖子的评论(最多 50 条) |
reels(Reels) | 主页 URL | 该主页的 Reels |
mentions(提及) | 主页 URL | 标记了该主页的帖子 |
探索商店中更多热门采集工具
by CoreClaw
通过链接提取 Instagram 公开帖子数据,包含用户信息、互动数据与主页详情。一键导出 CSV/JSON,支持批量采集,无需代码操作。
by CoreClaw
通过输入 URL,提取公开的 Instagram 个人资料数据。包括用户名、ID、简介、工作地点、网站 URL、粉丝数以及评论数等,并支持数据导出、API 调用或与第三方工具集成。
by CoreClaw
通过输入 Instagram 用户名,提取公开的 Instagram 个人资料数据。包括用户名、ID、简介、工作地点、网站 URL、粉丝数以及评论数等,并支持数据导出、API 调用或与第三方工具集成。
by mmi0cuhn
Instagram Reel 详情抓取工具支持批量采集 Reel 短视频数据:包括点赞数、评论数、作者信息、粉丝数、视频文案及话题标签。支持代理配置,输出结构化 JSON 数据,可直接用于各类研究与分析工作。