CoreClaw 商店
CoreClaw提供100+现成网页数据采集工具,支持 Google Maps、TikTok、Amazon、Facebook 等平台。 无需编程,按成功结果付费,失败不收费。
谷歌搜索结果(SERP)抓取API
通过关键词请求, 返回结构化的搜索结果摘要,包括最终搜索参数、自然结果、相关搜索以及 People Also Ask 数据。
数据集合并和去重工具
数据集去重采集器是一款功能强大的工具,用于合并多个 JSON/JSONL 文件中的数据集并进行数据去重。该工具针对 CafeScraper 平台完成全面优化,附加增强功能,并具备完善的异常处理机制。
Google Sheets 导入导出工具
一款功能强大的 Google Sheets 数据导入导出工具,专用于实现 Google Sheets 与外部系统的数据同步、备份和集成。支持三种操作模式、两种认证方式、批量处理、数据去重、自动备份等功能。
Cheerio网页抓取
一款基于 Cheerio 的高速静态页面爬虫工具,专为静态 HTML 页面设计。使用 Cheerio 进行 HTML 解析,速度比完整浏览器渲染快 10-50 倍。
Playwright 网页抓取
一款使用 Playwright 进行完整浏览器渲染的强大跨浏览器网页爬虫工具。支持 Chromium、Firefox 和 WebKit 三大浏览器引擎。完美适用于动态页面、单页应用(SPA)、无限滚动页面以及跨浏览器测试场景。
Puppeteer网页爬虫
一款使用 Puppeteer 进行完整浏览器渲染的强大网页爬虫工具。支持完整浏览器渲染、自动关闭 Cookie 弹窗、URL 过滤等功能。
页面内容检索器
一款强大的页面内容检索器,可监控网页上的特定内容变化,并通过对比前后内容来检测变化。当检测到变化时,它会提供详细的对比信息和前后截图。
网页截图工具
一款专为 CoreClaw 平台设计的网页截图工具,可捕获网页截图并以 Base64 编码形式嵌入 JSON 输出返回。
RAG 网络浏览器
一款专为检索增强生成(RAG)流程和 AI 应用设计的高性能网页抓取工具。结合 Google 搜索功能与智能内容提取,支持快速 HTTP 请求和完整浏览器渲染两种模式,支持并发处理、智能内容过滤、多格式输出。
网页爬虫工具
一款强大灵活的网页爬虫工具,可自动爬取网站、提取结构化数据并发现新链接。