网页截图工具是一种自动化网页截图工具,专用于为 CoreClaw 平台用户提供高质量的网页截图服务。使用 CoreClaw,即可零代码获取网页截图,助力网站监控、设计素材收集、SEO 审计、内容归档和品牌监控。
| 📸 网页截图图片 | 📄 Base64 编码数据 |
| 🖼️ 缩略图优化 | 🔤 OCR 提取文字 |
| 🏷️ 页面标题信息 | 🔗 最终 URL |
| 📏 图片尺寸信息 | 📊 文件大小(KB) |
| 🎨 输出格式信息 | ⚠️ 错误信息 |
CoreClaw 网页截图工具在后台为您处理浏览器启动、页面加载、截图生成和数据编码。只需几分钟,您就可以通过以下步骤获取数据:
| 参数 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| urls | array | - | 必填。 要截图的 URL 列表。每项可以是字符串或 { "url": "..." } 对象 |
| format | string | "jpeg" | 输出格式:jpeg、png、webp |
| quality | integer | 80 | JPEG/WebP 质量(1-100)。数值越大质量越好,文件越大 |
| outputMode | string | "thumbnail" | 输出模式:thumbnail、base64、metadata、ocr、chunks |
| thumbnailWidth | integer | 400 | 缩略图宽度(像素) |
| maxBase64Size | integer | 500 | 最大嵌入大小(KB)。0 = 无限制 |
| fullPage | boolean | true | 截取整个可滚动页面 |
| viewportWidth | integer | 1280 | 浏览器视口宽度(像素) |
| timeout | integer | 60 | 页面加载超时时间(秒) |
| blockAds | boolean | true | 拦截广告和追踪脚本 |
| scrollToBottom | boolean | false | 截图前滚动到底部(适用于懒加载内容) |
| waitForSelector | string | "" | 截图前等待的 CSS 选择器 |
| selectorsToHide | array | [] | 要隐藏的 CSS 选择器(如 Cookie 弹窗) |
| delay | integer | 0 | 页面加载后的额外延迟(毫秒) |
示例 1:基础截图(推荐)
示例 2:整页截图
示例 3:批量处理
示例 4:OCR 文字提取
示例 5:隐藏不需要的元素
每个截图请求将输出以下数据:
基础信息
图片信息
图片数据
<img> 标签)其他信息
JSON示例:
JPEG - 推荐格式
PNG
WebP
| 模式 | 说明 | 适用场景 |
|---|---|---|
| thumbnail | 推荐。压缩缩略图 | 大多数情况、批量处理 |
| base64 | 完整 Base64 嵌入 | 需要完整质量时 |
| metadata | 仅元数据,无图片 | 快速检查 URL 状态 |
| ocr | 提取文字内容 | 内容分析、SEO 审计 |
| chunks | 分割大图片 | 超长整页截图 |
建议:常规使用 thumbnail 模式,需要文字分析使用 ocr 模式,快速验证使用 metadata 模式。
整页截图(fullPage: true)
可视区域截图(fullPage: false)
如果截图显示空白,尝试以下方法:
1. 使用元素等待
等待主要内容元素出现后再截图。
2. 设置延迟时间
在页面加载后额外等待 2 秒。
3. 检查网站结构
探索商店中更多热门采集工具
by CoreClaw
通过关键词请求, 返回结构化的搜索结果摘要,包括最终搜索参数、自然结果、相关搜索以及 People Also Ask 数据。
by Odin Kael
数据集去重采集器是一款功能强大的工具,用于合并多个 JSON/JSONL 文件中的数据集并进行数据去重。该工具针对 CafeScraper 平台完成全面优化,附加增强功能,并具备完善的异常处理机制。
by Odin Kael
一款功能强大的 Google Sheets 数据导入导出工具,专用于实现 Google Sheets 与外部系统的数据同步、备份和集成。支持三种操作模式、两种认证方式、批量处理、数据去重、自动备份等功能。
by Odin Kael
一款基于 Cheerio 的高速静态页面爬虫工具,专为静态 HTML 页面设计。使用 Cheerio 进行 HTML 解析,速度比完整浏览器渲染快 10-50 倍。