谷歌搜索结果（SERP）抓取API

定价

Try for free

谷歌搜索结果（SERP）抓取API

coreclaw/google-search-scraper

通过关键词请求，返回结构化的搜索结果摘要，包括最终搜索参数、自然结果、相关搜索以及 People Also Ask 数据。

免费试用

Google 关键词搜索抓取工具

什么是 Google 关键词搜索抓取工具？

一款统一的 Google SERP 数据提取工具，通过关键词查询 Google 搜索结果并输出结构化的自然排名数据。借助 CoreClaw，您无需编写任何代码即可提取标题、URL、摘要、相关搜索和"人们还问"数据，适用于 SEO 研究、竞品分析、关键词监控和市场情报。

✅ 关键词驱动 — 输入任意语言的搜索词
✅ 多页翻页 — 每个关键词最多抓取 10+ 页，实时流式输出
✅ 结构化输出 — 每条自然结果一行，22+ 字段
✅ 丰富 SERP 特性 — 包含相关搜索、"人们还问"
✅ 8 种导出格式 — JSON、CSV、JSONL、XLS、XLSX、HTML Table、XML、RSS
✅ 全球覆盖 — 200+ Google 域名、100+ 国家和语言
✅ 自动重试 — 页面级失败重试，部分结果保全

可以提取哪些数据？

📝 自然搜索结果	🔍 SERP 特性	⚙️ 请求元数据
🌐 URL 与域名	💬 人们还问	📅 时间戳
🏷️ 高亮关键词	🔗 相关搜索	📍 地理位置

数据类别详情

自然搜索结果 — 排名位置、标题、来源名称、展示 URL、解析 URL、规范 URL、根域名、重定向 URL、摘要、高亮关键词、图片替代文本、网站图标
SERP 特性 — 相关搜索（区块位置、主题标题、搜索 URL）和"人们还问"（位置、问题、答案、来源 URL），每行重复
请求元数据 — 关键词、当前页码、Google 域名、国家、语言、地理位置、安全搜索、自动纠错过滤器、抓取时间戳、搜索 URL、总结果文本

如何使用 Google 关键词搜索抓取工具？

CoreClaw Google 关键词搜索抓取工具为您处理请求调度、翻页和结果交付。按照以下步骤操作：

使用邮箱创建免费的 CoreClaw 账户
打开 Google 关键词搜索抓取控制面板
输入您的关键词 — 任意语言的搜索词
设置最大页数 — 要抓取的 SERP 页数（默认 1）
可选配置域名、国家、语言和高级过滤器
点击 "开始"，让我们的云服务器处理抓取过程
以您偏好的格式下载结果（JSON、CSV、JSONL、XLS、XLSX、HTML Table、XML、RSS）

➡️ 输入

参数说明

参数	类型	默认值	说明
keyword	string	`pizza`	必填。搜索关键词。也可接受完整的 Google 搜索 URL，构建器将自动从中提取支持的参数。
max_pages	string	`1`	要抓取的最大 Google SERP 页数。每页到达后立即流式输出。翻页从偏移量 0 开始，每页递增 10（如 `max_pages=3` → `start=0, 10, 20`）。最小值 1；无硬上限，但 Google 超过 ~10 页后很少返回有用结果。
domain	string	`https://www.google.com/`	抓取时使用的 Google 域名。支持 200+ 国家/地区特定域名（google.co.uk、google.de、google.co.jp 等）。
gl	string	`us`	搜索结果的地区设置，使用两位国家代码（如 us、uk、de、jp）。
hl	string	`en`	Google 搜索结果的界面语言。使用标准语言代码（如 en、zh-cn、es、fr）。
cr	array	—	将结果限制为一个或多个国家/地区。值用 `\|` 连接，如 `countryFR\|countryDE`。
lr	array	—	将结果限制为一种或多种语言。值使用 `lang_XX` 格式，用 `\|` 连接，如 `lang_fr\|lang_de`。
location	string	—	用于模拟本地搜索上下文的地理位置文本。
tbs	string	—	高级 Google 搜索过滤器，如时间范围或搜索垂直领域过滤器。
safe	string	`off`	成人内容过滤模式。支持值：`active` 和 `off`。
nfpr	string	`0`	控制拼写自动纠错。设为 `1` 可禁用 Google 自动纠错。
filter	string	`0`	启用或禁用 Google 的重复结果过滤。

使用示例

示例 1：基本关键词搜索

关键词：OpenAI
最大页数：1
结果：返回 "OpenAI" 的第一页 Google 自然搜索结果

示例 2：多页抓取

关键词：best coffee shops NYC
最大页数：5
结果：流式输出 5 页结果（最多约 50 条自然结果）

示例 3：带地区设置的本地搜索

关键词：restaurants
域名：https://www.google.co.uk/
国家：gb
语言：en
地理位置：London, United Kingdom
结果：返回从伦敦视角看到的英国特定餐厅结果

示例 4：高级时间过滤

关键词：AI news
高级搜索参数：qdr:w（过去一周）
结果：仅返回过去一周的 AI 新闻

⬅️ 输出

结果以扁平表格形式组织 — 每条自然结果一行。搜索级字段（关键词、地理设置、相关搜索）在每行重复。position 字段是跨所有页面的连续全局排名（第 1 页 → 位置 1..N，第 2 页从 N+1 开始，依此类推）。

数据字段分组

分组	关键字段	说明
📝自然搜索结果	`position`、`title`、`source_name`、`display_url`、`url`、`clean_url`、`root_domain`、`snippet`、`highlighted_terms`、`image_alt`、`favicon_url`	单条搜索结果的内容和元数据
🌐URL 信息	`url`、`clean_url`、`root_domain`、`redirect_url`	解析 URL、规范 URL、根域名和 Google 重定向 URL
🔍SERP 特性	`related_queries`、`people_also_ask`	相关搜索和"人们还问"区块（每行重复）
🔎搜索上下文	`keyword`、`current_page`、`google_domain`、`country`、`language`、`geo_location`、`safe_search`、`search_url`	请求参数和搜索配置
📊统计数据	`results_count_collected`、`results_total_text`、`scraped_at`	已收集数量、总结果估计和时间戳

完整字段参考

字段	类型	说明
`keyword`	string	请求使用的搜索关键词。
`current_page`	number	当前 SERP 页码。
`start_position`	number	请求使用的结果偏移量。
`google_domain`	string	搜索请求使用的 Google 域名。
`country`	string	搜索请求的国家参数。
`language`	string	搜索请求的语言参数。
`geo_location`	string	从 `location` 或 `uule` 解析的地理位置值。
`safe_search`	string	安全搜索模式（`off` 或 `active`）。
`exclude_autocorrected_results`	boolean	是否排除自动纠错结果。
`results_filtering`	string	Google 结果过滤模式。
`scraped_at`	string	抓取时间戳，ISO 8601 格式。
`search_url`	string	请求的 Google 搜索 URL。
`results_count_collected`	number	当前页收集的自然结果数量。
`results_total_text`	string	Google 返回的原始总结果文本。
`related_queries`	array	相关搜索记录（见嵌套字段）。
`position`	number	跨所有流式页面的连续全局自然结果排名。
`title`	string	自然结果标题。
`source_name`	string	自然结果来源名称。
`display_url`	string	结果中显示的 Google 展示 URL。
`url`	string	解析后的自然结果 URL。
`clean_url`	string	不含查询字符串或锚点的规范 URL。
`root_domain`	string	从自然结果 URL 提取的根域名。
`redirect_url`	string	自然结果的 Google 重定向 URL。
`snippet`	string	自然结果摘要文本。
`highlighted_terms`	string	摘要中的高亮关键词，逗号分隔。
`image_alt`	string	自然结果的图片替代文本。
`has_image`	boolean	自然结果是否包含图片元数据。
`favicon_url`	string	自然结果的网站图标 URL。
`people_also_ask`	array	"人们还问"记录（见嵌套字段）。

嵌套字段：`related_queries`

字段	类型	说明
`block_position`	number	SERP 中相关搜索区块的位置。
`topic_title`	string	相关搜索标题文本。
`related_search_url`	string	相关搜索的 Google 搜索 URL。
`item_position`	number	相关搜索区块内的项目位置。

嵌套字段：`people_also_ask`

字段	类型	说明
`position`	number	在"人们还问"列表中的位置。
`question`	string	问题文本。
`answer`	string	可用时的答案或摘要文本。
`source_url`	string	可用时答案的来源 URL。

示例数据

json

{
    "keyword": "OpenAI",
    "current_page": 1,
    "start_position": 0,
    "google_domain": "https://www.google.com/",
    "country": "us",
    "language": "en",
    "geo_location": "w+CAIQICINVW5pdGVkIFN0YXRlcw",
    "safe_search": "off",
    "exclude_autocorrected_results": false,
    "results_filtering": "0",
    "scraped_at": "2026-05-06T18:00:00+08:00",
    "search_url": "https://www.google.com/search?q=OpenAI&gl=us&hl=en",
    "results_count_collected": 10,
    "results_total_text": "1630000000",
    "related_queries": [
        {
            "block_position": 1,
            "topic_title": "OpenAI API",
            "related_search_url": "https://www.google.com/search?q=OpenAI+API",
            "item_position": 1
        }
    ],
    "position": 1,
    "title": "OpenAI",
    "source_name": "OpenAI",
    "display_url": "https://openai.com",
    "url": "https://openai.com",
    "clean_url": "https://openai.com",
    "root_domain": "openai.com",
    "redirect_url": "https://www.google.com/url?url=https://openai.com",
    "snippet": "OpenAI is an AI research and deployment company.",
    "highlighted_terms": "OpenAI",
    "image_alt": "",
    "has_image": false,
    "favicon_url": "https://openai.com/favicon.ico",
    "people_also_ask": [
        {
            "position": 1,
            "question": "What is OpenAI?",
            "answer": "OpenAI is an AI research company",
            "source_url": "https://openai.com/about"
        }
    ]
}

常见问题

这个抓取工具返回哪些数据？

通过关键词查询 Google SERP，每行返回一条结构化的自然搜索结果，包含 22+ 个字段。每行包含结果标题、URL、摘要、根域名、高亮关键词及其连续全局排名。搜索级上下文（关键词、国家、语言、相关搜索、"人们还问"）在每行重复。

翻页机制如何工作？

翻页始终从偏移量 0 开始，每页递增 10（Google 默认 SERP 页面大小）。
max_pages=3 → 依次发出 start=0, 10, 20 的请求。
每页解析后立即流式输出 — 后续页面仍在获取时，消费者已可看到进度。
如果某页返回空的自然结果列表，抓取提前停止（Google 已无更多结果）。

最终行数如何确定？

最终输出行数等于所有抓取页面返回的自然结果总数。例如，如果 3 页分别返回 10 / 8 / 7 条自然结果，抓取器将输出 25 行。

支持哪些导出格式？

CoreClaw 支持 8 种导出格式：

格式	适用场景	说明
JSON	编程 / API 集成	完整保留嵌套结构
CSV	电子表格分析	直接导入 Excel、Google Sheets
JSONL	流式 / 逐行处理	每行一个 JSON 对象，适合大数据管道
XLS	旧版 Excel 兼容	Excel 97-2003 格式
XLSX	现代 Excel	原生 Excel 格式，支持格式化和公式
HTML Table	网页展示 / 报告	渲染为 HTML 表格，便于嵌入网页或邮件
XML	企业系统 / 遗留集成	标准标记格式，适配 SOAP API 和企业数据交换
RSS	订阅阅读器 / 监控	结构化订阅格式，用于跟踪更新