

可一键快速提取 Goodreads 图书相关数据,包含书名、内容简介、ISBN、ASIN、出版社、装帧类型、页数、语言、作品类型、所获奖项、登场人物、评分及评分人数。输出标准化 JSON 结构化数据,可无缝对接各类应用程序与业务流程。
这个 Worker 用于从 Goodreads 图书详情页提取结构化图书信息。你只需要提交一个或多个 Goodreads 图书 URL,Worker 会返回书名、页面链接、简介、标识符、出版信息、分类、奖项、角色、评分和评分数量等字段。
当你需要为图书研究、书单整理、内容分析或图书资料补全收集 Goodreads 元数据时,可以使用这个 Worker。
Worker 会读取每个提交的 Goodreads 图书详情页 URL,加载页面内容,解析页面中嵌入的图书数据,并为每个成功处理的图书返回一行结果。
输入字段是 GoodRead URL。
请添加一个或多个 Goodreads 图书详情页 URL,例如:
请使用直接的 Goodreads 图书详情页。搜索页、作者页、榜单页、评论页以及非 Goodreads URL 不在支持范围内。
当图书页面可以被正常解析时,Worker 会返回以下字段:
| 字段 | 说明 |
|---|---|
title | 图书标题 |
link | 本次处理的 Goodreads 页面链接 |
description | 清理后的图书简介 |
asin | ASIN 或页面可用的图书标识符 |
format | 图书格式,例如平装、电子书或有声书 |
number_of_pages | 页数 |
publisher | 出版社 |
isbn | ISBN |
language | 语言 |
genres | Goodreads 分类,合并为一个文本字段 |
awards | 页面列出的文学奖项 |
characters | 页面列出的角色名称 |
rating | Goodreads 平均评分 |
rating_count | Goodreads 评分数量 |
Goodreads 不同图书页面暴露数据的方式并不完全一致。如果页面结构不同、图书数据缺失,或者 Goodreads 拦截、变更了响应内容,某些 URL 可能无法抓取成功,或只能返回部分字段。
在将这个 Worker 用于大批量任务之前,请先在平台上使用多种不同 Goodreads 图书 URL 进行测试。建议覆盖常见图书、新书、元数据较少的图书,以及你实际生产任务中准备使用的 URL 格式。
以下 URL 建议重点测试:
isbn、asin、awards、characters 等字段是否为空,因为并非所有 Goodreads 页面都提供这些信息。这个 Worker 依赖当前 Goodreads 页面结构,不能保证支持所有图书页面、地区、语言或未来的 Goodreads 页面布局。它不支持按关键词搜索 Goodreads,也不会从其他图书数据库补充信息。
探索商店中更多热门采集工具
by mmi0cuhn
从 Made-in-China 供应商页面采集结构化公司信息,包括主营产品、审计报告编号、外贸能力、证书图片、发货图片和联系人信息,适用于 B2B 采购、供应商调研和线索富集。
by Techforce Global
只需搜索产品,即可获取每件商品的售价、原价、折扣力度、产品主图以及最新的客户评论,所有数据可直接导入您的电子表格、仪表盘或商业智能工具。Quince.com产品数据抓取工具能在短短几分钟内,将整个商品目录转化为整洁、结构化的产品数据。
by yankun guo
一款专用于 SHEIN 单个商品详情数据提取的工具,支持产品 URL 和商品 ID 两种输入方式。通过连接远程 Chromium 实例自动绕过 SHEIN 风险验证,加载目标商品页面并解析完整产品属性,返回标准化的结构化数据。适配全球 10 + 区域站点,支持自定义工作流重试次数,适用于商品信息监控、价格跟踪、竞品调研及趋势分析等场景。
by yankun guo
一款高性能工具,支持关键词、分类 URL、分类 ID 三种输入模式,可自动发现、解析并提取结构化的 SHEIN 产品数据;适配美、英、德、法等多区域站点,支持自定义排序规则,能解析价格、评分、销量、营销徽章等核心属性,适用于价格跟踪、竞品调研、趋势分析等场景。