
俄罗斯国际媒体
通过该工具,你可以从 RT 网站(https://www.rt.com/)提取以下新闻数据:
若你需要提取上述范围外的其他数据,请联系我们。
该脚本运行在平台内,通过 SDK 推送数据,平台支持将结果导出为 JSON、CSV 两种结构化数据格式:
是。每次爬取任务都会从 RT 网站实时获取最新的公开新闻数据,不依赖任何缓存机制,充分保障数据的时效性。
以下是爬取结果的展示样例。
| 列名 | 描述 | 数据类型 |
|---|---|---|
| NewsUrl | 新闻的完整链接 | Url |
| Author | 作者名称 | Text |
| NewsLanguage | 新闻语种(如 en) | Text |
| NewsTitle | 新闻标题 | Text |
| NewsImageUrl | 新闻配图链接 | Url |
| NewsPublished | 发布时间(ISO 8601 格式) | Text |
| NewsSourceType | 新闻类型(如 news / russia) | Text |
| NewsTextContent | 新闻纯文本内容(段落换行分隔) | Text |
| 参数名 | 类型 | 必填 | 描述 | 默认值 |
|---|---|---|---|---|
| website | 文本 | 是 | 目标首页 URL(可传入其他 RT 镜像站点) | https://www.rt.com/ |
| pages | 文本 | 否 | 页码范围:1-3(1~3页)、3(前3页)、1,3,5(指定页) | "1" |
| limit | 整数 | 否 | 抓取上限,仅抓取前 N 条新闻(0 或空表示不限制) | 0 |
| workers | 整数 | 否 | 新闻详情页并发抓取线程数 | 8 |