专为 AI 数据科学家打造

**海量视频元数据**:通过 Video ID 或关键词,批量获取标题、描述、标签、播放量等字段。

**评论与舆情分析**:高效抓取视频下的Top评论与回复,支持按时间或热度排序。

**音视频云端直传**:支持将无水印 4K/8K 视频或音频直接转存至您的 S3/OSS/GCS 对象存储,节省 99% 本地带宽。

**零运维成本**:您只需关注数据本身,我们将复杂的 IP 轮转、解锁验证码等工作完全抽象化。

API 集成示例

import requests

# 示例:获取视频详细信息与字幕
api_url = "https://api.123proxy.cn/v1/youtube/video"
payload = {
    "video_id": "VIDEO_ID_HERE",
    "features": ["metadata", "subtitles", "comments"],
    "download_config": {
         "resolution": "1080p",
         "audio_only": False,
         "upload_to": "s3://my-bucket/videos/" 
    },
    "api_key": "YOUR_API_KEY"
}

response = requests.post(api_url, json=payload)
data = response.json()

print(f"Title: {data['metadata']['title']}")
print(f"Subtitles: {data['subtitles']['en'][:100]}...")
            

简单的 REST API 接口,支持批量异步任务提交,并在任务完成后通过 Webhook 回调通知。


无缝集成至您的 AI 技术栈
LangChain
LlamaIndex
AutoGPT
Flowise

提供标准的 Document Loader 与 Tool 接口,让您的 Agent 能够实时获取 YouTube 知识库。

合规与道德承诺

我们深知数据合规对 AI 企业的重要性。123Proxy 的采集服务严格遵循 GDPR 与 CCPA 标准, 我们仅采集公开可见的元数据与内容,不涉及任何用户隐私信息。我们致力于构建负责任的 AI 数据基础设施, 助您在安全、合规的前提下挖掘数据价值。

常见问题 FAQ

Q1:API 的响应速度如何?

我们维护着全球大规模的预热连接池,对于元数据查询通常在毫秒级响应。对于深度的评论抓取或大文件处理,API 支持异步模式,确保高并发下的稳定性。

Q2:是否支持下载 4K/8K 视频原文件?

支持。通过 Video Download Endpoint,您可以配置 webhook 或对象存储凭证(S3/GCS/OSS),系统将直接把无需水印的高清音视频文件转存至您的存储桶,全程无需占用您本地带宽,特别适合大规模数据集构建。

Q3:如何处理 YouTube 的反爬限制?

这是我们核心解决的问题。API 后端集成了智能 IP 轮转、设备指纹伪装与验证码自动通过技术,对调用者完全透明,您无需编写任何反爬逻辑。

Q4:可以试用吗?

当然。联系客服开通 API Key 后,您将获得一定的免费调用额度用于测试集成效果。

立即开始构建您的视频 AI 数据集

扫码客服微信咨询详情