TikTok 母公司字节跳动拥有一款网络抓取速度比 OpenAI 快 25 倍的工具

母公司字节跳动正在以比其他主要网络爬虫更快的速度积累大量网络数据

字节跳动可能正计划发布自己的法学硕士,并积极使用其网络爬虫“Bytespider”来收集数据来训练其模型,财富报道称。

Bytespider 在 4 月份出现,从那时起,它的消耗速度让 OpenAI、Google、Meta 和 Anthropic 等网络爬虫相形见绌。

可混搭光速

专门从事机器人管理的公司 Kasada 的首席执行官 Sam Crowther 告诉媒体,Bytespider 的抓取速度是 OpenAI 的 GPTbot 的 25 倍,是 ClaudeBot 的 3000 倍,ClaudeBot 是 Anthropic 为其 Claude LLM 提供的网络爬虫。 Crowther 还表示,Kasada 的数据显示过去六周内来自 Bytespider 的“抓取活动大幅增加”。

随着 Bytespider 贪婪地消耗网络,美国政府正试图阻止中国政府获取美国用户数据的潜在可能性。 4月,拜登总统除非字节跳动在年内将其出售,否则将强制禁止 TikTok。考虑到字节跳动出售 TikTok 的时间紧迫,这种紧迫感与其大规模的网络爬行活动相匹配——无论是为了法学硕士、更好的算法还是其他什么,我们不知道。

字节跳动计划如何处理所有新挖掘的数据还有待观察。但 TikTok 已经为该平台推出了多项人工智能功能。五月份,它发布了一套工具,供广告商创建, 和对于品牌和创作者来说。据传 TikTok 也正在开发一款,结果由 AI 驱动——可能使用 ChatGPT。