OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4-新科技-资讯-头部财经

OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4

资讯 » 新科技 2024-04-07

本周早些时候，《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天，《纽约时报》详细介绍了 AI 公司处理此问题的一些方法，其中涉及到属于 AI 版权法模糊灰色区域的内容。

报道称，OpenAI 迫切需要训练数据，并开发了 Whisper 音频转录模型来克服困难，转录了超过 100 万小时的 YouTube 视频来训练其最先进的大型语言模型 GPT-4。

报道提到，OpenAI 在 2021 年耗尽了有用的数据供应，并在耗尽其他资源后讨论了转录 YouTube 视频、播客和有声读物的可行性。此外，OpenAI 使用了包括来自 Github 的计算机代码、国际象棋走棋数据库和来自 Quizlet 的作业内容。

据报道，OpenAI 公司知道这在法律上存在问题，但认为这是合理使用。《泰晤士报》则透露，OpenAI 总裁 Greg Brockman 亲自参与了所使用视频的收集。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

富友支付向港交所递交上市申请, 2023收入15.06亿元

2024-05-012阅读
银行理财市场洗牌：农银理财业绩承压，净利润下滑

2024-05-012阅读
太酷了！苹果新专利曝光：iPhone、iPad MacBook 硬件屏幕可折叠

2024-05-012阅读
贾跃亭：没有为孩子设立信托，可能是被造谣最多的中国企业家

2024-05-012阅读
销量下滑，马斯克解雇两名高管

2024-05-012阅读
顺丰控股财报：一季度营收突破653亿，同比增长7.03%

2024-05-012阅读
AMD财报：营收54.73亿美元，利润大幅增长，市场反应却出现分歧

2024-05-012阅读
小度添添推出首款基于文心大模型定制版闺蜜机

2024-05-012阅读
英伟达CEO黄仁勋：AI不会完全取代人类工作

2024-05-012阅读
2023年上海咖啡门店数达9553家，外资咖啡企业数领跑中国

2024-05-012阅读