先前报道过YouTube怀疑OpenAI曾使用他们的视频用以训练作为Sora视频生成模型。时隔一日之后,Google、OpenAI这两家公司被传媒指控,转录了YouTube视频的对白,将声音转变为文本,以训练其AI人工智能模型。
据《纽约时报》报道,OpenAI与Google涉嫌利用YouTube视频转录文本训练其人工智能模型,可能侵犯了创作者的版权。两间人工智能技术巨擘为寻求丰富其AI数据库的背景下,此事引发数据使用伦理的问题。
报道指OpenAI利用其“Whisper”语音识别工具,将超过1,000,000小时的YouTube视频内容转为文本,以训练GPT-4模型。Google也被指出使用YouTube视频内容训练自家的AI模型,但仅限于得到创作者同意的内容。对于未经授权截取YouTube内容,Google发言人Matt Bryant表示公司规定严禁此类行为,并声称Google对OpenAI的相关用途并不知情。
报道中提到Google内部某些人士实际上知悉此事却未采取行动,原因可能是Google自身也在从事类似的行为。此外,Google于2023年6月对其隐私政策进行调整,以更广泛地涵盖其对公开可得内容的使用,包括Google Docs及Google Sheets,目的在于清晰界定该公司使用这些数据来训练AI模型及产品的范畴。Google强调,此类数据使用必须获得用户同意,且未因政策变更而开始使用额外类型的数据进行训练。
随着AI技术的不断进步,如何平衡创新与伦理将成为业界持续面临的挑战。
数据源:纽约时报
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/166636.html