Door een verbijsterende misstap hebben OpenAI-ingenieurs per ongeluk cruciaal bewijsmateriaal gewist dat was verzameld door De New York Times en andere grote kranten in hun rechtszaak over AI-trainingsgegevens, zo blijkt uit een rechtszaak die woensdag is ingediend.
De juridische teams van de kranten hadden meer dan 150 uur besteed aan het doorzoeken van de AI-trainingsgegevens van OpenAI om gevallen te vinden waarin hun nieuwsartikelen waren opgenomen, aldus de indiener. Maar er wordt niet uitgelegd hoe deze fout is ontstaan of wat de gegevens precies inhielden. Hoewel in de indiening staat dat OpenAI de fout heeft toegegeven en heeft geprobeerd de gegevens te herstellen, was wat het wist te redden onvolledig en onbetrouwbaar. Wat er werd teruggevonden, kan dus niet helpen om goed te traceren hoe de artikelen van de nieuwsorganisaties werden gebruikt bij het bouwen van de AI-modellen van OpenAI. Terwijl de advocaten van OpenAI gekarakteriseerd De advocaten van de New York Times merkten op dat ze “geen reden hadden om aan te nemen” dat het wissen van de gegevens een ‘foutje’ was.
De New York Times Company lanceerde deze historische strijd afgelopen december en beweerde dat OpenAI en zijn partner Microsoft hun AI-tools hadden gebouwd door “miljoenen” artikelen van de publicatie te “kopiëren en te gebruiken” en nu “direct concurreren” met de inhoud ervan. De publicatie vraagt OpenAI aansprakelijk te stellen voor “miljarden dollars aan wettelijke en daadwerkelijke schade” voor het vermeend kopiëren van zijn werken.
The Times heeft al meer dan 1 miljoen dollar uitgegeven aan de strijd tegen OpenAI voor de rechtbank – een aanzienlijke vergoeding die maar weinig uitgevers kunnen evenaren. Ondertussen heeft OpenAI deals gesloten met grote verkooppunten zoals Axel Springer, Conde Nast en De Verge’s moederbedrijf Vox Media, wat suggereert dat veel uitgevers liever samenwerken dan vechten.
OpenAI weigerde samen met The New York Times de update bij de rechtbank in te dienen. Deze verklaring werd ingediend door Jennifer Maisel, een advocaat die de nieuwsorganisaties vertegenwoordigt, om de rechtbank formeel op de hoogte te stellen van wat er is gebeurd.
In een e-mail aan De randOpenAI-woordvoerder Jason Deutrom zei dat het bedrijf het niet eens is met de gemaakte karakteriseringen en binnenkort een eigen reactie zal indienen. De New York Times weigerde De rand‘s verzoek om commentaar.