Peu de temps après qu’OpenAI a dévoilé ChatGPT en novembre 2022, cela a déclenché un débat parmi les créatifs : quelles données ont-ils utilisé pour entraîner leur modèle d’IA ? Cela a été suivi par le premier procès dans lequel deux auteurs alléguaient que l’entreprise avait utilisé leur travail sans autorisation pour entraîner l’ensemble de données d’IA.
Aujourd’hui, certains la plupart influent des marques figurent sur la liste pour une raison similaire, notamment Apple, Salesforce, Nvidia et Anthropic, entraînant leur ensemble de données d’IA sur des vidéos YouTube sans consentement ni autorisation appropriée. Un rapport de CÂBLÉen collaboration avec Nouvelles de preuve détaille ce qui s’est exactement passé.
L’enquête « a révélé que les sous-titres de 173 536 vidéos YouTube, siphonnées sur plus de 48 000 chaînes, ont été utilisées par des poids lourds de la Silicon Valley, notamment Anthropic, Nvidia, Apple et Salesforce ».
Le fournisseur en question qui a fourni des données aux géants de la technologie est EleuterAI, qui a rassemblé un ensemble de données appelé Pile, qu’Apple aurait utilisé pour former son LLM. Une partie de cet ensemble de données, nommée sous-titres YouTube, est constituée de sous-titres de vidéos YouTube sans autorisation. C’est non seulement contraire à l’éthique, mais aussi une violation flagrante des termes et conditions de YouTube.
Le Mac Observer a contacté Apple pour commenter cette histoire, mais au moment de la publication, Apple n’a pas répondu. Nous mettrons à jour cette histoire dès que nous recevrons une réponse d’Apple.
Bien qu’Apple Intelligence ait été en retard dans le parti de l’IA, comme je l’ai souvent dit, j’ai toujours soutenu que l’entreprise avait fait preuve d’éthique dans ses pratiques (prenez, par exemple, lorsqu’elle a approché les éditeurs pour conclure un accord pour former son ensemble de données d’IA). sur les archives). Cependant, malgré ces intentions, il semble qu’Apple Intelligence ait été formée aux sous-titres YouTube sans autorisation appropriée, ce qui ne laisse pas une très bonne impression.