Некои од најголемите светски компании ги обучија своите модели со вештачка интелигенција на податоци кои вклучуваат транскрипти од повеќе од 173.000 видеа на „YouTube“ - и без дозвола.
Ова го откри новата истрага на „Proof News“. Базата на податоци, создадена од непрофитна компанија наречена „EleutherAI“, содржи транскрипти на видеа од повеќе од 48.000 канали на „YouTube“ и е користена од „Apple“, „Nvidia“ и „Anthropic“, меѓу другите компании.
Откритието укажува на една непријатна вистина за вештачката интелигенција: технологијата во голема мера е изградена на податоци земени од креаторите без нивна дозвола или надомест.
Податоците вклучуваат и видео транскрипти од некои од најголемите Јутјубери, како што се Маркез Браунли „MKBHD“и „MrBeast“.
„Apple собра податоци за својата вештачка интелигенција од неколку компании. Една од нив собра тони податоци/транскрипти од видеата на „YouTube“, вклучувајќи го и моето. Ова ќе биде тековен проблем долго време“, објави Браунли на платформата „X“.
Досега, компаниите за вештачка интелигенција не беа транспарентни за тоа кои податоци ги користат за да ги обучуваат своите модели со вештачка интелигенција. На почетокот на овој месец, уметниците и фотографите го критикуваа „Apple“ за необјавување на изворите користени за обука на „Apple Intelligence“ системот.
„YouTube“ го претставува најголемото складиште на видео содржини во светот и е вистински рудник за злато не само за транскрипти, туку и за аудио, видео, слики, што ја прави платформата совршен извор за обука на модели со вештачка интелигенција.