Technologue.id, Jakarta - Dalam upaya mengamankan data berkualitas tinggi untuk melatih model AI mereka, perusahaan AI seperti OpenAI, Google, dan Meta telah menggunakan taktik yang dinilai tidak jelas.
Laporan New York Times menyatakan bahwa OpenAI kabarnya mentranskripsikan lebih dari satu juta jam video YouTube untuk menerapkan data guna melatih model bahasa besar (LLM) tercanggihnya, GPT-4.
Kabarnya, OpenAI mengembangkan model transkripsi audio Whisper, yang membantu perusahaan dalam mengambil data dari video YouTube. NY Times melaporkan bahwa OpenAI mengetahui bahwa metode ini mungkin akan diawasi, namun mereka tetap melanjutkannya karena mereka yakin metode ini merupakan penggunaan wajar.
Menariknya, Google, pemilik YouTube, juga diduga terlibat dalam praktik serupa pada model AI-nya, sehingga melanggar hak cipta kreator, dikutip dari Neowin.
Laporan NY Times sejalan dengan laporan The Information, yang menyoroti bahwa OpenAI diduga menghapus data dari video dan podcast YouTube untuk melatih dua sistem AI-nya. Laporan tersebut juga menunjukkan bahwa presiden OpenAI, Greg Brockman, juga ada dalam tim tersebut.
Baca Juga:
Google Segera Integrasikan Gemini AI untuk Gmail Versi Android