NVIDIA a mai pus o cărămidă la evoluţia AI-ului, lansând o soluţie numită Fugatto, care modifică voci şi poate chiar crea muzică. Avem de-a face cu un model AI, care poate modifica fişiere audio şi chiar schimba accentul în care vorbeşte o persoană.
Pe 25 noiembrie NVIDIA a prezentat un model de inteligenţă artificială gândit pentru crearea de muzică şi pentru modificarea de voci şi generarea de sunete noi. Tehnologia e gândită pentru producătorii de muzică, filme şi jocuri video. Pentru început acest Fugatto (acronim de la Foundational Generative Audio Transformer Opus 1) nu e gândit pentru lansare publică, doar pentru o fază de teste.
Nu e un proiect singular, de vreme ce şi Meta, compania mamă Facebook a creat o soluţie care poate genera audio sau video dintr-un text. Ce face diferit NVIDIA totuşi e să ia o bucată audio şi să o modifice. Spre exemplu o compoziţie de pian poate deveni un track cu voce umană. Sau o înregistrare de podcast poate primi accent diferit, scoţian sau australian să zicem.
Noul model NVIDIA a fost antrenat cu date open source, pentru a nu stârni mânia muzicienilor sau creatorilor de conţinut. Ca menţiune secundară şi trăznită, Fugatto poate face ca o trompetă să latre şi un saxofon să miaune. Orice descrie utilizatorul, modelul creează sub formă audio. Evident există şi riscuri legate de scam-uri şi apeluri telefonice false în numele unor rude care cer transfer de bani.