vineri, ianuarie 10

Companiile de inteligență artificială au rămas fără date pentru antrenarea modelelor lor și au „epuizat” suma cunoștințelor umane, a declarat Elon Musk. Cea mai bogată persoană din lume a sugerat că firmele de tehnologie vor trebui să recurgă la date „sintetice” – sau materiale create de modelele de inteligență artificială – pentru a construi și a pune la punct noi sisteme, un proces care are deja loc cu tehnologia care se dezvoltă rapid, relatează The Guardian.

„Suma cumulată a cunoștințelor umane a fost epuizată în formarea inteligenței artificiale (AI). Asta s-a întâmplat practic anul trecut”, a declarat Musk într-un interviu transmis live pe platforma să de social media, X.

Cum funcționează antrenarea

Modelele AI, cum ar fi modelul GPT-4o care alimentează chatbotul ChatGPT, sunt „antrenate” pe o gama vastă de date preluate de pe internet, unde învață, de fapt, să identifice tipare în acele informații – ceea ce le permite să prezică, de exemplu, următorul cuvânt dintr-o propoziție.

Musk a declarat că „singura modalitate” de a contracara lipsa de material sursă pentru antrenarea noilor modele este trecerea la date sintetice create de inteligența artificială.

Referindu-se la epuizarea rezervelor de date, el a spus: „Singura modalitate de a completa aceste date este cu cele sintetice în care … va scrie un fel de eseu sau va veni cu o teză și apoi se va califica și … va trece prin acest proces de autoînvățare”.

Date sintetice

Meta, proprietarul Facebook și Instagram, a utilizat date sintetice pentru a-și perfecționa cel mai mare model Llama AI, în timp ce Microsoft a utilizat, de asemenea, conținut creat de AI pentru modelul sau Phi-4. Google și OpenAI, compania din spatele ChatGPT, au folosit, de asemenea, date sintetice în activitatea lor AI.

Cu toate acestea, Musk a avertizat, de asemenea, că obiceiul modelelor AI de a genera „halucinații” – un termen pentru rezultate inexacte sau fără sens – a reprezentat un pericol pentru procesul de sintetizare a datelor.

El a declarat în cadrul interviului cu Mark Penn, președintele grupului de publicitate Stagwell, că halucinațiile au făcut ca procesul de utilizare a materialului artificial să fie „provocator”, deoarece „cum știi dacă … a halucinat răspunsul sau este un răspuns real”.

Datele de înalta calitate și controlul asupra acestora reprezintă unul dintre câmpurile de luptă juridice ale boom-ului IA. OpenAI a recunoscut anul trecut că ar fi imposibil să creeze instrumente precum ChatGPT fără acces la materiale protejate prin drepturi de autor, în timp ce industriile creative și editurile solicită compensații pentru utilizarea rezultatelor lor în procesul de formare a modelului.

 

Editor : Marina Constantinoiu

Acțiune.
Exit mobile version