Zero-shot learning

Zero-shot learning

Zero-shot learning (ZSL) e un concept avansat în inteligența artificială și machine learning care înseamnă că un model poate face predicții sau îndeplini o sarcină fără să fi fost antrenat direct pe acele clase sau exemple specifice.

  • Modelul primește o problemă nouă, cu categorii sau tipuri de date pe care nu le-a văzut în timpul antrenării.
  • Folosește cunoștințe generale învățate anterior (de exemplu, relații semantice între concepte) ca să generalizeze și să răspundă corect.
  • Practic, nu e nevoie să-i arăți exemple concrete din clasa țintă pentru a o recunoaște sau a genera un răspuns relevant.

Exemplu simplu:

Dacă antrenezi un model să recunoască doar animale domestice (câine, pisică), dar îi ceri să identifice o „zebră” – fără să-i fi arătat poze cu zebre – modelul folosește descrieri, asemănări și alte informații contextuale ca să recunoască corect zebră, deși nu a văzut exemplare în antrenament.

În NLP și LLM:

LLM-urile pot înțelege și genera răspunsuri pentru sarcini complet noi (traduceri între limbi noi, întrebări despre domenii necunoscute) doar pe baza instrucțiunilor sau exemplelor minime, fără fine-tuning specializat.

Avantaje:

  • Scalabilitate mare: nu trebuie să retrenezi modelul pentru fiecare task nou.
  • Economisește timp și resurse.
  • Permite aplicarea modelelor AI în contexte imprevizibile sau dinamice.

Limitări:

  • Performanța poate fi mai slabă decât în sarcinile unde modelul a fost antrenat explicit.
  • Depinde mult de cât de bine a învățat reprezentările generale și relațiile între concepte.

În concluzie, zero-shot learning e capacitatea unui model AI de a generaliza și funcționa bine pe sarcini complet noi, fără antrenament specific, folosindu-se de învățarea anterioară și relațiile semantice.

close
type characters to search...
close