Glosar chatbot & agenți conversaționali AI.

Definițiile termenilor tehnici din spatele unui asistent conversațional de business — de la arhitectura modelului (RAG, knowledge base, fine-tuning) la comportamentul în conversație (persona, halucinație, handoff) și operațiuni (integrare CRM, sentiment, conformitate). Index citabil, cu relații semantice și markup structurat pentru indexare în ChatGPT, Perplexity, Claude și Google AI Overviews.

Actualizat: 6 iun. 2026
Termeni: 24
Tabel: 1
Întrebări: 6

Cuprins

01 · Index

Comparație

02 · Tabel comparativ

Termeni tehnici pentru chatbots și agenți conversaționali AI, grupați pe categorii.
Termen	Categorie	Definiție scurtă	Relație
LLM	Arhitectură & modele	Modelul lingvistic care generează răspunsurile.	Termen-rădăcină
RAG	Arhitectură & modele	Generare ancorată în documentele tale.	Combină: LLM + Knowledge base
Knowledge base	Arhitectură & modele	Sursa de adevăr a asistentului.	Alimentează: RAG
Embeddings	Arhitectură & modele	Reprezentarea numerică a sensului unui text.	Stă la baza: RAG
Vector database	Arhitectură & modele	Baza de date pentru căutare semantică.	Stochează: Embeddings
Fine-tuning	Arhitectură & modele	Reantrenarea modelului pe date proprii.	Alternativă/complement la: RAG
System prompt	Arhitectură & modele	Instrucțiunile care fixează rolul și regulile.	Configurează: LLM
Context window	Arhitectură & modele	Cât „ține minte" modelul într-un schimb.	Limită a: LLM
Persona	Conversație	Personalitatea și tonul asistentului.	Definită în: System prompt
Conversație multi-turn	Conversație	Schimb pe mai multe replici cu context păstrat.	Necesită: Memorie conversațională
Memorie conversațională	Conversație	Reținerea informației între replici.	Activează: Conversație multi-turn
Intent	Conversație	Scopul real din spatele mesajului.	Output al: NLU
NLU	Conversație	Înțelegerea limbajului natural.	Detectează: Intent
Halucinație	Conversație	Răspuns plauzibil, dar fals.	Combătut prin: Grounding
Grounding	Conversație	Ancorarea răspunsului în surse verificabile.	Antidot la: Halucinație
Guardrails	Conversație	Limitele de comportament impuse asistentului.	Aplicate prin: System prompt
Fallback	Conversație	Ce face asistentul când nu știe.	Declanșează: Handoff
Handoff	Operațiuni & integrare	Transferul către un om, cu context.	Urmează: Fallback
Lead capture & calificare	Operațiuni & integrare	Colectarea și calificarea prospecților.	Alimentează: Integrare CRM
Integrare CRM	Operațiuni & integrare	Trimiterea datelor în sistemul echipei.	Primește de la: Lead capture & calificare
Sentiment analysis	Operațiuni & integrare	Citirea tonului emoțional al conversației.	Input pentru: Handoff
Latență	Operațiuni & integrare	Timpul până la primul răspuns.	Metrică de performanță
Canal conversațional	Operațiuni & integrare	Unde trăiește asistentul (web, WhatsApp, Messenger).	Web / WhatsApp / Messenger
GDPR & data retention	Conformitate	Procesarea legală a datelor.	Acoperă toate categoriile

Definiții

03 · Termeni

Arhitectură & modele

LLM

Large Language ModelTermen-rădăcină

Model lingvistic de mari dimensiuni, antrenat pe volume uriașe de text, care generează răspunsuri prezicând cuvântul următor. Este motorul care produce limbajul unui asistent conversațional. Exemple folosite în implementări: GPT-4o, Claude, Llama, Mistral.

Apariție: Arhitectura Transformer — 2017 (Google); LLM-uri de larg consum — din 2022 (ChatGPT).
În implementare: Alegem modelul după caz: GPT-4o pentru raționament conversațional, Claude pentru documente lungi și ton nuanțat, modele open-source (Llama, Mistral) pentru on-premise sau buget redus.

Termeni similariRAG Fine-tuning Context window

Resurse aplicate

Sonya — personalități AI antrenate pe brandul tău

RAG

Retrieval-Augmented GenerationCombină: LLM + Knowledge base

Tehnică prin care, înainte de a răspunde, asistentul caută fragmentele relevante din documentele tale și le oferă modelului ca context. Astfel răspunsul e ancorat în date reale, nu în memoria generică a modelului — metoda principală de a reduce halucinațiile.

Apariție: Concept formalizat în 2020 (paper Facebook AI / Meta), devenit standard în asistenții de business din 2023.
În implementare: Spargem documentele în fragmente, le transformăm în embeddings, le stocăm într-un vector database și, la fiecare întrebare, injectăm fragmentele potrivite în prompt.

Resurse aplicate

Sonya — knowledge base pe documentele tale

Knowledge base

Bază de cunoștințeAlimentează: RAG

Colecția de surse pe care le „știe" asistentul — catalog de produse, prețuri, FAQ-uri, manuale, politici interne. Este sursa de adevăr din care se construiește fiecare răspuns. Cu cât e mai curată și mai completă, cu atât asistentul răspunde mai precis.

Apariție: Concept de suport clienți pre-AI; redefinit ca sursă pentru RAG din 2023.
În implementare: Importăm catalog, documente, FAQ-uri și manuale; le structurăm și le actualizăm periodic. Pachetul Starter acoperă până la 50 de documente; Business și Enterprise — knowledge base nelimitat.

Termeni similariRAG Embeddings Grounding

Resurse aplicate

Sonya — import catalog, documente, FAQ

Embeddings

Vectori semanticiStă la baza: RAG

Reprezentarea unui text sub formă de listă de numere (vector) care surprinde sensul, nu cuvintele exacte. Texte cu înțeles apropiat au vectori apropiați. Permite căutarea semantică: asistentul găsește fragmentul relevant chiar dacă utilizatorul folosește alte cuvinte decât documentul.

Apariție: Word2Vec — 2013; embeddings la nivel de propoziție/document, mainstream din 2022.
În implementare: Transformăm fiecare fragment din knowledge base în embeddings și le comparăm cu embedding-ul întrebării, pentru a regăsi cele mai relevante pasaje.

Termeni similariRAG Vector database

Vector database

Bază de date vectorialăStochează: Embeddings

Bază de date optimizată pentru stocarea și căutarea rapidă a embeddings. Răspunde la întrebarea „care fragmente seamănă semantic cu această întrebare?" în milisecunde, chiar și la milioane de documente. Componenta de „memorie de lungă durată" a unui sistem RAG.

Apariție: Categorie consolidată în 2022–2023 (Pinecone, Weaviate, pgvector, Qdrant).
În implementare: Alegem soluția după volum și cerințe de hosting; pentru deployments EU/on-premise folosim variante self-hosted, conform GDPR.

Termeni similariEmbeddings RAG

Fine-tuning

Ajustare finăAlternativă/complement la: RAG

Reantrenarea unui model pe exemple proprii, ca să adopte un stil, un format sau un comportament specific. Spre deosebire de RAG (care adaugă cunoștințe la momentul răspunsului), fine-tuning modifică modelul însuși. Util pentru ton și sarcini repetitive; mai costisitor de întreținut.

Apariție: Practică standard de transfer learning; aplicată comercial pe LLM-uri din 2023.
În implementare: Rezervat pachetului Enterprise, când brandul are nevoie de un model dedicat. Pentru majoritatea cazurilor, RAG + system prompt bine scris obțin rezultate similare, mai ieftin.

Termeni similariLLM RAG System prompt

System prompt

Prompt de sistemConfigurează: LLM

Setul de instrucțiuni invizibile pentru utilizator care fixează rolul, tonul, regulile și limitele asistentului înainte de orice conversație. Aici se definesc persona, ce are voie și ce nu are voie să spună, și cum escaladează. Coloana vertebrală a comportamentului.

Apariție: Mecanism standard al LLM-urilor de chat din 2022.
În implementare: Codificăm aici persona, guardrails și regulile de fallback. Un system prompt prost scris produce un asistent generic; unul bine scris înlocuiește, adesea, nevoia de fine-tuning.

Termeni similariPersona Guardrails Fine-tuning

Context window

Fereastră de contextLimită a: LLM

Cantitatea maximă de text (măsurată în tokenuri) pe care un model o poate procesa într-un singur schimb — incluzând instrucțiunile, istoricul conversației și documentele injectate. Când conversația o depășește, modelul „uită" partea cea mai veche dacă nu există un mecanism de memorie.

Apariție: Concept de la primele LLM-uri; ferestrele au crescut puternic din 2023.
În implementare: Gestionăm fereastra prin sumarizarea istoricului și prin RAG selectiv, ca să încapă doar contextul relevant — păstrând latența mică.

Conversație

Persona

Voce de brand · personalitate AIDefinită în: System prompt

Personalitatea distinctă a asistentului — ton, vocabular, replici-semnătură, mod de a reacționa la glume și obiecții. Transformă un FAQ animat într-un interlocutor care vorbește ca brandul. Diferența între un chatbot generic și un asistent care chiar vinde stă, în primul rând, în persona.

Apariție: Disciplină de design conversațional consolidată odată cu asistenții AI generativi, 2023–2024.
În implementare: Definim persona într-un workshop cu echipa (Ziua 1): voce, public țintă, obiectiv. Exemple live: Dona (ironică, pharma), Hanna (consultativă, HVAC), Sierra (aventurieră, auto premium).

Termeni similariSystem prompt Guardrails

Resurse aplicate

Conversație multi-turn

Multi-turn conversationNecesită: Memorie conversațională

Conversație care se desfășoară pe mai multe replici succesive, în care asistentul înțelege referirile la mesajele anterioare și completează informația lipsă întrebând natural. Opusul unui bot care tratează fiecare mesaj izolat și uită ce s-a spus cu o replică în urmă.

Apariție: Capabilitate-standard a asistenților LLM din 2022.
În implementare: Asistentul ține firul: dacă întrebi „și pentru menopauză?" după o discuție despre suplimente, înțelege la ce te referi, fără să reiei totul.

Memorie conversațională

Context / memoryActivează: Conversație multi-turn

Mecanismul prin care asistentul reține informația relevantă pe parcursul unei conversații (memorie de scurtă durată) sau între sesiuni (memorie de lungă durată). Permite continuitatea: utilizatorul nu trebuie să repete contextul, iar răspunsurile devin coerente de la o replică la alta.

Apariție: Tehnici de memorie pentru agenți conversaționali, mature din 2023.
În implementare: Combinăm istoricul recent al conversației cu RAG pe profil/istoric, păstrând doar ce e relevant ca să nu umplem context window.

Termeni similariConversație multi-turn Context window

Intent

IntențieOutput al: NLU

Scopul real din spatele unui mesaj — ce vrea de fapt utilizatorul, dincolo de cuvintele folosite. „Cât costă?", „aveți reduceri?" și „e scump?" pot avea aceeași intenție. Identificarea corectă a intenției determină dacă asistentul răspunde la întrebarea pusă sau la cea ratată.

Apariție: Concept central în chatbots clasici (din ~2016); reinterpretat de LLM-uri, care îl deduc fără reguli rigide.
În implementare: La asistenții moderni, intenția e dedusă de model în context, nu hardcodată într-un arbore de decizie — de aici flexibilitatea la întrebări nuanțate.

Termeni similariNLU Conversație multi-turn

NLU

Natural Language UnderstandingDetectează: Intent

Capacitatea unui sistem de a înțelege limbajul natural — sensul, intenția și entitățile dintr-un mesaj scris liber, cu greșeli, argou sau formulări neașteptate. Componenta care diferențiază un asistent care „pricepe" de un meniu cu butoane care cere formulări exacte.

Apariție: Subdomeniu NLP cu istorie lungă; revoluționat de LLM-uri din 2022.
În implementare: La asistenții AI, NLU vine nativ din LLM: nu mai antrenăm clasificatoare de intenție separat, ci ne bazăm pe înțelegerea contextuală a modelului.

Termeni similariIntent LLM

Halucinație

HallucinationCombătut prin: Grounding

Răspuns care sună plauzibil și sigur pe sine, dar este fals sau inventat — un preț greșit, o politică inexistentă, o sursă fictivă. Cel mai mare risc de business al unui asistent AI: o halucinație distruge încrederea exact când clientul era gata să cumpere.

Apariție: Termen popularizat odată cu LLM-urile de larg consum, 2022–2023.
În implementare: O combatem prin RAG (ancorare în date reale), grounding, limite clare de cunoaștere și reguli de fallback: când nu știe, asistentul spune că nu știe și escaladează. Niciodată nu inventează.

Termeni similariGrounding RAG Fallback Guardrails

Grounding

Ancorare în surseAntidot la: Halucinație

Practica de a obliga asistentul să-și construiască răspunsurile exclusiv din surse verificabile — documentele tale — și, ideal, să citeze de unde provine informația. Un răspuns „grounded" poate fi verificat; unul negrounded e doar o presupunere bine formulată a modelului.

Apariție: Principiu consolidat odată cu adopția RAG în producție, 2023.
În implementare: Configurăm asistentul să răspundă din knowledge base, nu din cunoștințe generice, și să recunoască explicit când o informație lipsește.

Termeni similariRAG Halucinație Knowledge base

Guardrails

Limite de comportamentAplicate prin: System prompt

Regulile care stabilesc ce are voie și ce nu are voie să facă asistentul — subiecte interzise, ton obligatoriu, obligația de a nu inventa, de a nu se da drept om, de a escalada în anumite situații. „Linia roșie" care protejează brandul de un asistent scăpat de sub control.

Apariție: Disciplină de AI safety aplicată comercial din 2023.
În implementare: Liniile noastre roșii: nu construim asistenți fără personalitate, nu permitem minciuna/halucinația, asistentul declară mereu că e AI, procesăm date doar GDPR conform.

Termeni similariSystem prompt Halucinație Fallback

Fallback

Comportament de rezervăDeclanșează: Handoff

Ce face asistentul când ajunge la limita cunoștințelor sau a competenței sale. În loc să inventeze, execută un plan prestabilit: spune că nu știe și sugerează contact uman, escaladează automat la un agent live, sau colectează datele de contact și promite revenire.

Apariție: Concept de design conversațional, esențial în era halucinațiilor.
În implementare: Definim exact varianta de fallback per brand, în faza de Discovery. Fallback-ul bun e invizibil pentru client — pare grijă, nu eșec.

Termeni similariHandoff Halucinație Guardrails

Operațiuni & integrare

Handoff

Escaladare la agent umanUrmează: Fallback

Transferul conversației de la asistentul AI către un agent uman, păstrând tot contextul intact — istoricul, întrebarea și datele colectate. Clientul nu o ia de la capăt. Se declanșează când conversația depășește scopul AI-ului sau când sentimentul indică frustrare.

Apariție: Funcție-standard în platformele de customer engagement; integrată cu AI din 2023.
În implementare: Disponibil din pachetul Business. Transferul e instant și complet — agentul preia exact de unde a rămas asistentul.

Termeni similariFallback Sentiment analysis

Resurse aplicate

Sonya — handoff live către agent uman

Lead capture & calificare

Generare și calificare lead-uriAlimentează: Integrare CRM

Colectarea datelor de contact prin conversație naturală (nu formular sec) și calificarea prospectului după criteriile tale — buget, nevoie, moment — înainte de a-l trimite echipei de vânzări. Asistentul transformă vizitatori curioși în cereri de ofertă calificate, fără efort uman.

Apariție: Practică de marketing automation reinventată conversațional din 2023.
În implementare: Asistentul întreabă firesc, califică după regulile tale și trimite lead-ul direct în CRM. Disponibil din pachetul Business.

Termeni similariIntegrare CRM Intent

Resurse aplicate

Sonya — generare și calificare lead-uri

Integrare CRM

CRM integrationPrimește de la: Lead capture & calificare

Conectarea asistentului la sistemul de management al relațiilor cu clienții, astfel încât lead-urile, conversațiile și sentimentul ajung automat acolo unde lucrează echipa. Elimină copy-paste-ul manual și asigură că niciun prospect generat de asistent nu se pierde.

Apariție: Integrări native AI–CRM, mature din 2023–2024.
În implementare: Conectăm HubSpot, Pipedrive, Salesforce, Monday sau API custom (Enterprise). Lead-ul, transcriptul și scorul ajung în pipeline-ul corect.

Resurse aplicate

Sonya — integrări CRM

Sentiment analysis

Analiză de sentimentInput pentru: Handoff

Detectarea automată a tonului emoțional al conversației — mulțumit, neutru, frustrat. Permite asistentului să-și adapteze răspunsul și să escaladeze la un om înainte ca un client nemulțumit să plece. La nivel agregat, arată ce subiecte generează frustrare recurentă.

Apariție: Tehnică NLP clasică, integrată în dashboards conversaționale moderne.
În implementare: Sentimentul alimentează decizia de handoff și ajunge în dashboard-ul de analytics, ca date acționabile — nu rapoarte moarte.

Termeni similariHandoff Integrare CRM

Latență

LatencyMetrică de performanță

Timpul scurs între întrebarea utilizatorului și primul răspuns al asistentului. Latența mare ucide conversația: clientul percepe ezitarea ca pe o defecțiune. Obiectivul practic pentru un asistent de business este un răspuns perceput ca aproape instant.

Apariție: Metrică universală de performanță; critică pentru UX conversațional.
În implementare: Optimizăm latența per canal; ținta operațională este răspuns sub 3 secunde. Alegerea modelului și gestiunea context window sunt principalele pârghii.

Termeni similariLLM Context window

Canal conversațional

ChannelWeb / WhatsApp / Messenger

Locul în care trăiește asistentul și vorbește cu clienții — widget pe website, WhatsApp Business, Facebook Messenger, Instagram Direct. Aceeași persona, aceleași cunoștințe, pe orice canal. Pentru piața din România, WhatsApp este adesea canalul preferat de comunicare cu brandurile.

Apariție: Strategie omnichannel adaptată asistenților AI, 2023–2024.
În implementare: Widget embed pe orice tehnologie de site (fără reinginerie), plus WhatsApp Business API, Messenger și Instagram din pachetul Business. Răspuns 24/7, aceeași voce peste tot.

Termeni similariPersona Latență

Resurse aplicate

Sonya — widget web, WhatsApp, Messenger

Conformitate

Întrebări frecvente

04 · FAQ

Care e diferența între un chatbot clasic și un asistent AI conversațional?

Un chatbot clasic funcționează pe arbori de decizie: butoane, meniuri și răspunsuri pre-scrise, declanșate de cuvinte-cheie exacte. Un asistent AI conversațional folosește un LLM care înțelege limbaj natural (NLU), ține minte contextul (conversație multi-turn), deduce intenția reală și răspunde nuanțat. Primul cere formulări exacte; al doilea pricepe ce vrei chiar dacă întrebi imperfect.

Ce este RAG și de ce contează pentru un chatbot de business?

RAG (Retrieval-Augmented Generation) este tehnica prin care asistentul caută mai întâi fragmentele relevante din documentele tale și abia apoi formulează răspunsul, ancorat în acele surse. Contează pentru că este principala metodă de a preveni halucinațiile: asistentul răspunde din knowledge base-ul tău real, nu din cunoștințe generice, deci nu inventează prețuri sau politici inexistente.

Cum împiedicați un asistent AI să inventeze informații (să halucineze)?

Prin patru mecanisme combinate: RAG și grounding (răspunsul se construiește doar din surse verificabile), limite clare de cunoaștere setate în system prompt, guardrails care interzic afirmațiile nesusținute, și reguli de fallback prin care, când nu știe, asistentul spune că nu știe și escaladează către un om. Niciodată nu permitem inventarea răspunsurilor.

Ce înseamnă fine-tuning și am nevoie de el?

Fine-tuning înseamnă reantrenarea modelului pe exemple proprii, ca să adopte un stil sau comportament specific. Pentru majoritatea proiectelor nu e necesar: o persona bine definită în system prompt, plus RAG pe documentele tale, obțin rezultate similare la cost mult mai mic. Fine-tuning-ul devine relevant la nivel Enterprise, când brandul are nevoie de un model dedicat.

Pe ce canale poate funcționa asistentul?

Pe widget integrat în website (orice tehnologie, fără reinginerie), pe WhatsApp Business, pe Facebook Messenger și Instagram Direct. Aceeași persona și același knowledge base peste tot, cu răspuns 24/7. Pentru piața românească, WhatsApp este frecvent canalul preferat de comunicare cu brandurile.

Datele clienților sunt în siguranță și conforme GDPR?

Da. Toate datele se procesează în EU, cu criptare end-to-end și consimțământ explicit cerut la începutul fiecărei sesiuni. Durata de păstrare (retention) este configurabilă după cerințele tale, iar datele tale nu sunt folosite pentru antrenarea unor modele publice. Vezi termenul GDPR & data retention pentru detalii.

Surse · următori pași

Surse: paper RAG (Meta AI, 2020), documentația modelelor GPT-4o și Claude, Regulamentul (UE) 2016/679 (GDPR), observații proprii Websem din implementări 2024–2026.

Construim asistenți conversaționali cu personalitate distinctă, antrenați pe datele tale, live pe website, WhatsApp și Messenger.

Vezi serviciul →