Sari la conținut

Glosar chatbot & agenți conversaționali AI.

Definițiile termenilor tehnici din spatele unui asistent conversațional de business — de la arhitectura modelului (RAG, knowledge base, fine-tuning) la comportamentul în conversație (persona, halucinație, handoff) și operațiuni (integrare CRM, sentiment, conformitate). Index citabil, cu relații semantice și markup structurat pentru indexare în ChatGPT, Perplexity, Claude și Google AI Overviews.

Actualizat
Termeni
24
Tabel
1
Întrebări
6

Cuprins

01 · Index

Comparație

02 · Tabel comparativ
Termeni tehnici pentru chatbots și agenți conversaționali AI, grupați pe categorii.
TermenCategorieDefiniție scurtăRelație
LLMArhitectură & modeleModelul lingvistic care generează răspunsurile.Termen-rădăcină
RAGArhitectură & modeleGenerare ancorată în documentele tale.Combină: LLM + Knowledge base
Knowledge baseArhitectură & modeleSursa de adevăr a asistentului.Alimentează: RAG
EmbeddingsArhitectură & modeleReprezentarea numerică a sensului unui text.Stă la baza: RAG
Vector databaseArhitectură & modeleBaza de date pentru căutare semantică.Stochează: Embeddings
Fine-tuningArhitectură & modeleReantrenarea modelului pe date proprii.Alternativă/complement la: RAG
System promptArhitectură & modeleInstrucțiunile care fixează rolul și regulile.Configurează: LLM
Context windowArhitectură & modeleCât „ține minte" modelul într-un schimb.Limită a: LLM
PersonaConversațiePersonalitatea și tonul asistentului.Definită în: System prompt
Conversație multi-turnConversațieSchimb pe mai multe replici cu context păstrat.Necesită: Memorie conversațională
Memorie conversaționalăConversațieReținerea informației între replici.Activează: Conversație multi-turn
IntentConversațieScopul real din spatele mesajului.Output al: NLU
NLUConversațieÎnțelegerea limbajului natural.Detectează: Intent
HalucinațieConversațieRăspuns plauzibil, dar fals.Combătut prin: Grounding
GroundingConversațieAncorarea răspunsului în surse verificabile.Antidot la: Halucinație
GuardrailsConversațieLimitele de comportament impuse asistentului.Aplicate prin: System prompt
FallbackConversațieCe face asistentul când nu știe.Declanșează: Handoff
HandoffOperațiuni & integrareTransferul către un om, cu context.Urmează: Fallback
Lead capture & calificareOperațiuni & integrareColectarea și calificarea prospecților.Alimentează: Integrare CRM
Integrare CRMOperațiuni & integrareTrimiterea datelor în sistemul echipei.Primește de la: Lead capture & calificare
Sentiment analysisOperațiuni & integrareCitirea tonului emoțional al conversației.Input pentru: Handoff
LatențăOperațiuni & integrareTimpul până la primul răspuns.Metrică de performanță
Canal conversaționalOperațiuni & integrareUnde trăiește asistentul (web, WhatsApp, Messenger).Web / WhatsApp / Messenger
GDPR & data retentionConformitateProcesarea legală a datelor.Acoperă toate categoriile

Definiții

03 · Termeni

Arhitectură & modele

01

LLM

Large Language ModelTermen-rădăcină

Model lingvistic de mari dimensiuni, antrenat pe volume uriașe de text, care generează răspunsuri prezicând cuvântul următor. Este motorul care produce limbajul unui asistent conversațional. Exemple folosite în implementări: GPT-4o, Claude, Llama, Mistral.

Apariție
Arhitectura Transformer — 2017 (Google); LLM-uri de larg consum — din 2022 (ChatGPT).
În implementare
Alegem modelul după caz: GPT-4o pentru raționament conversațional, Claude pentru documente lungi și ton nuanțat, modele open-source (Llama, Mistral) pentru on-premise sau buget redus.
02

RAG

Retrieval-Augmented GenerationCombină: LLM + Knowledge base

Tehnică prin care, înainte de a răspunde, asistentul caută fragmentele relevante din documentele tale și le oferă modelului ca context. Astfel răspunsul e ancorat în date reale, nu în memoria generică a modelului — metoda principală de a reduce halucinațiile.

Apariție
Concept formalizat în 2020 (paper Facebook AI / Meta), devenit standard în asistenții de business din 2023.
În implementare
Spargem documentele în fragmente, le transformăm în embeddings, le stocăm într-un vector database și, la fiecare întrebare, injectăm fragmentele potrivite în prompt.
03

Knowledge base

Bază de cunoștințeAlimentează: RAG

Colecția de surse pe care le „știe" asistentul — catalog de produse, prețuri, FAQ-uri, manuale, politici interne. Este sursa de adevăr din care se construiește fiecare răspuns. Cu cât e mai curată și mai completă, cu atât asistentul răspunde mai precis.

Apariție
Concept de suport clienți pre-AI; redefinit ca sursă pentru RAG din 2023.
În implementare
Importăm catalog, documente, FAQ-uri și manuale; le structurăm și le actualizăm periodic. Pachetul Starter acoperă până la 50 de documente; Business și Enterprise — knowledge base nelimitat.
04

Embeddings

Vectori semanticiStă la baza: RAG

Reprezentarea unui text sub formă de listă de numere (vector) care surprinde sensul, nu cuvintele exacte. Texte cu înțeles apropiat au vectori apropiați. Permite căutarea semantică: asistentul găsește fragmentul relevant chiar dacă utilizatorul folosește alte cuvinte decât documentul.

Apariție
Word2Vec — 2013; embeddings la nivel de propoziție/document, mainstream din 2022.
În implementare
Transformăm fiecare fragment din knowledge base în embeddings și le comparăm cu embedding-ul întrebării, pentru a regăsi cele mai relevante pasaje.
Termeni similariRAGVector database
05

Vector database

Bază de date vectorialăStochează: Embeddings

Bază de date optimizată pentru stocarea și căutarea rapidă a embeddings. Răspunde la întrebarea „care fragmente seamănă semantic cu această întrebare?" în milisecunde, chiar și la milioane de documente. Componenta de „memorie de lungă durată" a unui sistem RAG.

Apariție
Categorie consolidată în 2022–2023 (Pinecone, Weaviate, pgvector, Qdrant).
În implementare
Alegem soluția după volum și cerințe de hosting; pentru deployments EU/on-premise folosim variante self-hosted, conform GDPR.
Termeni similariEmbeddingsRAG
06

Fine-tuning

Ajustare finăAlternativă/complement la: RAG

Reantrenarea unui model pe exemple proprii, ca să adopte un stil, un format sau un comportament specific. Spre deosebire de RAG (care adaugă cunoștințe la momentul răspunsului), fine-tuning modifică modelul însuși. Util pentru ton și sarcini repetitive; mai costisitor de întreținut.

Apariție
Practică standard de transfer learning; aplicată comercial pe LLM-uri din 2023.
În implementare
Rezervat pachetului Enterprise, când brandul are nevoie de un model dedicat. Pentru majoritatea cazurilor, RAG + system prompt bine scris obțin rezultate similare, mai ieftin.
Termeni similariLLMRAGSystem prompt
07

System prompt

Prompt de sistemConfigurează: LLM

Setul de instrucțiuni invizibile pentru utilizator care fixează rolul, tonul, regulile și limitele asistentului înainte de orice conversație. Aici se definesc persona, ce are voie și ce nu are voie să spună, și cum escaladează. Coloana vertebrală a comportamentului.

Apariție
Mecanism standard al LLM-urilor de chat din 2022.
În implementare
Codificăm aici persona, guardrails și regulile de fallback. Un system prompt prost scris produce un asistent generic; unul bine scris înlocuiește, adesea, nevoia de fine-tuning.
08

Context window

Fereastră de contextLimită a: LLM

Cantitatea maximă de text (măsurată în tokenuri) pe care un model o poate procesa într-un singur schimb — incluzând instrucțiunile, istoricul conversației și documentele injectate. Când conversația o depășește, modelul „uită" partea cea mai veche dacă nu există un mecanism de memorie.

Apariție
Concept de la primele LLM-uri; ferestrele au crescut puternic din 2023.
În implementare
Gestionăm fereastra prin sumarizarea istoricului și prin RAG selectiv, ca să încapă doar contextul relevant — păstrând latența mică.

Conversație

09

Persona

Voce de brand · personalitate AIDefinită în: System prompt

Personalitatea distinctă a asistentului — ton, vocabular, replici-semnătură, mod de a reacționa la glume și obiecții. Transformă un FAQ animat într-un interlocutor care vorbește ca brandul. Diferența între un chatbot generic și un asistent care chiar vinde stă, în primul rând, în persona.

Apariție
Disciplină de design conversațional consolidată odată cu asistenții AI generativi, 2023–2024.
În implementare
Definim persona într-un workshop cu echipa (Ziua 1): voce, public țintă, obiectiv. Exemple live: Dona (ironică, pharma), Hanna (consultativă, HVAC), Sierra (aventurieră, auto premium).
10

Conversație multi-turn

Multi-turn conversationNecesită: Memorie conversațională

Conversație care se desfășoară pe mai multe replici succesive, în care asistentul înțelege referirile la mesajele anterioare și completează informația lipsă întrebând natural. Opusul unui bot care tratează fiecare mesaj izolat și uită ce s-a spus cu o replică în urmă.

Apariție
Capabilitate-standard a asistenților LLM din 2022.
În implementare
Asistentul ține firul: dacă întrebi „și pentru menopauză?" după o discuție despre suplimente, înțelege la ce te referi, fără să reiei totul.
11

Memorie conversațională

Context / memoryActivează: Conversație multi-turn

Mecanismul prin care asistentul reține informația relevantă pe parcursul unei conversații (memorie de scurtă durată) sau între sesiuni (memorie de lungă durată). Permite continuitatea: utilizatorul nu trebuie să repete contextul, iar răspunsurile devin coerente de la o replică la alta.

Apariție
Tehnici de memorie pentru agenți conversaționali, mature din 2023.
În implementare
Combinăm istoricul recent al conversației cu RAG pe profil/istoric, păstrând doar ce e relevant ca să nu umplem context window.
12

Intent

IntențieOutput al: NLU

Scopul real din spatele unui mesaj — ce vrea de fapt utilizatorul, dincolo de cuvintele folosite. „Cât costă?", „aveți reduceri?" și „e scump?" pot avea aceeași intenție. Identificarea corectă a intenției determină dacă asistentul răspunde la întrebarea pusă sau la cea ratată.

Apariție
Concept central în chatbots clasici (din ~2016); reinterpretat de LLM-uri, care îl deduc fără reguli rigide.
În implementare
La asistenții moderni, intenția e dedusă de model în context, nu hardcodată într-un arbore de decizie — de aici flexibilitatea la întrebări nuanțate.
13

NLU

Natural Language UnderstandingDetectează: Intent

Capacitatea unui sistem de a înțelege limbajul natural — sensul, intenția și entitățile dintr-un mesaj scris liber, cu greșeli, argou sau formulări neașteptate. Componenta care diferențiază un asistent care „pricepe" de un meniu cu butoane care cere formulări exacte.

Apariție
Subdomeniu NLP cu istorie lungă; revoluționat de LLM-uri din 2022.
În implementare
La asistenții AI, NLU vine nativ din LLM: nu mai antrenăm clasificatoare de intenție separat, ci ne bazăm pe înțelegerea contextuală a modelului.
Termeni similariIntentLLM
14

Halucinație

HallucinationCombătut prin: Grounding

Răspuns care sună plauzibil și sigur pe sine, dar este fals sau inventat — un preț greșit, o politică inexistentă, o sursă fictivă. Cel mai mare risc de business al unui asistent AI: o halucinație distruge încrederea exact când clientul era gata să cumpere.

Apariție
Termen popularizat odată cu LLM-urile de larg consum, 2022–2023.
În implementare
O combatem prin RAG (ancorare în date reale), grounding, limite clare de cunoaștere și reguli de fallback: când nu știe, asistentul spune că nu știe și escaladează. Niciodată nu inventează.
15

Grounding

Ancorare în surseAntidot la: Halucinație

Practica de a obliga asistentul să-și construiască răspunsurile exclusiv din surse verificabile — documentele tale — și, ideal, să citeze de unde provine informația. Un răspuns „grounded" poate fi verificat; unul negrounded e doar o presupunere bine formulată a modelului.

Apariție
Principiu consolidat odată cu adopția RAG în producție, 2023.
În implementare
Configurăm asistentul să răspundă din knowledge base, nu din cunoștințe generice, și să recunoască explicit când o informație lipsește.
16

Guardrails

Limite de comportamentAplicate prin: System prompt

Regulile care stabilesc ce are voie și ce nu are voie să facă asistentul — subiecte interzise, ton obligatoriu, obligația de a nu inventa, de a nu se da drept om, de a escalada în anumite situații. „Linia roșie" care protejează brandul de un asistent scăpat de sub control.

Apariție
Disciplină de AI safety aplicată comercial din 2023.
În implementare
Liniile noastre roșii: nu construim asistenți fără personalitate, nu permitem minciuna/halucinația, asistentul declară mereu că e AI, procesăm date doar GDPR conform.
17

Fallback

Comportament de rezervăDeclanșează: Handoff

Ce face asistentul când ajunge la limita cunoștințelor sau a competenței sale. În loc să inventeze, execută un plan prestabilit: spune că nu știe și sugerează contact uman, escaladează automat la un agent live, sau colectează datele de contact și promite revenire.

Apariție
Concept de design conversațional, esențial în era halucinațiilor.
În implementare
Definim exact varianta de fallback per brand, în faza de Discovery. Fallback-ul bun e invizibil pentru client — pare grijă, nu eșec.

Operațiuni & integrare

18

Handoff

Escaladare la agent umanUrmează: Fallback

Transferul conversației de la asistentul AI către un agent uman, păstrând tot contextul intact — istoricul, întrebarea și datele colectate. Clientul nu o ia de la capăt. Se declanșează când conversația depășește scopul AI-ului sau când sentimentul indică frustrare.

Apariție
Funcție-standard în platformele de customer engagement; integrată cu AI din 2023.
În implementare
Disponibil din pachetul Business. Transferul e instant și complet — agentul preia exact de unde a rămas asistentul.
19

Lead capture & calificare

Generare și calificare lead-uriAlimentează: Integrare CRM

Colectarea datelor de contact prin conversație naturală (nu formular sec) și calificarea prospectului după criteriile tale — buget, nevoie, moment — înainte de a-l trimite echipei de vânzări. Asistentul transformă vizitatori curioși în cereri de ofertă calificate, fără efort uman.

Apariție
Practică de marketing automation reinventată conversațional din 2023.
În implementare
Asistentul întreabă firesc, califică după regulile tale și trimite lead-ul direct în CRM. Disponibil din pachetul Business.
20

Integrare CRM

CRM integrationPrimește de la: Lead capture & calificare

Conectarea asistentului la sistemul de management al relațiilor cu clienții, astfel încât lead-urile, conversațiile și sentimentul ajung automat acolo unde lucrează echipa. Elimină copy-paste-ul manual și asigură că niciun prospect generat de asistent nu se pierde.

Apariție
Integrări native AI–CRM, mature din 2023–2024.
În implementare
Conectăm HubSpot, Pipedrive, Salesforce, Monday sau API custom (Enterprise). Lead-ul, transcriptul și scorul ajung în pipeline-ul corect.
21

Sentiment analysis

Analiză de sentimentInput pentru: Handoff

Detectarea automată a tonului emoțional al conversației — mulțumit, neutru, frustrat. Permite asistentului să-și adapteze răspunsul și să escaladeze la un om înainte ca un client nemulțumit să plece. La nivel agregat, arată ce subiecte generează frustrare recurentă.

Apariție
Tehnică NLP clasică, integrată în dashboards conversaționale moderne.
În implementare
Sentimentul alimentează decizia de handoff și ajunge în dashboard-ul de analytics, ca date acționabile — nu rapoarte moarte.
Termeni similariHandoffIntegrare CRM
22

Latență

LatencyMetrică de performanță

Timpul scurs între întrebarea utilizatorului și primul răspuns al asistentului. Latența mare ucide conversația: clientul percepe ezitarea ca pe o defecțiune. Obiectivul practic pentru un asistent de business este un răspuns perceput ca aproape instant.

Apariție
Metrică universală de performanță; critică pentru UX conversațional.
În implementare
Optimizăm latența per canal; ținta operațională este răspuns sub 3 secunde. Alegerea modelului și gestiunea context window sunt principalele pârghii.
Termeni similariLLMContext window
23

Canal conversațional

ChannelWeb / WhatsApp / Messenger

Locul în care trăiește asistentul și vorbește cu clienții — widget pe website, WhatsApp Business, Facebook Messenger, Instagram Direct. Aceeași persona, aceleași cunoștințe, pe orice canal. Pentru piața din România, WhatsApp este adesea canalul preferat de comunicare cu brandurile.

Apariție
Strategie omnichannel adaptată asistenților AI, 2023–2024.
În implementare
Widget embed pe orice tehnologie de site (fără reinginerie), plus WhatsApp Business API, Messenger și Instagram din pachetul Business. Răspuns 24/7, aceeași voce peste tot.

Conformitate

24

GDPR & data retention

Conformitate cu protecția datelorAcoperă toate categoriile

Cadrul legal european care reglementează cum sunt colectate, procesate, stocate și șterse datele personale ale utilizatorilor unui asistent conversațional. Include locul procesării, criptarea, consimțământul explicit și durata de păstrare (retention). Pentru companii serioase, conformitatea nu e opțională.

Apariție
GDPR în vigoare din 25 mai 2018; aplicat la sistemele AI conversaționale de la adopția lor.
În implementare
Procesăm datele în EU, cu criptare end-to-end și consimțământ explicit la începutul sesiunii. Retention configurabil. Nu folosim datele tale pentru antrenarea unor modele publice.

Întrebări frecvente

04 · FAQ

Care e diferența între un chatbot clasic și un asistent AI conversațional?

Un chatbot clasic funcționează pe arbori de decizie: butoane, meniuri și răspunsuri pre-scrise, declanșate de cuvinte-cheie exacte. Un asistent AI conversațional folosește un LLM care înțelege limbaj natural (NLU), ține minte contextul (conversație multi-turn), deduce intenția reală și răspunde nuanțat. Primul cere formulări exacte; al doilea pricepe ce vrei chiar dacă întrebi imperfect.

Ce este RAG și de ce contează pentru un chatbot de business?

RAG (Retrieval-Augmented Generation) este tehnica prin care asistentul caută mai întâi fragmentele relevante din documentele tale și abia apoi formulează răspunsul, ancorat în acele surse. Contează pentru că este principala metodă de a preveni halucinațiile: asistentul răspunde din knowledge base-ul tău real, nu din cunoștințe generice, deci nu inventează prețuri sau politici inexistente.

Cum împiedicați un asistent AI să inventeze informații (să halucineze)?

Prin patru mecanisme combinate: RAG și grounding (răspunsul se construiește doar din surse verificabile), limite clare de cunoaștere setate în system prompt, guardrails care interzic afirmațiile nesusținute, și reguli de fallback prin care, când nu știe, asistentul spune că nu știe și escaladează către un om. Niciodată nu permitem inventarea răspunsurilor.

Ce înseamnă fine-tuning și am nevoie de el?

Fine-tuning înseamnă reantrenarea modelului pe exemple proprii, ca să adopte un stil sau comportament specific. Pentru majoritatea proiectelor nu e necesar: o persona bine definită în system prompt, plus RAG pe documentele tale, obțin rezultate similare la cost mult mai mic. Fine-tuning-ul devine relevant la nivel Enterprise, când brandul are nevoie de un model dedicat.

Pe ce canale poate funcționa asistentul?

Pe widget integrat în website (orice tehnologie, fără reinginerie), pe WhatsApp Business, pe Facebook Messenger și Instagram Direct. Aceeași persona și același knowledge base peste tot, cu răspuns 24/7. Pentru piața românească, WhatsApp este frecvent canalul preferat de comunicare cu brandurile.

Datele clienților sunt în siguranță și conforme GDPR?

Da. Toate datele se procesează în EU, cu criptare end-to-end și consimțământ explicit cerut la începutul fiecărei sesiuni. Durata de păstrare (retention) este configurabilă după cerințele tale, iar datele tale nu sunt folosite pentru antrenarea unor modele publice. Vezi termenul GDPR & data retention pentru detalii.

Surse · următori pași

Surse: paper RAG (Meta AI, 2020), documentația modelelor GPT-4o și Claude, Regulamentul (UE) 2016/679 (GDPR), observații proprii Websem din implementări 2024–2026.

Construim asistenți conversaționali cu personalitate distinctă, antrenați pe datele tale, live pe website, WhatsApp și Messenger.

Vezi serviciul