Glossaire
Définitions claires pour acheteurs et praticiens.
RAG (Retrieval-Augmented Generation)
Combine la recherche documentaire et la génération LLM pour des réponses citées.
Embedding (plongement)
Représentation vectorielle numérique du texte pour la recherche sémantique.
Base de données vectorielle
Stocke les embeddings pour une recherche rapide des plus proches voisins (ex. Qdrant).
Grand modèle de langage (LLM)
Modèle neuronal générant du texte à partir de prompts ; KobiGPT utilise Gemini par défaut.
Affinage (fine-tuning)
Entraîner un modèle de base sur des données propres ; souvent plus coûteux que le RAG pour les PME.
Ingénierie de prompts
Conception d’instructions et de contexte pour un comportement fiable du modèle.
Découpage (chunking)
Découpage des documents en segments avant embedding (ex. 512 jetons).
Similarité cosinus
Métrique comparant les angles vectoriels ; courante en recherche sémantique.
Index HNSW
Index graphique approximatif des plus proches voisins utilisé dans Qdrant.
Base de connaissances
Documents d’entreprise organisés et indexés pour les assistants.
Multi-locataire
Données isolées par entreprise sur une infrastructure partagée.
KVKK
Loi turque sur la protection des données personnelles ; pertinente pour l’IA PME.
GDPR
Règlement européen sur la protection des données ; à considérer pour le SaaS transfrontalier.
Token
Unité sous-mot facturée par les API LLM ; base des estimations Kobi Kredi.
Fenêtre de contexte
Nombre maximal de jetons que le modèle peut lire en une requête.
Hallucination
Sortie du modèle fausse mais assurée ; atténuée par les citations RAG.
Recherche sémantique
Recherche par le sens via embeddings plutôt que mots-clés seuls.
BM25
Classement lexical classique ; parfois hybride avec vecteurs.
Recherche hybride
Combine recherche par mots-clés et vecteurs pour un meilleur rappel.
Grounding (ancrage)
Ancrer les réponses aux sources récupérées.
Citation
Référence aux extraits de documents affichés avec les réponses.
Assistant de département
Chatbot délimité pour RH, juridique, ventes, etc.
Synchronisation Google Drive
Connecter des dossiers comme source de documents dans KobiGPT.
Gemini
Famille LLM de Google utilisée comme modèle de chat par défaut de KobiGPT.
OpenRouter
Passerelle API pour embeddings et modèles alternatifs.
Qdrant
Base vectorielle pour collections par entreprise.
BullMQ
File Redis pour les tâches d’embedding documentaire asynchrones.
Self-hosted
Exécuter KobiGPT sur votre infrastructure pour la résidence des données.
Kobi Kredi
Crédits d’usage mesurant les coûts IA et plateforme externes.
IA PME
Produits IA tarifés et conçus pour les petites et moyennes entreprises.
Chatbot
Interface conversationnelle sur votre base de connaissances.
IA entreprise
IA à l’échelle de l’organisation avec gouvernance, SSO et politiques.
On-premise
Logiciel déployé dans le réseau du client.
Résidence des données
Lieu géographique de stockage et de traitement des données.
PII (données personnelles)
Informations personnelles identifiables soumises au RGPD/KVKK.
Contrôle d’accès
Règles définissant qui peut lire ou discuter avec quels documents.
Accès basé sur les rôles
Rôles admin, manager et viewer dans KobiGPT.
Clé API
Secret pour authentifier les appels API programmatiques.
Webhook
Rappel HTTP pour intégrations et automatisation.
SSL/TLS
Chiffrement en transit pour le trafic web et API.