Glosario
Definiciones claras para compradores y profesionales.
RAG (Retrieval-Augmented Generation)
Combina búsqueda en documentos con generación LLM para respuestas citadas.
Embedding (incrustación)
Representación vectorial numérica del texto para búsqueda semántica.
Base de datos vectorial
Almacena embeddings para búsqueda rápida de vecinos cercanos (p. ej. Qdrant).
Modelo de lenguaje grande (LLM)
Modelo neuronal que genera texto a partir de prompts; KobiGPT usa Gemini por defecto.
Ajuste fino (fine-tuning)
Entrenar un modelo base con datos propios; a menudo más caro que RAG para PYME.
Ingeniería de prompts
Diseño de instrucciones y contexto para un comportamiento fiable del modelo.
Fragmentación (chunking)
División de documentos en segmentos antes del embedding (p. ej. 512 tokens).
Similitud coseno
Métrica que compara ángulos vectoriales; común en búsqueda semántica.
Índice HNSW
Índice gráfico aproximado de vecinos más cercanos usado en Qdrant.
Base de conocimiento
Documentos empresariales curados e indexados para asistentes.
Multi-inquilino
Datos aislados por empresa en infraestructura compartida.
KVKK
Ley turca de protección de datos personales; relevante para IA en PYME.
GDPR
Reglamento europeo de protección de datos; considerar en SaaS transfronterizo.
Token
Unidad subpalabra facturada por APIs LLM; base de estimaciones Kobi Kredi.
Ventana de contexto
Máximo de tokens que el modelo puede leer en una solicitud.
Alucinación
Salida del modelo incorrecta pero confiada; mitigada con citas RAG.
Búsqueda semántica
Búsqueda por significado mediante embeddings, no solo palabras clave.
BM25
Clasificación léxica clásica; a veces híbrida con vectores.
Búsqueda híbrida
Combina búsqueda por palabras clave y vectores para mejor recuperación.
Grounding (fundamentación)
Anclar respuestas a fuentes recuperadas.
Cita
Referencia a fragmentos de documentos mostrados con las respuestas.
Asistente de departamento
Chatbot acotado para RR. HH., legal, ventas, etc.
Sincronización Google Drive
Conectar carpetas como fuente de documentos en KobiGPT.
Gemini
Familia LLM de Google usada como modelo de chat predeterminado de KobiGPT.
OpenRouter
Puerta de enlace API para embeddings y modelos alternativos.
Qdrant
Base de datos vectorial para colecciones por empresa.
BullMQ
Cola Redis para trabajos asíncronos de embedding de documentos.
Self-hosted
Ejecutar KobiGPT en su infraestructura para residencia de datos.
Kobi Kredi
Créditos de uso que miden costes externos de IA y plataforma.
IA para PYME
Productos de IA diseñados y tarifados para pequeñas y medianas empresas.
Chatbot
Interfaz conversacional sobre su base de conocimiento.
IA empresarial
IA organizacional con gobernanza, SSO y políticas.
On-premise
Software desplegado dentro de la red del cliente.
Residencia de datos
Ubicación geográfica donde se almacenan y procesan los datos.
PII (datos personales)
Información personal identificable sujeta a RGPD/KVKK.
Control de acceso
Reglas sobre quién puede leer o chatear con qué documentos.
Acceso basado en roles
Roles admin, manager y viewer en KobiGPT.
Clave API
Secreto para autenticar llamadas API programáticas.
Webhook
Callback HTTP para integraciones y automatización.
SSL/TLS
Cifrado en tránsito para tráfico web y API.