memoria-contextual-funciona
Cuando alguien dice que un agente "se acuerda" del cliente, la mayoría imagina una IA mística que acumula todo. No es eso. Memoria de agente es arquitectura — dos mecanismos distintos trabajando juntos, cada uno con una función clara.
Los dos tipos de memoria
Todo agente serio tiene:
- Memoria de corto plazo (ventana de contexto). El historial de los últimos N turnos de la conversación actual, mandado directo al modelo en cada llamada.
- Memoria de largo plazo (hechos persistidos). Hechos específicos sobre el member guardados en base de datos, recuperados bajo demanda en conversaciones futuras.
Confundir las dos es la causa principal de agentes que "olvidan" o "inventan".
Memoria de corto plazo (ventana)
Todo modelo de lenguaje tiene un límite de contexto — gpt-4o-mini soporta 128k tokens, Claude Sonnet 200k. Parece mucho, pero si metes el historial crudo de una conversación larga, el costo explota y la calidad cae (el modelo pierde atención en contexto gigante).
En Member AI, la ventana de corto plazo guarda los últimos 15 turnos crudos + un resumen de los 15 anteriores. Cada 30 turnos el resumen se actualiza. Eso mantiene el costo en niveles previsibles sin que el agente pierda el hilo de la conversación.
Memoria de largo plazo (hechos)
Acá vive la magia que no es magia. Cada conversación que termina, el agente corre un proceso en background que extrae hechos estructurados sobre el member:
- "Carla es creator de educación financiera, foco en mujeres de 30-45";
- "Tiene 12.300 seguidores en Instagram, 800 alumnas en la comunidad paga";
- "Cumplió meta de Q1 2026 (40 clientes nuevos)";
- "Prefiere responder en tono coloquial, sin formalismo";
- "Horario preferido para call: martes/jueves, mañana".
Esos hechos quedan en una base relacional por hub, con tags. Cuando el member vuelve, el agente no carga todos en el prompt — hace retrieval solo de los relevantes para el contexto actual.
Cómo hacemos retrieval sin inflar el prompt
Lo ingenuo sería usar vector search con embeddings en todo (técnica conocida como RAG). Funciona, pero es caro y lento. Nosotros hacemos híbrido:
- Búsqueda por tag en la base relacional — si la conversación mencionó "OKR" o "planificación", trae hechos con tag "metas";
- Vector search solo en hechos de texto abierto que no tienen tag clara;
- Re-ranking por relevancia temporal — un hecho reciente pesa más que uno viejo.
Al final, entran al prompt del turno como mucho 8-12 hechos relevantes. Costo bajo, calidad alta.
Qué debe olvidar el agente
Tan importante como recordar es olvidar. Activamente no guardamos:
- Contraseñas, datos de tarjeta, identificadores fiscales sensibles (aunque el member los mande);
- Hechos contradictorios — cuando un hecho nuevo contradice uno viejo, el viejo se marca como superseded;
- Hechos con más de 18 meses sin uso, que se archivan (recuperables, pero fuera del retrieval default).
Control del member sobre la memoria
Principio que seguimos: el member es dueño del dato. En el panel del hub, el creator activa un comando en el agente — el member puede decir "¿qué recuerdas de mí?" y el agente muestra la lista de hechos persistidos. Puede pedir olvidar cualquier ítem: el hecho se borra en tiempo real.
Memoria sin control es vigilancia. Memoria con control es relación. Nos importa que el member sepa que es relación.
Mira la memoria contextual en acción
14 días gratis. Configura un agente, manda 3 conversaciones distintas — en la cuarta ves al agente traer contexto.
Probar ahora
Lee más en memberai.pro/es/blog/memoria-contextual-funciona.
Saber más: planes y precios · sobre Member AI · casos reales · blog completo.