Memory Systems for AI

TL;DR

AI memory enables personalization and context retention across conversations. Session memory is raw message history, short-term is compressed summaries, long-term stores facts about entities, and episodic tracks timestamped events. Production systems need all four types.

Visual Overview

Without Memory

Business cost of no memory:

Support: 40% of tickets are repeat issues (wasted agent time)
Sales: Lost context = lost deals ($50K avg deal, 15% close rate drop)
Product: Users churn when AI “forgets” them (12% higher churn)

Memory is not a feature. Memory is table stakes.

Memory Types

The Critical Distinction

Long-term vs Episodic

Memory Operations

WRITE — When & What Gets Stored

Trigger	What to Store	Memory Type
User states fact	Extracted fact	Long-term
User states preference	Preference + confidence	Long-term
Conversation ends	Summary of key points	Short-term
Significant event	Event + timestamp	Episodic
Entity mentioned	Entity attributes	Long-term

Extraction prompt example:

Extraction Prompt

READ — Retrieval Strategies

Strategy	How	When to Use
Recency	Last N memories	Continuation context
Relevance	Semantic similarity search	Topic-specific recall
Temporal	”Last week”, “In March”	Time-referenced query
Entity	All facts about X	Entity-focused task
Hybrid	Relevance + Recency boost	General retrieval

Retrieval prompt injection:

Retrieval Prompt Injection

FORGET — Critical for Production

Mechanism	Trigger	Implementation
Explicit delete	User requests “forget X”	Hard delete + audit
Contradiction	New fact contradicts old	Update, keep history
Decay	Memory not accessed in N	Reduce retrieval weight
Consolidation	Many similar memories	Merge into summary
TTL	Retention policy expiry	Hard delete
GDPR request	”Right to be forgotten”	Full user purge

Memory Conflicts

Architecture Patterns

Implementation Checklist

When This Matters

Situation	What to implement
Simple chatbot	Session buffer only
Customer support	+ Summaries + User facts
Sales assistant	+ Episodic (deal history matters)
Personal assistant	Full stack with long-term memory
Enterprise deployment	+ Compliance, audit, deletion
Multi-turn conversations	Session + summarization
Personalization	Long-term user preferences
”Remember when” queries	Episodic memory required