Провели бенчмаркинг четырех систем памяти агентов: Mem0 показывает возврат 49% (что хуже, чем случайное угадывание), а Zep использует в 340 раз больше токенов для улучшения на 15 пунктов. Вот что происходит на самом деле.

2026-04-15 13:47:02

Краткое содержание

Я изучал, как на самом деле AI-агенты для кодирования справляются с памятью — не то, что говорят в маркетинге, а то, что показывают код и бенчмарки. Вот что я обнаружил. Краткое резюме: любая система памяти агента в 2026 году либо слишком проста (не умеет искать), либо слишком дорога (600 тыс. токенов на разговор), либо слишком умна (тратит токены на управление памятью, а не на реальную работу). Настоящая нерешенная проблема — это не запоминание, а забывание.Как на самом деле работают основные системыClaude Code— ЧтениеCLAUDE.mdat начало сессии. Весь файл попадает в контекст. Нет векторной БД, нет семантического поиска. Автоматическая память (v2.1.59+) записывает заметки в markdown-файлы. Жесткий лимит: 200 строк для MEMORY.md, всё сверх этого бесшумно обрезается.Намеренно простая. Работает для небольших проектов. Разваливается на монорепозиториях с годами решений.Mem0 (48 тыс. звезд) — Декомпозирует взаимодействия на факты, хранит их в виде эмбеддингов, извлекает через семантический поиск. Звучит отлично, пока не посмотришь на цифры:Система|Длинная память|Оценка|Токены за разговорMem0|49.0%|~1,764Zep|63.8%|~600

Полный текст статьи пока не загружен.

Читать оригинал статьи