создал инструмент с открытым исходным кодом для выявления регрессий у агентов ИИ. полезен также для дипломных и студенческих проектов
Краткое содержание
если вы когда-либо создавали чат-бота, приложение RAG или любой проект на основе ИИ, где что-то работало один раз, а потом сломалось после изменения промпта, модели, набора данных или системы извлечения — этот инструмент для вас. replayd разработан именно для таких случаев: вы фиксируете неудачный запуск, сохраняете его как регрессионный тест и воспроизводите перед каждым новым изменением. Если сбой повторяется — он ловит его. Подходит для студенческих проектов, небольших прототипов и производственных систем. Версия 0.1.2, устанавливается через pip, без runtime-зависимостей. pip install replaydgithub.com/taimoorkhan10/replayd на начальном этапе, с грубыми краями, но основной цикл работает. Если вы попробуете его использовать в проекте — сообщите, что сломалось. предоставлено пользователем /u/taimoorkhan10 [ссылка] [комментарии]
Полный текст статьи пока не загружен.