← Вернуться к списку
Remote Labor Index: ведущие ИИ-агенты справились с 2.5% реальных задач с биржи фрилансеров
Краткое содержание
Команда исследователей из Center for AI Safety и Scale AI опубликовала Remote Labor Index (RLI) — первый бенчмарк, который проверяет, могут ли ИИ-агенты делать настоящую работу фрилансеров. Они собрали 240 реальных проектов с Upwork — от создания игр до архитектурных чертежей. Результаты показывают, что даже самые продвинутые ИИ выполняют только 2.5% задач на уровне, приемлемом […]Source:Remote Labor Index: ведущие ИИ-агенты справились с 2.5% реальных задач с биржи фрилансеров
Полный текст статьи пока не загружен.