Remote Labor Index: ведущие ИИ-агенты справились с 2.5% реальных задач с биржи фрилансеров

2025-11-04 19:33:24

Краткое содержание

Команда исследователей из Center for AI Safety и Scale AI опубликовала Remote Labor Index (RLI) — первый бенчмарк, который проверяет, могут ли ИИ-агенты делать настоящую работу фрилансеров. Они собрали 240 реальных проектов с Upwork — от создания игр до архитектурных чертежей. Результаты показывают, что даже самые продвинутые ИИ выполняют только 2.5% задач на уровне, приемлемом […]Source:Remote Labor Index: ведущие ИИ-агенты справились с 2.5% реальных задач с биржи фрилансеров

Полный текст статьи пока не загружен.

Читать оригинал статьи