Ко-Адаптация: переосмысление адаптации как двунаправленной когнитивной адаптации человека и ИИ
Краткое содержание
arXiv:2509.12179v5 Тип объявления: замена Аннотация: Текущий подход к выравниванию ИИ с помощью обучения с подкреплением на основе обратной связи от человека следует однонаправленной парадигме, при которой ИИ адаптируется под предпочтения людей, рассматривая человеческое познание как фиксированное. Мы предлагаем переход к совместному выравниванию через двунаправленное когнитивное выравнивание (BiCA), где люди и ИИ взаимно приспосабливаются друг к другу. BiCA использует обучаемые протоколы, отображение представлений и ограничения бюджета Kullback-Leibler для контролируемой совместной эволюции. В задаче совместного навигационного поиска BiCA достигла успеха в 85,5% случаев по сравнению с базовым уровнем в 70,3%, продемонстрировав улучшение взаимной адаптации на 230% и конвергенции протоколов на 332%. Возникшие протоколы превзошли вручную созданные на 84%, а двунаправленная адаптация неожиданно повысила безопасность (+23% устойчивости вне распределения данных). Улучшение синергии на 46% демонстрирует, что оптимальное сотрудничество достигается не путем объединения возможностей человека и ИИ, а именно на их пересечении, подтверждая необходимость перехода от однонаправленных подходов к парадигмам совместного выравнивания.
Полный текст статьи пока не загружен.