Искусственный интеллект сквозь призму человеческого восприятия: исследование когнитивных теорий в психологии машин
Краткое содержание
arXiv:2506.18156v2 Тип объявления: замена Аннотация: Мы исследуем, демонстрируют ли большие языковые модели (LLM) когнитивные паттерны, схожие с человеческими, согласно четырем устоявшимся психологическим подходам: Тематический апперцептивный тест (ТАТ), предвзятость восприятия рамок, теория моральных основ (МТО) и когнитивный диссонанс. Используя структурированные подсказки и автоматизированную оценку, мы протестировали несколько проприетарных и открытых моделей. Наши результаты показывают, что эти модели часто генерируют связные повествования, подвержены положительной интерпретации контекста, проявляют моральное суждение, соответствующее проблемам Свободы/Подавления, и демонстрируют само-противоречия, смягченные обширной рационализацией. Такое поведение отражает человеческие когнитивные тенденции, однако оно формируется особенностями тренировочных данных и методов выравнивания. Обсуждаются последствия полученных результатов для прозрачности ИИ, этического внедрения технологий и дальнейших исследований, объединяющих когнитивную психологию и безопасность ИИ.
Полный текст статьи пока не загружен.