Существуют ли стандартизированные формы теста Тьюринга?
Краткое содержание
Большинство преподавателей информатики скажут вам, что тест Тьюринга — скорее теоретический или концептуальный мысленный эксперимент, чем реальный экзамен, который кто-то (или что-то!) может формально сдать и получить оценку. Этот тезис подтверждается в одном из обсуждений на AI Stack Exchange. Учитывая всё это, были ли попытки создать стандартизированную форму теста Тьюринга, которую можно было бы широко внедрить для оценки различных конструкций ИИ? Конечно, ни одна такая система не сможет считаться «Единственным Истинным Тестом Тьюринга» (TM), но, возможно, они найдут применение в исследованиях — как способ сравнения алгоритмов или оценки работ студентов. Я понимаю, что изначально тест требует человеческого судьи. Также я отмечаю, что такой подход оставляет оценку того, является ли испытуемый роботом, исключительно на усмотрение конкретного проверяющего — а это не масштабируемо. Мне представляется система
Полный текст
Задан 4 года, 5 месяцев назад Изменён сегодня Просмотрено 91 раз
Задан 4 года, 5 месяцев назад
4 $\begingroup$ Большинство преподавателей информатики скажут вам, что тест Тьюринга — это скорее теоретическое или концептуальное мысленное эксперимент, чем реальный экзамен, который кто-либо (или что-то!) может формально сдать и получить оценку. Обсуждение на AI Stack Exchange подтверждает это. Учитывая всё вышесказанное, были ли попытки создать стандартизированную форму теста Тьюринга, которую можно было бы широко внедрить для оценки различных конструкций ИИ? Очевидно, ни одна из таких систем тестирования не может считаться «Единственным Истинным Тестом Тьюринга» (TM), но возможно, они могут занять своё место в исследованиях — как способ сравнения или классификации различных алгоритмов либо оценки работ студентов. Я понимаю, что изначально тест предполагает наличие человека-эксперта. Также отмечу, что сам по себе он оставляет оценку того, является ли испытуемый роботом, исключительно на усмотрение конкретного оценщика — чего недостаточно для масштабирования. Мне представляется некоторая форма «Теста Тьюринга Лайт» или «Частично автоматизированного масштабируемого квазитест Тьюринга» («PASQTT»), который можно было бы широко внедрить и применять по запросу в отношении чат-ботов, лиц, подозреваемых в использовании ботов, либо даже обычных людей, желающих убедиться, что они не звучат как робот. Подойдёт либо полностью автоматизированный тест (например, просто вход, возможно, оплата небольшой платы за прохождение или подключение интерфейса теста к вашему чат-боту), либо стандартизированная система с подготовленными экспертами-человеками (в духе экзаменов медицинских советов XXI века), применяющими единые письменные критерии оценки — при условии, что критерии прохождения стандартизированы и не зависят от суждений неподготовленных лиц или случайных прохожих. Например, я представляю себе, как аспирант бормочет следующее: «Моя конструкция ИИ проходит тест Тьюринга Джонсона-Смитта (1992) и Хименеса-Дорфера (2017), но всё ещё не справляется с продвинутым элитным тестом Такахаши-2003. В чём моя ошибка? Может, стоит подправить эту процедуру здесь [нажато]. Дьявол! Всё равно не проходит». реализация тестирование ИИ тест Тьюринга оценка Share Improve this question Follow edited 45 минут назад asked Oct 15, 2021 at 18:05 Robert Columbia 141 6 6 бронзовых значков $\endgroup$ Добавить комментарий | 0 Отсортировано по: Сбросить настройки Наибольший балл (по умолчанию) Дата изменения (новее сначала) Дата создания (старше первым) Вы должны войти, чтобы ответить на этот вопрос. Начните задавать вопросы — получите ответы Найдите ответ на свой вопрос, задавая его. Задать вопрос Исследуйте связанные вопросы реализация тестирование ИИ тест Тьюринга оценка Посмотрите похожие вопросы с этими тегами.