P-ReMIS: Практическое рассуждение в области психического здоровья и социальные последствия
Краткое содержание
arXiv:2507.23247v2 Тип объявления: замена Аннотация: Хотя понятность и интерпретируемость получили значительное внимание в области искусственного интеллекта (ИИ) и обработки естественного языка (НЛП), применительно к вопросам психического здоровья, способность к рассуждению изучена недостаточно глубоко. Устранение данного пробела является необходимым условием для объединения НЛП и вопросов психического здоровья через интерпретируемые и способные рассуждать системы ИИ. В этой связи мы исследуем возможности прагматического рассуждения больших языковых моделей (БЯМ) в сфере психического здоровья. Мы представляем набор данных PRiMH и предлагаем задачи прагматического рассуждения в области психического здоровья, основанные на явлениях импликатуры и пресуппозиции. В частности, мы формулируем две задачи на импликатуру и одну задачу на пресуппозицию. Для оценки набора данных и предложенных задач мы рассматриваем четыре модели: Llama3.1, Mistral, MentaLLaMa и Qwen. Результаты экспериментов показывают, что модели Mistral и Qwen демонстрируют значительные способности к рассуждению в данной предметной области. Далее мы изучаем...
Полный текст статьи пока не загружен.