SMRC: Приведение больших языковых моделей в соответствие с рассуждениями учащихся для исправления математических ошибок
Краткое содержание
arXiv:2511.14684v1 Тип объявления: новое Аннотация: Большие языковые модели (LLM) часто допускают ошибки в рассуждениях при решении математических задач, и автоматическое обнаружение и исправление этих ошибок стало важным направлением исследований. Однако существующие подходы \textit{в основном сосредоточены на самокоррекции внутри самой модели}, что не соответствует требованиям "учительского стиля" коррекции, используемого в образовательных учреждениях, то есть систематическому руководству и пересмотру процесса решения задачи учащимся. Для устранения этого пробела мы предлагаем метод \texttt{SMRC} (\textit{\underline{S}tudent \underline{M}athematical \underline{R}easoning \underline{C}orrection}) — новый подход к согласованию LLM с логикой рассуждений учащихся. В частности, \texttt{SMRC} представляет процесс рассуждений ученика как многошаговую последовательную задачу принятия решений и использует поиск по дереву методом Монте-Карло (MCTS) для поиска оптимальных путей исправления. Чтобы снизить затраты на аннотирование вознаграждений на уровне шагов, мы применяем направляемый поиском в ширину (BFS)
Полный текст статьи пока не загружен.