← Вернуться к списку

В направлении эффективного медицинского рассуждения с минимальным объемом данных тонкой настройки

Краткое содержание

arXiv:2508.01450v2 Тип объявления: замена Аннотация: Обучение с учителем тонкой настройки (Supervised Fine-Tuning — SFT) играет ключевую роль в адаптации больших языковых моделей (Large Language Models — LLMs) к специализированным областям, таким как медицинское рассуждение. Однако существующие методы SFT часто полагаются на нефильтрованные наборы данных, содержащие избыточные и низкокачественные выборки, что приводит к значительным вычислительным затратам и субоптимальной производительности. Хотя существующие подходы пытаются решить эту проблему путем отбора данных на основе сложности образцов, определяемой сложностью знаний и рассуждений, они игнорируют полезность оптимизации каждого образца, отраженную его градиентом. Интересно отметить, что влияние, основанное только на градиенте, благоприятствует образцам, которые легко оптимизировать и вызывают большие сдвиги параметров, но не обладают глубокими цепочками рассуждений; при этом сложность сама по себе выбирает шумные или чрезмерно сложные случаи, которые не могут обеспечить стабильную оптимизацию. На основании этого наблюдения мы предлагаем стратегию выбора данных под названием "Квадрант трудности-влияния" (Difficulty-Influence Quadrant — DIQ), которая отдает приоритет образцам в

Полный текст статьи пока не загружен.