← Вернуться к списку

Рефлексия 70B (mattshumer/reflection-70b)

Краткое содержание

Reflection Llama-3.1 70B обучена с использованием новой техники под названием Reflection-Tuning, которая позволяет модели обнаруживать ошибки в собственных рассуждениях и корректировать ход решения. Модель была обучена на синтетических данных.

Полный текст статьи пока не загружен.