Рефлексия 70B (mattshumer/reflection-70b)

2024-09-06 00:00:00

Краткое содержание

Reflection Llama-3.1 70B обучена с использованием новой техники под названием Reflection-Tuning, которая позволяет модели обнаруживать ошибки в собственных рассуждениях и корректировать ход решения. Модель была обучена на синтетических данных.

Полный текст статьи пока не загружен.

Читать оригинал статьи