[D] Советы по подготовке к пост-обучению / тонкой настройке больших языковых моделей (LLM)?

2025-11-18 14:21:05

Краткое содержание

Привет всем, Те, кто следит за тонкой настройкой больших языковых моделей (LLM), возможно знают, что существует компания под названием Nous Research, выпускающая серию настроенных моделей под названием Hermes, которые демонстрируют отличные результаты. Поскольку постобучение обходится дешевле, чем предварительное обучение, я также хочу заняться постобучением и тонкой настройкой. Учитывая ограниченность моих ресурсов — у меня есть лишь MacBook Pro M4 и несколько кредитов от Tinker, — хотел бы узнать ваши советы и рекомендации относительно начала работы над постобучением. Например, считаете ли вы эту книгу https://www.manning.com/books/the-rlhf-book хорошим стартовым материалом? Если нет, какие другие материалы порекомендуете? Также сейчас читаю книги «Практическое руководство по большим языковым моделям» («Hands-on LLM») и «Создаем большую языковую модель с нуля». Возможно, эта информация поможет вам ответить. Большое спасибо за уделённое время! отправлено /u/hedgehog0 [ссылка] [комментарии]

Полный текст статьи пока не загружен.

Читать оригинал статьи