Главная - AST-AIHub

3 вопроса: плюсы и минусы синтетических данных в искусственном интеллекте

2025-09-03 04:00:00

Искусственно созданные данные предлагают преимущества — от экономии затрат до сохранения конфиденциальности, однако их ограничения требуют тщательного планирования и оценки, утверждает Калаян Вирамачани.

Читать оригинал Подробнее

Снизьте затраты на развертывание моделей, сохранив производительность благодаря обмену памятью GPU

2025-09-02 18:44:27

Развертывание крупных языковых моделей (LLM) в промышленных масштабах представляет собой двойную проблему: обеспечение быстрого отклика во время пиковых нагрузок при одновременной оптимизации расходов на GPU...

Читать оригинал Подробнее

ByteDance: Seed OSS 36B Instruct (Seed OSS 36B Инструкции от ByteDance)

2025-09-02 17:38:24

Seed-OSS-36B-Instruct — это языковая модель рассуждений с инструкциями, содержащая 36 миллиардов параметров, разработанная командой Seed компании ByteDance и выпущенная под лицензией Apache-2.0. Модель оптимизирована для выполнения общих инструкций и демонстрирует высокую производительность в област...

Читать оригинал Подробнее

Познакомьтесь с вашим новым помощником в учебе: stackoverflow.ai

2025-09-02 17:00:00

Этот инструмент на основе ИИ позволяет мгновенно получать ответы, учиться в процессе работы и открывает путь в сообщество Stack Overflow.

Читать оригинал Подробнее

Deep Cogito: Предварительный просмотр Cogito V2 Llama 70B (deepcogito/cogito-v2-preview-llama-70b)

2025-09-02 16:49:44

Cogito версии 2 с размером модели 70 миллиардов параметров — это плотная гибридная модель рассуждений, объединяющая возможности прямого ответа с продвинутым самоанализом. Построенная с использованием итерационного улучшения политики, она демонстрирует высокую производительность в различных задачах р...

Читать оригинал Подробнее

Когито В2 Превью Ллама 109Б (deepcogito/cogito-v2-preview-llama-109b-moe)

2025-09-02 16:46:08

Инструкция-настроенная гибридная модель рассуждений типа смесь-экспертов, построенная на основе архитектуры Llama-4-Scout-17B-16E. Cogito v2 способна давать прямые ответы либо запускать расширенную фазу «размышления», при этом согласование поведения осуществляется методом итерационной дистилляции и ...

Читать оригинал Подробнее

Deep Cogito: Предварительный просмотр Cogito V2 от Deepseek 671B (deepcogito/cogito-v2-preview-deepseek-671b)

2025-09-02 16:35:49

Cogito v2 — это многоязычная, настроенная на выполнение инструкций модель типа смесь экспертов (MoE), содержащая 671 миллиард параметров. Модель поддерживает как стандартный режим генерации текста, так и основанный на рассуждениях. Введён гибридный подход к рассуждению через метод итерационной дисти...

Читать оригинал Подробнее

Почему небольшие языковые модели являются ключом к масштабируемому агентному искусственному интеллекту

2025-08-29 18:00:42

Быстрое развитие агентной ИИ-технологии кардинально изменило подход предприятий, разработчиков и целых отраслей к автоматизации и цифровой производительности. От программного обеспечения…

Читать оригинал Подробнее

Что представляет собой $k$, и есть ли преимущество в увеличении $k$ при обучении?

2025-08-29 13:18:28

В машинном обучении ИИ мы умножаем матрицы $n \times k$ и $k \times m$. Я нашел источники, где $k$ представляет собой порядок от 10000 до 20000. Что такое $k$, и есть ли преимущество в машинном обучении при увеличении $k$, например, до $10^5 - 10^6$(при условии, что это можно вычислить)?

Читать оригинал Подробнее

ШагФункция: Шаг 3 (stepfun-ai/step3)

2025-08-28 21:09:35

Шаг 3 — передовая мультимодальная модель рассуждений, построенная на архитектуре смеси экспертов с общим количеством параметров 321 млрд и активным числом 38 млрд. Она разработана от начала до конца таким образом, чтобы минимизировать затраты на декодирование, обеспечивая при этом выдающиеся результ...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)