Главная - AST-AIHub

Qwen: QwQ 32B (qwen/qwq-32b) Квен: КвК 32Б (квен/квк-32б)

2025-03-05 21:06:54

QwQ — это модель рассуждений серии Qwen. В отличие от традиционных моделей, настроенных на выполнение инструкций, QwQ, способная мыслить и рассуждать, демонстрирует значительно улучшенные результаты в последующих задачах, особенно сложных проблемах. QwQ-32B является моделью среднего размера для расс...

Читать оригинал Подробнее

Квен: Квэн 2.5 32Б Инструкшн (qwen/qwen2.5-32b-instruct)

2025-03-03 22:59:04

Qwen2.5 32B Instruct — это вариант модели серии больших языковых моделей Qwen последнего поколения, настроенный на выполнение инструкций. Модель обладает улучшенными возможностями выполнения команд, повышенной эффективностью в кодировании и математическом рассуждении, а также устойчиво обрабатывает ...

Читать оригинал Подробнее

Разное #47

2025-03-02 07:03:29

Моделирование и проектирование генома ИИ во всех областях жизни с помощью Evo 2 Microsoft расхваливает ещё одну генеративную модель ИИ, но не объясняет, как именно она поможет разработчикам OthelloGPT освоил набор эвристик Vibe Coding — новая система мироустройства Робототехника: Как застави...

Читать оригинал Подробнее

MoonshotAI: Moonlight 16B A3B Инструкшн (moonshotai/moonlight-16b-a3b-instruct)

2025-02-28 05:16:41

Moonlight-16B-A3B-Instruct — это языковая модель типа смесь-экспертов (MoE), разработанная компанией Moonshot AI и содержащая 16 миллиардов параметров. Она оптимизирована для выполнения инструкций с активацией 3 миллиардов параметров на каждый вывод. Модель улучшает границу Парето по производительно...

Читать оригинал Подробнее

Nous: DeepHermes 3 Llama 3 8B Предварительный просмотр (nousresearch/deephermes-3-llama-3-8b-preview)

2025-02-28 05:09:32

Предварительная версия DeepHermes 3 — новейшая итерация нашей флагманской серии моделей машинного обучения Hermes от Nous Research и одна из первых моделей в мире, объединяющих рассуждения (длинные цепочки мыслей, повышающие точность ответов) и обычные режимы работы языковой модели в одной архитекту...

Читать оригинал Подробнее

OpenAI: GPT-4.5 (Превью-версия) (openai/gpt-4.5-preview)

2025-02-27 20:23:30

GPT-4.5 (Предварительный просмотр) — исследовательская версия новейшей языковой модели от OpenAI, предназначенная для повышения возможностей в области рассуждений, творчества и ведения многоходовых диалогов. Она основана на предыдущих итерациях с улучшениями в области знаний о мире, контекстной связ...

Читать оригинал Подробнее

Начните создавать с Gemini 2.0 Flash и Flash-Lite.

2025-02-25 18:02:12

Gemini 2.0 Flash-Lite теперь доступен в основном для использования в Gemini API в Google AI Studio и для корпоративных клиентов на Vertex AI.

Читать оригинал Подробнее

Гугл: Джемини 2.0 Флэш Лайт (google/gemini-2.0-flash-lite-001)

2025-02-25 17:56:52

Gemini 2.0 Flash Lite обеспечивает значительно меньшее время до получения первого токена (TTFT) по сравнению с Gemini Flash 1.5, при этом сохраняет качество на уровне больших моделей вроде Gemini Pro 1.5, предлагая крайне экономичные цены за токены.

Читать оригинал Подробнее

«Яндекс» выложил в открытый доступ модель семейства нейросетей YandexGPT

2025-02-25 11:31:00

«Яндекс» опубликовал в открытом доступе YandexGPT 5 Lite Pretrain — большую языковую модель (LLM) на 8 млрд параметров с поддержкой...

Читать оригинал Подробнее

Антропик: Клод 3.7 Сонет (размышление) (антропик/клод-3.7-сонет)

2025-02-24 18:35:10

Claude 3.7 Sonnet — это передовая большая языковая модель с улучшенными возможностями рассуждений, программирования и решения проблем. В модели реализован гибридный подход к обработке запросов, позволяющий пользователям выбирать между быстрыми ответами и расширенной пошаговой обработкой сложных зада...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)