QwQ — это модель рассуждений серии Qwen. В отличие от традиционных моделей, настроенных на выполнение инструкций, QwQ, способная мыслить и рассуждать, демонстрирует значительно улучшенные результаты в последующих задачах, особенно сложных проблемах. QwQ-32B является моделью среднего размера для расс...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 78158
Qwen2.5 32B Instruct — это вариант модели серии больших языковых моделей Qwen последнего поколения, настроенный на выполнение инструкций. Модель обладает улучшенными возможностями выполнения команд, повышенной эффективностью в кодировании и математическом рассуждении, а также устойчиво обрабатывает ...
Моделирование и проектирование генома ИИ во всех областях жизни с помощью Evo 2 Microsoft расхваливает ещё одну генеративную модель ИИ, но не объясняет, как именно она поможет разработчикам OthelloGPT освоил набор эвристик Vibe Coding — новая система мироустройства Робототехника: Как застави...
Moonlight-16B-A3B-Instruct — это языковая модель типа смесь-экспертов (MoE), разработанная компанией Moonshot AI и содержащая 16 миллиардов параметров. Она оптимизирована для выполнения инструкций с активацией 3 миллиардов параметров на каждый вывод. Модель улучшает границу Парето по производительно...
Предварительная версия DeepHermes 3 — новейшая итерация нашей флагманской серии моделей машинного обучения Hermes от Nous Research и одна из первых моделей в мире, объединяющих рассуждения (длинные цепочки мыслей, повышающие точность ответов) и обычные режимы работы языковой модели в одной архитекту...
GPT-4.5 (Предварительный просмотр) — исследовательская версия новейшей языковой модели от OpenAI, предназначенная для повышения возможностей в области рассуждений, творчества и ведения многоходовых диалогов. Она основана на предыдущих итерациях с улучшениями в области знаний о мире, контекстной связ...
Gemini 2.0 Flash-Lite теперь доступен в основном для использования в Gemini API в Google AI Studio и для корпоративных клиентов на Vertex AI.
Gemini 2.0 Flash Lite обеспечивает значительно меньшее время до получения первого токена (TTFT) по сравнению с Gemini Flash 1.5, при этом сохраняет качество на уровне больших моделей вроде Gemini Pro 1.5, предлагая крайне экономичные цены за токены.
«Яндекс» опубликовал в открытом доступе YandexGPT 5 Lite Pretrain — большую языковую модель (LLM) на 8 млрд параметров с поддержкой...
Claude 3.7 Sonnet — это передовая большая языковая модель с улучшенными возможностями рассуждений, программирования и решения проблем. В модели реализован гибридный подход к обработке запросов, позволяющий пользователям выбирать между быстрыми ответами и расширенной пошаговой обработкой сложных зада...