Kimi K2 Instruct — это масштабная языковая модель типа смесь-экспертов (MoE), разработанная компанией Moonshot AI, обладающая общим числом параметров в 1 триллион, из которых активно используется 32 миллиарда на каждом прямом проходе. Модель оптимизирована для агентских возможностей, включая продвин...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 74505
GLM-4.1V-9B-Thinking — это визуально-лингвистическая модель с 9 миллиардами параметров, разработанная лабораторией THUDM на основе архитектуры GLM-4-9B. Модель реализует парадигму рассуждений, ориентированную на аналитическое мышление и дополненную методами подкрепляющего обучения, что позволяет улу...
Devstral Medium — высокопроизводительная модель генерации кода и агентного рассуждения, разработанная совместно компаниями Mistral AI и All Hands AI. По сравнению с моделью Devstral Small она демонстрирует значительное улучшение: показатель успешности выполнения верифицированных заданий SWE-Bench со...
Devstral Small 1.1 — это открытая языковая модель весом 24 миллиарда параметров, предназначенная для агентов программного инжиниринга, разработанная компанией Mistral AI совместно с All Hands AI. Модель создана путем дообучения от версии Mistral Small 3.1 и выпущена под лицензией Apache 2.0. Она обл...
Агентная ИИ в настоящее время интегрирует рабочий процесс путем автоматизации различных функциональных возможностей Организации для их выполнения с использованием агентных способностей. Ранее существовали основные инструменты для сбора данных, их обработки и преобразования через интеграционные средс...
Venice Uncensored Dolphin Mistral 24B Венеция Edition — это тонко настроенная версия модели Mistral-Small-24B-Instruct-2501, разработанная компанией dphn.ai совместно с Venice.ai. Данная модель предназначена как «нецензурированная», настраиваемая инструкция для больших языковых моделей (LLM), сохран...
Grok 4 — новейшая модель рассуждений от xAI с контекстным окном размером 256К токенов. Поддерживает параллельные вызовы инструментов, структурированные выходные данные, а также ввод изображений и текста. Обратите внимание: механизм рассуждения не раскрывается, отключение рассуждений невозможно, а ур...
Генеративный ИИ
Gemma 3n E2B IT — мультимодальная, настроенная на выполнение инструкций модель, разработанная компанией Google DeepMind. Она предназначена для эффективной работы с размером параметра 2 миллиарда (2B), используя архитектуру на 6 миллиардов (6B). Основанная на архитектуре MatFormer, она поддерживает в...
Изучая написание текстов с помощью больших языковых моделей (LLM) в биомедицинской литературе посредством избыточности словарного запаса, исследователи обнаружили, что частота некоторых редких слов (например, "delves") значительно возросла в аннотациях статей с появлением LLM, таких как ChatGPT, пов...