Главная - AST-AIHub

MoonshotAI: Kimi K2 0711 (бесплатная версия) (moonshotai/kimi-k2)

2025-07-11 19:47:32

Kimi K2 Instruct — это масштабная языковая модель типа смесь-экспертов (MoE), разработанная компанией Moonshot AI, обладающая общим числом параметров в 1 триллион, из которых активно используется 32 миллиарда на каждом прямом проходе. Модель оптимизирована для агентских возможностей, включая продвин...

Читать оригинал Подробнее

THUDM: GLM 4.1V 9B Размышление (thudm/glm-4.1v-9b-thinking)

2025-07-11 14:33:05

GLM-4.1V-9B-Thinking — это визуально-лингвистическая модель с 9 миллиардами параметров, разработанная лабораторией THUDM на основе архитектуры GLM-4-9B. Модель реализует парадигму рассуждений, ориентированную на аналитическое мышление и дополненную методами подкрепляющего обучения, что позволяет улу...

Читать оригинал Подробнее

Мистраль: Девстрал Мидиум (mistralai/devstral-medium)

2025-07-10 15:28:41

Devstral Medium — высокопроизводительная модель генерации кода и агентного рассуждения, разработанная совместно компаниями Mistral AI и All Hands AI. По сравнению с моделью Devstral Small она демонстрирует значительное улучшение: показатель успешности выполнения верифицированных заданий SWE-Bench со...

Читать оригинал Подробнее

Мистраль: Девстрал Смолл 1.1 (mistralai/devstral-small)

2025-07-10 15:19:11

Devstral Small 1.1 — это открытая языковая модель весом 24 миллиарда параметров, предназначенная для агентов программного инжиниринга, разработанная компанией Mistral AI совместно с All Hands AI. Модель создана путем дообучения от версии Mistral Small 3.1 и выпущена под лицензией Apache 2.0. Она обл...

Читать оригинал Подробнее

Каким образом агентные ИИ (Agentic AI) внедряются в современные веб-приложения для интеграции и автоматизации рабочих процессов с целью снижения участия человека в процессе?

2025-07-10 03:11:16

Агентная ИИ в настоящее время интегрирует рабочий процесс путем автоматизации различных функциональных возможностей Организации для их выполнения с использованием агентных способностей. Ранее существовали основные инструменты для сбора данных, их обработки и преобразования через интеграционные средс...

Читать оригинал Подробнее

Венеция: Без цензуры (свободная версия) (cognitivecomputations/dolphin-mistral-24b-венецианское-издание)

2025-07-09 21:02:46

Venice Uncensored Dolphin Mistral 24B Венеция Edition — это тонко настроенная версия модели Mistral-Small-24B-Instruct-2501, разработанная компанией dphn.ai совместно с Venice.ai. Данная модель предназначена как «нецензурированная», настраиваемая инструкция для больших языковых моделей (LLM), сохран...

Читать оригинал Подробнее

xAI: Grok 4 (x-ай/грок-4)

2025-07-09 19:01:29

Grok 4 — новейшая модель рассуждений от xAI с контекстным окном размером 256К токенов. Поддерживает параллельные вызовы инструментов, структурированные выходные данные, а также ввод изображений и текста. Обратите внимание: механизм рассуждения не раскрывается, отключение рассуждений невозможно, а ур...

Читать оригинал Подробнее

MedGemma: Наши наиболее мощные открытые модели для разработки медицинского ИИ

2025-07-09 17:00:00

Генеративный ИИ

Читать оригинал Подробнее

Гугл: Джемма 3н 2Б (бесплатная версия) (google/gemma-3n-e2b-it)

2025-07-09 15:28:24

Gemma 3n E2B IT — мультимодальная, настроенная на выполнение инструкций модель, разработанная компанией Google DeepMind. Она предназначена для эффективной работы с размером параметра 2 миллиарда (2B), используя архитектуру на 6 миллиардов (6B). Основанная на архитектуре MatFormer, она поддерживает в...

Читать оригинал Подробнее

Почему LLM генеративный ИИ производит определенные слова с более высокой частотой, чем обычно?

2025-07-08 16:26:19

Изучая написание текстов с помощью больших языковых моделей (LLM) в биомедицинской литературе посредством избыточности словарного запаса, исследователи обнаружили, что частота некоторых редких слов (например, "delves") значительно возросла в аннотациях статей с появлением LLM, таких как ChatGPT, пов...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)