Главная - AST-AIHub

Мистраль: Магистрал Мидиум 2506 (обработка запроса) (mistralai/magistral-medium-2506)

2025-06-08 03:40:54

Магистраль (Magistral) — первая модель рассуждений от компании Мистрал (Mistral). Она идеально подходит для общего назначения, когда требуются длительные вычисления и большая точность по сравнению с моделями без функций рассуждения. От юридического анализа до финансового прогнозирования, разработки ...

Читать оригинал Подробнее

Масштабирование деталей: Эффективная региональная оценка экологических рисков с помощью генерирующего ИИ

2025-06-05 17:00:00

Климат и устойчивое развитие

Читать оригинал Подробнее

Гугл: Предварительный просмотр Gemini 2.5 Pro от 06-05 (google/gemini-2.5-pro-preview)

2025-06-05 15:27:37

Gemini 2.5 Pro — передовая модель искусственного интеллекта от Google, предназначенная для выполнения сложных аналитических задач, программирования, математики и научных исследований. Она обладает возможностями «размышления», позволяющими ей формировать ответы с повышенной точностью и глубоким поним...

Читать оригинал Подробнее

Продвинутый аудио-диалог и генерация с Gemini 2.5

2025-06-03 17:15:47

Gemini 2.5 обладает новыми возможностями в области диалогового ИИ и генерации аудио.

Читать оригинал Подробнее

Обучение уточнению: Многотуровые диалоги с контрастной самообучающей тренировкой на основе действий

2025-06-03 08:13:00

Генеративный ИИ

Читать оригинал Подробнее

SentientAGI: Dobby Mini Plus Llama 3.1 8B (sentientagi/dobby-mini-unhinged-plus-llama-3.1-8b) (Точный перевод технической строки сохранён без изменений.)

2025-06-02 17:33:39

Dobby-Mini-Leashed-Llama-3.1-8B и Dobby-Mini-Unhinged-Llama-3.1-8B представляют собой языковые модели, дообученные на основе Llama-3.1-8B-Instruct. Модели Dobby отличаются твёрдой приверженностью идеям личной свободы, децентрализации и всему, связанному с криптовалютами — даже когда их вынуждают выс...

Читать оригинал Подробнее

DeepSeek: R1 Дистиллированный Qwen 7B (deepseek/deepseek-r1-distill-qwen-7b)

2025-05-30 18:03:57

DeepSeek-R1-Distill-Qwen-7B — это плотная языковая модель с семью миллиардами параметров, дистиллированная из модели DeepSeek-R1 с использованием данных, полученных методом усиленного обучения от больших моделей DeepSeek. Процесс дистилляции переносит продвинутые способности рассуждений, математики ...

Читать оригинал Подробнее

DeepSeek: DeepSeek R1 0528 Qwen3 8B (бесплатная версия) (deepseek/deepseek-r1-0528-qwen3-8b)

2025-05-29 17:09:03

DeepSeek-R1-0528 — это слегка улучшенная версия модели DeepSeek R1, использующая больше вычислительных ресурсов и умнее применяющая постобучающие трюки, благодаря чему её способности к рассуждению и выводу приближаются к уровню флагманских моделей вроде O3 и Gemini 2.5 Pro. Теперь она лидирует в рей...

Читать оригинал Подробнее

Гугл: Джемма 1 2Б (google/gemma-2b-it)

2025-05-28 19:33:35

Модель Gemma 1 2B от Google — открытая модель, построенная на основе тех же исследований и технологий, которые использовались для создания моделей Gemini. Модели Gemma хорошо подходят для различных задач обработки текста, включая ответы на вопросы, создание резюме и рассуждения. Использование моде...

Читать оригинал Подробнее

DeepSeek: R1 0528 (бесплатная версия) (deepseek/deepseek-r1-0528)

2025-05-28 17:59:30

Обновление от 28 мая оригинальной модели DeepSeek R1: Производительность соответствует OpenAI o1, однако она полностью открыта — исходный код доступен публично, а также открыты токены рассуждений. Размер модели составляет 671 млрд параметров, из которых активно используется 37 миллиардов при выпол...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)