Главная - AST-AIHub

Геопространственный анализ: Раскрытие инсайтов с помощью генеративного ИИ и нескольких базовых моделей

2025-04-08 15:40:00

Климат и устойчивое развитие

NVIDIA: Ллама 3.1 Немотрон Нано 8B v1 (nvidia/llama-3.1-nemotron-nano-8b-v1)

2025-04-08 14:51:13

Llama-3.1-Nemotron-Nano-8B-v1 — компактная большая языковая модель (LLM), созданная на основе модели Meta Llama-3.1-8B-Instruct и оптимизированная специально для выполнения рассуждений, ведения диалоговых взаимодействий, генерации с использованием извлечения информации (RAG) и приложений вызова инст...

Читать оригинал Подробнее

NVIDIA: Ллама 3.3 Немотрон Супер 49B версия 1 (nvidia/llama-3.3-nemotron-super-49b-v1)

2025-04-08 13:38:14

Nemotron Super v1 — это крупная языковая модель (LLM) объемом 49 млрд параметров, оптимизированная для продвинутого рассуждения, диалоговых взаимодействий, генерации с использованием поиска по внешним источникам (RAG) и выполнения внешних запросов. Модель создана на основе архитектуры Meta Llama-3.3...

Читать оригинал Подробнее

NVIDIA: Ллама 3.1 Немотрон Ультра 253Б v1 (nvidia/llama-3.1-nemotron-ultra-253b-v1)

2025-04-08 12:24:19

Llama-3.1-Nemotron-Ultra-253B-v1 — это крупная языковая модель (LLM), оптимизированная для продвинутого рассуждения, интерактивного общения с человеком, генерации с использованием поиска по данным (RAG) и выполнения инструментальных запросов. Модель разработана на основе Meta Llama-3.1-405B-Instruct...

Читать оригинал Подробнее

Сапсан: Llama 3.1 Сапсан 8B Инструкционная версия 0.3 (tokyotech-llm/llama-3.1-swallow-8b-instruct-v0.3)

2025-04-07 00:45:42

Llama 3.1 Swallow 8B — это большая языковая модель, созданная путем непрерывной предобучающей тренировки на основе модели Meta Llama 3.1 8B. Модель Llama 3.1 Swallow улучшила возможности работы с японским языком исходной версии Llama 3.1, сохранив при этом способности обработки английского языка. Д...

Читать оригинал Подробнее

Meta: Ллама 4 Маверик (бесплатная версия) (meta-llama/llama-4-maverick)

2025-04-05 19:37:02

Llama 4 Maverick 17B Instruct (128E) — высокоемкая мультимодальная языковая модель от компании Meta, построенная на архитектуре типа смесь-экспертов (MoE), включающей 128 экспертов и использующей 17 миллиардов активных параметров на один проход прямого распространения (всего 400 млрд). Модель поддер...

Читать оригинал Подробнее

Meta: Ллама 4 Скаут (бесплатная версия) (meta-llama/llama-4-scout)

2025-04-05 19:31:59

Llama 4 Scout 17B Instruct (16E) — это экспертная смесь (MoE) языковой модели, разработанная компанией Meta, активирующая 17 миллиардов параметров из общего числа 109 млрд. Она поддерживает нативный мультимодальный ввод (текст и изображение), а также многоязычный вывод (текст и код) на 12 поддержива...

Читать оригинал Подробнее

Оценка прогресса больших языковых моделей (LLM) в решении научных проблем

2025-04-03 21:43:00

Общее естествознание

Читать оригинал Подробнее

OpenHands LM 32B v0.1 (all-hands/openhands-lm-32b-v0.1)

2025-04-02 16:56:53

OpenHands LM версии 0.1 — это открытая кодовая модель объёмом 32 миллиарда параметров, дообученная от модели Qwen2.5-Coder-32B-Instruct с использованием методов подкрепляющего обучения, изложенных в SWE-Gym. Она оптимизирована для автономных агентов разработки программного обеспечения и демонстрируе...

Читать оригинал Подробнее

Принятие ответственного пути к Общему Искусственному Интеллекту (ОИИ)

2025-04-02 13:31:00

Мы исследуем границы AGI, уделяя приоритетное внимание технической безопасности, проактивной оценке рисков и сотрудничеству с сообществом искусственного интеллекта.

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)