Главная - AST-AIHub

Гугл: Джемма 3 27Б (бесплатная) (google/gemma-3-27b-it)

2025-03-12 05:12:39

Gemma 3 вводит мультимодальность, поддерживая входные данные типа «изображение-текст» и текстовые выходные данные. Модель обрабатывает контекстные окна до 128 тысяч токенов, распознаёт свыше 140 языков и предлагает улучшенные возможности работы с математическими вычислениями, рассуждениями и диалого...

Читать оригинал Подробнее

Драммер: Анубис Про 105Б В1 (драммер/анубис-про-105б-в1)

2025-03-10 21:31:30

Anubis Pro 105B v1 — расширенная и доработанная версия модели Meta Llama 3.3 70B, включающая на 50% больше слоёв и прошедшая дополнительное дообучение для эффективного использования увеличенной ёмкости. Модель предназначена для продвинутых сценариев повествования, ролевых игр и учебных заданий, демо...

Читать оригинал Подробнее

LatitudeGames: Путник Большой 70B Лама 3.3 (latitudegames/wayfarer-large-70b-llama-3.3)

2025-03-10 20:01:25

Wayfarer Large 70B — это модель для ролевых игр и текстовых приключений, дообученная на основе модели Meta Llama-3.3-70B-Instruct. Она специально оптимизирована для сценариев, основанных на повествовании и сложных ситуациях, вводит реалистичные ставки, конфликты и последствия, которых часто избегают...

Читать оригинал Подробнее

TheDrummer: Skyfall 36B v2 (the drummer / skyfall-36b-v2)

2025-03-10 19:56:06

Skyfall 36B v2 — улучшенная версия модели Mistral Small 2501, специально дообученная для повышения креативности, тонкости письма, ролевых игр и связного повествования.

Читать оригинал Подробнее

Почему не кэшировать матрицу запросов (Q)?

2025-03-07 20:31:32

Краткая версия Почему мы кэшируем матрицы K(ключ) и V(значение), но не матрицу Q(запрос)? Полная версия Приведенный ниже набор данных представляет собой упрощенный пример 2-мерных векторов встраивания: TokenEmbedding Vector quick[0.27 0.78] lazy[0.38 0.58] brown[0.50 0.83] jumps[0.20 0.53] over...

Читать оригинал Подробнее

Перпендикулярность: Сонар Рационинг Про (перпендикулярность/сонар-рационинг-про) Примечание: В исходной формулировке слово «perplexity» переводится буквально как «затруднительность», однако в контексте машинного обучения оно означает показатель сложности модели («перплекситет»). Если речь идет именно о таком значении, корректный перевод будет следующим: Перплекситет: Сонар Рационинг Про (перплекситет/сонар-рационинг-про)

2025-03-07 02:08:28

Примечание: стоимость Sonar Pro включает в себя цену поиска Perplexity. Подробности здесь Sonar Reasoning Pro — премиальная модель рассуждений, основанная на технологии DeepSeek R1 с цепочкой размышлений (Chain of Thought, CoT). Разработана для продвинутых сценариев использования, поддерживает глу...

Читать оригинал Подробнее

Перпендикулярность: Сонар Про (perplexity/sonar-pro) --- Верный перевод технического термина: Сложность восприятия: Сонар Про (perplexity/sonar-pro) («Perplexity» — общепринятый технический термин, обозначающий меру сложности модели предсказания.)

2025-03-07 01:53:43

Примечание: стоимость Sonar Pro включает в себя цену поиска Perplexity. Подробности здесь Для предприятий, которым требуются расширенные возможности, API Sonar Pro способен обрабатывать глубокие многоэтапные запросы с дополнительной масштабируемостью, такие как удвоенное количество цитат на один п...

Читать оригинал Подробнее

Перплексность: Глубокое исследование Сонар (перплексность/сонар-глубокое-исследование)

2025-03-07 01:34:06

Sonar Deep Research — исследовательская модель, ориентированная на многоэтапное извлечение, синтезирование и рассуждение по сложным тематикам. Она автономно ищет, читает и оценивает источники, уточняя подход по мере сбора информации. Это позволяет создавать исчерпывающие отчёты по таким областям, ка...

Читать оригинал Подробнее

DeepSeek: DeepSeek R1 Zero (deepseek/deepseek-r1-zero) (перевод идентичен оригиналу, поскольку название продукта является собственным именем и не требует перевода)

2025-03-06 21:43:54

DeepSeek-R1-Zero — это модель, обученная методом крупномасштабного обучения с подкреплением (RL), без предварительного этапа дообучения с учителем (SFT). Она имеет размерность 671 млрд параметров, из которых активно используется 37 млрд при выполнении вывода. Модель демонстрирует выдающиеся результ...

Читать оригинал Подробнее

От диагностики до лечения: совершенствование системы AMIE для долгосрочного управления заболеваниями

2025-03-06 11:00:00

Генеративный ИИ

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)