Модель параметров Aion-1.0-Mini 32B является дистиллированной версией модели DeepSeek-R1, разработанной для высокой производительности в областях, требующих логического мышления, таких как математика, программирование и логика. Это модифицированная вариация FuseAI, превосходящая R1-Distill-Qwen-32B ...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 74686
Aion-RP-Llama-3.1-8B занимает первое место в части оценки персонажей в бенчмарке RPBench-Auto, специализированной вариации Arena-Hard-Auto для ролевых игр, где LLMs оценивают ответы друг друга. Это тонко настроенный базовый модельный вариант, а не инструкционная модель, разработанная для создания бо...
При запуске инициатив в области ИИ многие компании оказываются запертыми в рамках отдельных подразделений и воспринимают ИИ исключительно как чисто технологическое предприятие, игнорируя экспертов предметной области либо привлекая их слишком поздно. В результате получаются универсальные приложения И...
OpenAI, Сэм Альтман, Илон Маск, xAI, Anthropic, Gemini, Google, Apple... Все эти компании стремятся создать общий искусственный интеллект (AGI) к 2025 году, и после достижения этой цели десятки других компаний смогут воспроизвести его в течение нескольких недель. Идея создания сжатого хранилища знан...
Фотоэлектрический парадокс: Что искусственный интеллект раскрывает о человеческом гении Продолжение читайте на Becoming Human: Artificial Intelligence Magazine »
Недавно я несколько дней работал с ChatGPT, чтобы понять, как работают LLM в некоторой степени практических деталей (а также провел дополнительное чтение в интернете). Я суммировал свое общее понимание здесь (LinkedIn). По сути, я узнал, что для "преобразования входного текстового запроса в генериру...
Qwen VL Max — это модель визуального понимания с длиной контекста 7500 токенов. Она демонстрирует превосходную производительность при выполнении широкого спектра сложных задач.
Qwen-Turbo — это модель с контекстом размером 1 млн токенов, основанная на архитектуре Qwen2.5, обеспечивающая высокую скорость работы и низкую стоимость эксплуатации, подходящая для выполнения простых задач.
Qwen2.5-VL отлично распознаёт распространённые объекты, такие как цветы, птицы, рыбы и насекомые. Модель также обладает высокой способностью анализировать тексты, диаграммы, иконки, графику и макеты внутри изображений.
Модель Qwen-Plus, основанная на фундаментальной модели Qwen2.5, представляет собой контекстную модель ёмкостью 131К с оптимальным сочетанием производительности, скорости и стоимости.