Сбросить

Mistral Small 3 — языковая модель с параметрами объёмом 24 миллиарда, оптимизированная для высокоскоростного выполнения типичных задач искусственного интеллекта. Модель распространяется под лицензией Apache 2.0 и доступна в двух версиях: предварительно обученной (pre-trained) и настроенной на выполн...

DeepSeek R1 Distill Qwen 32B — дистиллированная большая языковая модель, основанная на модели Qwen 2.5 32B с использованием выходных данных от DeepSeek R1. Она превосходит OpenAI’s o1-mini по различным бенчмаркам, достигая новых передовых результатов среди плотных моделей. Другие результаты тестов ...

DeepSeek R1 Distill Qwen 14B — дистиллированная большая языковая модель, основанная на модели Qwen 2.5 14B с использованием выходных данных от DeepSeek R1. Она превосходит OpenAI’s o1-mini по различным бенчмаркам, достигая новых передовых результатов среди плотных моделей. Другие результаты тестов ...

Общаясь с корпоративными клиентами, часто сталкиваюсь с мнением, что хотя ИИ действительно мощный инструмент, он не даст какой-либо компании устойчивого конкурентного преимущества. В конце концов, за последние два года крупные масштабируемые языковые модели стали общедоступной технологией. Я много р...

Sonar Reasoning — это модель рассуждений от компании Perplexity, основанная на DeepSeek R1. Она позволяет разработчикам использовать длинные цепочки рассуждений с интегрированным веб-поиском. Модель Sonar Reasoning не подвергается цензуре и размещается в дата-центрах США.

Sonar — лёгкий, доступный, быстрый и простой в использовании инструмент, теперь поддерживающий цитаты и возможность настройки источников. Разработан для компаний, стремящихся интегрировать облегчённые функции вопросов и ответов, оптимизированные для высокой скорости работы.

LFM-7B — новая передовая языковая модель. LFM-7B разработана для выдающихся возможностей общения, включая такие языки, как арабский и японский. Модель построена на архитектуре жидкой базовой модели (Liquid Foundation Model, LFM), благодаря чему обладает уникальными характеристиками: низким потреблен...

Разное: Ссылки №45

MatterGen — новый подход к проектированию материалов с помощью генерирующего ИИ Жизненный цикл продукта человеческого труда: станут ли люди избыточным ресурсом? Вы абсолютный идиот, веря в шумиху вокруг «агентов ИИ». 25 прогнозов развития ИИ до 2025 года от Маркуса об искусственном интеллекте ...

DeepSeek R1 Distill Llama 70B — дистиллированная большая языковая модель, основанная на архитектуре Llama-3.3-70B-Instruct и использующая результаты работы модели DeepSeek R1. Модель объединяет передовые методы дистилляции, обеспечивая высокую производительность сразу по нескольким бенчмаркам, включ...