Главная - AST-AIHub

Перпендикулярность: Лама3 Сонар 70B (перпендикулярность/лама-3-сонар-лэрг-32к-чэт) --- Примечание: Термин «perplexity» переводится как «перпендикулярность» крайне редко и некорректно в данном контексте. Правильный технический перевод — «энтропия модели», «неоднозначность», либо оставить оригинальное слово («перплэксити»). В зависимости от контекста лучше использовать один из следующих вариантов перевода: 1. Энтропия: Лама3 Сонар 70B (энтропия/лама-3-сонар-лардж-32к-чэт) 2. Неоднозначность: Лама3 Сонар 70B (неоднозначность/лама-3-сонар-лардж-32к-чэт) 3. Перплэксити: Лама3 Сонар 70B (перплэксити/лама-3-сонар-лардж-32к-чэт)

2024-05-14 00:00:00

Семейство моделей Llama3 Sonar — последняя разработка компании Perplexity. По сравнению с предыдущими моделями семейства Sonar оно превосходит их по стоимости, скорости работы и производительности. Это обычная автономная языковая модель (LLM), однако онлайн-версия данной модели имеет доступ к Интер...

Читать оригинал Подробнее

DeepSeek v2.5 (deepseek/deepseek-чат-v2.5)

2024-05-14 00:00:00

DeepSeek-V2.5 — это улучшенная версия, объединяющая возможности DeepSeek-V2-Chat и DeepSeek-Coder-V2-Instruct. Новая модель интегрирует общие способности и навыки программирования двух предыдущих версий. Для получения подробной информации о модели посетите страницу **DeepSeek-V2**.

Читать оригинал Подробнее

OpenAI: GPT-4o (13 мая 2024 г.) (openai/gpt-4o-2024-05-13)

2024-05-13 00:00:00

GPT-4o («o» означает «omni») — новейшая модель искусственного интеллекта от компании OpenAI, поддерживающая ввод текста и изображений с выводом результата в виде текста. Она сохраняет уровень интеллектуальных возможностей модели GPT-4 Turbo, одновременно демонстрируя двукратное увеличение скорости р...

Читать оригинал Подробнее

Мета: ЛламаГард 2 8B (мета-ллама/ллама-гард-2-8б)

2024-05-13 00:00:00

Эта модель защиты содержит 8 миллиардов параметров и основана на семействе Llama 3. Подобно своему предшественнику — LlamaGuard 1 — она способна классифицировать как запросы (prompt), так и ответы (response). LlamaGuard 2 функционирует аналогично обычному языковой модели (LLM), генерируя текст, кот...

Читать оригинал Подробнее

OpenAI: GPT-4o (openai/gpt-4o) (Текст идентичен оригиналу, поскольку представленная строка является названием модели и не требует перевода.)

2024-05-13 00:00:00

GPT-4o («o» означает «omni») — новейшая модель искусственного интеллекта от компании OpenAI, поддерживающая ввод текста и изображений с выводом результата в виде текста. Она сохраняет уровень интеллектуальных возможностей модели GPT-4 Turbo, одновременно работая вдвое быстрее и обеспечивая снижение ...

Читать оригинал Подробнее

Метасофт: Ллама 3 8B (Базовая версия) (meta-llama/llama-3-8b)

2024-05-13 00:00:00

Последняя линейка моделей Meta (Llama 3) представлена различными размерами и вариантами исполнения. Это базовая предварительно обученная версия объемом 8 миллиардов параметров. Она продемонстрировала высокую производительность по сравнению с ведущими моделями закрытого типа согласно оценкам людей. ...

Читать оригинал Подробнее

Мета: Ллама 3 70B (Базовая версия) (meta-llama/llama-3-70b)

2024-05-13 00:00:00

Последняя линейка моделей Meta (Llama 3) представлена различными размерами и вариантами исполнения. Это базовая предварительно обученная версия объемом 70 миллиардов параметров. Она продемонстрировала высокую производительность по сравнению с ведущими моделями закрытого типа согласно оценкам людей....

Читать оригинал Подробнее

LLaVA v1.6 34B (лиухаотянь/ллава-йи-34б)

2024-05-11 00:00:00

LLaVA Yi 34B — открытая модель, обученная тонкой настройкой языковой модели (LLM) на мультимодальных инструкциях. Это авто-регрессивная языковая модель, основанная на архитектуре трансформера. Базовая LLM: NousResearch/Nous-Hermes-2-Yi-34B. Обучение проведено в декабре 2023 года.

Читать оригинал Подробнее

ОЛМо 7B Инструкшн (allenai/olmo-7b-instruct)

2024-05-10 00:00:00

OLMo 7B Instruct от Института искусственного интеллекта Аллена — это модель, дообученная для ответов на вопросы. Она демонстрирует **заметную производительность** сразу на нескольких эталонных тестах, включая TruthfulQA и ToxiGen. **Открытый исходный код:** Модель, её код, контрольные точки и журна...

Читать оригинал Подробнее

Параллельные вычисления xLSTM - несовпадение размерностей.

2024-05-09 14:09:19

Inthisrecent paper, a new architecture is proposed, called xLSTM. I've implemented the sequential version in PyTorch, but it's slower than I would like, so I'm now implementing the parallel version that's explained in the appendix (page 25-26). I feel like this page might contain a mistake, or maybe...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)