Главная - AST-AIHub

Meta: Ллама 3.1 8B Инструкшн (meta-llama/llama-3.1-8b-instruct)

2024-07-23 00:00:00

Последняя линейка моделей Meta (версия Llama 3.1) представлена различными размерами и вариантами исполнения. Эта версия объемом 8 миллиардов параметров с инструкционной настройкой отличается высокой скоростью работы и эффективностью. Она продемонстрировала отличные результаты по сравнению с ведущим...

Читать оригинал Подробнее

Google DeepMind на ICML 2024

2024-07-19 10:00:00

Исследование AGI, проблемы масштабирования и будущее мультимодального генеративного ИИ.

Читать оригинал Подробнее

Мистрал: Кодстраль Манба (mistralai/codestral-mamba)

2024-07-19 00:00:00

Модель на основе архитектуры Mamba с параметрами объёмом 7,3 миллиарда, предназначенная для выполнения задач программирования и рассуждений. - Линейное время вывода, позволяющее теоретически обрабатывать последовательности бесконечной длины - Окно контекста размером до 256 тысяч токенов - Оптимизир...

Читать оригинал Подробнее

Дельфин Ллама 3 70B 🐬 (cognitivecomputations/дольфин-ллама-3-70б)

2024-07-19 00:00:00

Dolphin 2.9 предназначен для выполнения инструкций, ведения диалогов и программирования. Эта модель представляет собой дообучение Llama 3 размером 70 млрд параметров. По сравнению с оригинальной моделью она демонстрирует улучшения в выполнении инструкций, ведении диалога, кодировании и вызове функци...

Читать оригинал Подробнее

Мистраль: Мистраль Немо (бесплатный) (mistralai/mistral-nemo)

2024-07-19 00:00:00

Модель с параметрами 12B и длиной контекста 128K токенов, разработанная компанией Mistral совместно с NVIDIA. Модель мультиязычная, поддерживает английский, французский, немецкий, испанский, итальянский, португальский, китайский, японский, корейский, арабский и хинди языки. Поддерживает вызовы фун...

Читать оригинал Подробнее

OpenAI: GPT-4o-мини (2024-07-18) (openai/gpt-4o-mini-2024-07-18)

2024-07-18 00:00:00

Мини-версия модели GPT-4o — новейшая разработка компании OpenAI после выхода GPT-4 Omni, поддерживающая ввод текста и изображений с выводом результатов в виде текста. Будучи самой продвинутой среди компактных моделей, она значительно дешевле других современных передовых моделей и более чем на 60 % ...

Читать оригинал Подробнее

OpenAI: GPT-4о-мини (openai/gpt-4o-mini)

2024-07-18 00:00:00

Мини-версия модели GPT-4o — новейшая разработка компании OpenAI после выхода GPT-4 Omni, поддерживающая ввод текста и изображений с выводом результатов в виде текста. Будучи самой продвинутой среди компактных моделей, она значительно дешевле других современных передовых моделей и более чем на 60 % ...

Читать оригинал Подробнее

Объединение результатов работы двух различных моделей машинного обучения для точного извлечения данных из счетов: является ли это жизнеспособным подходом?

2024-07-17 18:12:58

Я работаю (пытаюсь работать) над проектом по извлечению релевантной информации из счетов. В настоящее время я не достигаю значительной точности и пытаюсь придумать новые идеи. Я рассматриваю возможность объединения двух моделей машинного обучения: Lilt и YOLO, но конкретные модели не важны; я хотел ...

Читать оригинал Подробнее

Сочетание результатов двух различных моделей машинного обучения для точного извлечения данных из счетов-фактур: является ли этот подход жизнеспособным?

2024-07-17 18:12:58

I am working (trying to work) on a project to extract relevant information from invoices. Currently I don't achieve much good accuracy so am trying to come up with some new ideas. I am considering combining two machine learning models: Lilt and YOLO, but the specific models arent important, I want t...

Читать оригинал Подробнее

Почему интеграл ошибки обобщения интегрируется как по X, так и по Y, а не только по X?

2024-07-17 06:33:14

Формула для ошибки обобщения, взятая из Википедии, выглядит следующим образом: $$ I[f]=\int _{X\times Y}V(f({\vec {x}}),y)\rho ({\vec {x}},y)d{\vec {x}}dy $$ Версия d2l.ai’: $$ R[p, f] = E_{(\mathbf{x}, y) \sim P} [l(\mathbf{x}, y, f(\mathbf{x}))] = \int \int l(\mathbf{x}, y, f(\mathbf{x})) p...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)