Последняя линейка моделей Meta (версия Llama 3.1) представлена различными размерами и вариантами исполнения. Эта версия объемом 8 миллиардов параметров с инструкционной настройкой отличается высокой скоростью работы и эффективностью. Она продемонстрировала отличные результаты по сравнению с ведущим...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 75619
Исследование AGI, проблемы масштабирования и будущее мультимодального генеративного ИИ.
Модель на основе архитектуры Mamba с параметрами объёмом 7,3 миллиарда, предназначенная для выполнения задач программирования и рассуждений. - Линейное время вывода, позволяющее теоретически обрабатывать последовательности бесконечной длины - Окно контекста размером до 256 тысяч токенов - Оптимизир...
Dolphin 2.9 предназначен для выполнения инструкций, ведения диалогов и программирования. Эта модель представляет собой дообучение Llama 3 размером 70 млрд параметров. По сравнению с оригинальной моделью она демонстрирует улучшения в выполнении инструкций, ведении диалога, кодировании и вызове функци...
Модель с параметрами 12B и длиной контекста 128K токенов, разработанная компанией Mistral совместно с NVIDIA. Модель мультиязычная, поддерживает английский, французский, немецкий, испанский, итальянский, португальский, китайский, японский, корейский, арабский и хинди языки. Поддерживает вызовы фун...
Мини-версия модели GPT-4o — новейшая разработка компании OpenAI после выхода GPT-4 Omni, поддерживающая ввод текста и изображений с выводом результатов в виде текста. Будучи самой продвинутой среди компактных моделей, она значительно дешевле других современных передовых моделей и более чем на 60 % ...
Мини-версия модели GPT-4o — новейшая разработка компании OpenAI после выхода GPT-4 Omni, поддерживающая ввод текста и изображений с выводом результатов в виде текста. Будучи самой продвинутой среди компактных моделей, она значительно дешевле других современных передовых моделей и более чем на 60 % ...
Я работаю (пытаюсь работать) над проектом по извлечению релевантной информации из счетов. В настоящее время я не достигаю значительной точности и пытаюсь придумать новые идеи. Я рассматриваю возможность объединения двух моделей машинного обучения: Lilt и YOLO, но конкретные модели не важны; я хотел ...
I am working (trying to work) on a project to extract relevant information from invoices. Currently I don't achieve much good accuracy so am trying to come up with some new ideas. I am considering combining two machine learning models: Lilt and YOLO, but the specific models arent important, I want t...
Формула для ошибки обобщения, взятая из Википедии, выглядит следующим образом: $$ I[f]=\int _{X\times Y}V(f({\vec {x}}),y)\rho ({\vec {x}},y)d{\vec {x}}dy $$ Версия d2l.ai’: $$ R[p, f] = E_{(\mathbf{x}, y) \sim P} [l(\mathbf{x}, y, f(\mathbf{x}))] = \int \int l(\mathbf{x}, y, f(\mathbf{x})) p...