Главная - AST-AIHub

Мистраль: Мистраль Немо (бесплатный) (mistralai/mistral-nemo)

2024-07-19 00:00:00

Модель с параметрами 12B и длиной контекста 128K токенов, разработанная компанией Mistral совместно с NVIDIA. Модель мультиязычная, поддерживает английский, французский, немецкий, испанский, итальянский, португальский, китайский, японский, корейский, арабский и хинди языки. Поддерживает вызовы фун...

Читать оригинал Подробнее

OpenAI: GPT-4o-мини (2024-07-18) (openai/gpt-4o-mini-2024-07-18)

2024-07-18 00:00:00

Мини-версия модели GPT-4o — новейшая разработка компании OpenAI после выхода GPT-4 Omni, поддерживающая ввод текста и изображений с выводом результатов в виде текста. Будучи самой продвинутой среди компактных моделей, она значительно дешевле других современных передовых моделей и более чем на 60 % ...

Читать оригинал Подробнее

OpenAI: GPT-4о-мини (openai/gpt-4o-mini)

2024-07-18 00:00:00

Мини-версия модели GPT-4o — новейшая разработка компании OpenAI после выхода GPT-4 Omni, поддерживающая ввод текста и изображений с выводом результатов в виде текста. Будучи самой продвинутой среди компактных моделей, она значительно дешевле других современных передовых моделей и более чем на 60 % ...

Читать оригинал Подробнее

Объединение результатов работы двух различных моделей машинного обучения для точного извлечения данных из счетов: является ли это жизнеспособным подходом?

2024-07-17 18:12:58

Я работаю (пытаюсь работать) над проектом по извлечению релевантной информации из счетов. В настоящее время я не достигаю значительной точности и пытаюсь придумать новые идеи. Я рассматриваю возможность объединения двух моделей машинного обучения: Lilt и YOLO, но конкретные модели не важны; я хотел ...

Читать оригинал Подробнее

Сочетание результатов двух различных моделей машинного обучения для точного извлечения данных из счетов-фактур: является ли этот подход жизнеспособным?

2024-07-17 18:12:58

I am working (trying to work) on a project to extract relevant information from invoices. Currently I don't achieve much good accuracy so am trying to come up with some new ideas. I am considering combining two machine learning models: Lilt and YOLO, but the specific models arent important, I want t...

Читать оригинал Подробнее

Почему интеграл ошибки обобщения интегрируется как по X, так и по Y, а не только по X?

2024-07-17 06:33:14

Формула для ошибки обобщения, взятая из Википедии, выглядит следующим образом: $$ I[f]=\int _{X\times Y}V(f({\vec {x}}),y)\rho ({\vec {x}},y)d{\vec {x}}dy $$ Версия d2l.ai’: $$ R[p, f] = E_{(\mathbf{x}, y) \sim P} [l(\mathbf{x}, y, f(\mathbf{x}))] = \int \int l(\mathbf{x}, y, f(\mathbf{x})) p...

Читать оригинал Подробнее

Инструкция Qwen 2 7B (qwen/qwen-2-7b-instruct)

2024-07-16 00:00:00

Модель Qwen2 7B основана на архитектуре трансформера и демонстрирует превосходные результаты в понимании естественного языка, многоязычности, кодировании, математике и рассуждениях. Она оснащена активационной функцией SwiGLU, смещением внимания QKV (Query-Key-Value) и групповым вниманием к запросу....

Читать оригинал Подробнее

Гугл: Джемма 2 27B (google/gemma-2-27b-it)

2024-07-13 00:00:00

Модель Gemma 2 27B от компании Google — открытая модель, созданная на основе тех же исследований и технологий, что использовались при разработке моделей Gemini. Модели Gemma хорошо подходят для различных задач обработки текста, включая ответы на вопросы, создание резюме и рассуждений. Подробности ...

Читать оригинал Подробнее

Китайцы создали себе национальный Linux, напичканный ИИ-функциями, работающими прямо на ПК

2024-07-11 10:25:00

Представлен вариант «первой китайской ОС с открытым исходным кодом» для ИИ-ПК – с возможностями инференса ИИ-моделей в локальной инфраструктуре. Правда, «пощупать» собственными руками построенную вокруг ядра Linux OpenKylin for AIPC нельзя, во всяком случае, пока.

Читать оригинал Подробнее

Магнум 72Б (алпиндейл/магнум-72б)

2024-07-11 00:00:00

От создателей Goliath, Magnum 72B — первая модель новой линейки, разработанная для достижения качества прозы уровня моделей Claude 3, особенно Opus и Sonnet. Модель основана на Qwen2 72B и обучена на 55 миллионах токенов тщательно отобранных данных ролевых игр (RP).

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)