Сбросить

Command-R — это модель с 35 миллиардами параметров, выполняющая разговорные языковые задачи с более высоким качеством, большей надежностью и возможностью обработки более длинного контекста по сравнению с предыдущими моделями. Она может использоваться для сложных рабочих процессов, таких как генераци...

Задача заключается в разработке модели машинного обучения, обученной на тенденциях диуреза, клинических параметрах, лекарственных препаратах и поступлении жидкости у пациентов, для прогнозирования их будущего диуреза. Какая модель машинного обучения была бы наиболее подходящей для прогнозирования ди...

Когда не следует использовать нормализацию между слоями, такую как пакетная нормализация (Batch Norm), нормализация слоев (Layer Norm), нормализация экземпляров (Instance Norm) и групповая нормализация (Group Norm) при обучении модели глубокого обучения?

Часто возникает ситуация, когда взаимосвязь между временем и объемом памяти недооценивается до того, как использовать машинное обучение/глубокое обучение для решения конкретной задачи. Учитывая тип, размер и формат доступных данных, а также доступные ЦП, ГП и ОЗУ, я задаюсь вопросом, существует ли о...

Я ищу ML-модель для оптимизации маршрутов внутри фабрики. Я начинаю с простого – оптимизирую 1 проход (2 ряда). У нас есть множество критериев, и оптимальный маршрут будет зависеть от данных на момент времени. Пока что я хочу оставаться в пределах 1 прохода, поэтому не знаю, подходит ли алгоритм мур...

Это флагманская модель компании Mistral AI — Mistral Large 2 (версия `mistral-large-2407`). Это проприетарная доступная весовая модель, отлично справляющаяся с рассуждениями, кодом, JSON, чатом и многим другим. Прочтите объявление о запуске здесь. Модель поддерживает десятки языков, включая француз...

Я читал (*), что распространённым методом атаки на систему искусственного интеллекта типа «чёрный ящик», основанную на нейронной сети, является использование этой системы для тренировки модели-заменителя («surrogate»), чтобы она производила такие же классификации, как исходная чёрная коробка. После ...

Gemma от Google — это передовая семейная линейка открытых языковых моделей, использующая новейшие технологии декодеров типа «текст-в-текст». Она предлагает возможности работы с английским языком для различных задач обработки текста: вопрос-ответа, резюмирования и рассуждений. Вариант Gemma 7B сопост...

Это базовая 7-миллиардная модель Hermes, оптимизированная методом прямого предпочтения (Direct Preference Optimization — DPO), основанная на Teknium/OpenHermes-2.5-Mistral-7B. Она демонстрирует улучшение показателей во всех протестированных бенчмарках: AGIEval, BigBench Reasoning, GPT4All и Truthful...

У меня есть производственное приложение, основанное на машинном обучении, использующее Flask и развернутое на сервере Google Cloud Platform с помощью воркеров Gunicorn. В каждом входящем запросе принимается текстовое предложение. Для обработки используется библиотека Sentence Transformers (модель Al...