Главная - AST-AIHub

Когер: Команда R (03–2024) (когер/команда-r-03-2024)

2024-03-02 01:00:00

Command-R — это модель с 35 миллиардами параметров, выполняющая разговорные языковые задачи с более высоким качеством, большей надежностью и возможностью обработки более длинного контекста по сравнению с предыдущими моделями. Она может использоваться для сложных рабочих процессов, таких как генераци...

Читать оригинал Подробнее

Какой алгоритм машинного обучения может быть подходящим для обучения модели прогнозирования диуреза пациента?

2024-03-01 11:55:17

Задача заключается в разработке модели машинного обучения, обученной на тенденциях диуреза, клинических параметрах, лекарственных препаратах и поступлении жидкости у пациентов, для прогнозирования их будущего диуреза. Какая модель машинного обучения была бы наиболее подходящей для прогнозирования ди...

Читать оригинал Подробнее

Когда не следует использовать методы нормализации в моделях глубокого обучения?

2024-03-01 10:01:31

Когда не следует использовать нормализацию между слоями, такую как пакетная нормализация (Batch Norm), нормализация слоев (Layer Norm), нормализация экземпляров (Instance Norm) и групповая нормализация (Group Norm) при обучении модели глубокого обучения?

Читать оригинал Подробнее

Как оценить компромисс между временем и памятью до моделирования.

2024-02-27 13:03:52

Часто возникает ситуация, когда взаимосвязь между временем и объемом памяти недооценивается до того, как использовать машинное обучение/глубокое обучение для решения конкретной задачи. Учитывая тип, размер и формат доступных данных, а также доступные ЦП, ГП и ОЗУ, я задаюсь вопросом, существует ли о...

Читать оригинал Подробнее

Модель машинного обучения для оптимизации маршрутов в производстве

2024-02-26 14:48:47

Я ищу ML-модель для оптимизации маршрутов внутри фабрики. Я начинаю с простого – оптимизирую 1 проход (2 ряда). У нас есть множество критериев, и оптимальный маршрут будет зависеть от данных на момент времени. Пока что я хочу оставаться в пределах 1 прохода, поэтому не знаю, подходит ли алгоритм мур...

Читать оригинал Подробнее

Мистраль Лэдж (mistralai/mistral-large)

2024-02-26 00:00:00

Это флагманская модель компании Mistral AI — Mistral Large 2 (версия `mistral-large-2407`). Это проприетарная доступная весовая модель, отлично справляющаяся с рассуждениями, кодом, JSON, чатом и многим другим. Прочтите объявление о запуске здесь. Модель поддерживает десятки языков, включая француз...

Читать оригинал Подробнее

Почему атаки на основе состязательных примеров хорошо переносятся между моделями?

2024-02-22 09:30:17

Я читал (*), что распространённым методом атаки на систему искусственного интеллекта типа «чёрный ящик», основанную на нейронной сети, является использование этой системы для тренировки модели-заменителя («surrogate»), чтобы она производила такие же классификации, как исходная чёрная коробка. После ...

Читать оригинал Подробнее

Гугл: Джемма 7Б (google/gemma-7b-it)

2024-02-22 00:00:00

Gemma от Google — это передовая семейная линейка открытых языковых моделей, использующая новейшие технологии декодеров типа «текст-в-текст». Она предлагает возможности работы с английским языком для различных задач обработки текста: вопрос-ответа, резюмирования и рассуждений. Вариант Gemma 7B сопост...

Читать оригинал Подробнее

Наус: Гермес 2 Мистраль 7Б ДПО (nousresearch/nous-hermes-2-mistral-7b-dpo)

2024-02-21 00:00:00

Это базовая 7-миллиардная модель Hermes, оптимизированная методом прямого предпочтения (Direct Preference Optimization — DPO), основанная на Teknium/OpenHermes-2.5-Mistral-7B. Она демонстрирует улучшение показателей во всех протестированных бенчмарках: AGIEval, BigBench Reasoning, GPT4All и Truthful...

Читать оригинал Подробнее

Постепенное увеличение нагрузки на ЦПУ при использовании модели векторных представлений предложений (sentence embeddings) совместно с алгоритмом K-means

2024-02-20 13:24:01

У меня есть производственное приложение, основанное на машинном обучении, использующее Flask и развернутое на сервере Google Cloud Platform с помощью воркеров Gunicorn. В каждом входящем запросе принимается текстовое предложение. Для обработки используется библиотека Sentence Transformers (модель Al...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)