Главная - AST-AIHub

OpenAI: GPT-3.5 Turbo (устаревшая версия v0613) (openai/gpt-3.5-turbo-0613)

2024-01-25 00:00:00

GPT-3.5 Turbo — самая быстрая модель от OpenAI. Она способна понимать и генерировать естественный язык или код и оптимизирована для обработки диалогов и традиционных задач завершения текста. Обучающие данные актуальны до сентября 2021 года.

Читать оригинал Подробнее

OpenAI: Предварительный просмотр GPT-4 Turbo (openai/gpt-4-turbo-preview)

2024-01-25 00:00:00

Предварительная версия модели GPT-4 с улучшенным выполнением инструкций, поддержкой формата JSON, воспроизводимыми результатами, параллельным вызовом функций и другими улучшениями. Обучающие данные: до декабря 2023 года. **Примечание:** сильно ограничена по количеству запросов от OpenAI во время пр...

Читать оригинал Подробнее

Ий 34Б 200К (01-ай/ий-34б-200к)

2024-01-22 00:00:00

Модели серии Yi — это большие языковые модели, созданные разработчиками компании 01.АИ с нуля. Данная версия была обучена на большом объёме контекста, что позволяет обрабатывать около 200 тысяч слов (~1000 абзацев) объединённого входящего и исходящего текста.

Читать оригинал Подробнее

Являются ли параметры LLM синонимами для размерности?

2024-01-20 02:52:06

Например, обладает ли Большой Языковой Модель (LLM) с размером параметров 140 миллиардов 140 миллиардами измерений, как определено в глубоком обучении, как количество узлов на входном слое? Другой способ задать этот вопрос может быть таким: эквивалентно ли 140 млрд параметров утверждению о наличии 1...

Читать оригинал Подробнее

Является ли $s_0$ текущим состоянием в методе градиентного спуска политики?

2024-01-18 12:03:48

Как я понимаю из этого источника (OpenAI), целевая функция в Policy Gradient выглядит следующим образом: $$J(\pi_{\theta})=E_{\tau\sim\pi_{\theta}}[R(\tau)],$$ где $R(\tau)=r_0+r_1+...+r_T$, с $r_t$ взятым из траектории $\tau = (s_0,a_0,s_1,a_1,...)$, где $s_0$ определяется как начальное состояние...

Читать оригинал Подробнее

Nous: Гермес 2 Mixtral 8×7B SFT (nousresearch/nous-hermes-2-mixtral-8x7b-sft)

2024-01-16 00:00:00

Модель Nous Hermes 2 Mixtral 8x7B SFT представляет собой версию с исключительно контролируемым дообучением модели Nous Research, натренированной на архитектуре Mixtral 8x7B MoE (Mixture-of-Experts). Обучение проводилось на более чем миллионе записей преимущественно сгенерированных GPT-4 данных, а т...

Читать оригинал Подробнее

Nous: Гермес 2 Mixtral 8×7B DPO (nousresearch/nous-hermes-2-mixtral-8x7b-dpo)

2024-01-16 00:00:00

Nous Hermes 2 Mixtral 8x7B DPO — новая флагманская модель от Nous Research, прошедшая обучение на основе архитектуры Mixtral 8x7B MoE (LLM). Модель была обучена на более чем миллионе записей преимущественно сгенерированных GPT-4 данных, а также на других высококачественных открытых датасетах из раз...

Читать оригинал Подробнее

Как интерпретировать веса внимания в обученной модели? Надежны ли они?

2024-01-12 23:11:20

Я дообучил две разные модели (Bert и Roberta) на наборе данных для задачи бинарной классификации и сравниваю предложения, в которых модели ошибаются. Я решил использовать веса внимания как метод интерпретируемости, чтобы понять, какие токены вносят наибольший вклад в вывод модели. У меня есть функци...

Читать оригинал Подробнее

Отношение между регуляризацией и (эффективным) дисконтированием в глубоком обучении Q.

2024-01-11 17:56:43

У меня есть обучаемый с подкреплением типа deep-Q-network в среде типа aminigrid. После обучения я могу поместить агента в ряд искусственно созданных ситуаций и измерить его Q-значения, а затем вывести его эффективную ставку дисконтирования на основе этих Q-значений (например, вывести фактор дисконт...

Читать оригинал Подробнее

Существуют ли алгоритмы переноса стиля, использующие несколько изображений (вместо одного)?

2024-01-10 19:04:37

Исходная статья для переноса стиля поддерживает только один входной образ. Однако меня интересует, существует ли модель, использующая несколько изображений, предпочтительно таким образом, что пользователям не требуется предоставлять собственные файлы изображений, а достаточно обучить модель на изобр...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)