Главная - AST-AIHub

Семантическая оценка переводов вместо BLEU.

2021-07-07 17:13:55

У меня есть модель генерации текста, и я хочу оценить её вывод, сравнив его с набором эталонных текстов, размеченных людьми. Я изучил метрики машинного перевода и обнаружил, что BLEU обычно используется как основная метрика. Мне не понравилось использовать её, потому что она поверхностна, так как ис...

Читать оригинал Подробнее

Существуют ли какие-либо семантические оценки переводов, помимо BLEU?

2021-07-07 17:13:55

У меня есть модель генерации текста, и я хочу оценить ее вывод, сравнив его с набором эталонных текстов, размеченных людьми. Я изучил метрики машинного перевода и обнаружил, что BLEU обычно используется в качестве основной метрики. Мне не понравилось использовать ее, поскольку она поверхностна, так...

Читать оригинал Подробнее

Как можно использовать байесовские нейронные сети для переноса обучения?

2021-07-06 20:38:18

В обучении с переносом мы используем большие объемы данных из похожих задач для обучения параметров нейронной сети, а затем донастраиваем нейронную сеть на нашей задаче, для которой доступно мало данных. Здесь мы можем рассматривать шаг обучения с переносом как обучение (правильного) априори, а дона...

Читать оригинал Подробнее

Причины «катастрофического спада» в Deep Q-Learning?

2021-06-03 14:33:47

Я реализую некоторые «классические» статьи по Model Free RL, такие как DQN, Double DQN и Double DQN с Prioritized Replay. На различных моделях, запускаемых на CartPole-v1 с использованием одной и той же нейросети, я замечаю, что все вышеупомянутые три модели демонстрируют резкое и серьезное падение ...

Читать оригинал Подробнее

Какую нейронную сеть можно использовать для решения этой задачи оптимизации с ограничениями?

2021-05-01 20:57:31

Пусть $\mathcal{S}$ — набор обучающих данных, где каждый входной вектор $u^i \in \mathcal{S}$ имеет $d$ признаков. Я хочу спроектировать АПН таким образом, чтобы минимизировалась нижеприведённая функция стоимости (сумма квадратов парных разностей между выходными данными модели) и выполнялось заданно...

Читать оригинал Подробнее

Какой алгоритм использовать для классификации данных по пространственным отношениям?

2021-04-22 17:18:41

Предположим, у меня есть набор данных, состоящий из 2D-образцов, похожих на изображения, где значения можно разделить на несколько дискретных уровней (например, 1, 2, 3 и 4), как на изображении ниже, где каждый цвет соответствует различному значению от 1 до 4. Количество раз, когда данный цвет встре...

Читать оригинал Подробнее

Можно ли модифицировать существующую модель трансформатора для оценки следующего наиболее вероятного числа в последовательности чисел?

2021-03-28 03:17:29

Модели на основе архитектур трансформеров (GPT, BERT и т.д.) отлично работают для задач NLP, включая прием входных данных, сгенерированных словами, и выдачу вероятностных оценок следующего слова в качестве результата. Может ли существующая модель трансформера, такая как GPT-2, быть модифицирована дл...

Читать оригинал Подробнее

Как определить класс «безразличия» (не учитываемый класс) в классификации временных рядов в PyTorch?

2021-03-11 13:04:25

Это теоретический вопрос. Постановка задачи: У меня есть задача классификации временных рядов, в которой нужно выдавать классификацию трёх классов для каждого временного шага. Все данные размечены покадрово. Проблема: В датасете больше трех классов (которые также несбалансированы). Моя сеть должна...

Читать оригинал Подробнее

Можно ли использовать глубокое обучение для получения приближенных решений задач теории графов, являющихся NP-трудными?

2021-03-10 20:58:02

Можно ли использовать глубокое обучение для получения приближенных решений к задачам теории графов, являющимся NP-трудными? Если взять, например, задачу коммивояжера (или задачу о максимальной подмножестве) – предположим, у меня есть набор небольших примеров, где я вычисляю оптимальные значения путе...

Читать оригинал Подробнее

CAPTCHA на основе понимания текста и случайных токенов

2021-03-04 11:35:00

Я разработал новый тип CAPTCHA, основанный на понимании текста и случайных токенах. При задаче «Выберите первую пару соседних букв» и случайном токене 8NBA596V пользователю необходимо предоставить решение NB. Он обеспечивает базовую защиту, и атакующему может решить отдельные задачи с определенным у...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)