У меня есть модель генерации текста, и я хочу оценить её вывод, сравнив его с набором эталонных текстов, размеченных людьми. Я изучил метрики машинного перевода и обнаружил, что BLEU обычно используется как основная метрика. Мне не понравилось использовать её, потому что она поверхностна, так как ис...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 77827
У меня есть модель генерации текста, и я хочу оценить ее вывод, сравнив его с набором эталонных текстов, размеченных людьми. Я изучил метрики машинного перевода и обнаружил, что BLEU обычно используется в качестве основной метрики. Мне не понравилось использовать ее, поскольку она поверхностна, так...
В обучении с переносом мы используем большие объемы данных из похожих задач для обучения параметров нейронной сети, а затем донастраиваем нейронную сеть на нашей задаче, для которой доступно мало данных. Здесь мы можем рассматривать шаг обучения с переносом как обучение (правильного) априори, а дона...
Я реализую некоторые «классические» статьи по Model Free RL, такие как DQN, Double DQN и Double DQN с Prioritized Replay. На различных моделях, запускаемых на CartPole-v1 с использованием одной и той же нейросети, я замечаю, что все вышеупомянутые три модели демонстрируют резкое и серьезное падение ...
Пусть $\mathcal{S}$ — набор обучающих данных, где каждый входной вектор $u^i \in \mathcal{S}$ имеет $d$ признаков. Я хочу спроектировать АПН таким образом, чтобы минимизировалась нижеприведённая функция стоимости (сумма квадратов парных разностей между выходными данными модели) и выполнялось заданно...
Предположим, у меня есть набор данных, состоящий из 2D-образцов, похожих на изображения, где значения можно разделить на несколько дискретных уровней (например, 1, 2, 3 и 4), как на изображении ниже, где каждый цвет соответствует различному значению от 1 до 4. Количество раз, когда данный цвет встре...
Модели на основе архитектур трансформеров (GPT, BERT и т.д.) отлично работают для задач NLP, включая прием входных данных, сгенерированных словами, и выдачу вероятностных оценок следующего слова в качестве результата. Может ли существующая модель трансформера, такая как GPT-2, быть модифицирована дл...
Как определить класс «безразличия» (не учитываемый класс) в классификации временных рядов в PyTorch?
Это теоретический вопрос. Постановка задачи: У меня есть задача классификации временных рядов, в которой нужно выдавать классификацию трёх классов для каждого временного шага. Все данные размечены покадрово. Проблема: В датасете больше трех классов (которые также несбалансированы). Моя сеть должна...
Можно ли использовать глубокое обучение для получения приближенных решений к задачам теории графов, являющимся NP-трудными? Если взять, например, задачу коммивояжера (или задачу о максимальной подмножестве) – предположим, у меня есть набор небольших примеров, где я вычисляю оптимальные значения путе...
Я разработал новый тип CAPTCHA, основанный на понимании текста и случайных токенах. При задаче «Выберите первую пару соседних букв» и случайном токене 8NBA596V пользователю необходимо предоставить решение NB. Он обеспечивает базовую защиту, и атакующему может решить отдельные задачи с определенным у...