Сбросить

arXiv:2407.08567v3 Тип объявления: замена-перекрёстная публикация Аннотация: Функция активации играет ключевую роль в оптимизации моделей, однако оптимальный выбор до сих пор остаётся неясным. Например, сигмоидная активация фактически является стандартной функцией активации в сбалансированных клас...

arXiv:2502.13961v4 Тип объявления: замена-перекрёстная Аннотация: Понимание преимуществ глубоких нейронных сетей, обучаемых методом градиентного спуска (GD), по сравнению с неглубокими моделями остаётся открытой теоретической задачей. В данной работе мы вводим класс целевых функций (одно- и многом...

arXiv:2305.06315v2 Тип объявления: замена-перекрёстная публикация Аннотация: Для задач глубокого обучения на графовых структурах данных слои пулинга важны для понижения разрешения (даунсемплинга), снижения вычислительных затрат и минимизации переобучения. Мы определяем слой пулинга, названный nerv...

arXiv:2504.08814v4 Тип объявления: замена-перекрёстная публикация Аннотация: Квантовое федеративное обучение (Quantum Federated Learning — QFL) представляет собой новое направление исследований, использующее достижения квантовых вычислений (quantum computing — QC), чтобы повысить масштабируемость ...

arXiv:2509.15695v2 Тип анонса: замена-перекрёстная публикация Аннотация: Большие мультимодальные модели видения и языка (LVLM) превосходят другие подходы в области описания изображений, визуального вопросно-ответного взаимодействия и робототехники благодаря объединению зрения и языка, однако часто...

arXiv:2509.07055v2 Тип объявления: замена-перекрёстная публикация Аннотация: Мы предлагаем практический последовательный тест для проверки гарантий дифференциальной приватности чёрных ящиков. Тест обрабатывает потоки выходных данных механизмов, обеспечивая корректность выводов в любой момент време...

arXiv:2510.10078v2 Тип объявления: замена-перекрёстная публикация Аннотация: Несмотря на значительный прогресс исследований распознавания эмоций речи (SER), достигнутый благодаря методам глубокого обучения, эта область всё ещё сталкивается с проблемой получения высококачественных размеченных набор...

arXiv:2509.26546v2 Тип объявления: замена-перекрёстная Аннотация: Хотя основанные на больших языковых моделях (LLM) агенты способны решать широкий спектр вопросов, связанных с анализом исходного кода, их ответы не всегда верны. Это ограничивает полезность агента в ситуациях, когда необходима высок...

arXiv:2505.12528v2 Тип объявления: замена-перекрёстная публикация Аннотация: Мы представляем новое семейство алгоритмов для обнаружения и оценки сигнала ранга один из зашумлённого наблюдения при наличии априорной информации о направлении данного сигнала, уделяя особое внимание примерам, когда сигн...

arXiv:2511.10811v1 Тип объявления: новый Аннотация: Мы исследуем предсказание трансформерами длинных шагов Коллатца — сложной арифметической функции, отображающей нечётные целые числа на их далёких последователей в последовательности Коллатца ($ u_{n+1}=\frac{u_n}{2}$, если $u_n$ чётное, $u_{n+1}=...