Сбросить

arXiv:2511.13863v1 Тип объявления: новое Аннотация: Люди превосходно справляются с мультисенсорным восприятием и часто могут распознавать свойства объектов по звуку их взаимодействия. Вдохновленные этим фактом, мы предлагаем новую задачу сегментации источников звуков столкновения (Collision Sound ...

Пошаговая сеть

arXiv:2511.14329v1 Тип объявления: новый Аннотация: Увеличение глубины сети является фундаментальной целью в проектировании нейронных архитектур, поскольку теория предполагает экспоненциальный рост возможностей более глубоких моделей. Благодаря остаточным связям современные нейросети могут масштаб...

arXiv:2511.14391v1 Тип объявления: новый Аннотация: Большие языковые модели (LLM) все чаще используются для принятия решений и планирования в автономном вождении, демонстрируя многообещающие способности к рассуждению и потенциал обобщения на разнообразные дорожные ситуации. Однако текущие основанн...

arXiv:2511.14716v1 Тип объявления: новый Аннотация: Стандартные модели скрытой диффузии полагаются на сложную трехкомпонентную архитектуру, состоящую из отдельного кодировщика, декодера и сети диффузии, которые обучаются в несколько этапов. Такой модульный подход вычислительно неэффективен, привод...

arXiv:2506.22242v2 Тип объявления: замена Аннотация: Использование разнообразных робототехнических данных для предварительного обучения остается серьезной проблемой. Современные методы обычно моделируют распределение действий набора данных с использованием простых наблюдений в качестве входных дан...

arXiv:2505.05513v3 Тип объявления: замена Аннотация: Рис является важнейшим продуктом питания во всем мире и играет важную роль в развитии международной торговли, экономического роста и обеспечения питанием населения. Азиатские страны, такие как Китай, Индия, Пакистан, Таиланд, Вьетнам и Индонезия...

arXiv:2506.12409v2 Тип объявления: замена Аннотация: Обучение с непрерывным восприятием языка и изображений (Vision-Language Continual Learning — VLCL) привлекло значительное внимание исследователей благодаря своим мощным возможностям, а применение стратегий параметрически эффективного дообучения ...

arXiv:2508.11825v2 Тип объявления: замена Аннотация: Последние достижения в области компьютерного зрения преимущественно опирались на данные-ориентированные подходы, использующие глубокое обучение и крупномасштабные наборы данных. Глубокие нейронные сети добились выдающихся успехов в таких задачах...

arXiv:2510.05814v2 Тип объявления: замена Аннотация: Фреймворк регрессии на основе управляемой смеси экспертов (Steered Mixture of Experts) продемонстрировал высокую производительность в задачах реконструкции изображений, компрессии, удаления шумов и повышения разрешения. Однако его высокая вычисл...

arXiv:2506.07917v2 Тип объявления: замена-перекрёстная публикация Аннотация: Динамические расширения трехмерного гауссового сплаттинга (3DGS) обеспечивают высококачественные реконструкции с помощью нейронных полей движения, однако пер-Гауссовый нейронный вывод делает эти модели вычислительно дорог...