arXiv:2511.13863v1 Тип объявления: новое Аннотация: Люди превосходно справляются с мультисенсорным восприятием и часто могут распознавать свойства объектов по звуку их взаимодействия. Вдохновленные этим фактом, мы предлагаем новую задачу сегментации источников звуков столкновения (Collision Sound ...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 78996
arXiv:2511.14329v1 Тип объявления: новый Аннотация: Увеличение глубины сети является фундаментальной целью в проектировании нейронных архитектур, поскольку теория предполагает экспоненциальный рост возможностей более глубоких моделей. Благодаря остаточным связям современные нейросети могут масштаб...
arXiv:2511.14391v1 Тип объявления: новый Аннотация: Большие языковые модели (LLM) все чаще используются для принятия решений и планирования в автономном вождении, демонстрируя многообещающие способности к рассуждению и потенциал обобщения на разнообразные дорожные ситуации. Однако текущие основанн...
arXiv:2511.14716v1 Тип объявления: новый Аннотация: Стандартные модели скрытой диффузии полагаются на сложную трехкомпонентную архитектуру, состоящую из отдельного кодировщика, декодера и сети диффузии, которые обучаются в несколько этапов. Такой модульный подход вычислительно неэффективен, привод...
arXiv:2506.22242v2 Тип объявления: замена Аннотация: Использование разнообразных робототехнических данных для предварительного обучения остается серьезной проблемой. Современные методы обычно моделируют распределение действий набора данных с использованием простых наблюдений в качестве входных дан...
arXiv:2505.05513v3 Тип объявления: замена Аннотация: Рис является важнейшим продуктом питания во всем мире и играет важную роль в развитии международной торговли, экономического роста и обеспечения питанием населения. Азиатские страны, такие как Китай, Индия, Пакистан, Таиланд, Вьетнам и Индонезия...
arXiv:2506.12409v2 Тип объявления: замена Аннотация: Обучение с непрерывным восприятием языка и изображений (Vision-Language Continual Learning — VLCL) привлекло значительное внимание исследователей благодаря своим мощным возможностям, а применение стратегий параметрически эффективного дообучения ...
arXiv:2508.11825v2 Тип объявления: замена Аннотация: Последние достижения в области компьютерного зрения преимущественно опирались на данные-ориентированные подходы, использующие глубокое обучение и крупномасштабные наборы данных. Глубокие нейронные сети добились выдающихся успехов в таких задачах...
arXiv:2510.05814v2 Тип объявления: замена Аннотация: Фреймворк регрессии на основе управляемой смеси экспертов (Steered Mixture of Experts) продемонстрировал высокую производительность в задачах реконструкции изображений, компрессии, удаления шумов и повышения разрешения. Однако его высокая вычисл...
arXiv:2506.07917v2 Тип объявления: замена-перекрёстная публикация Аннотация: Динамические расширения трехмерного гауссового сплаттинга (3DGS) обеспечивают высококачественные реконструкции с помощью нейронных полей движения, однако пер-Гауссовый нейронный вывод делает эти модели вычислительно дорог...