← Вернуться к списку

Fusionista2.0: Система эффективного поиска в крупномасштабных наборах данных

Краткое содержание

arXiv:2511.12255v1 Тип: новая статья Аннотация: Соревнование Video Browser Showdown (VBS) требует от систем предоставления точных результатов в условиях строгих временных ограничений. Чтобы удовлетворить этот спрос, мы представляем Fusionista2.0 — оптимизированную систему для поиска в видео, ориентированную на скорость и удобство использования. Все основные модули были переработаны для повышения эффективности: предварительная обработка теперь использует ffmpeg для быстрого извлечения ключевых кадров, оптическое распознавание символов применяет Vintern-1B-v3.5 для надежного многозадачного распознавания текста, а автоматическое распознавание речи использует faster-whisper для транскрипции в реальном времени. Для ответов на вопросы применяются облегченные визуально-языковые модели, которые обеспечивают быстрые ответы без высоких затрат, характерных для больших моделей. Помимо этих технических улучшений, Fusionista2.0 представляет собой переработанный пользовательский интерфейс с повышенной отзывчивостью, доступностью и эффективностью рабочего процесса, что позволяет даже неопытным пользователям быстро находить релевантный контент. Оценки показывают, что время поиска было сокращено до 75%, при сохранении точно

Полный текст статьи пока не загружен.