← Вернуться к списку

AfriSpeech-MultiBench: Специализированный многоотраслевой многоконтинентальный набор эталонных тестов для систем распознавания африканского английского с акцентом (ASR)

Краткое содержание

arXiv:2511.14255v1 Тип объявления: новый Аннотация: Последние достижения в области речевых технологий искусственного интеллекта, включая NotebookLM от Google и API преобразования речи в речь от OpenAI, вызывают значительный интерес к голосовым интерфейсам во всем мире. Несмотря на этот импульс, до сих пор не существует общедоступной оценки моделей, ориентированной на языковое разнообразие Африки. Мы представляем AfriSpeech-MultiBench — первый специализированный набор для оценки более чем ста африканских акцентов английского языка из десяти с лишним стран и семи прикладных областей: финансы, юриспруденция, медицина, общий диалог, колл-центр, именованные сущности и устойчивость к галлюцинациям. Мы оцениваем широкий спектр систем распознавания речи, основанных как на открытых, так и закрытых одно- и мультимодальных моделях ASR (автоматическое распознавание речи) и LLM (больших языковых моделей), используя спонтанные и неспонтанные разговорные данные, полученные из различных открытых наборов данных по английскому языку с африканскими акцентами. Наш эмпирический анализ выявляет систематические различия: открытые модели ASR превосходят другие в контексте спонтанной речи, но ухудшают результаты при наличии шума...

Полный текст статьи пока не загружен.