К разговорному распознаванию венгерской речи: введение наборов данных BEA-Large и BEA-Dialogue

2025-11-18 05:00:00

Краткое содержание

arXiv:2511.13529v1 Тип объявления: новый Аннотация: Развитие технологий автоматического распознавания речи (ASR) значительно продвинулось благодаря обширным наборам данных для высокоресурсных языков, тогда как такие языки, как венгерский, остаются недостаточно представленными из-за ограниченного количества спонтанных и разговорных корпусов. Для устранения данного пробела мы представляем два новых набора данных — BEA-Large и BEA-Dialogue, созданных на основе ранее необработанных частей венгерского корпуса устной речи BEA. Набор BEA-Large расширяет BEA-Base добавлением 255 часов спонтанной речи от 433 говорящих, обогащенной подробной сегментированной метаданными. В состав BEA-Dialogue входят 85 часов спонтанных диалогов, представляющих собой венгерский корпус устной речи с естественным характером бесед, разделенных на независимые подмножества по говорящим, что способствует исследованиям в области разговорного ASR и диаранизации говорящих. Мы устанавливаем воспроизводимые базовые показатели на этих наборах данных, используя общедоступные модели ASR, причем тонко настроенная модель Fast Conformer достигает низких показателей ошибок распознавания слов...

Полный текст статьи пока не загружен.

Читать оригинал статьи