Создание набора данных рецептов македонской кухни: сбор, синтаксический разбор и сравнительный анализ
Краткое содержание
arXiv:2510.14128v2 Тип объявления: замена Аннотация: Вычислительная гастрономия всё больше полагается на разнообразные высококачественные наборы рецептов для отражения региональных кулинарных традиций. Хотя существуют крупномасштабные коллекции для основных языков, рецепты македонской кухни остаются недостаточно представленными в цифровых исследованиях. В данной работе мы представляем первую систематическую попытку построения набора македонских рецептов путём веб-скрейпинга и структурированного синтаксического анализа. Мы рассматриваем проблемы обработки разнородных описаний ингредиентов, включая нормализацию единиц измерения, количества и дескрипторов. Исследование частоты встречаемости и совместного появления ингредиентов, проведённое с использованием таких мер, как точечная взаимная информация (Pointwise Mutual Information) и коэффициент подъёма (Lift score), выявляет характерные сочетания ингредиентов, отличающие македонскую кухню. Полученный набор данных представляет собой новый ресурс для изучения культуры питания на недостаточно представленных языках и даёт представление о уникальных особенностях македонской кулинарной традиции.
Полный текст статьи пока не загружен.