← Вернуться к списку

«На чьей вы стороне?» Оценка идеологии политического и новостного контента с помощью больших языковых моделей и выбора демонстраций методом few-shot

Краткое содержание

arXiv:2503.20797v3 Тип объявления: замена Аннотация: Быстрый рост социальных медиа-платформ вызывает озабоченность вопросами радикализации, формирования информационных пузырей и предвзятости контента. Существующие подходы к классификации идеологии ограничены необходимостью значительных усилий человека, маркировки больших объемов данных и неспособностью адаптироваться к меняющимся идеологическим контекстам. В данной статье исследуется потенциал крупных языковых моделей (LLM) для классификации политической идеологии онлайн-контента посредством контекстного обучения (ICL). Наши обширные эксперименты, включающие выбор демонстраций сбалансированным образом по меткам, проведенные на трех наборах данных, состоящих из новостных статей и видеороликов YouTube, показывают, что наш подход значительно превосходит методы нулевого выстрела и традиционные контролируемые методы. Дополнительно мы оцениваем влияние метаданных (например, источника контента и описаний) на классификацию идеологий и обсуждаем последствия такого влияния. Наконец, мы демонстрируем, каким образом указание источника политического и неполитического...

Полный текст статьи пока не загружен.