arXiv:2511.04910v1 Тип объявления: новый Аннотация: Современные эталонные тесты для визуального поиска документов (VDR) в значительной мере игнорируют языки, отличные от английского, и структурную сложность официальных публикаций. Для устранения этой критической проблемы мы представляем SDS KoPub ...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 75756
arXiv:2511.05184v1 Тип объявления: новый Аннотация: Подход цепочки рассуждений (Chain-of-Thought — CoT) является широко используемым методом повышения способности больших языковых моделей (LLM) к рассуждению. В последнее время CoT применяется в методе дистилляции знаний (Knowledge Distillation — K...
arXiv:2511.05239v1 Тип объявления: новый Аннотация: Древние переводили классический китайский язык на японский, делая аннотации вокруг каждого символа. Мы абстрагируем этот процесс как задачи последовательной разметки (sequence tagging), интегрируя их в современные технологии обработки естественно...
arXiv:2504.10335v2 Тип объявления: замена Аннотация: Токенизация является критически важным этапом обработки естественного языка, особенно с появлением больших языковых моделей (LLM), влияющим на производительность последующих этапов, вычислительные затраты и эффективность. Современные LLM использ...
arXiv:2511.04692v1 Тип объявления: новый Аннотация: Обнаружение фейковых новостей давно является предметом активного исследования в социальных сетях. Последние работы показывают, что включение эмоциональной окраски как новостного содержания, так и пользовательских комментариев способно повысить эф...
arXiv:2511.04754v1 Тип объявления: новый Аннотация: Мы количественно оцениваем лингвистическое разнообразие подписей изображений с помощью дисперсии удивления — разброса отрицательных логарифмических вероятностей на уровне токенов внутри набора подписей. На тестовом наборе MSCOCO мы сравниваем пят...
arXiv:2511.04800v1 Тип объявления: новый Аннотация: Обучение с подкреплением на верифицируемых вознаграждениях (RLVR) зарекомендовало себя как эффективный подход для повышения способностей рассуждения больших языковых моделей (LLM). Семейство методов групповой относительной оптимизации политики (G...
arXiv:2511.04921v1 Тип объявления: новый Аннотация: Агенты больших языковых моделей становятся всё более эффективными в веб-задачах, таких как информационный поиск и сложное рассуждение. Эти новые возможности вызвали всплеск исследовательского интереса к разработке агентов LLM (Large Language Mode...
arXiv:2511.04989v1 Тип объявления: новый Аннотация: Знания об эмоциональных событиях представляют собой важный вид знаний, который применяется для повышения эффективности различных приложений. Однако такие события трудно получить, особенно общие или обобщённые эмоциональные события, независимые от...
arXiv:2511.05080v1 Тип объявления: новый Аннотация: Растущее стремление населения заботиться о своем здоровье и потребление биомедицинской информации в цифровом формате требуют масштабируемых решений для автоматического преобразования сложных научных и технических документов на простой язык. Автом...