Сбросить

arXiv:2511.07910v1 Тип объявления: новый Аннотация: Большие языковые модели (LLM) демонстрируют превосходную производительность в задачах рассуждений на естественном языке благодаря предварительному обучению на огромных объёмах неструктурированного текста, что позволяет им понимать логику естестве...

arXiv:2511.08128v1 Тип объявления: новый Аннотация: В данной работе исследуется сжатие контекста для больших языковых моделей (LLM), использующее обучение токенов сжатия для снижения требований к памяти и вычислительным ресурсам при обработке длинных последовательностей. Мы показываем, что предвар...

arXiv:2511.08145v1 Тип объявления: новый Аннотация: Большие языковые модели (LLM) всё чаще рассматриваются как универсальные решения общего назначения для широкого круга задач обработки естественного языка, особенно применительно к английскому языку. Но сохраняется ли эта предпосылка для малоресур...

arXiv:2511.08525v1 Тип объявления: новый Аннотация: Большие модели рассуждений (Large Reasoning Models — LRM) продемонстрировали выдающиеся результаты в сложных задачах благодаря проведению расширенного анализа перед формированием конечных выводов. Помимо повышения производительности, эти детальны...

arXiv:2511.08317v1 Тип объявления: новый Аннотация: Современные методы рецензирования статей часто основываются либо на поверхностных характеристиках рукописей, либо непосредственно на больших языковых моделях (LLM), подверженных иллюзиям, предвзятости оценок и ограниченным возможностям рассуждени...

arXiv:2511.08487v1 Тип объявления: кросс Аннотация: Современные оценки безопасности агентов, управляемых большими языковыми моделями (LLM), главным образом сосредоточены на атомарных угрозах, упуская из виду сложные угрозы, в которых злонамеренные намерения скрыты или размыты внутри сложных задач. ...

arXiv:2409.04181v3 Тип объявления: замена Аннотация: Достижения в области обработки естественного языка произвели революцию в способах взаимодействия пользователей с цифровыми информационными системами, такими как базы данных, делая их доступнее. Тем не менее остаются проблемы, особенно когда важн...

arXiv:2502.17129v2 Тип объявления: замена Аннотация: Обработка длинного контекста является важной темой в области обработки естественного языка (NLP), проходящей через развитие архитектур NLP и предоставляющей огромные возможности большим языкамоделям (LLM), наделяя их потенциалом непрерывного обу...

arXiv:2511.08117v1 Тип объявления: новый Аннотация: Машинное обучение обладает значительным потенциалом для оптимизации различных промышленных процессов. Однако сбор данных остается серьезной проблемой, поскольку он требует значительных временных затрат и финансовых ресурсов. Синтетические данные ...

arXiv:2511.08274v1 Тип объявления: новый Аннотация: В то время как методы дополненного извлечением порождения (Retrieval-Augmented Generation — RAG) традиционно извлекают данные из неструктурированных документов, новая парадигма GraphRAG направлена на использование структурированных данных, таких ...