Главная - AST-AIHub

SDS KoPub VDR: Эталонный набор данных для визуального поиска документов в корейских публичных документах

2025-11-10 05:00:00

arXiv:2511.04910v1 Тип объявления: новый Аннотация: Современные эталонные тесты для визуального поиска документов (VDR) в значительной мере игнорируют языки, отличные от английского, и структурную сложность официальных публикаций. Для устранения этой критической проблемы мы представляем SDS KoPub ...

Читать оригинал Подробнее

Эффективность цепочки рассуждений при извлечении способности рассуждать из больших языковых моделей

2025-11-10 05:00:00

arXiv:2511.05184v1 Тип объявления: новый Аннотация: Подход цепочки рассуждений (Chain-of-Thought — CoT) является широко используемым методом повышения способности больших языковых моделей (LLM) к рассуждению. В последнее время CoT применяется в методе дистилляции знаний (Knowledge Distillation — K...

Читать оригинал Подробнее

Перевод через аннотацию: вычислительное исследование перевода классического китайского языка на японский

2025-11-10 05:00:00

arXiv:2511.05239v1 Тип объявления: новый Аннотация: Древние переводили классический китайский язык на японский, делая аннотации вокруг каждого символа. Мы абстрагируем этот процесс как задачи последовательной разметки (sequence tagging), интегрируя их в современные технологии обработки естественно...

Читать оригинал Подробнее

MorphTok: Морфологически обоснованная токенизация для индийских языков

2025-11-10 05:00:00

arXiv:2504.10335v2 Тип объявления: замена Аннотация: Токенизация является критически важным этапом обработки естественного языка, особенно с появлением больших языковых моделей (LLM), влияющим на производительность последующих этапов, вычислительные затраты и эффективность. Современные LLM использ...

Читать оригинал Подробнее

SARC: Глубокая кластеризация ролей с учетом эмоциональной окраски для обнаружения фейковых новостей

2025-11-10 05:00:00

arXiv:2511.04692v1 Тип объявления: новый Аннотация: Обнаружение фейковых новостей давно является предметом активного исследования в социальных сетях. Последние работы показывают, что включение эмоциональной окраски как новостного содержания, так и пользовательских комментариев способно повысить эф...

Читать оригинал Подробнее

Удивление выявляет пробелы разнообразия в описании изображений, а разные оценщики меняют картину

2025-11-10 05:00:00

arXiv:2511.04754v1 Тип объявления: новый Аннотация: Мы количественно оцениваем лингвистическое разнообразие подписей изображений с помощью дисперсии удивления — разброса отрицательных логарифмических вероятностей на уровне токенов внутри набора подписей. На тестовом наборе MSCOCO мы сравниваем пят...

Читать оригинал Подробнее

Изучение данных, оставшихся после обучения методом подкрепления, применительно к языковой модели, основанной на рассуждениях

2025-11-10 05:00:00

arXiv:2511.04800v1 Тип объявления: новый Аннотация: Обучение с подкреплением на верифицируемых вознаграждениях (RLVR) зарекомендовало себя как эффективный подход для повышения способностей рассуждения больших языковых моделей (LLM). Семейство методов групповой относительной оптимизации политики (G...

Читать оригинал Подробнее

AgentExpt: Автоматизация проектирования экспериментов ИИ с помощью агента поиска ресурсов на основе больших языковых моделей (LLM)

2025-11-10 05:00:00

arXiv:2511.04921v1 Тип объявления: новый Аннотация: Агенты больших языковых моделей становятся всё более эффективными в веб-задачах, таких как информационный поиск и сложное рассуждение. Эти новые возможности вызвали всплеск исследовательского интереса к разработке агентов LLM (Large Language Mode...

Читать оригинал Подробнее

Получение типичных эмоционально окрашенных событий китайского языка с использованием большой языковой модели

2025-11-10 05:00:00

arXiv:2511.04989v1 Тип объявления: новый Аннотация: Знания об эмоциональных событиях представляют собой важный вид знаний, который применяется для повышения эффективности различных приложений. Однако такие события трудно получить, особенно общие или обобщённые эмоциональные события, независимые от...

Читать оригинал Подробнее

О показателях упрощения текста и универсальных больших языковых моделях (LLM) для доступной медицинской информации, а также о потенциальном архитектурном преимуществе класса настраиваемых инструкциями моделей LLM

2025-11-10 05:00:00

arXiv:2511.05080v1 Тип объявления: новый Аннотация: Растущее стремление населения заботиться о своем здоровье и потребление биомедицинской информации в цифровом формате требуют масштабируемых решений для автоматического преобразования сложных научных и технических документов на простой язык. Автом...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)