Главная - AST-AIHub

Думай последовательно, рассуждай эффективно: калибровка на основе энергии для скрытого цепочечного рассуждения

2025-11-11 05:00:00

arXiv:2511.07124v1 Тип объявления: кросс Аннотация: Большие языковые модели (LLM) продемонстрировали сильные способности к рассуждениям через метод подсказок типа *цепочка мыслей* (CoT), который позволяет проводить пошаговое промежуточное рассуждение. Однако явные методы CoT полагаются на дискретны...

Читать оригинал Подробнее

AgenticSciML: Коллаборативные многоагентные системы для обнаружения возникающих закономерностей в научном машинном обучении

2025-11-11 05:00:00

arXiv:2511.07262v1 Тип объявления: кросс Аннотация: Научное машинное обучение (SciML) объединяет данные, полученные на основе наблюдений, с физическими моделями для решения сложных проблем науки и техники. Однако проектирование архитектур SciML, формулировка функций потерь и стратегии обучения оста...

Читать оригинал Подробнее

Когда смещение притворяется истиной: Как ложные корреляции подрывают обнаружение иллюзий в больших языковых моделях

2025-11-11 05:00:00

arXiv:2511.07318v1 Тип объявления: кросс Аннотация: Несмотря на значительные достижения, большие языковые модели (LLM) продолжают демонстрировать иллюзии восприятия, порождая правдоподобные, но неверные ответы. В данной работе мы выделяем критически важную, однако ранее недостаточно изученную катег...

Читать оригинал Подробнее

DigiData: Обучение и оценка универсальных агентов управления мобильными устройствами

2025-11-11 05:00:00

arXiv:2511.07413v1 Тип анонса: кросс Аннотация: Агенты ИИ, способные управлять пользовательскими интерфейсами, обладают потенциалом преобразовать взаимодействие человека с цифровыми устройствами. Для ускорения данного преобразования необходимы два фундаментальных компонента: высококачественные набо...

Читать оригинал Подробнее

Объяснение байесовских нейронных сетей

2025-11-11 05:00:00

arXiv:2108.10346v2 Тип объявления: замена Аннотация: Для повышения прозрачности машин обучения, таких как глубокие нейронные сети (DNN), была создана область интерпретируемого ИИ (XAI), предназначенная для объяснения прогнозов DNN. Несмотря на существование различных методов интерпретаций, популяр...

Читать оригинал Подробнее

Понимание забывания при контролируемой тонкой настройке больших языковых моделей (LLM) и обучении предпочтениям — взгляд с позиции выпуклой оптимизации

2025-11-11 05:00:00

arXiv:2410.15483v4 Тип объявления: замена Аннотация: Постобучение больших языковых моделей (LLM), которое обычно включает этап контролируемого дообучения (SFT) и этап обучения предпочтениям (RLHF или DPO), имеет решающее значение для эффективного и безопасного применения LLM. Широко распространённ...

Читать оригинал Подробнее

О сходимости непрерывного федеративного обучения с использованием инкрементально агрегированных градиентов

2025-11-11 05:00:00

arXiv:2411.07959v3 Тип объявления: замена Аннотация: Святым Граалем машинного обучения является возможность реализации непрерывного федеративного обучения (CFL), которое повышает эффективность, конфиденциальность и масштабируемость систем ИИ при обучении на потоковых данных. Основная проблема сист...

Читать оригинал Подробнее

Обзор JailbreakZoo: исследование ландшафта и перспективы взлома крупных языковых моделей и моделей зрения-языка

2025-11-11 05:00:00

arXiv:2407.01599v3 Тип объявления: замена-перекрёстная публикация Аннотация: Быстрая эволюция искусственного интеллекта (ИИ), обусловленная развитием больших языковых моделей (LLM) и визуально-языковых моделей (VLM), привела к значительным достижениям во многих технологических областях. Хотя эти м...

Читать оригинал Подробнее

Стохастические методы внутренней точки для гладкой конической оптимизации с приложениями

2025-11-11 05:00:00

arXiv:2412.12987v3 Тип объявления: замена-перекрёстная публикация Аннотация: Конусная оптимизация играет ключевую роль во многих задачах машинного обучения (ML). Однако практические алгоритмы для конусно-ограниченных задач машинного обучения с большими наборами данных часто ограничены конкретными ...

Читать оригинал Подробнее

Оценка производительности больших языковых моделей на задаче генерации целочисленных последовательностей

2025-11-11 05:00:00

arXiv:2411.04372v3 Тип анонса: замена Аннотация: Мы представляем новый бенчмарк, предназначенный для строгого тестирования возможностей больших языковых моделей (LLM) в области математического рассуждения и синтеза алгоритмического кода. Бенчмарк включает задачи генерации целочисленных последовате...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)