arXiv:2511.07124v1 Тип объявления: кросс Аннотация: Большие языковые модели (LLM) продемонстрировали сильные способности к рассуждениям через метод подсказок типа *цепочка мыслей* (CoT), который позволяет проводить пошаговое промежуточное рассуждение. Однако явные методы CoT полагаются на дискретны...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 75756
arXiv:2511.07262v1 Тип объявления: кросс Аннотация: Научное машинное обучение (SciML) объединяет данные, полученные на основе наблюдений, с физическими моделями для решения сложных проблем науки и техники. Однако проектирование архитектур SciML, формулировка функций потерь и стратегии обучения оста...
arXiv:2511.07318v1 Тип объявления: кросс Аннотация: Несмотря на значительные достижения, большие языковые модели (LLM) продолжают демонстрировать иллюзии восприятия, порождая правдоподобные, но неверные ответы. В данной работе мы выделяем критически важную, однако ранее недостаточно изученную катег...
arXiv:2511.07413v1 Тип анонса: кросс Аннотация: Агенты ИИ, способные управлять пользовательскими интерфейсами, обладают потенциалом преобразовать взаимодействие человека с цифровыми устройствами. Для ускорения данного преобразования необходимы два фундаментальных компонента: высококачественные набо...
arXiv:2108.10346v2 Тип объявления: замена Аннотация: Для повышения прозрачности машин обучения, таких как глубокие нейронные сети (DNN), была создана область интерпретируемого ИИ (XAI), предназначенная для объяснения прогнозов DNN. Несмотря на существование различных методов интерпретаций, популяр...
arXiv:2410.15483v4 Тип объявления: замена Аннотация: Постобучение больших языковых моделей (LLM), которое обычно включает этап контролируемого дообучения (SFT) и этап обучения предпочтениям (RLHF или DPO), имеет решающее значение для эффективного и безопасного применения LLM. Широко распространённ...
arXiv:2411.07959v3 Тип объявления: замена Аннотация: Святым Граалем машинного обучения является возможность реализации непрерывного федеративного обучения (CFL), которое повышает эффективность, конфиденциальность и масштабируемость систем ИИ при обучении на потоковых данных. Основная проблема сист...
arXiv:2407.01599v3 Тип объявления: замена-перекрёстная публикация Аннотация: Быстрая эволюция искусственного интеллекта (ИИ), обусловленная развитием больших языковых моделей (LLM) и визуально-языковых моделей (VLM), привела к значительным достижениям во многих технологических областях. Хотя эти м...
arXiv:2412.12987v3 Тип объявления: замена-перекрёстная публикация Аннотация: Конусная оптимизация играет ключевую роль во многих задачах машинного обучения (ML). Однако практические алгоритмы для конусно-ограниченных задач машинного обучения с большими наборами данных часто ограничены конкретными ...
arXiv:2411.04372v3 Тип анонса: замена Аннотация: Мы представляем новый бенчмарк, предназначенный для строгого тестирования возможностей больших языковых моделей (LLM) в области математического рассуждения и синтеза алгоритмического кода. Бенчмарк включает задачи генерации целочисленных последовате...