arXiv:2511.08042v1 Тип объявления: новый Аннотация: Внедрение агентных ИИ-систем предприятиями требует надежных методов оценки, отражающих реальные сценарии эксплуатации. Традиционные бенчмарки моделей больших языковых моделей страдают от загрязнения тренировочных данных и неспособности измерять а...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 75942
arXiv:2511.08108v1 Тип объявления: новый Аннотация: Машинное обучение является важным инструментом оптимизации процессов контроля качества в промышленности. Однако сложность моделей машинного обучения часто ограничивает их практическое применение из-за недостатка интерпретируемости. К тому же мног...
arXiv:2511.08168v1 Тип объявления: новый Аннотация: Данный проект был реализован во втором семестре в рамках проекта Министерства экономики, торговли и промышленности Японии (METI) и Организации развития новых энергетических и промышленных технологий (NEDO) «Развитие конкурентоспособных фундамента...
arXiv:2511.08217v1 Тип объявления: новый Аннотация: Идентификация потенциальных лекарственных соединений является центральной задачей ранних этапов разработки препаратов, традиционно требующей значительных экспериментальных ресурсов. Последние достижения в области искусственного интеллекта, особен...
arXiv:2511.08242v1 Тип объявления: новый Аннотация: По мере распространения агентов ИИ во всех отраслях и приложениях оценка их производительности исключительно на основе инфраструктурных метрик, таких как задержка, время до первого токена или пропускная способность токенов, оказывается недостаточ...
arXiv:2511.08301v1 Тип объявления: новый Аннотация: Переход от человекоцентричных практик разработки программного обеспечения к агент-центричным нарушает существующие среды обмена знаниями среди разработчиков ПО. Традиционные репозитории и сообщества разработчиков, предназначенные для совместного ...
arXiv:2511.08409v1 Тип объявления: новое Аннотация: Проблема недостоверности остаётся устойчивым вызовом для больших языковых моделей (LLM), которые часто порождают правдоподобные, но необоснованные цепочки рассуждений, расходящиеся с воспринимаемыми свидетельствами или конечными выводами. Мы разл...
arXiv:2511.08439v1 Тип объявления: новый Аннотация: Целостность набора данных является фундаментальной основой безопасности и надежности систем искусственного интеллекта, особенно применительно к автономному вождению. В данной статье представлен структурированный подход к разработке безопасных наб...
arXiv:2511.08484v1 Тип объявления: новый Аннотация: Мы предлагаем подход к исправлению уязвимостей больших языковых моделей (LLM), аналогичный выпуску версий программного обеспечения — лёгкий и модульный метод устранения проблем безопасности. Хотя поставщики выпускают улучшенные версии LLM, крупны...
arXiv:2511.07803v1 Тип объявления: кросс Аннотация: Современное рабство затрагивает миллионы людей во всём мире, и нормативные акты вроде законов против современного рабства теперь требуют от компаний публикации подробной отчётности. Однако такие отчёты часто бывают расплывчатыми и несогласованным...