← Вернуться к списку

Обеспечение надежности больших языковых моделей (LLM), когда это наиболее важно: пятислойная архитектура для принятия критически важных решений

Краткое содержание

arXiv:2511.07669v1 Тип объявления: новый Аннотация: Современные большие языковые модели (LLM) превосходят в проверяемых областях, где результаты можно проверить до принятия решения, однако оказываются менее надежными при принятии стратегических решений высокого риска с неопределенными исходами. Этот разрыв, обусловленный взаимно усиливающими когнитивными искажениями как у людей, так и у систем искусственного интеллекта (ИИ), ставит под угрозу обоснованность оценок и устойчивость инвестиций в данной отрасли. Настоящий отчет описывает структуру, возникающую в результате систематической качественной оценки семи передовых LLM и трех рыночных кейсов венчурной деятельности в условиях ограниченного времени. Подробное формулирование запросов, предусматривающее партнерство в процессе принятия решений и явную инструкцию избегать угодничества, выдумывания несуществующих фактов, отклонения от темы и нигилизма, позволило достичь начального состояния партнёрства, но оказалось неспособным поддерживать его под операционным давлением. Для поддержания устойчивого защитного состояния партнёрства потребовалась возникшая семиступенчатая процедура калибровки, построенная поверх четырёхступенчатого процесса инициализации, внутри...

Полный текст статьи пока не загружен.