Это вариант модели диалогового взаимодействия серии StripedHyena, разработанный совместно компаниями Together и Nous Research. StripedHyena применяет новую архитектуру, конкурирующую с традиционными трансформерами, особенно в обработке длинных контекстов данных. Она объединяет механизмы внимания с ...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 74521
Версия v2 Psyfighter — объединённая модель, созданная участниками сообщества KoboldAI Джебом Картером и ТвистедШэдоуз благодаря сервису объединения моделей от KoboldAI. Цель состояла в добавлении медицинских данных для дополнения вымышленных способностей модели деталями анатомии и психического сост...
Меня интересует математическое обоснование использования функции softmax в качестве функции активации в механизмах self-attention в нейронных сетях. В частности, меня интересует, существует ли теоретическая основа, которая требует использования softmax по сравнению с другими функциями активации. So...
У меня есть PDF, в котором раскрываются различные корпоративные политики и механизмы управления ими. Это гораздо больше, но суть вы понимаете. С другой стороны, у меня есть набор правил и положений, определяющих, что должно быть включено в вышеупомянутый PDF. Как и ожидалось, правила и положения сфо...
Модели серии Yi — это большие языковые модели, созданные разработчиками компании 01.АИ с нуля. Данная модель с 34 миллиардами параметров была настроена для ведения диалогов.
От создателя MythoMax объединяется набор моделей, предназначенный для снижения предвосхищения слов, ошибок и прочих нежелательных выражений в данных ролевых диалогов ChatGPT. Объединяет модели Neural Chat 7B, Airoboros 7b, Toppy M 7B, Zepher 7b beta, Nou Capybara 34B, OpenHeremes 2.5 и многие други...
Модели серии Yi — это большие языковые модели, разработанные с нуля специалистами компании 01.АИ. Данная версия представляет собой базовую модель с 6 миллиардами параметров.
Модели серии Yi — это большие языковые модели, созданные разработчиками компании 01.АИ с нуля. Данная версия представляет собой базовую модель с 34 миллиардами параметров.
Серия Capybara — это коллекция наборов данных и моделей, созданных путем тонкой настройки (fine-tuning) на данных, разработанных компанией Nous, преимущественно внутри компании. Версия V1.9 применяет техники разбалансировки (unalignment), обеспечивающие более последовательный и динамичный контроль....
При создании нейронной сети для прогнозирования влияния рисков на стоимость проекта, какие методы используются для инициализации весов, предоставляемых скрытым слоям и выходному слою?