Главная - AST-AIHub

Функция потерь по запросу ловит сеть в локальных оптимумах.

2024-08-15 17:20:27

Я работаю с прямо распространяющейся нейронной сетью для подгонки следующей простой функции: N(1) = -1 N(2) = -1 N(3) = 1 N(4) = -1 Но я не хочу использовать среднеквадратичную ошибку; я использую пользовательскую функцию потерь, которая "направляет" сеть к правильному выходу другим способом. Моя ...

Читать оригинал Подробнее

Почему эта пользовательская функция потерь застревает по сравнению с среднеквадратичной ошибкой во время обучения?

2024-08-15 17:20:27

Я работаю с прямо распространяющейся нейронной сетью для подгонки следующей простой функции: N(1) = -1 N(2) = -1 N(3) = 1 N(4) = -1 Но я не хочу использовать среднеквадратичную ошибку; я использую пользовательскую функцию потерь, которая "направляет" сеть к правильному выходу другим способом. Моя ...

Читать оригинал Подробнее

Сэкономьте до $400 на билетах на конференцию!

2024-08-15 11:27:24

В течение следующих двух недель вы можете сэкономить до $400 на билетах на конференцию Chatbot Conference 2024. Неважно, являетесь ли вы постоянным участником или впервые присоединяетесь к нашему сообществу — это идеальный шанс познакомиться с будущим технологий ИИ и чат-ботов по сниженной цене. Вот...

Читать оригинал Подробнее

OpenAI: ChatGPT-4о (openai/chatgpt-4o-latest)

2024-08-14 00:00:00

OpenAI ChatGPT 4o регулярно обновляется компанией OpenAI до текущей версии GPT-4o, используемой ChatGPT. Поэтому она немного отличается от API-версии GPT-4o наличием дополнительного обучения с подкреплением человеком (RLHF). Модель предназначена исключительно для исследовательских целей и оценки. К...

Читать оригинал Подробнее

Рост популярности человекоподобных роботов: достижения отрасли, ключевые игроки и сроки внедрения

2024-08-13 16:14:25

Индустрия робототехники стоит на пороге значительных преобразований, многие эксперты — включая генерального директора компании NVIDIA Дженсен Хуанг — считают, что мы приближаемся к своего рода «моменту ChatGPT» для роботов. Публикация «Рост числа человекоподобных роботов: достижения отрасли, ключевы...

Читать оригинал Подробнее

Эфирное Крыло: Звездная Пушка 12Б (эфирное_крыло/мн-звездная-пушка-12б)

2024-08-13 00:00:00

Starcannon 12B v2 — это творческая модель для ролевых игр и написания историй, основанная на архитектуре Mistral Nemo, использующая nothingiisreal/mn-celeste-12b в качестве основы, объединённую с intervitens/mini-magnum-12b-v1.1 методом TIES. Несмотря на большее сходство с моделью Magnum, Starcanno...

Читать оригинал Подробнее

Sao10K: Лама 3 8B Лунарис (sao10k/l3-lunaris-8b)

2024-08-13 00:00:00

Lunaris 8B — универсальная модель общего назначения и ролевых игр, основанная на архитектуре Llama 3. Это стратегическое объединение нескольких моделей, предназначенное для гармоничного сочетания креативности с улучшенной логикой и общими знаниями. Созданная разработчиком Sao10k, эта модель призван...

Читать оригинал Подробнее

Почему интеллектуальные возможности Apple могут разочаровать ожидания?

2024-08-08 18:48:33

С появлением новостей о презентации Apple Intelligence ожидания взлетели до небес. Переход от iPhone к AI-Phone рисует картину будущего, в котором наши устройства — уже не просто инструменты, а партнеры, способные предугадывать наши потребности и действия. Однако среди этой восторженной предвзятости...

Читать оригинал Подробнее

Исследование понимания знаний, вывода и академических исследований по конкретному содержанию в больших моделях

2024-08-07 08:50:55

В настоящее время я изучаю производительность больших моделей в понимании знаний в конкретных областях и пытаюсь построить фреймворк знаний, аналогичный тому, который устанавливают люди при изучении предмета. Это понимание не должно быть безупречным, но должно обеспечивать всестороннее понимание клю...

Читать оригинал Подробнее

OpenAI: GPT-4o (6 августа 2024 г.) (openai/gpt-4o-2024-08-06)

2024-08-06 00:00:00

Версия GPT-4o от 6 августа 2024 года предлагает улучшенную производительность при структурированных выходных данных, включая возможность предоставления схемы JSON через параметр `response_format`. Подробнее здесь. GPT-4o («о» означает «omni», универсальный) — новейшая модель искусственного интеллек...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)