Сбросить

Привет всем, сегодня я открыл Codex и столкнулся с этим огромным списком невыпущенных внутренних моделей. Мне удалось записать скриншот выпадающего списка прямо до того, как OpenAI, по-видимому, осознала ошибку и исправила ее. Похоже, они случайно выкатили свою внутреннюю тестовую/dogfooding среду в...

Недавно появилось много моделей с экспертами (MOE). Хотя они показывают феноменальную работу со скоростью, вы платите за это снижением когерентности... если только MOE не имеет как минимум 10 млрд активных параметров на токен. Я часто кодировал с этими моделями и пробовал много разных моделей. Самые...

Это обновление моего предыдущего поста, сравнивающего Qwen 3.6 35B и Gemma 4 26B. Я хотел бы уделить особое внимание следующим моментам: 1. Возможно, Gemma 4 26B пострадала от "налога квантования" и показала бы значительно лучшие результаты при 8-битном квантовании. Поэтому на этот раз я хотел прове...

Всем привет, сегодня я открыл Codex и столкнулся с этим огромным списком невыпущенных и внутренних моделей. Мне удалось сделать запись экрана выпадающего списка прямо перед тем, как OpenAI, по-видимому, осознала ошибку и исправила ее. Похоже, они случайно выложили свою внутреннюю тестовую среду (sta...

NotebookLM — одна из лучших и самых полезных ИИ-платформ на рынке, но как только вы начинаете использовать ее регулярно, вы также ощущаете ее ограничения, которые оставляют желать лучшего. Существуют ограничения на количество источников, которые можно добавить в блокнот. Есть лимиты на количество до...

Привет, знаю, это звучит немного нелепо, и, возможно, оно такое, но один из способов, которым я пытаюсь получить высокую оценку по моему классу машинного обучения (ML) в школе, — это заставить опубликовать часть моей работы или что-то похожее, поскольку профессор специально указал это как критерий д...

Сэм Тобин /Reuters: Трибунал Великобритании постановил, что Microsoft должна столкнуться с судебным иском, в котором утверждается, что компания завысила цены для британских предприятий на использование Windows Server в облачных сервисах от Amazon, Google и Alibaba. — Microsoft (MSFT.O) должна столкн...

Никита Бир /@nikitabier:X запускает Пользовательские ленты (Custom Timelines) — функцию на базе Grok, которая позволяет пользователям закреплять любую из более чем 75 тем в своей домашней вкладке. Доступно в раннем режиме для подписчиков Premium на iOS— Дамы и господа, сегодня мы запускаем одно из с...

Всем привет! Я студент последнего курса по программной инженерии и ищу хорошую идею для выпускного проекта (ВКР). Мой основной интерес — это ИИ и машинное обучение, но я также открыт к облачным вычислениям или другим современным технологическим областям, если идея будет значимой и полезной. Я хочу ...

Нашел это интересным и подумал поделиться. Большая проблема, с которой я столкнулся в Qwen 3 MoE, — это то, как плохо он следовал инструкциям, а также очень низкое «ограничение» (dumb point) в контекстном окне. Я был настолько разочарован им, что никогда не пробовал Qwen 3.5 и продолжал использовать...