← Вернуться к списку
Всё ещё не проходит проверку на канцелярскую скрепку.
Краткое содержание
Каждый раз, когда выходит новая модель, я провожу кучу простых тестов. Эта модель по-прежнему не проходит большинство из них. На самом деле она сравнима с nano-banana (по моим тестам), при этом обе теперь проходят тест «измени направление этой круговой стрелки» (OpenAI ранее не справлялась).submitted by/u/RobRobbieRobertson[link][comments]
Полный текст статьи пока не загружен.