← Вернуться к списку

Всё ещё не проходит проверку на канцелярскую скрепку.

Краткое содержание

Каждый раз, когда выходит новая модель, я провожу кучу простых тестов. Эта модель по-прежнему не проходит большинство из них. На самом деле она сравнима с nano-banana (по моим тестам), при этом обе теперь проходят тест «измени направление этой круговой стрелки» (OpenAI ранее не справлялась).submitted by/u/RobRobbieRobertson[link][comments]

Полный текст статьи пока не загружен.