Главная - AST-AIHub

01.ИИ: Йи Лэдж (01-ай/йи-лэдж)

2024-06-25 00:00:00

Большая языковая модель Yi была разработана компанией 01.АИ с учетом следующих сценариев использования: поиск знаний, классификация данных, чат-боты с человеческим поведением и обслуживание клиентов. Она выделяется своей многоязычной компетентностью, особенно в испанском, китайском, японском, немец...

Читать оригинал Подробнее

AI21: Джамба Инструкт (ai21/jamba-instruct)

2024-06-25 00:00:00

Модель Jamba-Instruct, представленная компанией AI21 Labs, является вариантом модели Jamba с настройкой инструкций, основанной на гибридной архитектуре SSM-трансформера, специально оптимизированной для корпоративных приложений. - Окно контекста размером 256К: позволяет обрабатывать большие объемы и...

Читать оригинал Подробнее

NVIDIA: Немотрон-4 340Б Инструкшен (nvidia/nemotron-4-340b-instruct)

2024-06-23 00:00:00

Nemotron-4-340B-Instruct — англоязычная диалоговая модель, оптимизированная для генерации синтетических данных. Эта большая языковая модель (LLM) представляет собой дообученную версию базовой модели Nemotron-4-340B-Base, предназначенной для одношаговых и многошаговых сценариев общения с контекстной ...

Читать оригинал Подробнее

Подходит ли глубокое обучение / является ли оно предпочтительным для обнаружения сходства строк и автоматизации приложений? Если да, то какому типу?

2024-06-20 07:16:51

Новичок здесь. Я разработал приложение, которое по сути выполняет следующие действия: выполняет распознавание текста (OCR), проверяет, содержатся ли слова в полученном тексте, и затем выполняет действие. Если ни одного слова из заданного списка не обнаружено, то использует алгоритмы сходства строк, ...

Читать оригинал Подробнее

Антропик: Клод 3.5 Соннет (2024-06-20) (anthropic/claude-3.5-sonnet-20240620)

2024-06-20 00:00:00

Claude 3.5 Sonnet обеспечивает возможности лучше Opus, скорость быстрее Sonnet'а при тех же ценах Sonnet. Sonnet особенно хорош в следующих областях: - Программирование: автономное написание, редактирование и выполнение кода с возможностью анализа и отладки ошибок - Наука о данных: усиливает чело...

Читать оригинал Подробнее

ЕС пытается реализовать план по использованию ИИ для сканирования и отчетности о всех частных зашифрованных коммуникациях. Это безумие и нарушает фундаментальные концепции приватности и end-to-end шифрования. Не спите, европейцы. Звоните и доставайте своих представителей в Брюсселе.

2024-06-19 10:20:18

отправлено /u/B3_Kind_R3wind_[ссылка][комментарии]

Читать оригинал Подробнее

Sao10k: Лама 3 Эвриала 70B v2.1 (sao10k/l3-euryale-70b)

2024-06-18 00:00:00

Euryale 70B v2.1 — это модель от Sao10k, ориентированная на творческую ролевую игру. — Улучшена точность следования подсказкам (промптам). — Повышено качество анатомии и пространственного восприятия. — Значительно лучше адаптируется к уникальным и нестандартным форматам оформления/ответов. — Очень ...

Читать оригинал Подробнее

Как агрегируются перплексии по множественным экземплярам?

2024-06-15 19:27:15

Переплетенность (perplexity) $i$-го токена в последовательности номер $k$ определяется следующим образом: $$ P_{ki} = \frac{1}{p(t_{ki})}, $$ где $p(t_{ki})$ — вероятность появления данного токена согласно модели. Агрегированная переплетенность всей $k$-й последовательности вычисляется как геомет...

Читать оригинал Подробнее

Майкрософт: Phi-3 Средний 4К Инструктаж (microsoft/phi-3-medium-4k-instruct)

2024-06-15 00:00:00

Phi-3 4K Medium — мощная модель с 14 миллиардами параметров, предназначенная для продвинутого понимания языка, рассуждений и выполнения инструкций. Оптимизированная путём контролируемой тонкой настройки и корректировки предпочтений, она показывает отличные результаты в задачах, связанных с здравым с...

Читать оригинал Подробнее

StarCoder2 15B Инструкционный (bigcode/starcoder2-15b-instruct)

2024-06-09 00:00:00

StarCoder2 15B Instruct отлично справляется с задачами программирования, преимущественно на Python. Это первая самообученная открытая большая языковая модель (LLM), разработанная командой BigCode. Данная модель была дообучена без каких-либо аннотаций от человека или дистиллированных данных от пропри...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)