Главная - AST-AIHub

Статья Tsinghua для конференции ICLR отозвана из-за многочисленных сгенерированных ИИ цитирований.

2025-11-18 03:26:44

Сегодня просматривал отозванные статьи ICLR:Рецензенты утверждают, что оптимальный транспорт не связан с машинным обучениемРецензенты не читают статью, а авторы отзывают работы из-за разочарования в качестве рецензий ICLRОчевидно сгенерированные ИИ рецензииНо эта работа выделилась — статья под руков...

Читать оригинал Подробнее

thenlper: gte-base (thenlper/gte-base) (перевод идентичен оригиналу, поскольку текст представляет собой название модели и её обозначение, перевод которых не требуется)

2025-11-18 02:43:40

Модель встраивания `gte-base` кодирует английские предложения и абзацы в плотное векторное пространство размерностью 768, обеспечивая эффективные и качественные семантические вложения, оптимизированные для задач определения текстового сходства, семантического поиска и кластеризации.

Читать оригинал Подробнее

thenlper: gte-large (thenlper/gte-large) (Точный перевод технического названия сохранён без изменений.)

2025-11-18 02:40:55

Модель встраивания gte-large преобразует английские предложения, абзацы и умеренно длинные документы в плотное векторное пространство размерностью 1024, обеспечивая высококачественные семантические вложения, оптимизированные для информационного поиска, оценки семантического сходства текста, переранж...

Читать оригинал Подробнее

Источники: Databricks ведет переговоры о привлечении финансирования с оценкой стоимости более $130 млрд, что примерно на 30% выше показателя сентября, когда компания привлекла $1 млрд в раунде финансирования серии K с оценкой в $100 млрд (The Information).

2025-11-18 02:40:01

Информация: Источники: Databricks ведет переговоры о привлечении финансирования с оценкой компании более $130 млрд, что примерно на 30% выше показателя сентября, когда компания привлекла $1 млрд в раунде Series K с оценкой в $100 млрд. Databricks, провайдер баз данных, чьи инструменты помогают кли...

Читать оригинал Подробнее

intfloat: e5-large-v2 (intfloat/e5-large-v2) (перевод идентичен оригиналу, поскольку исходный текст представляет собой название модели и её обозначение, перевод которых не требуется)

2025-11-18 02:37:12

Модель встраивания e5-large-v2 отображает английские предложения, абзацы и документы в плотное векторное пространство размерностью 1024, обеспечивая высоко точные семантические вложения, оптимизированные для задач поиска, семантического поиска, переранжирования и оценки сходства.

Читать оригинал Подробнее

intfloat: e5-base-v2 (intfloat/e5-base-v2) (Текст идентичен оригиналу, поскольку представляет собой название модели и ссылку — перевод здесь неуместен.)

2025-11-18 02:33:12

Модель встраивания e5-base-v2 кодирует английские предложения и абзацы в плотное векторное пространство размерностью 768, создавая эффективные и высококачественные семантические вложения, оптимизированные для выполнения задач вроде семантического поиска, оценки сходства, извлечения и кластеризации.

Читать оригинал Подробнее

многократный-float: многоязычный-e5-большой (intfloat/многоязычный-e5-большой) (Note: The original text seems to be a mix of technical terms and a specific model name. "multilingual" is translated as "многоязычный", which is common in the context of language models, but "e5-large" remains unchanged since it's likely a specific model identifier.)

2025-11-18 02:30:47

Модель встраивания многоязычной-e5-large кодирует предложения, абзацы и документы на более чем 90 языках в пространство плотных векторов размерностью 1024, обеспечивая надежные семантические вложения, оптимизированные для многоязычного поиска, межъязыковой схожести и масштабируемого поиска данных.

Читать оригинал Подробнее

Sentence Transformers: paraphrase-MiniLM-L6-v2 (sentence-transformers/paraphrase-minilm-l6-v2) Предобученная языковая модель Sentence Transformers версии paraphrase-MiniLM-L6-v2 Модель предназначена для преобразования предложений в векторные представления фиксированной длины, подходящие для вычисления семантического сходства между предложениями. Она оптимизирована для выполнения задач парафразинга — нахождения близких по смыслу формулировок одного и того же содержания. Модель основана на архитектуре MiniLM с шестью слоями трансформера и обучена на больших корпусах текста для эффективного сопоставления смысла различных выражений.

2025-11-18 02:20:54

Модель встраивания `paraphrase-MiniLM-L6-v2` преобразует предложения и короткие абзацы в плотное векторное пространство размерностью 384, создавая высококачественные семантические вложения, оптимизированные для обнаружения перефразирований, оценки семантического сходства, кластеризации и выполнения ...

Читать оригинал Подробнее

Кто-нибудь использовал ONNX Runtime (ORT) + CUDA для многоязычных моделей эмбеддингов (например, LaBSE) на GPU?

2025-11-18 02:17:19

У меня есть проект, в котором мы должны использовать LLM для построения матриц семантической близости. Я делаю это в PySpark с помощью AWS EMR и модели labse от Google. Я конвертировал модель labse в формат ONNX Runtime, чтобы облегчить мой ML-пайплайн в Spark без установки PyTorch, TensorFlow или S...

Читать оригинал Подробнее

Sentence Transformers: all-MiniLM-L12-v2 (sentence-transformers/all-minilm-l12-v2) Предобученная языковая модель Sentence Transformers версии all-MiniLM-L12-v2.

2025-11-18 02:15:55

Модель встраивания all-MiniLM-L12-v2 отображает предложения и короткие абзацы в плотное векторное пространство размерностью 384, создавая эффективные и высококачественные семантические вложения, оптимизированные для задач вроде семантического поиска, кластеризации и оценки сходства.

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)