Как создавать документы в стиле FactSet BlackLine?

18.02.2020 02:01

Краткое содержание

Отчеты Factset BlackLine по сути могут сравнивать два документа 10-Q, поданных в Комиссию по ценным бумагам и биржам США (SEC), и показывать различия между двумя документами. Они выделяют добавленные элементы зеленым цветом, а удаленные — красным с перечеркиванием (по сути это разница документов, но на более долгосрочной основе я бы хотел запускать алгоритмы для анализа различий). Меня не интересует изменение цветов, однако мне хотелось бы получать аналогичные сводки, которые обобщают добавления и удаления. Какой алгоритм искусственного интеллекта или машинного обучения может выполнить аналогичную задачу?

Полный текст

Как создать документы наподобие FactSet BlackLine?
Задать вопрос
Опубликовано 5 лет 9 месяцев назад
Изменено сегодня
Просмотрено 184 раза

Опубликовано 5 лет 9 месяцев назад
0
$\begingroup$
Отчеты FactSet Blackline по сути могут сравнивать два документа отчетности 10-Q Комиссии по ценным бумагам и биржам США (SEC) и показывать различия между ними. Они выделяют добавленные элементы зеленым цветом, а удаленные — красным с перечеркиванием (по сути это разница документов, но в долгосрочной перспективе я бы хотел запускать алгоритмы на основе этих различий).

Меня не интересует изменение цветов, но мне хотелось бы создавать аналогичные извлечения, которые суммируют добавления и удаления.
Какой алгоритм искусственного интеллекта или машинного обучения может сделать то же самое?
обработка естественного языка
рекуррентные нейронные сети
Поделиться
Улучшить этот вопрос
Следить за изменениями
Редактировано 22 июля 2020 г., в 11:33
nbro
43.1 тыс.
14 золотых значков
121 серебряный значок
222 бронзовых значка
Вопрос задан 18 февраля 2020 г., в 2:01
user29468
259
11 бронзовых значков
$\endgroup$
Добавить комментарий |
1 ответ
Сортировать ответы:
Вернуть к исходному порядку
По наивысшему рейтингу (по умолчанию)
По дате изменения (сначала новые)
По дате создания (самые старые сначала)
0
$\begingroup$
Финансовые информационные компании прилагают огромные усилия для того, чтобы правильно выполнять подобные задачи, и их модели обычно являются проприетарными, поэтому реальный ответ вы вряд ли получите на общедоступном сайте.

Конечно, можно получить очень простое приближение путем прямого сравнения текстов ("diff"), а более сложное решение — используя готовые инструменты обработки естественного языка (NLP) или компьютерного зрения, однако, скорее всего, вам не удастся приблизиться к производительности FactSet или других конкурентов, применяя эти инструменты.

Поделиться
Улучшить ответ
Следить за изменениями
Ответ дан 22 февраля 2020 г., в 1:11
John Doucette
9,472
1 золотой значок
20 серебряных значков
52 бронзовых значка
$\endgroup$
Добавить комментарий |
Вам необходимо войти в систему, чтобы ответить на этот вопрос.
Начните спрашивать, чтобы получать ответы
Найдите ответ на свой вопрос, задав его.
Задать вопрос
Изучите связанные вопросы
Обработка естественного языка
Рекуррентные нейронные сети
Посмотрите похожие вопросы с этими тегами.
0
$\begingroup$
Отчеты FactSet Blackline по сути могут сравнивать два документа отчетности 10-Q Комиссии по ценным бумагам и биржам США (SEC) и показывать различия между ними. Они выделяют добавленные элементы зеленым цветом, а удаленные — красным с перечеркиванием (по сути это разница документов, но в долгосрочной перспективе я бы хотел запускать алгоритмы на основе этих различий).

Меня не интересует изменение цветов, но мне хотелось бы создавать аналогичные извлечения, которые суммируют добавления и удаления.
Какой алгоритм искусственного интеллекта или машинного обучения может сделать то же самое?
обработка естественного языка
рекуррентные нейронные сети
Поделиться
Улучшить этот вопрос
Следить за изменениями
Редактировано 22 июля 2020 г., в 11:33
nbro
43.1 тыс.
14 золотых значков
121 серебряный значок
222 бронзовых значка
Вопрос задан 18 февраля 2020 г., в 2:01
user29468
259
11 бронзовых значков
$\endgroup$
Добавить комментарий |
$\begingroup$
Отчеты FactSet Blackline по сути могут сравнивать два документа отчетности 10-Q Комиссии по ценным бумагам и биржам США (SEC) и показывать различия между ними. Они выделяют добавленные элементы зеленым цветом, а удаленные — красным с перечеркиванием (по сути это разница документов, но в долгосрочной перспективе я бы хотел запускать алгоритмы на основе этих различий).

Меня не интересует изменение цветов, но мне хотелось бы создавать аналогичные извлечения, которые суммируют добавления и удаления.
Какой алгоритм искусственного интеллекта или машинного обучения может сделать то же самое?
обработка естественного языка
рекуррентные нейронные сети
Поделиться
Улучшить этот вопрос
Следить за изменениями
Редактировано 22 июля 2020 г., в 11:

Читать оригинал статьи