Объединение результатов работы двух различных моделей машинного обучения для точного извлечения данных из счетов: является ли это жизнеспособным подходом?
Краткое содержание
Я работаю (пытаюсь работать) над проектом по извлечению релевантной информации из счетов. В настоящее время я не достигаю значительной точности и пытаюсь придумать новые идеи. Я рассматриваю возможность объединения двух моделей машинного обучения: Lilt и YOLO, но конкретные модели не важны; я хотел бы спросить вас о моей предложенной работе: Первичное Обработка с помощью Lilt: Счет сначала обрабатывается моделью Lilt и OCR-движком для извлечения структурированных данных на основе макета и содержания. Выходные данные Lilt фиксируются в структурированном формате, таком как JSON. Вторичная Обработка с помощью YOLO: Тот же самый счет затем обрабатывается моделью YOLO для обнаружения и извлечения конкретных полей или текстовых блоков (например, номер счета, дата, общая сумма). Выходные данные YOLO аналогично фиксируются в структурированном формате с оценками уверенности. Сравнение и Сопоставление: Я реализую функцию для сравнения выходных данных Lilt и YOLO. Для каждого поля: Если обе модели предоставляют значение, я буду сравнивать оценки уверенности.
Полный текст статьи пока не загружен.