ContentReader Engine SDK
Многофункциональный инструментарий разработчика, который позволяет встраивать в приложения интеллектуальные технологии распознавания данных. С помощью OCR на основе технологий искусственного интеллекта вы можете создавать приложения с функциями качественного распознавания документов, изображений, фотографий, классификации документов, сохранение сканированных документов в файлы форматов Word, Excel и PDF с возможностью поиска.Возможности:
- Полный спектр технологий распознавания - SDK позволяет использовать отмеченные многими наградами технологии полнотекстового и зонального распознавания печатного (OCR) и рукопечатного (ICR) текстов, а также распознавать штрихкоды (OBR).
- Эффективные инструменты обработки PDF - Конвертируйте документы в PDF и PDF/A с возможностью поиска. При импортировании PDF можно добавлять текстовый слой с сохранением настроек файла. Извлекайте XML-данные из импортированных файлов в формате PDF/A-3 и добавляйте их при сохранении файлов в формате PDF/A-3.
- Искусственный интеллект и машинное обучение - Эффективные технологии с элементами искусственного интеллекта и машинного обучения в сочетании с ADRT-технологиями позволяют определять логическую структуру и форматирование документа, например, таблицы, колонтитулы и шрифты, чтобы с высокой точностью воссоздать исходный документ.
- Многоядерные процессоры и параллельная обработка - Воспользуйтесь гибкой и масштабируемой архитектурой ContentReader® Engine для обработки большого числа страниц, например, при распознавании большого потока документов, книг или архивов. Распознавание проходит значительно быстрее за счет поддержки многоядерных процессоров и параллельной обработки в нескольких потоках.
- Передовые возможности предобработки изображений - Точность распознавания можно повысить за счет предобработки и оптимизации изображений перед началом OCR-процесса. Выравнивание, изменение поворота, коррекция искажения, выпрямление строк, разделение на страницы, адаптивная бинаризация, шумопонижение и не только — все это позволяет распознавать изображения даже низкого качества.
- Профили распознавания для быстрого внедрения - В предопределенных профилях обработки содержатся необходимые параметры, позволяющие быстро и точно распознавать текст в рамках определенных повторяющихся задач. Они также помогают ускорить процесс разработки и исключить необходимость настраивать систему вручную.
- Готовое решение для распознавания визитных карточек и MRZ - BCR API и MRZ API позволяют распознавать визитные карточки и машинно-считываемых зоны (MRZ) в документах, удостоверяющих личность, загранпаспортах или визах. Они обеспечивают доступ к значениям отдельных полей с минимальными затратами на программирование.
- Классификация документов с помощью технологий машинного обучения и обработки естественного языка - В передовых алгоритмах классификации ContentReader® Engine используются технологии машинного обучения, оптического распознавания символов и обработки естественного языка, что позволяет качественно определять типы документов.
- Библиотека примеров кода - Обширный набор примеров кода содержит инструкции по применению OCR SDK, примеры работы технологии и может быть использован для разработки решений. В каждом разделе библиотеки содержатся фрагменты кода и руководство по выполнению определенных задач.
- Подробная документация и поддержка - Подробная документация помогает оптимизировать процесс интеграции. Есть вопросы? На протяжении всего срока действия пробной версии пользователи могут свободно обращаться в техническую поддержку.
- Сравнение документов - ContentReader® Engine позволяет сравнить две версии одного документа и найти в них различия. При этом документы могут быть в различных форматах, например, Microsoft Word, PDF, TIFF, JPEG и других.
