Россияне создали ПО, обучающее ИИ распознавать любые документы

Россияне создали ПО, обучающее ИИ распознавать любые документы

Разработчики Smart Engines создали ПО для обучения ИИ распознавать любые документы более чем на сотни языках. Настройка распознавания будет занимать секунды.

ПО для обучения ИИ

Как стало известно CNews, разработчик ИИ-решений Smart Engines создал ПО «ИИгорь» для автоматической подготовки шаблонов распознавания любых документов. Об этом CNews сообщил гендиректор компании Владимир Арлазаров.

По его словам, система позволяет настраивать распознавание различных типов документов, включая нестандартные формы (анкеты и опросники) с печатным и рукописным заполнением более чем на ста языках. Ранее для добавления нового документа требовалось передавать вендору десятки или сотни примеров для настройки системы распознавания.

ИИ-агент (ПО) позволяет быстро создавать шаблоны для классификации и распознавания документов в системе Smart Document Engine без привлечения вендора, что, по заявлению разработчика, исключает ручной труд.

Решение предназначено для банков, страховых компаний, госучреждений и интеграторов.

Принцип работы и безопасность

«ИИгорь» автоматически обнаруживает и описывает в документе статические элементы, определяет расположение штрихкодов, чекбоксов, полей с рукописным и печатным заполнением, печатей и подписей.

Smart Engines разработали ПО для обучения ИИ чтению любых документов

ПО работает автономно и локально в контуре организации на обычном компьютере. Как подчеркивают в Smart Engines, это обеспечивает конфиденциальность: данные документов не покидают периметр организации ни при распознавании, ни при добавлении новой формы. Доступ к информации не получают ни вендор, ни третьи стороны.

«Он работает без GPU — на сверхлегких нейросетях, благодаря чему настройка распознавания формы занимает несколько секунд», — отметил Арлазаров.

Технологическая основа

В основе решения лежит собственная OCR-платформа Smart Engines для распознавания текста. Весь технологический стек, от алгоритмов анализа структуры документов до агентных ИИ-моделей, разработан внутри компании.

Как утверждают разработчики, это обеспечивает независимость от сторонних библиотек и возможность адаптации под требования заказчика.

Востребовано ли ПО на рынке

«Подобные решения, безусловно, будут востребованы у компаний, где в бизнес-процессах активно используется распознавание бумажных документов нетиповых или уникальных форматов, и автоматическое создание карточек на их основе, — рассказал CNews Product Lead ELMA365 CSP + AI-решения Григорий Старовойтов. — Возможно, технических заданий, чертежей, схем. В первую очередь это организации с большим входящим потоком документов: чем выше объем, тем заметнее экономический эффект от автоматизации и тем выше практическая ценность таких инструментов».

По словам Старовойтова, ключевой интерес в заявленном подходе — возможность дообучения системы без привлечения вендора. «Если речь действительно идет о том, что заказчик может самостоятельно обучать систему распознавать свои уникальные типы документов — нестандартные формы, внутренние бланки, рукописные элементы — это выглядит очень перспективно».

Если система способна обеспечивать высокое качество распознавания, работать быстро и при этом не требовать дорогостоящего оборудования, например GPU, — это будет серьезным конкурентным преимуществом, заключил эксперт.

Чем известна компания

Smart Engines занимается разработкой алгоритмов в области компьютерного зрения, машинного обучения и искусственного интеллекта. Технологиями распознавания Smart Engine пользуются 70% жителей России и больше 275 млн человек по всему миру.

По итогам 2024 г. компания заработала 830 млн руб., что на 80% выше, чем по итогам 2023 г.

Компания была основана в 2016 г. ведущими учеными из нескольких институтов Российской академии наук, специализирующихся на распознавании и обработке изображений. В штате компании более 80 сотрудников, из которых 20 имеют ученые степень.

Добавить комментарий

Кнопка «Наверх»
Мы используем cookie-файлы для наилучшего представления нашего сайта. Продолжая использовать этот сайт, вы соглашаетесь с использованием cookie-файлов.
Принять
Отказаться
Политика конфиденциальности