СИСТЕМНО-АНАЛИТИЧЕСКИЙ ПОДХОД К ПРОЦЕССУ ОЦИФРОВКИ РУКОПИСНЫХ АРХИВНЫХ ДОКУМЕНТОВ С ИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

Наталья Евгеньевна Мащенко, София Сергеевна Сафьянова

Аннотация


В статье исследуется применение системно-аналитического подхода к процессу оцифровки рукописных архивных документов с использованием технологий искусственного интеллекта. Оцифровка рассматривается как сложная социотехническая система, включающая технологические, организационные и экспертные компоненты. Раскрыта структура процесса цифровизации, включающая этапы сканирования, предобработки изображений, анализа особенностей рукописного текста, распознавания, постобработки и контроля качества. Особое внимание уделено применению нейросетевых методов распознавания рукописного текста (HTR), сверточных и трансформерных моделей, а также языковых моделей для контекстной верификации и коррекции результатов распознавания. Проанализированы современные инструменты (Transkribus, Kraken, языковые модели) и практика их применения в архивной деятельности на примере проекта «Архивный десант». Выявлены основные проблемы цифровизации  и обоснована эффективность гибридной модели взаимодействия человека и искусственного интеллекта.

Полный текст:

PDF

Литература


Qwen Chat – китайский ИИ-ассистент [Электронный ресурс]. – URL: https://chat.qwen.ai (дата обращения: 25.03.2026).

РГАДА – российский государственный архив древних актов [Электронный ресурс]. – URL: http://rgada.info/ (дата обращения: 25.03.2026).

Архивные фонды России в одном окне: ЭЛАР вывел ГИС УИАД на новый уровень [Электронный ресурс] // Официальный сайт ЭЛАР. – 2025. – URL: https://elar.ru/press-center/news/arkhivnye-fondy-rossii-v-nbsp-odnom-okne-elar-vyvel-gis-uiad-na-nbsp-novyy-uroven/ (дата обращения: 25.03.2026).

Краснова Е. Л. Сохранение и трансляция культурного наследия в цифровую эпоху: к построению модели [Электронный ресурс] // Музей. Памятник. Наследие. – 2022. – № 1 (11). – С. 134-140. – URL: https://museumstudy.ru/wp-content/uploads/2017/11/11-2022-ИТОГ-134-140.pdf (дата обращения: 27.03.2026).

Li Y., Chen D., Tang T., Shen X. HTR-VT: распознавание рукописного текста с использованием Vision Transformer [Электронный ресурс] // Pattern Recognition. – 2025. – Т. 158. – Статья 110967. – URL: https://www.sciencedirect.com/science/article/pii/S0031320324007180 (дата обращения: 05.04.2026).

ОРКРТ (ОСГ РМ) [Электронный ресурс] // Тенденции цифровизации в архивном секторе. 2020. — URL: https://www.osgrm.ru/info/news/tendentsii-tsifrovizatsii-v-arkhivnom-sektore/ (дата обращения: 25.03.2026

Garrido-Muñoz C., Ríos-Vila A., Calvo-Zaragoza J. Handwritten Text Recognition: A Survey (Распознавание рукописного текста: обзор) [Электронный ресурс] // arXiv. – 2025. – DOI: 10.48550/arXiv.2502.08417. – URL: https://arxiv.org/abs/2502.08417 (дата обращения: 05.04.2026).

Mahadevkar S., Patil S., Kotecha K. Повышение точности распознавания рукописного текста с использованием гибридного подхода на основе искусственного интеллекта [Электронный ресурс] // MethodsX. – 2024. – Т. 12. – Статья 102654. – URL: https://pmc.ncbi.nlm.nih.gov/articles/PMC10950881/ (дата обращения: 05.04.2026).

Архивный десант [Электронный ресурс] // Научный центр исторической памяти при Президенте Российской Федерации. — URL: https://russiancip.ru/nauchno-prosvetitelskij-proekt-dostupnyj-arhiv/arhivnyj-desant/ (дата обращения: 25.03.2026).

Transkribus – платформа для автоматического распознавания и транскрибирования исторических документов [Электронный ресурс] // Transkribus. – URL: https://www.transkribus.org/ (дата обращения: 27.03.2026).

Политика конфиденциальности Kraken [Электронный ресурс] // Kraken: официальный сайт компании. – URL: https://www.kraken.com/ru/legal/privacy (дата обращения: 27.03.2026).


Ссылки

  • На текущий момент ссылки отсутствуют.


(c) 2026 Наталья Евгеньевна Мащенко, София Сергеевна Сафьянова