Open Access System for Information Sharing

Login Library

 

Thesis
Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

엔지니어링 문서의 디지털화를 위한 AI기반 표 인식 알고리즘 개발: 제철소 설비 사양서 사례

Title
엔지니어링 문서의 디지털화를 위한 AI기반 표 인식 알고리즘 개발: 제철소 설비 사양서 사례
Authors
김채연
Date Issued
2022
Publisher
포항공과대학교
Abstract
When dealing with plant sustainability projects, the plant owner and the supplier need to exchange lots of technical information and clarifications in the bidding process of equipment purchase orders (POs). Although the Fourth Industrial Revolution has arrived, the plant owners and suppliers’ equipment engineers still rely on a traditional and manual checking process in handling technical documents such as POs. Literature review shows that existing research and commercial programs targeted relatively simple non-technical documents and are often limited to recognizing the texts inside tables in POs. The purpose of this study is to achieve complete digitization of technical documents by merging and recognizing table structures and inner texts. Major tables in POs for steel plant capital projects are classified into two major types according to the level of the table’s header, then are automatically analyzed its layout. Based on the layout analysis, a rule-based AI algorithm, the Table Recognition (TRC-R) model was developed. TRC-R model was implemented with Python and utilized the OpenCV specialized for optical character recognition (OCR) to recognize the structure of the table and utilized the PDFminer to recognize the text inside the table. After extracting the coordinates of the recognized table structure and internal texts, the table was recognized and converted into an equivalent database form, including comma-separated values (CVS) and Excel. As a result of the performance evaluation of TRC-R model, the F1 score was measured to be 96.9%, which is a reliable level for practical implementation in the industry. Performance could be improved by securing additional data to supplement the cases that the TRC-R model's rule-based algorithm cannot handle. This model was programmed into Purchase Order Recognition and Analysis Systems (PORAS), the interface that automatically detects and compares owners’ risk clauses in POs. The PORAS prototype was further converted into a Web-based cloud platform for the user’s system interface utilizing the Spring Framework and Angular 11. Through this study, main tables in technical documents such as POs are recognized automatically and converted into a database form, thereby providing a basis for introducing automation and intelligent technology to document processing for plant capital projects.
지속 가능성을 위한 플랜트 개조 프로젝트를 수행하기 위해 플랜트의 소유주(owner)와 공급업체는 입찰 과정에서 구입 사양서 (purchase order, PO)를 통해 많은 기술 정보와 설명을 교환해야 한다. 4차 산업혁명이 도래하였으나, 플랜트 산업에서 플랜트 소유주와 공급업체의 장비 엔지니어는 PO와 같은 기술 문서를 검토할 때 여전히 수동으로 검토하는 전통적 방식에 의존하고 있다. 문헌 검토에 따르면 기존의 연구와 상용 프로그램은 비교적 단순한 비(非) 기술 문서를 대상으로 하며, 표 내부의 텍스트를 인식하는 것에만 국한된 경우가 많았다. 본 연구의 목표는 표의 구조와 텍스트의 병합하여 인식함으로써 기술 문서의 온전한 디지털화를 이루는 것이다. 실제 제철소 설비 투자에 사용되는 PO의 핵심 표를 헤더(header)의 단계에 따라 두 가지 유형으로 분류한 뒤, 자동으로 레이아웃(layout)을 분석했다. 이를 바탕으로 규칙 기반 AI 알고리즘인 Table Recognition (TRC-R) 모델을 개발했다. TRC-R 모델은 Python으로 구현되었으며 optical character recognition (OCR)에 특화된 OpenCV를 주로 활용하여 표의 구조를 인식했고, PDFminer를 주로 활용하여 표 내부의 텍스트를 인식했다. 인식된 표의 구조와 텍스트의 좌표 정보를 추출한 후, 표를 인식하여 CSV, Excel과 같은 형태로 데이터베이스에 저장했다. TRC-R 모델의 성능 평가 결과, F1 score가 96.9%로 측정되었고 이는 업계에서 실용화하기에 신뢰할 수 있는 수준이다. 데이터를 추가 확보하여 TRC-R 모델의 규칙 기반 알고리즘이 다루고 있지 않은 경우에 대해 보완한다면 성능을 향상시킬 수 있다. 이 모델은 저자가 속한 연구팀이 개발한 AI를 활용한 PO의 독소조항을 자동으로 탐지하고 비교하는 인터페이스인 Purchase Order Recognition and Analysis Systems (PORAS)에 내장됐다. PORAS 프로토타입은 Spring Framework와 Angular 11을 활용하여 사용자의 시스템 인터페이스를 위한 웹 (Web) 기반 클라우드 플랫폼 (cloud platform)으로도 개발됐다. 본 연구를 통해 PO와 같은 기술 문서의 핵심 표를 인식하여 데이터베이스화함으로써, 플랜트 투자 사업의 문서 처리에 자동화 및 지능화 기술을 도입할 수 있는 토대를 제공한다.
URI
http://postech.dcollection.net/common/orgView/200000635344
https://oasis.postech.ac.kr/handle/2014.oak/117377
Article Type
Thesis
Files in This Item:
There are no files associated with this item.

qr_code

  • mendeley

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Views & Downloads

Browse