KR102375566B1 - Electronic apparatus that processes medical expenses receipt printed on paper electronically and operating method thereof - Google Patents
Electronic apparatus that processes medical expenses receipt printed on paper electronically and operating method thereof Download PDFInfo
- Publication number
- KR102375566B1 KR102375566B1 KR1020200153486A KR20200153486A KR102375566B1 KR 102375566 B1 KR102375566 B1 KR 102375566B1 KR 1020200153486 A KR1020200153486 A KR 1020200153486A KR 20200153486 A KR20200153486 A KR 20200153486A KR 102375566 B1 KR102375566 B1 KR 102375566B1
- Authority
- KR
- South Korea
- Prior art keywords
- matrix
- mxn
- text
- medical
- electronic document
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Epidemiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
Description
본 발명은 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치 및 그 동작 방법에 대한 것이다.The present invention relates to an electronic device for electronically processing a receipt for medical expenses printed on paper, and a method for operating the same.
최근, 이미지로부터 문자를 인식할 수 있는 다양한 OCR(Optical Character Reader) 관련 기술들이 등장하면서, 이를 이용한 다양한 응용 서비스가 제공되고 있다.Recently, as various OCR (Optical Character Reader) related technologies capable of recognizing characters from an image have appeared, various application services using them have been provided.
예컨대, 이미지로부터 문자를 인식하여 해당 문자에 대한 자동 번역 기능을 제공하는 서비스나, 주변 사물의 간판 이미지에서 문자를 인식하여 주변 사물에 대한 관련 정보를 인터넷 검색을 통해 제공하는 서비스 등이 존재한다.For example, a service that recognizes a character from an image and provides an automatic translation function for the character, or a service that recognizes a character from a sign image of a nearby object and provides related information about the surrounding object through an Internet search, etc. exist.
한편, 환자들은 병원에서 진료를 받은 뒤 진료비 영수증과 처방전을 받을 때 일반적으로 인쇄된 종이 문서 형태의 진료비 영수증과 처방전을 받는다.On the other hand, when patients receive medical bills and prescriptions after receiving treatment at the hospital, they usually receive receipts and prescriptions in the form of printed paper documents.
그러나, 종이 문서는 분실의 염려도 있고, 나중에 해당 문서를 참조할 필요가 있는 경우, 스마트폰과 같은 전자 기기를 통하여 바로바로 확인할 수 없다는 불편함이 존재한다.However, there is a risk of loss of paper documents, and when it is necessary to refer to the documents later, there is an inconvenience in that it is not possible to check them directly through an electronic device such as a smart phone.
이러한 불편을 해소하기 위해 종이 문서를 스캔하여 전자 장치 상에 이미지 형식으로 보관하는 방법을 고려할 수 있다. 다만, 이미지 형식으로 저장하는 방식은 문서를 전자 문서의 파일 형식이 아닌 단순한 이미지 파일 형식으로 저장하기 때문에 내용에 대한 편집이 불가능한 단점이 존재한다. 특히, 진료비 영수증은 도 5에 도시된 그림과 같이, 표 형식으로 구성되어 있는데, 기존에는 진료비 영수증과 같은 표 형식으로 구성된 종이 문서를 전자 문서화 처리하는 기술이 존재하지 않아서, 진료비 영수증을 규격화 및 편집이 가능한 전자 문서의 파일 형식으로 기록하고 싶은 경우에는, 일일이 표를 만들고, 표를 구성하는 복수의 셀들에 텍스트들을 하나하나 입력하는 과정을 거쳐야 했다.In order to solve this inconvenience, a method of scanning a paper document and storing it in the form of an image on an electronic device may be considered. However, the method of saving in the image format has a disadvantage in that it is impossible to edit the contents because the document is saved in a simple image file format instead of an electronic document file format. In particular, the medical expense receipt is in the form of a table as shown in the figure shown in FIG. 5, and there is no technology for electronically processing paper documents in the form of a table such as a medical expense receipt, so standardize and edit the medical expense receipt. If you wanted to record this possible electronic document file format, you had to go through the process of creating a table one by one and inputting texts into a plurality of cells that make up the table one by one.
이와 관련해서, 종이 문서로 구성된 진료비 영수증을 전자 문서화 처리할 수 있다면, 환자들의 진료비 영수증을 관리하는 관리자의 편의가 도모될 수 있을 것이다.In this regard, if it is possible to electronically process the medical expenses receipts composed of paper documents, the convenience of the administrator who manages the medical expenses receipts of patients can be promoted.
특히, 대형 병원 등에서는 전산화를 통해 업무의 효율성을 높이기 위한 시도가 지속되고 있다는 점에서, 환자들에게 제공된 진료비 영수증들을 전자 문서화하여 관리할 필요성이 증가하고 있는 실정이다.In particular, since attempts to increase work efficiency through computerization are continuing in large hospitals, the need to electronically document and manage medical receipts provided to patients is increasing.
따라서, 종이로 인쇄된 진료비 영수증을 전자 문서화 처리할 수 있는 기술에 대한 연구가 필요하다.Therefore, there is a need for research on a technology capable of electronically documenting medical bills printed on paper.
본 발명에 따른 전자 장치 및 그 동작 방법은 종이로 인쇄된 진료비 영수증에 대한 스캔 이미지로부터 진료비 내역 테이블을 구성하는 선들을 추출하여 표를 생성하고, 상기 스캔 이미지로부터 텍스트를 추출한 후 상기 표 상에 텍스트를 삽입함으로써, 종이로 인쇄된 진료비 영수증을 전자 문서화 처리할 수 있도록 한다.An electronic device and an operating method thereof according to the present invention generate a table by extracting lines constituting a medical expense detail table from a scanned image of a paper-printed medical expense receipt, and after extracting text from the scanned image, text on the table By inserting the , paper-printed medical bill receipts can be electronically documented.
본 발명의 일실시예에 따른 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치는 서로 다른 복수의 환자 식별자들과 상기 복수의 환자 식별자들 각각에 대응하는 진료비 영수증에 대한 문서 파일 및 상기 복수의 환자 식별자들 각각에 대응하는 진료비 총액에 대한 정보가 서로 대응되어 저장되어 있는 복합 정보 저장부, 표를 구성하는 선의 색상으로 사전 설정된 색상 값 범위가 저장되어 있는 색상 값 저장부, 관리자로부터 종이로 인쇄된 제1 진료비 영수증 - 상기 제1 진료비 영수증은 진료비 내역에 대한 텍스트(Text)가 삽입된 표 형식의 진료비 내역 테이블로 구성되어 있음 - 이 스캔된 제1 스캔 이미지와 제1 환자 식별자가 입력되면서, 상기 제1 진료비 영수증에 대한 전자 문서화 처리 명령이 인가되면, 상기 제1 스캔 이미지를 가로 n(n은 2이상의 자연수임)개, 세로 m(m은 2이상의 자연수임)개의 사전 설정된 제1 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 중 상기 색상 값 범위에 대응되는 색상을 갖는 사각 영역에 대해 1의 코드를 할당하고, 나머지 영역에 대해 0의 코드를 할당하여 상기 제1 스캔 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성하는 이미지 행렬 생성부, OCR(Optical Character Reader)을 이용하여 상기 제1 스캔 이미지 내에 존재하는 복수의 텍스트들을 추출한 후, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 텍스트 위치 정보 - 상기 텍스트 위치 정보는 상기 제1 스캔 이미지의 최좌측 상단 지점을 기준으로 한 각 텍스트의 상기 제1 스캔 이미지 내에서의 상대적 위치에 대한 정보를 의미함 - 를 확인하는 텍스트 확인부, 상기 m x n의 이미지 행렬에 대해, 스캔 이미지 내에서의 수직선을 검출하기 위한 사전 설정된 m x n의 수직선 필터 행렬 - 상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 복수의 열들 중 사전 설정된 복수의 제1 열들을 구성하는 성분은 1의 코드가 할당되어 있고, 나머지 열들을 구성하는 성분은 0의 코드가 할당되어 있는 행렬임 - 과 스캔 이미지 내에서의 수평선을 검출하기 위한 사전 설정된 m x n의 수평선 필터 행렬 - 상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 복수의 행들 중 사전 설정된 복수의 제1 행들을 구성하는 성분은 1의 코드가 할당되어 있고, 나머지 행들을 구성하는 성분은 0의 코드가 할당되어 있는 행렬임 - 을 기초로 한 행렬 연산을 수행함으로써, 상기 제1 스캔 이미지로부터 상기 진료비 내역 테이블을 구성하는 복수의 수직선들과 복수의 수평선들을 검출하는 선 검출부, 상기 복수의 수직선들과 상기 복수의 수평선들에 의해 생성되는 복수의 셀들을 확인한 후, 상기 복수의 셀들로 구성되는 표가 삽입된 제1 전자 문서를 생성하는 전자 문서 생성부, 상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각을 상기 제1 전자 문서에 삽입된 표를 구성하는 상기 복수의 셀들에 삽입하여 상기 제1 전자 문서에 대한 문서 파일을 생성하는 문서 파일 생성부, 상기 제1 전자 문서에 대한 문서 파일이 생성되면, 상기 복수의 텍스트들 중 진료비 총액 항목을 지시하는 것으로 사전 설정된 텍스트와의 유사도가 최대인 제1 텍스트가 삽입된 제1 셀을 선택한 후, 상기 제1 셀과 같은 행, 열에 위치하는 셀들 중 금액을 지시하는 텍스트가 삽입된 적어도 하나의 셀을 확인하고, 상기 확인된 적어도 하나의 셀 중 상기 제1 셀과 가장 근접하여 위치하는 제2 셀을 선정한 후, 상기 제2 셀에 삽입된 텍스트를 진료비 총액에 대한 정보로 확인하는 진료비 총액 확인부 및 상기 제2 셀에 삽입된 텍스트가 진료비 총액에 대한 정보로 확인되면, 상기 제1 환자 식별자와 상기 제1 전자 문서에 대한 문서 파일 및 상기 확인된 진료비 총액에 대한 정보를 상기 복합 정보 저장부에 서로 대응시켜 저장하는 정보 저장 처리부를 포함한다.An electronic device for electronically documenting a paper-printed medical expense receipt according to an embodiment of the present invention includes a plurality of different patient identifiers, a document file for medical expenses receipts corresponding to each of the plurality of patient identifiers, and the plurality of patient identifiers. Composite information storage in which information on the total amount of medical expenses corresponding to each patient identifier is stored in correspondence with each other First medical expense receipt - The first medical expense receipt is composed of a table-type medical expenses details table in which text for medical expenses details is inserted - As the scanned first scanned image and the first patient identifier are input, When the electronic document processing command for the first medical fee receipt is applied, the first scanned image is n (n is a natural number greater than or equal to 2) horizontally and m (m is a natural number greater than or equal to 2) preset first sizes of the first scanned image. After dividing into rectangular regions, a code of 1 is assigned to a rectangular region having a color corresponding to the color value range among the rectangular regions, and a code of 0 is assigned to the remaining regions to obtain the first scanned image. By binarizing, a plurality of texts existing in the first scan image are extracted using an image matrix generator that generates an mxn image matrix, OCR (Optical Character Reader), and then the plurality of texts and the plurality of texts text position information within the first scanned image for each - the text position information is information about the relative position of each text within the first scanned image with respect to the upper leftmost point of the first scanned image means - a text confirmation unit to confirm, for the mxn image matrix, a preset mxn vertical line filter matrix for detecting vertical lines in a scanned image - The mxn vertical line filter matrix is the mxn vertical line filter matrix Presets among a plurality of columns that make up A component constituting the plurality of first columns is assigned a code of 1, and a component constituting the remaining columns is a matrix to which a code of 0 is assigned - and a preset mxn for detecting a horizontal line in a scanned image Horizontal line filter matrix of - The mxn horizontal line filter matrix is assigned a code of 1 to a component constituting a plurality of preset first rows among a plurality of rows constituting the mxn horizontal line filter matrix, and constituting the remaining rows A component is a matrix to which a code of 0 is assigned - a line detection unit that detects a plurality of vertical lines and a plurality of horizontal lines constituting the medical expense breakdown table from the first scan image by performing a matrix operation based on An electronic document generator generating a first electronic document into which a table composed of the plurality of cells is inserted after checking a plurality of cells generated by the plurality of vertical lines and the plurality of horizontal lines, each of the plurality of texts Based on the text position information in the first scanned image for A document file generating unit generating a document file for After selecting the inserted first cell, at least one cell into which text indicating an amount is inserted among cells positioned in the same row and column as the first cell is identified, and the first cell from among the checked at least one cell After selecting the second cell located closest to the medical bill, the total amount of medical expenses confirmation unit that checks the text inserted into the second cell as information on the total medical expenses, and the text inserted into the second cell as information on the total medical expenses When it is confirmed, the first patient identifier, the document file for the first electronic document, and information on the confirmed total amount of medical expenses are mutually transmitted to the composite information storage unit. and an information storage processing unit for storing the corresponding information.
또한, 본 발명의 일실시예에 따른 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치의 동작 방법은 서로 다른 복수의 환자 식별자들과 상기 복수의 환자 식별자들 각각에 대응하는 진료비 영수증에 대한 문서 파일 및 상기 복수의 환자 식별자들 각각에 대응하는 진료비 총액에 대한 정보가 서로 대응되어 저장되어 있는 복합 정보 저장부를 유지하는 단계, 표를 구성하는 선의 색상으로 사전 설정된 색상 값 범위가 저장되어 있는 색상 값 저장부를 유지하는 단계, 관리자로부터 종이로 인쇄된 제1 진료비 영수증 - 상기 제1 진료비 영수증은 진료비 내역에 대한 텍스트가 삽입된 표 형식의 진료비 내역 테이블로 구성되어 있음 - 이 스캔된 제1 스캔 이미지와 제1 환자 식별자가 입력되면서, 상기 제1 진료비 영수증에 대한 전자 문서화 처리 명령이 인가되면, 상기 제1 스캔 이미지를 가로 n(n은 2이상의 자연수임)개, 세로 m(m은 2이상의 자연수임)개의 사전 설정된 제1 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 중 상기 색상 값 범위에 대응되는 색상을 갖는 사각 영역에 대해 1의 코드를 할당하고, 나머지 영역에 대해 0의 코드를 할당하여 상기 제1 스캔 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성하는 단계, OCR을 이용하여 상기 제1 스캔 이미지 내에 존재하는 복수의 텍스트들을 추출한 후, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 텍스트 위치 정보 - 상기 텍스트 위치 정보는 상기 제1 스캔 이미지의 최좌측 상단 지점을 기준으로 한 각 텍스트의 상기 제1 스캔 이미지 내에서의 상대적 위치에 대한 정보를 의미함 - 를 확인하는 단계, 상기 m x n의 이미지 행렬에 대해, 스캔 이미지 내에서의 수직선을 검출하기 위한 사전 설정된 m x n의 수직선 필터 행렬 - 상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 복수의 열들 중 사전 설정된 복수의 제1 열들을 구성하는 성분은 1의 코드가 할당되어 있고, 나머지 열들을 구성하는 성분은 0의 코드가 할당되어 있는 행렬임 - 과 스캔 이미지 내에서의 수평선을 검출하기 위한 사전 설정된 m x n의 수평선 필터 행렬 - 상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 복수의 행들 중 사전 설정된 복수의 제1 행들을 구성하는 성분은 1의 코드가 할당되어 있고, 나머지 행들을 구성하는 성분은 0의 코드가 할당되어 있는 행렬임 - 을 기초로 한 행렬 연산을 수행함으로써, 상기 제1 스캔 이미지로부터 상기 진료비 내역 테이블을 구성하는 복수의 수직선들과 복수의 수평선들을 검출하는 단계, 상기 복수의 수직선들과 상기 복수의 수평선들에 의해 생성되는 복수의 셀들을 확인한 후, 상기 복수의 셀들로 구성되는 표가 삽입된 제1 전자 문서를 생성하는 단계, 상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각을 상기 제1 전자 문서에 삽입된 표를 구성하는 상기 복수의 셀들에 삽입하여 상기 제1 전자 문서에 대한 문서 파일을 생성하는 단계, 상기 제1 전자 문서에 대한 문서 파일이 생성되면, 상기 복수의 텍스트들 중 진료비 총액 항목을 지시하는 것으로 사전 설정된 텍스트와의 유사도가 최대인 제1 텍스트가 삽입된 제1 셀을 선택한 후, 상기 제1 셀과 같은 행, 열에 위치하는 셀들 중 금액을 지시하는 텍스트가 삽입된 적어도 하나의 셀을 확인하고, 상기 확인된 적어도 하나의 셀 중 상기 제1 셀과 가장 근접하여 위치하는 제2 셀을 선정한 후, 상기 제2 셀에 삽입된 텍스트를 진료비 총액에 대한 정보로 확인하는 단계 및 상기 제2 셀에 삽입된 텍스트가 진료비 총액에 대한 정보로 확인되면, 상기 제1 환자 식별자와 상기 제1 전자 문서에 대한 문서 파일 및 상기 확인된 진료비 총액에 대한 정보를 상기 복합 정보 저장부에 서로 대응시켜 저장하는 단계를 포함한다.In addition, the operating method of an electronic device for electronically processing a paper-printed medical bill receipt according to an embodiment of the present invention includes a plurality of different patient identifiers and a document for a medical bill receipt corresponding to each of the plurality of patient identifiers. Maintaining a composite information storage unit in which information on the total amount of medical expenses corresponding to each of the file and each of the plurality of patient identifiers is stored in correspondence with each other, a color value in which a range of color values preset as the color of the line constituting the table is stored Maintaining a storage unit, a first receipt for medical expenses printed on paper from the manager - The first receipt for medical expenses is composed of a table of medical expenses details in which text for medical expenses details is inserted - This scanned first scanned image and When the first patient identifier is input and an electronic document processing command for the first medical fee receipt is applied, the first scanned image is n horizontally (n is a natural number greater than or equal to 2) and vertical m (m is a natural number greater than or equal to 2) ), a code of 1 is assigned to a rectangular area having a color corresponding to the color value range among the rectangular areas, and a code of 0 is assigned to the remaining areas. generating an mxn image matrix by allocating and binarizing the first scanned image; after extracting a plurality of texts present in the first scanned image using OCR, the plurality of texts and the plurality of texts text position information within the first scanned image for each - the text position information is information about the relative position of each text within the first scanned image with respect to the upper leftmost point of the first scanned image means - identifying, for the mxn image matrix, a preset mxn vertical line filter matrix for detecting vertical lines in a scanned image, the mxn vertical line filter matrix constituting the mxn vertical line filter matrix to configure a plurality of preset first columns among a plurality of columns to is a matrix to which a component is assigned a code of 1, and the components constituting the remaining columns are assigned a code of 0 - and a preset mxn horizontal line filter matrix for detecting horizontal lines in the scanned image - of the mxn In the horizontal line filter matrix, a code of 1 is assigned to a component constituting a plurality of preset first rows among a plurality of rows constituting the mxn horizontal line filter matrix, and a code of 0 is assigned to a component constituting the remaining rows. Detecting a plurality of vertical lines and a plurality of horizontal lines constituting the medical expense breakdown table from the first scan image by performing a matrix operation based on generating a first electronic document into which a table composed of the plurality of cells is inserted after checking a plurality of cells generated by generating a document file for the first electronic document by inserting each of the plurality of texts into the plurality of cells constituting a table inserted in the first electronic document based on location information; When the document file for the document is created, after selecting the first cell in which the first text having the highest degree of similarity with the text preset as indicating the total amount of medical expenses among the plurality of texts is inserted, the same as the first cell After checking at least one cell into which text indicating the amount of money is inserted among cells located in rows and columns, and selecting a second cell closest to the first cell from among the checked at least one cell, the second cell 2 Confirming the text inserted into the cell as information on the total amount of medical expenses, and when the text inserted into the second cell is confirmed as information on the total amount of medical expenses, the first patient identifier and the document file for the first electronic document and storing the information on the confirmed total amount of medical expenses in correspondence with each other in the composite information storage unit.
본 발명에 따른 전자 장치 및 그 동작 방법은 종이로 인쇄된 진료비 영수증에 대한 스캔 이미지로부터 진료비 내역 테이블을 구성하는 선들을 추출하여 표를 생성하고, 상기 스캔 이미지로부터 텍스트를 추출한 후 상기 표 상에 텍스트를 삽입함으로써, 종이로 인쇄된 진료비 영수증을 전자 문서화 처리할 수 있다.An electronic device and an operating method thereof according to the present invention generate a table by extracting lines constituting a medical expense detail table from a scanned image of a paper-printed medical expense receipt, and after extracting text from the scanned image, text on the table By inserting , paper-printed medical bill receipts can be electronically documented.
도 1은 본 발명의 일실시예에 전자 장치의 구조를 도시한 도면이다.
도 2 내지 도 6은 본 발명의 일실시예에 따른 전자 장치를 설명하기 위한 도면이다.
도 7은 본 발명의 일실시예에 따른 전자 장치의 동작 방법을 도시한 순서도이다.1 is a diagram showing the structure of an electronic device according to an embodiment of the present invention.
2 to 6 are diagrams for explaining an electronic device according to an embodiment of the present invention.
7 is a flowchart illustrating a method of operating an electronic device according to an embodiment of the present invention.
이하에서는 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명하기로 한다. 이러한 설명은 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였으며, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 본 명세서 상에서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. These descriptions are not intended to limit the present invention to specific embodiments, and should be understood to include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention. While describing each drawing, like reference numerals are used for similar components, and unless otherwise defined, all terms used in this specification, including technical or scientific terms, refer to those of ordinary skill in the art to which the present invention belongs. It has the same meaning as is commonly understood by those who have it.
본 문서에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 또한, 본 발명의 다양한 실시예들에 있어서, 각 구성요소들, 기능 블록들 또는 수단들은 하나 또는 그 이상의 하부 구성요소로 구성될 수 있고, 각 구성요소들이 수행하는 전기, 전자, 기계적 기능들은 전자회로, 집적회로, ASIC(Application Specific Integrated Circuit) 등 공지된 다양한 소자들 또는 기계적 요소들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수도 있다. In this document, when a part "includes" a certain component, it means that other components may be further included, rather than excluding other components, unless otherwise stated. In addition, in various embodiments of the present invention, each of the components, functional blocks or means may be composed of one or more sub-components, and the electrical, electronic, and mechanical functions performed by each component are electronic. A circuit, an integrated circuit, an ASIC (Application Specific Integrated Circuit), etc. may be implemented as various well-known devices or mechanical elements, and may be implemented separately or two or more may be integrated into one.
한편, 첨부된 블록도의 블록들이나 흐름도의 단계들은 범용 컴퓨터, 특수용 컴퓨터, 휴대용 노트북 컴퓨터, 네트워크 컴퓨터 등 데이터 프로세싱이 가능한 장비의 프로세서나 메모리에 탑재되어 지정된 기능들을 수행하는 컴퓨터 프로그램 명령들(instructions)을 의미하는 것으로 해석될 수 있다. 이들 컴퓨터 프로그램 명령들은 컴퓨터 장치에 구비된 메모리 또는 컴퓨터에서 판독 가능한 메모리에 저장될 수 있기 때문에, 블록도의 블록들 또는 흐름도의 단계들에서 설명된 기능들은 이를 수행하는 명령 수단을 내포하는 제조물로 생산될 수도 있다. 아울러, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 명령들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 가능한 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 정해진 순서와 달리 실행되는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 실질적으로 동시에 수행되거나, 역순으로 수행될 수 있으며, 경우에 따라 일부 블록들 또는 단계들이 생략된 채로 수행될 수도 있다.On the other hand, the blocks in the accompanying block diagram or steps in the flowchart are computer program instructions that are loaded in a processor or memory of equipment capable of data processing, such as a general-purpose computer, a special-purpose computer, a portable notebook computer, and a network computer, and perform specified functions. can be interpreted as meaning Since these computer program instructions may be stored in a memory provided in a computer device or in a memory readable by a computer, the functions described in the blocks of the block diagrams or the steps of the flowcharts are produced as articles of manufacture containing instruction means for performing the same. it might be In addition, each block or each step may represent a module, segment, or portion of code comprising one or more executable instructions for executing the specified logical function(s). It should also be noted that, in some alternative embodiments, it is also possible for the functions recited in blocks or steps to be executed out of the prescribed order. For example, two blocks or steps shown one after another may be performed substantially simultaneously or in the reverse order, and in some cases, some blocks or steps may be omitted.
도 1은 본 발명의 일실시예에 따른 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치의 구조를 도시한 도면이다.1 is a diagram illustrating the structure of an electronic device for electronically documenting a paper-printed medical expense receipt according to an embodiment of the present invention.
도 1을 참조하면, 본 발명의 일실시예에 따른 전자 장치(110)는 복합 정보 저장부(111), 색상 값 저장부(112), 이미지 행렬 생성부(113), 텍스트 확인부(114), 선 검출부(115), 전자 문서 생성부(116), 문서 파일 생성부(117), 진료비 총액 확인부(118) 및 정보 저장 처리부(119)를 포함한다.Referring to FIG. 1 , an
복합 정보 저장부(111)에는 서로 다른 복수의 환자 식별자들과 상기 복수의 환자 식별자들 각각에 대응하는 진료비 영수증에 대한 문서 파일 및 상기 복수의 환자 식별자들 각각에 대응하는 진료비 총액에 대한 정보가 서로 대응되어 저장되어 있다.In the complex
예컨대, 복합 정보 저장부(111)에는 하기의 표 1과 같이 정보가 저장되어 있을 수 있다.For example, information may be stored in the complex
색상 값 저장부(112)에는 표를 구성하는 선의 색상으로 사전 설정된 색상 값 범위가 저장되어 있다.The color
예컨대, 도 2 내지 도 6에서 볼 수 있듯이, 표를 구성하는 선의 색상이 하늘색 계열의 색상으로 이루어진 경우, 색상 값 저장부(112)에는 표를 구성하는 선의 색상으로 하늘색 계열의 색상 값 범위가 저장되어 있을 수 있다.For example, as shown in FIGS. 2 to 6 , when the color of the line constituting the table is made of a color of the sky blue series, the color
이미지 행렬 생성부(113)는 관리자로부터 종이로 인쇄된 제1 진료비 영수증이 스캔된 제1 스캔 이미지와 제1 환자 식별자가 입력되면서, 상기 제1 진료비 영수증에 대한 전자 문서화 처리 명령이 인가되면, 상기 제1 스캔 이미지를 가로 n(n은 2이상의 자연수임)개, 세로 m(m은 2이상의 자연수임)개의 사전 설정된 제1 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 중 상기 색상 값 범위에 대응되는 색상을 갖는 사각 영역에 대해 1의 코드를 할당하고, 나머지 영역에 대해 0의 코드를 할당하여 상기 제1 스캔 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성한다.The image
여기서, 상기 제1 진료비 영수증은 도 5에 도시된 그림과 같이 진료비 내역에 대한 텍스트(Text)가 삽입된 표 형식의 진료비 내역 테이블로 구성되어 있을 수 있고, 상기 진료비 내역 테이블을 구성하는 각 셀에는 '환자등록번호'라는 텍스트, '진료과목'이라는 텍스트, '진찰료'라는 텍스트, '25,000원'이라는 텍스트 등과 같이 복수의 텍스트들이 삽입되어 있을 수 있다.Here, the first medical expense receipt may be composed of a table-type medical expenses details table in which text for medical expenses details is inserted, as shown in the figure shown in FIG. 5, and each cell constituting the medical expenses history table A plurality of texts may be inserted, such as the text 'patient registration number', the text 'treatment subject', the text 'examination fee', the text '25,000 won', and the like.
이때, 본 발명의 일실시예에 따르면, 이미지 행렬 생성부(113)는 평균 값 연산부(121) 및 행렬 생성 처리부(122)를 포함할 수 있다.In this case, according to an embodiment of the present invention, the image
평균 값 연산부(121)는 상기 관리자로부터 상기 제1 스캔 이미지와 상기 제1 환자 식별자가 입력되면서, 상기 제1 진료비 영수증에 대한 전자 문서화 처리 명령이 인가되면, 상기 제1 스캔 이미지를 가로 n개, 세로 m개의 상기 제1 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 각각에 대해, 상기 사각 영역들 각각을 구성하는 복수의 화소들의 색상 값의 평균 값을 연산한다.When an electronic document processing command for the first medical expense receipt is applied while the first scan image and the first patient identifier are input from the manager, the average
행렬 생성 처리부(122)는 상기 사각 영역들 중 상기 복수의 화소들의 색상 값의 평균 값이 상기 색상 값 범위에 포함되는 사각 영역에 대해 1의 코드를 할당하고, 상기 색상 값 범위에 포함되지 않는 사각 영역에 대해 0의 코드를 할당하여 상기 제1 스캔 이미지를 이진화함으로써, 상기 m x n의 이미지 행렬을 생성한다.The matrix
예컨대, 상기 제1 진료비 영수증이 '진료 기간'이라는 텍스트가 삽입된 표 형식의 진료비 내역 테이블로 구성되어 있다고 하고, 상기 제1 진료비 영수증이 스캔된 제1 스캔 이미지가 도 2의 도면부호 210에서 나타낸 '스캔 이미지 1(210)'과 같다고 하며, 상기 제1 환자 식별자를 '환자 식별자 110'이라고 가정하자.For example, it is assumed that the first medical expense receipt is composed of a table-type medical expenses breakdown table in which the text 'treatment period' is inserted, and a first scanned image of the first medical expenses receipt is scanned as shown by
이때, 상기 관리자로부터 전자 장치(110)에 상기 제1 스캔 이미지인 '스캔 이미지 1(210)'과 상기 제1 환자 식별자인 '환자 식별자 110'이 입력되면서, 상기 제1 진료비 영수증에 대한 전자 문서화 처리 명령이 인가되면, 평균 값 연산부(121)는 '스캔 이미지 1(210)'을 가로 n개, 세로 m개의 상기 제1 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 각각에 대해, 상기 사각 영역들 각각을 구성하는 복수의 화소들의 색상 값의 평균 값을 연산할 수 있다.At this time, as the first scanned image 'scan image 1 (210)' and the first patient identifier 'patient identifier 110' are input from the manager to the
여기서, 'n=12'라고 하고, 'm=8'이라고 가정하면, 평균 값 연산부(121)는 도면부호 220과 같이, '스캔 이미지 1(210)'을 가로 12개, 세로 8개의 상기 제1 크기의 사각 영역들(220)로 분할할 수 있고, 사각 영역들(220) 각각에 대해, 사각 영역들(220) 각각을 구성하는 복수의 화소들의 색상 값의 평균 값을 연산할 수 있다.Here, assuming that 'n=12' and 'm=8', the average
구체적으로, 평균 값 연산부(121)는 사각 영역들(220) 중 진료비 내역 테이블을 구성하는 선의 영역(221)에 대해 하늘색 계열의 색상 값의 평균 값을 연산할 수 있고, 진료비 내역 테이블 내부의 배경을 구성하는 영역(222)에 대해 하얀색 계열의 색상 값의 평균 값을 연산할 수 있으며, '진료 기간'이라는 글자를 구성하는 영역(223)에 대해 검은색 계열의 색상 값의 평균 값을 연산할 수 있다.Specifically, the average
이후, 행렬 생성 처리부(122)는 사각 영역들(220) 중 상기 복수의 화소들의 색상 값의 평균 값이 앞선 예에서의 하늘색 계열의 색상 값 범위에 포함되는 사각 영역에 대해 1의 코드를 할당하고, 하늘색 계열의 색상 값 범위에 포함되지 않는 사각 영역에 대해 0의 코드를 할당하여 '스캔 이미지 1(210)'을 이진화할 수 있다.Thereafter, the matrix
즉, 행렬 생성 처리부(122)는 사각 영역들(220) 중 진료비 내역 테이블을 구성하는 선의 영역(221)에 대해서는 1의 코드를 할당하고, 진료비 내역 테이블 내부의 배경을 구성하는 영역(222)과 '진료 기간'이라는 글자를 구성하는 영역(223)에 대해서는 0의 코드를 할당하여 '스캔 이미지 1(210)'을 이진화함으로써, 도면부호 230과 같은 8 x 12의 이미지 행렬(230)을 생성할 수 있다.That is, the matrix
텍스트 확인부(114)는 OCR(Optical Character Reader)을 이용하여 상기 제1 스캔 이미지 내에 존재하는 복수의 텍스트들을 추출한 후, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 텍스트 위치 정보를 확인한다.The
여기서, 상기 텍스트 위치 정보는 상기 제1 스캔 이미지의 최좌측 상단 지점을 기준으로 한 각 텍스트의 상기 제1 스캔 이미지 내에서의 상대적 위치에 대한 정보를 의미한다.Here, the text position information means information on the relative position of each text in the first scanned image with respect to the upper leftmost point of the first scanned image.
또한, 상기 OCR은 종이에 인쇄되거나 손으로 쓴 문자를 광학적 수단에 의해 인식하여 컴퓨터 텍스트로 변환하는 입력 장치를 의미하는 것으로, 스마트폰을 통한 전자상거래 결제 시, 결제하려는 신용카드에 대한 정보를 직접 입력하는 대신 스마트폰에 내장된 카메라를 통해 촬영함으로써, 촬영된 신용카드의 이미지에서 카드 번호와 유효 기간 등을 자동으로 추출하는 등에 활용될 수 있다.In addition, the OCR refers to an input device that recognizes printed or handwritten characters on paper by optical means and converts them into computer text. By taking a picture through the camera built into the smartphone instead of inputting it, it can be used to automatically extract the card number and expiration date from the photographed credit card image.
관련해서, 상기 제1 진료비 영수증이 '진료 차트', '환자 성명', '진료 날짜', '홍길동' 및 '20201022'라는 복수의 텍스트들이 삽입된 표 형식의 진료비 내역 테이블로 구성되어 있다고 하고, 상기 제1 진료비 영수증이 스캔된 제1 스캔 이미지가 도 4에서의 '스캔 이미지 2(410)'와 같다고 가정하자.In relation to this, it is said that the first medical fee receipt is composed of a table of medical expenses details in which a plurality of texts such as 'treatment chart', 'patient name', 'treatment date', 'Hong Gil-dong' and '20201022' are inserted, It is assumed that the first scanned image from which the first medical bill receipt is scanned is the same as 'scanned image 2 (410)' in FIG.
이때, 도 4를 참조하면, 텍스트 확인부(114)는 OCR을 이용하여 '스캔 이미지 2(410)' 내에 존재하는 상기 복수의 텍스트들인 '진료 차트', '환자 성명', '진료 날짜', '홍길동' 및 '20201022'를 추출한 후, 상기 복수의 텍스트들인 '진료 차트', '환자 성명', '진료 날짜', '홍길동' 및 '20201022'와 상기 복수의 텍스트들인 '진료 차트', '환자 성명', '진료 날짜', '홍길동' 및 '20201022' 각각에 대한 '스캔 이미지 2(410)' 내에서의 텍스트 위치 정보를 확인할 수 있다.At this time, referring to FIG. 4 , the
구체적으로, 텍스트 확인부(114)는 상기 복수의 텍스트들인 '진료 차트', '환자 성명', '진료 날짜', '홍길동' 및 '20201022' 중 '진료 차트'에 대한 텍스트 위치 정보로 '스캔 이미지 2(410)'의 최좌측 상단 지점(411)에서 '진료 차트'에 대한 텍스트 중간 지점(412)까지의 수평 거리(413)와 수직 거리(414)를 측정한 후, '진료 차트'와, '진료 차트'에 대한 텍스트 위치 정보인 수평 거리(413) 및 수직 거리(414)를 확인할 수 있다.Specifically, the text confirmation unit 114 'scans' with the text location information for the 'treatment chart' among the plurality of texts 'medical chart', 'patient name', 'treatment date', 'Hong Gil-dong', and '20201022'. After measuring the horizontal distance (413) and the vertical distance (414) from the upper left point (411) of 'image 2 (410)' to the midpoint (412) of the text for 'medical chart', 'care chart' and , it is possible to check the
그리고, 텍스트 확인부(114)는 같은 방식으로 '환자 성명', '진료 날짜', '홍길동', '20201022'에 대해서도 텍스트 위치 정보를 획득하여, 상기 복수의 텍스트들인 '진료 차트', '환자 성명', '진료 날짜', '홍길동' 및 '20201022'와 상기 복수의 텍스트들인 '진료 차트', '환자 성명', '진료 날짜', '홍길동' 및 '20201022' 각각에 대한 텍스트 위치 정보를 확인할 수 있다.In the same manner, the
선 검출부(115)는 상기 m x n의 이미지 행렬에 대해, 스캔 이미지 내에서의 수직선을 검출하기 위한 사전 설정된 m x n의 수직선 필터 행렬과 스캔 이미지 내에서의 수평선을 검출하기 위한 사전 설정된 m x n의 수평선 필터 행렬을 기초로 한 행렬 연산을 수행함으로써, 상기 제1 스캔 이미지로부터 상기 진료비 내역 테이블을 구성하는 복수의 수직선들과 복수의 수평선들을 검출한다.The
여기서, 상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 복수의 열들 중 사전 설정된 복수의 제1 열들을 구성하는 성분은 1의 코드가 할당되어 있고, 나머지 열들을 구성하는 성분은 0의 코드가 할당되어 있는 행렬이고, 상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 복수의 행들 중 사전 설정된 복수의 제1 행들을 구성하는 성분은 1의 코드가 할당되어 있고, 나머지 행들을 구성하는 성분은 0의 코드가 할당되어 있는 행렬이다.Here, in the mxn vertical line filter matrix, a code of 1 is assigned to a component constituting a plurality of preset first columns among a plurality of columns constituting the mxn vertical line filter matrix, and a component constituting the remaining columns is 0 is a matrix to which a code of is assigned, and the mxn horizontal line filter matrix is assigned a code of 1 to a component constituting a plurality of preset first rows among a plurality of rows constituting the mxn horizontal line filter matrix, and the remaining A component constituting the rows is a matrix to which codes of 0 are assigned.
관련해서, 상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 상기 복수의 열들 중 사전 설정된 진료비 내역 테이블 양식에 따라, 수직선에 대응하는 영역에 1의 코드가 할당되고, 수직선에 대응하지 않는 영역에 0의 코드가 할당되도록 사전 구성되어 있을 수 있다.In relation to this, in the mxn vertical line filter matrix, a code of 1 is assigned to an area corresponding to a vertical line according to a preset medical cost breakdown table format among the plurality of columns constituting the mxn vertical line filter matrix, and does not correspond to a vertical line It may be pre-configured so that a code of 0 is assigned to a non-existent area.
마찬가지로, 상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 상기 복수의 행들 중 사전 설정된 진료비 내역 테이블 양식에 따라, 수평선에 대응하는 영역에 1의 코드가 할당되고, 수평선에 대응하지 않는 영역에 0의 코드가 할당되도록 사전 구성되어 있을 수 있다.Similarly, in the mxn horizontal line filter matrix, a code of 1 is assigned to an area corresponding to a horizontal line according to a preset medical expense breakdown table format among the plurality of rows constituting the mxn horizontal line filter matrix, and a code of 1 is assigned to an area that does not correspond to the horizontal line Regions may be preconfigured to be assigned a code of zero.
이때, 본 발명의 일실시예에 따르면, 선 검출부(115)는 연산부(123) 및 선 검출 처리부(124)를 포함할 수 있다.In this case, according to an embodiment of the present invention, the
연산부(123)는 상기 m x n의 이미지 행렬과 상기 m x n의 수직선 필터 행렬 간의 아다마르 곱(Hadamard product)을 연산하여 m x n의 제1 연산 행렬을 생성하고, 상기 m x n의 이미지 행렬과 상기 m x n의 수평선 필터 행렬 간의 아다마르 곱을 연산하여 m x n의 제2 연산 행렬을 생성한 후, 상기 m x n의 제1 연산 행렬과 상기 m x n의 제2 연산 행렬 간의 논리합(OR) 연산을 수행하여 m x n의 제3 연산 행렬을 생성한다.The
여기서, 아다마르 곱이란 같은 크기의 행렬 또는 벡터에서 각 성분을 곱하는 연산을 의미하는 것으로, '[a b c]'와 '[x y z]'라는 두 행렬이 있을 때, 상기 두 행렬 간의 아다마르 곱을 연산한 행렬은 '[ax by cz]'로 나타낼 수 있다.Here, the Hadamard product means an operation of multiplying each component in a matrix or vector of the same size. When there are two matrices '[abc]' and '[xyz]', A matrix can be expressed as '[ax by cz]'.
선 검출 처리부(124)는 상기 제1 스캔 이미지에서, 상기 m x n의 제3 연산 행렬을 구성하는 성분들 중 1의 코드가 할당된 성분들에 대응되는 지점들을 선을 구성하는 영역으로 확인함으로써, 상기 제1 스캔 이미지로부터 상기 진료비 내역 테이블을 구성하는 상기 복수의 수직선들과 상기 복수의 수평선들을 검출한다.The line
관련해서, 상기 제1 스캔 이미지에 대한 상기 m x n의 이미지 행렬이 하기의 수학식 1과 같은 9 x 7 행렬이라고 가정하고, 상기 m x n의 수직선 필터 행렬이 하기의 수학식 2와 같은 9 x 7 행렬이라고 가정하며, 상기 m x n의 수평선 필터 행렬이 하기의 수학식 3과 같은 9 x 7 행렬이라고 가정하고, 연산부(123)와 선 검출 처리부(124)의 동작을 설명하면 다음과 같다.In this regard, it is assumed that the mxn image matrix for the first scan image is a 9 x 7 matrix as shown in
우선, 연산부(123)는 하기의 수학식 4와 같이, 상기 9 x 7의 이미지 행렬과 상기 9 x 7의 수직선 필터 행렬 간의 아다마르 곱을 연산함으로써, 사전 설정된 진료비 내역 테이블 양식에 따라 수직선에 대응하는 영역과 일치하는 영역만이 검출되도록 9 x 7의 제1 연산 행렬을 생성할 수 있다.First, the
그리고, 연산부(123)는 하기의 수학식 5와 같이, 상기 9 x 7의 이미지 행렬과 상기 9 x 7의 수평선 필터 행렬 간의 아다마르 곱을 연산함으로써, 사전 설정된 진료비 내역 테이블 양식에 따라 수평선에 대응하는 영역과 일치하는 영역만이 검출되도록 9 x 7의 제2 연산 행렬을 생성할 수 있다.In addition, the
그 이후, 연산부(123)는 하기의 수학식 6과 같이, 상기 9 x 7의 제1 연산 행렬과 상기 9 x 7의 제2 연산 행렬 간의 논리합(OR) 연산을 수행함으로써, 9 x 7의 제3 연산 행렬을 생성할 수 있다.Thereafter, the
이렇게, 연산부(123)를 통해, 상기 수학식 6에서와 같은 상기 9 x 7의 제3 연산 행렬이 생성되면, 선 검출 처리부(124)는 제1 스캔 이미지에서, 상기 9 x 7의 제3 연산 행렬을 구성하는 성분들 중 1의 코드가 할당된 성분들에 대응되는 지점들을 선을 구성하는 영역으로 확인함으로써, 도 3에 도시된 그림과 같이, 상기 제1 스캔 이미지로부터 상기 진료비 내역 테이블을 구성하는 복수의 수직선들과 복수의 수평선들을 검출할 수 있다.In this way, when the 9x7 third operation matrix as in Equation 6 is generated through the
전자 문서 생성부(116)는 상기 복수의 수직선들과 상기 복수의 수평선들에 의해 생성되는 복수의 셀들을 확인한 후, 상기 복수의 셀들로 구성되는 표가 삽입된 제1 전자 문서를 생성한다.The electronic
문서 파일 생성부(117)는 상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각을 상기 제1 전자 문서에 삽입된 표를 구성하는 상기 복수의 셀들에 삽입하여 상기 제1 전자 문서에 대한 문서 파일을 생성한다.The document
이때, 본 발명의 일실시예에 따르면, 문서 파일 생성부(117)는 삽입 지점 연산부(125) 및 파일 생성 처리부(126)를 포함할 수 있다.In this case, according to an embodiment of the present invention, the document
삽입 지점 연산부(125)는 상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각에 대한 상기 제1 전자 문서 내에서의 텍스트 삽입 지점을 연산한다.The insertion
여기서, 상기 텍스트 삽입 지점은 상기 제1 전자 문서의 최좌측 상단 지점을 기준으로 상기 텍스트 위치 정보에 따른 위치를 연산한 지점을 의미한다.Here, the text insertion point means a point at which a location according to the text location information is calculated based on the upper leftmost point of the first electronic document.
파일 생성 처리부(126)는 상기 제1 전자 문서에 삽입된 표를 구성하는 상기 복수의 셀들 중 상기 복수의 텍스트들 각각의 텍스트 삽입 지점에 대응되는 위치의 셀을 확인한 후, 상기 복수의 텍스트들 각각을 각 텍스트의 텍스트 삽입 지점에 대응되는 위치의 셀에 삽입하여 상기 제1 전자 문서에 대한 문서 파일을 생성한다.The file
예컨대, 전술한 예에 따라 도 4를 참조하여 설명하면, 삽입 지점 연산부(125)는 우선 상기 복수의 텍스트들인 '진료 차트', '환자 성명', '진료 날짜', '홍길동' 및 '20201022' 중 '진료 차트'에 대한 텍스트 위치 정보인 '스캔 이미지 2(410)'의 최좌측 상단 지점(411)에서 '진료 차트'에 대한 텍스트 중간 지점(412)까지의 수평 거리(413)와 수직 거리(414)를 기초로, 상기 제1 전자 문서 내에서의 최좌측 상단 지점을 기준으로 한 수직 거리(413)와 수평 거리(414)에 따른 지점을 연산함으로써, '진료 차트'에 대한 텍스트 삽입 지점을 연산할 수 있다.For example, if described with reference to FIG. 4 according to the above-described example, the insertion
이와 같은 방식으로, 삽입 지점 연산부(125)는 '환자 성명', '진료 날짜', '홍길동', '20201022'에 대해서도, '스캔 이미지 2(410)' 내에서의 상기 텍스트 위치 정보를 기초로, '환자 성명', '진료 날짜', '홍길동', '20201022' 각각에 대한 상기 제1 전자 문서 내에서의 텍스트 삽입 지점을 연산할 수 있다.In this way, the insertion
이후, 파일 생성 처리부(126)는 상기 제1 전자 문서에 삽입된 표를 구성하는 상기 복수의 셀들 중 상기 복수의 텍스트들인 '진료 차트', '환자 성명', '진료 날짜', '홍길동' 및 '202009031022' 각각의 텍스트 삽입 지점에 대응되는 위치의 셀을 확인한 후, 상기 복수의 텍스트들인 '진료 차트', '환자 성명', '진료 날짜', '홍길동' 및 '20201022' 각각을 각 텍스트의 텍스트 삽입 지점에 대응되는 위치의 셀에 삽입하여 상기 제1 전자 문서에 대한 문서 파일을 생성할 수 있다.Thereafter, the file
이러한 방식으로, 전자 장치(110)는 상기 제1 스캔 이미지에 삽입된 상기 진료비 내역 테이블과 동일한 표가 삽입된 전자 문서를 생성할 수 있다.In this way, the
진료비 총액 확인부(118)는 상기 제1 전자 문서에 대한 문서 파일이 생성되면, 상기 복수의 텍스트들 중 진료비 총액 항목을 지시하는 것으로 사전 설정된 텍스트와의 유사도가 최대인 제1 텍스트가 삽입된 제1 셀을 선택한 후, 상기 제1 셀과 같은 행, 열에 위치하는 셀들 중 금액을 지시하는 텍스트가 삽입된 적어도 하나의 셀을 확인하고, 상기 확인된 적어도 하나의 셀 중 상기 제1 셀과 가장 근접하여 위치하는 제2 셀을 선정한 후, 상기 제2 셀에 삽입된 텍스트를 진료비 총액에 대한 정보로 확인한다.When the document file for the first electronic document is generated, the total medical
이때, 본 발명의 일실시예에 따르면, 상기 복수의 텍스트들 각각과 진료비 총액 항목을 지시하는 것으로 사전 설정된 텍스트 간의 유사도는 최장 공통 부분 수열(Longest Common Subsequence: LCS)의 길이가 활용될 수 있다.In this case, according to an embodiment of the present invention, the length of the longest common subsequence (LCS) may be utilized for the degree of similarity between each of the plurality of texts and the text preset to indicate the total amount of medical expenses.
여기서, 상기 최장 공통 부분 수열이란 두 개의 문자열에서 일치하는 연속된 문자열을 의미한다. 관련해서, 두 개의 문자열을 각각 'ACAYKP, CAPCAK'라고 하는 경우, 상기 두 개의 문자열 간의 최장 공통 부분 수열은 'ACAK'이므로, 상기 두 개의 문자열 간의 최장 공통 부분 수열의 길이는 '4'이다.Here, the longest common subsequence means a continuous character string that matches two character strings. In this regard, when two character strings are referred to as 'ACAYKP, CAPCAK', the longest common subsequence between the two character strings is 'ACAK', so the length of the longest common subsequence between the two character strings is '4'.
관련해서, 도 6에 도시된 그림을 참조하여 진료비 총액 확인부(118)의 동작을 설명하면 다음과 같다.In relation to this, the operation of the total medical expenses check
먼저, 상기 사전 설정된 텍스트를 '진료비 총금액'이라고 하고, 문서 파일 생성부(117)에 의해 도 6에 도시된 그림과 같은 표가 삽입된 제1 전자 문서에 대한 문서 파일이 생성되었다고 가정하자. 그러면, 진료비 총액 확인부(118)는 상기 복수의 텍스트들인 '환자 성명, 홍길동, 진료항목, 항목별 진료금액, 병원명, A병원, 수술, 진료 날짜, 20201022, 검사, 10,000원, 진료비 총액, 40,000원, 주사, 30,000원, 납부금액, 40,000원, 입원' 중 상기 사전 설정된 텍스트인 '진료비 총금액'과의 유사도가 최대인 제1 텍스트가 삽입된 제1 셀을 선택할 수 있다.First, it is assumed that the preset text is 'total amount of medical expenses', and a document file for a first electronic document into which a table as shown in FIG. 6 is inserted is generated by the document
관련해서, 도 6에 도시된 실시예에서 상기 사전 설정된 텍스트인 '진료비 총금액'과의 유사도가 최대인 제1 텍스트가 삽입된 제1 셀을 '진료비 총액'이라는 텍스트가 삽입된 '셀 2(602)'라고 하는 경우, 진료비 총액 확인부(118)는 상기 제1 셀로 '셀 2(602)'를 선택할 수 있다.In relation to this, in the embodiment shown in FIG. 6, the first cell into which the first text having the highest degree of similarity with the preset text 'total medical expenses' is inserted into 'cell 2 (602)' into which the text 'total medical expenses' is inserted. )', the total medical
그러고 나서, 진료비 총액 확인부(118)는 상기 제1 셀인 '셀 2(602)'와 같은 행, 열에 위치하는 셀들인 '셀 1(601), 셀 3(603), 셀 4(604), 셀 5(605), 셀 6(606), 셀 7(607), 셀 8(608)' 중 금액을 지시하는 텍스트가 삽입된 적어도 하나의 셀인 '셀 3(603), 셀 5(605)'를 확인하고, 상기 확인된 적어도 하나의 셀인 '셀 3(603), 셀 5(605)' 중 상기 제1 셀인 '셀 2(602)'와 가장 근접하여 위치하는 제2 셀인 '셀 3(603)'을 도 6에 도시된 그림과 같이 선정한 후, 상기 제2 셀인 '셀 3(603)'에 삽입된 텍스트인 '40,000원'을 진료비 총액에 대한 정보로 확인할 수 있다.Then, the total medical
정보 저장 처리부(119)는 상기 제2 셀에 삽입된 텍스트가 진료비 총액에 대한 정보로 확인되면, 상기 제1 환자 식별자와 상기 제1 전자 문서에 대한 문서 파일 및 상기 확인된 진료비 총액에 대한 정보를 복합 정보 저장부(111)에 서로 대응시켜 저장한다.When the text inserted into the second cell is identified as information on the total amount of medical expenses, the information
예컨대, 전술한 예에 따라, 진료비 총액 확인부(118)에 의해 상기 제2 셀인 '셀 3(603)'에 삽입된 텍스트인 '40,000원'이 진료비 총액에 대한 정보로 확인되었다고 하는 경우, 정보 저장 처리부(119)는 상기 제1 환자 식별자인 '환자 식별자 110'과 상기 제1 전자 문서에 대한 문서 파일 및 상기 확인된 진료비 총액인 '40,000원'에 대한 정보를 복합 정보 저장부(111)에 서로 대응시켜 하기의 표 2와 같이 저장할 수 있다.For example, according to the above-described example, when the text '40,000 won' inserted into the second cell 'cell 3 (603)' by the total medical
본 발명의 일실시예에 따르면, 전자 장치(110)는 표시부(120)를 더 포함할 수 있다.According to an embodiment of the present invention, the
표시부(120)는 정보 저장 처리부(119)에 의해 상기 제1 환자 식별자와 상기 제1 전자 문서에 대한 문서 파일 및 상기 확인된 진료비 총액에 대한 정보가 복합 정보 저장부(111)에 서로 대응되어 저장된 이후, 상기 관리자로부터 상기 제1 환자 식별자를 기초로 한 진료비 영수증 검색 명령이 인가되면, 복합 정보 저장부(111)로부터 상기 제1 환자 식별자에 대응되어 저장되어 있는 상기 제1 전자 문서에 대한 문서 파일과 상기 확인된 진료비 총액에 대한 정보를 추출한 후, 상기 제1 전자 문서에 대한 문서 파일을 실행하여 상기 제1 전자 문서를 화면 상에 표시함과 동시에 상기 확인된 진료비 총액에 대한 정보를 상기 제1 전자 문서가 표시되는 화면 영역에서 사전 설정된 제1 지점에 표시한다.The
예컨대, 전술한 예에 따라, 정보 저장 처리부(119)에 의해 상기 제1 환자 식별자인 '환자 식별자 110'과 상기 제1 전자 문서에 대한 문서 파일 및 상기 확인된 진료비 총액인 '40,000원'에 대한 정보가 상기 표 2에서 나타낸 바와 같이, 복합 정보 저장부(111)에 서로 대응되어 저장되었다고 가정하자. 이때, 상기 관리자로부터 상기 제1 환자 식별자인 '환자 식별자 110'을 기초로 한 진료비 영수증 검색 명령이 전자 장치(110)에 인가되었다고 하는 경우, 표시부(120)는 상기 표 2와 같은 복합 정보 저장부(111)로부터 상기 제1 환자 식별자인 '환자 식별자 110'에 대응되어 저장되어 있는 상기 제1 전자 문서에 대한 문서 파일과 상기 확인된 진료비 총액인 '40,000원'에 대한 정보를 추출할 수 있다.For example, according to the above-described example, the first patient identifier 'patient identifier 110', the document file for the first electronic document, and '40,000 won', which is the total amount of the confirmed medical expenses by the information
그러고 나서, 표시부(120)는 상기 제1 전자 문서에 대한 문서 파일을 실행하여 상기 제1 전자 문서를 화면 상에 표시함과 동시에 상기 확인된 진료비 총액인 '40,000원'에 대한 정보를 상기 제1 전자 문서가 표시되는 화면 영역에서 사전 설정된 제1 지점에 표시할 수 있다.Then, the
이를 통해, 관리자는 상기 화면 상에 표시된 상기 제1 전자 문서에 대한 정보와 상기 제1 지점에 표시된 상기 확인된 진료비 총액인 '40,000원'에 대한 정보를 빠르게 확인할 수 있다.Through this, the administrator can quickly check information on the first electronic document displayed on the screen and information on '40,000 won', which is the confirmed total medical expenses displayed at the first point.
도 7은 본 발명의 일실시예에 따른 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치의 동작 방법을 도시한 순서도이다.7 is a flowchart illustrating an operation method of an electronic device for electronically processing a paper-printed medical expense receipt according to an embodiment of the present invention.
단계(S710)에서는 서로 다른 복수의 환자 식별자들과 상기 복수의 환자 식별자들 각각에 대응하는 진료비 영수증에 대한 문서 파일 및 상기 복수의 환자 식별자들 각각에 대응하는 진료비 총액에 대한 정보가 서로 대응되어 저장되어 있는 복합 정보 저장부를 유지한다.In step S710, a document file for a plurality of different patient identifiers, a medical fee receipt corresponding to each of the plurality of patient identifiers, and information on the total amount of medical expenses corresponding to each of the plurality of patient identifiers are stored in correspondence with each other Maintains a complex information storage unit.
단계(S720)에서는 표를 구성하는 선의 색상으로 사전 설정된 색상 값 범위가 저장되어 있는 색상 값 저장부를 유지한다.In step S720, a color value storage unit in which a color value range preset as the color of the line constituting the table is stored is maintained.
단계(S730)에서는 관리자로부터 종이로 인쇄된 제1 진료비 영수증(상기 제1 진료비 영수증은 진료비 내역에 대한 텍스트가 삽입된 표 형식의 진료비 내역 테이블로 구성되어 있음)이 스캔된 제1 스캔 이미지와 제1 환자 식별자가 입력되면서, 상기 제1 진료비 영수증에 대한 전자 문서화 처리 명령이 인가되면, 상기 제1 스캔 이미지를 가로 n(n은 2이상의 자연수임)개, 세로 m(m은 2이상의 자연수임)개의 사전 설정된 제1 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 중 상기 색상 값 범위에 대응되는 색상을 갖는 사각 영역에 대해 1의 코드를 할당하고, 나머지 영역에 대해 0의 코드를 할당하여 상기 제1 스캔 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성한다.In step S730, the first medical expense receipt printed on paper from the manager (the first medical expense receipt is composed of a table-type medical expenses details table in which the text for medical expenses details is inserted) is scanned with the first scanned image and the second 1 When a patient identifier is input and an electronic document processing command for the first medical fee receipt is applied, the first scanned image is n horizontally (n is a natural number greater than or equal to 2) and vertical m (m is a natural number greater than or equal to 2). After dividing into rectangular regions of a preset first size, a code of 1 is assigned to a rectangular region having a color corresponding to the color value range among the rectangular regions, and a code of 0 is assigned to the remaining regions By binarizing the first scan image, an mxn image matrix is generated.
단계(S740)에서는 OCR을 이용하여 상기 제1 스캔 이미지 내에 존재하는 복수의 텍스트들을 추출한 후, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 텍스트 위치 정보(상기 텍스트 위치 정보는 상기 제1 스캔 이미지의 최좌측 상단 지점을 기준으로 한 각 텍스트의 상기 제1 스캔 이미지 내에서의 상대적 위치에 대한 정보를 의미함)를 확인한다.In step S740, after extracting a plurality of texts existing in the first scanned image using OCR, the plurality of texts and text location information ( The text position information refers to information on the relative position of each text in the first scanned image with respect to the upper leftmost point of the first scanned image).
단계(S750)에서는 상기 m x n의 이미지 행렬에 대해, 스캔 이미지 내에서의 수직선을 검출하기 위한 사전 설정된 m x n의 수직선 필터 행렬(상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 복수의 열들 중 사전 설정된 복수의 제1 열들을 구성하는 성분은 1의 코드가 할당되어 있고, 나머지 열들을 구성하는 성분은 0의 코드가 할당되어 있는 행렬임)과 스캔 이미지 내에서의 수평선을 검출하기 위한 사전 설정된 m x n의 수평선 필터 행렬(상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 복수의 행들 중 사전 설정된 복수의 제1 행들을 구성하는 성분은 1의 코드가 할당되어 있고, 나머지 행들을 구성하는 성분은 0의 코드가 할당되어 있는 행렬임)을 기초로 한 행렬 연산을 수행함으로써, 상기 제1 스캔 이미지로부터 상기 진료비 내역 테이블을 구성하는 복수의 수직선들과 복수의 수평선들을 검출한다.In step S750, for the mxn image matrix, a preset mxn vertical line filter matrix for detecting vertical lines in a scan image (the mxn vertical line filter matrix is a plurality of columns constituting the mxn vertical line filter matrix) A component constituting a plurality of preset first columns is assigned a code of 1, and a component constituting the remaining columns is a matrix to which a code of 0 is assigned) and a dictionary for detecting a horizontal line in the scanned image. A set mxn horizontal line filter matrix (the mxn horizontal line filter matrix is a component constituting a plurality of preset first rows among a plurality of rows constituting the mxn horizontal line filter matrix is assigned a code of 1, and the remaining rows are A plurality of vertical lines and a plurality of horizontal lines constituting the medical expenses detail table are detected from the first scan image by performing a matrix operation based on the component constituting the matrix to which codes of 0 are assigned).
단계(S760)에서는 상기 복수의 수직선들과 상기 복수의 수평선들에 의해 생성되는 복수의 셀들을 확인한 후, 상기 복수의 셀들로 구성되는 표가 삽입된 제1 전자 문서를 생성한다.In step S760, after checking a plurality of cells generated by the plurality of vertical lines and the plurality of horizontal lines, a first electronic document into which a table composed of the plurality of cells is inserted is generated.
단계(S770)에서는 상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각을 상기 제1 전자 문서에 삽입된 표를 구성하는 상기 복수의 셀들에 삽입하여 상기 제1 전자 문서에 대한 문서 파일을 생성한다.In step S770 , each of the plurality of texts constitutes a table inserted into the first electronic document based on the text position information in the first scanned image for each of the plurality of texts. A document file for the first electronic document is created by inserting it into cells of .
단계(S780)에서는 상기 제1 전자 문서에 대한 문서 파일이 생성되면, 상기 복수의 텍스트들 중 진료비 총액 항목을 지시하는 것으로 사전 설정된 텍스트와의 유사도가 최대인 제1 텍스트가 삽입된 제1 셀을 선택한 후, 상기 제1 셀과 같은 행, 열에 위치하는 셀들 중 금액을 지시하는 텍스트가 삽입된 적어도 하나의 셀을 확인하고, 상기 확인된 적어도 하나의 셀 중 상기 제1 셀과 가장 근접하여 위치하는 제2 셀을 선정한 후, 상기 제2 셀에 삽입된 텍스트를 진료비 총액에 대한 정보로 확인한다.In step S780, when the document file for the first electronic document is generated, the first cell in which the first text having the highest degree of similarity with the text preset to indicate the total amount of medical expenses among the plurality of texts is inserted After selection, at least one cell in which text indicating an amount is inserted among cells located in the same row and column as the first cell is checked, and among the checked at least one cell located closest to the first cell After selecting the second cell, the text inserted into the second cell is checked as information on the total amount of medical expenses.
단계(S790)에서는 상기 제2 셀에 삽입된 텍스트가 진료비 총액에 대한 정보로 확인되면, 상기 제1 환자 식별자와 상기 제1 전자 문서에 대한 문서 파일 및 상기 확인된 진료비 총액에 대한 정보를 상기 복합 정보 저장부에 서로 대응시켜 저장한다.In step S790, when the text inserted into the second cell is identified as information on the total amount of medical expenses, the first patient identifier, a document file for the first electronic document, and information on the confirmed total amount of medical expenses are combined They are stored in correspondence with each other in the information storage unit.
이때, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 제1 환자 식별자와 상기 제1 전자 문서에 대한 문서 파일 및 상기 확인된 진료비 총액에 대한 정보가 상기 복합 정보 저장부에 서로 대응되어 저장된 이후, 상기 관리자로부터 상기 제1 환자 식별자를 기초로 한 진료비 영수증 검색 명령이 인가되면, 상기 복합 정보 저장부로부터 상기 제1 환자 식별자에 대응되어 저장되어 있는 상기 제1 전자 문서에 대한 문서 파일과 상기 확인된 진료비 총액에 대한 정보를 추출한 후, 상기 제1 전자 문서에 대한 문서 파일을 실행하여 상기 제1 전자 문서를 화면 상에 표시함과 동시에 상기 확인된 진료비 총액에 대한 정보를 상기 제1 전자 문서가 표시되는 화면 영역에서 사전 설정된 제1 지점에 표시하는 단계를 더 포함할 수 있다.In this case, according to an embodiment of the present invention, in the method of operating the electronic device, the first patient identifier, the document file for the first electronic document, and information on the confirmed total amount of medical expenses are mutually transmitted to the composite information storage unit. After correspondingly stored, when a medical fee receipt search command based on the first patient identifier is applied from the manager, the document for the first electronic document stored in correspondence with the first patient identifier from the composite information storage unit After extracting the file and the information on the total amount of medical expenses, the document file for the first electronic document is executed to display the first electronic document on the screen, and at the same time, information on the confirmed total amount of medical expenses is displayed as the first electronic document. 1 The method may further include displaying the electronic document at a preset first point in a screen area where the electronic document is displayed.
또한, 본 발명의 일실시예에 따르면, 단계(S730)에서는 상기 관리자로부터 상기 제1 스캔 이미지와 상기 제1 환자 식별자가 입력되면서, 상기 제1 진료비 영수증에 대한 전자 문서화 처리 명령이 인가되면, 상기 제1 스캔 이미지를 가로 n개, 세로 m개의 상기 제1 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 각각에 대해, 상기 사각 영역들 각각을 구성하는 복수의 화소들의 색상 값의 평균 값을 연산하는 단계 및 상기 사각 영역들 중 상기 복수의 화소들의 색상 값의 평균 값이 상기 색상 값 범위에 포함되는 사각 영역에 대해 1의 코드를 할당하고, 상기 색상 값 범위에 포함되지 않는 사각 영역에 대해 0의 코드를 할당하여 상기 제1 스캔 이미지를 이진화함으로써, 상기 m x n의 이미지 행렬을 생성하는 단계를 포함할 수 있다.In addition, according to an embodiment of the present invention, in step S730, while the first scan image and the first patient identifier are input from the manager, when an electronic document processing command for the first medical fee receipt is applied, the After dividing the first scan image into n horizontal and m vertical rectangular regions of the first size, for each of the rectangular regions, an average value of color values of a plurality of pixels constituting each of the rectangular regions and assigning a code of 1 to a rectangular region in which the average value of the color values of the plurality of pixels among the rectangular regions is included in the color value range, and to a rectangular region not included in the color value range. and binarizing the first scan image by assigning a code of 0 to the mxn image matrix.
또한, 본 발명의 일실시예에 따르면, 단계(S750)에서는 상기 m x n의 이미지 행렬과 상기 m x n의 수직선 필터 행렬 간의 아다마르 곱을 연산하여 m x n의 제1 연산 행렬을 생성하고, 상기 m x n의 이미지 행렬과 상기 m x n의 수평선 필터 행렬 간의 아다마르 곱을 연산하여 m x n의 제2 연산 행렬을 생성한 후, 상기 m x n의 제1 연산 행렬과 상기 m x n의 제2 연산 행렬 간의 논리합 연산을 수행하여 m x n의 제3 연산 행렬을 생성하는 단계 및 상기 제1 스캔 이미지에서, 상기 m x n의 제3 연산 행렬을 구성하는 성분들 중 1의 코드가 할당된 성분들에 대응되는 지점들을 선을 구성하는 영역으로 확인함으로써, 상기 제1 스캔 이미지로부터 상기 진료비 내역 테이블을 구성하는 상기 복수의 수직선들과 상기 복수의 수평선들을 검출하는 단계를 포함할 수 있다.In addition, according to an embodiment of the present invention, in step S750, a Hadamard product between the mxn image matrix and the mxn vertical filter matrix is calculated to generate an mxn first operation matrix, and the mxn image matrix and An mxn second operation matrix is generated by calculating the Hadamard product between the mxn horizontal line filter matrices, and then an OR operation is performed between the mxn first operation matrix and the mxn second operation matrix to perform a third operation matrix of mxn generating and in the first scan image, by identifying points corresponding to components to which a code of 1 is assigned among components constituting the mxn third operation matrix as regions constituting a line, the first The method may include detecting the plurality of vertical lines and the plurality of horizontal lines constituting the medical expenses detail table from a scan image.
또한, 본 발명의 일실시예에 따르면, 단계(S770)에서는 상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각에 대한 상기 제1 전자 문서 내에서의 텍스트 삽입 지점(상기 텍스트 삽입 지점은 상기 제1 전자 문서의 최좌측 상단 지점을 기준으로 상기 텍스트 위치 정보에 따른 위치를 연산한 지점을 의미함)을 연산하는 단계 및 상기 제1 전자 문서에 삽입된 표를 구성하는 상기 복수의 셀들 중 상기 복수의 텍스트들 각각의 텍스트 삽입 지점에 대응되는 위치의 셀을 확인한 후, 상기 복수의 텍스트들 각각을 각 텍스트의 텍스트 삽입 지점에 대응되는 위치의 셀에 삽입하여 상기 제1 전자 문서에 대한 문서 파일을 생성하는 단계를 포함할 수 있다.In addition, according to an embodiment of the present invention, in step S770, based on the text position information in the first scan image for each of the plurality of texts, the 1 Calculating a text insertion point in an electronic document (the text insertion point refers to a point at which a position according to the text position information is calculated based on the upper leftmost point of the first electronic document) and the second 1 After checking a cell at a position corresponding to a text insertion point of each of the plurality of texts among the plurality of cells constituting a table inserted into an electronic document, each of the plurality of texts corresponds to a text insertion point of each text The method may include generating a document file for the first electronic document by inserting it into a cell at a location where the first electronic document is located.
이상, 도 7을 참조하여 본 발명의 일실시예에 따른 전자 장치의 동작 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 따른 전자 장치의 동작 방법은 도 1 내지 도 6을 이용하여 설명한 전자 장치(110)의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.In the above, a method of operating an electronic device according to an embodiment of the present invention has been described with reference to FIG. 7 . Here, since the method of operating the electronic device according to an embodiment of the present invention may correspond to the configuration of the operation of the
본 발명의 일실시예에 따른 전자 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다.The method of operating an electronic device according to an embodiment of the present invention may be implemented as a computer program stored in a storage medium for execution through combination with a computer.
또한, 본 발명의 일실시예에 따른 전자 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.Also, the method of operating an electronic device according to an embodiment of the present invention may be implemented in the form of computer program instructions for execution through combination with a computer and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the present invention, or may be known and available to those skilled in the art of computer software. Examples of the computer-readable recording medium include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floppy disks. - includes magneto-optical media, and hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.As described above, in the present invention, specific matters such as specific components, etc., and limited embodiments and drawings have been described, but these are only provided to help a more general understanding of the present invention, and the present invention is not limited to the above embodiments. , various modifications and variations are possible from these descriptions by those of ordinary skill in the art to which the present invention pertains.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be limited to the described embodiments, and not only the claims to be described later, but also all those with equivalent or equivalent modifications to the claims will be said to belong to the scope of the spirit of the present invention. .
110: 전자 장치
111: 복합 정보 저장부 112: 색상 값 저장부
113: 이미지 행렬 생성부 114: 텍스트 확인부
115: 선 검출부 116: 전자 문서 생성부
117: 문서 파일 생성부 118: 진료비 총액 확인부
119: 정보 저장 처리부 120: 표시부
121: 평균 값 연산부 122: 행렬 생성 처리부
123: 연산부 124: 선 검출 처리부
125: 삽입 지점 연산부 126: 파일 생성 처리부110: electronic device
111: complex information storage unit 112: color value storage unit
113: image matrix generation unit 114: text verification unit
115: line detection unit 116: electronic document generating unit
117: document file generation unit 118: total medical expenses confirmation unit
119: information storage processing unit 120: display unit
121: average value calculation unit 122: matrix generation processing unit
123: calculation unit 124: line detection processing unit
125: insertion point calculation unit 126: file generation processing unit
Claims (12)
표를 구성하는 선의 색상으로 사전 설정된 색상 값 범위가 저장되어 있는 색상 값 저장부;
관리자로부터 종이로 인쇄된 제1 진료비 영수증 - 상기 제1 진료비 영수증은 진료비 내역에 대한 텍스트(Text)가 삽입된 표 형식의 진료비 내역 테이블로 구성되어 있음 - 이 스캔된 제1 스캔 이미지와 제1 환자 식별자가 입력되면서, 상기 제1 진료비 영수증에 대한 전자 문서화 처리 명령이 인가되면, 상기 제1 스캔 이미지를 가로 n(n은 2이상의 자연수임)개, 세로 m(m은 2이상의 자연수임)개의 사전 설정된 제1 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 중 상기 색상 값 범위에 대응되는 색상을 갖는 사각 영역에 대해 1의 코드를 할당하고, 나머지 영역에 대해 0의 코드를 할당하여 상기 제1 스캔 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성하는 이미지 행렬 생성부;
OCR(Optical Character Reader)을 이용하여 상기 제1 스캔 이미지 내에 존재하는 복수의 텍스트들을 추출한 후, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 텍스트 위치 정보 - 상기 텍스트 위치 정보는 상기 제1 스캔 이미지의 최좌측 상단 지점을 기준으로 한 각 텍스트의 상기 제1 스캔 이미지 내에서의 상대적 위치에 대한 정보를 의미함 - 를 확인하는 텍스트 확인부;
상기 m x n의 이미지 행렬에 대해, 스캔 이미지 내에서의 수직선을 검출하기 위한 사전 설정된 m x n의 수직선 필터 행렬 - 상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 복수의 열들 중 사전 설정된 복수의 제1 열들을 구성하는 성분은 1의 코드가 할당되어 있고, 나머지 열들을 구성하는 성분은 0의 코드가 할당되어 있는 행렬임 - 과 스캔 이미지 내에서의 수평선을 검출하기 위한 사전 설정된 m x n의 수평선 필터 행렬 - 상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 복수의 행들 중 사전 설정된 복수의 제1 행들을 구성하는 성분은 1의 코드가 할당되어 있고, 나머지 행들을 구성하는 성분은 0의 코드가 할당되어 있는 행렬임 - 을 기초로 한 행렬 연산을 수행함으로써, 상기 제1 스캔 이미지로부터 상기 진료비 내역 테이블을 구성하는 복수의 수직선들과 복수의 수평선들을 검출하는 선 검출부;
상기 복수의 수직선들과 상기 복수의 수평선들에 의해 생성되는 복수의 셀들을 확인한 후, 상기 복수의 셀들로 구성되는 표가 삽입된 제1 전자 문서를 생성하는 전자 문서 생성부;
상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각을 상기 제1 전자 문서에 삽입된 표를 구성하는 상기 복수의 셀들에 삽입하여 상기 제1 전자 문서에 대한 문서 파일을 생성하는 문서 파일 생성부;
상기 제1 전자 문서에 대한 문서 파일이 생성되면, 상기 복수의 텍스트들 중 진료비 총액 항목을 지시하는 것으로 사전 설정된 텍스트와의 유사도가 최대인 제1 텍스트가 삽입된 제1 셀을 선택한 후, 상기 제1 셀과 같은 행, 열에 위치하는 셀들 중 금액을 지시하는 텍스트가 삽입된 적어도 하나의 셀을 확인하고, 상기 확인된 적어도 하나의 셀 중 상기 제1 셀과 가장 근접하여 위치하는 제2 셀을 선정한 후, 상기 제2 셀에 삽입된 텍스트를 진료비 총액에 대한 정보로 확인하는 진료비 총액 확인부; 및
상기 제2 셀에 삽입된 텍스트가 진료비 총액에 대한 정보로 확인되면, 상기 제1 환자 식별자와 상기 제1 전자 문서에 대한 문서 파일 및 상기 확인된 진료비 총액에 대한 정보를 상기 복합 정보 저장부에 서로 대응시켜 저장하는 정보 저장 처리부
를 포함하는 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치.Composite information storage in which a document file for a plurality of different patient identifiers, a medical fee receipt corresponding to each of the plurality of patient identifiers, and information on the total amount of medical expenses corresponding to each of the plurality of patient identifiers are stored in correspondence with each other wealth;
a color value storage unit storing a preset color value range as the color of the line constituting the table;
The first medical expense receipt printed on paper from the administrator - The first medical expense receipt is composed of a table format medical expenses history table in which text for medical expenses details is inserted - This scanned first scanned image and the first patient When an electronic document processing command for the first medical fee receipt is applied while the identifier is input, the first scanned image is n horizontally (n is a natural number greater than or equal to 2) and m vertical (m is a natural number greater than or equal to 2) dictionary of the first scan image. After dividing into rectangular regions of a set first size, a code of 1 is assigned to a rectangular region having a color corresponding to the color value range among the rectangular regions, and a code of 0 is assigned to the remaining regions. an image matrix generator generating an mxn image matrix by binarizing the first scan image;
After extracting a plurality of texts present in the first scanned image using an optical character reader (OCR), the plurality of texts and text position information in the first scanned image for each of the plurality of texts - a text confirmation unit for confirming that the text position information means information about a relative position of each text in the first scanned image with respect to the upper leftmost point of the first scanned image;
For the mxn image matrix, a preset mxn vertical line filter matrix for detecting vertical lines in a scanned image, wherein the mxn vertical line filter matrix comprises a preset plurality of columns constituting the mxn vertical line filter matrix. A component constituting the first columns is assigned a code of 1, and a component constituting the remaining columns is a matrix assigned a code of 0 - and a preset mxn horizontal line filter for detecting horizontal lines in the scanned image. Matrix - In the mxn horizontal line filter matrix, a code of 1 is assigned to a component constituting a plurality of preset first rows among a plurality of rows constituting the mxn horizontal line filter matrix, and a component constituting the remaining rows is 0 a line detection unit that detects a plurality of vertical lines and a plurality of horizontal lines constituting the medical expense details table from the first scan image by performing a matrix operation based on - that is a matrix to which a code of is assigned;
an electronic document generating unit generating a first electronic document into which a table composed of the plurality of cells is inserted after checking a plurality of cells generated by the plurality of vertical lines and the plurality of horizontal lines;
Based on the text position information in the first scanned image for each of the plurality of texts, each of the plurality of texts is inserted into the plurality of cells constituting a table inserted in the first electronic document, a document file generating unit generating a document file for the first electronic document;
When the document file for the first electronic document is generated, after selecting a first cell in which the first text having the highest degree of similarity with the text preset as indicating the total amount of medical expenses among the plurality of texts is inserted, Among the cells positioned in the same row and column as the first cell, at least one cell in which text indicating the amount is inserted is checked, and a second cell located closest to the first cell is selected from among the checked at least one cell. Then, a total amount of medical treatment check unit for checking the text inserted into the second cell as information about the total amount of medical expenses; and
When the text inserted into the second cell is identified as information on the total amount of medical expenses, the first patient identifier, the document file for the first electronic document, and information on the confirmed total amount of medical expenses are mutually transferred to the composite information storage unit Information storage processing unit to store in correspondence
An electronic device for electronically documenting a paper-printed medical bill receipt comprising a.
상기 정보 저장 처리부에 의해 상기 제1 환자 식별자와 상기 제1 전자 문서에 대한 문서 파일 및 상기 확인된 진료비 총액에 대한 정보가 상기 복합 정보 저장부에 서로 대응되어 저장된 이후, 상기 관리자로부터 상기 제1 환자 식별자를 기초로 한 진료비 영수증 검색 명령이 인가되면, 상기 복합 정보 저장부로부터 상기 제1 환자 식별자에 대응되어 저장되어 있는 상기 제1 전자 문서에 대한 문서 파일과 상기 확인된 진료비 총액에 대한 정보를 추출한 후, 상기 제1 전자 문서에 대한 문서 파일을 실행하여 상기 제1 전자 문서를 화면 상에 표시함과 동시에 상기 확인된 진료비 총액에 대한 정보를 상기 제1 전자 문서가 표시되는 화면 영역에서 사전 설정된 제1 지점에 표시하는 표시부
를 더 포함하는 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치.According to claim 1,
After the information on the first patient identifier, the document file for the first electronic document, and the confirmed total amount of medical expenses by the information storage processing unit are stored in correspondence with each other in the complex information storage unit, the first patient from the manager When a medical expense receipt search command based on the identifier is applied, the document file for the first electronic document stored in correspondence with the first patient identifier and information on the confirmed total medical expenses are extracted from the complex information storage unit. Then, the first electronic document is displayed on the screen by executing the document file for the first electronic document, and at the same time, information on the confirmed total amount of medical expenses is displayed in the screen area where the first electronic document is displayed. 1 point display
An electronic device for electronically documenting a paper-printed medical bill receipt, further comprising a.
상기 이미지 행렬 생성부는
상기 관리자로부터 상기 제1 스캔 이미지와 상기 제1 환자 식별자가 입력되면서, 상기 제1 진료비 영수증에 대한 전자 문서화 처리 명령이 인가되면, 상기 제1 스캔 이미지를 가로 n개, 세로 m개의 상기 제1 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 각각에 대해, 상기 사각 영역들 각각을 구성하는 복수의 화소들의 색상 값의 평균 값을 연산하는 평균 값 연산부; 및
상기 사각 영역들 중 상기 복수의 화소들의 색상 값의 평균 값이 상기 색상 값 범위에 포함되는 사각 영역에 대해 1의 코드를 할당하고, 상기 색상 값 범위에 포함되지 않는 사각 영역에 대해 0의 코드를 할당하여 상기 제1 스캔 이미지를 이진화함으로써, 상기 m x n의 이미지 행렬을 생성하는 행렬 생성 처리부
를 포함하는 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치.According to claim 1,
The image matrix generator
While the first scan image and the first patient identifier are input from the manager, when an electronic document processing command for the first medical fee receipt is applied, the first scan image is displayed in n horizontal and m vertical sizes. an average value calculating unit that calculates an average value of color values of a plurality of pixels constituting each of the rectangular regions after dividing the rectangular regions; and
A code of 1 is assigned to a rectangular area in which the average value of the color values of the plurality of pixels among the rectangular areas is included in the color value range, and a code of 0 is assigned to a rectangular area not included in the color value range. A matrix generation processing unit for generating the mxn image matrix by binarizing the first scan image by allocating
An electronic device for electronically documenting a paper-printed medical bill receipt comprising a.
상기 선 검출부는
상기 m x n의 이미지 행렬과 상기 m x n의 수직선 필터 행렬 간의 아다마르 곱(Hadamard product)을 연산하여 m x n의 제1 연산 행렬을 생성하고, 상기 m x n의 이미지 행렬과 상기 m x n의 수평선 필터 행렬 간의 아다마르 곱을 연산하여 m x n의 제2 연산 행렬을 생성한 후, 상기 m x n의 제1 연산 행렬과 상기 m x n의 제2 연산 행렬 간의 논리합(OR) 연산을 수행하여 m x n의 제3 연산 행렬을 생성하는 연산부; 및
상기 제1 스캔 이미지에서, 상기 m x n의 제3 연산 행렬을 구성하는 성분들 중 1의 코드가 할당된 성분들에 대응되는 지점들을 선을 구성하는 영역으로 확인함으로써, 상기 제1 스캔 이미지로부터 상기 진료비 내역 테이블을 구성하는 상기 복수의 수직선들과 상기 복수의 수평선들을 검출하는 선 검출 처리부
를 포함하는 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치.According to claim 1,
The line detection unit
A Hadamard product between the mxn image matrix and the mxn vertical line filter matrix is calculated to generate an mxn first operation matrix, and the Hadamard product between the mxn image matrix and the mxn horizontal line filter matrix is calculated an arithmetic operation unit for generating an mxn second operation matrix and then performing an OR operation between the mxn first operation matrix and the mxn second operation matrix to generate a mxn third operation matrix; and
In the first scan image, by identifying points corresponding to the components to which the code of 1 is assigned among the components constituting the mxn third operation matrix as regions constituting the line, the medical expenses from the first scan image A line detection processing unit that detects the plurality of vertical lines and the plurality of horizontal lines constituting the history table
An electronic device for electronically documenting a paper-printed medical bill receipt comprising a.
상기 문서 파일 생성부는
상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각에 대한 상기 제1 전자 문서 내에서의 텍스트 삽입 지점 - 상기 텍스트 삽입 지점은 상기 제1 전자 문서의 최좌측 상단 지점을 기준으로 상기 텍스트 위치 정보에 따른 위치를 연산한 지점을 의미함 - 을 연산하는 삽입 지점 연산부; 및
상기 제1 전자 문서에 삽입된 표를 구성하는 상기 복수의 셀들 중 상기 복수의 텍스트들 각각의 텍스트 삽입 지점에 대응되는 위치의 셀을 확인한 후, 상기 복수의 텍스트들 각각을 각 텍스트의 텍스트 삽입 지점에 대응되는 위치의 셀에 삽입하여 상기 제1 전자 문서에 대한 문서 파일을 생성하는 파일 생성 처리부
를 포함하는 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치.According to claim 1,
The document file generating unit
a text insertion point in the first electronic document for each of the plurality of texts, based on the text position information within the first scanned image for each of the plurality of texts, wherein the text insertion point is an insertion point calculating unit that calculates a point at which a location according to the text location information is calculated based on the upper leftmost point of the first electronic document; and
After checking a cell at a position corresponding to a text insertion point of each of the plurality of texts among the plurality of cells constituting the table inserted into the first electronic document, each of the plurality of texts is set as a text insertion point of each text A file generation processing unit for generating a document file for the first electronic document by inserting it into a cell at a position corresponding to
An electronic device for electronically documenting a paper-printed medical bill receipt comprising a.
표를 구성하는 선의 색상으로 사전 설정된 색상 값 범위가 저장되어 있는 색상 값 저장부를 유지하는 단계;
관리자로부터 종이로 인쇄된 제1 진료비 영수증 - 상기 제1 진료비 영수증은 진료비 내역에 대한 텍스트(Text)가 삽입된 표 형식의 진료비 내역 테이블로 구성되어 있음 - 이 스캔된 제1 스캔 이미지와 제1 환자 식별자가 입력되면서, 상기 제1 진료비 영수증에 대한 전자 문서화 처리 명령이 인가되면, 상기 제1 스캔 이미지를 가로 n(n은 2이상의 자연수임)개, 세로 m(m은 2이상의 자연수임)개의 사전 설정된 제1 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 중 상기 색상 값 범위에 대응되는 색상을 갖는 사각 영역에 대해 1의 코드를 할당하고, 나머지 영역에 대해 0의 코드를 할당하여 상기 제1 스캔 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성하는 단계;
OCR(Optical Character Reader)을 이용하여 상기 제1 스캔 이미지 내에 존재하는 복수의 텍스트들을 추출한 후, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 텍스트 위치 정보 - 상기 텍스트 위치 정보는 상기 제1 스캔 이미지의 최좌측 상단 지점을 기준으로 한 각 텍스트의 상기 제1 스캔 이미지 내에서의 상대적 위치에 대한 정보를 의미함 - 를 확인하는 단계;
상기 m x n의 이미지 행렬에 대해, 스캔 이미지 내에서의 수직선을 검출하기 위한 사전 설정된 m x n의 수직선 필터 행렬 - 상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 복수의 열들 중 사전 설정된 복수의 제1 열들을 구성하는 성분은 1의 코드가 할당되어 있고, 나머지 열들을 구성하는 성분은 0의 코드가 할당되어 있는 행렬임 - 과 스캔 이미지 내에서의 수평선을 검출하기 위한 사전 설정된 m x n의 수평선 필터 행렬 - 상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 복수의 행들 중 사전 설정된 복수의 제1 행들을 구성하는 성분은 1의 코드가 할당되어 있고, 나머지 행들을 구성하는 성분은 0의 코드가 할당되어 있는 행렬임 - 을 기초로 한 행렬 연산을 수행함으로써, 상기 제1 스캔 이미지로부터 상기 진료비 내역 테이블을 구성하는 복수의 수직선들과 복수의 수평선들을 검출하는 단계;
상기 복수의 수직선들과 상기 복수의 수평선들에 의해 생성되는 복수의 셀들을 확인한 후, 상기 복수의 셀들로 구성되는 표가 삽입된 제1 전자 문서를 생성하는 단계;
상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각을 상기 제1 전자 문서에 삽입된 표를 구성하는 상기 복수의 셀들에 삽입하여 상기 제1 전자 문서에 대한 문서 파일을 생성하는 단계;
상기 제1 전자 문서에 대한 문서 파일이 생성되면, 상기 복수의 텍스트들 중 진료비 총액 항목을 지시하는 것으로 사전 설정된 텍스트와의 유사도가 최대인 제1 텍스트가 삽입된 제1 셀을 선택한 후, 상기 제1 셀과 같은 행, 열에 위치하는 셀들 중 금액을 지시하는 텍스트가 삽입된 적어도 하나의 셀을 확인하고, 상기 확인된 적어도 하나의 셀 중 상기 제1 셀과 가장 근접하여 위치하는 제2 셀을 선정한 후, 상기 제2 셀에 삽입된 텍스트를 진료비 총액에 대한 정보로 확인하는 단계; 및
상기 제2 셀에 삽입된 텍스트가 진료비 총액에 대한 정보로 확인되면, 상기 제1 환자 식별자와 상기 제1 전자 문서에 대한 문서 파일 및 상기 확인된 진료비 총액에 대한 정보를 상기 복합 정보 저장부에 서로 대응시켜 저장하는 단계
를 포함하는 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치의 동작 방법.Composite information storage in which a document file for a plurality of different patient identifiers, a medical fee receipt corresponding to each of the plurality of patient identifiers, and information on the total amount of medical expenses corresponding to each of the plurality of patient identifiers are stored in correspondence with each other maintaining wealth;
maintaining a color value storage unit in which a color value range preset as a color of a line constituting a table is stored;
The first medical expense receipt printed on paper from the administrator - The first medical expense receipt is composed of a table format medical expenses history table in which text for medical expenses details is inserted - This scanned first scanned image and the first patient When an electronic document processing command for the first medical fee receipt is applied while the identifier is input, the first scanned image is n horizontally (n is a natural number greater than or equal to 2) and m vertical (m is a natural number greater than or equal to 2) dictionary of the first scan image. After dividing into rectangular regions of a set first size, a code of 1 is assigned to a rectangular region having a color corresponding to the color value range among the rectangular regions, and a code of 0 is assigned to the remaining regions. generating an mxn image matrix by binarizing the first scan image;
After extracting a plurality of texts present in the first scanned image using an optical character reader (OCR), the plurality of texts and text position information in the first scanned image for each of the plurality of texts - confirming that the text position information means information about a relative position of each text in the first scanned image with respect to the upper leftmost point of the first scanned image;
For the mxn image matrix, a preset mxn vertical line filter matrix for detecting vertical lines in a scanned image, wherein the mxn vertical line filter matrix comprises a preset plurality of columns constituting the mxn vertical line filter matrix. A component constituting the first columns is assigned a code of 1, and a component constituting the remaining columns is a matrix assigned a code of 0 - and a preset mxn horizontal line filter for detecting horizontal lines in the scanned image. Matrix - In the mxn horizontal line filter matrix, a code of 1 is assigned to a component constituting a plurality of preset first rows among a plurality of rows constituting the mxn horizontal line filter matrix, and a component constituting the remaining rows is 0 detecting a plurality of vertical lines and a plurality of horizontal lines constituting the medical expenses detail table from the first scan image by performing a matrix operation based on the matrix to which a code of is assigned;
generating a first electronic document into which a table composed of the plurality of cells is inserted after checking a plurality of cells generated by the plurality of vertical lines and the plurality of horizontal lines;
Based on the text position information in the first scanned image for each of the plurality of texts, each of the plurality of texts is inserted into the plurality of cells constituting a table inserted in the first electronic document, generating a document file for the first electronic document;
When a document file for the first electronic document is generated, after selecting a first cell in which the first text having the highest degree of similarity with the text preset to indicate the total amount of medical expenses among the plurality of texts is inserted, the second cell Among the cells located in the same row and column as the first cell, at least one cell in which text indicating the amount is inserted is checked, and a second cell located closest to the first cell is selected from among the checked at least one cell. thereafter, checking the text inserted into the second cell as information about the total amount of medical expenses; and
When the text inserted into the second cell is identified as information on the total amount of medical expenses, the first patient identifier, the document file for the first electronic document, and information on the confirmed total amount of medical expenses are mutually transferred to the composite information storage unit step to save
An operating method of an electronic device for electronically documenting a paper-printed medical bill receipt comprising a.
상기 제1 환자 식별자와 상기 제1 전자 문서에 대한 문서 파일 및 상기 확인된 진료비 총액에 대한 정보가 상기 복합 정보 저장부에 서로 대응되어 저장된 이후, 상기 관리자로부터 상기 제1 환자 식별자를 기초로 한 진료비 영수증 검색 명령이 인가되면, 상기 복합 정보 저장부로부터 상기 제1 환자 식별자에 대응되어 저장되어 있는 상기 제1 전자 문서에 대한 문서 파일과 상기 확인된 진료비 총액에 대한 정보를 추출한 후, 상기 제1 전자 문서에 대한 문서 파일을 실행하여 상기 제1 전자 문서를 화면 상에 표시함과 동시에 상기 확인된 진료비 총액에 대한 정보를 상기 제1 전자 문서가 표시되는 화면 영역에서 사전 설정된 제1 지점에 표시하는 단계
를 더 포함하는 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치의 동작 방법.7. The method of claim 6,
After the first patient identifier and the document file for the first electronic document and information on the confirmed total amount of medical expenses are stored in correspondence with each other in the complex information storage unit, the medical expenses based on the first patient identifier from the manager When the receipt search command is applied, after extracting the document file for the first electronic document stored in correspondence with the first patient identifier and information on the confirmed total amount of medical expenses from the complex information storage unit, the first electronic Displaying the first electronic document on the screen by executing the document file for the document and simultaneously displaying information on the confirmed total medical expenses at a preset first point in the screen area where the first electronic document is displayed
An operating method of an electronic device for electronically processing medical expenses receipt printed on paper further comprising a.
상기 m x n의 이미지 행렬을 생성하는 단계는
상기 관리자로부터 상기 제1 스캔 이미지와 상기 제1 환자 식별자가 입력되면서, 상기 제1 진료비 영수증에 대한 전자 문서화 처리 명령이 인가되면, 상기 제1 스캔 이미지를 가로 n개, 세로 m개의 상기 제1 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 각각에 대해, 상기 사각 영역들 각각을 구성하는 복수의 화소들의 색상 값의 평균 값을 연산하는 단계; 및
상기 사각 영역들 중 상기 복수의 화소들의 색상 값의 평균 값이 상기 색상 값 범위에 포함되는 사각 영역에 대해 1의 코드를 할당하고, 상기 색상 값 범위에 포함되지 않는 사각 영역에 대해 0의 코드를 할당하여 상기 제1 스캔 이미지를 이진화함으로써, 상기 m x n의 이미지 행렬을 생성하는 단계
를 포함하는 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치의 동작 방법.7. The method of claim 6,
The step of generating the mxn image matrix is
While the first scan image and the first patient identifier are input from the manager, when an electronic document processing command for the first medical fee receipt is applied, the first scan image is displayed in n horizontal and m vertical sizes. calculating an average value of color values of a plurality of pixels constituting each of the rectangular regions after dividing the rectangular regions; and
A code of 1 is assigned to a rectangular area in which the average value of the color values of the plurality of pixels among the rectangular areas is included in the color value range, and a code of 0 is assigned to a rectangular area not included in the color value range. generating the mxn image matrix by binarizing the first scan image by assigning
An operating method of an electronic device for electronically documenting a paper-printed medical bill receipt comprising a.
상기 복수의 수직선들과 상기 복수의 수평선들을 검출하는 단계는
상기 m x n의 이미지 행렬과 상기 m x n의 수직선 필터 행렬 간의 아다마르 곱(Hadamard product)을 연산하여 m x n의 제1 연산 행렬을 생성하고, 상기 m x n의 이미지 행렬과 상기 m x n의 수평선 필터 행렬 간의 아다마르 곱을 연산하여 m x n의 제2 연산 행렬을 생성한 후, 상기 m x n의 제1 연산 행렬과 상기 m x n의 제2 연산 행렬 간의 논리합(OR) 연산을 수행하여 m x n의 제3 연산 행렬을 생성하는 단계; 및
상기 제1 스캔 이미지에서, 상기 m x n의 제3 연산 행렬을 구성하는 성분들 중 1의 코드가 할당된 성분들에 대응되는 지점들을 선을 구성하는 영역으로 확인함으로써, 상기 제1 스캔 이미지로부터 상기 진료비 내역 테이블을 구성하는 상기 복수의 수직선들과 상기 복수의 수평선들을 검출하는 단계
를 포함하는 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치의 동작 방법.7. The method of claim 6,
Detecting the plurality of vertical lines and the plurality of horizontal lines includes:
A Hadamard product between the mxn image matrix and the mxn vertical line filter matrix is calculated to generate an mxn first operation matrix, and the Hadamard product between the mxn image matrix and the mxn horizontal line filter matrix is calculated generating an mxn second operation matrix, and then performing an OR operation between the mxn first operation matrix and the mxn second operation matrix to generate a mxn third operation matrix; and
In the first scan image, by identifying points corresponding to the components to which the code of 1 is assigned among the components constituting the mxn third operation matrix as regions constituting the line, the medical expenses from the first scan image Detecting the plurality of vertical lines and the plurality of horizontal lines constituting the history table
An operating method of an electronic device for electronically documenting a paper-printed medical bill receipt comprising a.
상기 제1 전자 문서에 대한 문서 파일을 생성하는 단계는
상기 복수의 텍스트들 각각에 대한 상기 제1 스캔 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각에 대한 상기 제1 전자 문서 내에서의 텍스트 삽입 지점 - 상기 텍스트 삽입 지점은 상기 제1 전자 문서의 최좌측 상단 지점을 기준으로 상기 텍스트 위치 정보에 따른 위치를 연산한 지점을 의미함 - 을 연산하는 단계; 및
상기 제1 전자 문서에 삽입된 표를 구성하는 상기 복수의 셀들 중 상기 복수의 텍스트들 각각의 텍스트 삽입 지점에 대응되는 위치의 셀을 확인한 후, 상기 복수의 텍스트들 각각을 각 텍스트의 텍스트 삽입 지점에 대응되는 위치의 셀에 삽입하여 상기 제1 전자 문서에 대한 문서 파일을 생성하는 단계
를 포함하는 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치의 동작 방법.7. The method of claim 6,
The step of generating a document file for the first electronic document includes:
a text insertion point in the first electronic document for each of the plurality of texts, based on the text position information within the first scanned image for each of the plurality of texts, wherein the text insertion point is calculating a point at which a location according to the text location information is calculated based on the upper leftmost point of the first electronic document; and
After checking a cell at a position corresponding to a text insertion point of each of the plurality of texts among the plurality of cells constituting the table inserted into the first electronic document, each of the plurality of texts is set as a text insertion point of each text generating a document file for the first electronic document by inserting it into a cell at a position corresponding to
An operating method of an electronic device for electronically documenting a paper-printed medical bill receipt comprising a.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200153486A KR102375566B1 (en) | 2020-11-17 | 2020-11-17 | Electronic apparatus that processes medical expenses receipt printed on paper electronically and operating method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200153486A KR102375566B1 (en) | 2020-11-17 | 2020-11-17 | Electronic apparatus that processes medical expenses receipt printed on paper electronically and operating method thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102375566B1 true KR102375566B1 (en) | 2022-03-17 |
Family
ID=80936277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200153486A KR102375566B1 (en) | 2020-11-17 | 2020-11-17 | Electronic apparatus that processes medical expenses receipt printed on paper electronically and operating method thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102375566B1 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5590224A (en) * | 1992-10-19 | 1996-12-31 | Fast; Bruce B. | OCR image preprocessing method for image enhancement of scanned documents by correction of registration |
US8174554B2 (en) * | 2007-07-18 | 2012-05-08 | Brother Kogyo Kabushiki Kaisha | Optical scanning device and printing apparatus using a threshold matrix to improve image quality |
KR101445171B1 (en) * | 2014-03-28 | 2014-10-02 | 주식회사 한글과컴퓨터 | Apparatus and method for converting paper document into electronic document |
KR20190095651A (en) * | 2018-02-07 | 2019-08-16 | 삼성에스디에스 주식회사 | Apparatus for generating training data for character learning and method thereof |
US10769503B1 (en) * | 2018-04-25 | 2020-09-08 | Zorroa Corporation | Digital organization of printed documents according to extracted semantic information |
-
2020
- 2020-11-17 KR KR1020200153486A patent/KR102375566B1/en active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5590224A (en) * | 1992-10-19 | 1996-12-31 | Fast; Bruce B. | OCR image preprocessing method for image enhancement of scanned documents by correction of registration |
US8174554B2 (en) * | 2007-07-18 | 2012-05-08 | Brother Kogyo Kabushiki Kaisha | Optical scanning device and printing apparatus using a threshold matrix to improve image quality |
KR101445171B1 (en) * | 2014-03-28 | 2014-10-02 | 주식회사 한글과컴퓨터 | Apparatus and method for converting paper document into electronic document |
KR20190095651A (en) * | 2018-02-07 | 2019-08-16 | 삼성에스디에스 주식회사 | Apparatus for generating training data for character learning and method thereof |
US10769503B1 (en) * | 2018-04-25 | 2020-09-08 | Zorroa Corporation | Digital organization of printed documents according to extracted semantic information |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111476227B (en) | Target field identification method and device based on OCR and storage medium | |
US10339378B2 (en) | Method and apparatus for finding differences in documents | |
KR102149050B1 (en) | System and method for analyzing document using artificial intelligence based on ocr | |
US9785627B2 (en) | Automated form fill-in via form retrieval | |
US20040139391A1 (en) | Integration of handwritten annotations into an electronic original | |
US9836665B2 (en) | Management system, list production device, method, computer readable recording medium, data structure, and printed label | |
US8254721B2 (en) | Data input system, data input receiving device, data input receiving method and computer readable medium | |
EP3430567B1 (en) | Optical character recognition utilizing hashed templates | |
KR102328034B1 (en) | Database building device that can build a knowledge database from a table-inserted image and operating method thereof | |
JP2008259156A (en) | Information processing device, information processing system, information processing method, program, and storage medium | |
CN111444795A (en) | Bill data identification method, electronic device, storage medium and device | |
US10867170B2 (en) | System and method of identifying an image containing an identification document | |
JP6574921B1 (en) | Image processing system, image processing method, and program | |
CN112257396A (en) | Mobile phone end auxiliary form filling method based on artificial intelligence technology | |
KR20150091948A (en) | A system for recognizing a font and providing its information and the method thereof | |
CN110537188B (en) | Object recognition device, object recognition system, and object recognition method | |
KR20010103394A (en) | A customer information management system and method using text recognition technology for the identification card | |
KR102375566B1 (en) | Electronic apparatus that processes medical expenses receipt printed on paper electronically and operating method thereof | |
KR102300475B1 (en) | Electronic device that can convert a table-inserted image into an electronic document and operating method thereof | |
KR102352726B1 (en) | Electronic apparatus that can convert medical expenses receipt printed on paper into an electronic document and operating method thereof | |
CN113259538B (en) | Electronic file transferring system | |
KR101435860B1 (en) | Method for manipulating template of electronic document and method for reading the electronic document using the template | |
JP2001034763A (en) | Document image processor, method for extracting its document title and method for attaching document tag information | |
US20210027052A1 (en) | Image-processing device, image processing method, and storage medium on which program is stored | |
CN115640952B (en) | Method and system for importing and uploading data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |