KR101692930B1 - Medical Record Translation System and Medical Record Translation Method - Google Patents

Medical Record Translation System and Medical Record Translation Method Download PDF

Info

Publication number
KR101692930B1
KR101692930B1 KR1020160093255A KR20160093255A KR101692930B1 KR 101692930 B1 KR101692930 B1 KR 101692930B1 KR 1020160093255 A KR1020160093255 A KR 1020160093255A KR 20160093255 A KR20160093255 A KR 20160093255A KR 101692930 B1 KR101692930 B1 KR 101692930B1
Authority
KR
South Korea
Prior art keywords
unit
word
translation
phrase
extracted
Prior art date
Application number
KR1020160093255A
Other languages
Korean (ko)
Inventor
김태연
Original Assignee
사라소프트주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 사라소프트주식회사 filed Critical 사라소프트주식회사
Priority to KR1020160093255A priority Critical patent/KR101692930B1/en
Application granted granted Critical
Publication of KR101692930B1 publication Critical patent/KR101692930B1/en

Links

Images

Classifications

    • G06F17/2809

Landscapes

  • Machine Translation (AREA)

Abstract

The present invention relates to a system for translating a medical record written with a medical term and a translation method thereof. The present invention has the following effects. The present invention can improve the accuracy of translation by performing a searching operation according to a priority. Also, a user can optionally correct a translation result with a translation unit and construct a database by storing the corrected translation, thereby improving a translation rate according as the experience of the user is accumulated. The present invention includes a medical record scan module which converts a medical record scan material into a medical record text material, a medical record translation module which translates the medical record text material from English to Korean, and the database which stores data to be translated.

Description

의료기록지 번역 시스템 및 의료기록지 번역 방법 {omitted}Medical Record Translation System and Medical Record Translation Method {omitted}

본 발명은 의료용어로 작성된 의료기록지를 실시간으로 번역하는 시스템과 그 번역 방법에 관한 것이다.The present invention relates to a system for translating medical recording papers written in medical terminology in real time and a translation method thereof.

손해액의 조사 및 평가와 보험금사정업무는 보험사업자 뿐만 아니라 보험계약자의 권익에도 영향을 미치는 중요한 업무인 바 객관적으로 공정하고 자격있는 전문인에 의하여 수행토록 함이 보험사업의 공공성에 비추어 보험경영의 합리성, 건전성 도모와 공정한 업무처리를 위하여 바람직하다는 취지에서 손해사정인 제도가 도입되었다. The purpose of this study is to investigate and evaluate the amount of loss and the assessment of insurance premiums by objective and fair and qualified professionals who are important business affects not only the insurance companies but also the policyholders' interests. The rationality, In order to improve the soundness and fairness of the business, a system of damages assessment was introduced.

손해사정인의 역할은 정확한 사고조사 및 면부책판단과 공정, 적정한 손해액 및 보험금의 신속사정을 통하여 보험자 및 피보험자측에 보험금 지급 책임 발생 유무 및 합의 기준 보험금액을 제시함으로써 보험사고 발생시 야기되는 제반분쟁을 보험제도권 내에서 해결토록 하는 것이다.The role of the damage assessor is to provide the insurer and the insured side with the insurance claim payment liability and the agreed insurance standard amount through the accident investigation, the judging of the book and the process, the fair damages, It is to be resolved within the insurance system.

손해사정 프로세스는 도 7에 제시되어 있는데, 보험사가 고객으로부터 보험금 청구 접수를 받으면, 접수 내역에 대해서류를 검토하고 손해사정회사에 조사를 의뢰하는 것으로 시작된다. 손해사정회사는 조사의뢰내역을 접수하여 조사의뢰의 내용과 성격에 따라 의뢰건을 담당자별로 분배하고 지정한다. 지정된 조사담당지는 해당 조사건을 분석하고 자료를 검토하여 보고서를 작성하게 되는데, 이 때 분석하는 자료 중에 병원에서 발급받은 진단서, 증명서 등의 의료기록지도 포함된다. 그런데 의료기록지는 대부분 영어인 의료용어로 되어있어, 의사 정도로 의료분야에 전문적 지식을 갖추지 않은 사람은 이를 해석하는데 매우 많은 시간이 소요된다. 특히 의료용어는 일반 영어사전에 등재되어 있지 않은 것이 대부분이므로, 의학분야 사전을 뒤져 일일이 번역해야 하며, 약어나 공식용어가 아닌 단어는 이를 검색하여 파악하는 등의 번거로운 작업을 거쳐야 한다. 따라서 조사자들이 수십장에서 많게는 수백장에 이르는 의료기록지를 분석하는데 통상 5~10일이 소요되는 실정이다.The damage assessment process is shown in FIG. 7, where the insurer receives a claim from the customer and begins by reviewing the documents for the receipt and requesting an investigation to the loss assessment company. Damage Assessment The Company receives the request for investigation and distributes the request for each person in charge according to the nature and contents of the investigation request. The designated investigator will analyze the investigation, review the data, and prepare a report, which includes medical records such as medical certificates and certificates issued by the hospital. However, most of the medical records are in English medical terminology, and those who do not have expertise in the field of medicine as a doctor are very time consuming to interpret it. Especially medical terminology is not listed in the general English dictionary. Therefore, it is necessary to translate dictionary of medical field one by one, and it is troublesome work such as searching for the word which is not an abbreviation or official term, and grasping it. Therefore, it usually takes 5 to 10 days for researchers to analyze medical records from dozens to hundreds.

등록특허 제10-1313158호(2013.09.30.)Registration No. 10-1313158 (September 30, 2013)

본 발명에서 해결하려는 과제는 다음과 같다.The problems to be solved in the present invention are as follows.

우선순위에 따라 검색을 수행하여 번역의 정확도를 향상시키고자 한다. 또한 번역결과에서 사용자가 번역단위별로 임의수정 가능케 하고 이를 저장하여 데이터베이스화 함으로써 사용자 경험이 누적될 수록 번역률이 높아지는 지능형 번역시스템을 제시하고자 한다.We want to improve the accuracy of translation by performing searches according to priority. In this paper, we propose an intelligent translation system that enables users to make arbitrary revisions for each translation unit in a translation result, stores it in a database, and increases the translation rate as the user experience accumulates.

본 발명은 상기와 같은 과제를 해결하기 위하여,In order to solve the above problems,

의료기록지스캔본(10)을 의료기록지텍스트본(20)으로 변환하는 의료기록지스캔모듈(100); 의료기록지텍스트본(20)의 영어를 한글로 번역하는 의료기록지번역모듈(200); 번역을 수행할 데이터가 저장되는 데이터베이스(300); 의료기록지번역모듈(200)에 의해 번역된 결과를 의료기록지텍스트본(20)에 반영하여 의료기록지번역본(30)을 작성하는 번역본작성모듈(400);을 포함하고, 상기 데이터베이스(300)는 구절로 된 영어의학용어와 그에 대응되는 한글구절이 저장되는 구절DB(350)를 포함하고, 상기 의료기록지번역모듈(200)은 의료기록지텍스트본(20)에서 문장부호 또는 줄바꿈으로 구분되는 단위문장인 번역단위를 추출하는 추출부(210), 정해진 순서에 따라 추출된 번역단위별로 번역을 수행하는 번역부(220), 번역결과를 번역단위별로 출력하는 번역문출력부(230)을 포함하며, 상기 추출부(210)는 단위문장에서 약어를 추출하는 약어추출부(214), 단위문장에서 번역가능한 가장 긴 구절을 추출하는 구절추출부(211), 단위문장에서 약어추출부(214)와 구절추출부(211)에서 추출되지 않은 텍스트 중 사용자단어를 추출하는 사용자단어추출부(212), 단위문장에서 약어추출부(214)와 구절추출부(211), 사용자단어추출부(212)에서 추출되지 않은 텍스트 중 학습단어를 추출하는 학습단어추출부(213), 약어추출부(214)와 구절추출부(211), 사용자단어추출부(212), 학습단어추출부(213)에서 추출되지 않은 텍스트 중 어휘를 추출하는 어휘추출부(215), 약어추출부(214)와 구절추출부(211), 사용자단어추출부(212), 학습단어추출부(213)에서 추출되지 않은 텍스트 중 단어가 아닌 것(문장부호 등)이나 한글을 추출하는 비대상추출부(218), 번역대상파일의 텍스트 중 개인정보를 추출하는 개인정보추출부(219)를 포함하되, 사용자단어는 사용자가 직접 등록한 영어단어이고, 학습단어는 번역된 단어 뜻이 사용자에 의해 수정된 영어단어임을 특징으로 하며, 상기 구절추출부(211)는 단위문장 전체가 구절DB(350)에 저장되어 있을 경우 이를 구절로 추출하고, 그렇지 않을 경우 최후 단어를 제외하는 방식으로 구절의 길이를 순차로 줄여가면서 구절DB(350)에 저장된 구절을 추출하며, 한 구절이 추출되면 남은 단어에서 구절의 길이를 순차로 줄여가면서 구절DB(350)에 저장되어 있을 경우 이를 구절로 추출하는 것을 특징으로 하며, 상기 번역부(220)는 약어추출부(214)에서 추출된 약어를 번역하는 약어번역부(224), 구절추출부(211)에서 추출된 구절을 번역하는 구절번역부(221), 사용자단어추출부(212)에서 추출된 사용자단어를 번역하는 사용자단어번역부(222), 학습단어추출부(213)에서 추출된 학습단어를 번역하는 학습단어번역부(223), 어휘추출부(215)에서 추출된 어휘를 번역하는 어휘번역부(225), 단어추출부(216)에서 추출된 단어를 번역하는 단어번역부(226)를 포함하고, 상기 번역문출력부(230)는 추출부(210)에서 단위문장으로 추출한 원문장(231a)과 이에 대응되는 번역문장(231b)을 출력하는 단위문장출력부(231), 원문장(231a)을 세부번역단위로 구분한 원단어(232a)와 이에 대응되는 번역단어(232b)를 같은 구분칸에 출력하는 세부단위출력부(232), 세부번역단위수, 비대상단어수, 미등록단어수 및 번역율을 포함한 번역정보를 표시하는 번역정보표시부(233)를 포함하되, 세부번역단위는 구절, 사용자단어, 학습단어, 약어, 어휘 중 하나이며, 세부번역단위별로 번역이 수행되고, 세부번역단위별로 번역단어(232b)를 약어, 어휘를 포함하는 자동으로 번역된 단어와 사용자단어, 학습단어를 포함하는 수동으로 번역된 단어, 번역되지 않은 단어, 번역대상이 아닌 단어에 따라 각기 다른색으로 표시하고 이를 번역문장(231b)에 반영하는 것을 특징으로 하며, 상기 번역본작성모듈(400)에서 의료기록지텍스트본(20)의 각 대응되는 위치에 원문장(231a)을 대입하여 의료기록지번역본(30)을 작성하는 것을 특징으로 하는 의료기록지 번역 시스템을 제시한다.A medical record scanning module (100) for converting the medical record scan book (10) into a medical record text book (20); A medical recording paper translation module 200 for translating the English text of the medical recording paper text 20 into Korean; A database 300 in which data to be translated is stored; And a translation creating module (400) for creating a medical recording translation (30) by reflecting the translated result by the medical recording translation module (200) in the medical record text book (20) And the medical record translation module 200 includes a sentence code or a unit sentence separated by a line break in the medical record paper text block 20. The medical record translation module 200 may include a medical phrase database 350 in which English medical terms and corresponding Hangul phrases are stored, A translation unit 220 for performing translation for each translation unit extracted according to a predetermined order, and a translation output unit 230 for outputting translation results for each translation unit, The extraction unit 210 includes an abbreviation extraction unit 214 for extracting an abbreviation in a unit sentence, a phrase extraction unit 211 for extracting the longest translatable phrase in a unit sentence, an abbreviation extraction unit 214, (Not shown) A user word extracting unit 212 for extracting a user word among the texts extracted from the unit word extracting unit 214, a phrase extracting unit 211, and a user word extracting unit 212, The vocabulary extracting unit 213 extracts a vocabulary among the texts not extracted by the learning word extracting unit 213, the abbreviation extracting unit 214 and the phrase extracting unit 211, the user word extracting unit 212 and the learning word extracting unit 213, (Punctuation marks, etc.) or non-words (e.g., punctuation marks) that are not extracted by the extracting unit 215, the abbreviation extracting unit 214 and the phrase extracting unit 211, the user word extracting unit 212 and the learning word extracting unit 213, And a personal information extraction unit 219 for extracting personal information from the text of the translation target file, wherein the user word is an English word directly registered by the user, the learning word is a translated word Wherein the meaning is an English word modified by the user, If the whole unit sentence is stored in the phrase database 350, it is extracted as a phrase. Otherwise, the phrase stored in the phrase database 350 is stored in the phrase database 350 while decreasing the length of the phrase in a manner of excluding the last word And extracts the phrases as phrases when they are stored in the phrase DB 350 while sequentially reducing the length of the phrases in the remaining words when one phrase is extracted, An abbreviation translating unit 224 for translating the abbreviations extracted by the user extraction unit 214, a phrase translation unit 221 for translating the phrases extracted by the phrase extraction unit 211, a user word extracted from the user word extraction unit 212, A learning word translation unit 223 for translating the learning word extracted by the learning word extraction unit 213, a vocabulary translation unit for translating the vocabulary extracted by the vocabulary extraction unit 215 225), the word extracted by the word extracting unit 216 is translated And the translated sentence output unit 230 includes a sentence output unit 230 for outputting a sentence sentence 231a extracted as a unit sentence by the extracting unit 210 and a translated sentence 231b corresponding thereto, A detailed unit output unit 232 for outputting a source word 232a dividing the sentence sentence 231a into a detailed translation unit and a translation word 232b corresponding to the source word 232b in the same segment, And a translation information display unit 233 for displaying translation information including the number of non-target words, the number of unregistered words, and the translation ratio, wherein the detailed translation unit is one of a phrase, a user word, a learning word, an abbreviation and a vocabulary, A translation is performed, and the translation word (232b) is abbreviated for each detailed translation unit, an automatically translated word including a vocabulary and a user word, a manually translated word including a learning word, an untranslated word, Display different colors for different words The translating sentence 231b is reflected in the translation sentence 231b and the translated sentence creation module 400 substitutes the sentence sentence 231a at each corresponding position of the medical recording paper text book 20, And a medical recorder translation system which records the medical recorder translation system.

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

본 발명은 다음과 같은 효과를 발휘한다.The present invention has the following effects.

우선순위에 따라 검색을 수행하여 번역의 정확도를 향상시킬 수 있다. 또한 번역결과에서 사용자가 번역단위별로 임의수정 가능케 하고 이를 저장하여 데이터베이스화 함으로써 사용자 경험이 누적될 수록 번역률이 높아지는 장점이 있다.It is possible to improve the accuracy of the translation by searching according to the priority. In addition, the translation result can be arbitrarily modified by the user for each translation unit, stored in a database, and the translation rate is increased as the user experience is accumulated.

도 1은 본 발명에 의해 번역이 수행되는 화면을 나타낸 도면.
도 2는 번역대상인 의료기록지의 예시 도면.
도 3은 도 2의 의료기록지가 번역된 결과의 예시 도면.
도 4는 사용자단어 목록에 대한 도면.
도 5는 본 발명의 전체 구성에 대한 블록도.
도 6은 의료기록지번역모듈의 세부 구성에 대한 블록도.
도 7은 손해사정 프로세스에 대한 도면.
도 8은 도 2와 도 3의 의료기록지를 한 화면에 나타낸 도면.
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a diagram showing a screen on which translation is performed according to the present invention; FIG.
2 is an exemplary illustration of a medical recording sheet to be translated;
Fig. 3 is an exemplary view of a result of translating the medical recording sheet of Fig. 2; Fig.
4 is a diagram of a user word list;
5 is a block diagram of an overall configuration of the present invention;
6 is a block diagram of the detailed configuration of the medical record translation module;
7 is a diagram of a damage assessment process;
FIG. 8 is a view showing the medical recording sheets of FIGS. 2 and 3 on one screen. FIG.

이하 첨부된 도면을 바탕으로 본 발명의 바람직한 실시예에 대해 설명한다. 다만 본 발명의 권리범위는 특허청구범위 기재에 의하여 파악되어야 한다. 또한 본 발명의 요지를 모호하게 하는 공지기술의 설명은 생략한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings. However, the scope of the present invention should be understood from the description of the claims. Further, the description of known technology which obscures the gist of the present invention is omitted.

본 발명의 의료기록지 번역 시스템은 도 5와 같이 의료기록지스캔모듈(100), 의료기록지번역모듈(200), 데이터베이스(300), 번역본작성모듈(400)을 포함하여 구성된다.The medical recording paper translation system of the present invention includes a medical recording paper scanning module 100, a medical recording paper translation module 200, a database 300 and a translation writing module 400 as shown in FIG.

의료기록지스캔모듈(100)은 의료기록지스캔본(10)을 의료기록지텍스트본(20)으로 변환하는 기능을 제공하며, 스캔파일수신부(110), 파일형식변환부(120), 텍스트추출부(130), 텍스트파일생성부(140)를 포함한다. 의료기록지스캔본(10)은 영어를 포함하는 언어로 작성된 의료기록지를 스캔한 파일, 의료기록지텍스트본(20)은 의료기록지스캔본(10)이 의료기록지스캔모듈(100)에 의해 변환된 파일을 의미한다.The medical recording sheet scanning module 100 provides a function of converting the medical recording sheet scanned book 10 into a medical recording sheet text book 20 and includes a scan file receiving unit 110, a file format converting unit 120, a text extracting unit 130, and a text file generation unit 140. The medical record paper text 20 is a file in which the medical record scanned book 10 is converted into a file converted by the medical record scanning module 100, .

스캔파일수신부(110)는 의료기록지스캔본(10), 즉 의료기록지를 스캔하여 생성된 파일을 수신하는 부분이다. 이 때 의료기록지는 병원에서 발급받은 것으로서 대부분 영어로 된 의료용어로 작성되어 있다. 의료기록지를 스캔하면 의료기록지에 적힌 글자가 텍스트로 바로 인식되지 않고, 전체가 이미지형식으로 처리된 이미지파일인 의료기록지스캔본(10)이 생성된다. 이 의료기록지스캔본(10)을 번역이 수행될 서버에 업로드하면 스캔파일수신부(110)에서 수신하게 된다. 즉, 출력된(hardcopy) 의료기록지를 스캔하여 생성된 의료기록지스캔본(10, 예를 들어 jpg 파일)을 사용자가 서버로 업로드하면 스캔파일수신부(110)에서 수신하게 된다.The scan file receiving unit 110 is a part for receiving a scan file 10, that is, a file generated by scanning a medical record. At this time, medical records were issued by the hospital, and most of them are written in medical terminology in English. When a medical recording sheet is scanned, a medical record sheet scanned image 10, which is an image file in which an entire image is processed in an image format, is generated without recognizing the text written on the medical recording sheet directly. When the medical record book 10 is uploaded to the server to be translated, the scan file receiver 110 receives the scanned book 10. That is, when the user uploads a scanned medical record (10, e.g., a jpg file) generated by scanning the hardcopy medical recording sheet to the server, the scan file receiving unit 110 receives the scan.

파일형식변환부(120)는 스캔파일수신부(110)에서 수신된 의료기록지스캔본(10)을 텍스트 추출 가능한 파일형식으로 변환한다. 텍스트 추출 가능한 파일형식은 텍스트를 추출할 프로그램(툴)에 따라 달라질 것이나, 통상 OCR기능을 수행할 수 있는 pdf 또는 xml 파일형식이 바람직할 것이다. 즉, 스캔파일수신부(110)에서 수신된 jpg 파일을 파일형식변환부(120)에서 xml 파일로 변환하는 것이다.The file format conversion unit 120 converts the scanned medical record 10 received from the scan file receiving unit 110 into a file format that can be extracted as text. The format of the text extractable file will depend on the program (tool) from which the text is to be extracted, but a pdf or xml file format that would normally perform OCR functions would be desirable. That is, the jpg file received from the scan file receiving unit 110 is converted from the file format conversion unit 120 into an xml file.

텍스트추출부(130)는 파일형식변환부(120)에서 형식변환된 파일에서 이미지를 인식하여 텍스트로 추출하는 부분이다. 이는 통상적인 OCR 기능을 이용하는 것이므로 상세한 기술은 생략한다.The text extraction unit 130 extracts an image from a file format-converted by the file format conversion unit 120 and extracts it as text. Since the conventional OCR function is used, detailed description is omitted.

텍스트파일생성부(140)는 텍스트추출부(130)에서 추출된 텍스트를 번역대상파일인 의료기록지텍스트본(20)으로 저장하는 부분이다. 의료기록지텍스트본(20)은 온전히 텍스트정보만 포함된 txt파일일 수도 있으나, 의료기록지스캔본(10)과 쉽게 대조할 수 있도록 의료기록지스캔본(10)에서 추출한 텍스트가 추출된 위치에 대응하도록 텍스트 위치정보를 포함하고, 텍스트로 추출되지 않은 부분은 이미지형태로 남겨둔 채로 저장함이 바람직하다. 또한 본 발명은 웹기반의 실시간 번역을 특징으로 하는 바, 웹에서 용이하게 불러올 수 있는 html파일이 더욱 바람직할 것이다. 다시 말해, 파일형식변환부(120)에서 변환된 pdf 파일에서 텍스트추출부(130)에 의해 텍스트를 추출한 뒤, 텍스트파일생성부(140)에서 추출된 텍스트 정보를 포함하여 html 파일로 저장하는 것이다.The text file generating unit 140 is a unit for storing the text extracted by the text extracting unit 130 as a text file 20 of a medical record text to be translated. The medical record text text 20 may be a txt file containing only text information but may correspond to a location where the text extracted from the medical record scanned book 10 is extracted so as to be easily collated with the scanned medical record book 10 It is preferable to store the text position information and the portion not extracted as text in an image form. Further, the present invention is characterized by a web-based real-time translation, and an html file that can be easily retrieved from the web is more preferable. In other words, the text extraction unit 130 extracts text from the pdf file converted by the file format conversion unit 120, and then stores the extracted text information in the html file including the text information extracted by the text file generation unit 140 .

도 2에서 번역대상인 의료기록지의 예시를 확인할 수 있으며, 이는 의료기록지스캔본(10)이 의료기록지스캔모듈(100)에 의해 변환된 의료기록지텍스트본(20)으로서, 의료기록지스캔본(10) 역시 같은 형태의 문서일 것이다.FIG. 2 shows an example of a medical recording sheet to be translated. This is a medical record sheet text block 20 converted by the medical recording sheet scanning module 100 into a scanned medical record sheet 10, It would also be a document of the same type.

의료기록지번역모듈(200)은 의료기록지텍스트본(20)의 영어를 한글로 번역하는 기능을 제공하며, 도 6과 같이 추출부(210), 번역부(220), 번역문출력부(230)를 포함하여 구성된다.The medical record translation module 200 provides a function of translating the English text of the medical record text text 20 into Korean and includes an extraction unit 210, a translation unit 220, and a translation output unit 230 .

추출부(210)는 번역대상파일인 의료기록지텍스트본(20)에서 번역단위를 추출하는 부분이며, 구절추출부(211), 사용자단어추출부(212), 학습단어추출부(213), 약어추출부(214), 어휘추출부(215), 단어추출부(216), 미등록추출부(217), 비대상추출부(218), 개인정보추출부(219)를 포함한다.The extraction unit 210 extracts a translation unit from the medical record text text 20 as a translation target file and includes a phrase extraction unit 211, a user word extraction unit 212, a learning word extraction unit 213, An extracting unit 214, a lexical extracting unit 215, a word extracting unit 216, an unregistered extracting unit 217, a non-object extracting unit 218 and a personal information extracting unit 219.

사용자단어는 사용자가 직접 등록한 영어단어를 의미한다. 번역대상인 영어단어가 데이터베이스(300)에 등록되지 않은 단어인 경우, 이와 대응되는 한글단어를 데이터베이스(300)에서 불러올 수 없으므로, 사용자가 직접 입력하거나 웹을 검색하여 적당한 한글단어를 선정하여 입력하게 된다. 이 때 입력된 한글단어와 번역대상인 영어단어가 사용자단어 해당되며, 사용자단어DB(320)에 저장된다.The user word means an English word registered directly by the user. If the English word to be translated is a word not registered in the database 300, the corresponding Korean word can not be called up in the database 300, so that the user directly inputs or selects the appropriate Korean word by searching the web . The input Hangul word and the English word to be translated correspond to the user word, and are stored in the user word DB 320.

학습단어는 번역된 단어 뜻이 사용자에 의해 수정된 영어단어를 의미한다. 번역대상인 영어단어가 데이터베이스(300)에 등록된 단어인 경우, 이와 대응되는 한글단어를 데이터베이스(300)에서 불러와 번역문출력부(230)에서 출력하게 된다. 이 때 사용자가 출력된 한글단어 뜻과 다른 뜻의 한글단어 입력을 원하여 이를 수정할 경우, 수정된 한글단어와 번역대상인 영어단어가 학습단어에 해당되는 것이다. 학습단어는 학습단어DB(330)에 저장된다.The learning word means the English word modified by the user means the translated word. If the English word to be translated is a word registered in the database 300, the corresponding Korean word is called up in the database 300 and output by the translated text output unit 230. In this case, when the user desires to input a Korean word which is different from the output of the Korean word meaning, the modified Korean word and the English word to be translated correspond to the learning word. The learning word is stored in the learning word DB 330. [

번역단위는 번역대상파일의 텍스트를 문장단위로 추출한 것으로, 마침표('.')과 같은 문장부호나 줄바꿈으로 구분된 단위문장을 의미한다. 특히 의료기록지 특성상 한 단위문장이 서술형태의 완전한 문장이기 보다 특정 항목에 대한 단어의 나열인 경우가 많으므로, 본 발명의 단위문장은 일반적으로 말하는 주어와 서술어로 구성된 문법적으로 갖춰진 문장을 의미하는 것은 아니다.A translation unit is a sentence unit that extracts the text of a file to be translated in sentence units, and it is a sentence code such as a period ('.') Or a unit sentence separated by a line break. In particular, due to the nature of the medical recording paper, since a unit sentence is often a list of words for a specific item rather than a complete sentence of a description form, the unit sentence of the present invention generally means a grammatically prepared sentence composed of a subject word and a descriptive word no.

약어추출부(214)는 상기 단위문장에서 약어를 추출하는 부분이다. 단위문장의 텍스트 중 약어사전DB(340)에 저장된 약어가 있는지 검색하여 이를 추출하게 된다.The abbreviation extracting unit 214 extracts abbreviations from the unit sentence. Among the text of the unit sentence, the abbreviation dictionary DB 340 is searched for an abbreviation stored therein and extracted.

구절추출부(211)는 단위문장에서 번역가능한 가장 긴 구절을 추출하는 부분이다. 단위문장의 텍스트 중 구절DB(350)에 저장된 구절이 있는지 검색하여 이를 추출하게 된다. 다만, 그 순서는 먼저 단위문장 전체가 구절DB(350)에 저장되어 있을 경우 이를 추출하나, 그렇지 않을 경우 최후 단어를 제외하는 방식으로 구절의 길이를 순차로 줄여가면서 구절DB(350)에 저장된 구절을 추출한다. 한 구절이 추출되면 남은 단어에서 마찬가지로 구절의 길이를 순차로 줄여가면서 구절DB(350)에 저장된 구절인지 판단하게 된다.The phrase extraction unit 211 extracts the longest translatable phrase in the unit sentence. Among the text of the unit sentence, the phrase DB 350 is searched for a phrase stored therein and extracted. However, if the unit sentences are stored in the phrase DB 350, the sequence is first extracted. If not, the phrases stored in the phrase DB 350 are sequentially stored in a manner that the lengths of the phrases are sequentially reduced, . When one phrase is extracted, the length of the phrase is sequentially reduced in the remaining words, and it is determined whether the phrase is stored in the phrase database 350. [

예를 들어 한 문장이 "A, B, C, D" 로 구성되어 있을 경우, "A, B, C, D, E" 문장 자체는 구절DB(350)에 저장되어 있지 않으나, "A, B"와 "C, D"가 각각 구절DB(350)에 저장되어 있는 경우를 살펴보면 다음과 같다.For example, when a sentence is composed of "A, B, C, D", the sentence itself is not stored in the phrase DB 350, but "A, B, C, "And" C, D "are stored in the phrase database 350, respectively.

먼저 최후 단어인 "E"를 제외한 "A, B, C, D"를 구절DB(350)에서 찾는다. 그러나 저장되어 있지 않으므로, 역시 최후 단어인 "D"를 제외하여 길이가 줄어든 "A, B, C"를 찾는다. 없으면 "C"를 제외한 "A, B"를 구절DB(350)에서 찾아 추출하게 된다. 그리고 남은 단어인 "C, D, E"를 구절DB(350)에서 찾고, 없으면 최후 단어인 "E"를 제외한 "C, D"를 구절DB(350)에서 찾아 추출하게 된다.First, "A, B, C, D" except for the last word "E" is searched in the phrase DB 350. However, since it is not stored, it also searches for "A, B, C" whose length is reduced except for the last word "D". Quot; A " and " B "except for" C " Then, the remaining words "C, D, E" are searched in the phrase database 350, and if there is no end word "C, D" excluding the last word "C, D"

사용자단어추출부(212)는 단위문장에서 약어추출부(214)와 구절추출부(211)에서 추출되지 않은 텍스트 중 사용자단어를 추출하는 부분이다. 단위문장에서 약어추출부(214)와 구절추출부(211)에서 추출되지 않은 텍스트 중 사용자단어DB(320)에 저장된 사용자단어가 있는지 검색하여 이를 추출하게 된다. The user word extracting unit 212 extracts user words among texts not extracted by the abbreviation extracting unit 214 and the phrase extracting unit 211 in a unit sentence. In the unit sentence, the abbreviation extracting unit 214 and the phrase extracting unit 211 search for a user word stored in the user word DB 320 among texts not extracted, and extract the extracted user word.

학습단어추출부(213)는 단위문장에서 약어추출부(214)와 구절추출부(211), 사용자단어추출부(212)에서 추출되지 않은 텍스트 중 학습단어를 추출하는 부분이다. 단위문장에서 약어추출부(214)와 구절추출부(211), 사용자단어추출부(212)에서 추출되지 않은 텍스트 중 학습단어DB(330)에 저장된 학습단어가 있는지 검색하여 이를 추출하게 된다.The learning word extracting unit 213 extracts a learning word among texts not extracted by the abbreviation extracting unit 214, the phrase extracting unit 211, and the user word extracting unit 212 in a unit sentence. A unit sentence is searched for a learning word stored in the learning word DB 330 among the texts not extracted by the abbreviation extraction unit 214, the phrase extraction unit 211, and the user word extraction unit 212, and extracted.

어휘추출부(215)는 약어추출부(214)와 구절추출부(211), 사용자단어추출부(212), 학습단어추출부(213)에서 추출되지 않은 텍스트 중 어휘를 추출하는 부분이다. 단위문장에서 약어추출부(214)와 구절추출부(211), 사용자단어추출부(212), 학습단어추출부(213)에서 추출되지 않은 텍스트 중 영어사전DB(310)에 저장된 어휘가 있는지 검색하여 이를 추출하게 된다.The vocabulary extraction unit 215 is a unit for extracting vocabulary among texts not extracted by the abbreviation extraction unit 214, the phrase extraction unit 211, the user word extraction unit 212, and the learning word extraction unit 213. It is checked whether there is a vocabulary stored in the English dictionary DB 310 among the texts not extracted by the abbreviation extracting unit 214, the phrase extracting unit 211, the user word extracting unit 212 and the learning word extracting unit 213 in the unit sentence And extracts it.

미등록추출부(217)는 약어추출부(214)와 구절추출부(211), 사용자단어추출부(212), 학습단어추출부(213)에서 추출되지 않은 텍스트 중 미등록단어를 추출하는 부분이며, 비대상추출부(218)는 약어추출부(214)와 구절추출부(211), 사용자단어추출부(212), 학습단어추출부(213)에서 추출되지 않은 텍스트 중 단어가 아닌 것(문장부호 등)이나 한글을 추출하는 부분이다.
개인정보추출부(219)는 번역대상파일의 텍스트 중 개인정보를 추출하는 부분이다. 개인정보에는 주민등록번호와 같은 정보가 포함될 수 있다. 주민등록번호일 경우 6자리 이상의 숫자가 하이픈('-')을 사이에 두고 나열된 경우를 인식하는 등 인식방법은 다양하게 구성할 수 있다.
The unregistered extracting unit 217 extracts an unregistered word among texts not extracted by the abbreviation extracting unit 214, the phrase extracting unit 211, the user word extracting unit 212, and the learning word extracting unit 213, The non-target extraction unit 218 extracts non-target words from the non-extracted text in the abbreviation extraction unit 214, the phrase extraction unit 211, the user word extraction unit 212, and the learning word extraction unit 213 Etc.) and extracts Hangul.
The personal information extracting unit 219 extracts the personal information from the text of the translation target file. Personal information may include information such as a resident registration number. In the case of a resident registration number, recognition methods such as recognizing the case where the digits of 6 or more digits are arranged with a hyphen ('-') between them can be configured in various ways.

삭제delete

번역부(220)는 정해진 순서에 따라 추출된 번역단위별로 번역을 수행하는 부분으로, 구절번역부(221), 사용자단어번역부(222), 학습단어번역부(223), 약어번역부(224), 어휘번역부(225), 단어번역부(226), 예측번역부(227)를 포함한다.The translation unit 220 is a unit for performing translation for each translation unit extracted in a predetermined order and includes a phrase translation unit 221, a user word translation unit 222, a learning word translation unit 223, an abbreviation translation unit 224 ), A vocabulary translation unit 225, a word translation unit 226, and a prediction translation unit 227.

구절번역부(221)는 구절추출부(211)에서 추출된 구절을 번역하는 부분이다. 추출된 구절에 대응되는 한글 구절을 구절DB(350)에서 불러온다.The phrase translation unit 221 is a unit for translating a phrase extracted by the phrase extraction unit 211. [ And a Hangul phrase corresponding to the extracted phrase is retrieved from the phrase DB 350. [

사용자단어번역부(222)는 사용자단어추출부(212)에서 추출된 사용자단어를 번역하는 부분이다. 추출된 사용자단어에 대응되는 한글단어를 사용자단어DB(320)에서 불러온다.The user word translation unit 222 is a unit for translating the user word extracted by the user word extraction unit 212. And the Korean word corresponding to the extracted user word is loaded from the user word DB 320. [

학습단어번역부(223)는 학습단어추출부(213)에서 추출된 학습단어를 번역하는 부분이다. 추출된 학습단어에 대응되는 한글단어를 학습단어DB(330)에서 불러온다.The learning word translation unit 223 is a unit for translating the learning word extracted by the learning word extraction unit 213. [ And the Hangul words corresponding to the extracted learning words are retrieved from the learning word DB 330. [

약어번역부(224)는 약어추출부(214)에서 추출된 약어를 번역하는 부분이다. 추출된 약어에 대응되는 한글단어를 약어사전DB(340)에서 불러온다.The abbreviation-translating unit 224 is a unit for translating the abbreviation extracted by the abbreviation-extracting unit 214. And a Hangul word corresponding to the extracted abbreviation is loaded from the abbreviation DB 340.

어휘번역부(225)는 어휘추출부(215)에서 추출된 어휘를 번역하는 부분이다. 추출된 어휘에 대응되는 한글어휘를 영어사전DB(310)에서 불러온다.The vocabulary translation unit 225 is a unit for translating the vocabulary extracted by the vocabulary extraction unit 215. And the Korean language vocabulary corresponding to the extracted vocabulary is retrieved from the English dictionary DB 310.

단어번역부(226)는 단어추출부(216)에서 추출된 단어를 번역하는 부분이다. 추출된 단어에 대응되는 한글단어를 영어사전DB(310)에서 불러온다.The word translation unit 226 is a unit for translating the word extracted by the word extraction unit 216. [ And the Korean word corresponding to the extracted word is retrieved from the English dictionary DB 310. [

예측번역부(227)는 미등록추출부(217)에서 추출된 단어를 번역하는 부분이다. 추출된 단어는 데이터베이스(300)에 저장되어 있지 않은 단어이므로, 이를 번역하지 않고 영어단어 그대로 출력하여 사용자에 의해 입력을 받거나, 웹을 검색하여 선정된 한글단어로 번역될 수 있다. The predictive translation unit 227 is a unit for translating the word extracted by the non-registered extraction unit 217. Since the extracted word is a word not stored in the database 300, it can be output as it is without translating it, and can be input by a user, or translated into a selected Korean word by searching the web.

이 때, 사용자에 의해 입력받은 단어는 사용자단어DB(320)에 저장되고, 웹에서 검색된 단어는 학습단어DB(330)에 저장될 것이다.At this time, the word received by the user is stored in the user word DB 320, and the word retrieved from the web is stored in the learning word DB 330.

번역문출력부(230)는 번역결과를 번역단위별로 출력하는 부분으로, 단위문장출력부(231), 세부단위출력부(232), 번역정보표시부(233)를 포함한다.The translated-text output unit 230 includes a unit sentence output unit 231, a detailed unit output unit 232, and a translation information display unit 233.

단위문장출력부(231)는 추출부(210)에서 단위문장으로 추출한 원문장(231a)과 이에 대응되는 번역문장(231b)을 출력하는 부분이다. 원문장(231a)은 추출부(210)에서 단위문장으로 추출된 영어가 포함된 문장이며, 번역문장(231b)은 하기 세부단위출력부(232)에서 한글로 번역된 번역단어(232b)의 조합으로 구성된다.The unit sentence output unit 231 outputs a sentence sentence 231a extracted by the extracting unit 210 as a unit sentence and a translated sentence 231b corresponding thereto. The original sentence 231a is a sentence containing English extracted as a unit sentence in the extraction unit 210 and the translated sentence 231b is a combination of the translated words 232b translated into Korean in the detailed unit output unit 232 .

세부단위출력부(232)는 원문장(231a)을 세부번역단위로 구분한 원단어(232a)와 이에 대응되는 번역단어(232b)를 출력하는 부분이다. 세부번역단위는 상술한 구절, 사용자단어, 학습단어, 약어, 어휘일 수 있고, 여기에 해당하지 않을 경우 공백이나 문장부호로 구분된 단어가 세부번역단위가 된다. 번역은 세부번역단위별로 수행된다. 즉, 각 구절, 사용자단어, 학습단어, 약어, 어휘 등에 해당되는 한글단어를 데이터베이스(300)에서 불러와 1:1로 매칭시킨다. 이 때, 도 1과 같이 각 대응되는 원단어(232a)와 번역단어(232b)를 같은 구분칸에 위치시켜, 대응관계를 한눈에 파악할 수 있다. 이로써 제대로 번역되었는지 확인하거나 수정하는 작업이 용이해져 번역정확도를 높일 수 있게 된다. 또한, 세부번역단위별로 번역단어(232b)를 약어, 어휘 등 자동으로 번역된 단어와 사용자단어, 학습단어 등 수동으로 번역된 단어, 번역되지 않은 단어, 번역대상이 아닌 단어에 따라 각기 다른색으로 표시하고 이를 번역문장(231b)에 반영하면 번역 상태 파악도 용이하게 된다. 즉, 도 1과 같이 번역된 단어는 빨간색으로, 약어는 파란색으로 표시하고 이를 번역문장(231b)에도 반영하면, 어떤 단어가 번역된 단어인지, 어떤 단어가 약어인지와 같은 정보를 한눈에 확인할 수 있는 것이다.The detail unit output unit 232 is a unit for outputting a source word 232a dividing the sentence sentence 231a into detailed translation units and a translated word 232b corresponding thereto. A detailed translation unit may be the above-mentioned phrase, user word, learning word, abbreviation, vocabulary, and if not, a word separated by a space or a punctuation code becomes a detailed translation unit. Translation is carried out by detailed translation unit. That is, a Hangul word corresponding to each phrase, a user word, a learning word, an abbreviation, a vocabulary, and the like is retrieved from the database 300 and matched with 1: 1. In this case, as shown in FIG. 1, the corresponding original word 232a and the translated word 232b can be located in the same segment, and the corresponding relationship can be grasped at a glance. This makes it easy to check whether or not the translation has been correctly translated and improve the translation accuracy. In addition, the translation word (232b) may be automatically translated into a different color according to a word that is automatically translated, such as an automatically translated word, a user word, a learning word, a word that is not translated, It is easy to grasp the translation state by reflecting it in the translation sentence 231b. That is, when the translated word is displayed in red and the abbreviation is displayed in blue as shown in FIG. 1 and reflected in the translation sentence 231b, information such as which word is translated and which word is abbreviated can be confirmed at a glance It is.

한편, 세부단위출력부(232)는 번역단어수정부(232c)와 사용자단어입력부(232d)를 더 포함할 수 있다.The detailed unit output unit 232 may further include a translated word correcting unit 232c and a user's word input unit 232d.

번역단어수정부(232c)는 세부단위출력부(232)의 단위별로 번역단어(232b)를 다른 번역단어(232b')로 수정하기 위한 부분으로, 원단어(232a)와 번역단어(232b)가 같은 구분칸에 위치함으로써 어떤 영어단어가 어떤 한글단어로 번역되었는지 확인할 때, 번역된 한글단어와 다른 뜻이 출력되기를 원하는 경우 이용된다. 번역단어수정부(232c)를 눌러 새로운 한글단어 뜻을 직접 입력할 수도 있고, 데이터베이스(300)에서 유사한 뜻의 한글단어 목록을 제시하여 사용자가 선택하도록 할 수도 있다. 이 때 선택된 다른 뜻의 한글단어는 해당 영어단어와 함께 학습단어DB(330)에 저장된다.The translated word correcting unit 232c is a unit for correcting the translated word 232b into another translated word 232b 'for each unit of the detailed unit output unit 232. The original word 232a and the translated word 232b It is used when you want to output a meaning other than the translated Korean word when checking which English word is translated into which Korean word by placing it in the same division box. The user may directly input a new Korean word meaning by pressing the translated word correcting unit 232c or may present a similar Korean word list in the database 300 for the user to select. At this time, the selected Hangul words are stored in the learning word DB 330 together with the corresponding English words.

사용자단어입력부(232d)는 세부세부단위출력부(232)의 원단어(232a)를 사용자단어로 입력하기 위한 부분으로, 원단어(232a)와 번역단어(232b)가 같은 구분칸에 위치함으로써 어떤 영어단어가 어떤 한글단어로 번역되었는지 확인할 때, 번역되지 않고 영어로 남아 있는 단어를 직접 번역하기 원하는 경우 이용된다. 이는 데이터베이스(300)에 저장되어 있지 않거나 예측번역부(227)에 의해서도 번역되지 않은 단어로서, 사용자단어입력부(232d)를 눌러 새로운 한글단어 뜻을 직접 입력할 수도 있고, 예측번역부(227)에 의해 검색된 한글단어 목록을 제시하여 사용자가 선택하도록 할 수도 있다. 이 때 선택된 한글단어는 해당 영어단어와 함께 사용자단어DB(320)에 저장된다.The user word input unit 232d is a unit for inputting the original word 232a of the detailed detailed unit output unit 232 as a user word and the original word 232a and the translation word 232b are located in the same division cell, It is used when confirming the English word is translated into a Korean word, and when it is desired to directly translate a word remaining in English without being translated. It is also possible to directly input a new Korean word meaning by pressing the user word input section 232d as a word which is not stored in the database 300 or which has not been translated by the predictive translation section 227 or may be inputted to the predictive translation section 227 A list of Korean words found by the user can be presented to the user. At this time, the selected Hangul word is stored in the user word DB 320 together with the corresponding English word.

번역정보표시부(233)는 세부번역단위수, 비대상단어수, 미등록단어수 및 번역율을 포함한 번역정보를 표시하는 부분이다. 세부번역단위는 추출부(210)에 의해 추출된 단위문장에서 구절추출부(211), 사용자단어추출부(212), 학습단어추출부(213), 약어추출부(214), 어휘추출부(215) 또는 단어추출부(216)에서 각각 추출된 번역단위의 갯수를 의미한다. 비대상단어수는 추출부(210)에 의해 추출된 단위문장에서 비대상추출부(218)에서 추출된 문장부호 또는 한글단어의 갯수를 의미한다. 미등록단어수는 추출부(210)에 의해 추출된 단위문장에서 미등록추출부(217)에 의해 추출된 단어의 갯수를 의미한다. 원단어(232a)에서 번역대상인 단어 갯수와 번역단어(232b)에서 실제로 번역된 단어 갯수를 비교하여 번역율을 계산할 수 있고, 이를 번역정보표시부(233)에 표시할 수 있다. The translation information display unit 233 displays translation information including the number of detailed translation units, the number of non-target words, the number of unregistered words, and the translation ratio. The detailed translation unit includes a phrase extraction unit 211, a user word extraction unit 212, a learning word extraction unit 213, an abbreviation extraction unit 214, a lexical extraction unit 215 or the word extracting unit 216, respectively. The number of non-target words means the number of sentence codes or Korean words extracted from the non-target extracting unit 218 in the unit sentence extracted by the extracting unit 210. The number of unregistered words means the number of words extracted by the unregistered extracting unit 217 in the unit sentence extracted by the extracting unit 210. The translation rate can be calculated by comparing the number of words to be translated and the number of words actually translated in the translation word 232b in the original word 232a and displayed on the translation information display unit 233. [

번역본작성모듈(400)은 의료기록지번역모듈(200)에 의해 번역된 결과를 의료기록지텍스트본(20)에 반영하여 의료기록지번역본(30)을 작성하는 부분이다. 도 1과 같은 화면에서 번역작업이 완료된 후, 이를 도 2와 같은 의료기록지텍스트본(20)의 각 대응되는 위치에 원문장(231a)을 대입하여 의료기록지번역본(30)을 작성한다. 이 때 작성된 의료기록지번역본(30)은 도 3에서 확인할 수 있다. 바람직하게는 도 8과 같이 의료기록지 원본과 번역본을 한 화면에 출력하여 대응관계를 한눈에 확인하도록 할 수 있다. 특히, 원본과 번역본의 각 문구의 위치가 대응되므로, 원본에 적힌 영어원문에 해당하는 번역문을 번역본의 같은 위치에서 확인할 수 있고, 반대로 번역본에 제시된 번역문에 해당하는 원문을 원본의 같은 위치에서 확인할 수 있으므로, 모호한 의미 파악이 용이해진다. 따라서 도 8과 같은 화면이 제시되면 이를 기준으로 보고서 작성하는 작업이 훨씬 수월해 지는 것이다.The translation creating module 400 is a part for creating the medical recording translation 30 by reflecting the translated result by the medical recording translation module 200 on the medical recording text text 20. After the translation work is completed on the screen as shown in FIG. 1, the medical record translated book 30 is created by substituting the sentence sentence 231a at each corresponding position of the medical record paper text book 20 as shown in FIG. The medical record translation 30 created at this time can be seen in FIG. Preferably, as shown in FIG. 8, the original medical document and the translated document may be output on one screen so that the corresponding relationship can be confirmed at a glance. In particular, since the position of each phrase in the original and the translation is matched, a translation corresponding to the original English text on the original can be confirmed at the same position of the translation, and conversely, the original text corresponding to the translation Therefore, ambiguous meaning can be grasped easily. Therefore, when the screen as shown in FIG. 8 is presented, it becomes much easier to create a report based on the screen.

데이터베이스(300)는 번역을 수행할 데이터가 저장되는 부분으로 영어사전DB(310), 사용자단어DB(320), 학습단어DB(330), 약어사전DB(340)을 포함한다.The database 300 includes an English dictionary DB 310, a user word DB 320, a learning word DB 330, and an abbreviation dictionary DB 340, where data to be translated is stored.

영어사전DB(310)은 영어의학용어가 포함된 영어단어와 그에 대응되는 한글단어가 저장되는 데이터베이스이다.The English dictionary DB 310 is a database in which English words including English medical terms and corresponding Korean words are stored.

사용자단어DB(320)는 사용자단어와 그에 대응되는 한글단어가 저장되는 데이터베이스이다.The user word DB 320 is a database in which user words and corresponding Korean words are stored.

학습단어DB(330)는 학습단어와 그에 대응되는 한글단어가 저장되는 데이터베이스이다.The learning word DB 330 is a database in which learning words and corresponding Korean words are stored.

약어사전DB(340)는 약어로 된 영어의학용어와 그에 대응되는 한글단어가 저장되는 데이터베이스이다.The abbreviation dictionary DB (340) is a database storing abbreviated English medical terms and their corresponding Hangul words.

구절DB(350)는 구절로 된 영어의학용어와 그에 대응되는 한글구절이 저장되는 데이터베이스이다.The phrase DB 350 is a database for storing English medical terms and phrases corresponding to phrases.

상기 데이터베이스에 저장되는 데이터는 서버에 저장되는 것이므로 손해사정회사에서 공유하게 될 경우 다른 직원이 등록해 놓은 사용자단어나 약어, 구절도 참고할 수 있게 된다(도 4 참고).Since the data stored in the database is stored in the server, the user can refer to user words, abbreviations, and phrases registered by other employees when the loss assessment company shares them (refer to FIG. 4).

상술한 구성에 의해 의료기록지를 번역하는 방법은 다음과 같은 순서로 행해진다.A method of translating a medical recording sheet by the above-described configuration is performed in the following order.

s1: 의료기록지스캔본(10)에서 텍스트를 추출하여 의료기록지텍스트본(20)을 생성하는 단계s1: extracting text from the medical recording paper scanned book 10 and generating a medical recording paper text book 20

s1-1: 서버에서 의료기록지스캔본(10)을 수신하여 텍스트 추출 가능한 파일형식으로 변환한다.s1-1: The server receives the medical record scanned book 10 and converts it into a file format capable of extracting text.

s1-2: s1-1의 형식변환된 파일에서 이미지를 인식하여 텍스트를 추출한다.s1-2: extracts the text by recognizing the image in the formatted file of s1-1.

s1-3: s1-2에서 추출된 텍스트를 의료기록지텍스트본(20)으로 저장한다.s1-3: The text extracted from s1-2 is stored as a medical recording paper text 20.

s2: 의료기록지텍스트본(20)의 영어를 한글로 번역하는 단계s2: translating the English text of the medical recording paper text 20 into Korean

s2-1: 의료기록지텍스트본(20)의 텍스트 중 약어를 추출하여 번역한다. 의료용어는 약어가 대부분이므로 약어 번역을 가장 우선순위로 하는 것이다.s2-1: Abbreviation of the text of the medical record paper text (20) is extracted and translated. Medical terminology is most abbreviated, so abbreviation translation is the top priority.

s2-2: 의료기록지텍스트본(20)의 텍스트를 문장단위로 추출하여 번역한다. 이 때, s2-1에서 번역된 약어를 포함하여 마침표 등의 문장부호로 구분된 문장단위를 추출한다. 추출된 문장 전체가 번역되지 않을 경우, 문장의 최후 단어를 제외하는 방식으로 순차적으로 구절의 길이를 줄임으로써 번역가능한(데이터베이스에 등록된) 구절을 추출하여 번역한다. 문장 앞부분의 일부가 구절로 추출되면 남은 부분에서 같은 작업을 수행하여 구절을 추출 및 번역한다.s2-2: The text of the medical record paper text 20 is extracted and translated on a sentence-by-sentence basis. At this time, a sentence unit separated by a punctuation mark such as a period is extracted including the abbreviation translated in s2-1. If the entire extracted sentence is not translated, the translated phrases (registered in the database) are extracted and translated by reducing the length of the phrases sequentially by excluding the last word of the sentence. When a part of the front part of a sentence is extracted as a phrase, the same operation is performed in the remaining part to extract and translate the phrase.

s2-3: s2-1 ~ s2-2에서 번역되지 않은 텍스트에서 사용자단어를 추출하여 번역한다.s2-3: extract the user words from the untranslated texts in s2-1 to s2-2 and translate them.

s2-4: s2-1 ~ s2-3에서 번역되지 않은 텍스트에서 학습단어를 추출하여 번역한다.s2-4: s2-1 to s2-3 extract the learning word from the untranslated text and translate it.

s2-5: s2-1 ~ s2-4에서 번역되지 않은 텍스트에서 어휘를 추출하여 번역한다.s2-5: s2-1 to s2-4 extract vocabulary from untranslated text and translate it.

s2-6: s2-1 ~ s2-5에서 번역되지 않은 텍스트에서 등록단어를 추출하여 번역한다.s2-6: extracts the registered word from the untranslated text in s2-1 to s2-5 and translates it.

s2-7: s2-1 ~ s2-6에서 번역되지 않은 텍스트에서 미등록단어와 단어가 아닌부분과 한글인 부분을 추출한다. 이 때 추출된 텍스트는 자동번역될 수 없는 부분이므로 s2-8에서 그대로 출력된다.s2-7: Extracts unregistered words and non-word parts and Hangul characters from untranslated text in s2-1 to s2-6. In this case, since the extracted text is a part that can not be automatically translated, it is output as it is in s2-8.

s2-8: s2-2에서 추출된 원문장과 s2-1 ~ s2-7에서 추출된 원단어, s2-1 ~ s2-6에서 번역된 번역단어, 번역단어가 조합된 번역문장을 원문장의 어순에 맞춰 출력한다.s2-8: The original sentence extracted from s2-2, the original word extracted from s2-1 ~ s2-7, the translated word translated from s2-1 ~ s2-6, .

s2-9: s2-7의 미등록단어에 대응되는 한글 단어를 직접 입력하거나 웹에서 검색하여 입력한다.s2-9: Input the Korean word corresponding to the unregistered word of s2-7 directly or search the web and enter it.

s3: 변역된 결과를 반영하여 의료기록지번역본(30)을 작성하는 단계s3: a step of creating a medical recording translated book 30 reflecting the translated result

s3-1: s2에서 번역작업이 완료된 번역문장을 의료기록지텍스트본(20)의 원문장에 대체하는 방식으로 의료기록지번역본(30)을 작성한다.s3-1: Creates the medical recording translation 30 by replacing the translated sentence in which the translation work has been completed in the s2 with the original sentence text of the medical recording paper text 20.

s3-2: 의료기록지스캔본(10) 또는 의료기록지텍스트본(20)과 의료기록지번역본(30)을 도 8과 같이 원문과 번역문의 텍스트 위치가 대응되도록 하여 한 화면에 출력한다.s3-2: The medical record book scan book 10 or the medical record book text book 20 and the medical book translation book 30 are displayed on a screen such that the text positions of the original text and the translated text correspond to each other as shown in FIG.

이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것은 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경 가능함은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어서 명백할 것이다.While the present invention has been described in connection with what is presently considered to be practical exemplary embodiments, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, It will be clear to those who have knowledge.

100 : 의료기록지스캔모듈
110 : 스캔파일수신부
120 : 파일형식변환부
130 : 텍스트추출부
140 : 텍스트파일생성부
200 : 의료기록지번역모듈
210 : 추출부
211 : 구절추출부
212 : 사용자단어추출부
213 : 학습단어추출부
214 : 약어추출부
215 : 어휘추출부
216 : 등록단어추출부
217 : 미등록추출부
218 : 비대상추출부
219 : 개인정보추출부
220 : 번역부
221 : 구절번역부
222 : 사용자단어번역부
223 : 학습단어번역부
224 : 약어번역부
225 : 어휘번역부
226 : 단어번역부
227 : 예측번역부
230 : 번역문출력부
231 : 단위문장출력부
231a : 원문장
231b : 번역문장
232 : 세부단위출력부
232a : 원단어
232b : 번역단어
232c : 번역단어수정부
232d : 사용자단어입력부
233 : 번역정보표시부
300 : 데이터베이스
310 : 영어사전DB
320 : 사용자단어DB
330 : 학습단어DB
340 : 약어사전DB
350 : 구절DB
400 : 번역본작성모듈
10 : 의료기록지스캔본
20 : 의료기록지텍스트본
30 : 의료기록지번역본
100: medical record scanning module
110: scan file receiver
120: File format conversion unit
130:
140: Text file generation unit
200: medical record translation module
210:
211:
212: user word extracting unit
213: Learning word extraction unit
214: Abbreviation extraction unit
215:
216: registered word extracting unit
217: Unregistered Extraction Unit
218: Non-target extraction unit
219: Personal Information Extraction Unit
220: translation unit
221: Translation section
222: user word translation unit
223: Learning word translation part
224: Abbreviation translation part
225: Vocabulary Translation Department
226: Word translation part
227: Prediction translation unit
230: translation output unit
231: unit sentence output unit
231a: One sentence
231b: translation sentence
232: detailed unit output section
232a: One word
232b: Translation Words
232c: translation word counting
232d: user word input section
233: Translation information display section
300: Database
310: English dictionary DB
320: User Word DB
330: Learning Word DB
340: Abbreviation Dictionary DB
350: passage DB
400: Translation module
10: Scanned medical records
20: medical record text text
30: Translation of medical records

Claims (4)

의료기록지스캔본(10)을 의료기록지텍스트본(20)으로 변환하는 의료기록지스캔모듈(100);
의료기록지텍스트본(20)의 영어를 한글로 번역하는 의료기록지번역모듈(200);
번역을 수행할 데이터가 저장되는 데이터베이스(300);
의료기록지번역모듈(200)에 의해 번역된 결과를 의료기록지텍스트본(20)에 반영하여 의료기록지번역본(30)을 작성하는 번역본작성모듈(400);을 포함하고,

상기 데이터베이스(300)는
구절로 된 영어의학용어와 그에 대응되는 한글구절이 저장되는 구절DB(350)를 포함하고,

상기 의료기록지번역모듈(200)은
의료기록지텍스트본(20)에서 문장부호 또는 줄바꿈으로 구분되는 단위문장인 번역단위를 추출하는 추출부(210),
정해진 순서에 따라 추출된 번역단위별로 번역을 수행하는 번역부(220),
번역결과를 번역단위별로 출력하는 번역문출력부(230)을 포함하며,

상기 추출부(210)는
단위문장에서 약어를 추출하는 약어추출부(214),
단위문장에서 번역가능한 가장 긴 구절을 추출하는 구절추출부(211),
단위문장에서 약어추출부(214)와 구절추출부(211)에서 추출되지 않은 텍스트 중 사용자단어를 추출하는 사용자단어추출부(212),
단위문장에서 약어추출부(214)와 구절추출부(211), 사용자단어추출부(212)에서 추출되지 않은 텍스트 중 학습단어를 추출하는 학습단어추출부(213),
약어추출부(214)와 구절추출부(211), 사용자단어추출부(212), 학습단어추출부(213)에서 추출되지 않은 텍스트 중 어휘를 추출하는 어휘추출부(215),
약어추출부(214)와 구절추출부(211), 사용자단어추출부(212), 학습단어추출부(213)에서 추출되지 않은 텍스트 중 단어가 아닌 것(문장부호 등)이나 한글을 추출하는 비대상추출부(218),
번역대상파일의 텍스트 중 개인정보를 추출하는 개인정보추출부(219)를 포함하되,
사용자단어는 사용자가 직접 등록한 영어단어이고,
학습단어는 번역된 단어 뜻이 사용자에 의해 수정된 영어단어임을 특징으로 하며,

상기 구절추출부(211)는
단위문장 전체가 구절DB(350)에 저장되어 있을 경우 이를 구절로 추출하고, 그렇지 않을 경우 최후 단어를 제외하는 방식으로 구절의 길이를 순차로 줄여가면서 구절DB(350)에 저장된 구절을 추출하며,
한 구절이 추출되면 남은 단어에서 구절의 길이를 순차로 줄여가면서 구절DB(350)에 저장되어 있을 경우 이를 구절로 추출하는 것을 특징으로 하며,

상기 번역부(220)는
약어추출부(214)에서 추출된 약어를 번역하는 약어번역부(224),
구절추출부(211)에서 추출된 구절을 번역하는 구절번역부(221),
사용자단어추출부(212)에서 추출된 사용자단어를 번역하는 사용자단어번역부(222),
학습단어추출부(213)에서 추출된 학습단어를 번역하는 학습단어번역부(223),
어휘추출부(215)에서 추출된 어휘를 번역하는 어휘번역부(225),
단어추출부(216)에서 추출된 단어를 번역하는 단어번역부(226)를 포함하고,

상기 번역문출력부(230)는
추출부(210)에서 단위문장으로 추출한 원문장(231a)과 이에 대응되는 번역문장(231b)을 출력하는 단위문장출력부(231),
원문장(231a)을 세부번역단위로 구분한 원단어(232a)와 이에 대응되는 번역단어(232b)를 같은 구분칸에 출력하는 세부단위출력부(232),
세부번역단위수, 비대상단어수, 미등록단어수 및 번역율을 포함한 번역정보를 표시하는 번역정보표시부(233)를 포함하되,
세부번역단위는 구절, 사용자단어, 학습단어, 약어, 어휘 중 하나이며, 세부번역단위별로 번역이 수행되고,
세부번역단위별로 번역단어(232b)를 약어, 어휘를 포함하는 자동으로 번역된 단어와 사용자단어, 학습단어를 포함하는 수동으로 번역된 단어, 번역되지 않은 단어, 번역대상이 아닌 단어에 따라 각기 다른색으로 표시하고 이를 번역문장(231b)에 반영하는 것을 특징으로 하며,

상기 번역본작성모듈(400)에서 의료기록지텍스트본(20)의 각 대응되는 위치에 원문장(231a)을 대입하여 의료기록지번역본(30)을 작성하는 것을 특징으로 하는
의료기록지 번역 시스템.

A medical record scanning module (100) for converting the medical record scan book (10) into a medical record text book (20);
A medical recording paper translation module 200 for translating the English text of the medical recording paper text 20 into Korean;
A database 300 in which data to be translated is stored;
And a translation creating module (400) for creating a translated medical record translation book (30) by reflecting the translated result by the medical record translation module (200) to the medical record text book (20)

The database (300)
And a phrase database 350 in which English medical terms in phrases and corresponding Hangul phrases are stored,

The medical record translation module 200
An extracting unit 210 for extracting a translation unit, which is a unit sentence separated by punctuation marks or line breaks, in the medical recording paper text 20,
A translator 220 for translating the extracted translation units in a predetermined order,
And a translation output unit (230) for outputting translation results in translation units,

The extracting unit 210 extracts
An abbreviation extracting unit 214 for extracting abbreviations from unit sentences,
A phrase extracting unit 211 for extracting the longest translatable phrase in the unit sentence,
A user word extracting unit 212 for extracting a user word among texts not extracted by the abbreviation extracting unit 214 and the phrase extracting unit 211 in a unit sentence,
An abbreviation extracting unit 214 and a phrase extracting unit 211 in a unit sentence, a learning word extracting unit 213 extracting a learning word among texts not extracted by the user word extracting unit 212,
A vocabulary extracting unit 215 for extracting vocabulary among the texts not extracted by the abbreviation extracting unit 214 and the phrase extracting unit 211, the user word extracting unit 212 and the learning word extracting unit 213,
Extracts non-word (punctuation marks, etc.) or Hangul from non-extracted text in the abbreviation extracting unit 214, the phrase extracting unit 211, the user word extracting unit 212, and the learning word extracting unit 213, The target extraction unit 218,
And a personal information extracting unit (219) for extracting personal information from the text of the translation target file,
The user word is an English word registered by the user,
The learning word is characterized in that the translated word is an English word modified by the user,

The phrase extraction unit 211 extracts
If the whole unit sentence is stored in the phrase database 350, the sentence is extracted as a phrase. Otherwise, the phrase stored in the phrase database 350 is extracted while sequentially reducing the length of the phrase by excluding the last word,
If one phrase is extracted, if the remaining words are stored in the phrase database 350 while sequentially decreasing the length of the phrase, the extracted phrase is extracted as a phrase,

The translator 220 translates
An abbreviation translating unit 224 for translating abbreviations extracted by the abbreviation extracting unit 214,
A phrase translation unit 221 for translating a phrase extracted by the phrase extraction unit 211,
A user word translation unit 222 for translating the user word extracted by the user word extraction unit 212,
A learning word translation unit 223 for translating the learning word extracted by the learning word extraction unit 213,
A vocabulary translation unit 225 for translating the vocabulary extracted by the vocabulary extraction unit 215,
And a word translation unit 226 for translating the word extracted by the word extraction unit 216,

The translated text output unit 230
A unit sentence output unit 231 for outputting an original sentence 231a extracted as a unit sentence by the extraction unit 210 and a translated sentence 231b corresponding thereto,
A detailed unit output unit 232 for outputting a source word 232a dividing the sentence sentence 231a into detailed translation units and a translation word 232b corresponding to the source word 232a in the same segment,
A translation information display unit 233 for displaying translation information including the number of detailed translation units, the number of non-target words, the number of unregistered words, and the translation ratio,
A detailed translation unit is one of a phrase, a user word, a learning word, an abbreviation, and a vocabulary, and a translation is performed for each detailed translation unit,
(232b) for each detailed translation unit, an automatically translated word including a vocabulary and a user's word, a manually translated word including a learned word, a non-translated word, and a non-translated word Color, and reflects it in the translation sentence 231b,

And the translation writing module (400) substitutes the original sentence (231a) at each corresponding position of the medical recording paper text book (20) to create the medical recording translation book (30)
Medical record translation system.

삭제delete 삭제delete 삭제delete
KR1020160093255A 2016-07-22 2016-07-22 Medical Record Translation System and Medical Record Translation Method KR101692930B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160093255A KR101692930B1 (en) 2016-07-22 2016-07-22 Medical Record Translation System and Medical Record Translation Method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160093255A KR101692930B1 (en) 2016-07-22 2016-07-22 Medical Record Translation System and Medical Record Translation Method

Publications (1)

Publication Number Publication Date
KR101692930B1 true KR101692930B1 (en) 2017-01-04

Family

ID=57832179

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160093255A KR101692930B1 (en) 2016-07-22 2016-07-22 Medical Record Translation System and Medical Record Translation Method

Country Status (1)

Country Link
KR (1) KR101692930B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101966627B1 (en) 2018-12-26 2019-04-08 사라소프트주식회사 Medical documents translation system for mobile
KR20200041586A (en) 2018-10-12 2020-04-22 충남대학교산학협력단 English - Korean translation system based on period
KR102185090B1 (en) * 2020-06-16 2020-12-01 (주)켐녹 Website management device using translation model based on deep learning and operation method of the same
WO2022177156A1 (en) * 2021-02-18 2022-08-25 삼성전자주식회사 Electronic device and control method therefor

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10134060A (en) * 1996-09-03 1998-05-22 Toshiba Corp Equivalent generating method, machine translation system for executing the method, and recording medium
JP2003022265A (en) * 2001-07-06 2003-01-24 Nec Corp System for automatically translating language
KR20110112495A (en) * 2010-04-07 2011-10-13 주식회사 인아웃정보기술 Medical analysis serve system for medical data
KR101313158B1 (en) 2013-04-18 2013-09-30 리더스손해사정 주식회사 Cloud service platform system of damage assessment
KR20150033027A (en) * 2013-09-23 2015-04-01 한국 한의학 연구원 Method and apparatus for translation management

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10134060A (en) * 1996-09-03 1998-05-22 Toshiba Corp Equivalent generating method, machine translation system for executing the method, and recording medium
JP2003022265A (en) * 2001-07-06 2003-01-24 Nec Corp System for automatically translating language
KR20110112495A (en) * 2010-04-07 2011-10-13 주식회사 인아웃정보기술 Medical analysis serve system for medical data
KR101313158B1 (en) 2013-04-18 2013-09-30 리더스손해사정 주식회사 Cloud service platform system of damage assessment
KR20150033027A (en) * 2013-09-23 2015-04-01 한국 한의학 연구원 Method and apparatus for translation management

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200041586A (en) 2018-10-12 2020-04-22 충남대학교산학협력단 English - Korean translation system based on period
KR101966627B1 (en) 2018-12-26 2019-04-08 사라소프트주식회사 Medical documents translation system for mobile
KR102185090B1 (en) * 2020-06-16 2020-12-01 (주)켐녹 Website management device using translation model based on deep learning and operation method of the same
WO2022177156A1 (en) * 2021-02-18 2022-08-25 삼성전자주식회사 Electronic device and control method therefor

Similar Documents

Publication Publication Date Title
JP7268273B2 (en) Legal document analysis system and method
CA2200928C (en) Document composition supporting method and system, and electronic dictionary for terminology
KR101692930B1 (en) Medical Record Translation System and Medical Record Translation Method
Piotrowski Natural language processing for historical texts
Brunessaux et al. The maurdor project: Improving automatic processing of digital documents
CN110956026B (en) Legal document generation method and device and electronic equipment
CN110390000A (en) A kind of legal documents automatic identification generates system and method
CN111062791A (en) Method, device and equipment for reimbursing and filling bill
WO2005029379A1 (en) Information processing device and information processing method
CN111680634A (en) Document file processing method and device, computer equipment and storage medium
US20170178528A1 (en) Method and System for Providing Automated Localized Feedback for an Extracted Component of an Electronic Document File
JP2020184342A (en) Dialog management server, dialog management method, and program
US7716639B2 (en) Specification wizard
KR101966627B1 (en) Medical documents translation system for mobile
JP3915443B2 (en) Receipt processing system
JP2020204971A (en) Dialog management server, dialog management method, and program
CN111339257A (en) Personalized user portrait recognition method for legal consultation user
KR20220005167A (en) Method for analysis of legal document based on standard document using artificial intelligence, and apparatus for the same
JP2003256462A (en) Coding system, and coding program
JP2007280413A (en) Automatic input device of financial statement
KR20130083002A (en) Apparatus and method for managing digital learning contents based on xml
Auer et al. An electronic corpus of Letters of Artisans and the Labouring Poor (England, c. 1750-1835): compilation principles and coding conventions
KR101080880B1 (en) Automatic loanword-to-korean transliteration method and apparatus
Round et al. Automated parsing of interlinear glossed text from page images of grammatical descriptions
Wu et al. Automatic semantic knowledge extraction from electronic forms

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20200121

Year of fee payment: 4