KR101919877B1 - 의료 문서의 오입력을 방지하는 방법 및 이를 이용한 장치 - Google Patents

의료 문서의 오입력을 방지하는 방법 및 이를 이용한 장치 Download PDF

Info

Publication number
KR101919877B1
KR101919877B1 KR1020180052313A KR20180052313A KR101919877B1 KR 101919877 B1 KR101919877 B1 KR 101919877B1 KR 1020180052313 A KR1020180052313 A KR 1020180052313A KR 20180052313 A KR20180052313 A KR 20180052313A KR 101919877 B1 KR101919877 B1 KR 101919877B1
Authority
KR
South Korea
Prior art keywords
information
medical document
context
medical
document
Prior art date
Application number
KR1020180052313A
Other languages
English (en)
Inventor
김상기
이륜희
Original Assignee
주식회사 뷰노
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 뷰노 filed Critical 주식회사 뷰노
Priority to KR1020180052313A priority Critical patent/KR101919877B1/ko
Application granted granted Critical
Publication of KR101919877B1 publication Critical patent/KR101919877B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

본 발명은 의료 문서의 오입력을 방지하는 방법 및 이를 이용한 장치에 관한 것이다. 구체적으로, 본 발명에 따른 방법에 의하면, 컴퓨팅 장치가, 의료 문서와 관련된 문맥 정보를 참조로 하여 문맥 불일치 부분을 탐색하고, 이를 강조하여 출력한다.

Description

의료 문서의 오입력을 방지하는 방법 및 이를 이용한 장치{METHOD FOR PREVENTING INCORRECT INPUT OF MEDICAL DOCUMENTS AND APPARATUS USING THE SAME}
본 발명은 의료 문서의 오입력을 방지하는 방법 및 이를 이용한 장치에 관한 것이다. 구체적으로, 본 발명에 따른 방법에 의하면, 컴퓨팅 장치가, 의료 문서와 관련된 문맥 정보를 참조로 하여 문맥 불일치 부분을 탐색하고, 이를 강조하여 출력한다.
의료 문서의 편리한 입력을 위하여 자동 음성 인식 시스템이 음향 데이터로부터 스크립트, 즉 전사문을 생성하는 기술이 점차 이용되기 시작하는 추세이다. 의료 문서의 작성에 있어서 키보드와 같은 입력 장치를 이용하는 것이 일반적인 형태이지만, 작업 환경상 손이 부자유스러운 상황이 있을 수 있어 이를 극복하기 위한 수단으로서, 혹은 입력 속도를 높이기 위한 수단으로서 음성 인식을 이용하고자 하는 것이다.
그런데, 그러한 기술들에는 여전히 많은 어려움이 있는바, 아직까지 음성 인식의 정확도가 충분하지 않다는 점이다. 이러한 과정에서 전사자는 많은 음성을 듣는데 모든 문장에 대하여 문맥 상의 문제점이 없는지 내용 상의 상이함이 없는지를 꼼꼼히 점검하는 것은 쉽게 피로해지는 일이다.
물론 이와 같은 문제는 사람이 직접 필기한 것을 문자 인식하거나 심지어 사람이 직접 키보드를 이용하여 입력한 것에서도 드러나는 문제점이다.
따라서 본 발명에서는 의료 문서를 입력하는 자 또는 전사자가 점검하여야 하는 의료 문서에 있어서 문맥 상의 불일치를 쉽게 파악할 수 있게 함으로써 의료 문서의 오입력을 방지할 수 있게 하는 방법 및 이를 이용하는 장치를 제안하고자 한다.
본 발명은 의료 문서와 같이 형식화된 문서를 그 문맥과 관련하여 오입력이 의심되는 부분을 파악하게 함으로써 문서를 정확하게 작성할 수 있게 하는 방안을 제시하는 것을 목적으로 한다.
구체적으로, 본 발명은 의료 문서로부터 파악되거나 이와 연관되는 문맥 정보를 활용하여 오입력을 감소시켜 문서 작성의 효율성을 증대하는 것을 목적으로 한다.
상기한 바와 같은 본 발명의 목적을 달성하고, 후술하는 본 발명의 특징적인 효과를 실현하기 위한 본 발명의 특징적인 구성은 하기와 같다.
본 발명의 일 태양(aspect)에 따르면, 의료 문서(medical document)의 오입력을 방지하는 방법이 제공되는바, 그 방법은, (a) 컴퓨팅 장치가, 상기 의료 문서를 획득하는 단계; (b) 상기 컴퓨팅 장치가, (i) 상기 의료 문서로부터 문맥 정보를 추출하는 프로세스 및 (ii) 상기 의료 문서에 연관된 상기 문맥 정보를 획득하는 프로세스 중 적어도 하나를 수행하는 단계; (c) 상기 컴퓨팅 장치가, 상기 문맥 정보를 참조로 하여 상기 의료 문서에서 상기 문맥 정보와 불일치하는 부분인 문맥 불일치 부분을 탐색하는 단계; 및 (d) 상기 컴퓨팅 장치가, 상기 문맥 불일치 부분을 강조하여 출력하는 단계를 포함한다.
본 발명의 다른 태양에 따르면, 본 발명에 따른 방법을 수행하도록 구현된 명령어(instructions)를 포함하는, 기계 판독 가능한 비일시적 기록 매체에 저장된, 컴퓨터 프로그램도 제공된다.
본 발명의 또 다른 태양에 따르면, 의료 문서의 오입력을 방지하는 컴퓨팅 장치가 제공되는바, 그 장치는, 상기 의료 문서를 획득하는 통신부; 및 (i) 상기 의료 문서로부터 문맥 정보를 추출하는 프로세스 및 (ii) 상기 의료 문서에 연관된 상기 문맥 정보를 획득하는 프로세스 중 적어도 하나를 수행하는 프로세서를 포함하고, 상기 프로세서는, 상기 문맥 정보를 참조로 하여 상기 의료 문서에서 상기 문맥 정보와 불일치하는 부분인 문맥 불일치 부분을 탐색하고, 상기 문맥 불일치 부분을 강조하여 출력한다.
본 발명에 의하면, 형식화된 의료 문서에서 오입력이 의심되는 부분을 쉽게 파악할 수 있는 효과가 있다. 이에 따라 의료 문서를 정확하게 작성할 수 있게 되는 효과가 있다.
따라서 본 발명에 의하면, 의료 문서의 전사 또는 작성에 있어서의 편의가 도모됨으로써 효율성이 증대되는 효과가 있다.
본 발명의 실시 예의 설명에 이용되기 위하여 첨부된 아래 도면들은 본 발명의 실시 예들 중 단지 일부일 뿐이며, 본 발명이 속한 기술분야의 통상의 기술자에게 있어서는 발명적 작업이 이루어짐 없이 이 도면들에 기초하여 다른 도면들이 얻어질 수 있다.
도 1은 본 발명에 따라 의료 문서의 오입력을 방지하는 방법(이하 "의료 문서 오입력 방지 방법"이라 함)을 수행하는 컴퓨팅 장치의 예시적 구성을 개략적으로 도시한 개념도이다.
도 2a는 본 발명에 따른 의료 문서 오입력 방지 방법을 수행하는 컴퓨팅 장치의 하드웨어 또는 소프트웨어 구성요소를 예시적으로 도시한 블록도이고, 도 2b는 도 2a에 나타난 문맥 정보 수집부에 의하여 문맥 정보가 수집되는 예시적 방식을 설명한 블록도이다.
도 3은 본 발명에 따른 의료 문서 오입력 방지 방법을 예시적으로 나타낸 흐름도이다.
도 4는 본 발명에 따른 의료 문서 오입력 방지 방법이 적용될 수 있는 의료 문서의 일 예시를 나타낸 도면이다.
도 5는 본 발명에 따른 의료 문서 오입력 방지 방법의 일 실시 예를 개념적으로 설명하기 위하여 의료 문서의 본론 정보 및 결론 정보를 예시적으로 나타낸 도면이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명의 목적들, 기술적 해법들 및 장점들을 분명하게 하기 위하여 본 발명이 실시될 수 있는 특정 실시 예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시 예는 통상의 기술자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다.
본 발명의 상세한 설명 및 청구항들에 걸쳐 이용된 "음향 데이터" 또는 "음향 파일"이라는 용어는 음향의 정보를 나타낸 디지털 표현물을 지칭하는 용어이다. 예를 들어, 음향 데이터 또는 음향 파일에 관하여 통상의 기술자에게 알려진 어떠한 음향 또는 비디오 포맷이 이용될 수 있다. 몇몇 실시 예에서, 음향 파일은 하나의 오디오 코덱(audio codec)을 지원하는 포맷을 포함할 수 있고, 몇몇 실시 예에서는 음향 파일이 다수의 코덱을 지원하는 포맷을 포함할 수 있다. 몇몇 실시 예에서 음향 파일은, 압축되지 않은 오디오 포맷, 예컨대, WAV, AIFF, AU와 같은 포맷을 포함할 수 있다. 몇몇 실시 예에서 음향 파일의 포맷은 FLAC, 파일 확장자로 APE를 가지는 Monkey's Audio, 파일 확장자로 WV를 가지는 WayPack, Tom's losless Audio Kompressor(TAK), TTA, ATRAC Advanced Lossless, Apple Lossless 및 무손실 WINDOWS 미디어 오디오(WMA)와 같은 무손실 압축 방식을 포함할 수 있다. 몇몇 실시 예서는 음향 파일의 포맷은 MP3, Vorbis, Musepack, ATRAC, 손실 WINDOWS 미디어 오디오(WMA) 및 AAC와 같은 손실 압축 방식을 포함할 수 있다.
몇몇 실시 예에서, 음향 포맷은 WINDOWS 컴퓨터 판독 가능 매체를 위한 ".wav", MAC OS 컴퓨터 판독 가능 매체에서의 ".aiff"와 같은 무압축 PCM 포맷이다. 몇몇 실시 예에서 브로드캐스트 웨이브 포맷(Broadcast Wave Format; BWF)이 이용될 수 있는바, 메타데이터가 파일에 함께 저장될 수 있다. 몇몇 실시 예에서, 음향 포맷은 FLAC, WayPack, Monkey's Audio, ALAC/Apple Lossless와 같은 무손실 오디오 포맷이다. 몇몇 실시 예에서 상기 무손실 오디오 포맷은 약 2:1의 압축비를 제공한다. 몇몇 실시 예에서 오디오 포맷은, 예컨대 wav, ogg, mpc, flac, aiff, raw, au 또는 mid와 같이 무료로 열려 있는(free-and-open) 포맷이다. 몇몇 실시 예에서 오디오 포맷은, gsm, dct, vox, acc, mp4/m4a, 또는 mmf와 같이 공개된 파일 포맷이다. 몇몇 실시 예에서 오디오 포맷은 mp3, wma, atrac, ra, ram, dss, msv, dvg, IVS, m4p, iklax, mxp4 등등과 같은 적당한 포맷일 수 있다.
그리고 본 발명의 상세한 설명 및 청구항들에 걸쳐 '학습' 혹은 '러닝'은 절차에 따른 컴퓨팅(computing)을 통하여 기계 학습(machine learning)을 수행함을 일컫는 용어인바, 인간의 교육 활동과 같은 정신적 작용을 지칭하도록 의도된 것이 아니며, 훈련(training) 및 추론(inferring)은 기계 학습에 관하여 일반적으로 받아들여지는 의미로 쓰인 것이다.
그리고 본 발명의 상세한 설명 및 청구항들에 걸쳐, '포함하다'라는 단어 및 그 변형은 다른 기술적 특징들, 부가물들, 구성요소들 또는 단계들을 제외하는 것으로 의도된 것이 아니다. 또한, '하나' 또는 '한'은 하나 이상의 의미로 쓰인 것이며, '또 다른'은 적어도 두 번째 이상으로 한정된다.
통상의 기술자에게 본 발명의 다른 목적들, 장점들 및 특성들이 일부는 본 설명서로부터, 그리고 일부는 본 발명의 실시로부터 드러날 것이다. 아래의 예시 및 도면은 실례로서 제공되며, 본 발명을 한정하는 것으로 의도된 것이 아니다. 따라서, 특정 구조나 기능에 관하여 본 명세서에 개시된 상세 사항들은 한정하는 의미로 해석되어서는 아니되고, 단지 통상의 기술자가 실질적으로 적합한 임의의 상세 구조들로써 본 발명을 다양하게 실시하도록 지침을 제공하는 대표적인 기초 자료로 해석되어야 할 것이다.
더욱이 본 발명은 본 명세서에 표시된 실시 예들의 모든 가능한 조합들을 망라한다. 본 발명의 다양한 실시 예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시 예에 관련하여 본 발명의 사상 및 범위를 벗어나지 않으면서 다른 실시 예로 구현될 수 있다. 또한, 각각의 개시된 실시 예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 사상 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
본 명세서에서 달리 표시되거나 분명히 문맥에 모순되지 않는 한, 단수로 지칭된 항목은, 그 문맥에서 달리 요구되지 않는 한, 복수의 것을 아우른다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
이하, 통상의 기술자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시 예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 의료 문서 오입력 방지 방법을 수행하는 컴퓨팅 장치의 예시적 구성을 개략적으로 도시한 개념도이다.
도 1을 참조하면, 본 발명의 일 실시 예에 따른 컴퓨팅 장치(100)는, 통신부(110) 및 프로세서(120)를 포함하며, 상기 통신부(110)를 통하여 외부 컴퓨팅 장치(미도시)와 직간접적으로 통신할 수 있다.
구체적으로, 상기 컴퓨팅 장치(100)는, 전형적인 컴퓨터 하드웨어(예컨대, 컴퓨터 프로세서, 메모리, 스토리지, 입력 장치 및 출력 장치, 기타 기존의 컴퓨팅 장치의 구성요소들을 포함할 수 있는 장치; 라우터, 스위치 등과 같은 전자 통신 장치; 네트워크 부착 스토리지(NAS; network-attached storage) 및 스토리지 영역 네트워크(SAN; storage area network)와 같은 전자 정보 스토리지 시스템)와 컴퓨터 소프트웨어(즉, 컴퓨팅 장치로 하여금 특정의 방식으로 기능하게 하는 명령어들)의 조합을 이용하여 원하는 시스템 성능을 달성하는 것일 수 있다.
이와 같은 컴퓨팅 장치의 통신부(110)는 연동되는 타 컴퓨팅 장치와 요청과 응답을 송수신할 수 있는바, 일 예시로서 그러한 요청과 응답은 동일한 TCP(transmission control protocol) 세션(session)에 의하여 이루어질 수 있지만, 이에 한정되지는 않는바, 예컨대 UDP(user datagram protocol) 데이터그램(datagram)으로서 송수신될 수도 있을 것이다. 덧붙여, 넓은 의미에서 상기 통신부(110)는 명령어 또는 지시 등을 전달받기 위한 키보드, 마우스, 기타 외부 입력장치, 프린터, 디스플레이, 기타 외부 출력장치를 포함할 수 있다.
또한, 컴퓨팅 장치의 프로세서(120)는 MPU(micro processing unit), CPU(central processing unit), GPU(graphics processing unit), NPU(neural processing unit) 또는 TPU(tensor processing unit), 캐시 메모리(cache memory), 데이터 버스(data bus) 등의 하드웨어 구성을 포함할 수 있다. 또한, 운영체제, 특정 목적을 수행하는 애플리케이션의 소프트웨어 구성을 더 포함할 수도 있다.
도 2a는 본 발명에 따른 의료 문서 오입력 방지 방법을 수행하는 컴퓨팅 장치의 하드웨어 또는 소프트웨어 구성요소를 예시적으로 도시한 블록도이다.
도 2a를 참조하여 본 발명에 따른 방법 및 장치의 구성을 간략히 개관하면, 컴퓨팅 장치(100)는 그 구성요소로서 의료 문서 획득부(210)를 포함할 수 있다. 이 의료 문서 획득부(210)는 의료 문서를 획득한다. 이 의료 문서는 음성이 담긴 음향 데이터로부터 음성을 인식하여 획득되는 초벌 전사문일 수도 있는바, 이때 음성 인식을 위하여 의료 문서 획득부(210)는 음성 인식부(215; 미도시)를 더 포함할 수도 있다. 이 의료 문서 획득부(210)를 포함하는 도 2a에 도시된 개별 모듈들은, 예컨대, 컴퓨팅 장치(100)에 포함된 통신부(110)나 프로세서(120), 또는 상기 통신부(110) 및 프로세서(120)의 연동에 의하여 구현될 수 있음을 통상의 기술자가 이해할 수 있을 것이다.
상기 의료 문서는 그 의료 문서와 관련된 문맥 정보를 수집하도록 구성되는 문맥 정보 수집부(220)에 전달될 수 있다. 컴퓨팅 장치(100)는 문맥 불일치 검출부(230)에 검출의 대상이 되는 어휘의 목록 또는 그 어휘를 검출하기 위한 모델(model)을 제공하는 구성요소로서 문맥 불일치 검출 정보 보유부(250)를 포함할 수 있는바, 문맥 불일치 검출 정보 보유부(250)는 문맥의 불일치를 판별하기 위한 어휘의 정보 자체 또는 이를 검출할 수 있는 모델을 보유할 수 있다. 문맥 불일치 검출 정보 보유부(250)에 의하여 보유될 수 있는 정보는 후술한다.
다음으로, 출력부(240)는 문맥 불일치 검출부(230)에 의하여 검출된 문맥 불일치 부분을 외부 엔티티에 제공하도록 구성되며, 예컨대 그 문맥 불일치 부분을 강조하여 출력함으로써 의료 문서의 편집, 수정을 용이하게 할 수 있게 구성된다.
여기에서 외부 엔티티라고 함은, 상기 컴퓨팅 장치(100)의 사용자, 예컨대, 의사, 간호사 등을 포함하는 의료진, 기타 관리자, 상기 의료 문서를 담당하는 전사자 등을 포함하나, 이 이외에도 의료 문서에서 오류 혹은 문맥 불일치의 검출을 필요로 하는 주체라면 어느 주체라도 포함되는 것으로 이해되어야 할 것이다.
이제 도 2a에 나타난 구성요소들에 의하여 달성되는 구체적인 기능 및 효과에 관하여 도 3을 참조하여 상세히 후술하기로 한다. 도 2a에 나타난 구성요소들은 설명의 편의상 하나의 컴퓨팅 장치에서 실현되는 것으로 예시되었으나, 본 발명의 방법을 수행하는 컴퓨팅 장치(100)는 복수개의 장치들이 서로 연동되도록 구성될 수도 있다는 점이 이해될 것이다. 예를 들어, 의료 문서 획득부(210), 문맥 정보 수집부(220), 출력부(240)는 제1 컴퓨팅 장치에서 수행되고, 문맥 불일치의 검출 및 처리에 필요한 문맥 불일치 검출부(230) 및 문맥 불일치 검출 정보 보유부(250)는 상기 서버에 연동되는 클라이언트에서 수행되도록 구성할 수도 있을 것인바, 통상의 기술자는 다양한 방식으로 복수개의 장치들이 서로 연동하여 본 발명의 방법을 수행하도록 구성할 수 있을 것이다.
이제 본 발명에 따른 의료 문서 오입력 방지 방법을 도 3를 참조하여 더 구체적으로 설명하기로 한다. 도 3은 본 발명에 따른 의료 문서 오입력 방지 방법을 예시적으로 나타낸 흐름도이다.
도 3을 참조하면, 본 발명에 따른 의료 문서 오입력 방지 방법은, 우선, 컴퓨팅 장치(100)에 의하여 구현되는 의료 문서 획득부(210)가, 의료 문서를 획득하는 단계(S100)를 포함한다. 여기에서 의료 문서의 획득은 하나의 전체 의료 문서에 대하여 1회만 수행되거나 스트림(stream) 입력에 의하여 연속적으로 수행될 수도 있는데, 후자의 경우에는 본 발명에 따른 방법의 각 단계가 의료 문서가 전부 획득되는 때까지 반복 수행될 수 있다. 예컨대, 의료 문서는 음향 데이터에 대한 음성 인식에 의하여 스트림 입력으로서 획득될 수 있다.
다음으로, 본 발명에 따른 의료 문서 오입력 방지 방법은, 컴퓨팅 장치(100)에 의하여 구현되는 문맥 정보 수집부(220)가, (i) 상기 의료 문서로부터 문맥 정보를 추출하는 프로세스 및 (ii) 상기 의료 문서에 연관된 상기 문맥 정보를 획득하는 프로세스 중 적어도 하나를 수행하는 단계(S200)를 더 포함한다.
이 단계(S200)에서 문맥 정보가 획득되면, 그 다음, 본 발명에 따른 의료 문서 오입력 방지 방법은, 컴퓨팅 장치(100)에 의하여 구현되는 문맥 불일치 검출부(230)가, 상기 문맥 정보를 참조로 하여 상기 의료 문서에서 상기 문맥 정보와 불일치하는 부분인 문맥 불일치 부분을 탐색하는 단계(S300)를 더 포함한다.
본 발명의 제1 실시 예에 따르면, 단계(S200)에서, 상기 의료 문서에 기재된 상기 의료 문서와 관련된 검사 이력 정보를 문맥 정보로서 획득할 수 있으며, 그 검사 이력 정보는, 예를 들어, 상기 의료 문서에 기재된 선행 검사의 일시 및 방법 중 적어도 하나를 포함할 수 있다.
도 4는 본 발명에 따른 의료 문서 오입력 방지 방법이 적용될 수 있는 의료 문서의 일 예시를 나타낸 도면이다.
도 4를 참조하면, 이력(history) 정보, 소견(findings) 정보 혹은 본론 정보, 및 결론 정보(conclusion) 정보를 포함하는 의료 문서가 도시되어 있다. 여기에서 이력 정보는 병력이나 과거에 선행한 검사에 관한 정보, 즉 검사 이력 정보를 포함할 수 있는데, 도 4의 예시에서는 참조부호 410의 "compared with 2011-1-13 US"가 선행 검사의 일시 및 방법으로 기재되어 있다. 다른 예시로서, "2012-11-22 촬영한 CT와 비교하여 판독함"과 같은 형태로 명시적으로 판독문에 입력할 수 있다. 선행 검사의 일시 및 방법에 관하여 오입력이 발생하는 경우에 단계(S300)에서는 의료 문서에 기재된 내용에 있어서 선행 검사의 일시 및 방법과 불일치하는 부분을 문맥 불일치 부분으로서 식별할 수 있다.
이때, 의료 문서에 기재된 이력 정보에 의하여 식별되는 선행 검사 정보에 대하여 컴퓨팅 장치(100)의 문맥 정보 수집부(220)가 접근할 수 있는 때에는 그 선행 검사 정보로부터 획득되는 문맥 정보에 기초하여 의료 문서의 문맥 불일치 부분을 식별할 수 있을 것이나, 그 선행 검사 정보에 대하여 컴퓨팅 장치가 접근할 수 없는 때에도 의료 문서 자체에 기재된 정보에 기초하여 의료 문서의 문맥 불일치 부분을 식별할 수도 있을 것이다.
이 제1 실시 예를 아래 표 1 내지 표 7를 참조하여 상세하게 설명한다.
History:
1. Compared with 2011-1-13 US.
Findings:
2018-02-03 촬영한 CT와 비교 판독함.
Liver의 크기와 모양은 정상이며 parenchymal echogenicity에 특이 소견 없음.
Liver에 뚜렷하게 보이는 abnormal focal lesion 없음.
.
.
.
표 1은 판독문의 일 예시이다. 예를 들어 이 판독문과 매칭하기 위하여 수집된 문맥 정보는 아래 표 2와 같을 수 있다.
<비교판독>: <2018-02-03> <chest CT>
표 2에 나타난 문맥 정보의 유형에 따라 생성되는 표현 형태들은 아래 표 3과 같을 수 있다.
Case 1 : Compared with ${날짜} ${촬영기법}
Case 2 : ${날짜} 촬영한 $[촬영기법}와/과 비교 판독함
Case 3 : ${날짜} 촬영한 $[촬영기법}와/과 비교하여 판독함
Case 4 : ${날짜} 촬영한 $[촬영기법}와/과 비교해서 판독함
...
이 표현 형태들을 판독문에서 검색한 문자열의 결과는 아래 표 4와 같다.
Case 1 : Compared with 2018-02-03 US.
Case 2 : 2018-02-03 촬영한 CT와 비교 판독함
표 4에 나타난 문자열들에서 매칭되는 문맥 부분을 추출하면 아래 표 5와 같다.
Case 1 : <비교판독> : <2011-02-03> <US>
Case 2 : <비교판독> : <2018-02-03> <CT>
이 문맥 부분과 문맥 정보는 아래 표 6과 같이 비교될 수 있다.
Case 1 : <비교판독> : <2011-02-03> <US> => 불일치
Case 2 : <비교판독> : <2018-02-03> <CT> => 일치
표 6의 case 1은 불일치하고, case 2는 일치하므로, case 1은 단계(S300)에서 문맥 불일치 부분으로 검출될 수 있다. 아래에서 설명될 단계(S400)에서 이 문맥 불일치 부분은 표 7에서와 같이 강조하여 출력될 수 있다.
Case 1 : Compared with 2018-02-03 US .
또한, 본 발명의 제2 실시 예에 따르면, 단계(S200)에서, 상기 의료 문서에 기재된 환자의 과거 병력(예컨대, 진단명에 관한 정보) 및 과거 치료에 관한 정보(예컨대, 치료의 종류에 관한 정보) 중 적어도 하나에 매칭되는 의무 기록상의 정보가 문맥 정보로서 획득할 수 있으며, 그 후 단계(S300)에서, 그 의무 기록상의 정보와 불일치하는 상기 의료 문서의 부분이 문맥 불일치 부분으로서 탐색될 수 있다.예를 들어, 의료 문서에 기재된 내용으로서, "S/P right hemicolectomy and anterior resection for colon cancer." 혹은 "colon cancer로 right hemicolectomy와 anterior resection을 시행받은 환자임." 등과 같은 형태로 이는 colon cancer(질병)으로 right hemicolectomy와 anterior resection(치료의 종류)를 시행받았다는 의미이다. 이와 같은 환자의 과거 병력(과거 진단)과 치료 기록은 의무 기록으로서 남아 있어 컴퓨팅 장치(100)의 문맥 정보 수집부(220)가 접근할 수 있으며, 사용자(판독자) 또한 이를 보고 확인하게 되는데, 판독문과 같은 의료 문서에 작성된 내용과 불일치하는 경우에는 오류일 가능성이 큰 것으로 보아 사용자에게 이를 알려주기 위하여 문맥 불일치 부분으로 식별할 수 있다.
이와 같이 문맥 정보 수집부(220)에 의하여 획득될 수 있는 종류의 문맥 정보에 해당하는 표현의 포맷에 대응되는 문자열을 의료 문서에서 검색할 수 있으며, 문맥 정보를 추출하여 수집, 획득된 문맥 정보 중에서 일치하는 내용이 있는지를 확인하고, 그 일치하는 문맥 정보가 없는 경우에 오입력의 가능성이 높은 문맥 불일치 부분으로 식별할 수 있다.
일치하는 항목 자체가 존재하지 않는다면 해당 표현 전체가 오입력의 가능성이 높은 문맥 불일치 부분으로 판정하는 것도 가능하고, 부분적으로만 일치하는 항목이 있다면 그 부분은 제외하고 문맥 불일치 부분으로 판정하는 것도 가능할 것이다.
그리고, 본 발명의 제3 실시 예에 따르면, 단계(S200)에서, 상기 의료 문서에 기재된 검사 방법, 검사 장비 및 검사 부위 중 적어도 하나를 포함하는 검사 정보가 문맥 정보로서 문맥 정보 수집부(220)에 의하여 획득될 수 있으며, 그 후 단계(S300)에서, 상기 검사 정보에 따라 나타날 가능성이 현저히 낮은, 예를 들어 소정의 기준보다 낮은 어휘를 포함하는 의료 문서의 기재 문구를, 문맥 불일치 검출부(230)가, 문맥 불일치 부분으로서 탐색할 수 있다.
여기에서 검사 장비는, 예컨대, CT, MR, US(초음파) 등을 포함할 수 있고, 검사 부위는, 예컨대, 복부, 흉부, 근골격 등을 포함할 수 있다. 이는 예시적으로 열거된 것이며 한정적으로 열거하기 위한 의도가 아닌바, 통상의 기술자에게 알려진 다양한 검사 장비와 검사 부위가 포함될 수 있음은 물론이다.
구체적으로 실시 예를 설명하면, 특정 검사에 대한 판독을 수행하기에 앞서 해당 검사가 어떤 부위(복부, 흉부 등등)를 어떠한 방식(조영 증강 CT, 초음파 등등)으로 검사한 것인지에 대한 정보를 알 수 있다. 이러한 정보를 문맥 정보로서 활용하면 오입력으로 추정되는 어휘를 사용자에게 알려줄 수 있다.
Right lateral malleus 의 fusion된 physis의 sclerotic line보다 약간 상방의 posterolateral aspect에 cortex disruption이 있으며, incomplete fracture의 가능성이 있음
예를 들어 표 8의 문장은 MS(근골격계) 검사의 판독문에서 발췌한 내용으로서 "malleus"라는 단어가 포함되어 있다. 이는 귓속뼈를 의미하는데, Head & Neck 타입의 판독문에만 주로 나타나며, MS 검사에는 등장하지 않는 어휘로서 발목뼈를 의미하는 "malleolus"가 오입력된 경우에 해당한다. 따라서 이는 문맥 불일치 부분으로 식별될 수 있다. 이와 같이 이 실시 예는 해당 검사 부위와 검사 방법에 따라 나타날 가능성 혹은 (통계적) 확률이 현저히 낮은 어휘에 대하여 사용자에게 알려줄 수 있도록 문맥 불일치 부분으로서 식별함으로써 이를 쉽게 수정할 수 있게 하는 효과가 있다. 여기에서 문맥 불일치 부분으로 식별될 수 있는 어휘는 하나 이상의 단어의 조합으로 구성될 수 있다. 본 발명의 제3 실시 예의 예시적 구현은 다음과 같다. 우선, 의료 문서 상에 존재하는 모든 단어의 출현 확률을 고려하는 것도 가능하지만 계산 시간과 저장 공간의 효율성을 위하여 그 개수를 제한할 수 있다. 검사를 분류하는 기준은 의료 기관에서 이용하는 분류 체계를 따를 수 있으나 효율성 등을 이유로 직접 결정하는 것도 가능하다. 각각의 분류에 대하여 개별 어휘가 나타날 확률은 과거의 의료 문서들을 이용하여 계산, 적용할 수 있다.
예를 들어, 전체 의료 문서에서 나타나는 전체 어휘의 개수(중복 포함)를 N0, 특정 어휘가 전체 의료 문서에서 나타나는 횟수를 L0, 특정 분류에 속하는 의료 문서에서의 전체 어휘의 개수를 N1, 특정 어휘가 특정 분류의 의료 문서에서 나타나는 횟수를 L1이라고 할 때 아래 수학식 1 및 수학식 2를 만족하는 어휘를 오입력의 후보 목록으로 저장할 수 있을 것이다.
Figure 112018044764378-pat00001
Figure 112018044764378-pat00002
수학식 1은 전체 의료 문서에서 해당 어휘가 나타나는 빈도 대비 특정 분류의 판독문에서의 빈도가 1/C1보다 작은지를 확인하는 것인바, 예컨대 1000일 수 있다.
한편 수학식 2는 매우 낮은 빈도로 나타나는 어휘에 대한 출현 확률을 고려하는 것이 부정확할 수 있으므로 이를 제외하기 위한 조건으로서 C2는 상수로서 사용자 등에 의하여 설정이 가능한바, 예컨대 10-5일 수 있다.
이와 같은 방식으로 추출된 오입력 후보 목록은 주기적으로 혹은 자동으로 갱신하는 것이 가능하고 사용자 등에 의하여 특정 어휘의 삭제 및 추가가 수동으로 이루어질 수도 있다. 검출되는 어휘가 2개 이상의 단어의 조합으로 이루어지는 경우에는 연이어 나타나는 두 개의 단어의 조합을 어휘로 간주하고 위에서 설명한 것과 동일한 방식으로 처리할 수 있다.
즉, 의료 문서에서의 오입력을 검출함에 있어서, (i) 의료 문서의 분류에 따른 오입력 후보 목록을 설정하고, (ii) 미리 정의된 어휘의 최대 단어 개수까지의 후보 어휘를 생성하며, (iii) 생성된 후보 어휘를 오입력 후보 목록에서 검색한 후에 (iv) 검색되어 나온 어휘에 대하여는 오입력 가능성이 높은 어휘로 즉 문맥 불일치 부분으로 검출할 수 있다.
예를 들어, 의료 문서의 내용이 "2018-02-03 촬영한 CT와 비교 판독함"인 경우에 어휘를 구성하는 최대 단어 개수가 2라면 후보 어휘는 "2018-02-03", "촬영한", "CT와", "비교", "판독함", "2018-02-03 촬영한", "촬영한 CT와", "CT와 비교", "비교 판독함"이다.
다시 도 4를 참조하면, 본 발명의 제4 실시 예에 따라, 단계(S200)에서, 상기 의료 문서의 본론 영역에 기재된 정보인 본론 정보(420) 및 상기 의료 문서의 결론 영역에 기재된 정보인 결론 정보(430) 중 적어도 하나를 포함하는 영역 정보가 문맥 정보 수집부(220)에 의하여 문맥 정보로서 획득되면, 단계(S300)에서, 상기 본론 정보(420)와 불일치하는 의료 문서의 대응 부분, 및 상기 결론 정보(430)와 불일치하는 의료 문서의 대응 부분 중 적어도 하나가 상기 문맥 불일치 부분으로서 식별될 수 있다.
일반적으로 본론 정보 혹은 소견 정보(420)에는 검사 대상의 영상에서 관찰되는 내용들이 모두 기술되고, 결론 정보(430)에는 그 중에서 중요하다고 판단되는 내용에 관하여 요약 기술되는 것이므로, 결론 정보(430)에 나타나는 내용은 본론 정보(420)에서 기술되었던 내용과 동일하거나 이에 상응하는 결론에 해당하는 것이다. 따라서 본론 정보(420)와 결론 정보(430)가 서로 매칭되지 않는 항목을 포함한다면 오입력의 가능성이 있으므로 이를 사용자에게 알려주기 위한 문맥 불일치 부분으로서 식별할 수 있다.
History:
1. HCC로 수술 받고 recurrent tumor에 대하여 TACE를 시행하였음
Findings:
S3 에 이전 CT에서 언급되었던 HCC 비교적 compact lipiodol uptake 되어 있음. 그러나 contrast enhanced scan이 없어 정확한 evaluation의 limitation이 있음.
그 외 특이 소견 없음.
Conclusion:
1. Compact lipiodol uptake in the previously noted HCC in S4 .
표 9에 도시된 판독문의 예시를 보면 본론 정보(findings)에서는 S3(liver segment 3번)에 존재하는 HCC를 언급하지만 결론 정보(conclusion)에서는 S4에 존재하는 HCC를 언급하고 있어 상이하다. 이러한 경우에는 오입력인 경우가 대부분이며, 이를 사용자에게 알려주어야 할 필요가 있으므로 문맥 불일치 부분으로 식별될 수 있다.예시에서와 같은 숫자의 경우(신체 부위의 몇 번째 부분인지 - 간, 폐와 같이 부분으로 나누어 붙이는 번호, 요추 등과 같은 뼈의 번호, 검사상 영상이 다수 존재하는 때에 특정 부분을 나타내는 일련 번호(시리즈 넘버), 이미지 넘버 등)나 신체에서의 좌우의 지칭, 과거 검사 결과의 지정시의 날짜 등에 대하여 실수가 자주 발생하는 경향이 있으므로 이들에 대하여 문맥 불일치 여부를 판별할 수 있을 것이다.
참고로, 문맥 정보 수집부(220)에 의하여 문맥 정보가 수집되는 예시적 방식을 설명한 블록도인 도 2b를 참조하면, 문맥 정보 수집부(220)에 의하여 수집되는 문맥 정보에 있어서, 현재의 검사 또는 선행 검사에 대한 문맥 정보는 판독문의 형태로 문맥 정보 수집부(220)가 용이하게 접근할 수 있는 반면, 과거의 진단명에 관한 정보, 과거의 치료에 관한 정보는 의료 기관 사이에 미리 정해진 코드의 형태로 저장되어 있어 판독문으로 나타나는 형태와는 상이할 수 있다. 예를 들어, 문맥 정보 수집부(220)는 과거의 진단명에 관한 정보를 질병분류코드로 나타나는 주진단코드에 관한 정보로써 획득할 수 있고, 과거에 시행된 치료에 관한 정보를 처방코드에 관한 정보로써 획득할 수 있다. 따라서, 단계(S200)에는 이와 같은 질병분류코드, 주진단코드, 처방코드와 같은 코드의 정보를 판독문의 형태로 나타나는 어휘와 매칭하는 단계가 포함될 수 있다.
여기에서 처방코드는 의료 기관에서 이루어지는 모든 종류의 처치를 망라하여 코드화한 것으로서, 실제 판독문에 나타나는 처치보다 더 광범위할 수 있는바, 단계(S200)에서의 검색 및 처리에 이용될 수 있는 컴퓨팅 파워(computing power)를 고려할 때 이 모든 코드가 고려되어야 할 필요는 없을 수 있다. 따라서, 사전에 전문가에 의하여 정의된 목록에 포함된 N개의 코드들에 대하여만 검색이 수행될 수도 있으며, 그 목록은 추후에 추가 및 삭제가 가능할 수도 있다.
다시 도 3을 참조하면, 이제까지 설명된 실시 예들과 같이 문맥 불일치 부분이 검출되면, 본 발명에 따른 의료 문서 오입력 방지 방법은, 상기 컴퓨팅 장치에 의하여 구현되는 출력부(240)가, 상기 문맥 불일치 부분을 강조하여 출력하는 단계(S400)를 더 포함한다.
예를 들어, 강조하여 표시하는 방식에는 글꼴의 종류를 달리 한다든지, 굵기를 달리 한다든지, 기울여 쓴다든지, 밑줄을 긋는다든지, 크기를 달리 한다든지 하는 방식이 있을 수 있으며, 표시하는 글꼴 자체의 색이나 그 전경색의 색상, 채도, 명도 중 적어도 하나를 조절할 수도 있다.
이 단계(S400)의 출력은 의료 문서의 편집기에 통합적으로 제공될 수도 있는데, 이 경우에 편집기를 이용하는 사용자는 문맥 불일치 부분을 편리하게 파악할 수 있는 편의를 얻을 수 있다. 편집기에 의하여 의료 문서의 내용에 변화가 있게 되면, 또는 스트림 입력에 의하여 편집기에 의료 문서의 내용이 추가되면, 전술한 단계(S100 내지 S300)가 반복 수행될 수 있음은 물론이다.
앞서 설명된 실시 예들을 가능하게 하는 문맥 불일치 검출 정보 보유부(250)는 다음과 같이 구성될 수 있다.
첫째, 문맥 불일치 검출 정보 보유부(250)는 검사 이력 정보 등의 문맥 정보를 수집할 수 있도록 그 문맥 정보가 나타나는 포맷(format)을 보유할 수 있다.
예를 들어, "<비교판독>: <날짜>, <촬영 방법>: Compared with $날짜 $촬영 방법; $날짜 촬영한 $촬영 방법 과 [비교, 참고]{하여, 해서}판독함"과 같은 포맷이 정의되어 보유될 수 있는데, 이 정의에 따르면, 앞서 예시로 든 "compared with 2011-1-13 US"혹은 "2012-11-22 촬영한 CT와 비교하여 판독함"과 같이 기재된 검사 이력 정보가 검출될 수 있다. 여기에서 "비교판독"에 해당하는 문맥 정보는 검사 일시("날짜"), 검사 방법("촬영 방법")이라는 두 개의 정보가 있으며, 세미콜론으로 분리된 여러 가지 포맷으로 의료 문서에 나타날 수 있음을 의미한다. 이 예시에서 $는 동일한 유형의 문자열을 나타내는 대표어로서 이용된 것이며, 예를 들어, "작은 1번", "괄호 2번" 등과 같이 숫자가 들어가는 경우에 숫자를 $int로 표시할 수 있고, 이 $int를 대표어라고 한다. 이 경우, "[작은, 괄호] $int 번"과 같이 나타낼 수 있으며, "작은 1번"은 "1)"로, "괄호 2번"은 "2)"로 치환될 수 있다.
또한, 대괄호([]) 사이의 단어들은 그 중 하나가 반드시 있어야 함을 의미하며 중괄호[{}] 사이의 단어들은 그 중 하나가 나오거나 아무 것도 나타나지 않아도 되는 임의선택적인 것임을 의미한다. 이 예시는 설명을 하기 위한 의도로 제시된 것이며 통상의 기술자는 다양한 포맷이 정의되어 문맥 불일치 검출 정보 보유부(250)에 의하여 보유될 수 있음을 이해할 수 있을 것이다. 이는 표현되는 문자열의 포맷이 반드시 하나로 고정되지 않고 이용하는 사용자나 기관에 따라서 달라질 수 있기 때문이다.
둘째, 문맥 불일치 검출 정보 보유부(250)는 검사 정보(검사 방법, 검사 장비, 검사 부위 등)에 따라 의료 문서에 나타날 가능성이 낮은 단어를 추론할 수 있는 정보를 저장할 수 있다. 검사 정보는 기본적으로 검사 방법(촬영 기법)과 검사 부위(촬영 부위)의 조합(예컨대, CT, 복부)으로 분류될 수 있으나, 둘 중 하나의 정보 혹은 또 다른 건, 또는 그 조합으로 구성이 가능하다. 검사 방법에 따라 나타날 가능성이 낮은 단어를 보유(저장)하는 방법에는 여러 가지 방안이 있을 수 있으나 기본적으로는 각각의 조건에 대하여 나타날 가능성이 낮은 단어 혹은 구절(복수의 단어들의 연쇄)의 목록을 저장하는 방법이 이용될 수 있다. 이와 같은 목록은 과거의 의료 문서들에서 나타나지 않는 통계적 분포에 기초하여 자동으로 추출할 수도 있고, 사용자 또는 컴퓨팅 장치(100)의 관리자에 의하여 수동으로 추가될 수도 있다.
뿐만 아니라, 검사 정보에 따라 나타날 가능성이 낮은 단어는 언어 모델(language model; LM)의 형태로 보유될 수도 있다. 이는 검사 정보에 따라 각각에 적합하도록 특화된 언어 모델을 학습하고 새로 본 발명의 적용에 이용되는 새 의료 문서를 그 언어 모델에 적용하여 적합 확률이 낮게 나오는 단어나 구절들을 오입력의 가능성이 높은 어휘로 검출하는 방식이다.
셋째, 문맥 불일치 검출 정보 보유부(250)는 의료 문서에 나타나는 동의(同意) 표현을 보유할 수 있다. 예컨대, 담낭의 다른 표현에는 gallbladder나 GB가 있을 수 있다. 다른 예시로서, liver segment 4번과 liver s4는 상이한 문자열로 표현되었지만 같은 의미를 가진다. Left GB는 gallbladder 왼쪽, left middle lobe는 LML과 같이 장기의 특정 위치를 나타내는 다양한 표현이 있음은 통상의 기술자에게 알려진 바와 같다.
넷째, 문맥 불일치 검출 정보 보유부(250)는 의료 문서의 본문 정보와 결론 정보의 불일치를 검출할 수 있게 하기 위하여 라인 매칭(line matching)에 이용될 수 있는 특징적인 어휘를 보유할 수 있다. 이는 문맥 불일치 검출부(230)가 본문 정보와 결론 정보의 불일치를 문맥 불일치 부분으로 식별하는 과정에서 각각의 라인(line)을 매칭할 때 이용될 수 있는 어휘들을 목록으로서 보유하는 것이다. 이 목록은 기존의 의료 문서에 통계적 방법을 이용하여 자동으로 추출할 수도 있으며, 컴퓨팅 장치(100)의 사용자 또는 관리자에 의하여 추가 및 삭제, 편집 등의 관리가 가능하다.
문맥 불일치 검출 정보 보유부(250)가 보유할 수 있는 정보가 전술한 것에 한정되지 않음은 물론이다.
다음으로, 도 5는 본 발명에 따른 의료 문서 오입력 방지 방법의 제4 실시 예를 개념적으로 설명하기 위하여 의료 문서의 본론 정보(510) 및 결론 정보(520)를 예시적으로 나타낸 도면이다.
제4 실시 예는 본론 정보와 결론 정보의 불일치를 검출하는 것이며, 그 구현에는 다양한 방식이 있을 수 있는바, 그 중 하나의 방식을 예시적으로 설명한다.
도 5를 참조하면, 본론 정보(findings; 510)와 결론 정보(conclusion; 520)의 예시가 라인 별로 상세하게 예시되어 있는데, 전술한 바와 같이 본론 정보 혹은 소견 정보에는 검사 혹은 판독 과정에서 관찰되는 내용을 기술하고, 결론 정보에는 그 중에서 중요한 내용을 요약하여 정형화된 형태로 기술한다. 일반적으로 결론 정보에 나타나는 내용의 순서는 본론 정보에 나타나는 내용의 순서와 일치한다. 다만, 본론 정보에는 존재하지만 중요하지 않다고 판단되어 결론 정보에는 존재하지 않는 것도 있을 수 있다.
도 5에서는 본론 정보의 각 라인과 결론 정보의 각 라인이 도시된 바와 같이 점선으로써 매칭되어 있다. 이러한 매칭은 문맥 불일치 검출 정보 보유부(250)에 의하여 보유된 정보를 이용하여 결론 정보(520)에서 나타나는 어휘들 중 특징적인 단어들을 추출한 후, 결론 정보(250)의 각 라인에서 추출한 특징들이 동시에 존재하는 본론 정보(510)의 문장을 찾음으로써 이루어질 수 있다. 이 매칭에서는 문맥 불일치 검출 정보 보유부(250)에 의하여 보유된 정보에 기반하여 동의 표현을 참조할 수 있다.
각 라인의 매칭은 결론 정보(520)의 첫번째 라인(520a)부터 시작한다. 결론 정보(520)의 라인에서 추출된 특징이 모두 존재하는 라인을 본론 정보(510)의 첫 번째 라인(510a)에서부터 검색하여 그 추출된 특징이 존재하는 처음 발견된 라인과 매칭한다. 다음은 결론 정보(520)의 두 번째 라인(520b)을 이전에 매칭된 본론 정보(510)의 라인에서부터 검색을 시작하여 매칭되는 라인을 검색한다. 이와 같은 과정을 결론 정보(520)의 마지막 라인(520i)의 매칭이 끝날 때까지 반복한다.
이 과정에서 매칭이 되는 라인이 발견되지 않을 경우에는 부분적으로 매칭이 되는 라인을 검색하고, 검색된 N개의 라인을 매칭 결과로 상정하고 그 각각에 대하여 다음 라인의 매칭을 계속한다.
부분적으로만 매칭이 발생하는 경우가 연속으로 발생하면 매칭의 시도가 트리(tree) 형태로 확장되며 모든 매칭이 결정되었을 때 각 리프 노드(leaf node)의 매칭된 특징들의 수가 가장 큰 것을 택하여 최종 매칭의 결과로 사용한다. 결론 정보(520)의 라인 중 매칭이 전혀 없는 경우에는 그 라인의 전체를 사용자에게 문맥 불일치 부분으로서 제공할 수도 있을 것이다.
최종 매칭의 결과에서 결론 정보(520)의 각 라인의 특징 중 검색에 실패한 어휘에 대하여 오입력의 가능성이 높은 것으로 결정하고, 추가적으로 그 라인과 매칭되는 본론 정보(510)의 라인에서 매칭에 사용되지 않은 어휘 중 가장 유사한 어휘를 동시에 오입력의 가능성이 높은 어휘로 결정하는 것도 가능하다. 예컨대, 2017-10-10을 상호 매칭하지 못했는데, 2017-10-11이 매칭에 사용되지 않았다면 오입력의 가능성이 높은 것으로 판정할 수 있다.
지금까지 설명된 모든 실시 예들에서와 같이 본 발명은 그 실시 예 및 변형례에 걸쳐, 형식화된 의료 문서에서 오입력이 의심되는 부분을 쉽게 파악할 수 있게 함으로써 의료 문서를 정확하게 작성할 수 있게 하는 효과가 있으며, 이로써 의료 문서의 전사 또는 작성에 있어서의 편의가 도모되고 그 효율성이 증대될 수 있다.
위 실시 예의 설명에 기초하여 해당 기술분야의 통상의 기술자는, 본 발명의 방법 및/또는 프로세스들, 그리고 그 단계들이 하드웨어, 소프트웨어 또는 특정 용례에 적합한 하드웨어 및 소프트웨어의 임의의 조합으로 실현될 수 있다는 점을 명확하게 이해할 수 있다. 상기 하드웨어는 범용 컴퓨터 및/또는 전용 컴퓨팅 장치 또는 특정 컴퓨팅 장치 또는 특정 컴퓨팅 장치의 특별한 모습 또는 구성요소를 포함할 수 있다. 상기 프로세스들은 내부 및/또는 외부 메모리를 가지는, 하나 이상의 마이크로프로세서, 마이크로컨트롤러, 임베디드 마이크로컨트롤러, 프로그래머블 디지털 신호 프로세서 또는 기타 프로그래머블 장치에 의하여 실현될 수 있다. 게다가, 혹은 대안으로서, 상기 프로세스들은 주문형 집적회로(application specific integrated circuit; ASIC), 프로그래머블 게이트 어레이(programmable gate array), 프로그래머블 어레이 로직(Programmable Array Logic; PAL) 또는 전자 신호들을 처리하기 위해 구성될 수 있는 임의의 다른 장치 또는 장치들의 조합으로 실시될 수 있다. 더욱이 본 발명의 기술적 해법의 대상물 또는 선행 기술들에 기여하는 부분들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 기계 판독 가능한 기록 매체에 기록될 수 있다. 상기 기계 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 기계 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 통상의 기술자에게 공지되어 사용 가능한 것일 수도 있다. 기계 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD, Blu-ray와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 전술한 장치들 중 어느 하나뿐만 아니라 프로세서, 프로세서 아키텍처 또는 상이한 하드웨어 및 소프트웨어의 조합들의 이종 조합, 또는 다른 어떤 프로그램 명령어들을 실행할 수 있는 기계 상에서 실행되기 위하여 저장 및 컴파일 또는 인터프리트될 수 있는, C와 같은 구조적 프로그래밍 언어, C++ 같은 객체지향적 프로그래밍 언어 또는 고급 또는 저급 프로그래밍 언어(어셈블리어, 하드웨어 기술 언어들 및 데이터베이스 프로그래밍 언어 및 기술들)를 사용하여 만들어질 수 있는바, 기계어 코드, 바이트코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 이에 포함된다.
따라서 본 발명에 따른 일 태양에서는, 앞서 설명된 방법 및 그 조합들이 하나 이상의 컴퓨팅 장치들에 의하여 수행될 때, 그 방법 및 방법의 조합들이 각 단계들을 수행하는 실행 가능한 코드로서 실시될 수 있다. 다른 일 태양에서는, 상기 방법은 상기 단계들을 수행하는 시스템들로서 실시될 수 있고, 방법들은 장치들에 걸쳐 여러 가지 방법으로 분산되거나 모든 기능들이 하나의 전용, 독립형 장치 또는 다른 하드웨어에 통합될 수 있다. 또 다른 일 태양에서는, 위에서 설명한 프로세스들과 연관된 단계들을 수행하는 수단들은 앞서 설명한 임의의 하드웨어 및/또는 소프트웨어를 포함할 수 있다. 그러한 모든 순차 결합 및 조합들은 본 개시서의 범위 내에 속하도록 의도된 것이다.
예를 들어, 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다. 상기 하드웨어 장치는, 프로그램 명령어를 저장하기 위한 ROM/RAM 등과 같은 메모리와 결합되고 상기 메모리에 저장된 명령어들을 실행하도록 구성되는 MPU, CPU, GPU, TPU와 같은 프로세서를 포함할 수 있으며, 외부 장치와 신호를 주고 받을 수 있는 통신부를 포함할 수 있다. 덧붙여, 상기 하드웨어 장치는 개발자들에 의하여 작성된 명령어들을 전달받기 위한 키보드, 마우스, 기타 외부 입력장치를 포함할 수 있다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시 예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시 예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 사람이라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시 예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.
그와 같이 균등하게 또는 등가적으로 변형된 것에는, 예컨대 본 발명에 따른 방법을 실시한 것과 동일한 결과를 낼 수 있는, 논리적으로 동치(logically equivalent)인 방법이 포함될 것인바, 본 발명의 진의 및 범위는 전술한 예시들에 의하여 제한되어서는 아니되며, 법률에 의하여 허용 가능한 가장 넓은 의미로 이해되어야 한다.

Claims (11)

  1. 의료 문서(medical document)의 오입력을 컴퓨팅 장치에 의하여 방지하는 방법에 있어서, 상기 컴퓨팅 장치는 통신부 및 상기 통신부를 통하여 데이터를 송수신하는 프로세서를 포함하되,
    상기 방법은,
    (a) 상기 컴퓨팅 장치의 상기 통신부에 의하여 구현되는 의료 문서 획득부가, 상기 의료 문서를 획득하는 단계;
    (b) 상기 컴퓨팅 장치의 상기 프로세서가, 상기 프로세서에 의하여 실행되는 문맥 정보 수집부를 통하여, (i) 상기 의료 문서로부터 문맥 정보를 추출하는 프로세스 및 (ii) 상기 의료 문서에 연관된 상기 문맥 정보를 획득하는 프로세스 중 적어도 하나를 수행하는 단계;
    (c) 상기 컴퓨팅 장치의 상기 프로세서가, 상기 프로세서에 의하여 실행되는 문맥 불일치 검출부를 통하여, 상기 문맥 정보를 참조로 하여 상기 의료 문서에서 상기 문맥 정보와 불일치하는 부분인 문맥 불일치 부분을 탐색하는 단계; 및
    (d) 상기 컴퓨팅 장치의 상기 프로세서가, 상기 프로세서에 의하여 실행되는 출력부를 통하여, 상기 문맥 불일치 부분을 강조하여 출력하는 단계를 포함하는 의료 문서 오입력 방지 방법.
  2. 제1항에 있어서,
    상기 (b) 단계에서,
    상기 문맥 정보는, 상기 의료 문서에 기재된 상기 의료 문서와 관련된 검사 이력 정보를 포함하고, 상기 검사 이력 정보는 상기 의료 문서에 기재된 선행 검사의 일시 및 방법 중 적어도 하나를 포함하는 의료 문서 오입력 방지 방법.
  3. 제1항에 있어서,
    상기 (b) 단계에서,
    상기 문맥 정보는, 상기 의료 문서에 기재된 환자의 과거 병력 및 과거 치료에 관한 정보 중 적어도 하나에 매칭되는 의무 기록상의 정보를 포함하고,
    상기 (c) 단계에서,
    상기 문맥 불일치 부분은 상기 의무 기록상의 정보와 불일치하는 상기 의료 문서의 부분을 포함하는 의료 문서 오입력 방지 방법.
  4. 제1항에 있어서,
    상기 (b) 단계에서,
    상기 문맥 정보는,
    상기 의료 문서에 기재된 검사 방법, 검사 장비 및 검사 부위 중 적어도 하나를 포함하는 검사 정보를 포함하고,
    상기 (c) 단계는,
    상기 컴퓨팅 장치의 상기 프로세서가, 상기 문맥 불일치 검출부를 통하여, 상기 검사 정보에 따라 나타날 가능성이 소정 기준보다 낮은 어휘를 포함하는 상기 의료 문서의 기재 문구를 상기 문맥 불일치 부분으로서 탐색하는 것을 특징으로 하는 의료 문서 오입력 방지 방법.
  5. 제1항에 있어서,
    상기 (b) 단계에서,
    상기 문맥 정보는,
    상기 의료 문서의 본론 영역에 기재된 정보인 본론 정보 및 상기 의료 문서의 결론 영역에 기재된 정보인 결론 정보 중 적어도 하나를 포함하는 영역 정보를 포함하며,
    상기 (c) 단계에서,
    상기 문맥 불일치 부분은 상기 영역 정보 중 상기 본론 정보와 불일치하는 상기 의료 문서의 대응 부분 및 상기 영역 정보 중 상기 결론 정보와 불일치하는 상기 의료 문서의 대응 부분 중 적어도 하나를 포함하는 의료 문서 오입력 방지 방법.
  6. 컴퓨팅 장치로 하여금, 제1항 내지 제5항 중 어느 한 항의 방법을 수행하도록 구현된 명령어(instructions)를 포함하는, 기계 판독 가능한 비일시적 기록 매체에 저장된, 컴퓨터 프로그램.
  7. 의료 문서(medical document)의 오입력을 방지하는 컴퓨팅 장치에 있어서,
    상기 의료 문서를 획득하는 통신부; 및
    (i) 상기 의료 문서로부터 문맥 정보를 추출하는 프로세스 및 (ii) 상기 의료 문서에 연관된 상기 문맥 정보를 획득하는 프로세스 중 적어도 하나를 수행하는 프로세서
    를 포함하되,
    상기 프로세서는,
    상기 문맥 정보를 참조로 하여 상기 의료 문서에서 상기 문맥 정보와 불일치하는 부분인 문맥 불일치 부분을 탐색하고,
    상기 문맥 불일치 부분을 강조하여 출력하는 것을 특징으로 하는 의료 문서 오입력 방지 장치.
  8. 제7항에 있어서,
    상기 문맥 정보는, 상기 의료 문서에 기재된 상기 의료 문서와 관련된 검사 이력 정보를 포함하고, 상기 검사 이력 정보는 상기 의료 문서에 기재된 선행 검사의 일시 및 방법 중 적어도 하나를 포함하는 의료 문서 오입력 방지 장치.
  9. 제7항에 있어서,
    상기 문맥 정보는, 상기 의료 문서에 기재된 환자의 과거 병력 및 과거 치료에 관한 정보 중 적어도 하나에 매칭되는 의무 기록상의 정보를 포함하고,
    상기 문맥 불일치 부분은 상기 의무 기록상의 정보와 불일치하는 상기 의료 문서의 부분을 포함하는 의료 문서 오입력 방지 장치.
  10. 제7항에 있어서,
    상기 문맥 정보는,
    상기 의료 문서에 기재된 검사 방법, 검사 장비 및 검사 부위 중 적어도 하나를 포함하는 검사 정보를 포함하고,
    상기 프로세서는,
    상기 검사 정보에 따라 나타날 가능성이 소정 기준보다 낮은 어휘를 포함하는 상기 의료 문서의 기재 문구를 상기 문맥 불일치 부분으로서 탐색하는 것을 특징으로 하는 의료 문서 오입력 방지 장치.
  11. 제7항에 있어서,
    상기 문맥 정보는,
    상기 의료 문서의 본론 영역에 기재된 정보인 본론 정보 및 상기 의료 문서의 결론 영역에 기재된 정보인 결론 정보 중 적어도 하나를 포함하는 영역 정보를 포함하며,
    상기 문맥 불일치 부분은 상기 영역 정보 중 상기 본론 정보와 불일치하는 상기 의료 문서의 대응 부분 및 상기 영역 정보 중 상기 결론 정보와 불일치하는 상기 의료 문서의 대응 부분 중 적어도 하나를 포함하는 의료 문서 오입력 방지 장치.
KR1020180052313A 2018-05-08 2018-05-08 의료 문서의 오입력을 방지하는 방법 및 이를 이용한 장치 KR101919877B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180052313A KR101919877B1 (ko) 2018-05-08 2018-05-08 의료 문서의 오입력을 방지하는 방법 및 이를 이용한 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180052313A KR101919877B1 (ko) 2018-05-08 2018-05-08 의료 문서의 오입력을 방지하는 방법 및 이를 이용한 장치

Publications (1)

Publication Number Publication Date
KR101919877B1 true KR101919877B1 (ko) 2019-02-08

Family

ID=65365302

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180052313A KR101919877B1 (ko) 2018-05-08 2018-05-08 의료 문서의 오입력을 방지하는 방법 및 이를 이용한 장치

Country Status (1)

Country Link
KR (1) KR101919877B1 (ko)

Similar Documents

Publication Publication Date Title
CN111316281B (zh) 基于机器学习的自然语言情境中数值数据的语义分类方法以及系统
US10929420B2 (en) Structured report data from a medical text report
JP7157758B2 (ja) モデル支援コホート選択を行うシステム及び方法
US11024066B2 (en) Presentation generating system for medical images, training method thereof and presentation generating method
US8793199B2 (en) Extraction of information from clinical reports
US8600748B2 (en) System and methods for matching an utterance to a template hierarchy
US20220301670A1 (en) Automated information extraction and enrichment in pathology report using natural language processing
US20160210426A1 (en) Method of classifying medical documents
CN111696640A (zh) 自动获取病历模板的方法、装置和存储介质
US20090299977A1 (en) Method for Automatic Labeling of Unstructured Data Fragments From Electronic Medical Records
CN111696642A (zh) 用于生成医学图像中的异常的描述的系统和方法
US11244755B1 (en) Automatic generation of medical imaging reports based on fine grained finding labels
US10339143B2 (en) Systems and methods for relation extraction for Chinese clinical documents
JP2014505950A (ja) 撮像プロトコルの更新及び/又はリコメンダ
US11728014B2 (en) Deep learning architecture for analyzing unstructured data
CN112541066B (zh) 基于文本结构化的医技报告检测方法及相关设备
US11763081B2 (en) Extracting fine grain labels from medical imaging reports
CN111226287A (zh) 用于分析医学成像数据集的方法、用于分析医学成像数据集的系统、计算机程序产品以及计算机可读介质
KR101919877B1 (ko) 의료 문서의 오입력을 방지하는 방법 및 이를 이용한 장치
CN116580801A (zh) 一种基于大型语言模型的超声检查方法
US20220375562A1 (en) Document creation support apparatus, document creation support method, and program
CN115985506A (zh) 一种信息提取方法及装置、存储介质、计算机设备
CN114694847A (zh) 数据处理方法、设备、介质和程序产品
CN116992839B (zh) 病案首页自动生成方法、装置及设备
EP4341950A1 (en) Method and system for facilitating consistent use of descriptors in radiology reports