KR102280664B1 - 위험 행동 예측 장치, 예측 모델 생성 장치 및 위험 행동 예측용 프로그램 - Google Patents

위험 행동 예측 장치, 예측 모델 생성 장치 및 위험 행동 예측용 프로그램 Download PDF

Info

Publication number
KR102280664B1
KR102280664B1 KR1020207030798A KR20207030798A KR102280664B1 KR 102280664 B1 KR102280664 B1 KR 102280664B1 KR 1020207030798 A KR1020207030798 A KR 1020207030798A KR 20207030798 A KR20207030798 A KR 20207030798A KR 102280664 B1 KR102280664 B1 KR 102280664B1
Authority
KR
South Korea
Prior art keywords
sentence
sentences
unit
word
index value
Prior art date
Application number
KR1020207030798A
Other languages
English (en)
Other versions
KR20200128752A (ko
Inventor
히로요시 도요시바
히데후미 우치야마
Original Assignee
가부시키가이샤 프론테오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 프론테오 filed Critical 가부시키가이샤 프론테오
Publication of KR20200128752A publication Critical patent/KR20200128752A/ko
Application granted granted Critical
Publication of KR102280664B1 publication Critical patent/KR102280664B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/11Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
    • A61B5/1116Determining posture transitions
    • A61B5/1117Fall detection
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/165Evaluating the state of mind, e.g. depression, anxiety
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Surgery (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Psychiatry (AREA)
  • Physiology (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Psychology (AREA)
  • Educational Technology (AREA)
  • Social Psychology (AREA)
  • Dentistry (AREA)
  • Hospice & Palliative Care (AREA)

Abstract

환자의 전자 카르테에 포함되는 m개의 문장을 입력하는 학습용 데이터 입력부(10)와, m개의 문장으로부터 n개의 단어를 추출하고, m개의 문장 및 n개의 단어간의 관계성을 반영한 유사성 지표값을 산출하는 유사성 지표값 산출부(100)와, 1개의 문장에 대하여 n개의 유사성 지표값으로 이루어지는 문장 지표값군을 기초로, m개의 문장을 복수의 사상으로 분류하기 위한 분류 모델을 생성하는 분류 모델 생성부(14)와, 예측용 데이터 입력부(20)에 의해 입력되는 문장으로부터 유사성 지표값 산출부(100)에 의해 산출되는 유사성 지표값을 분류 모델에 적용함으로써, 예측 대상의 문장으로부터 전도 발생의 가능성을 예측하는 위험 행동 예측부(21)를 포함하고, 어느 단어가 어느 문장에 대하여 어느 정도 기여하고 있는 것인지를 나타낸 유사성 지표값을 이용하여 고정밀도의 분류 모델을 생성한다.

Description

위험 행동 예측 장치, 예측 모델 생성 장치 및 위험 행동 예측용 프로그램
본 발명은, 위험 행동 예측 장치, 예측 모델 생성 장치 및 위험 행동 예측용 프로그램에 관한 것이며, 특히, 환자가 전도 또는 전락 등의 위험 행동을 일으킬 가능성을 예측하는 기술, 및 이 예측에 이용하는 예측 모델을 생성하는 기술에 관한 것이다.
최근, 인시던트를 예방하는 것이 다양한 산업 분야에 있어서 중요시되고 있다. 의료 분야에서도, 의료 사고를 방지하기 위해 다양한 방책이 검토되고 있다. 예를 들면, 인시던트 리포트를 기록하고, 의료 사고에 연결될 수 있는 위험한 행위를 인시던트 리포트에 기초하여 관리함으로써, 의료 사고를 미연에 방지하기 위한 시스템이 제공되고 있다.
그런데, 의료 사고에는, 의사나 간호사 등의 의료 행위에 기인하는 사고 이외에, 환자측의 사정에 기인하는 사고, 예를 들면, 환자의 전도가 존재한다. 의사나 간호사 등에 의한 의료 행위의 질을 향상시킴으로써, 전자의 사고를 극력 방지하는 것은 가능하지만, 환자측의 요인이 큰 후자의 사고를 막는 것은 애초 어렵다. 따라서, 종래의 대책에서는, 환자의 행동을 일률적으로 규제하는 등, 대략적인 대응밖에 강구할 수 없었던 것이 실정이었다.
그리고, 특허문헌 1에는, 환자의 위험 행동(전도 또는 낙하 등)을 예측하는 장치가 개시되어 있다. 특허문헌 1에 기재된 행동 예측 장치에서는, 환자의 위험 행동에 관한 인시던트 리포트와 연관지어는 것에 의해 위험 행동이 특정된 카르테 정보인 기(旣)판단 카르테 정보로부터 미리 추출된, 해당 위험 행동과 관련된 의료 정보를 기억부에 저장한다. 관계성 평가부는, 인시던트 리포트가 연관지어져 있지 않은 미판단 카르테 정보를 취득하여, 기억부에 저장된 위험 행동과 관련된 의료 정보를 기초로, 미판단 카르테 정보와 해당 미판단 카르테 정보에 대응하는 환자가 취할 수 있는 위험 행동과의 관계성을 평가한다. 예측부는, 관계성 평가부의 평가 결과에 따라, 미판단 카르테 정보에 대응하는 환자의 위험 행동을 예측한다.
구체적으로는, 특허문헌 1에 기재된 행동 예측 장치는, 카르테 정보에 포함되는 데이터 요소(환자의 감정 표현을 포함하는 데이터 요소, 예를 들면, 「편해졌다」, 「아프다」, 「괴롭다」 등의 형태소)에 대한 감정 평가를 대응시켜 기억부에 기억한다. 또한, 행동 예측 장치는, 카르테 정보에 포함되는 텍스트에 대하여, 미리 정해진 키워드(감정에 관한 문언)가 해당 텍스트에 포함되는지의 여부를 탐색한다. 그리고, 포함되어 있었을 경우에, 소정의 기준을 따라서 산출한 감정 스코어를 해당 키워드에 대응시켜 기억부에 기억해 둔다.
한편, 행동 예측 장치는, 미판단 카르테 정보로부터, 미리 정해진 감정에 관한 키워드를 추출하고, 추출한 키워드에 대응되어 있는 감정 스코어를 기억부로부터 취득하여, 키워드 각각의 감정 스코어를 통합하는 하는 것에 의해, 해당 미판단 카르테 정보의 감정 스코어로 한다. 예를 들면, 미판단 카르테 정보의 텍스트 중에 「최근, 다리가 아프다. 일어서는 때 후들거린다.」라는 문장이 포함되어 있었다고 한다. 그리고, 키워드로서 「아프다」, 「비틀비틀」이 기억부에 미리 저장되고, 각각 「+1.4」, 「+0.9」라는 감정 스코어가 대응되어 있다고 한다. 이 경우, 행동 예측 장치는, 양자를 가산하여 「+2.3」이라는 감정 스코어를 산출한다. 그리고, 행동 예측 장치는, 상기 감정 스코어에 기초하여 환자의 위험 행동(전도)을 예측한다.
일본특허 제5977898호 공보
상기 특허문헌 1과 같은 기계 학습에 의해 전도의 예측을 행하는 경우에, 예측의 정밀도를 올리기 위해서는, 학습에 의해 생성하는 예측 모델의 정밀도를 올리는 것이 없어서는 안 된다. 그러나, 상기 특허문헌 1에 기재된 행동 예측 장치에서는, 예측에 사용하는 스코어를, 단지, 미리 정해진 감정에 관한 키워드가 카르테 정보 중에 어느 정도 포함되어 있는지에 의해 계산하고 있을 뿐이며, 이에 의해 생성되는 예측 모델은, 산출된 스코어를 키워드에 대응시켜 기억한 것만의 지극히 단순한 것이다. 그러므로, 예측의 정밀도를 충분히 올리는 것이 어렵다는 문제가 있었다.
본 발명은, 이와 같은 과제를 해결하기 위해 이루어진 것이며, 전자 카르테 등의 의료 정보에 포함되는 문장을 대상으로 한 해석에 의해, 전도나 전락 등 사람에게 기인하는 위험 행동의 발생을 양호한 정도로 예측할 수 있도록 하는 것을 목적으로 한다.
상기한 과제를 해결하기 위하여, 본 발명의 위험 행동 예측 장치에서는, 위험 행동을 일으켰는지의 여부에 대하여 이미 알려진 환자에 관한 의료 정보에 포함되는 m개의 문장을 학습용 데이터로서 입력하고, 해당 입력된 m개의 문장을 해석하여 해당 m개의 문장으로부터 n개의 단어를 추출하고, m개의 문장을 각각 소정의 룰에 따라서 q차원으로 벡터화함으로써, q개의 축 성분으로 이루어지는 m개의 문장 벡터를 산출하고, 또한 n개의 단어를 각각 소정의 룰에 따라서 q차원으로 벡터화함으로써, q개의 축 성분으로 이루어지는 n개의 단어 벡터를 산출하고, 또한 m개의 문장 벡터와 n개의 단어 벡터의 내적을 각각 취하는 것에 의해, m개의 문장 및 n개의 단어간의 관계성을 반영한 m×n개의 유사성 지표값을 산출한다. 그리고, 1개의 문장에 대하여 n개의 유사성 지표값으로 이루어지는 문장 지표값군을 기초로, 위험 행동이 발생할 가능성의 높음에 대하여 m개의 문장을 분류하기 위한 분류 모델을 생성하도록 하고 있다. 예측 대상으로 하는 환자에 대하여 위험 행동을 일으킬 가능성을 예측할 때는, 예측 대상으로 하는 환자에 관한 의료 정보에 포함되는 m'개의 문장을 예측용 데이터로서 입력하고, 해당 입력한 예측용 데이터에 대하여 단어 추출, 문장 벡터 산출, 단어 벡터 산출 및 지표값 산출의 각 처리를 실행함으로써 얻어지는 유사성 지표값을 분류 모델에 적용함으로써, 예측 대상으로 하는 환자가 위험 행동을 일으킬 가능성을 예측하도록 하고 있다.
상기한 바와 같이 구성한 본 발명에 의하면, 환자의 의료 정보에 포함되는 문장으로부터 산출된 문장 벡터와, 문장 내에 포함되는 단어로부터 산출된 단어 벡터와의 내적을 계산함으로써, 문장 및 단어간의 관계성을 반영한 유사성 지표값이 산출되므로, 어느 단어가 어느 문장에 대하여 어느 정도 기여하고 있는 것인지, 혹은, 어느 문장이 어느 단어에 대하여 어느 정도 기여하고 있는 것인지를 내적의 값으로서 얻을 수 있다. 그리고, 이와 같은 성질을 가지는 유사성 지표값을 이용하여 분류 모델이 생성되므로, m개의 문장과 n개의 단어의 기여도를 가미한 후에, 위험 행동이 발생할 가능성의 높음에 대하여, 각 환자에게 대응하는 문장을 적절하게 분류할 수 있게 된다. 따라서, 본 발명에 의하면, 환자가 위험 행동을 일으킬 가능성의 예측을 행하는 장치에 있어서, 학습에 의해 생성하는 분류 모델의 정밀도를 올리고, 위험 행동의 발생을 양호한 정도로 예측할 수 있게 된다.
[도 1] 본 실시형태에 의한 위험 행동 예측 장치의 기능 구성예를 나타내는 블록도이다.
[도 2] 본 실시형태에 의한 위험 행동 예측 장치의 동작예를 나타내는 플로차트다.
[도 3] 본 실시형태에 의한 위험 행동 예측 장치의 다른 기능 구성예를 나타내는 블록도이다.
이하, 본 발명의 일 실시형태를 도면에 기초하여 설명한다. 도 1은, 본 실시형태에 의한 위험 행동 예측 장치의 기능 구성예를 나타내는 블록도이다. 본 실시형태의 위험 행동 예측 장치는 그 기능 구성으로서, 학습용 데이터 입력부(10), 단어 추출부(11), 벡터 산출부(12), 지표값 산출부(13), 분류 모델 생성부(14), 예측용 데이터 입력부(20) 및 위험 행동 예측부(21)를 구비하여 구성되어 있다. 벡터 산출부(12)는, 보다 구체적인 기능 구성으로서, 문장 벡터 산출부(12A) 및 단어 벡터 산출부(12B)를 구비하고 있다. 또한, 본 실시형태의 위험 행동 예측 장치는, 기억 매체로서, 분류 모델 기억부(30)를 구비하고 있다.
그리고, 이하의 설명의 편의상, 단어 추출부(11), 벡터 산출부(12) 및 지표값 산출부(13)로 구성되는 부분을 유사성 지표값 산출부(100)라고 한다. 유사성 지표값 산출부(100)는, 문장에 관한 문장 데이터를 입력하고, 문장과 그 안에 포함되는 단어와의 관계성을 반영한 유사성 지표값을 산출하여 출력하는 것이다. 또한, 본 실시형태의 위험 행동 예측 장치는, 환자의 전자 카르테(특허청구의 범위의 의료 정보에 상당)에 포함되는 문장을 유사성 지표값 산출부(100)가 해석함으로써 산출되는 유사성 지표값을 이용하여, 전자 카르테에 포함되는 문장의 내용으로부터, 환자가 위험 행동(예를 들면, 보행 중이나 목욕 중의 전도, 또는 침대나 변좌 등으로부터의 추락 등, 이하, 단지 전도 전락이라고 함)을 일으킬 가능성을 예측하는 것이다. 그리고, 학습용 데이터 입력부(10), 유사성 지표값 산출부(100) 및 분류 모델 생성부(14)에 의해, 본 발명의 예측 모델 생성 장치가 구성된다.
상기 각 기능 블록(10∼14, 20∼21)은, 하드웨어, DSP(Digital Signal Processor), 소프트웨어 중 어느 것에 의해서도 구성할 수 있다. 예를 들면, 소프트웨어에 의해 구성하는 경우, 상기 각 기능 블록(10∼14, 20∼21)은, 실제로는 컴퓨터의 CPU, RAM, ROM 등을 구비하여 구성되며, RAM이나 ROM, 하드 디스크 또는 반도체 메모리 등의 기록 매체에 기억된 프로그램이 동작함으로써 실현된다.
학습용 데이터 입력부(10)는, 전도 전락의 위험 행동을 일으켰는지의 여부에 대하여 이미 알려진 환자에 관한 전자 카르테에 포함되는 m개(m은 2 이상의 임의의 정수)의 문장을 학습용 데이터로서 입력한다. 예를 들면, 학습용 데이터 입력부(10)는, 입원 중에서의 전도 전락의 발생의 유무가 전자 카르테 혹은 다른 보고서의 기술에 의해 보고되어 있는 과거의 입원 환자의 전자 카르테를 입력하고, 해당 전자 카르테에 포함되어 있는 진료 기록 텍스트로 이루어지는 문장을 학습용 데이터로서 입력한다.
전자 카르테에는, 환자의 성명, 생년월일, 혈액형, 성별 등의 개인정보 이외에, 진료과, 진찰일, 진료 기록 텍스트 등이 포함되어 있다. 학습용 데이터 입력부(10)는, 전자 카르테 중의 진료 기록 텍스트의 부분을 학습용 데이터로서 사용하는 것을 설정한 상태에서, 전자 카르테를 입력한다(엄밀에 말하면, 전자 카르테를 입력하여, 그 전자 카르테 중 진료 기록 텍스트의 문장을 학습용 데이터로서 사용함). 그리고, 학습용 데이터 입력부(10)에 의해 입력하는 진료 기록 텍스트의 문장, 즉 후술하는 해석 대상으로 하는 문장은, 1개의 센텐스(구점(句點)에 의해 나누어지는 단위)로 이루어지는 것이어도 되고, 복수의 센텐스로 이루어지는 것이어도 된다.
단어 추출부(11)는, 학습용 데이터 입력부(10)에 의해 입력된 m개의 문장을 해석하고, 해당 m개의 문장으로부터 n개(n은 2 이상의 임의의 정수)의 단어를 추출한다. 문장의 해석 방법으로서는, 예를 들면 공지의 형태소 해석을 이용하는 것이 가능하다. 여기에서, 단어 추출부(11)는, 형태소 해석에 의해 분할되는 모든 품사의 형태소를 단어로서 추출하도록 해도 되고, 특정한 품사의 형태소만을 단어로서 추출하도록 해도 된다.
그리고, m개의 문장 중에는, 동일한 단어가 복수 포함되어 있는 경우가 있다. 이 경우, 단어 추출부(11)는, 동일한 단어를 복수 개 추출하는 것은 하지 않고, 1개만 추출한다. 즉, 단어 추출부(11)가 추출하는 n개의 단어란, n종류의 단어라는 의미이다. 여기에서, 단어 추출부(11)는, m개의 전자 카르테 중의 문장으로부터 동일한 단어가 추출되는 빈도를 계측하고, 출현 빈도가 큰 쪽으로부터 n개(n종류)의 단어, 혹은 출현 빈도가 임계값 이상인 n개(n종류)의 단어를 추출하도록 해도 된다.
벡터 산출부(12)는, m개의 문장 및 n개의 단어로부터, m개의 문장 벡터 및 n개의 단어 벡터를 산출한다. 여기에서, 문장 벡터 산출부(12A)는, 단어 추출부(11)에 의한 해석 대상으로 된 m개의 문장을 각각 소정의 룰에 따라서 q차원으로 벡터화함으로써, q개(q는 2 이상의 임의의 정수)의 축 성분으로 이루어지는 m개의 문장 벡터를 산출한다. 또한, 단어 벡터 산출부(12B)는, 단어 추출부(11)에 의해 추출된 n개의 단어를 각각 소정의 룰에 따라서 q차원으로 벡터화함으로써, q개의 축 성분으로 이루어지는 n개의 단어 벡터를 산출한다.
본 실시형태에서는, 일례로서, 다음과 같이 하여 문장 벡터 및 단어 벡터를 산출한다. 이제, m개의 문장과 n개의 단어로 이루어지는 집합 S=<dD, w∈W>을 생각한다. 여기에서, 각 문장 di(i=1, 2, …, m) 및 각 단어 wj(j=1, 2, …, n)에 대하여 각각 문장 벡터 di→ 및 단어 벡터 wj→(이하에서는, 기호 "→"은 벡터인 것을 가리키는 것으로 함)를 관련짓는다. 그리고, 임의의 단어 wj와 임의의 문장 di에 대하여, 다음의 식(1)에 나타내는 확률 P(wj|di)를 계산한다.
Figure 112020113369065-pct00001
그리고, 이 확률 P(wj|di)는, 예를 들면 문장이나 문서를 단락(paragraph)·벡터에 의해 평가하는 것에 대하여 기술한 논문 「"Distributed Representations of Sentences and Documents" by Quoc Le and Tomas Mikolov, Google Inc, Proceedings of the 31st International Conference on Machine Learning Held in Bejing, China on 22-24 June 2014」에 개시되어 있는 확률 p를 모방하여 산출하는 것이 가능한 값이다. 이 논문에는, 예를 들면 "the", "cat", "sat"라는 3개의 단어가 있을 때, 4개째의 단어로서 "on"을 예측한다고 되어 있고, 그 예측 확률 p의 산출식이 게재되고 있다. 해당 논문에 기재되어 있는 확률 p(wt|wt-k, …, wt+k)는, 복수의 단어 wt-k, …, wt+k로부터 다른 1개의 단어 wt를 예측했을 때의 정해 확률이다.
이에 대하여, 본 실시형태에서 사용하는 식(1)에 나타내어지는 확률 P(wj|di)는, m개의 문장 중 1개의 문장 di로부터, n개의 단어 중 1개의 단어 wj가 예상되는 정해 확률을 표시하고 있다. 1개의 문장 di로부터 1개의 단어 wj를 예측한다는 것은, 구체적으로는, 어떤 문장 di가 출현했을 때, 그 중에 단어 wj가 포함될 가능성을 예측한다는 것이다.
식(1)에서는, e를 밑으로 하고, 단어 벡터 w→와 문장 벡터 d→의 내적값을 지수로 하는 지수 함수값을 이용한다. 그리고, 예측 대상으로 하는 문장 di와 단어 wj의 조합으로부터 계산되는 지수 함수값과, 문장 di와 n개의 단어 wk(k=1, 2, …, n)의 각 조합으로부터 계산되는 n개의 지수 함수값의 합계값의 비율을, 1개의 문장 di로부터 1개의 단어 wj가 예상되는 정해 확률로서 계산하고 있다.
여기에서, 단어 벡터 wj→와 문장 벡터 di→의 내적값은, 단어 벡터 wj→를 문장 벡터 di→의 방향으로 투영한 경우의 스칼라값, 즉 단어 벡터 wj→가 가지고 있는 문장 벡터 di→의 방향의 성분값이라고도 말할 수 있다. 이것은, 단어 wj가 문장 di에 기여하고 있는 정도를 표시하고 있다고 생각할 수 있다. 따라서, 이와 같은 내적을 이용하여 계산되는 지수 함수값을 이용하여, n개의 단어 wk(k=1, 2, …, n)에 대하여 계산되는 지수 함수값의 합계에 대한, 1개의 단어 wj에 대하여 계산되는 지수 함수값의 비율을 구하는 것은, 1개의 문장 di로부터 n개의 단어 중 1개의 단어 wj가 예상되는 정해 확률을 구하는 것에 상당한다.
그리고, 식(1)은, di와 wj에 대하여 대칭이므로, n개의 단어 중 1개의 단어 wj로부터, m개의 문장 중 1개의 문장 di가 예상되는 확률 P(di|wj)를 계산해도 된다. 1개의 단어 wj로부터 1개의 문장 di를 예측한다는 것은, 어떤 단어 wj가 출현했을 때, 그것이 문장 di 중에 포함될 가능성을 예측한다는 것이다. 이 경우, 문장 벡터 di→와 단어 벡터 wj→의 내적값은, 문장 벡터 di→를 단어 벡터 wj→의 방향으로 투영한 경우의 스칼라값, 즉 문장 벡터 di→가 가지고 있는 단어 벡터 wj→의 방향의 성분값이라고도 말할 수 있다. 이것은, 문장 di가 단어 wj에 기여하고 있는 정도를 표시하고 있다고 생각할 수 있다.
그리고, 여기서는, 단어 벡터 w→와 문장 벡터 d→의 내적값을 지수로 하는 지수 함수값을 이용하는 계산예를 제시했지만, 지수 함수값을 사용하는 것을 필수로 하는 것은 아니다. 단어 벡터 w→와 문장 벡터 d→의 내적값을 이용한 계산식이면 되고, 예를 들면, 내적값 그 자체의 비율에 의해 확률을 구하도록 해도 된다.
다음으로, 벡터 산출부(12)는, 하기의 식(2)에 나타낸 바와 같이, 상기 식(1)에 의해 산출되는 확률 P(wj|di)를 모든 집합 S에 대하여 합계한 값 L을 최대화하는 문장 벡터 di→ 및 단어 벡터 wj→를 산출한다. 즉, 문장 벡터 산출부(12A) 및 단어 벡터 산출부(12B)는, 상기 식(1)에 의해 산출되는 확률 P(wj|di)를, m개의 문장과 n개의 단어의 모든 조합에 대하여 산출하고, 이들을 합계한 값을 목표 변수 L로 하여, 해당 목표 변수 L을 최대화하는 문장 벡터 di→ 및 단어 벡터 wj→를 산출한다.
Figure 112020113369065-pct00002
m개의 문장과 n개의 단어의 모든 조합에 대하여 산출한 확률 P(wj|di)의 합계값 L을 최대화한다는 것은, 어떤 문장 di(i=1, 2, …, m)로부터 어떤 단어 wj(j=1, 2, …, n)가 예상되는 정해 확률을 최대화한다는 것이다. 즉, 벡터 산출부(12)는, 이 정해 확률이 최대화하는 바와 같은 문장 벡터 di→ 및 단어 벡터 wj→를 산출하는 것이라고 말할 수 있다.
여기에서, 본 실시형태에서는, 전술한 바와 같이, 벡터 산출부(12)는, m개의 문장 di를 각각 q차원으로 벡터화함으로써, q개의 축 성분으로 이루어지는 m개의 문장 벡터 di→를 산출하고, 또한 n개의 단어를 각각 q차원으로 벡터화함으로써, q개의 축 성분으로 이루어지는 n개의 단어 벡터 wj를 산출한다. 이것은, q개의 축방향을 가변으로 하여, 전술한 목표 변수 L이 최대화하는 바와 같은 문장 벡터 di→ 및 단어 벡터 wj→를 산출하는 것에 상당한다.
지표값 산출부(13)는, 벡터 산출부(12)에 의해 산출된 m개의 문장 벡터 di→와 n개의 단어 벡터 wj→의 내적을 각각 취함으로써, m개의 문장 di 및 n개의 단어 wj간의 관계성을 반영한 m×n개의 유사성 지표값을 산출한다. 본 실시형태에서는, 지표값 산출부(13)는 하기의 식(3)에 나타낸 바와 같이, m개의 문장 벡터 di→의 각 q개의 축 성분(d11∼dmq)을 각 요소로 하는 문장 행렬 D와, n개의 단어 벡터 wj→의 각 q개의 축 성분(w11∼wnq)을 각 요소로 하는 단어 행렬 W의 곱을 취하는 것에 의해, m×n개의 유사성 지표값을 각 요소로 하는 지표값 행렬 DW를 산출한다. 여기에서, Wt는 단어 행렬의 전치 행렬이다.
Figure 112020113369065-pct00003
이와 같이 하여 산출된 지표값 행렬 DW의 각 요소는, 어느 단어가 어느 문장에 대하여 어느 정도 기여하고 있는 것인지를 표시한 것이라고 말할 수 있다. 예를 들면, 1행 2열의 요소 dw12는, 단어 w2가 문장 d1에 대하여 어느 정도 기여하고 있는 것인지를 표시한 값이다. 이에 의해, 지표값 행렬 DW의 각 행은 문장의 유사성을 평가하는 것으로서 이용하는 것이 가능하며, 각각의 열은 단어의 유사성을 평가하는 것으로서 이용하는 것이 가능하다.
분류 모델 생성부(14)는, 지표값 산출부(13)에 의해 산출된 m×n개의 유사성 지표값을 이용하여, 1개의 문장 di(i=1, 2, …, m)에 대하여 n개의 유사성 지표값 dwj(j=1, 2, …, n)로 이루어지는 문장 지표값군을 기초로, 전도 전락이 발생할 가능성의 높음에 대하여 m개의 문장 di를 각각 2개로 분류하기 위한 분류 모델을 생성한다. 즉, 분류 모델 생성부(14)는, 전도 전락을 일으킨 것이 이미 알려진 환자의 전자 카르테를 기초로 산출되는 문장 지표값군에 대해서는 「전도 전락있음」으로 분류되고, 전도 전락을 일으키고 있지 않은 것이 이미 알려진 환자의 전자 카르테를 기초로 산출되는 문장 지표값군에 대해서는 「전도 전락없음」으로 분류되는 분류 모델을 생성한다. 그리고, 분류 모델 생성부(14)는, 생성한 분류 모델을 분류 모델 기억부(30)에 기억시킨다.
여기에서, 문장 지표값군이란, 예를 들면, 첫번째의 문장 d1의 경우, 지표값 행렬 DW의 첫째줄에 포함되는 n개의 유사성 지표값 dw11∼dw1n이 이것에 해당한다. 마찬가지로, 두 번째의 문장 d2의 경우, 지표값 행렬 DW의 둘째줄에 포함되는 n개의 유사성 지표값 dw21∼dw2n이 이것에 해당한다. 이하, m개째의 문장 dm에 관한 문장 지표값군(n개의 유사성 지표값 dwm1∼dwmn)까지 동일하다.
분류 모델 생성부(14)는, 예를 들면, 각 문장 di의 문장 지표값군에 대하여 각각 특징량을 산출하고, 해당 산출한 특징량의 값에 따라, 마르코프 연쇄 몬테카를로법(Markov chain Monte Carlo method)에 의한 2군 분리의 최적화를 행함으로써, 각 문장 di를 2개의 사상으로 분류하기 위한 분류 모델을 생성한다. 여기에서, 분류 모델 생성부(14)가 생성하는 분류 모델은, 문장 지표값군을 입력으로 하여, 예측하고자 하는 2개의 사상(전도 전락의 발생 가능성의 유무) 중 어느 하나를 해로서 출력하는 학습 모델이다. 혹은, 전도 전락의 「가능성있음」으로 분류되는 확률을 수치로서 출력하는 학습 모델로 해도 된다. 학습 모델의 형태는 임의이다.
예를 들면, 분류 모델 생성부(14)가 생성하는 분류 모델의 형태는, 회귀 모델(선형 회귀, 로지스틱 회귀, 서포트 벡터 머신 등을 베이스로 하는 학습 모델), 나무 모델(결정 나무, 회귀 나무, 랜덤 포레스트, 구배 부스팅 나무 등을 베이스로 하는 학습 모델), 뉴럴 네트워크 모델(퍼셉트론(perceptron), 컨벌루션 뉴럴 네트워크, 재기형 뉴럴 네트워크, 잔차(殘差) 네트워크, RBF 네트워크, 확률적 뉴럴 네트워크, 스파이킹 뉴럴 네트워크, 복소 뉴럴 네트워크 등을 베이스로 하는 학습 모델), 베이즈 모델(베이즈 추론 등을 베이스로 하는 학습 모델), 클러스터링 모델(k근방법, 계층형 클러스터링, 비계층형 클러스터링, 토픽 모델 등을 베이스로 하는 학습 모델) 등 중 어느 하나로 하는 것이 가능하다. 그리고, 여기에 예로 든 분류 모델은 일례에 지나지 않고, 이것에 한정되는 것은 아니다.
예측용 데이터 입력부(20)는, 예측 대상으로 하는 환자에 관한 전자 카르테에 포함되는 m'개(m'은 1 이상의 임의의 정수)의 문장을 예측용 데이터로서 입력한다. 예를 들면, 예측용 데이터 입력부(20)는, 본 실시형태의 위험 행동 예측 장치를 도입하고 있는 병원에서의 현재의 입원 환자의 인원수만큼의 전자 카르테를 입력하고, 해당 전자 카르테에 포함되어 있는 진료 기록 텍스트로 이루어지는 문장을 예측용 데이터로서 입력한다.
실제 병원의 운용으로서는, 예측용 데이터 입력부(20)에 의해 각 입원 환자의 전자 카르테의 입력을 정기적으로(예를 들면, 매일) 행하고, 위험 행동 예측부(21)에 의해 각 입원 환자의 전도 전락의 예측을 정기적으로 행하는 것이 바람직하다. 예를 들면, 예측용 데이터 입력부(20)는, 전자 카르테의 데이터를 보존한 전자 카르테 시스템(도시하지 않음)으로부터 각 입원 환자의 전자 카르테를 정기적으로 입력하도록 해도 된다. 전자 카르테 내의 진료 기록 텍스트의 기술은, 의사에 의한 일차(日次)의 진료를 통하여 갱신되고 있을 가능성이 있다. 따라서, 갱신될 수 있는 진료 기록 텍스트의 문장 내용에 기초하여, 각 입원 환자의 전도 전락의 예측을 일차로 행하게 된다.
여기에서, 예측용 데이터 입력부(20)가 입력하는 전자 카르테는, 전도 전락의 발생 가능성이 미지인 환자, 및 전도 전락의 발생 가능성이 현시점에서는 없다고 예측되고 있는 환자의 전자 카르테로 한다. 전도 전락의 발생 가능성이 있다고 이미 예측되고 있는 환자의 전자 카르테는 반드시 입력 대상으로 하지 않아도 된다. 다만, 환자의 증상이나 몸 상태의 개선에 의해 전도 전락의 발생 가능성이 없어질 가능성도 있으므로, 전도 전락의 발생 가능성이 있다고 이미 예측되고 있는 환자의 전자 카르테를 입력 대상에 포함해도 된다.
그리고, 전자 카르테의 갱신 이력과, 전도 전락의 예측 실시 이력을 환자마다 기록한 데이터베이스를 작성하고, 예측용 데이터 입력부(20)가 이 데이터베이스의 이력 정보에 기초하여, 예측 대상으로 하는 환자의 전자 카르테를 전자 카르테 시스템으로 선택적으로 입력하도록 해도 된다. 예를 들면, 예측용 데이터 입력부(20)는, 전자 카르테의 갱신이 행해지고 있어서, 그 갱신보다도 나중에 전도 전락의 예측 처리가 실행되어 있지 않은 것이 이력 정보에 의해 나타내어져 있는 환자의 전자 카르테를 전자 카르테 시스템으로부터 검색하여 입력하도록 해도 된다.
위험 행동 예측부(21)는, 예측용 데이터 입력부(20)에 의해 입력된 예측용 데이터에 대하여, 유사성 지표값 산출부(100)의 단어 추출부(11), 벡터 산출부(12) 및 지표값 산출부(13)의 처리를 실행함으로써 얻어지는 유사성 지표값을, 분류 모델 생성부(14)에 의해 생성된 분류 모델(분류 모델 기억부(30)에 기억된 분류 모델)에 적용함으로써, 예측 대상으로 하는 환자가 전도 전락의 위험 행동을 일으킬 가능성을 예측한다.
예를 들면, 예측용 데이터 입력부(20)에 의해 전자 카르테 내에 포함되는 m'개의 진료 기록 텍스트의 문장이 예측용 데이터로서 입력된 경우, 위험 행동 예측부(21)의 지시에 의해 이 m'개의 진료 기록 텍스트의 문장에 대하여 유사성 지표값 산출부(100)의 처리를 실행하는 것에 의해, m'개의 문장 지표값군을 얻는다. 위험 행동 예측부(21)는, 유사성 지표값 산출부(100)에 의해 산출된 m'개의 문장 지표값군을 1개씩 분류 모델에 입력 데이터로서 부여함으로써, m'개의 문장 각각에 대하여, 환자의 전도 전락의 발생 가능성을 예측한다.
여기에서, 단어 추출부(11)는, m개의 학습용 데이터로부터 추출한 n개의 단어와 동일한 단어를 m'개의 예측용 데이터로부터 추출하는 것이 바람직하다. 예측용 데이터로부터 추출되는 n개의 단어로 이루어지는 문장 지표값군이, 학습용 데이터로부터 추출된 n개의 단어로 이루어지는 문장 지표값군과 동일한 단어를 요소로 하는 것으로 되므로, 분류 모델 기억부(30)에 기억된 분류 모델에 대한 적합도가 높아지기 때문이다. 다만, 학습 시와 동일한 n개의 단어를 예측 시에도 추출하는 것을 필수로 하는 것은 아니다. 학습 시와는 다른 단어의 조합에 의해 예측용의 문장 지표값군이 생성되는 경우, 분류 모델에 대한 적합도가 낮아지지만, 적합도가 낮다라는 것 자체도 평가의 하나의 요소로서, 사상에 해당하는 가능성을 예측하는 것 자체는 가능하기 때문이다.
도 2는, 상기한 바와 같이 구성한 본 실시형태에 의한 사상 예측 장치의 동작예를 나타내는 플로차트다. 도 2의 (a)는, 분류 모델을 생성하는 학습 시의 동작예를 나타내고, 도 2의 (b)는, 생성된 분류 모델을 이용하여 사상의 예측을 행하는 예측 시의 동작예를 나타내고 있다.
도 2의 (a)에 나타내는 학습 시에 있어서, 먼저, 학습용 데이터 입력부(10)는, 전도 전락의 위험 행동을 일으켰는지의 여부에 대하여 이미 알려진 환자에 관한 전자 카르테에 포함되는 m개의 문장(진료 기록 텍스트)을 학습용 데이터로서 입력한다(스텝 S1). 단어 추출부(11)는, 학습용 데이터 입력부(10)에 의해 입력된 m개의 문장을 해석하고, 해당 m개의 문장으로부터 n개의 단어를 추출한다(스텝 S2).
이어서, 벡터 산출부(12)는, 학습용 데이터 입력부(10)에 의해 입력된 m개의 문장 및 단어 추출부(11)에 의해 추출된 n개의 단어로부터, m개의 문장 벡터 di→ 및 n개의 단어 벡터 wj→를 산출한다(스텝 S3). 그리고, 지표값 산출부(13)는, m개의 문장 벡터 di→와 n개의 단어 벡터 wj→의 내적을 각각 취함으로써, m개의 문장 di 및 n개의 단어 wj간의 관계성을 반영한 m×n개의 유사성 지표값(m×n개의 유사성 지표값을 각 요소로 하는 지표값 행렬 DW)을 산출한다(스텝 S4).
또한, 분류 모델 생성부(14)는, 지표값 산출부(13)에 의해 산출된 m×n개의 유사성 지표값을 이용하여, 1개의 문장 di에 대하여 n개의 유사성 지표값 dwj로 이루어지는 문장 지표값군을 기초로, 전도 전락이 발생할 가능성의 높음에 대하여 m개의 문장 di를 2개로 분류하기 위한 분류 모델을 생성하고, 생성한 분류 모델을 분류 모델 기억부(30)에 기억시킨다(스텝 S5). 이상에 의해, 학습 시의 동작이 종료된다.
도 2의 (b)에 나타내는 예측 시에 있어서, 먼저, 예측용 데이터 입력부(20)는, 예측 대상으로 하는 환자에 관한 전자 카르테에 포함되는 m'개의 문장(진료 기록 텍스트)을 예측용 데이터로서 입력한다(스텝 S11). 위험 행동 예측부(21)는, 예측용 데이터 입력부(20)에 의해 입력된 예측용 데이터를 유사성 지표값 산출부(100)에 공급하고, 유사성 지표값의 산출을 지시한다.
이 지시에 따라, 단어 추출부(11)는, 예측용 데이터 입력부(20)에 의해 입력된 m'개의 문장을 해석하고, 해당 m'개의 문장으로부터 n개의 단어(학습용 데이터로부터 추출된 것과 동일한 단어)을 추출한다(스텝 S12). 그리고, m'개의 문장 중에 n개의 단어가 모두 포함되어 있다고는 한정되지 않는다. m'개의 문장 중에 존재하지 않는 단어에 대해서는 Null값으로 된다.
이어서, 벡터 산출부(12)는, 예측용 데이터 입력부(20)에 의해 입력된 m'개의 문장 및 단어 추출부(11)에 의해 추출된 n개의 단어로부터, m'개의 문장 벡터 di→ 및 n개의 단어 벡터 wj→을 산출한다(스텝 S13).
그리고, 지표값 산출부(13)는, m'개의 문장 벡터 di→와 n개의 단어 벡터 wj→의 내적을 각각 취함으로써, m'개의 문장 di 및 n개의 단어 wj간의 관계성을 반영한 m'×n개의 유사성 지표값(m'×n개의 유사성 지표값을 각 요소로 하는 지표값 행렬 DW)을 산출한다(스텝 S14). 지표값 산출부(13)는, 산출한 m'×n개의 유사성 지표값을 사상 예측부(21)에 공급한다.
위험 행동 예측부(21)는, 유사성 지표값 산출부(100)로부터 공급된 m'×n개의 유사성 지표값을 기초로, m'개의 문장 지표값군을 각각 분류 모델 기억부(30)에 기억된 분류 모델에 적용함으로써, m'개의 문장 각각에 대하여, 예측 대상으로 하는 환자가 전도 전락의 위험 행동을 일으킬 가능성을 예측한다(스텝 S15). 이에 의해, 예측 시의 동작이 종료된다.
이상 상세하게 설명한 바와 같이, 본 실시형태에서는, 환자의 전자 카르테에 포함되는 m개의 문장을 학습용 데이터로서 입력하고, 해당 입력된 문장으로부터 산출한 문장 벡터와, 문장 내에 포함되는 단어로부터 산출한 단어 벡터의 내적을 계산함으로써, 문장 및 단어간의 관계성을 반영한 유사성 지표값을 산출하고, 이 유사성 지표값을 이용하여 분류 모델을 생성하고 있다. 이에 의해, 어느 단어가 어느 문장에 대하여 어느 정도 기여하고 있는 것인가, 혹은, 어느 문장이 어느 단어에 대하여 어느 정도 기여하고 있는 것인가를 나타낸 유사성 지표값을 이용하여 분류 모델이 생성된다. 그러므로, m개의 문장과 n개의 단어의 기여도를 가미한 후에, 전자 카르테 내의 문장을, 전도 전락의 발생 가능성의 유무라는 2개의 사상 중 어느 하나로 적절하게 분류할 수 있게 된다. 따라서, 본 실시형태에 의하면, 환자가 위험 행동을 일으킬 가능성의 예측을 행하는 장치에 있어서, 학습에 의해 생성하는 분류 모델의 정밀도를 올리고, 위험 행동의 발생을 양호한 정밀도로 예측할 수 있게 된다.
그리고, 상기 실시형태에서는, 「전도 전락있음」 및 「전도 전락없음」의 2개의 사상 중 어느 쪽에 해당하는지가 이미 알려진 문장에 관한 문장 데이터를 학습용 데이터로서 사용하는 교사있음 학습을 적용한 예에 대하여 설명하였으나, 이것에 강화 학습을 조합시키도록 해도 된다. 도 3은, 강화 학습의 구조를 추가한 다른 실시형태에 관한 사상 예측 장치의 기능 구성예를 나타내는 블록도이다.
도 3에 나타낸 바와 같이, 다른 실시형태에 관한 사상 예측 장치는, 도 1에 나타낸 구성에 더하여 실적 데이터 입력부(22) 및 보수 결정부(23)을 더욱 구비하고 있다. 또한, 다른 실시형태에 관한 위험 행동 예측 장치는, 도 1에 나타낸 분류 모델 생성부(14)를 대신하여 분류 모델 생성부(14')를 구비하고 있다.
실적 데이터 입력부(22)는, 퇴원 환자의 전자 카르테에 포함되어 있는 위험 행동 기록 리포트를 실적 데이터로서 입력한다. 즉, 전자 카르테에는, 전술한 환자의 성명, 생년월일, 혈액형, 성별, 진료과, 진찰일, 진료 기록 텍스트의 이외에, 퇴원 후 요약(su㎜ary)의 항목이 포함되어 있는 경우가 있다. 이 퇴원 후 요약은, 환자의 퇴원 후에, 입원 중에서의 환자의 상태를 요약으로서 기술하기 위한 항목이다. 이 퇴원 후 요약에, 환자가 입원 중에 위험 행동을 일으켰는지의 여부의 기록 리포트가 기술된다. 실적 데이터 입력부(22)는, 이 퇴원 후 요약에 기술되어 있는 위험 행동 기록 리포트의 내용, 즉 환자가 입원 중에 위험 행동을 일으켰는지의 여부의 정보를 실적 데이터로서 입력한다.
그리고, 실적 데이터 입력부(22)에 의한 실적 데이터의 입력 방법은 이것에 한정되지 않는다. 예를 들면, 환자가 입원 중에 위험 행동을 일으켰는지의 여부의 정보가 전자 카르테의 진료 기록 텍스트에 기술되는 경우도 있다. 따라서, 실적 데이터 입력부(22)는, 진료 기록 텍스트에 기술되어 있는 위험 행동 기록 리포트의 내용을 실적 데이터로서 입력하도록 해도 된다.
구체적으로는, 실적 데이터 입력부(22)는, 퇴원 후 요약 또는 진료 기록 텍스트에 기술되어 있는 문장을 해석함으로써, 환자가 입원 중에 위험 행동을 일으켰는지의 여부를 판정하고, 그 판정 결과를 실적 데이터로서 입력한다. 혹은, 퇴원 후 요약 또는 진료 기록 텍스트에 기술되어 있는 문장을 의사나 간호사 등의 의료 종사자가 육안으로 확인하고, 의사나 간호사 등의 의료 종사자가 키보드나 터치패널 등의 입력 디바이스를 조작함으로써 입력한 정보를 실적 데이터 입력부(22)가 입력하는 것에 의해, 퇴원 환자의 입원 중에서의 위험 행동의 발생의 유무를 실적 데이터로서 입력하도록 해도 된다.
보수 결정부(23)는, 위험 행동 예측부(21)에 의해 예측된 전도 전락의 발생 가능성에 대하여, 실적 데이터 입력부(22)로부터 입력된 전도 전락의 발생 실적에 따라서, 분류 모델 생성부(14')에 부여하는 보수를 결정한다. 예를 들면, 보수 결정부(23)는, 위험 행동 예측부(21)에 의해 예측된 전도 전락의 발생 가능성을 나타내는 예측 데이터와, 실적 데이터 입력부(22)에 의해 입력된 실적 데이터가 일치하고 있는 경우에는 플러스의 보수를 부여하도록 결정하고, 일치하고 있지 않은 경우는 무보수 또는 마이너스의 보수를 부여하도록 결정한다.
분류 모델 생성부(14')는 도 1에 나타낸 분류 모델 생성부(14)와 마찬가지로, 학습용 데이터 입력부(10)에 의해 입력된 학습용 데이터를 기초로, 분류 모델을 생성하고, 분류 모델 기억부(30)에 기억시킨다. 이것에 더하여, 분류 모델 생성부(14')는, 보수 결정부(23)에 의해 결정된 보수에 따라, 분류 모델 기억부(30)에 기억된 분류 모델을 개변한다. 이와 같이, 교사있음 학습의 구조에 대하여 강화 학습의 구조를 더하여 분류 모델을 생성함으로써, 분류 모델의 정밀도를 더욱 향상시킬 수 있다.
그리고, 상기 실시형태에서는, 학습 및 예측에 사용하는 의료 정보로서 전자 카르테를 이용하는 예에 대하여 설명하였으나, 예를 들면, 간호 기록 리포트 등, 환자의 위험 행동의 발생 가능성을 예측할 수 있는 문장이 포함되어 있는 것이면, 전자 카르테 이외의 의료 정보를 사용해도 된다.
또한, 상기 실시형태에서는, 환자의 위험 행동으로서 전도 전락의 발생 가능성을 예측하는 예에 대하여 설명하였으나, 본 발명은 이것에 한정되지 않는다. 즉, 의사나 간호사측이 아니고 환자측의 사정에 기인하는 위험 행동의 발생을 예측하는 것에 널리 이용하는 것이 가능하다.
또한, 상기 실시형태에서는, 전도 전락이 발생할 가능성의 높음에 대하여 문장을 2개로 분류하는 예에 대하여 설명하였으나, 3개 이상의 랭크로 분류하도록 해도 된다.
또한, 상기 실시형태에서는, 입원 중의 환자에 관한 전도 전락의 발생을 예측하는 것에 대하여 설명하였으나, 본 발명은 이것에 한정되지 않는다. 예를 들면, 외래환자, 재택 방문 치료의 대상 환자, 원격 의료 시스템을 이용하고 있는 원격 치료 환자 등, 전자 카르테 또는 그것에 유사한 의료 정보가 존재하는 환자에 대해서도, 재택에서의 전도 전락의 발생 가능성을 예측할 수 있다.
또한, 상기 실시형태에서는, 병원에서 있어서 환자가 위험 행동을 일으킬 가능성을 예측하는 것에 대하여 설명하였으나, 간병 시설 등에 있어서 피개호자가 위험 행동을 일으킬 가능성을 예측하는 것도 가능하다. 본 명세서 및 특허청구의 범위에서는, 피개호자도 「환자」에 포함되는 개념인 것으로 한다.
그 외, 상기 실시형태는, 모두 본 발명을 실시하는 데 있어서의 구체화의 일례를 나타낸 것에 지나지 않고, 이에 의해 본 발명의 기술적 범위가 한정적으로 해석되어서는 안 되는 것이다. 즉, 본 발명은 그 요지, 또는 그 주요한 특징으로부터 일탈하지 않고, 다양한 형태로 실시할 수 있다.
10 : 학습용 데이터 입력부
11 : 단어 추출부
12 : 벡터 산출부
12A : 문장 벡터 산출부
12B : 단어 벡터 산출부
13 : 지표값 산출부
14, 14' : 분류 모델 생성부
20 : 예측용 데이터 입력부
21 : 위험 행동 예측부
22 : 실적 데이터 입력부
23 : 보수 결정부
30 : 분류 모델 기억부
100 : 유사성 지표값 산출부

Claims (12)

  1. 위험 행동을 일으켰는지의 여부에 대하여 이미 알려진 환자에 관한 의료 정보에 포함되는 m개(m은 2 이상의 임의의 정수)의 문장을 학습용 데이터로서 입력하는 학습용 데이터 입력부;
    상기 학습용 데이터 입력부에 의해 상기 학습용 데이터로서 입력된 상기 m개의 문장을 해석하고, 상기 m개의 문장으로부터 n개(n은 2 이상의 임의의 정수)의 단어를 추출하는 단어 추출부;
    상기 m개의 문장을 각각 소정의 룰에 따라서 q차원(q는 2 이상의 임의의 정수)으로 벡터화함으로써, q개의 축 성분으로 이루어지는 m개의 문장 벡터를 산출하는 문장 벡터 산출부;
    상기 n개의 단어를 각각 소정의 룰에 따라서 q차원으로 벡터화함으로써, q개의 축 성분으로 이루어지는 n개의 단어 벡터를 산출하는 단어 벡터 산출부;
    상기 m개의 문장 벡터와 상기 n개의 단어 벡터의 내적을 각각 취함으로써, 상기 m개의 문장 및 상기 n개의 단어간의 관계성을 반영한 m×n개의 유사성 지표값을 산출하는 지표값 산출부;
    상기 지표값 산출부에 의해 산출된 상기 m×n개의 유사성 지표값을 이용하여, 1개의 문장에 대하여 n개의 유사성 지표값으로 이루어지는 문장 지표값군을 기초로, 상기 위험 행동이 발생할 가능성의 높음에 대하여 상기 m개의 문장을 분류하기 위한 분류 모델을 생성하는 분류 모델 생성부;
    예측 대상으로 하는 환자에 관한 의료 정보에 포함되는 m'개(m'은 1 이상의 임의의 정수)의 문장을 예측용 데이터로서 입력하는 예측용 데이터 입력부; 및
    상기 예측용 데이터 입력부에 의해 입력된 상기 예측용 데이터에 대하여 상기 단어 추출부, 상기 문장 벡터 산출부, 상기 단어 벡터 산출부 및 상기 지표값 산출부의 처리를 실행함으로써 얻어지는 유사성 지표값을, 상기 분류 모델 생성부에 의해 생성된 상기 분류 모델에 적용하는 것에 의해, 상기 예측 대상으로 하는 환자가 상기 위험 행동을 일으킬 가능성을 예측하는 위험 행동 예측부
    를 포함하는, 위험 행동 예측 장치.
  2. 제1항에 있어서,
    상기 문장 벡터 산출부 및 상기 단어 벡터 산출부는, 상기 n개의 단어 중 1개의 단어로부터 상기 m개의 문장 중 1개의 문장이 예상되는 확률, 또는, 상기 m개의 문장 중 1개의 문장으로부터 상기 n개의 단어 중 1개의 단어가 예상되는 확률을, 상기 m개의 문장과 상기 n개의 단어의 모든 조합에 대하여 산출하여 합계한 값을 목표 변수로 하고, 상기 목표 변수를 최대화하는 문장 벡터 및 단어 벡터를 산출하는, 위험 행동 예측 장치.
  3. 제1항 또는 제2항에 있어서,
    상기 지표값 산출부는, 상기 m개의 문장 벡터의 각 q개의 축 성분을 각 요소로 하는 문장 행렬과, 상기 n개의 단어 벡터의 각 q개의 축 성분을 각 요소로 하는 단어 행렬의 곱을 취하는 것에 의해, m×n개의 상기 유사성 지표값을 각 요소로 하는 지표값 행렬을 산출하는, 위험 행동 예측 장치.
  4. 제1항 또는 제2항에 있어서,
    상기 학습용 데이터 입력부는, 상기 위험 행동을 일으켰는지의 여부에 대하여 이미 알려진 환자의 전자 카르테를 상기 의료 정보로서 입력하고, 상기 전자 카르테에 포함되어 있는 진료 기록 텍스트로 이루어지는 문장을 상기 학습용 데이터로서 입력하고,
    상기 예측용 데이터 입력부는, 현재의 입원 환자의 전자 카르테를 상기 의료 정보로서 입력하고, 상기 전자 카르테에 포함되어 있는 진료 기록 텍스트로 이루어지는 문장을 상기 예측용 데이터로서 입력하는, 위험 행동 예측 장치.
  5. 제4항에 있어서,
    퇴원 환자의 전자 카르테에 포함되어 있는 위험 행동 기록 리포트를 실적 데이터로서 입력하는 실적 데이터 입력부; 및
    상기 퇴원 환자의 입원 시에 상기 위험 행동 예측부에 의해 예측된 상기 위험 행동의 발생 가능성에 대하여, 상기 실적 데이터 입력부에 의해 입력된 상기 실적 데이터에 의해 나타내어지는 상기 위험 행동의 발생 실적에 따라, 상기 분류 모델 생성부에 부여하는 보수를 결정하는 보수 결정부를 더 포함하고,
    상기 분류 모델 생성부는, 상기 보수 결정부에 의해 결정된 보수에 따라, 상기 분류 모델을 개변하는, 위험 행동 예측 장치.
  6. 위험 행동을 일으켰는지의 여부에 대하여 이미 알려진 환자에 관한 의료 정보에 포함되는 m개(m은 2 이상의 임의의 정수)의 문장을 학습용 데이터로서 입력하는 학습용 데이터 입력부;
    상기 학습용 데이터 입력부에 의해 상기 학습용 데이터로서 입력된 상기 m개의 문장을 해석하고, 상기 m개의 문장으로부터 n개(n은 2 이상의 임의의 정수)의 단어를 추출하는 단어 추출부;
    상기 m개의 문장을 각각 소정의 룰에 따라서 q차원(q는 2 이상의 임의의 정수)으로 벡터화함으로써, q개의 축 성분으로 이루어지는 m개의 문장 벡터를 산출하는 문장 벡터 산출부;
    상기 n개의 단어를 각각 소정의 룰에 따라서 q차원으로 벡터화함으로써, q개의 축 성분으로 이루어지는 n개의 단어 벡터를 산출하는 단어 벡터 산출부;
    상기 m개의 문장 벡터와 상기 n개의 단어 벡터의 내적을 각각 취함으로써, 상기 m개의 문장 및 상기 n개의 단어간의 관계성을 반영한 m×n개의 유사성 지표값을 산출하는 지표값 산출부; 및
    상기 지표값 산출부에 의해 산출된 상기 m×n개의 유사성 지표값을 이용하여, 1개의 문장에 대하여 n개의 유사성 지표값으로 이루어지는 문장 지표값군을 기초로, 상기 위험 행동이 발생할 가능성의 높음에 대하여 상기 m개의 문장을 분류하기 위한 분류 모델을, 상기 문장으로부터 상기 위험 행동이 발생할 가능성을 예측하기 위한 예측 모델로서 생성하는 분류 모델 생성부
    를 포함하는, 예측 모델 생성 장치.
  7. 제6항에 있어서,
    상기 문장 벡터 산출부 및 상기 단어 벡터 산출부는, 상기 n개의 단어 중 1개의 단어로부터 상기 m개의 문장 중 1개의 문장이 예상되는 확률, 또는, 상기 m개의 문장 중 1개의 문장으로부터 상기 n개의 단어 중 1개의 단어가 예상되는 확률을, 상기 m개의 문장과 상기 n개의 단어의 모든 조합에 대하여 산출하여 합계한 값을 목표 변수로 하고, 상기 목표 변수를 최대화하는 문장 벡터 및 단어 벡터를 산출하는, 예측 모델 생성 장치.
  8. 제6항 또는 제7항에 있어서,
    상기 지표값 산출부는, 상기 m개의 문장 벡터의 각 q개의 축 성분을 각 요소로 하는 문장 행렬과, 상기 n개의 단어 벡터의 각 q개의 축 성분을 각 요소로 하는 단어 행렬의 곱을 취하는 것에 의해, m×n개의 상기 유사성 지표값을 각 요소로 하는 지표값 행렬을 산출하는, 예측 모델 생성 장치.
  9. 컴퓨터에 저장되어 있는 위험 행동 예측용 프로그램으로서, 상기 컴퓨터에 의해 실행되었을 때,
    위험 행동을 일으켰는지의 여부에 대하여 이미 알려진 환자에 관한 의료 정보에 포함되는 m개(m은 2 이상의 임의의 정수)의 문장을 학습용 데이터로서 입력하는 학습용 데이터 입력 수단,
    상기 학습용 데이터 입력 수단에 의해 상기 학습용 데이터로서 입력된 상기 m개의 문장을 해석하고, 상기 m개의 문장으로부터 n개(n은 2 이상의 임의의 정수)의 단어를 추출하는 단어 추출 수단,
    상기 m개의 문장을 각각 소정의 룰에 따라서 q차원(q는 2 이상의 임의의 정수)으로 벡터화하고, 또한 상기 n개의 단어를 각각 소정의 룰에 따라서 q차원으로 벡터화함으로써, q개의 축 성분으로 이루어지는 m개의 문장 벡터 및 q개의 축 성분으로 이루어지는 n개의 단어 벡터를 산출하는 벡터 산출 수단, 및
    상기 m개의 문장 벡터와 상기 n개의 단어 벡터의 내적을 각각 취함으로써, 상기 m개의 문장 및 상기 n개의 단어간의 관계성을 반영한 m×n개의 유사성 지표값을 산출하는 지표값 산출 수단, 및
    상기 지표값 산출 수단으로 의해 산출된 상기 m×n개의 유사성 지표값을 이용하여, 1개의 문장에 대하여 n개의 유사성 지표값으로 이루어지는 문장 지표값군을 기초로, 상기 위험 행동이 발생할 가능성의 높음에 대하여 상기 m개의 문장을 분류하기 위한 분류 모델을, 상기 문장으로부터 상기 위험 행동이 발생할 가능성을 예측하기 위한 예측 모델로서 생성하는 분류 모델 생성 수단
    으로서 상기 컴퓨터를 기능하게 하기 위한, 위험 행동 예측용 프로그램.
  10. 제9항에 있어서,
    예측 대상으로 하는 환자에 관한 의료 정보에 포함되는 m'개(m'은 1 이상의 임의의 정수)의 문장을 예측용 데이터로서 입력하는 예측용 데이터 입력 수단, 및
    상기 예측용 데이터 입력 수단에 의해 입력된 상기 예측용 데이터에 대하여 상기 단어 추출 수단, 상기 벡터 산출 수단, 및 상기 지표값 산출 수단의 처리를 실행함으로써 얻어지는 유사성 지표값을, 상기 분류 모델 생성 수단에 의해 생성된 상기 분류 모델에 적용하는 것에 의해, 상기 예측 대상으로 하는 환자가 상기 위험 행동을 일으킬 가능성을 예측하는 위험 행동 예측 수단
    으로서 상기 컴퓨터를 더욱 기능하게 하기 위한, 위험 행동 예측용 프로그램.
  11. 제3항에 있어서,
    상기 학습용 데이터 입력부는, 상기 위험 행동을 일으켰는지의 여부에 대하여 이미 알려진 환자의 전자 카르테를 상기 의료 정보로서 입력하고, 상기 전자 카르테에 포함되어 있는 진료 기록 텍스트로 이루어지는 문장을 상기 학습용 데이터로서 입력하고,
    상기 예측용 데이터 입력부는, 현재의 입원 환자의 전자 카르테를 상기 의료 정보로서 입력하고, 상기 전자 카르테에 포함되어 있는 진료 기록 텍스트로 이루어지는 문장을 상기 예측용 데이터로서 입력하는, 위험 행동 예측 장치.
  12. 제11항에 있어서,
    퇴원 환자의 전자 카르테에 포함되어 있는 위험 행동 기록 리포트를 실적 데이터로서 입력하는 실적 데이터 입력부; 및
    상기 퇴원 환자의 입원 시에 상기 위험 행동 예측부에 의해 예측된 상기 위험 행동의 발생 가능성에 대하여, 상기 실적 데이터 입력부에 의해 입력된 상기 실적 데이터에 의해 나타내어지는 상기 위험 행동의 발생 실적에 따라, 상기 분류 모델 생성부에 부여하는 보수를 결정하는 보수 결정부를 더 포함하고,
    상기 분류 모델 생성부는, 상기 보수 결정부에 의해 결정된 보수에 따라, 상기 분류 모델을 개변하는, 위험 행동 예측 장치.
KR1020207030798A 2018-05-02 2019-04-23 위험 행동 예측 장치, 예측 모델 생성 장치 및 위험 행동 예측용 프로그램 KR102280664B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018088828A JP6652986B2 (ja) 2018-05-02 2018-05-02 危険行動予測装置、予測モデル生成装置および危険行動予測用プログラム
JPJP-P-2018-088828 2018-05-02
PCT/JP2019/017191 WO2019212005A1 (ja) 2018-05-02 2019-04-23 危険行動予測装置、予測モデル生成装置および危険行動予測用プログラム

Publications (2)

Publication Number Publication Date
KR20200128752A KR20200128752A (ko) 2020-11-16
KR102280664B1 true KR102280664B1 (ko) 2021-07-21

Family

ID=68387056

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207030798A KR102280664B1 (ko) 2018-05-02 2019-04-23 위험 행동 예측 장치, 예측 모델 생성 장치 및 위험 행동 예측용 프로그램

Country Status (6)

Country Link
US (1) US20210090748A1 (ko)
EP (1) EP3779727A4 (ko)
JP (1) JP6652986B2 (ko)
KR (1) KR102280664B1 (ko)
CN (1) CN112074825A (ko)
WO (1) WO2019212005A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11568982B1 (en) 2014-02-17 2023-01-31 Health at Scale Corporation System to improve the logistics of clinical care by selectively matching patients to providers
EP3756144A4 (en) * 2018-02-23 2022-06-22 INTEL Corporation METHOD, DEVICE AND SYSTEM FOR GENERATION OF BAYESIAN INFERENCE WITH A SPIKING NEURAL NETWORK
US11610679B1 (en) * 2020-04-20 2023-03-21 Health at Scale Corporation Prediction and prevention of medical events using machine-learning algorithms
CN111581982B (zh) * 2020-05-06 2023-02-17 首都师范大学 一种基于本体的医疗纠纷案件舆情预警等级的预测方法
JP7466865B2 (ja) 2020-08-07 2024-04-15 公立大学法人名古屋市立大学 自己抜去発生予測装置、自己抜去発生予測方法、プログラム、転倒転落発生予測装置、転倒転落発生予測方法および医療安全性向上支援方法
JP7469775B2 (ja) * 2020-09-14 2024-04-17 株式会社メビウスボックス 入院可能性推定システム
CN113283634B (zh) * 2021-04-15 2024-03-26 招商新智科技有限公司 一种基于梯度提升树模型的高速公路事故预测方法及系统
CN113312470B (zh) * 2021-05-28 2022-05-31 北京航空航天大学 一种基于匿名化隐私保护技术的医疗事件抽取方法
KR102565874B1 (ko) * 2021-06-07 2023-08-09 주식회사 카카오헬스케어 기계학습을 위한 의료데이터의 벡터화 방법, 이를 구현한 데이터 변환 장치 및 데이터 변환 프로그램
WO2023053177A1 (ja) * 2021-09-28 2023-04-06 日本電気株式会社 アセスメント評価装置、アセスメント支援方法及び記憶媒体
JPWO2023053189A1 (ko) * 2021-09-28 2023-04-06
CN114678138A (zh) * 2022-04-19 2022-06-28 重庆邮电大学 一种基于电子护理文本数据的人体跌倒风险预测方法及系统
US11900436B1 (en) * 2022-10-17 2024-02-13 Inmar Clearing, Inc. Natural language processing based product substitution system and related methods

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130054603A1 (en) 2010-06-25 2013-02-28 U.S. Govt. As Repr. By The Secretary Of The Army Method and apparatus for classifying known specimens and media using spectral properties and identifying unknown specimens and media
US20170364829A1 (en) * 2016-06-17 2017-12-21 Graham Fyffe System and methods for intrinsic reward reinforcement learning
JP2018032213A (ja) * 2016-08-24 2018-03-01 シャープ株式会社 情報処理装置、情報処理システム、情報処理方法及びプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110295621A1 (en) * 2001-11-02 2011-12-01 Siemens Medical Solutions Usa, Inc. Healthcare Information Technology System for Predicting and Preventing Adverse Events
US7383258B2 (en) * 2002-10-03 2008-06-03 Google, Inc. Method and apparatus for characterizing documents based on clusters of related words
JP2005208782A (ja) * 2004-01-21 2005-08-04 Fuji Xerox Co Ltd 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
CN104637242A (zh) * 2013-11-12 2015-05-20 广州华久信息科技有限公司 一种基于多分类器集成的老人跌倒检测方法及系统
US20170316180A1 (en) 2015-01-26 2017-11-02 Ubic, Inc. Behavior prediction apparatus, behavior prediction apparatus controlling method, and behavior prediction apparatus controlling program
WO2017199445A1 (ja) * 2016-05-20 2017-11-23 株式会社Ubic データ分析システム、その制御方法、プログラム、及び、記録媒体
CN106776884B (zh) * 2016-11-30 2021-04-20 江苏大学 一种基于多标签组合多分类器的恐怖行为预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130054603A1 (en) 2010-06-25 2013-02-28 U.S. Govt. As Repr. By The Secretary Of The Army Method and apparatus for classifying known specimens and media using spectral properties and identifying unknown specimens and media
US20170364829A1 (en) * 2016-06-17 2017-12-21 Graham Fyffe System and methods for intrinsic reward reinforcement learning
JP2018032213A (ja) * 2016-08-24 2018-03-01 シャープ株式会社 情報処理装置、情報処理システム、情報処理方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
최성호 외 2인, Paragraph Vector를 이용한 문장 의도 예측 기법, 한국정보과학회 학술발표논문집, 2016.6, 977-979페이지. 1부.*

Also Published As

Publication number Publication date
EP3779727A1 (en) 2021-02-17
JP6652986B2 (ja) 2020-02-26
CN112074825A (zh) 2020-12-11
WO2019212005A1 (ja) 2019-11-07
JP2019194807A (ja) 2019-11-07
EP3779727A4 (en) 2021-05-19
US20210090748A1 (en) 2021-03-25
KR20200128752A (ko) 2020-11-16

Similar Documents

Publication Publication Date Title
KR102280664B1 (ko) 위험 행동 예측 장치, 예측 모델 생성 장치 및 위험 행동 예측용 프로그램
Mahmood et al. Deep sentiments in roman urdu text using recurrent convolutional neural network model
Duarte et al. Deep neural models for ICD-10 coding of death certificates and autopsy reports in free-text
Zhang A hybrid structured deep neural network with Word2Vec for construction accident causes classification
KR102315984B1 (ko) 사상 예측 장치, 예측 모델 생성 장치 및 사상 예측용 프로그램
Dheeraj et al. Negative emotions detection on online mental-health related patients texts using the deep learning with MHA-BCNN model
KR102293160B1 (ko) 인지증 예측 장치, 예측 모델 생성 장치 및 인지증 예측용 프로그램
Akhtyamova et al. Adverse drug extraction in twitter data using convolutional neural network
Tung et al. Analyzing depression tendency of web posts using an event-driven depression tendency warning model
Chatterjee et al. Depression detection from social media posts using multinomial naive theorem
Mukherjee et al. Natural language processing-based quantification of the mental state of psychiatric patients
Krishnamurthy et al. A hybrid statistical and semantic model for identification of mental health and behavioral disorders using social network analysis
US20220036180A1 (en) Reinforcement learning approach to approximate a mental map of formal logic
Ahmed et al. Hyper-graph-based attention curriculum learning using a lexical algorithm for mental health
Jimenez et al. Automatic prediction of citability of scientific articles by stylometry of their titles and abstracts
Xu et al. Incorporating user generated content for drug drug interaction extraction based on full attention mechanism
CN116030271A (zh) 一种基于深度学习和双模态数据的抑郁情绪预测系统
Aswathy et al. Deep learning approach for the detection of depression in twitter
GB2503223A (en) Redrafting text strings using a vocabulary
Bayot et al. Multilingual author profiling using lstms
Elahinia et al. Predicting medical nonadherence using natural language processing
Omodunbi et al. Development of a medical condiction prediction model using natural language processing with K-nearest neighbour
Gajderowicz et al. Extracting Impact Model Narratives from Social Services' Text
Helae et al. Data Analytics in the Pharmacology Domain
Alam et al. Machine learning and lexical semantic-based sentiment analysis for determining the impacts of the COVID-19 Vaccine

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant