WO2014076777A1 - 医療情報解析プログラム、医療情報解析装置、および医療情報解析方法 - Google Patents

医療情報解析プログラム、医療情報解析装置、および医療情報解析方法 Download PDF

Info

Publication number
WO2014076777A1
WO2014076777A1 PCT/JP2012/079498 JP2012079498W WO2014076777A1 WO 2014076777 A1 WO2014076777 A1 WO 2014076777A1 JP 2012079498 W JP2012079498 W JP 2012079498W WO 2014076777 A1 WO2014076777 A1 WO 2014076777A1
Authority
WO
WIPO (PCT)
Prior art keywords
patient
information
record
medical
word
Prior art date
Application number
PCT/JP2012/079498
Other languages
English (en)
French (fr)
Inventor
龍雄 早川
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通株式会社 filed Critical 富士通株式会社
Priority to JP2014546769A priority Critical patent/JP6187474B2/ja
Priority to PCT/JP2012/079498 priority patent/WO2014076777A1/ja
Priority to EP12888222.2A priority patent/EP2922018A4/en
Publication of WO2014076777A1 publication Critical patent/WO2014076777A1/ja
Priority to US14/691,958 priority patent/US20150227714A1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Definitions

  • the present invention relates to a medical information analysis program, a medical information analysis apparatus, and a medical information analysis method for analyzing medical information.
  • an object of the present invention is to provide a medical information analysis program, a medical information analysis device, and a medical information analysis method that can extract information that is useful for medical treatment of a patient from a medical record.
  • the computer refers to the medical records of multiple patients, identifies a second patient whose medical record is similar to the first patient, and extracts information from the medical record of the second patient
  • a medical information analysis program for causing a computer to execute is provided.
  • FIG. 1 is a diagram illustrating a functional configuration example of the medical information analysis apparatus according to the first embodiment.
  • the medical information analysis apparatus S includes a storage unit 1, a specifying unit 2, and an extraction unit 4.
  • the medical information analysis apparatus S is a computer that analyzes medical information by executing a medical information analysis program.
  • the storage unit 1 stores medical records 1a, 1b, 1c,... Medical records 1a, 1b, 1c,... Are created for each patient.
  • the medical records 1a, 1b, 1c,... include record information indicating the contents of medical care and nursing for each patient.
  • the specifying means 2 refers to the medical records of a plurality of patients, and specifies a second patient whose medical records are similar to the first patient.
  • the specifying unit 2 includes a plurality of pieces of record information 1a-1, 1a-2, 1a-3,... Included in the first patient's medical record 1a and other patient's medical records 1b, 1c,. .. Similarity with each of the plurality of pieces of recording information 1b-1, 1b-2, 1b-3,.
  • the specifying means 2 totals the similarity between recorded information for every other patient. The summed similarity will represent the similarity of other patients to the first patient.
  • the specifying means 2 has a predetermined number of higher ranks from the one with the highest similarity to each of the plurality of pieces of record information 1a-1, 1a-2, 1a-3,... Included in the medical record 1a of the first patient.
  • the record information of other patients may be extracted, and the similarities of the extracted record information may be totaled for each other patient.
  • the extraction means 4 extracts information from the medical record 1b of the second patient. For example, the extraction unit 4 extracts words that do not appear in the medical record 1a of the first patient from words appearing in the medical record 1b of the second patient.
  • the analysis of medical information is started in response to an analysis instruction specifying the first patient from the user.
  • the specifying unit 2 calculates the similarity between the medical record 1a of the first patient and the medical records 1b, 1c,. For example, 1a-1, 1a-2, 1a-3,... Included in the medical record 1a of the first patient and a plurality of recorded information included in the medical records 1b, 1c,. Similarities with 1b-1, 1b-2, 1b-3,... Are calculated.
  • the similarity between recorded information is totaled for every other patient. And one or more other patients from the one where the total value of the similarities is larger are specified as the second patient.
  • the second patient is specified, for example, information indicating the specified patient (similar patient information 3) is transmitted from the specifying unit 2 to the extracting unit 4.
  • patient “B” is identified as the second patient.
  • the extraction means 4 extracts a word that serves as a reference for the medical treatment of the first patient from the medical record 1b of the second patient. For example, words (word array 5) that do not appear in the medical record 1a of the first patient are extracted from words (word array 6) that appear in the medical record 1b of the second patient.
  • the extracted word is output from the extraction means 4 as, for example, a word (reference word 7) that serves as a reference for medical treatment of the first patient.
  • the second patient specified by the specifying means 2 is not limited to one patient.
  • the specifying unit 2 calculates the similarity between the medical record of the first patient and the medical record of the other patient, and sets a predetermined number of other patients as the second patient from the higher similarity. be able to.
  • the specifying means 2 can also perform weighting according to the type of recorded information when calculating the similarity between the recorded information. For example, the specifying unit 2 multiplies the calculation result of the similarity based on the contents of the two pieces of recording information to be calculated by the weights of the two pieces of recording information, and uses the multiplication result as the similarity between the two pieces of recording information. To do. As a result, it is possible to attach a weight according to the type to the recorded information and extract an appropriate word. For example, by setting the weight of the medical record recorded by the doctor to be heavier than the medical record recorded by the nurse, another patient whose medical content is similar to the content of nursing may be given priority as the second patient. it can.
  • the patient's medical record can include physical information indicating the physical characteristics of the patient.
  • the patient's medical record can include physical information indicating the physical characteristics of the patient.
  • the specifying unit 2 and the extracting unit 4 can be realized by, for example, a processor included in the medical information analysis apparatus S.
  • the storage unit 1 can be realized by, for example, a RAM (Random Access Memory) included in the medical information analysis apparatus S.
  • the second embodiment is an electronic medical record management system that allows a plurality of doctors to share knowledge accumulated in an electronic medical record via a network in a hospital.
  • FIG. 2 is a diagram illustrating a system configuration example according to the second embodiment.
  • a server 100 and a plurality of terminal devices 21 to 23 are connected via a network 10.
  • the terminal devices 21 to 23 are used by the doctors 31 and 32 and the nurse 33 for inputting information related to the medical treatment of the patient.
  • Information input to the terminal devices 21 to 23 is transmitted to the server 100 via the network 10 and recorded by the server 100.
  • a set of recorded information for each patient becomes an electronic medical record of the patient.
  • the recorded information is information recorded every time an action such as treatment or nursing is performed.
  • the server 100 is a computer that manages electronic medical records. Then, the server 100 can analyze the stored electronic medical record in response to a recommendation request from the terminal devices 21 to 23 and output a recommendation result.
  • a patient (target patient) to be recommended is specified.
  • the server 100 detects a keyword that is not described in the electronic medical record of the target patient but is described in the electronic medical record of another patient (similar patient) whose medical condition or treatment history is similar to that of the target patient. Output keywords as recommendation results.
  • FIG. 3 is a diagram illustrating a configuration example of server hardware used in the present embodiment.
  • the server 100 is entirely controlled by a processor 101.
  • a RAM 102 and a plurality of peripheral devices are connected to the processor 101 via a bus 109.
  • the processor 101 may be a multiprocessor.
  • the processor 101 is, for example, a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or a DSP (Digital Signal Processor). At least a part of the functions of the processor 101 may be realized by an electronic circuit such as ASIC (Application Specific Integrated Circuit) or PLD (Programmable Logic Device).
  • ASIC Application Specific Integrated Circuit
  • PLD Programmable Logic Device
  • the RAM 102 is used as a main storage device of the server 100.
  • the RAM 102 temporarily stores at least part of an OS (Operating System) program and application programs to be executed by the processor 101.
  • the RAM 102 stores various data necessary for processing by the processor 101.
  • Peripheral devices connected to the bus 109 include an HDD (Hard Disk Drive) 103, a graphic processing device 104, an input interface 105, an optical drive device 106, a device connection interface 107, and a network interface 108.
  • HDD Hard Disk Drive
  • the HDD 103 magnetically writes and reads data to and from the built-in disk.
  • the HDD 103 is used as an auxiliary storage device of the server 100.
  • the HDD 103 stores an OS program, application programs, and various data.
  • a semiconductor storage device such as a flash memory can also be used as the auxiliary storage device.
  • a monitor 11 is connected to the graphic processing device 104.
  • the graphic processing device 104 displays an image on the screen of the monitor 11 in accordance with a command from the processor 101.
  • Examples of the monitor 11 include a display device using a CRT (Cathode Ray Tube) and a liquid crystal display device.
  • a keyboard 12 and a mouse 13 are connected to the input interface 105.
  • the input interface 105 transmits a signal transmitted from the keyboard 12 or the mouse 13 to the processor 101.
  • the mouse 13 is an example of a pointing device, and other pointing devices can also be used. Examples of other pointing devices include a touch panel, a tablet, a touch pad, and a trackball.
  • the optical drive device 106 reads data recorded on the optical disk 14 using a laser beam or the like.
  • the optical disk 14 is a portable recording medium on which data is recorded so that it can be read by reflection of light.
  • the optical disk 14 includes a DVD (Digital Versatile Disc), a DVD-RAM, a CD-ROM (Compact Disc Read Only Memory), a CD-R (Recordable) / RW (ReWritable), and the like.
  • the device connection interface 107 is a communication interface for connecting peripheral devices to the server 100.
  • the memory device 15 and the memory reader / writer 16 can be connected to the device connection interface 107.
  • the memory device 15 is a recording medium equipped with a communication function with the device connection interface 107.
  • the memory reader / writer 16 is a device that writes data to the memory card 17 or reads data from the memory card 17.
  • the memory card 17 is a card type recording medium.
  • the network interface 108 is connected to the network 10.
  • the network interface 108 transmits / receives data to / from other computers or communication devices via the network 10.
  • the medical information analysis apparatus shown in the first embodiment can also be realized by the same hardware as the server 100 shown in FIG.
  • the server 100 implements the processing functions of the second embodiment by executing a program recorded on a computer-readable recording medium, for example.
  • the program describing the processing contents to be executed by the server 100 can be recorded on various recording media.
  • a program to be executed by the server 100 can be stored in the HDD 103.
  • the processor 101 loads at least a part of the program in the HDD 103 into the RAM 102 and executes the program.
  • a program to be executed by the server 100 can also be recorded on a portable recording medium such as the optical disc 14, the memory device 15, and the memory card 17.
  • the program stored in the portable recording medium becomes executable after being installed in the HDD 103 under the control of the processor 101, for example.
  • the processor 101 can also read and execute a program directly from a portable recording medium.
  • FIG. 4 is a block diagram showing the recommendation function of the server.
  • the server 100 includes, as data storage units, an electronic medical record storage unit 110, a registration exclusion dictionary storage unit 120, a target patient record word storage unit 130, a similar record word storage unit 140, a similar patient information storage unit 150, and a similar patient record.
  • An internal word storage unit 160 is included.
  • the server 100 also includes a word extraction unit 171, a similar patient determination unit 172, and a reference word extraction unit 173 as data calculation units. These arithmetic units are realized, for example, when the processor 101 of the server 100 executes a program stored in the RAM 102 or the HDD 103.
  • the electronic medical record storage unit 110 stores recording information input by the doctors 31 and 32, the nurse 33, and the like.
  • the registration exclusion dictionary storage unit 120 stores words / phrases to be removed from the extraction target in the word extraction process from the electronic medical record.
  • the target patient record word storage unit 130 stores words extracted from the record information of a patient (target patient) to be recommended.
  • the similar recorded word storage unit 140 stores words extracted from recorded information similar to the recorded information of the target patient.
  • the similar patient information storage unit 150 stores information on other patients (similar patients) whose electronic medical records are similar to the target patient.
  • the similar patient record word storage unit 160 stores words in the record information of similar patients.
  • the word extraction unit 171 When the word extraction unit 171 receives the recommendation request designating the target patient, the word extraction unit 171 acquires the record information included in the electronic medical record of the target patient from the electronic medical record storage unit 110. And the word extraction part 171 extracts a word from the acquired recording information. For example, the word extraction unit 171 performs morphological analysis and divides the recorded information into a plurality of words. Next, the word extraction unit 171 refers to the registration exclusion dictionary storage unit 120 and deletes words included in the registration exclusion dictionary from the words obtained by morphological analysis. Note that the word extraction unit 171 may refer to a medical term dictionary, for example, and delete words that are not listed in the medical term dictionary. The word extraction unit 171 stores the words left after the word deletion process in the target patient record word storage unit 130.
  • the word extraction unit 171 extracts words from record information similar to any of the record information of the target patient among the record information of patients other than the target patient. For example, the word extraction unit 171 performs morphological analysis on other patient's recorded information and divides it into a plurality of words. Next, the word extraction unit 171 refers to the registration exclusion dictionary storage unit 120 and deletes words included in the registration exclusion dictionary from the words obtained by morphological analysis. Then, the word extraction unit 171 stores the words remaining after the word deletion process in the similar record word storage unit 140.
  • the similar patient determination unit 172 ranks other patients based on the similarity between recorded information of the target patient and other patients.
  • the similar patient determination unit 172 stores information on a predetermined number of patients (similar patients) ranked higher in the similar patient information storage unit 150.
  • the similar patient determination unit 172 stores the word extracted from the record information of the similar patient in the similar patient record word storage unit 160.
  • the reference word extraction unit 173 extracts a word that is not included in the record information of the target patient among words extracted from the record information of the similar patient as a reference word for medical treatment of the target patient. And the reference word extraction part 173 transmits the extracted word to the terminal device which output the recommendation request
  • the lines connecting the elements shown in FIG. 4 indicate a part of the communication path, and communication paths other than the illustrated communication paths can be set.
  • the similar patient determination unit 172 is an example of the specifying unit 2 according to the first embodiment shown in FIG.
  • the reference word extraction unit 173 is an example of the extraction unit 4 according to the first embodiment shown in FIG.
  • the electronic medical record storage unit 110 and the registration exclusion dictionary storage unit 120 are registered by the administrator before executing the recommendation process.
  • FIG. 5 is a diagram showing an example of the data structure of the electronic medical chart storage unit.
  • the electronic medical record storage unit 110 stores electronic medical records 111, 112, 113,... For each patient.
  • the electronic medical record 111 includes recorded information 111a, 111b, 111c, 111d,.
  • the other electronic medical records 112, 113,... Include recording information as in the electronic medical record 111.
  • Each of the record information 111a, 111b, 111c, 111d,... Includes a patient ID, a record number, a type, a record date, and a record content.
  • the patient ID is an identifier that uniquely indicates a patient.
  • the recording number is an identifier that uniquely identifies recording information within the server 100.
  • the type indicates the type of recorded information. Types include, for example, “physical record”, “doctor record”, “nursing record”, and the like.
  • the recording information can be set to have a weight for each type. For example, the weight of the doctor record is set higher than the weight of the nursing record. The weight value is multiplied by, for example, the calculation result of the similarity between recorded information. Thereby, the similarity between doctor records can be evaluated higher than the similarity between nursing records.
  • the recording date is a date when recording information is registered.
  • the weight for each type can be set in advance by the system administrator, for example.
  • the user can arbitrarily specify the weight.
  • the record information 111a of the type “physical record” is the name and physical information of the patient.
  • the physical information includes information representing physical characteristics such as sex, age, weight, and height. Note that the latest information is set as information that may change over time, such as age, weight, and height.
  • the record information 111b of the type “doctor record” records the medical treatment contents of the doctor.
  • the recorded contents of the record information 111b are filled with the patient's symptoms and the name of the medicine taken.
  • the record information of the type “nursing record” is not illustrated in FIG. 5, for example, the state of the patient in the nursing process is entered in the record content of the record information of the type “nursing record”.
  • FIG. 6 is a diagram illustrating an example of a data structure of the registration exclusion dictionary storage unit.
  • the registration exclusion dictionary storage unit 120 stores a registration exclusion dictionary 121.
  • words that are not extracted from the recorded information are registered.
  • phrases such as “is” and “mas” are registered.
  • FIG. 7 is a flowchart illustrating an example of the procedure of the recommendation process. The recommendation process is executed when a recommendation request designating a target patient is input from any terminal device.
  • the word extraction unit 171 performs record analysis processing of the target patient.
  • the word extracted from the record information included in the electronic medical record of the target patient is stored in the word storage unit 130 in the target patient record. Details of the target patient record analysis process will be described later (see FIG. 8).
  • Step S102 The word extraction unit 171 performs a record analysis process for patients other than the target patient (other patients). As a result of this processing, the words extracted from the record information having contents similar to the record information in the electronic medical record of the target patient among the recorded information included in the electronic medical records of other patients are stored in the similar record word storage unit 140. Is done. Details of the other patient record analysis process will be described later (see FIG. 10).
  • the similar patient determination unit 172 performs a determination process for other patients (similar patients) similar to the target patient.
  • the similar patient information storage unit 150 stores the patient IDs of a predetermined number of patients with high similarity.
  • the word extracted from the recorded information in the electronic medical record of the similar patient is stored in the similar patient record word storage unit 160. Details of the similar patient determination processing will be described later (see FIG. 13).
  • the reference word extraction unit 173 performs a process of extracting a word (reference word) that serves as a reference for medical treatment of the target patient.
  • the extracted reference word is transmitted to the terminal device that has output the recommendation request. Then, the reference word is displayed on the monitor of the terminal device. Details of the reference word extraction process will be described later (see FIG. 15).
  • FIG. 8 is a flowchart illustrating an example of the procedure of the target patient record analysis process.
  • the target patient record analysis process is executed when a recommendation request is input.
  • the word extraction unit 171 acquires one piece of unselected recording information in the electronic medical record of the target patient from the electronic medical record storage unit 110.
  • the word extraction unit 171 may narrow down the recorded information in the electronic medical record of the subject patient in advance using SQL (Structured Query Query Language). In that case, the word extraction unit 171 obtains the record information that has been narrowed down in advance.
  • Step S112 The word extraction unit 171 determines whether or not the record information has been acquired in Step S111. If there is unacquired recording information in the electronic medical record of the subject patient, the recording information can be acquired in step S111. On the other hand, if all the record information in the electronic medical record of the target patient has been acquired, the record information cannot be acquired in step S111. If the record information has been acquired, the process proceeds to step S113. If the record information cannot be acquired, the target patient record analysis process ends.
  • the word extraction unit 171 performs morphological analysis on the acquired recording information from the top. For example, the word extraction unit 171 performs a morphological analysis of a character string indicating the detailed contents in the recorded information, cuts out words sequentially from the beginning of the character string, and acquires the words. Note that the word extraction unit 171 may unify characters that can be expressed in both full-width and half-width in the recorded information into one character before performing the morphological analysis. For example, prior to the morphological analysis, the word extraction unit 171 performs conversion from a half-width katakana to a full-width katakana and a full-width alphabet to a half-width alphabet.
  • the word extraction unit 171 may delete full-width numerals, half-width numerals, and symbols from the recorded information. This is because numbers and symbols are likely to cause errors in similarity calculation.
  • the record information of the type “physical record” includes a lot of information that has significant meaning in numbers and symbols. Therefore, the word extraction unit 171 does not delete numbers and symbols for the record information of “physical record”, for example.
  • the word extraction unit 171 determines whether a new word has been acquired by morphological analysis. For example, when the morphological analysis has been completed to the end of the recorded information and the processing such as the part-of-speech check for all the words has been completed, a new word cannot be acquired. If there is a word that has not been processed such as part-of-speech check, the word can be acquired. If the word can be acquired, the process proceeds to step S115. If the word cannot be acquired, the process proceeds to step S120.
  • the word extraction unit 171 checks the part of speech of the acquired word.
  • the word extraction unit 171 determines whether or not the part of speech of the acquired word is a part of speech to be registered.
  • the part of speech to be registered is set in the word extraction unit 171 in advance.
  • the part of speech to be registered is, for example, “noun”, “verb”, “adjective”, “adjective verb”. “Particles” and “adverbs” are excluded from registration because they tend to cause errors in similarity calculation. If the acquired word part of speech is the part of speech to be registered, the process proceeds to step S117. If the acquired part of speech is not the part of speech to be registered, the process proceeds to step S113.
  • the word extraction unit 171 checks whether or not the acquired word is included in the registration exclusion dictionary 121 stored in the registration exclusion dictionary storage unit 120. Note that, for example, when nouns follow a noun, the word extraction unit 171 may recognize the combined noun as another one word. For example, when “depressurization” follows “external”, three words “external”, “decompressed”, and “external depressurized” are to be checked. Furthermore, the word extraction unit 171 may delete “-” when the number of characters of the word is 4 or more and “ ⁇ ” (long note) exists at the end of the word. For example, “server” becomes “server”, and “user” becomes “user”.
  • Step S118 The word extraction unit 171 determines whether or not the acquired word is a registration exclusion target. For example, if the acquired word is included in the registration exclusion dictionary 121, the word extraction unit 171 recognizes that the word is a registration exclusion target. If it is a registration exclusion target, the process proceeds to step S113. If it is not a registration exclusion target, the process proceeds to step S119.
  • Step S119 The word extraction unit 171 adds the word acquired in Step S113 to the word array of the recording information acquired in Step S111. Thereafter, the process proceeds to step S113.
  • Step S120 If the word cannot be acquired in Step S113, the word extraction unit 171 determines that the analysis of the acquired recording information is completed, and corresponds the word sequence of the recording information acquired in Step S111 to the recording information. In addition, it is stored in the word storage unit 130 in the target patient record. Thereafter, the process proceeds to step S111.
  • FIG. 9 is a diagram illustrating an example of a data structure of the word storage unit in the target patient record.
  • the target patient record word storage unit 130 stores a word sequence table 131.
  • the word arrangement table 131 is a data table in which words extracted from the record information of the target patient are registered for each record information.
  • the word sequence table 131 includes columns for patient ID, record number, type, and word sequence.
  • the patient ID of the target patient is set in the patient ID column.
  • the record number column the record number of the record information included in the electronic medical record of the target patient is set.
  • the type column the type of the corresponding recording information is set.
  • words extracted from the corresponding record information are listed.
  • FIG. 10 is a flowchart illustrating an example of a procedure for recording analysis processing of another patient.
  • the other patient record analysis process is executed after the target patient record analysis process is completed.
  • the word extraction unit 171 acquires one piece of unselected record information in the electronic medical record of a patient other than the target patient (other patient) from the electronic medical record storage unit 110. Note that the word extraction unit 171 may narrow down the recorded information in the electronic medical records of other patients in advance using SQL.
  • Step S132 The word extraction unit 171 determines whether or not the record information has been acquired in Step S131. If there is unacquired record information in the electronic medical record of at least one other patient, the record information can be acquired in step S131. On the other hand, if all the recording information in the electronic medical records of all other patients has been acquired, the recording information cannot be acquired in step S131. If the record information has been acquired, the process proceeds to step S133. When the record information cannot be acquired, the record analysis process for the other patient ends.
  • Step S133 The word extraction unit 171 performs morphological analysis on the acquired recording information from the top, and acquires words in order from the top. The details of this process are the same as step S113 in FIG.
  • Step S134 The word extraction unit 171 determines whether a new word has been acquired by morphological analysis. If the word has been acquired, the process proceeds to step S135. If the word cannot be acquired, the process proceeds to step S140.
  • Step S135 When the word extraction unit 171 can acquire a word, the word extraction unit 171 checks the part of speech of the acquired word.
  • Step S136 The word extraction unit 171 determines whether or not the part of speech of the acquired word is a part of speech to be registered. If the part of speech of the acquired word is the part of speech to be registered, the process proceeds to step S137. If the acquired part of speech is not the part of speech to be registered, the process proceeds to step S133.
  • Step S137 The word extraction unit 171 checks whether or not the acquired word is included in the registration exclusion dictionary 121 stored in the registration exclusion dictionary storage unit 120. The details of this process are the same as the process of step S117 in FIG.
  • Step S138 The word extraction unit 171 determines whether or not the acquired word is a registration exclusion target. If it is a registration exclusion target, the process proceeds to step S133. If it is not a registration exclusion target, the process proceeds to step S139.
  • Step S139 The word extraction unit 171 adds the word acquired in Step S133 to the word array of the recording information acquired in Step S131. Thereafter, the process proceeds to step S133.
  • Step S140 When the word cannot be acquired in Step S133, the word extraction unit 171 determines that the analysis of the acquired record information is completed, and the acquired record information and each of the plurality of record information of the target patient are determined. Similarity (0 or more and 1 or less) is calculated. For the calculation of the similarity, a word sequence extracted from each record information is used. For example, the word extraction unit 171 compares the word sequence generated in step S139 with each of the word sequences of the stored information stored in the target patient record word storage unit 130, and TF (Term (Frequency) -IDF (Inverse Document Frequency). ) To calculate the similarity.
  • TF Term (Frequency)
  • IDF Inverse Document Frequency
  • TF-IDF is a technique for calculating the importance of words in a document based on the appearance frequency (TF) of words and the inverse document frequency (IDF).
  • ID-IDF inverse document frequency
  • the word extraction unit 171 calculates, for example, the similarity between the record information of the target patient and the acquired record information of the other patient by the vector space method using the importance of the word extracted from the record information.
  • the vector space method a vector is generated using the importance of characters included in each of two pieces of recorded information to be compared, and the cosine (cos ⁇ ) of the angle ⁇ formed by the two vectors is the similarity.
  • the word extraction unit 171 can set a weight for each type of electronic medical record information. In that case, a high weight is set for important records. For example, the doctor record weight is “1.2”, the nursing record weight is “1.1”, and the other record weights are “0.9”. Also, the weight of physical information can be made larger than other recorded information. By increasing the weight of the physical information, it is possible to increase the similarity of the recorded information of other patients whose physical characteristics are similar to the target patient. The word extraction unit 171 adds the weight value corresponding to the type of each recorded information compared to the similarity calculated by the vector space method. Then, the word extracting unit 171 sets the result of integrating the weights as the final similarity.
  • Step S141 The word extraction unit 171 determines whether there is recording information of the target patient having a high degree of similarity with the acquired recording information. For example, when the word extraction unit 171 arranges the record information of other patients on the basis of the similarity between the record information of each target patient and the acquired record information falls within the top 20 Judge that the degree of similarity is high. If there is recorded information of the target patient having a high similarity, the process proceeds to step S142. If there is no record information of the target patient having a high similarity, the process proceeds to step S131.
  • a plurality of recorded information of one other patient may fall within the upper predetermined number of similarity rankings with respect to one recorded information of the target patient.
  • the word extraction unit 171 treats, for example, the record information other than the highest one among the plurality of record information of the same patient as not having high similarity.
  • the word extraction unit 171 associates the word sequence extracted from the acquired record information with one or more pieces of record information of the target patient having a high degree of similarity with the record information, and records similar recorded words. Store in the storage unit 140. In addition, by storing new record information, the number of record information of other patients associated with the record information of the target patient may exceed a predetermined number (for example, 20). In this case, the word extraction unit 171 deletes the word sequence of the record information having the lowest similarity from the record information of other patients associated with the record information of the target patient from the word storage unit 140 in the similar record. Thereafter, the process proceeds to step S131.
  • FIG. 11 is a diagram illustrating an example of the data structure of the word storage unit in the similar record.
  • the similar recorded word storage unit 140 stores word sequence tables 141, 142, 143,... For each record information of the target patient.
  • Each of the word array tables 141, 142, 143,... Is assigned a record number of record information of the subject patient.
  • the word array tables 141, 142, 143,... Have columns for patient ID, record number, type, word array, and similarity.
  • the patient ID of another patient is set in the patient ID column.
  • record numbers of record information of other patients having contents similar to the record information of the target patient are set.
  • the type of recording information is set in the type column.
  • word array column a word array extracted from the recorded information is set.
  • similarity column the similarity with the record information of the target patient is set.
  • the word sequence tables 141, 142, 143,... The word sequences of the record information of other patients similar to the record information are registered in association with the record information of the target patient.
  • sequence of several recorded information of another patient is not registered into one word arrangement
  • the word arrangement of one record information of another patient may be registered in a plurality of word arrangement tables.
  • the plurality of pieces of record information of the target patient and the record information of other patients similar to the record information are associated with each other by the word arrangement tables 141, 142, 143, ... in the similar record word storage unit 140.
  • FIG. 12 is a diagram showing a similar relationship between recorded information.
  • the record information 41, 42, 43, 44, 45,... Of the target patient is associated with the record information of a predetermined number of other patients whose similarity rank is higher.
  • the record information 41 of the target patient is associated with a predetermined number of record information 51, 52, 53, 54,... Of other patients similar to the record information.
  • the target patient record information 45 is associated with a predetermined number of other pieces of record information 61, 62, 63, 64,... Similar to the record information.
  • the word sequence is extracted from the record information of 20000 other patients. It will be.
  • FIG. 13 is a flowchart illustrating a procedure of similar patient determination processing. This process is executed after the other patient's record analysis process is completed.
  • the similar patient determination unit 172 adds up the similarities of the record information of other patients similar to any of the record information of the target patient for each patient ID of the other patient. For example, the similar patient determination unit 172 acquires, for each patient ID of another patient, the similarity of the record in which the patient ID is set from the similar record word storage unit 140. And the similar patient determination part 172 adds up the similarity acquired for every patient ID.
  • the similar patient determination unit 172 compares the sums of similarities, and sets the upper predetermined number (for example, 20 patients) as similar patients to the target patient. For example, the similar patient determination unit 172 sorts the patient IDs of other patients according to the sum of the similarities in descending order of the total value. The similar patient determination unit 172 extracts the upper predetermined number of patient IDs as a result of sorting. Then, the similar patient determination unit 172 stores the extracted patient ID in the similar patient information storage unit 150.
  • the upper predetermined number for example, 20 patients
  • the similar patient determination unit 172 acquires a word array of recorded information of the similar patient. For example, the similar patient determination unit 172 extracts the record including the patient ID of the similar patient from the similar record word storage unit 140 and excludes the others. Then, the similar patient determination unit 172 stores the extracted record in the similar patient record word storage unit 160.
  • FIG. 14 is a diagram illustrating an example of a data structure of the similar patient information storage unit.
  • a similar patient list 151 is stored in the similar patient information storage unit 150.
  • the similar patient list 151 is a list of patients with a higher ranking of similarity. In the example of FIG. 14, the ranking of patients, the patient ID, and the similarity are set in the similar patient list 151.
  • FIG. 15 is a diagram illustrating an example of the data structure of the word storage unit in the similar patient record.
  • the similar patient record word storage unit 160 stores word sequence tables 161, 162, 163,... For each record information of the target patient.
  • the data structure of the word arrangement tables 161, 162, 163,... Is the same as that of the word arrangement tables 141, 142, 143,... In the similar recorded word storage unit 140 shown in FIG. However, in the word array tables 161, 162, 163,... In the similar patient record word storage unit 160, only records in which the patient IDs of similar patients are set are registered.
  • the word sequence table 141 in the similar record word storage unit 140 shown in FIG. 11 includes a record of the patient with the patient ID “Z”.
  • the patient with the patient ID “Z” is not a similar patient. Therefore, in the word sequence table 161 in the similar patient record word storage unit 160 shown in FIG. 15, the record of the patient ID “Z” is excluded.
  • FIG. 16 is a flowchart showing the procedure of the reference word extraction process. This process is executed after the similar patient determination process ends.
  • the reference word extraction unit 173 integrates (merges) the word extracted from the record information of the target patient and the word extracted from the record information of the similar patient.
  • the reference word extraction unit 173 assigns a unique number (word ID) to each word after merging. For example, the reference word extraction unit 173 sets the word appearance order in the word array after merging as the word ID of the word. At this point, the association between the word and the recorded information is lost, and an appearance word list for each patient is generated.
  • the reference word extraction unit 173 extracts a reference word from the list of appearance words for each patient. For example, the reference word extraction unit 173 selects a reference word by applying a collaborative filtering (CF: Collaborative Filtering) technique.
  • CF Collaborative Filtering
  • collaborative filtering for example, a user's behavior is recorded, and other users having behavior similar to that of a specific user are regarded as users having similar preferences. And it is presumed that the specific user likes the same behavior as the behavior of other users with similar preferences, and there is a behavior that is not in the specific user's behavior but is close to the specific user to the specific user. Recommended.
  • “words” extracted from the recorded information as “actions” in collaborative filtering the target patient has not yet performed from the recorded information in other users of the medical content similar to the medical content of the target patient, Words that can be useful for future medical care can be extracted.
  • the reference word extraction unit 173 extracts, as reference words, words (a plurality) that are not included in the appearance word list of the target patient, from among the appearance word lists of other patients that are determined to have similar preferences by collaborative filtering.
  • the reference word extraction unit 173 outputs the extracted reference word as a recommendation result. For example, the reference word extraction unit 173 transmits a list of reference words to the terminal device that has transmitted the recommendation request.
  • FIG. 17 is a diagram illustrating an example of a recommendation.
  • the patient with the patient ID “A” is the target patient.
  • a similar patient is determined by comparing words in the recorded information between the patient with the patient ID “A” and another patient.
  • patients with patient IDs “B”, “C”, “D”, and “E” are determined to be similar patients.
  • the words in the record information of the target patient (patient ID “A”) and the words in the record information of similar patients (patient IDs “B”, “C”, “D”, “E”) are compared. And a reference word is extracted.
  • many words related to thyroiditis appear as a tendency of patients having a high degree of similarity with the patient ID “A”.
  • “Levothyroxine sodium) hydrate” tends to appear frequently.
  • the words “myasthenia gravis” and “hypofunction” do not appear. Therefore, the words “myasthenia gravis” and “hypofunction” are extracted as reference words and transmitted as recommendation results.
  • the similarity between each of the plurality of recorded information included in the medical record of the target patient and each of the plurality of recorded information included in the medical record of the other patient is calculated, and the similarity of the recorded information is calculated for each other patient. Summing up, a predetermined number of patients from the one with the highest total degree of similarity are regarded as similar patients. Thereby, the doctor in charge of the target patient can determine an appropriate medical treatment policy with reference to the medical treatment contents for many similar patients. In particular, large-scale hospitals have a large amount of electronic medical records. Therefore, it is possible to determine the treatment policy of the target patient with reference to the past medical records of various patients, thereby enabling more appropriate medical treatment.
  • the record information of the other predetermined number of other patients is extracted from the one with higher similarity, and for each other patient, The similarities of the extracted record information are totaled. As a result, the record information that is not helpful is excluded at the extraction stage. As a result, even if a patient with a medical condition similar to the target patient is receiving other treatment, even if the patient's electronic medical record contains a large amount of recorded information that is not helpful for the target patient, Similar patients can be found appropriately. For example, consider a case where the target patient is undergoing treatment for diabetes. In that case, it is expected that other diabetic patients are extracted as similar patients.
  • a diabetic patient has been receiving dermatological treatment for a long time regardless of diabetes.
  • the comparison is made for the entire electronic medical record, the appearance ratio of words related to diabetes of the diabetic patient is reduced, and the diabetic patient may not be determined as a similar patient.
  • record information related to medical treatment other than diabetes is excluded, and diabetes The patient is correctly determined to be a similar patient. That is, the accuracy of similar patient determination is improved.
  • weighting according to the type of recorded information can be performed. For example, the calculation result of the similarity based on the contents of the two pieces of recording information to be calculated can be multiplied by the weights of the two pieces of recording information, and the multiplication result can be used as the similarity between the two pieces of recording information. .
  • an appropriate recommendation can be made by setting the weight of the record information of the medical treatment by the nurse higher than the record information of the nursing by the doctor. You can receive the results of the foundation.
  • the weight of the record information including physical information can be set higher than that of other types of record information, for example.
  • the weight of physical information By setting the weight of physical information to be the highest, other patients whose physical characteristics are close to the target patient can be preferentially similar patients. If the recommendation is performed by such weighting, for example, a word useful for determining a medical treatment policy regarding a disease whose medical condition or treatment content varies depending on sex or age can be acquired as a recommendation result.

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

 ある患者の診療の参考となる情報を診療録から抽出できるようにする。 医療情報解析装置(S)は、特定手段(2)と抽出手段(4)とを有する。特定手段(2)は、複数の患者の診療録を参照し、診療録が第1の患者と類似する第2の患者を特定する。抽出手段(4)は、第2の患者の診療録から情報を抽出する。

Description

医療情報解析プログラム、医療情報解析装置、および医療情報解析方法
 本発明は、医療情報を解析する医療情報解析プログラム、医療情報解析装置、および医療情報解析方法に関する。
 情報技術の発達に伴い、コンピュータの利用範囲が拡大している。その結果、コンピュータには、膨大な量の電子データが蓄積されている。電子データの中には、文字情報を含むものが多数ある。そこで、電子データに含まれる文字情報を有効に利用するための技術が考えられている。例えば、インターネット上のQAサービスにおいて、ユーザが興味を明示したり回答したりしなくても、ユーザが一度でも質問もしくは回答したことのあるユーザであれば、ユーザの知識および興味に応じて回答を促すための質問を推薦する技術がある。また、手書きの注釈により入力された個人情報を収集し、管理し、探索し、共有する方法も考えられている。
 コンピュータによるデータの管理は、医療の世界にも浸透してきている。例えば、医療の世界では、大規模病院を中心に電子カルテが進み、診断結果などの記事が患者ごとに管理されている。そこで医療の分野においても、多数の患者に関する蓄積されたデータを、診察に有効利用することが考えられている。例えば、画像に付与された文を元に類似画像を検索するシステムにおいて、所望の画像を早く容易に検索できるシステムがある。これにより、画像について検索者が見落としていた、あるいは意識していなかったキーワードや特徴量についても自動で抽出され、医師の見落としていた関連症例についても検索可能となる。また、読影医による観察箇所の見落としを防止し、質の高い読影レポートを作成できるようにする医用診断レポートシステムがある。この医用診断レポートシステムでは、医用診断レポートの所見から読影箇所を特定する単語を読影チェック項目として抽出し、医用診断レポートの所見から抽出した読影チェック項目が含まれる文章を取得して、読影チェック項目ごとに文章を表示する。
特開2011-186854号公報 特開2005-85285号公報 特開2004-157623号公報 特開2011-100254号公報
 医療に関する情報の様々な利用方法が提案されているものの、従来の技術では、診療に関する大量のデータの活用が十分とはいえない。例えば診療対象の患者と同様の病状の他の患者の診療録(カルテ)は、診療対象患者の診療の参考になるものと考えられる。しかし、現状では、ある患者の診療の参考となる情報が、大量に存在する診療録のうちのどの診療録に含まれるのかを適切に判断することができない。その結果、大量に蓄積された診療録の中から、ある患者の参考となる情報を抽出することができない。
 1つの側面では、本発明は、ある患者の診療の参考となる情報を診療録から抽出できる医療情報解析プログラム、医療情報解析装置、および医療情報解析方法を提供することを目的とする。
 1つの案では、コンピュータに、複数の患者の診療録を参照し、診療録が第1の患者と類似する第2の患者を特定し、第2の患者の診療録から情報を抽出する、処理をコンピュータに実行させる医療情報解析プログラムが提供される。
 1態様によれば、ある患者の診療の参考となる情報を診療録から抽出できるようになる。
 本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。
第1の実施の形態に係る医療情報解析装置の機能構成例を示す図である。 第2の実施の形態のシステム構成例を示す図である。 本実施の形態に用いるサーバのハードウェアの一構成例を示す図である。 サーバのレコメンデーション機能を示すブロック図である。 電子カルテ記憶部のデータ構造の一例を示す図である。 登録排除辞書記憶部のデータ構造の一例を示す図である。 レコメンデーション処理の手順の一例を示すフローチャートである。 対象患者記録解析処理の手順の一例を示すフローチャートである。 対象患者記録内単語記憶部のデータ構造の一例を示す図である。 他の患者の記録解析処理の手順の一例を示すフローチャートである。 類似記録内単語記憶部のデータ構造の一例を示す図である。 記録情報間の類似関係を示す図である。 類似患者判定処理の手順を示すフローチャートである。 類似患者情報記憶部のデータ構造の一例を示す図である。 類似患者記録内単語記憶部のデータ構造の一例を示す図である。 参考単語抽出処理の手順を示すフローチャートである。 レコメンデーションの一例を示す図である。
 以下、本実施の形態について図面を参照して説明する。なお各実施の形態は、矛盾のない範囲で複数の実施の形態を組み合わせて実施することができる。
 〔第1の実施の形態〕
 図1は、第1の実施の形態に係る医療情報解析装置の機能構成例を示す図である。医療情報解析装置Sは、記憶手段1、特定手段2、および抽出手段4を有する。例えば医療情報解析装置Sは、医療情報解析プログラムを実行することで医療情報を解析するコンピュータである。
 記憶手段1は、複数の患者の診療録(カルテ)1a,1b,1c,・・・を記憶する。診療録1a,1b,1c,・・・は、患者ごとに作成されている。診療録1a,1b,1c,・・・には、各患者の診療や看護の内容を示す記録情報が含まれている。
 特定手段2は、複数の患者の診療録を参照し、診療録が第1の患者と類似する第2の患者を特定する。例えば特定手段2は、第1の患者の診療録1aに含まれる複数の記録情報1a-1,1a-2,1a-3,・・・それぞれと、他の患者の診療録1b,1c,・・・に含まれる複数の記録情報1b-1,1b-2,1b-3,・・・それぞれとの類似度を計算する。そして特定手段2は、他の患者ごとに記録情報間の類似度を合計する。合計された類似度が、第1の患者に対する他の患者の類似の度合いを表すこととなる。また特定手段2は、第1の患者の診療録1aに含まれる複数の記録情報1a-1,1a-2,1a-3,・・・それぞれに対し、類似度が高い方から上位所定数の他の患者の記録情報を抽出し、他の患者ごとに、抽出された記録情報の類似度を合計してもよい。
 抽出手段4は、第2の患者の診療録1bから情報を抽出する。例えば抽出手段4は、第2の患者の診療録1bに出現する単語のうち、第1の患者の診療録1aに出現しない単語を抽出する。
 このような医療情報解析装置Sでは、例えばユーザから、第1の患者を指定した解析指示に応じて、医療情報の解析が開始される。医療情報の解析では、まず特定手段2により、第1の患者の診療録1aと、他の患者の診療録1b,1c,・・・との類似度が計算される。例えば第1の患者の診療録1aに含まれる1a-1,1a-2,1a-3,・・・それぞれと、他の患者の診療録1b,1c,・・・に含まれる複数の記録情報1b-1,1b-2,1b-3,・・・それぞれとの類似度が計算される。さらに、他の患者ごとに記録情報間の類似度が合計される。そして類似度の合計値が大きい方から1以上の他の患者が、第2の患者として特定される。第2の患者が特定されると、例えば特定した患者を示す情報(類似患者情報3)が、特定手段2から抽出手段4に送信される。図1の例では、患者「B」が第2の患者として特定されている。
 次に抽出手段4により、第2の患者の診療録1bから、第1の患者の診療の参考となる単語が抽出される。例えば、第2の患者の診療録1bに出現する単語(単語配列6)のうち、第1の患者の診療録1aに出現しない単語(単語配列5)が抽出される。抽出された単語は、例えば、第1の患者の診療の参考になる単語(参考単語7)として、抽出手段4から出力される。
 このようにして、第1の患者と診療記録が類似する第2の患者の診療録から、第1の患者の診療の参考となる情報を抽出することができ、医療情報の有効活用が促進される。その結果、診療品質を向上させることができる。
 なお特定手段2が特定する第2の患者は、一人の患者には限定されない。例えば特定手段2は、第1の患者の診療録と他の患者の診療録との間の類似度を計算し、類似度が高い方から所定数の他の患者を、第2の患者とすることができる。
 さらに特定手段2は、記録情報間の類似度の計算の際に、記録情報の種類に応じて重み付けを行うこともできる。例えば特定手段2は、類似度計算対象の2つの記録情報の内容に基づく類似度の計算結果に、2つの記録情報それぞれの重みを乗算し、乗算結果を該2つの記録情報間の類似度とする。これにより、記録情報に対して、種類に応じた軽重を付け、適切な単語が抽出されるようにすることができる。例えば、医師が記録した診療記録の重みを、看護師が記録した診療記録より重くすることで、看護内容よりも診療内容が類似する他の患者を、優先して第2の患者とすることができる。
 また、患者の診療録には、患者の身体的特徴を示す身体情報を含めることもできる。身体情報を用いて診療録の類似性を判断することにより、第1の患者と身体情報が似た他の患者を、第2の患者とすることができる。その結果、患者の身体情報の違いにより、診療方法などが大きく異なるような病気の診療に有用な単語を抽出することができる。
 なお、特定手段2と抽出手段4とは、例えば医療情報解析装置Sが有するプロセッサにより実現することができる。また、記憶手段1は、例えば医療情報解析装置Sが有するRAM(Random Access Memory)により実現することができる。
 〔第2の実施の形態〕
 次に第2の実施の形態につて説明する。第2の実施の形態は、病院内のネットワークを介して、電子カルテに蓄積された知識を複数の医者が共有できるようにした電子カルテ管理システムである。
 図2は、第2の実施の形態のシステム構成例を示す図である。電子カルテ管理システムでは、ネットワーク10を介して、サーバ100と複数の端末装置21~23とが接続されている。端末装置21~23は、医師31,32や看護師33が、患者の診療に関する情報の入力に使用する。端末装置21~23に入力された情報は、ネットワーク10を介してサーバ100に送信され、サーバ100で記録される。患者ごとの記録情報の集合が、患者の電子カルテとなる。記録情報は、治療や看護などの行為が行われるごとに記録される情報である。
 サーバ100は、電子カルテを管理するコンピュータである。そしてサーバ100は、端末装置21~23からのレコメンデーション要求に応じて、蓄積された電子カルテを解析し、レコメンデーション結果を出力することができる。レコメンデーション要求には、レコメンデーションの対象となる患者(対象患者)が指定されている。例えば、サーバ100は、対象患者の電子カルテには記載されていないが、対象患者と似た病状や治療履歴の他の患者(類似患者)の電子カルテに記載されているキーワードを検出し、そのキーワードをレコメンデーション結果として出力する。
 図3は、本実施の形態に用いるサーバのハードウェアの一構成例を示す図である。サーバ100は、プロセッサ101によって装置全体が制御されている。プロセッサ101には、バス109を介してRAM102と複数の周辺機器が接続されている。プロセッサ101は、マルチプロセッサであってもよい。プロセッサ101は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)、またはDSP(Digital Signal Processor)である。プロセッサ101の機能の少なくとも一部を、ASIC(Application Specific Integrated Circuit)、またはPLD(Programmable Logic Device)などの電子回路で実現してもよい。
 RAM102は、サーバ100の主記憶装置として使用される。RAM102には、プロセッサ101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、プロセッサ101による処理に必要な各種データが格納される。
 バス109に接続されている周辺機器としては、HDD(Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、光学ドライブ装置106、機器接続インタフェース107およびネットワークインタフェース108がある。
 HDD103は、内蔵したディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。HDD103は、サーバ100の補助記憶装置として使用される。HDD103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。なお、補助記憶装置としては、フラッシュメモリなどの半導体記憶装置を使用することもできる。
 グラフィック処理装置104には、モニタ11が接続されている。グラフィック処理装置104は、プロセッサ101からの命令に従って、画像をモニタ11の画面に表示させる。モニタ11としては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置などがある。
 入力インタフェース105には、キーボード12とマウス13とが接続されている。入力インタフェース105は、キーボード12やマウス13から送られてくる信号をプロセッサ101に送信する。なお、マウス13は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。
 光学ドライブ装置106は、レーザ光などを利用して、光ディスク14に記録されたデータの読み取りを行う。光ディスク14は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク14には、DVD(Digital Versatile Disc)、DVD-RAM、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)などがある。
 機器接続インタフェース107は、サーバ100に周辺機器を接続するための通信インタフェースである。例えば機器接続インタフェース107には、メモリ装置15やメモリリーダライタ16を接続することができる。メモリ装置15は、機器接続インタフェース107との通信機能を搭載した記録媒体である。メモリリーダライタ16は、メモリカード17へのデータの書き込み、またはメモリカード17からのデータの読み出しを行う装置である。メモリカード17は、カード型の記録媒体である。
 ネットワークインタフェース108は、ネットワーク10に接続されている。ネットワークインタフェース108は、ネットワーク10を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。
 以上のようなハードウェア構成によって、第2の実施の形態の処理機能を実現することができる。なお、第1の実施の形態に示した医療情報解析装置も、図3に示したサーバ100と同様のハードウェアにより実現することができる。
 サーバ100は、例えばコンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第2の実施の形態の処理機能を実現する。サーバ100に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、サーバ100に実行させるプログラムをHDD103に格納しておくことができる。プロセッサ101は、HDD103内のプログラムの少なくとも一部をRAM102にロードし、プログラムを実行する。またサーバ100に実行させるプログラムを、光ディスク14、メモリ装置15、メモリカード17などの可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ101からの制御により、HDD103にインストールされた後、実行可能となる。またプロセッサ101が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。
 図4は、サーバのレコメンデーション機能を示すブロック図である。サーバ100は、データ記憶部として、電子カルテ記憶部110、登録排除辞書記憶部120、対象患者記録内単語記憶部130、類似記録内単語記憶部140、類似患者情報記憶部150、および類似患者記録内単語記憶部160を有している。例えば、サーバ100のRAM102やHDD103の記憶領域の一部が、各データ記憶部として使用される。またサーバ100は、データの演算部として、単語抽出部171、類似患者判定部172、および参考単語抽出部173を有する。これらの演算部は、例えばサーバ100のプロセッサ101がRAM102またはHDD103に格納されたプログラムを実行することで実現される。
 電子カルテ記憶部110は、医師31,32や看護師33などが入力した記録情報を、記憶する。登録排除辞書記憶部120には、電子カルテからの単語抽出処理において、抽出対象から解除する語句を記憶する。対象患者記録内単語記憶部130は、レコメンデーションの対象となる患者(対象患者)の記録情報から抽出された単語を記憶する。類似記録内単語記憶部140は、対象患者の記録情報に類似する記録情報から抽出された単語を記憶する。類似患者情報記憶部150は、対象患者との間で電子カルテの内容が類似する他の患者(類似患者)の情報を記憶する。類似患者記録内単語記憶部160は、類似患者の記録情報内の単語を記憶する。
 単語抽出部171は、対象患者を指定したレコメンデーション要求を受け取ると、電子カルテ記憶部110から、対象患者の電子カルテに含まれる記録情報を取得する。そして単語抽出部171は、取得した記録情報から、単語を抽出する。例えば単語抽出部171は、形態素解析を行い、記録情報を複数の単語に分割する。次に単語抽出部171は、登録排除辞書記憶部120を参照し、形態素解析で得られた単語のうち、登録排除辞書に含まれる単語を削除する。なお、単語抽出部171は、例えば医学用語辞典を参照し、医学用語辞典に掲載されていない単語を削除するようにしてもよい。単語抽出部171は、単語の削除処理を行った後に残された単語を、対象患者記録内単語記憶部130に格納する。
 また単語抽出部171は、対象患者以外の患者の記録情報のうち、対象患者の記録情報のいずれかに類似する記録情報から単語を抽出する。例えば単語抽出部171は、他の患者の記録情報を形態素解析し、複数の単語に分割する。次に単語抽出部171は、登録排除辞書記憶部120を参照し、形態素解析で得られた単語のうち、登録排除辞書に含まれる単語を削除する。そして、単語抽出部171は、単語の削除処理を行った後に残された単語を、類似記録内単語記憶部140に格納する。
 類似患者判定部172は、対象患者と他の患者との記録情報間の類似度に基づいて、他の患者の順位付けを行う。類似患者判定部172は、順位が上位となった所定数の患者(類似患者)の情報を、類似患者情報記憶部150に格納する。また類似患者判定部172は、類似患者の記録情報から抽出された単語を、類似患者記録内単語記憶部160に格納する。
 参考単語抽出部173は、類似患者の記録情報から抽出された単語のうち、対象患者の記録情報に含まれない単語を、対象患者の診療の参考になる単語として抽出する。そして参考単語抽出部173は、抽出した単語を、レコメンデーション結果として、レコメンデーション要求を出力した端末装置に送信する。端末装置では、レコメンデーション結果が表示される。
 図4に示した各要素間を接続する線は通信経路の一部を示すものであり、図示した通信経路以外の通信経路も設定可能である。また類似患者判定部172は、図1に示す第1の実施の形態の特定手段2の一例である。さらに参考単語抽出部173は、図1に示す第1の実施の形態の抽出手段4の一例である。
 サーバ100内の各データ記憶部のうち、レコメンデーション処理を実行する前に、管理者によってデータが登録されているのは、電子カルテ記憶部110と登録排除辞書記憶部120である。
 図5は、電子カルテ記憶部のデータ構造の一例を示す図である。電子カルテ記憶部110には、患者ごとの電子カルテ111,112,113,・・・が格納されている。電子カルテ111には、記録情報111a,111b,111c,111d,・・・が含まれている。他の電子カルテ112,113,・・・にも、電子カルテ111と同様に記録情報が含まれる。
 記録情報111a,111b,111c,111d,・・・それぞれには、患者ID、記録番号、種類、記録日、および記録内容が含まれている。患者IDは、患者を一意に示す識別子である。記録番号は、サーバ100内で記録情報を一意に識別する識別子である。種類は、記録情報の種類を示している。種類には、例えば「身体記録」、「医師記録」、「看護記録」などがある。なお記録情報は、種類ごとに重みを設定することができる。例えば、医師記録の重みは、看護記録の重みよりも高く設定される。重みの値は、例えば記録情報間の類似度の計算結果に乗算される。これにより、看護記録間の類似性よりも、医師記録間の類似性を高く評価することができる。記録日は、記録情報を登録した日付である。
 なお種類ごとの重みは、例えばシステム管理者が、あらかじめ設定しておくことができる。またレコメンデーション要求において種別ごとの重みを指定することで、ユーザが任意に重みを指定することもできる。
 種類「身体記録」の記録情報111aは、患者の名前や身体情報である。身体情報には、性別、年齢、体重、身長など、身体的特徴を表す情報が含まれる。なお年齢、体重、身長のように、年月の経過によって変化する可能性のある情報には、最新の情報が設定される。
 種類「医師記録」の記録情報111bは、医師の診療内容を記録したものである。例えば記録情報111bの記録内容には、患者の症状や投薬した薬の名前などが記入される。
 なお図5には、種類「看護記録」の記録情報は例示していないが、種類「看護記録」の記録情報の記録内容には、例えば看護過程での患者の様子が記入される。
 記録情報の別の種類としては、例えば臨床検査の結果を示す臨床記録や、リハビリの状況を示すリハビリ記録などがある。
 図6は、登録排除辞書記憶部のデータ構造の一例を示す図である。登録排除辞書記憶部120には、登録排除辞書121が格納されている。登録排除辞書121には、記録情報からの抽出対象外とする語句が登録されている。例えば登録排除辞書121には、「です」、「ます」といった語句が登録されている。
 サーバ100では、図5・図6に示した電子カルテ111,112,113,・・・と登録排除辞書121とを用いて、レコメンデーション処理が実行される。
 図7は、レコメンデーション処理の手順の一例を示すフローチャートである。なお、レコメンデーション処理は、いずれかの端末装置から、対象患者を指定したレコメンデーション要求が入力されたときに実行される。
 [ステップS101]単語抽出部171は、対象患者の記録解析処理を行う。この処理により、対象患者記録内単語記憶部130に、対象患者の電子カルテに含まれる記録情報から抽出された単語が格納される。対象患者の記録解析処理の詳細は後述する(図8参照)。
 [ステップS102]単語抽出部171は、対象患者以外の患者(他の患者)の記録解析処理を行う。この処理により、類似記録内単語記憶部140に、他の患者の電子カルテに含まれる記録情報のうち、対象患者の電子カルテ内の記録情報に類似する内容の記録情報から抽出された単語が格納される。他の患者の記録解析処理の詳細は後述する(図10参照)。
 [ステップS103]類似患者判定部172は、対象患者に対して類似する他の患者(類似患者)の判定処理を行う。この処理により、類似患者情報記憶部150には、類似度の高い所定数の患者の患者IDが格納される。また類似患者記録内単語記憶部160には、類似患者の電子カルテ内の記録情報から抽出された単語が格納される。類似患者判定処理の詳細は後述する(図13参照)。
 [ステップS104]参考単語抽出部173は、対象患者の診療の参考になる単語(参考単語)の抽出処理を行う。抽出された参考単語は、レコメンデーション要求を出力した端末装置に送信される。すると端末装置のモニタに、参考単語が表示される。参考単語抽出処理の詳細は後述する(図15参照)。
 このような手順でレコメンデーションが行われる。以下、図7に示した各ステップの詳細について説明する。
 図8は、対象患者記録解析処理の手順の一例を示すフローチャートである。対象患者記録解析処理は、レコメンデーション要求が入力されたときに実行される。
 [ステップS111]単語抽出部171は、電子カルテ記憶部110から、対象患者の電子カルテにおける未選択の記録情報を1つ取得する。なお、単語抽出部171は、あらかじめ対象患者の電子カルテ内の記録情報をSQL(Structured Query Language)によって絞り込んでおいてもよい。その場合、単語抽出部171は、あらかじめ絞り込まれた記録情報を順番に取得する。
 [ステップS112]単語抽出部171は、ステップS111において、記録情報が取得できたか否かを判断する。対象患者の電子カルテ内に未取得の記録情報があれば、ステップS111において記録情報を取得できる。他方、対象患者の電子カルテ内のすべての記録情報が取得済みであれば、ステップS111において記録情報を取得できない。記録情報が取得できた場合、処理がステップS113に進められる。記録情報が取得できなかった場合、対象患者記録解析処理が終了する。
 [ステップS113]単語抽出部171は、取得した記録情報を先頭から形態素解析する。例えば単語抽出部171は、記録情報内の詳細内容を示す文字列の形態素解析を行い、その文字列の先頭から順に単語を切り出し、その単語を取得する。なお単語抽出部171は、形態素解析を実施する前に、記録情報内の全角と半角との両方で表せる文字を、一方の文字に統一してもよい。例えば単語抽出部171は、形態素解析に先立って、半角カタカナの全角カタカナへの変換、全角アルファベットの半角アルファベットへの変換を行う。
 また単語抽出部171は、記録情報から全角数字、半角数字、および記号を削除してもよい。これは、数字や記号は、類似度計算時の誤差原因になりやすい為である。ただし、種類が「身体記録」の記録情報については、数字や記号に大きな意味がある情報が多数含まれる。そこで単語抽出部171は、例えば「身体記録」の記録情報については、数字や記号を削除しないようにする。
 [ステップS114]単語抽出部171は、形態素解析により、新たな単語が取得できたか否かを判断する。例えば、記録情報の最後まで形態素解析が終了し、すべての単語の品詞チェックなどの処理が終了している場合、新たな単語は取得できない。また品詞チェックなどの処理が行われていない単語があれば、その単語が取得できる。単語が取得できた場合、処理がステップS115に進められる。単語が取得できなければ、処理がステップS120に進められる。
 [ステップS115]単語抽出部171は、単語が取得できた場合、取得した単語の品詞をチェックする。
 [ステップS116]単語抽出部171は、取得した単語の品詞が、登録対象の品詞か否かを判断する。例えば単語抽出部171には、あらかじめ登録対象の品詞が設定されている。登録対象の品詞は、例えば「名詞」、「動詞」、「形容詞」、「形容動詞」である。「助詞」や「副詞」は、類似度計算の誤差原因となりやすいため、登録対象から除外される。取得した単語の品詞が登録対象の品詞であれば、処理がステップS117に進められる。また取得した品詞が登録対象の品詞でなければ、処理がステップS113に進められる。
 [ステップS117]単語抽出部171は、取得した単語が、登録排除辞書記憶部120に格納されている登録排除辞書121に含まれているか否かをチェックする。なお単語抽出部171は、例えば、名詞の後ろに名詞が連続する場合、それらの名詞を結合した後を、別の1つの単語と認識してもよい。例えば「外」の後に「減圧」と続く場合、「外」、「減圧」、「外減圧」の3つの単語が、チェックの対象となる。さらに単語抽出部171は、単語の文字数が4文字以上であり、単語の最後に「ー」(長音符)が存在した場合、「ー」を削除してもよい。例えば「サーバー」は「サーバ」となり、「ユーザー」は「ユーザ」となる。
 [ステップS118]単語抽出部171は、取得した単語が登録排除対象か否かを判断する。例えば単語抽出部171は、取得した単語が登録排除辞書121に含まれていれば、その単語が登録排除対象であると認識する。登録排除対象であれば、処理がステップS113に進められる。登録排除対象でなければ、処理がステップS119に進められる。
 [ステップS119]単語抽出部171は、ステップS111で取得した記録情報の単語配列に、ステップS113で取得した単語を追加する。その後、処理がステップS113に進められる。
 [ステップS120]単語抽出部171は、ステップS113で単語が取得できなかった場合、取得した記録情報の解析が完了したと判断し、ステップS111で取得した記録情報の単語配列を、記録情報に対応付けて対象患者記録内単語記憶部130に格納する。その後、処理がステップS111に進められる。
 このようにして、対象患者の電子カルテに含まれる各記録情報に対応する単語配列が、対象患者記録内単語記憶部130に格納される。
 図9は、対象患者記録内単語記憶部のデータ構造の一例を示す図である。対象患者記録内単語記憶部130には、単語配列テーブル131が格納されている。単語配列テーブル131は、対象患者の記録情報から抽出した単語が、記録情報ごとに登録されたデータテーブルである。単語配列テーブル131には、患者ID、記録番号、種類、および単語配列の欄が設けられている。患者IDの欄には、対象患者の患者IDが設定される。記録番号の欄には、対象患者の電子カルテに含まれる記録情報の記録番号が設定される。種類の欄には、対応する記録情報の種類が設定される。単語配列の欄には、対応する記録情報から抽出された単語が列挙される。
 次に、他の患者の記録解析処理について説明する。
 図10は、他の患者の記録解析処理の手順の一例を示すフローチャートである。他の患者の記録解析処理は、対象患者記録解析処理が終了した後に実行される。
 [ステップS131]単語抽出部171は、電子カルテ記憶部110から、対象患者以外の患者(他の患者)の電子カルテにおける未選択の記録情報を1つ取得する。なお、単語抽出部171は、あらかじめ他の患者の電子カルテ内の記録情報をSQLによって絞り込んでおいてもよい。
 [ステップS132]単語抽出部171は、ステップS131において、記録情報が取得できたか否かを判断する。少なくとも一人の他の患者の電子カルテ内に未取得の記録情報があれば、ステップS131において記録情報を取得できる。他方、すべての他の患者の電子カルテ内のすべての記録情報が取得済みであれば、ステップS131において記録情報を取得できない。記録情報が取得できた場合、処理がステップS133に進められる。記録情報が取得できなかった場合、他の患者の記録解析処理が終了する。
 [ステップS133]単語抽出部171は、取得した記録情報を先頭から形態素解析し、先頭から順に単語を取得する。この処理の詳細は、図8のステップS113と同様である。
 [ステップS134]単語抽出部171は、形態素解析により、新たな単語が取得できたか否かを判断する。単語が取得できた場合、処理がステップS135に進められる。単語が取得できなければ、処理がステップS140に進められる。
 [ステップS135]単語抽出部171は、単語が取得できた場合、取得した単語の品詞をチェックする。
 [ステップS136]単語抽出部171は、取得した単語の品詞が、登録対象の品詞か否かを判断する。取得した単語の品詞が登録対象の品詞であれば、処理がステップS137に進められる。また取得した品詞が登録対象の品詞でなければ、処理がステップS133に進められる。
 [ステップS137]単語抽出部171は、取得した単語が、登録排除辞書記憶部120に格納されている登録排除辞書121に含まれているか否かをチェックする。この処理の詳細は、図8のステップS117の処理と同様である。
 [ステップS138]単語抽出部171は、取得した単語が登録排除対象か否かを判断する。登録排除対象であれば、処理がステップS133に進められる。登録排除対象でなければ、処理がステップS139に進められる。
 [ステップS139]単語抽出部171は、ステップS131で取得した記録情報の単語配列に、ステップS133で取得した単語を追加する。その後、処理がステップS133に進められる。
 [ステップS140]単語抽出部171は、ステップS133で単語が取得できなかった場合、取得した記録情報の解析が完了したと判断し、取得した記録情報と、対象患者の複数の記録情報それぞれとの類似度(0以上、1以下の値)を計算する。類似度の計算には、各記録情報から抽出された単語配列が用いられる。例えば単語抽出部171は、ステップS139で生成した単語配列を、対象患者記録内単語記憶部130に格納された、記憶情報の単語配列それぞれと比較し、TF(Term Frequency)-IDF(Inverse Document Frequency)により類似度を計算する。TF-IDFは、単語の出現頻度(TF)と逆文書頻度(IDF)とに基づいて、文書中の単語の重要度を計算する手法である。ID-IDFを用いると、多くの記録情報に含まれる単語の重要度が下がり、特定の記録情報にしか出現しない単語の重要度が上がる。
 単語抽出部171は、例えば、記録情報から抽出した単語の重要度を用いて、ベクトル空間法により、対象患者の記録情報と、取得した他の患者の記録情報との類似度を計算する。ベクトル空間法では、比較対象の2つの記録情報それぞれに含まれる文字の重要度を用いてベクトルを生成し、2つのベクトルの成す角θの余弦(cosθ)が類似度となる。
 また単語抽出部171は、電子カルテの記録情報の種類別に重み付けを設定しておくことができる。その場合、重要な記録には高い重み付けが設定される。例えば、医師記録の重みを「1.2」、看護記録の重みを「1.1」、その他の記録の重みを「0.9」とする。また身体情報の重みを、他の記録情報よりも大きくすることもできる。身体情報の重みを大きくすることで、対象患者と身体的特徴が似た他の患者の記録情報の類似度を上げることができる。単語抽出部171は、比較された各記録情報の種類に応じた重みの値を、ベクトル空間法により計算された類似度に積算する。そして単語抽出部171は、重みを積算した結果を、最終的な類似度とする。
 [ステップS141]単語抽出部171は、取得した記録情報との間の類似度が高い、対象患者の記録情報があるか否かを判断する。例えば単語抽出部171は、対象患者の各記録情報について、その記録情報との間の類似度に基づいて他の患者の記録情報を並べたとき、取得した記録情報が上位20位以内に入る場合、類似度が高いと判断する。類似度が高い対象患者の記録情報がある場合、処理がステップS142に進められる。類似度の高い対象患者の記録情報がない場合、処理がステップS131に進められる。
 なお、対象患者の1つの記録情報に対して、他の一人の患者の複数の記録情報が、類似度のランキングの上位所定数内に入る場合も考えられる。この場合、単語抽出部171は、例えば、同じ患者の複数の記録情報のうちの最上位以外の記録情報については、類似度は高くないものとして取り扱う。
 [ステップS142]単語抽出部171は、取得した記録情報から抽出した単語配列を、その記録情報との間の類似度が高い、対象患者の1または複数の記録情報に関連付けて、類似記録内単語記憶部140に格納する。なお新たな記録情報の格納により、対象患者の記録情報に関連付けられた他の患者の記録情報の数が所定数(例えば20)を超える場合がある。この場合、単語抽出部171は、対象患者の記録情報に関連付けられた他の患者の記録情報のうち、類似度が最も低い記録情報の単語配列を、類似記録内単語記憶部140から削除する。その後、処理がステップS131に進められる。
 このようにして、対象患者の記録情報それぞれに類似する他の患者の記録情報から抽出した単語配列が、類似記録内単語記憶部140に格納される。
 図11は、類似記録内単語記憶部のデータ構造の一例を示す図である。類似記録内単語記憶部140には、対象患者の記録情報ごとの単語配列テーブル141,142,143,・・・が格納されている。単語配列テーブル141,142,143,・・・それぞれには、対象患者の記録情報の記録番号が付与されている。また単語配列テーブル141,142,143,・・・には、患者ID、記録番号、種類、単語配列、および類似度の欄が設けられている。
 患者IDの欄には、他の患者の患者IDが設定される。記録番号の欄には、対象患者の記録情報に類似する内容の、他の患者の記録情報の記録番号が設定される。種類の欄には、記録情報の種類が設定される。単語配列の欄には、記録情報から抽出された単語配列が設定される。類似度の欄には、対象患者の記録情報との間の類似度が設定される。
 このように、単語配列テーブル141,142,143,・・・には、対象患者の記録情報に対応付けて、その記録情報に類似する他の患者の記録情報の単語配列が登録される。なお他の患者の複数の記録情報の単語配列が、1つの単語配列テーブルに登録されることはない。すなわち、1つの単語配列テーブルには、一人の患者につき1つの記録情報の単語配列のみが登録される。他方、他の患者の1つの記録情報の単語配列が、複数の単語配列テーブルに登録されることはある。
 類似記録内単語記憶部140内の単語配列テーブル141,142,143,・・・によって、対象患者の複数の記録情報と、その記録情報に類似する他の患者の記録情報とが関連付けられる。
 図12は、記録情報間の類似関係を示す図である。対象患者の記録情報41,42,43,44,45,・・・それぞれに対して、類似度のランキングが上位となる所定数の他の患者の記録情報が関連付けられる。例えば対象患者の記録情報41には、その記録情報に類似する他の患者の所定数の記録情報51,52,53,54,・・・が関連付けられている。また対象患者の記録情報45には、その記録情報に類似する他の患者の所定数の記録情報61,62,63,64,・・・が関連付けられている。ここで対象患者の記録情報が1000件あり、類似度のランキングで上位20位以内の他の患者の記録情報を関連付けた場合、20000件の他の患者の記録情報から、単語配列が抽出されることとなる。
 対象患者の複数の記録情報それぞれに関連付けられた、他の患者の記録情報に基づいて、対象患者に類似する治療履歴の患者(類似患者)を判定することができる。
 図13は、類似患者判定処理の手順を示すフローチャートである。この処理は、他の患者の記録解析処理の終了後に実行される。
 [ステップS151]類似患者判定部172は、対象患者の記録情報のいずれかに類似する他の患者の記録情報の類似度を、他の患者の患者IDごとに合計する。例えば類似患者判定部172は、類似記録内単語記憶部140から、他の患者の患者IDごとに、その患者IDが設定されたレコードの類似度を取得する。そして類似患者判定部172は、患者IDごとに取得した類似度を合計する。
 [ステップS152]類似患者判定部172は、類似度の合計を比較し、上位所定数(例えば20人)の患者を、対象患者に対する類似患者とする。例えば類似患者判定部172は、他の患者の患者IDを、類似度の合計によって、合計値が高い順にソートする。類似患者判定部172は、ソートした結果の上位所定数の患者IDを抽出する。そして類似患者判定部172は、抽出した患者IDを、類似患者情報記憶部150に格納する。
 [ステップS153]類似患者判定部172は、類似患者の記録情報の単語配列を取得する。例えば類似患者判定部172は、類似記録内単語記憶部140から、類似患者の患者IDを含むレコードを抽出し、その他を排除する。そして類似患者判定部172は、抽出したレコードを、類似患者記録内単語記憶部160に格納する。
 このようにして、類似患者が特定される。この処理により、例えば「対象患者の電子カルテの記録情報に類似する記録情報の上位に出現する頻度が高い患者」が類似患者として特定される。また「対象患者の電子カルテの記録情報に類似する記録情報に出現する頻度がそれほど高くなくても、類似する1つ1つの記録情報の類似度が高い患者」が、類似患者と特定される場合もある。
 特定された類似患者のリストは、類似患者情報記憶部150に格納される。
 図14は、類似患者情報記憶部のデータ構造の一例を示す図である。類似患者情報記憶部150には、類似患者リスト151が格納されている。類似患者リスト151は、類似度のランキングが上位の患者のリストである。図14の例では、類似患者リスト151には、患者のランキングの順位、患者ID、および類似度が設定されている。
 類似患者リスト151に登録された患者については、その患者の記録情報から抽出された単語配列が、類似患者記録内単語記憶部160に格納される。
 図15は、類似患者記録内単語記憶部のデータ構造の一例を示す図である。類似患者記録内単語記憶部160には、対象患者の記録情報ごとの単語配列テーブル161,162,163,・・・が格納されている。単語配列テーブル161,162,163,・・・のデータ構造は、図11に示した類似記録内単語記憶部140内の単語配列テーブル141,142,143,・・・と同様である。ただし、類似患者記録内単語記憶部160内の単語配列テーブル161,162,163,・・・には、類似患者の患者IDが設定されたレコ-ドのみが登録されている。例えば図11に示した類似記録内単語記憶部140内の単語配列テーブル141には、患者ID「Z」の患者のレコードが含まれている。ここで、患者ID「Z」の患者は、類似患者ではないものとする。そのため、図15に示す類似患者記録内単語記憶部160内の単語配列テーブル161では、患者ID「Z」のレコードは除外されている。
 このような類似患者記録内単語記憶部160に格納された単語から、対象患者の診療の参考となる単語が抽出される。
 図16は、参考単語抽出処理の手順を示すフローチャートである。この処理は、類似患者判定処理の終了後に実行される。
 [ステップS161]参考単語抽出部173は、対象患者の記録情報から抽出した単語と、類似患者の記録情報から抽出した単語とを統合(マージ)する。
 [ステップS162]参考単語抽出部173は、マージした後の各単語に、一意の番号(単語ID)を付与する。例えば参考単語抽出部173は、マージした後の単語配列における単語の出現順位を、その単語の単語IDとする。なお、この時点で、単語と記録情報との関連付けはなくなり、患者ごとの出現単語一覧が生成される。
 [ステップS163]参考単語抽出部173は、患者ごとの出現単語一覧の中から、参考単語を抽出する。例えば参考単語抽出部173は、協調フィルタリング(CF:Collaborative Filtering)技術を応用して、参考単語を選択する。協調フィルタリングでは、例えばユーザの行動を記録し、特定のユーザの行動と類似した行動の他のユーザが、嗜好が近いユーザとされる。そして、特定のユーザが、嗜好が近い他のユーザの行動と同様な行動を好むものと推定され、特定のユーザの行動にはないが、嗜好の近いユーザにはある行動が、特定のユーザに薦められる。協調フィルタリングにおける「行動」として記録情報から抽出した「単語」を用いることで、対象患者の診療内容と似た診療内容の他のユーザにおける記録情報の中から、対象患者がまだ行っていないが、今後の診療に役立つと思われる単語が抽出できる。
 そこで参考単語抽出部173は、協調フィルタリングによって嗜好が近いと判断された他の患者の出現単語一覧のうち、対象患者の出現単語一覧に含まれない単語(複数)を、参考単語として抽出する。
 [ステップS164]参考単語抽出部173は、抽出した参考単語を、レコメンデーション結果として出力する。例えば参考単語抽出部173は、参考単語のリストを、レコメンデーション要求の送信元の端末装置に対して送信する。
 このようにして、対象患者の診療に有用な単語を、診療内容が類似した他の患者の記録情報内の単語から導き出すことができる。
 図17は、レコメンデーションの一例を示す図である。図17の例では、患者ID「A」の患者を対象患者としている。この場合、患者ID「A」の患者と他の患者との記録情報内の単語の比較により類似患者が判定される。図17の例では、患者ID「B」、「C」、「D」、「E」の各患者が、類似患者と判定されている。
 ここで、対象患者(患者ID「A」)の記録情報内の単語と、類似患者(患者ID「B」、「C」、「D」、「E」)の記録情報内の単語とが比較され、参考単語が抽出される。例えば、患者ID「A」の患者と類似度が高い患者の傾向として、甲状腺炎に関する単語が多く出現している。そして薬剤として「レボチロキシンナトリウム水和物(Levothyroxine sodium hydrate)」の出現回数が多い傾向にある。患者ID「A」の患者の傾向としては、「重症筋無力症」や「機能低下症」の単語が出現されていない。そこで「重症筋無力症」や「機能低下症」の単語が、参考単語として抽出され、レコメンデーション結果として送信される。
 このようにして、対象患者と似た内容の電子カルテに対応する類似患者を検出し、その患者の電子カルテから、対象患者の診療に役に立つ単語(キーワード)を抽出し、例えば対象患者の担当医に提示することができる。その結果、診療方針の決定に際して、患者の症状に応じた重要な検討事項の検討漏れを抑止し、対象患者の診療方針を的確に判断することができ、診療品質を向上させることができる。また、診療方針の決定に際して、医師個人の能力に依存する度合いを低下させ、高いレベルで均質な医療を提供することができる。
 しかも、対象患者の診療録に含まれる複数の記録情報それぞれと、他の患者の診療録に含まれる複数の記録情報それぞれとの類似度を計算し、他の患者ごとに記録情報の類似度を合計し、類似度の合計値が高い方から所定数の患者を類似患者としている。これにより、対象患者の担当医は、多数の類似患者に対する診療内容を参考にして、適切な診療方針を判断することができる。とくに大規模の病院では大量の電子カルテの蓄積があるため、過去の様々な患者の診療記録を参考に対象患者の診療方針を決定できることで、より適切な診療が可能となる。
 さらに、類似患者の検出において、対象患者の診療録に含まれる複数の記録情報それぞれに対し、類似度が高い方から上位所定数の他の患者の記録情報を抽出し、他の患者ごとに、抽出された記録情報の類似度を合計している。これにより、参考にならない記録情報については、記録情報を抽出段階で排除される。その結果、対象患者に類似する病状の患者が、他の治療を受けていることによって、その患者の電子カルテに、対象患者の参考とはならない記録情報が大量に含まれていても、病状の類似する患者を適切に見つけ出すことができる。例えば、対象患者が、糖尿病の治療を受けている場合を考える。その場合、他の糖尿病患者が類似患者として抽出されることが期待される。ここで、ある糖尿病患者が、糖尿病とは関係なく、皮膚科の治療を長期に渡って受けていたものとする。このような場合において、もし電子カルテ全体で比較を行うと、その糖尿病患者の糖尿病に関連する単語の出現割合が低下し、その糖尿病患者が類似患者と判定されない可能性がある。他方、第2の実施の形態に示すように、個々の記録情報間で類似関係の比較を行い、類似度の低い記録情報を除外することで、糖尿病以外の診療に関する記録情報は除外され、糖尿病患者が正しく類似患者と判定される。すなわち、類似患者判定の精度が向上する。
 また、記録情報間の類似度の計算では、記録情報の種類に応じた重み付けを行うことができる。例えば、類似度計算対象の2つの記録情報の内容に基づく類似度の計算結果に、2つの記録情報それぞれの重みを乗算し、乗算結果を該2つの記録情報間の類似度とすることができる。例えば医師による診療の記録情報の重みを、看護師による看護の記録情報より高く設定できる。これにより、医師が方針の決定に際し、他の医師の診療内容を参考にすることができる。看護師が、患者の症状に応じた適切な看護手法のレコメンデーションを要求する場合、看護師による診療の記録情報の重みを、医師師による看護の記録情報より高く設定することで、適切なレコメンデーション結果を受け取ることができる。
 また記録情報に身体情報を含めることで、患者の年齢、性別、体重、身長などが類似し、且つ患者の診察内容が類似する他の患者に対して行われて、対象患者に対して行われていない治療を示す単語を、レコメンデーション結果として出力することができる。
 さらに身体情報を含む記録情報の重みを、例えば他の種類の記録情報よりも高く設定することもできる。身体情報の重みを最も高く設定することで、対象患者と身体的特徴が近い他の患者を優先的に類似患者とすることができる。このような重み付けによりレコメンデーションを行えば、例えば性別や年齢によって病状や治療内容が異なるような病気に関する診療方針の決定に有用な単語を、レコメンデーション結果として取得できる。
 さらに、類似患者の診療録に含まれる複数の記録情報に出現する単語のうち、前記対象患者の診療録に出現しない単語を抽出することで、参考にならない単語が抽出されることを抑止できる。その結果、レコメンデーション結果を取得した医師は、無駄な単語に惑わされることなく、レコメンデーション結果に基づく診療方針の決定を迅速に行うことができる。
 上記については単に本発明の原理を示すものである。さらに、多数の変形、変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応するすべての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。
 1 記憶手段
 1a,1b,1c,・・・ 診療録
 1a-1,1a-2,1a-3,1b-1,1b-2,1b-3,・・・ 記録情報
 2 特定手段
 3 類似患者情報
 4 抽出手段
 5,6 単語配列
 7 参考単語
 S 医療情報解析装置

Claims (9)

  1.  コンピュータに、
     複数の患者の診療録を参照し、診療録が第1の患者と類似する第2の患者を特定し、
     前記第2の患者の診療録から情報を抽出する、
     処理をコンピュータに実行させる医療情報解析プログラム。
  2.  前記第2の患者の特定では、前記第1の患者の診療録に含まれる複数の記録情報それぞれと、他の患者の診療録に含まれる複数の記録情報それぞれとの類似度を計算し、他の患者ごとに記録情報間の類似度を合計することを特徴とする請求の範囲第1項記載の医療情報解析プログラム。
  3.  前記第2の患者の特定では、前記第1の患者の診療録に含まれる複数の記録情報それぞれに対し、類似度が高い方から上位所定数の他の患者の記録情報を抽出し、他の患者ごとに、抽出された記録情報の類似度を合計することを特徴とする請求の範囲第2項記載の医療情報解析プログラム。
  4.  記録情報間の類似度の計算では、記録情報の種類に応じて重み付けを行い、類似度計算対象の2つの記録情報の内容に基づく類似度の計算結果に、該2つの記録情報それぞれの重みを乗算し、乗算結果を該2つの記録情報間の類似度とすることを特徴とする請求の範囲第2項または第3項記載の医療情報解析プログラム。
  5.  前記複数の患者の診療録は、患者の身体的特徴を示す身体情報を含むことを特徴とする請求の範囲第1項乃至第4項のいずれかに記載の医療情報解析プログラム。
  6.  前記第2の患者の特定では、前記第1の患者の診療録と他の患者の診療録との間の類似度を計算し、類似度が高い方から所定数の他の患者を、前記第2の患者とすることを特徴とする請求の範囲第1項乃至第5項のいずれかに記載の医療情報解析プログラム。
  7.  単語の抽出では、前記第2の患者の診療録に出現する単語のうち、前記第1の患者の診療録に出現しない単語を抽出することを特徴とする請求の範囲第1項乃至第6項記載の医療情報解析プログラム。
  8.  複数の患者の診療録を参照し、診療録が第1の患者と類似する第2の患者を特定する特定手段と、
     前記第2の患者の診療録から情報を抽出する抽出手段と、
     を有する医療情報解析装置。
  9.  コンピュータが、
     複数の患者の診療録を参照し、診療録が第1の患者と類似する第2の患者を特定し、
     前記第2の患者の診療録から情報を抽出する、
     医療情報解析方法。
PCT/JP2012/079498 2012-11-14 2012-11-14 医療情報解析プログラム、医療情報解析装置、および医療情報解析方法 WO2014076777A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2014546769A JP6187474B2 (ja) 2012-11-14 2012-11-14 医療情報解析プログラム、医療情報解析装置、および医療情報解析方法
PCT/JP2012/079498 WO2014076777A1 (ja) 2012-11-14 2012-11-14 医療情報解析プログラム、医療情報解析装置、および医療情報解析方法
EP12888222.2A EP2922018A4 (en) 2012-11-14 2012-11-14 ANALYSIS OF MEDICAL INFORMATION PROGRAM, MEDICAL INFORMATION ANALYSIS DEVICE AND METHOD OF ANALYZING MEDICAL INFORMATION
US14/691,958 US20150227714A1 (en) 2012-11-14 2015-04-21 Medical information analysis apparatus and medical information analysis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/079498 WO2014076777A1 (ja) 2012-11-14 2012-11-14 医療情報解析プログラム、医療情報解析装置、および医療情報解析方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US14/691,958 Continuation US20150227714A1 (en) 2012-11-14 2015-04-21 Medical information analysis apparatus and medical information analysis method

Publications (1)

Publication Number Publication Date
WO2014076777A1 true WO2014076777A1 (ja) 2014-05-22

Family

ID=50730719

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/079498 WO2014076777A1 (ja) 2012-11-14 2012-11-14 医療情報解析プログラム、医療情報解析装置、および医療情報解析方法

Country Status (4)

Country Link
US (1) US20150227714A1 (ja)
EP (1) EP2922018A4 (ja)
JP (1) JP6187474B2 (ja)
WO (1) WO2014076777A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016190210A1 (ja) * 2015-05-26 2016-12-01 株式会社野村総合研究所 ヘルスケアシステム
JP2020021514A (ja) * 2019-11-06 2020-02-06 株式会社野村総合研究所 サーバ装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10379987B1 (en) * 2013-06-14 2019-08-13 HCA Holdings, Inc. Intermediate check points and controllable parameters for addressing process deficiencies
US11056241B2 (en) * 2016-12-28 2021-07-06 Canon Medical Systems Corporation Radiotherapy planning apparatus and clinical model comparison method
CN110265099B (zh) * 2019-05-08 2022-08-05 北京百度网讯科技有限公司 用于输出病历的方法和装置
CN113064960A (zh) * 2020-01-02 2021-07-02 广州创金谷科技有限公司 一种精确搜索与患者病情相似病例的方法
KR102369960B1 (ko) * 2021-07-30 2022-03-04 쿠팡 주식회사 사용자 계정의 존재 여부에 기초하여 정보를 제공하는 전자 장치 및 그 방법

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004157623A (ja) 2002-11-05 2004-06-03 Hitachi Ltd 検索システム及び検索方法
JP2005085285A (ja) 2003-09-10 2005-03-31 Microsoft Corp ペンベースのコンピューティングシステムでの注釈の管理
JP2006268698A (ja) * 2005-03-25 2006-10-05 Gifu Univ 類似症例表示装置、及び類似症例表示プログラム
JP2009205456A (ja) * 2008-02-28 2009-09-10 Fujifilm Corp 健康疾患管理支援装置及び方法、並びに医用ネットワークシステム
WO2010032343A1 (ja) * 2008-09-19 2010-03-25 株式会社日立製作所 類似症例検索システム
JP2011100254A (ja) 2009-11-05 2011-05-19 Hitachi Medical Corp 医用診断レポートシステム、当該システムとして機能させるためのプログラム、および医用診断レポートの作成支援方法
JP2011186854A (ja) 2010-03-09 2011-09-22 Nippon Telegr & Teleph Corp <Ntt> 質問推薦装置及び方法及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030125983A1 (en) * 2001-12-27 2003-07-03 Flack John M. Computer-implemented method and system for managing patient healthcare and evaluating patient kidney function
US20060259329A1 (en) * 2002-04-09 2006-11-16 Charlotte-Mecklenburg Hospital Authority D/B/A Carolinas Medical Center System and Method for Determining the Degree of Abnormality of a Patient's Vital Signs
JP2007287018A (ja) * 2006-04-19 2007-11-01 Fujifilm Corp 診断支援システム
JP2008146170A (ja) * 2006-12-06 2008-06-26 Fujifilm Corp 医療施設検索装置及び方法
EP2283442A1 (en) * 2008-05-09 2011-02-16 Koninklijke Philips Electronics N.V. Method and system for personalized guideline-based therapy augmented by imaging information
US8731966B2 (en) * 2009-09-24 2014-05-20 Humedica, Inc. Systems and methods for real-time data ingestion to a clinical analytics platform to generate a heat map
JP2013012025A (ja) * 2011-06-29 2013-01-17 Fujifilm Corp 診療支援システムおよび方法、並びに、プログラム
US20160358284A1 (en) * 2011-10-19 2016-12-08 Humana Inc. Computerized system and method for coding medical records

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004157623A (ja) 2002-11-05 2004-06-03 Hitachi Ltd 検索システム及び検索方法
JP2005085285A (ja) 2003-09-10 2005-03-31 Microsoft Corp ペンベースのコンピューティングシステムでの注釈の管理
JP2006268698A (ja) * 2005-03-25 2006-10-05 Gifu Univ 類似症例表示装置、及び類似症例表示プログラム
JP2009205456A (ja) * 2008-02-28 2009-09-10 Fujifilm Corp 健康疾患管理支援装置及び方法、並びに医用ネットワークシステム
WO2010032343A1 (ja) * 2008-09-19 2010-03-25 株式会社日立製作所 類似症例検索システム
JP2011100254A (ja) 2009-11-05 2011-05-19 Hitachi Medical Corp 医用診断レポートシステム、当該システムとして機能させるためのプログラム、および医用診断レポートの作成支援方法
JP2011186854A (ja) 2010-03-09 2011-09-22 Nippon Telegr & Teleph Corp <Ntt> 質問推薦装置及び方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2922018A4

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016190210A1 (ja) * 2015-05-26 2016-12-01 株式会社野村総合研究所 ヘルスケアシステム
JP2016218954A (ja) * 2015-05-26 2016-12-22 株式会社野村総合研究所 ヘルスケアシステム
US11495335B2 (en) 2015-05-26 2022-11-08 Nomura Research Institute, Ltd. Health care system
JP2020021514A (ja) * 2019-11-06 2020-02-06 株式会社野村総合研究所 サーバ装置

Also Published As

Publication number Publication date
US20150227714A1 (en) 2015-08-13
JP6187474B2 (ja) 2017-08-30
JPWO2014076777A1 (ja) 2016-09-08
EP2922018A1 (en) 2015-09-23
EP2922018A4 (en) 2015-10-14

Similar Documents

Publication Publication Date Title
Juhn et al. Artificial intelligence approaches using natural language processing to advance EHR-based clinical research
JP6187474B2 (ja) 医療情報解析プログラム、医療情報解析装置、および医療情報解析方法
US8199982B2 (en) Mapping of literature onto regions of interest on neurological images
Suominen et al. Overview of the CLEF eHealth evaluation lab 2018
US9558264B2 (en) Identifying and displaying relationships between candidate answers
CN110136788B (zh) 一种基于自动检测的病历质检方法、装置、设备及存储介质
Palotti et al. How users search and what they search for in the medical domain: understanding laypeople and experts through query logs
US10423758B2 (en) Computer system and information processing method
WO2016120955A1 (ja) 行動予測装置、行動予測装置の制御方法、および行動予測装置の制御プログラム
US20070282940A1 (en) Thread-ranking apparatus and method
US10127271B2 (en) Generating a query
US8126228B2 (en) Determining efficacy of therapeutic intervention in neurosychiatric disease
US20190237200A1 (en) Recording medium recording similar case retrieval program, information processing apparatus, and similar case retrieval method
JP2013200592A (ja) 医療情報検索装置、方法およびプログラム
Sedghi et al. Mining clinical text for stroke prediction
Yildirim et al. Prediction of similarities among rheumatic diseases
Kefeli et al. Benchmark pathology report text corpus with cancer type classification
Canino et al. Feature selection model for diagnosis, electronic medical records and geographical data correlation
Sigdel et al. Cloud-based phrase mining and analysis of user-defined phrase-category association in biomedical publications
Mantovani et al. Discovering predictive trend-event patterns in temporal clinical data
CN112652400A (zh) 基于专病视图相似分析病情参考方法、系统、设备和介质
GB2548627A (en) A system and a method for assessing patient treatment risk using open data and clinician input
US9916419B2 (en) Processing electronic documents
Rakia Allegue et al. Data harmonization for Advancing research on Personalized Rehabilitation Interventions for Patients with Traumatic Brain Injury and Stroke: A proof of concept
Vani et al. Natural Language Processing Utilisation in Healthcare

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12888222

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014546769

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 2012888222

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE