WO2016142990A1 - 検索プログラム、検索方法および検索装置 - Google Patents

検索プログラム、検索方法および検索装置 Download PDF

Info

Publication number
WO2016142990A1
WO2016142990A1 PCT/JP2015/056638 JP2015056638W WO2016142990A1 WO 2016142990 A1 WO2016142990 A1 WO 2016142990A1 JP 2015056638 W JP2015056638 W JP 2015056638W WO 2016142990 A1 WO2016142990 A1 WO 2016142990A1
Authority
WO
WIPO (PCT)
Prior art keywords
patient information
patient
representative
information
search
Prior art date
Application number
PCT/JP2015/056638
Other languages
English (en)
French (fr)
Inventor
江朗 勝田
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通株式会社 filed Critical 富士通株式会社
Priority to JP2017504315A priority Critical patent/JP6521053B2/ja
Priority to PCT/JP2015/056638 priority patent/WO2016142990A1/ja
Publication of WO2016142990A1 publication Critical patent/WO2016142990A1/ja
Priority to US15/672,874 priority patent/US20170372014A1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Definitions

  • the present invention relates to a search program, a search method, and a search device.
  • the following technology has been proposed as an example of a technology related to matching between an original image and a template image.
  • a hierarchical image obtained by converting the resolution of an original image is used, and matching is first performed using the uppermost layer image having the lowest resolution.
  • a plurality of point groups having a correlation value with the template image equal to or higher than the threshold value are extracted from the uppermost image, and a point having the maximum correlation value in each point group is determined as a search point.
  • the search process takes time as the information registered in the database increases. .
  • the search processing time becomes longer as the number of patient information registered in the database is larger, and the search processing time is longer as the number of items of information included in each patient information is larger.
  • an object of the present invention is to provide a search program, a search method, and a search device that can reduce the time required for a similar search of patient information.
  • a search program is provided.
  • This search program is a plurality of sets of patient information that are similar to each other among a plurality of pieces of patient information in a computer that can acquire a plurality of pieces of patient information from a storage unit that stores a plurality of pieces of patient information regarding each of a plurality of patients
  • a plurality of representative patient information representing each patient information group of the patient is acquired from the storage unit, and the first patient information having the highest similarity to the designated designated patient information is identified from the plurality of representative patient information.
  • the patient information included in the specific patient information group to which the first patient information belongs among the plurality of patient information groups is acquired from the storage unit, and the designated patient information is selected from the patient information included in the specific patient information group.
  • the second patient information having the highest degree of similarity with is specified, and the process is executed.
  • a search method capable of acquiring a plurality of patient information from a storage unit that stores a plurality of patient information relating to each of a plurality of patients is a plurality of sets of similar patient information among a plurality of patient information.
  • a plurality of representative patient information representing each patient information group of the patient is acquired from the storage unit, and the first patient information having the highest similarity to the designated designated patient information is identified from the plurality of representative patient information.
  • the patient information included in the specific patient information group to which the first patient information belongs among the plurality of patient information groups is acquired from the storage unit, and the designated patient information is selected from the patient information included in the specific patient information group. 2nd patient information with the highest similarity is identified.
  • a search device includes a storage unit and a calculation unit.
  • the storage unit stores at least a plurality of representative patient information representing a plurality of patient information groups, each of which is a set of similar patient information among a plurality of patient information regarding each of the plurality of patients.
  • the computing unit identifies first patient information having the highest degree of similarity with the designated designated patient information from among the plurality of representative patient information, and the first patient information of the plurality of patient information groups belongs to the first patient information.
  • the second patient information having the highest similarity to the designated patient information is specified from the patient information included in the specific patient information group.
  • FIG. 1 is a diagram illustrating a search device according to the first embodiment.
  • the search device 1 is a device that searches patient information similar to designated patient information or a patient corresponding to the patient information from among a plurality of patient information.
  • the search device 1 includes a storage unit 1a and a calculation unit 1b.
  • the storage unit 1a may be a volatile storage device such as a RAM (Random Access Memory) or a non-volatile storage device such as an HDD (Hard Disk Drive) or a flash memory.
  • the computing unit 1b is, for example, a processor.
  • the processor may include a CPU (Central Processing Unit), a DSP (Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), an FPGA (Field Programmable Gate Array), and the like. Further, the calculation unit 1b may be a multiprocessor.
  • the storage unit 1a stores a plurality of pieces of patient information to be subjected to a similarity search.
  • Patient information includes various information regarding the corresponding patient.
  • patient information includes information such as attribute information such as the patient's sex, patient diagnosis results, patient test results, whether or not a treatment method has been implemented, the patient's condition (medical condition) and the period until the condition. obtain.
  • the storage unit 1a stores a patient information database 10 in which a plurality of pieces of patient information to be subjected to similarity search are registered.
  • the storage unit 1a in the search device 1 does not have to store all patient information to be subjected to the similarity search.
  • the plurality of pieces of patient information may be stored in an external device existing outside the search device 1, and the search device may read only patient information necessary for processing from the external device and store it in the storage unit 1a.
  • the patient information in the patient information database 10 is classified in advance into a plurality of patient information groups.
  • the patient information group is a set of similar patient information.
  • the patient information in the patient information database 10 is classified into three patient information groups 11-13.
  • Each patient information in the patient information database 10 may belong to a plurality of patient information groups.
  • representative patient information representing the patient information group is set as one of the patient information belonging to the patient information group.
  • patient information 11 a among the patient information belonging to the patient information group 11 is set as representative patient information.
  • the patient information 12a is set as the representative patient information.
  • patient information 13a is set as representative patient information.
  • a set of patient information 11a, 12a, 13a representing each of the patient information groups 11 to 13 is shown as a representative patient information group 20.
  • a plurality of representative patient information can be obtained by projecting each patient information in the patient information database 10 onto a coordinate space set so as to indicate dissimilarity between patient information corresponding to the distance between points. The position corresponding to the information is selected from the patient information in the patient information database 10 so that the positions corresponding to the information are dispersed in the coordinate space.
  • the selection process of patient information included in each patient information group and the selection process of representative patient information for each patient information group may be executed by the search device 1 or may be executed by a device other than the search device 1. Good.
  • the calculation unit 1b accepts designation of designated patient information 30 which is patient information serving as a search key. Then, the calculation unit 1b firstly displays the representative patient information of the patient information groups 11 to 13 among the patient information in the patient information database 10 (that is, patient information 11a, 12a, 13a included in the representative patient information group 20). ) Is executed as a search target. Specifically, the calculation unit 1b calculates the similarity between the designated patient information 30 and each representative patient information, and identifies the patient information having the highest similarity with the designated patient information 30 from the representative patient information. (Step S1). In the example of FIG. 1, it is assumed that patient information 13a representing the patient information group 13 is specified.
  • the calculation unit 1b executes a search process with the patient information group 13 to which the specified patient information 13a belongs as a search target. Specifically, the calculation unit 1b calculates the similarity between the designated patient information 30 and each patient information belonging to the patient information group 13, and from the patient information belonging to the patient information group 13, The patient information with the highest similarity is specified (step S2).
  • the calculation unit 1b outputs the specified patient information 13b or patient identification information corresponding to the patient information 13b as a search result.
  • the search target by the search device 1 is limited to patient information belonging to the representative patient information group 20 and patient information belonging to the patient information group corresponding to one representative patient information.
  • patient information is classified into a plurality of patient information groups, each of which is a set of similar patient information, and each representative patient information that is initially searched is patient information that represents each patient information group. . Then, the representative patient information most similar to the designated patient information is identified, and the patient information group to which the identified representative patient information belongs, that is, a plurality of patient information similar to the identified representative patient information is Search target.
  • the patient information in the patient information database 10 that is actually the highest in similarity with the designated patient information is less likely to leak from the search target. Therefore, it is possible to reduce the time required for the search process while maintaining the search accuracy.
  • the storage unit 1a in the search device 1 does not have to store all patient information in the patient information database 10 to be subjected to the similarity search.
  • the search device 1 includes at least the representative patient information included in the representative patient information group 20 among the patient information in the patient information database 10 in step S1. Patient information included in the patient information group to which the identified patient information belongs is read from the external device into the storage unit 1a.
  • FIG. 2 illustrates an information processing system according to the second embodiment.
  • the information processing system according to the second embodiment includes a server 100 and a terminal device 200.
  • Server 100 and terminal device 200 are connected via network 900.
  • the network 900 may be a local area network (LAN) or a wide area network such as a wide area network (WAN) or the Internet.
  • LAN local area network
  • WAN wide area network
  • the server 100 stores a patient database in which a plurality of patient information is registered.
  • patient information information on a plurality of items related to the patient is registered. For example, attribute information such as patient gender, patient diagnosis results, patient test results, whether or not a treatment method has been implemented, patient status (medical condition) and the period until the status is registered in patient information Is done.
  • the server 100 searches a patient database for a patient whose content of patient information is similar and transmits the patient information to the terminal device 200.
  • a search is also called “similar case search”.
  • the patient specified in the search request may be described as “query patient”, and the patient extracted from the patient database by the search may be described as “similar patient”.
  • the server 100 is an example of the search device 1 in FIG.
  • the terminal device 200 is a client computer used by a user.
  • FIG. 3 is a diagram illustrating a hardware example of the server.
  • the server 100 includes a processor 101, a RAM 102, an HDD 103, an image signal processing unit 104, an input signal processing unit 105, a reading device 106, and a communication interface 107. Each unit is connected to the bus of the server 100.
  • the processor 101 controls the entire server 100.
  • the processor 101 is, for example, a CPU, DSP, ASIC, or FPGA.
  • the processor 101 may be a multiprocessor including a plurality of processing elements. Further, the processor 101 may be a combination of two or more elements among a CPU, a DSP, an ASIC, an FPGA, and the like.
  • the RAM 102 is a main storage device of the server 100.
  • the RAM 102 temporarily stores at least part of an OS (Operating System) program and application programs to be executed by the processor 101.
  • the RAM 102 stores various data used for processing by the processor 101.
  • the HDD 103 is an auxiliary storage device of the server 100.
  • the HDD 103 magnetically writes and reads data to and from the built-in magnetic disk.
  • the HDD 103 stores an OS program, application programs, and various data.
  • the server 100 may include other types of auxiliary storage devices such as flash memory and SSD (Solid State Drive), or may include a plurality of auxiliary storage devices.
  • the image signal processing unit 104 outputs an image to the display 801 connected to the server 100 in accordance with an instruction from the processor 101.
  • the display 801 various displays such as a CRT (Cathode Ray Tube) display, a liquid crystal display (LCD), and an organic EL (Electro-Luminescence) display can be used.
  • CTR Cathode Ray Tube
  • LCD liquid crystal display
  • organic EL Electro-Luminescence
  • the input signal processing unit 105 acquires an input signal from the input device 802 connected to the server 100 and outputs it to the processor 101.
  • various input devices such as a pointing device such as a mouse and a touch panel and a keyboard can be used.
  • a plurality of types of input devices may be connected to the server 100.
  • the reading device 106 is a device that reads a program and data recorded on the recording medium 803.
  • a magnetic disk such as a flexible disk (FD) or HDD
  • an optical disk such as a CD (Compact Disk) or a DVD (Digital Versatile Disk), or a magneto-optical disk (MO: Magneto-Optical disk) is used.
  • a nonvolatile semiconductor memory such as a flash memory card can be used.
  • the reading device 106 stores the program and data read from the recording medium 803 in the RAM 102 or the HDD 103 in accordance with an instruction from the processor 101.
  • the communication interface 107 communicates with the terminal device 200 via the network 900.
  • the communication interface 107 may be a wired communication interface or a wireless communication interface.
  • the terminal device 200 can also be realized by the same hardware as the server 100.
  • FIG. 4 is a diagram illustrating an example of functions of the information processing system.
  • the server 100 includes a storage unit 110, a preprocessing unit 121, and a search processing unit 122.
  • the storage unit 110 is mounted as a storage area secured in the RAM 102 or the HDD 103, for example.
  • the processing of the preprocessing unit 121 and the search processing unit 122 is realized by the processor 101 executing a predetermined program, for example.
  • the storage unit 110 stores a patient database 111, a map table 112, a representative patient table 113, and a patient group table 114. A lot of patient information is registered in the patient database 111.
  • the map table 112, the representative patient table 113, and the patient group table 114 are information created by the preprocessing unit 121 for the search processing in the search processing unit 122.
  • the pre-processing unit 121 performs pre-processing for executing similar patient search processing in the search processing unit 122.
  • the preprocessing unit 121 converts patient information, which is multidimensional information, registered in the patient database 111 into low-dimensional information such as two-dimensional and three-dimensional information.
  • the preprocessing unit 121 creates a map (scatter diagram) indicating the position of each patient in the coordinate space of the dimension after conversion.
  • a map for example, principal component analysis or a multidimensional scaling method is used. Thereby, the distance between patients on a map shows the similarity between corresponding patient information.
  • the map table 112 the coordinates of each patient on the map are registered. That is, the map table 112 is substantial information corresponding to the created map.
  • the patient coordinates registered in the map table 112 indicate patient information after dimension conversion for the patient.
  • the preprocessing unit 121 identifies a plurality of representative patients from all patients based on the map table 112.
  • the representative patient is identified to be distributed within the patient distribution area on the map.
  • the identified representative patient is registered in the representative patient table 113.
  • patient information in the patient database 111 corresponding to the representative patient may also be registered.
  • the preprocessing unit 121 identifies a patient group corresponding to each identified representative patient.
  • the patient group includes patients existing in a certain distance range centered on the representative patient in the map among all patients. That is, a patient whose patient information is somewhat similar to the representative patient belongs to the patient group.
  • identification information (patient ID) of patients belonging to each patient group is registered.
  • the search processing unit 122 receives a similar patient search request from the terminal device 200.
  • the search request includes patient information of the query patient. Further, the search request may include only the patient ID for identifying the query patient. In this case, the search processing unit 122 refers to the patient database 111 and acquires patient information corresponding to the patient ID included in the search request.
  • the search processing unit 122 calculates the similarity of the patient information of each representative patient to the patient information of the query patient.
  • the search processing unit 122 identifies the representative patient whose patient information is most similar to the query patient from the result of calculating the similarity.
  • the search processing unit 122 refers to the patient group table 114 and identifies the group to which the identified representative patient belongs.
  • the search processing unit 122 calculates the similarity of the patient information of each patient belonging to the specified group with respect to the patient information of the query patient.
  • the search processing unit 122 identifies the patient whose patient information is most similar to the query patient as a similar patient from the result of calculating the similarity.
  • the control unit 120 transmits information on similar patients identified as search results to the terminal device 200.
  • the information transmitted to the terminal device 200 may be a patient ID of a similar patient, or may be information on all or part of the patient information of a similar patient. Thereby, the search result can be displayed on the display of the terminal device 200.
  • At least the patient database 111 may be stored in a storage device outside the server 100.
  • the server 100 acquires and uses patient information registered in the patient database 111 from an external storage device.
  • FIG. 5 is a diagram showing an example of a patient database.
  • the patient database 111 is stored in the storage unit 110.
  • the patient database 111 includes, for example, patient ID, sex, age, INF (Interferon) treatment, TAE (Transcatheter Arterial Embbolization), RFA (RadioFrequency Ablation), ALT (Alanine Aminotransferase), PLT (Platelet), stage, survival, recurrence And items with no recurrence period.
  • a record corresponding to one patient ID in the patient database 111 is patient information about the patient corresponding to the patient ID.
  • the patient ID item information for identifying a patient is registered.
  • the sex item information for identifying the sex is registered.
  • “1” (male) or “0” (female) is registered.
  • the age item a numerical value indicating the age is registered.
  • INF treatment item information indicating whether or not INF treatment, which is a kind of treatment for hepatitis, has been performed is registered.
  • INF treatment item “1” (INF treatment was performed) or “0” (INF treatment was not performed) is registered.
  • TAE item information indicating whether or not a TAE, which is a kind of liver cancer treatment method, has been performed is registered.
  • TAE item “1” (TAE is performed) or “0” (TAE is not performed) is registered.
  • RFA item information indicating whether or not RFA, which is a kind of liver cancer treatment method, is registered.
  • RFA item “1” (RFA is performed) or “0” (RFA is not performed) is registered.
  • ALT inspection value is registered in the ALT item.
  • PLT inspection value is registered in the PLT item.
  • Information indicating the degree of progression of a predetermined type of cancer is registered in the stage item. For example, one of 0 to 4 is registered in the stage item. The higher the number, the higher the progression of cancer.
  • survival period information indicating the survival period from the start of treatment is registered.
  • recurrence item information indicating whether or not the disease has recurred is registered.
  • “1” (recurring) or “0” (not recurring) is registered.
  • “no recurrence period” a numerical value indicating a period in which the disease has not recurred since the start of treatment is registered.
  • gender and age are examples of patient attribute information
  • INF treatment is examples of information indicating whether or not a treatment method is performed on the patient
  • ALT and PLT are It is an example of a test result of a patient.
  • the stage is an example of information indicating the patient's state
  • the relapse is an example of information indicating whether or not the patient is in a certain state.
  • Stage and recurrence are examples of patient diagnostic results. Survival period and recurrence are examples of information indicating a period until a patient reaches a certain state.
  • gene expression levels at lesion sites may be registered as an example of patient test results.
  • the gene expression level is registered for each DNA probe, for example.
  • a photographed image (or a link to the image) by X-ray or MRI (Magnetic Resonance Imaging) may be registered in the patient database 111 as an example of a patient test result.
  • FIG. 6 is a diagram showing an example of the map table.
  • the map table 112 is stored in the storage unit 110.
  • the map table 112 has a record for each patient. In each record, a patient ID and coordinates are registered.
  • the patient ID is identification information for identifying a patient.
  • the coordinates indicate position information on the map. This position information corresponds to information obtained by converting corresponding patient information registered in the patient database 111 into low-dimensional information.
  • FIG. 7 is a diagram showing an example of a representative patient table.
  • the representative patient table 113 is stored in the storage unit 110.
  • the representative patient table 113 has a record for each representative patient. In each record, patient information of a representative patient extracted from the patient database 111 is registered. As shown in FIG. 7, the record of the representative patient table 113 is identified by the patient ID. Note that only the patient ID of the representative patient may be registered in the representative patient table 113.
  • FIG. 8 is a diagram showing an example of a patient group table.
  • the patient group table 114 is stored in the storage unit 110.
  • a record for each patient group is registered.
  • a group ID for identifying a patient group and a patient ID for identifying a patient belonging to the patient group are registered.
  • a record of a patient group also includes a patient ID for a representative patient of that patient group.
  • FIG. 9 is a diagram for explaining an example of preprocessing for similar patient search.
  • the preprocessing unit 121 executes the following preprocessing for creating various types of information used when searching for similar patients.
  • the patient information registered in the patient database 111 is multidimensional information having many items.
  • the preprocessing unit 121 converts such patient information into lower-dimensional information, and creates a map 300 in which each patient information is projected on the coordinate space of the converted dimension. .
  • the preprocessing unit 121 registers coordinates indicating the projection position for each patient information in the coordinate space of the dimension after conversion in the map table 112.
  • Each patient information is identified by a patient ID that identifies the patient. Therefore, in the following description, the projection position of the patient information in the coordinate space forming the map 300 may be described as “patient position” on the map 300, and the coordinates indicating the projection position may be described on the map 300. May be described as “patient coordinates”.
  • the coordinate space forming the map 300 is set so that the distance between points indicates the degree of similarity between corresponding patient information. More specifically, the closer the distance between points, the higher the degree of similarity between patient information corresponding to each point.
  • principal component analysis or a multidimensional scaling method is used for creating such a map 300.
  • the dimension of the map 300 is preferably two-dimensional or three-dimensional in order to reduce the processing load using the map 300.
  • a two-dimensional map 300 is created as an example.
  • the patient information is converted into two-dimensional information (that is, information indicating the positions of the two coordinate axes in each direction).
  • a coefficient that maximizes the variance or correlation of the values of each item is obtained for the coefficient of the linear combination equation using the values of each item of patient information as variables.
  • the preprocessing unit 121 calculates the eigenvalues and eigenvectors of the variance-covariance matrix or correlation coefficient matrix of the values of the respective items, the principal component corresponding to the largest eigenvalue is the first principal component, and the next A principal component corresponding to a large eigenvalue is defined as a second principal component.
  • the preprocessing unit 121 outputs a principal component score for each patient corresponding to each of the first principal component and the second principal component as position information in each axial direction in the two-dimensional coordinate space.
  • the preprocessing unit 121 determines the dissimilarity between patient information (an index that takes a smaller value as the similarity is higher) for all combinations of patients in the patient database 111. ) Is calculated.
  • the dissimilarity is calculated based on similarities such as cosine similarity and pearson correlation coefficient, for example.
  • the preprocessing unit 121 positions a point corresponding to each patient information on the two-dimensional space so that the calculated dissimilarity between the patient information matches the distance in the two-dimensional space. This positioning process is performed based on the Young-Householder theorem, for example.
  • the preprocessing unit 121 identifies a predetermined number (m) of representative patients from all patients.
  • m is 2 or more and is an integer smaller than the total number of patients.
  • Representative patients are selected from among all patients so as to be evenly distributed (ie, distributed) on the map 300.
  • the map 300a shown in FIG. 9 shows only the position of the representative patient extracted from the map 300.
  • the pre-processing unit 121 randomly selects m patients from all patients until the following condition is satisfied. (Condition) In the map 300, the standard deviation ⁇ 1 of the positions of all the patients and the standard deviation ⁇ 2 of the selected patient positions substantially coincide.
  • the number of patients to be calculated is n
  • the coordinates of each patient in the map 300 are (x n , y n )
  • the center of gravity Sd with respect to the position of n patients is (x 0 , y 0 )
  • the standard deviation of the position is ⁇
  • the center of gravity Sd and the standard deviation ⁇ are obtained by the following equations (1) and (2), respectively.
  • the center of gravity Sd is obtained by substituting the coordinates of all patients into the equation (1), and the standard deviation ⁇ 1 is obtained by substituting the coordinates of all patients and the coordinates of the center of gravity Sd into the equation (2).
  • the standard deviation ⁇ 2 is obtained by substituting the coordinates of each patient selected at random and the coordinates of the center of gravity Sd into the equation (2). In calculating the standard deviation ⁇ 2, the value of the center of gravity for each patient position selected at random may be substituted into Equation (2) instead of the center of gravity Sd.
  • Conditions are determined as follows. For example, it is determined that the condition is satisfied when the absolute value of the difference between the standard deviation ⁇ 1 and the standard deviation ⁇ 2 is equal to or less than a predetermined ratio of the standard deviation ⁇ 1 (or standard deviation ⁇ 2). This predetermined ratio is a value larger than 0 and smaller than 1, for example, 5%. As another example, it is determined that the condition is satisfied when the absolute value of the difference between the standard deviation ⁇ 1 and the standard deviation ⁇ 2 is equal to or smaller than a predetermined threshold value.
  • the preprocessing unit 121 identifies each selected patient as a representative patient and registers the patient ID of each representative patient in the representative patient table 113. In the present embodiment, the preprocessing unit 121 registers not only the patient ID of the representative patient but also all patient information about the representative patient in the representative patient table 113 in the representative patient table 113.
  • the preprocessing unit 121 identifies a patient group corresponding to each identified representative patient.
  • the patient group includes patients existing in a certain distance range centered on the representative patient in the map 300 among all patients. As a result, patients whose patient information is somewhat similar to the representative patient belong to the patient group.
  • patients 311a to 311d belong to the patient group 311 corresponding to the representative patient 301
  • patients 312a to 312d belong to the patient group 312 corresponding to the representative patient 302.
  • the pre-processing unit 121 creates a record for each representative patient in the patient group table 114, and registers the patient IDs of the patients belonging to the patient group of the representative patient in the corresponding record in the patient group table 114.
  • the distance range for setting the patient group is set so that all patients except the representative patient on the map 300 belong to at least one patient group.
  • the ranges of adjacent patient groups may overlap. In this case, the same patient is allowed to belong to a plurality of patient groups.
  • FIG. 10 is a diagram for explaining an example of a similar patient search process.
  • the search processing unit 122 receives a search request for a patient similar to the query patient 400 from the terminal device 200.
  • the search processing unit 122 first searches for similar patients using only representative patients as search targets. That is, the search processing unit 122 calculates the similarity of the patient information of each representative patient with respect to the patient information of the query patient 400. For example, the search processing unit 122 calculates the similarity using a cosine similarity, a pearson correlation coefficient, a spearman correlation coefficient, a kendall correlation coefficient, and the like.
  • the search processing unit 122 evaluates each item included in the patient information of the query patient 400 and creates a vector. In addition, the search processing unit 122 evaluates each item included in the patient information of each representative patient, and creates a vector for each representative patient. The search processing unit 122 calculates the similarity based on the vector created from the patient information of the query patient and the vector created from the patient information of each representative patient.
  • the search processing unit 122 identifies the representative patient 301 that is most similar to the patient information of the query patient 400 from the result of calculating the similarity.
  • the search processing unit 122 refers to the patient group table 114 and identifies the patient group 311 to which the representative patient 301 belongs. Then, the search processing unit 122 searches for similar patients by using patients (including representative patients) belonging to the patient group 311 as search targets. That is, the similarity of the patient information of each patient belonging to the patient group 311 with respect to the patient information of the query patient 400 is calculated. Note that the similarity calculation method is the same as that used in the above search for a representative patient as a search target.
  • the search processing unit 122 specifies, for example, a patient 311c most similar to the patient information of the query patient 400 from the patients belonging to the patient group 311 as a result of the search.
  • the search processing unit 122 transmits, for example, the identified patient ID of the patient 311c or patient information of the patient 311c to the terminal device 200 as a search result.
  • the search processing unit 122 when the search processing unit 122 receives a search request, the search processing unit 122 does not search for all patients registered in the patient database 111 but only the representative patient as a search target. Perform a patient search. Then, the search processing unit 122 specifies a patient group to which the representative patient specified by the search belongs, and searches for similar patients using only the patients belonging to the specified patient group as a search target.
  • the number of times of similarity calculation between patient information is greatly reduced as compared with a case where all patients registered in the patient database 111 are targeted for search. For this reason, the time taken from the reception of the search request to the end of the search process is greatly reduced.
  • the number of patients registered in the patient database 111 is 10,000
  • the number of representative patients is 100
  • the number of patients belonging to each patient group is 100.
  • the number of times of calculating the similarity is 10,000.
  • the search process can be completed in minutes or seconds by the process of FIG.
  • a map 300 is created in which the distance between patients indicates the degree of similarity between patient information (exactly dissimilarity), and a plurality of maps 300 are distributed as much as possible on the map 300.
  • a representative patient is selected.
  • a patient group to which a representative patient whose patient information is similar to the query patient belongs is specified, and patients in the specified patient group are set as detailed search targets.
  • Such a process reduces the possibility that a true patient whose patient information is most similar to the query patient will be omitted from the search target. Therefore, the search processing time can be shortened while maintaining the search accuracy.
  • FIG. 11 is a flowchart illustrating an example (part 1) of the preprocessing procedure by the preprocessing unit.
  • the process illustrated in FIG. 11 will be described in order of step number.
  • the process of FIG. 11 is periodically executed. For example, regular means once a week.
  • the preprocessing unit 121 refers to the patient database 111 and creates a map using principal component analysis or a multidimensional scale construction method. Actually, the preprocessing unit 121 registers the correspondence relationship between the patient ID of each patient registered in the patient database 111 and the coordinates in the map in the map table 112.
  • the preprocessing unit 121 calculates the center of gravity Sd with respect to the positions of all patients on the map.
  • the center of gravity Sd is calculated by substituting the coordinates of all patients read from the map table 112 into the above-described equation (1).
  • the preprocessing unit 121 calculates a standard deviation ⁇ 1 for all patient positions in the map.
  • the standard deviation ⁇ 1 is calculated by substituting the coordinates of all patients read from the map table 112 and the coordinates of the center of gravity Sd calculated in step S32 into the above-described equation (2). Then, the process proceeds to step S41.
  • FIG. 12 is a flowchart illustrating an example (part 2) of the preprocessing procedure performed by the preprocessing unit. In the following, the process illustrated in FIG. 12 will be described in order of step number.
  • the preprocessing unit 121 randomly selects m patients from the patients registered in the map table 112 (or the patient database 111).
  • the preprocessing unit 121 calculates the standard deviation ⁇ 2 for the position on the map of each patient selected in step S41.
  • the standard deviation ⁇ 2 is calculated by substituting the coordinates of each patient selected in step S41 read from the map table 112 and the center of gravity Sd calculated in step S32 into the above-described equation (2).
  • step S43 The preprocessing unit 121 determines whether or not the standard deviation ⁇ 1 calculated in step S33 and the standard deviation ⁇ 2 calculated in step S42 substantially match. That is, the preprocessing unit 121 determines whether the above-described condition is satisfied. If the condition is satisfied, the process proceeds to step S44. In this case, n patients selected in step S41 are specified as representative patients. On the other hand, if the condition is not satisfied, the process proceeds to step S41.
  • the pre-processing unit 121 creates m records in the representative patient table 113, and registers the patient information of each identified representative patient in an individual record. In addition, the preprocessing unit 121 creates m records in the patient group table 114 and registers a unique group ID in each record. Then, the preprocessing unit 121 registers the patient ID of each identified representative patient in an individual record in the patient group table 114.
  • the preprocessing unit 121 selects one representative patient.
  • the preprocessing unit 121 refers to the map table 112 and calculates the distances (Euclidean distances) between the representative patient positions selected in step S45 and the positions of all other patients registered in the map table 112. To do.
  • the pre-processing unit 121 selects all patients whose distance from the representative patient is within a predetermined distance from the other patients whose distances were calculated in step S46.
  • the preprocessing unit 121 registers the patient ID of each selected patient in a record corresponding to the representative patient in the patient group table 114.
  • the pre-processing unit 121 determines whether all representative patients have been selected. If there is an unselected representative patient, the process proceeds to step S45. If all representative patients have been selected, the process is terminated.
  • FIG. 13 is a flowchart illustrating an example of a processing procedure for similarity search. In the following, the process illustrated in FIG. 13 will be described in order of step number.
  • the search processing unit 122 receives a search request for similar patients similar to the query patient from the terminal device 200.
  • the search request includes patient information of the query patient. Further, the search request may include only the patient ID for identifying the query patient.
  • the search processing unit 122 refers to the patient database 111 and acquires patient information corresponding to the patient ID included in the search request. In this case, in the following processing, the patient information excluding the patient information of the query patient among the patient information registered in the patient database 111 is a search target.
  • the search processing unit 122 refers to the representative patient table 113 and acquires patient information of all representative patients.
  • the search processing unit 122 calculates the similarity of the patient information of each representative patient with respect to the patient information of the query patient.
  • the search processing unit 122 identifies the representative patient most similar to the patient information of the query patient from the result of calculating the similarity.
  • the search processing unit 122 refers to the patient group table 114 and identifies the patient group to which the identified representative patient belongs.
  • the search processing unit 122 refers to the patient database 111 and acquires patient information of all patients belonging to the specified patient group.
  • the search processing unit 122 calculates the degree of similarity of each acquired patient information with respect to the patient information of the query patient.
  • the search processing unit 122 identifies the patient most similar to the patient information of the query patient from the result of calculating the similarity.
  • the search processing unit 122 outputs the patient information or patient ID of the patient specified in step S54 to the terminal device 200 as the search result of the similar search. Then, the process ends.
  • the information processing according to the first embodiment can be realized, for example, by causing a processor used in the search device 1 to execute a program.
  • the information processing of the second embodiment can be realized by causing the processor 101 to execute a program, for example.
  • the program can be recorded on a computer-readable recording medium.
  • the program can be distributed by distributing a recording medium on which the program is recorded.
  • programs that realize functions corresponding to the preprocessing unit 121 and the search processing unit 122 may be separate programs, and each program may be distributed separately.
  • the functions of the preprocessing unit 121 and the search processing unit 122 may be realized by separate computers.
  • the computer may store (install) a program recorded in a recording medium in a storage device such as the RAM 102 or the HDD 103, and read and execute the program from the storage device.

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

 患者情報の類似検索にかかる時間を短縮すること。 検索装置(1)は、記憶部(1a)と演算部(1b)とを有する。記憶部(1a)は、複数の患者のそれぞれに関する複数の患者情報のうち、それぞれが類似する患者情報の集合である患者情報群(11,12,13)をそれぞれ代表する複数の代表患者情報(11a,12a,13a)を少なくとも記憶する。演算部(1b)は、代表患者情報(11a,12a,13a)の中から、指定された指定患者情報(30)との類似度が最も高い患者情報(13a)を特定する。演算部(1b)は、患者情報(13a)が属する患者情報群(13)に含まれる患者情報の中から、指定患者情報(30)との類似度が最も高い患者情報(13b)を特定する。

Description

検索プログラム、検索方法および検索装置
 本発明は検索プログラム、検索方法および検索装置に関する。
 近年、医療分野でのデータベースの活用に関する研究が進んでいる。例えば、患者個人についての検査結果や診断結果などを含む患者情報が多数登録されたデータベースを用いて、類似症例を検索することが研究されている。また、データベースの例としては、患者個人についての臨床病理情報や画像診断データ、病変部位におけるゲノム/オミックス情報などを統合した疾患オミックス統合データベースの研究が進んでいる。
 また、原画像とテンプレート画像とのマッチングに関する技術の一例として、次のような技術が提案されている。この技術では、原画像の解像度を変換した階層的な画像が用いられ、最初に、最も解像度の低い最上層の画像を用いてマッチングが行われる。その際、最上層の画像から、テンプレート画像との相関値がしきい値以上である点群が複数抽出され、各点群において最大の相関値を有する点が探索点に決定される。
特開平7-49949号公報
 ところで、上記のような患者情報が登録されたデータベースから、ある患者の患者情報と類似する患者情報を検索する処理では、データベースに登録された情報が多いほど検索処理に時間がかかるという問題がある。例えば、データベースに登録された患者情報の数が多いほど検索処理時間は長くなり、また、各患者情報に含まれる情報の項目数が多いほど検索処理時間は長くなる。
 1つの側面では、本発明は、患者情報の類似検索にかかる時間を短縮することが可能な検索プログラム、検索方法および検索装置を提供することを目的とする。
 1つの態様では、検索プログラムが提供される。この検索プログラムは、複数の患者のそれぞれに関する複数の患者情報を記憶する記憶部から複数の患者情報を取得可能なコンピュータに、複数の患者情報のうち、それぞれが類似する患者情報の集合である複数の患者情報群をそれぞれ代表する複数の代表患者情報を記憶部から取得して、複数の代表患者情報の中から、指定された指定患者情報との類似度が最も高い第1の患者情報を特定し、複数の患者情報群のうち、第1の患者情報が属する特定患者情報群に含まれる患者情報を記憶部から取得して、特定患者情報群に含まれる患者情報の中から、指定患者情報との類似度が最も高い第2の患者情報を特定する、処理を実行させる。
 また、1つの態様では、検索方法が提供される。この検索方法は、複数の患者のそれぞれに関する複数の患者情報を記憶する記憶部から複数の患者情報を取得可能なコンピュータが、複数の患者情報のうち、それぞれが類似する患者情報の集合である複数の患者情報群をそれぞれ代表する複数の代表患者情報を記憶部から取得して、複数の代表患者情報の中から、指定された指定患者情報との類似度が最も高い第1の患者情報を特定し、複数の患者情報群のうち、第1の患者情報が属する特定患者情報群に含まれる患者情報を記憶部から取得して、特定患者情報群に含まれる患者情報の中から、指定患者情報との類似度が最も高い第2の患者情報を特定する。
 また、1つの態様では、検索装置が提供される。この検索装置は、記憶部と演算部とを有する。記憶部は、複数の患者のそれぞれに関する複数の患者情報のうち、それぞれが類似する患者情報の集合である複数の患者情報群をそれぞれ代表する複数の代表患者情報を少なくとも記憶する。演算部は、複数の代表患者情報の中から、指定された指定患者情報との類似度が最も高い第1の患者情報を特定し、複数の患者情報群のうちの第1の患者情報が属する特定患者情報群に含まれる患者情報の中から、指定患者情報との類似度が最も高い第2の患者情報を特定する。
 1つの側面では、患者情報の類似検索にかかる時間を短縮できる。
 本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。
第1の実施の形態の検索装置を示す図である。 第2の実施の形態の情報処理システムを示す図である。 サーバのハードウェア例を示す図である。 情報処理システムの機能例を示す図である。 患者データベースの例を示す図である。 マップテーブルの例を示す図である。 代表患者テーブルの例を示す図である。 患者グループテーブルの例を示す図である。 類似患者検索の前処理の例について説明するための図である。 類似患者の検索処理の例について説明するための図である。 前処理部による前処理手順の例(その1)を示すフローチャートである。 前処理部による前処理手順の例(その2)を示すフローチャートである。 類似検索の処理手順の例を示すフローチャートである。
 以下、本実施の形態について図面を参照して説明する。
 [第1の実施の形態]
 図1は、第1の実施の形態の検索装置を示す図である。検索装置1は、複数の患者情報の中から、指定された患者情報と類似する患者情報、または当該患者情報に対応する患者を検索する装置である。検索装置1は、記憶部1aおよび演算部1bを有する。
 記憶部1aは、RAM(Random Access Memory)などの揮発性記憶装置でもよいし、HDD(Hard Disk Drive)やフラッシュメモリなどの不揮発性記憶装置でもよい。演算部1bは、例えば、プロセッサである。プロセッサには、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)などを含み得る。また、演算部1bは、マルチプロセッサであってもよい。
 記憶部1aは、類似検索の対象となる複数の患者情報を記憶する。患者情報は、対応する患者に関する様々な情報を含む。例えば、患者情報は、患者の性別などの属性情報、患者の診断結果、患者の検査結果、治療法の実施の有無、患者の状態(病状)やその状態になるまでの期間などの情報を含み得る。本実施の形態では例として、記憶部1aは、類似検索の対象となる複数の患者情報が登録された患者情報データベース10を記憶する。
 なお、検索装置1内の記憶部1aは、類似検索の対象となるすべての患者情報を記憶している必要はない。例えば、これらの複数の患者情報が検索装置1の外部に存在する外部装置に記憶され、検索装置は、外部装置から処理に必要な患者情報だけを読み出して記憶部1aに記憶してもよい。
 ところで、患者情報データベース10内の患者情報は、複数の患者情報群にあらかじめ分類されている。患者情報群は、類似する患者情報の集合である。図1の例では、患者情報データベース10内の患者情報は、3つの患者情報群11~13に分類されている。なお、患者情報データベース10内の各患者情報は、複数の患者情報群に属していてもよい。
 また、患者情報群に属する患者情報の1つは、その患者情報群を代表する代表患者情報が設定されている。図1の例では、患者情報群11に属する患者情報のうち、患者情報11aが代表患者情報に設定されている。また、患者情報群12に属する患者情報のうち、患者情報12aが代表患者情報に設定されている。さらに、患者情報群13に属する患者情報のうち、患者情報13aが代表患者情報に設定されている。なお、図1では、患者情報群11~13のそれぞれを代表する患者情報11a,12a,13aの集合を、代表患者情報群20として示している。
 これらの複数の代表患者情報は、互いの類似度ができるだけ低い方が望ましい。例えば、複数の代表患者情報は、点間距離が対応する患者情報間の非類似度を示すように設定された座標空間に患者情報データベース10内の各患者情報を投影した場合に、各代表患者情報に対応する位置がその座標空間において分散するように、患者情報データベース10内の患者情報の中から選択される。
 なお、各患者情報群に含める患者情報の選択処理や、患者情報群ごとの代表患者情報の選択処理は、検索装置1に実行されてもよいし、検索装置1以外の装置に実行されてもよい。
 演算部1bは、検索キーとなる患者情報である指定患者情報30の指定を受け付ける。すると、演算部1bは、まず、患者情報データベース10内の患者情報のうち、患者情報群11~13のそれぞれの代表患者情報(すなわち、代表患者情報群20に含まれる患者情報11a,12a,13a)を検索対象として検索処理を実行する。具体的には、演算部1bは、指定患者情報30と各代表患者情報との類似度を算出し、代表患者情報の中から、指定患者情報30との類似度が最も高い患者情報を特定する(ステップS1)。図1の例では、患者情報群13を代表する患者情報13aが特定されたものとする。
 次に、演算部1bは、特定された患者情報13aが属する患者情報群13を検索対象として検索処理を実行する。具体的には、演算部1bは、指定患者情報30と患者情報群13に属する各患者情報との類似度を算出し、患者情報群13に属する患者情報の中から、指定患者情報30との類似度が最も高い患者情報を特定する(ステップS2)。
 図1の例では、患者情報13bが特定されたものとする。演算部1bは、検索結果として、例えば、特定された患者情報13b、または患者情報13bに対応する患者の識別情報を出力する。
 以上の第1の実施の形態では、検索装置1による検索対象は、代表患者情報群20に属する患者情報と、1つの代表患者情報に対応する患者情報群に属する患者情報とに限定される。これにより、患者情報データベース10内のすべての患者情報を検索対象とした場合と比較して、患者情報間の類似度の演算回数が低減される。その結果、類似検索にかかる時間が短縮される。
 また、患者情報は、それぞれが類似する患者情報の集合である複数の患者情報群に分類され、最初に検索対象とされる各代表患者情報は、各患者情報群を代表する患者情報とされる。そして、その中で指定患者情報に最も類似する代表患者情報が特定され、特定された代表患者情報が属する患者情報群、すなわち、特定された代表患者情報に類似する複数の患者情報が、次の検索対象とされる。このような処理により、患者情報データベース10内の患者情報のうち、指定患者情報との類似度が実際に最も高い患者情報が、検索対象から漏れる可能性が低くなる。したがって、検索精度を維持しながら、検索処理にかかる時間を短縮することができる。
 なお、前述のように、検索装置1内の記憶部1aは、類似検索の対象となる患者情報データベース10内のすべての患者情報を記憶している必要はない。例えば、患者情報データベース10が外部装置に記憶されている場合、検索装置1は、患者情報データベース10内の患者情報のうち、少なくとも、代表患者情報群20に含まれる代表患者情報と、ステップS1で特定された患者情報が属する患者情報群に含まれる患者情報とを、外部装置から記憶部1aに読み込む。
 [第2の実施の形態]
 図2は、第2の実施の形態の情報処理システムを示す図である。第2の実施の形態の情報処理システムは、サーバ100および端末装置200を含む。サーバ100および端末装置200は、ネットワーク900を介して接続されている。ネットワーク900は、LAN(Local Area Network)でもよいし、WAN(Wide Area Network)やインターネットなどの広域ネットワークでもよい。
 サーバ100は、複数の患者情報が登録された患者データベースを記憶する。患者情報には、患者に関する複数項目の情報が登録される。例えば、患者の性別などの属性情報、患者の診断結果、患者の検査結果、治療法の実施の有無、患者の状態(病状)やその状態になるまでの期間などの情報が、患者情報に登録される。
 また、サーバ100は、端末装置200からの検索依頼に応じて、ある患者と患者情報の内容が類似する患者を患者データベースから検索し、端末装置200に送信する。このような検索は、“類似症例検索”とも呼ばれる。以下、検索依頼において指定される患者を「クエリ患者」、検索によって患者データベースから抽出される患者を「類似患者」と記載する場合がある。
 なお、サーバ100は、図1の検索装置1の一例である。
 端末装置200は、ユーザが使用するクライアントコンピュータである。
 図3は、サーバのハードウェア例を示す図である。サーバ100は、プロセッサ101、RAM102、HDD103、画像信号処理部104、入力信号処理部105、読み取り装置106および通信インタフェース107を有する。各ユニットがサーバ100のバスに接続されている。
 プロセッサ101は、サーバ100全体を制御する。プロセッサ101は、例えば、CPU、DSP、ASICまたはFPGAなどである。また、プロセッサ101は、複数のプロセッシング要素を含むマルチプロセッサであってもよい。さらに、プロセッサ101は、CPU、DSP、ASIC、FPGAなどのうちの2以上の要素の組み合わせであってもよい。
 RAM102は、サーバ100の主記憶装置である。RAM102は、プロセッサ101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部を一時的に記憶する。また、RAM102は、プロセッサ101による処理に用いる各種データを記憶する。
 HDD103は、サーバ100の補助記憶装置である。HDD103は、内蔵した磁気ディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。HDD103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。サーバ100は、フラッシュメモリやSSD(Solid State Drive)などの他の種類の補助記憶装置を備えてもよく、複数の補助記憶装置を備えてもよい。
 画像信号処理部104は、プロセッサ101からの命令に従って、サーバ100に接続されたディスプレイ801に画像を出力する。ディスプレイ801としては、CRT(Cathode Ray Tube)ディスプレイ、液晶ディスプレイ(LCD:Liquid Crystal Display)、有機EL(Electro-Luminescence)ディスプレイなど各種のディスプレイを用いることができる。
 入力信号処理部105は、サーバ100に接続された入力デバイス802から入力信号を取得し、プロセッサ101に出力する。入力デバイス802としては、マウスやタッチパネルなどのポインティングデバイスやキーボードなどの各種の入力デバイスを用いることができる。サーバ100には、複数の種類の入力デバイスが接続されてもよい。
 読み取り装置106は、記録媒体803に記録されたプログラムやデータを読み取る装置である。記録媒体803として、例えば、フレキシブルディスク(FD:Flexible Disk)やHDDなどの磁気ディスク、CD(Compact Disc)やDVD(Digital Versatile Disc)などの光ディスク、光磁気ディスク(MO:Magneto-Optical disk)を使用できる。また、記録媒体803として、例えば、フラッシュメモリカードなどの不揮発性の半導体メモリを使用することもできる。読み取り装置106は、例えば、プロセッサ101からの命令に従って、記録媒体803から読み取ったプログラムやデータをRAM102またはHDD103に格納する。
 通信インタフェース107は、ネットワーク900を介して端末装置200と通信を行う。通信インタフェース107は、有線通信インタフェースでもよいし、無線通信インタフェースでもよい。
 なお、端末装置200もサーバ100と同様のハードウェアにより実現できる。
 図4は、情報処理システムの機能例を示す図である。サーバ100は、記憶部110、前処理部121および検索処理部122を有する。記憶部110は、例えば、RAM102またはHDD103に確保した記憶領域として実装される。前処理部121および検索処理部122の処理は、例えば、プロセッサ101が所定のプログラムを実行することで実現される。
 記憶部110は、患者データベース111、マップテーブル112、代表患者テーブル113および患者グループテーブル114を記憶する。患者データベース111には、多数の患者情報が登録されている。マップテーブル112、代表患者テーブル113および患者グループテーブル114は、検索処理部122での検索処理のために前処理部121によって作成される情報である。
 前処理部121は、検索処理部122での類似患者の検索処理の実行のための前処理を実行する。前処理部121は、まず、患者データベース111に登録された、多次元情報である患者情報を、2次元、3次元といった低次元の情報に変換する。前処理部121は、変換後の次元の座標空間における各患者の位置を示すマップ(散布図)を作成する。マップの作成には、例えば、主成分分析または多次元尺度構成法が用いられる。これにより、マップ上での患者間の距離は、対応する患者情報間の類似度を示すようになる。
 マップテーブル112には、マップ上の各患者の座標が登録される。すなわち、マップテーブル112は、作成されるマップに対応する実体的な情報である。そして、マップテーブル112に登録された患者の座標は、その患者についての次元変換後の患者情報を示す。
 また、前処理部121は、マップテーブル112に基づいて、全患者の中から複数の代表患者を特定する。代表患者は、マップ上の患者の分布領域内で分散するように特定される。特定された代表患者は、代表患者テーブル113に登録される。なお、代表患者テーブル113には、代表患者に対応する患者データベース111内の患者情報も登録されてもよい。
 また、前処理部121は、特定した代表患者のそれぞれに対応する患者グループを特定する。患者グループには、全患者のうち、マップにおいて代表患者を中心とした一定距離範囲に存在する患者が含められる。すなわち、患者グループには、代表患者と患者情報がある程度類似する患者が属する。患者グループテーブル114には、各患者グループに属する患者の識別情報(患者ID)が登録される。
 検索処理部122は、端末装置200から、類似患者の検索依頼を受信する。検索依頼には、クエリ患者の患者情報が含まれる。また、検索依頼には、クエリ患者を識別する患者IDのみが含まれていてもよい。この場合、検索処理部122は、患者データベース111を参照し、検索依頼に含まれる患者IDに対応する患者情報を取得する。
 検索処理部122は、クエリ患者の患者情報に対する各代表患者の患者情報の類似度を算出する。検索処理部122は、類似度を算出した結果から患者情報がクエリ患者に最も類似している代表患者を特定する。検索処理部122は、患者グループテーブル114を参照し、特定した代表患者が属するグループを特定する。検索処理部122は、クエリ患者の患者情報に対する特定したグループに属する各患者の患者情報の類似度を算出する。検索処理部122は、類似度を算出した結果から患者情報がクエリ患者に最も類似している患者を類似患者として特定する。制御部120は、検索結果として特定した類似患者の情報を端末装置200に送信する。ここで、端末装置200に送信される情報とは、類似患者の患者IDでもよいし、類似患者の患者情報の全部または一部の情報でもよい。これにより、検索の結果を端末装置200のディスプレイに表示させることができる。
 なお、記憶部110に記憶される情報のうち、少なくとも患者データベース111は、サーバ100の外部の記憶装置に記憶されていてもよい。この場合、サーバ100は、患者データベース111に登録された患者情報を外部の記憶装置から取得して利用する。
 図5は、患者データベースの例を示す図である。患者データベース111は、記憶部110に格納される。患者データベース111は、例えば、患者ID、性別、年齢、INF(Interferon)治療、TAE(Transcatheter Arterial Embolization)、RFA(RadioFrequency Ablation)、ALT(Alanine Aminotransferase)、PLT(Platelet)、ステージ、生存期間、再発および無再発期間の項目を含む。患者データベース111における1つの患者IDに対応するレコードが、その患者IDに対応する患者についての患者情報である。
 患者IDの項目には、患者を識別するための情報が登録される。性別の項目には、性別を識別する情報が登録される。性別の項目には、“1”(男性)または“0”(女性)が登録される。年齢の項目には、年齢を示す数値が登録される。
 INF治療の項目には、肝炎の治療法の一種であるINF治療を行ったか否かを示す情報が登録される。INF治療の項目には、“1”(INF治療を行った)または“0”(INF治療を行っていない)が登録される。TAEの項目には、肝臓がんの治療法の一種であるTAEを行ったか否かを示す情報が登録される。TAEの項目には、“1”(TAEを行った)または“0”(TAEを行っていない)が登録される。RFAの項目には、肝臓がんの治療法の一種であるRFAを行ったか否かを示す情報が登録される。RFAの項目には、“1”(RFAを行った)または“0”(RFAを行っていない)が登録される。
 ALTの項目には、ALTの検査値が登録される。PLTの項目には、PLTの検査値が登録される。ステージの項目には、所定種類のがんの進行度を示す情報が登録される。ステージの項目には、例えば、0~4のいずれかが登録される。数字が大きいほどがんの進行度が高いことを示す。生存期間の項目には、治療開始からの生存期間を示す情報が登録される。
 再発の項目には、病気が再発したか否かを示す情報が登録される。再発の項目には、“1”(再発した)または“0”(再発していない)が登録される。無再発期間の項目には、治療開始から病気が再発していない期間を示す数値が登録される。再発の項目に“1”が登録されている場合、無再発期間の項目には、治療開始から病気が再発するまでの期間が登録される。
 以上の図5の例において、性別および年齢は、患者の属性情報の一例であり、INF治療、TAEおよびRFAは、患者に対する治療法の実施の有無を示す情報の一例であり、ALTおよびPLTは、患者の検査結果の一例である。また、ステージは、患者の状態を示す情報の一例であり、再発は、患者がある状態になったか否かを示す情報の一例である。ステージおよび再発は、患者の診断結果の一例とも言える。生存期間および再発は、患者がある状態になるまでの期間を示す情報の一例である。
 また、患者データベース111には、患者の検査結果の一例として、病変部位における遺伝子発現量が登録されてもよい。遺伝子発現量は、例えば、DNAプローブごとに登録される。さらに、患者データベース111には、患者の検査結果の一例として、X線やMRI(Magnetic Resonance Imaging)などによる撮影画像(またはその画像へのリンク)が登録されてもよい。
 図6は、マップテーブルの例を示す図である。マップテーブル112は、記憶部110に格納される。マップテーブル112は、患者ごとのレコードを有する。各レコードには、患者IDおよび座標が登録される。患者IDは、患者を識別するための識別情報である。座標は、マップにおける位置情報を示す。この位置情報は、患者データベース111に登録された対応する患者情報を低次元の情報に変換して得られた情報に対応する。
 図7は、代表患者テーブルの例を示す図である。代表患者テーブル113は、記憶部110に格納される。代表患者テーブル113は、代表患者ごとのレコードを有する。各レコードには、患者データベース111から抽出された、代表患者の患者情報が登録される。図7に示すように、代表患者テーブル113のレコードは、患者IDによって識別される。なお、代表患者テーブル113には、代表患者の患者IDのみが登録されてもよい。
 図8は、患者グループテーブルの例を示す図である。患者グループテーブル114は、記憶部110に格納される。患者グループテーブル114は、患者グループごとのレコードが登録される。各レコードには、患者グループを識別するグループIDと、患者グループに属する患者を識別する患者IDとが登録される。図8の例では、グループID“001”の患者グループに対して、患者ID“1010162”,“1017648”の患者が属していることを示す。なお、ある患者グループのレコードには、その患者グループの代表患者についての患者IDも含まれる。
 図9は、類似患者検索の前処理の例について説明するための図である。前処理部121は、患者データベース111に基づいて、類似患者の検索時に利用する各種の情報を作成する、次のような前処理を実行する。
 図5に示したように、患者データベース111に登録された患者情報は、多数の項目を有する多次元の情報である。前処理部121は、まず、ステップS11に示すように、このような患者情報をより低次元の情報に変換し、変換後の次元の座標空間に各患者情報が投影されたマップ300を作成する。前処理部121は、変換後の次元の座標空間における各患者情報についての投影位置を示す座標を、マップテーブル112に登録する。
 なお、各患者情報は、患者を識別する患者IDによって識別される。そこで、以下の説明では、マップ300を形成する座標空間における患者情報の投影位置を、マップ300上の「患者の位置」と記載する場合があり、また、投影位置を示す座標を、マップ300上の「患者の座標」と記載する場合がある。
 ここで、マップ300を形成する座標空間は、点間距離が対応する患者情報間の類似性の度合いを示すように設定される。より具体的には、点と点との距離が近いほど、各点に対応する患者情報間の類似度は高い。このようなマップ300の作成には、例えば、主成分分析または多次元尺度構成法が用いられる。
 また、マップ300の次元は、マップ300を用いた処理の負荷を低減するために、2次元または3次元であることが望ましい。以下の説明では、例として、2次元のマップ300を作成するものとする。この場合、患者情報は、2次元の情報(すなわち、2つの座標軸の各方向に対する位置を示す情報)に変換される。
 主成分分析が用いられる場合、患者情報の各項目の値を変数とする線形結合式の係数について、各項目の値の分散または相関が最大となるような係数が求められる。実際には、例えば、前処理部121は、各項目の値の分散共分散行列または相関係数行列の固有値および固有ベクトルを算出し、最も大きい固有値に対応する主成分を第1主成分、その次に大きい固有値に対応する主成分を第2主成分とする。前処理部121は、第1主成分および第2主成分にそれぞれ対応する患者ごとの主成分スコアを、2次元座標空間における各軸方向の位置情報として出力する。
 また、多次元尺度構成法を用いる場合、前処理部121は、患者データベース111内の患者と患者とのすべての組み合わせについて、患者情報間の非類似度(類似性が高いほど小さい値をとる指標)を算出する。非類似度は、例えば、コサイン類似度、pearson相関係数などの類似度に基づいて算出される。前処理部121は、算出された患者情報間の非類似度が2次元空間上の距離と一致するように、各患者情報に対応する点を2次元空間上に位置付ける。この位置付け処理は、例えば、Young-Householderの定理に基づいて行われる。
 次に、ステップS12に示すように、前処理部121は、すべての患者の中から所定人数(m人)の代表患者を特定する。ただし、mは、2以上であり、全患者数より小さい整数とされる。代表患者は、すべての患者の中から、マップ300上で均等に分布するように(すなわち、分散するように)選択される。なお、図9に示したマップ300aは、マップ300から代表患者の位置のみを抽出して示したものである。
 例えば、前処理部121は、次の条件を満たすようになるまで、全患者からm人の患者をランダムに選択する。
 (条件)マップ300において、全患者の位置の標準偏差σ1と、選択した患者の位置についての標準偏差σ2とがほぼ一致する。
 ここで、計算対象の患者数をn、マップ300における各患者の座標を(xn,yn)、n人の患者の位置に対する重心Sdを(x0,y0)、n人の患者の位置の標準偏差をσとすると、重心Sdおよび標準偏差σは次の式(1),(2)によってそれぞれ求められる。
Figure JPOXMLDOC01-appb-M000001
 重心Sdは、式(1)に全患者の座標を代入することで求められ、標準偏差σ1は、式(2)に全患者の座標と重心Sdの座標とを代入することで求められる。また、標準偏差σ2は、式(2)にランダムに選択された各患者の座標と重心Sdの座標とを代入することで求められる。なお、標準偏差σ2の算出では、重心Sdの代わりに、ランダムに選択された各患者の位置に対する重心の値が式(2)に代入されてもよい。
 条件は、次のように判定される。例えば、標準偏差σ1と標準偏差σ2との差分の絶対値が、標準偏差σ1(または標準偏差σ2)の所定割合以下である場合に、条件を満たすと判定される。この所定割合とは、0より大きく1より小さい値であり、例えば5%である。また、別の例として、標準偏差σ1と標準偏差σ2との差分の絶対値が所定のしきい値以下の場合に、条件を満たすと判定される。
 前処理部121は、ランダムに選択した各患者について上記の条件が満たされた場合、選択した各患者を代表患者として特定し、各代表患者の患者IDを代表患者テーブル113に登録する。また、本実施の形態では、前処理部121は、代表患者テーブル113に、代表患者の患者IDだけでなく、代表患者についての患者情報をすべて代表患者テーブル113に登録する。
 次に、前処理部121は、ステップS13に示すように、特定した代表患者のそれぞれに対応する患者グループを特定する。患者グループには、全患者のうち、マップ300において代表患者を中心とした一定距離範囲に存在する患者が含められる。これにより、患者グループには、代表患者と患者情報がある程度類似する患者が属するようになる。図9では、例えば、代表患者301に対応する患者グループ311には患者311a~311dが属し、代表患者302に対応する患者グループ312には患者312a~312dが属する。
 前処理部121は、患者グループテーブル114に代表患者ごとのレコードを作成し、代表患者の患者グループに属する患者の患者IDを、患者グループテーブル114の対応するレコードに登録する。
 なお、患者グループを設定するための距離範囲は、マップ300上の代表患者を除くすべての患者が少なくとも1つの患者グループに属するように設定される。また、マップ300において、隣接する患者グループの範囲は重複してもよい。この場合、同じ患者が複数の患者グループに属することが許容される。
 図10は、類似患者の検索処理の例について説明するための図である。
 検索処理部122は、端末装置200から、クエリ患者400に類似する患者の検索依頼を受信する。検索処理部122は、まず、代表患者のみを検索の対象として類似患者の検索を行う。すなわち、検索処理部122は、クエリ患者400の患者情報に対する各代表患者の患者情報の類似度を算出する。例えば、検索処理部122は、コサイン類似度、pearson相関係数、spearman相関係数、kendall相関係数などを用いて、類似度を算出する。
 例えば、コサイン類似度を用いる場合、検索処理部122は、クエリ患者400の患者情報に含まれる各項目を評価してベクトルを作成する。また、検索処理部122は、各代表患者の患者情報に含まれる各項目を評価して、代表患者ごとのベクトルを作成する。検索処理部122は、クエリ患者の患者情報から作成したベクトルと、各代表患者の患者情報から作成したベクトルとに基づいて類似度を算出する。
 ステップS21に示すように、検索処理部122は、類似度を算出した結果からクエリ患者400の患者情報に最も類似する代表患者301を特定する。
 次に、ステップS22に示すように、検索処理部122は、患者グループテーブル114を参照して、代表患者301が属する患者グループ311を特定する。そして、検索処理部122は、患者グループ311に属する患者(代表患者を含む)を検索の対象として類似患者の検索を行う。すなわち、クエリ患者400の患者情報に対する、患者グループ311に属する各患者の患者情報の類似度を算出する。なお、類似度の算出方法は、代表患者を検索の対象とした上記の検索時と同様の方法が用いられる。
 ステップS23に示すように、検索処理部122は、検索の結果、患者グループ311に属する患者の中から、例えば、クエリ患者400の患者情報に最も類似する患者311cを特定する。検索処理部122は、検索結果として、例えば、特定された患者311cの患者ID、あるいは、患者311cの患者情報を端末装置200に送信する。
 以上の図10の処理では、検索処理部122は、検索依頼を受信したとき、患者データベース111に登録されたすべての患者を検索の対象とするのではなく、代表患者のみを検索の対象として類似患者の検索を行う。そして、検索処理部122は、検索によって特定された代表患者が属する患者グループを特定し、特定した患者グループに属する患者だけを検索の対象として類似患者の検索を行う。
 このような処理により、患者データベース111に登録されたすべての患者を検索の対象とした場合と比較して、患者情報間の類似度演算回数が大幅に低減する。このため、検索依頼を受信してから検索処理が終了するまでにかかる時間が大幅に短縮される。例えば、患者データベース111に登録された患者数が10000人、代表患者の数が100人、各患者グループに属する患者数が100人であるとする。この場合に、患者データベース111に登録されたすべての患者を検索の対象として類似患者を検索すると、類似度の演算回数は10000回となる。一方、図10の処理によれば、類似度の演算回数は200回に抑制される。これにより、例えば、全患者を検索対象とした場合に検索処理に数時間かかっていた場合でも、図10の処理により検索処理を数分や数秒で終了させることが可能になる。
 また、図9に示したように、患者間の距離が患者情報間の類似度(正確には非類似度)を示すようなマップ300が作成され、マップ300上でできるだけ分散するように複数の代表患者が選択される。そして、患者情報がクエリ患者と類似する代表患者が属する患者グループが特定され、特定された患者グループ内の患者が詳細な検索対象とされる。このような処理により、患者情報がクエリ患者と最も類似する真の患者が検索対象から漏れる可能性が低くなる。したがって、検索精度を維持しながら、検索処理時間を短縮することができる。
 次に、サーバ100の処理手順についてフローチャートを用いて説明する。
 図11は、前処理部による前処理手順の例(その1)を示すフローチャートである。以下、図11に示す処理をステップ番号に沿って説明する。図11の処理は、定期的に実行される。例えば、定期的とは、1週間に1回である。
 (S31)前処理部121は、患者データベース111を参照し、主成分分析または多次元尺度構成法を用いてマップを作成する。実際には、前処理部121は、患者データベース111に登録された各患者の患者IDとマップにおける座標との対応関係をマップテーブル112に登録する。
 (S32)前処理部121は、マップにおける全患者の位置に対する重心Sdを算出する。重心Sdは、前述の式(1)に、マップテーブル112から読み出した全患者の座標を代入することで算出される。
 (S33)前処理部121は、マップにおける全患者の位置についての標準偏差σ1を算出する。標準偏差σ1は、前述の式(2)に、マップテーブル112から読み出した全患者の座標とステップS32で算出された重心Sdの座標とを代入することで算出される。そして、処理をステップS41に進める。
 図12は、前処理部による前処理手順の例(その2)を示すフローチャートである。以下、図12に示す処理をステップ番号に沿って説明する。
 (S41)前処理部121は、マップテーブル112(または患者データベース111)に登録された患者の中から、m人の患者をランダムに選択する。
 (S42)前処理部121は、ステップS41で選択した各患者のマップ上の位置についての標準偏差σ2を算出する。標準偏差σ2は、前述の式(2)に、マップテーブル112から読み出した、ステップS41で選択した各患者の座標と、ステップS32で算出された重心Sdとを代入することで算出される。
 (S43)前処理部121は、ステップS33で算出された標準偏差σ1とステップS42で算出された標準偏差σ2とがほぼ一致するかを判定する。すなわち、前処理部121は、前述の条件が満たされているかを判定する。条件が満たされている場合、処理をステップS44に進める。この場合、ステップS41で選択されたn人の患者が代表患者として特定される。一方、条件が満たされていない場合、処理をステップS41に進める。
 (S44)前処理部121は、代表患者テーブル113にm個のレコードを作成し、特定された各代表患者の患者情報をそれぞれ個別のレコードに登録する。また、前処理部121は、患者グループテーブル114にm個のレコードを作成し、各レコードにユニークなグループIDを登録する。そして、前処理部121は、特定された各代表患者の患者IDを、患者グループテーブル114における個別のレコードに登録する。
 (S45)前処理部121は、代表患者を1人選択する。
 (S46)前処理部121は、マップテーブル112を参照し、ステップS45で選択した代表患者の位置と、マップテーブル112に登録されたその他のすべての患者の位置との距離(ユークリッド距離)を算出する。
 (S47)前処理部121は、ステップS46で距離の算出対象とされたその他の患者の中から、代表患者との距離が所定距離以内である患者をすべて選択する。前処理部121は、選択した各患者の患者IDを、患者グループテーブル114における代表患者に対応するレコードに登録する。
 (S48)前処理部121は、すべての代表患者を選択済みかを判定する。未選択の代表患者が存在する場合、処理をステップS45に進める。すべての代表患者を選択済みである場合、処理を終了する。
 なお、図11および図12の処理は、例えば、サーバ100とは別の情報処理装置において実行されてもよい。
 図13は、類似検索の処理手順の例を示すフローチャートである。以下、図13に示す処理をステップ番号に沿って説明する。
 (S51)検索処理部122は、端末装置200から、クエリ患者に類似する類似患者の検索依頼を受信する。検索依頼には、クエリ患者の患者情報が含まれる。また、検索依頼には、クエリ患者を識別する患者IDのみが含まれていてもよい。この場合、検索処理部122は、患者データベース111を参照し、検索依頼に含まれる患者IDに対応する患者情報を取得する。なお、この場合、以下の処理では、患者データベース111に登録された患者情報のうち、クエリ患者の患者情報を除く患者情報が検索対象となる。
 (S52)検索処理部122は、代表患者テーブル113を参照し、すべての代表患者の患者情報を取得する。検索処理部122は、クエリ患者の患者情報に対する各代表患者の患者情報の類似度を算出する。検索処理部122は、類似度を算出した結果からクエリ患者の患者情報に最も類似する代表患者を特定する。
 (S53)検索処理部122は、患者グループテーブル114を参照し、特定した代表患者が属する患者グループを特定する。
 (S54)検索処理部122は、患者データベース111を参照し、特定した患者グループに属するすべての患者の患者情報を取得する。検索処理部122は、クエリ患者の患者情報に対する、取得した各患者情報の類似度を算出する。検索処理部122は、類似度を算出した結果からクエリ患者の患者情報に最も類似する患者を特定する。
 (S55)検索処理部122は、類似検索の検索結果として、ステップS54で特定した患者の患者情報または患者IDを端末装置200に出力する。そして、処理を終了する。
 なお、第1の実施の形態の情報処理は、例えば、検索装置1に用いられるプロセッサに、プログラムを実行させることで実現できる。第2の実施の形態の情報処理は、例えば、プロセッサ101にプログラムを実行させることで実現できる。プログラムは、コンピュータ読み取り可能な記録媒体に記録できる。
 例えば、プログラムを記録した記録媒体を配布することで、プログラムを流通させることができる。また、例えば、前処理部121と検索処理部122とにそれぞれ相当する機能を実現するプログラムを別個のプログラムとし、各プログラムを別個に配布してもよい。また、前処理部121と検索処理部122の機能が別個のコンピュータにより実現されてもよい。コンピュータは、例えば、記録媒体に記録されたプログラムを、RAM102やHDD103などの記憶装置に格納し(インストールし)、当該記憶装置からプログラムを読み込んで実行してもよい。
 上記については単に本発明の原理を示すものである。さらに、多数の変形、変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応するすべての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。
 1 検索装置
 1a 記憶部
 1b 演算部
 10 患者情報データベース
 11,12,13 患者情報群
 11a,12a,13a 患者情報
 20 代表患者情報群
 30 指定患者情報
 S1,S2 ステップ

Claims (7)

  1.  複数の患者のそれぞれに関する複数の患者情報を記憶する記憶部から前記複数の患者情報を取得可能なコンピュータに、
     前記複数の患者情報のうち、それぞれが類似する患者情報の集合である複数の患者情報群をそれぞれ代表する複数の代表患者情報を前記記憶部から取得して、前記複数の代表患者情報の中から、指定された指定患者情報との類似度が最も高い第1の患者情報を特定し、
     前記複数の患者情報群のうち、前記第1の患者情報が属する特定患者情報群に含まれる患者情報を前記記憶部から取得して、前記特定患者情報群に含まれる患者情報の中から、前記指定患者情報との類似度が最も高い第2の患者情報を特定する、
     処理を実行させる検索プログラム。
  2.  前記複数の代表患者情報は、点間距離が対応する患者情報間の非類似度を示すように設定された座標空間に前記複数の患者情報を投影した場合に、前記複数の代表患者情報にそれぞれ対応する位置が前記座標空間において分散するように、前記複数の患者情報の中から選択される、
     請求項1記載の検索プログラム。
  3.  前記複数の患者情報群にそれぞれ属する患者情報は、前記座標空間における位置が、前記複数の代表患者情報のうち対応する代表患者情報についての前記座標空間における位置から一定距離の範囲内に含まれる患者情報である、
     請求項2記載の検索プログラム。
  4.  前記複数の患者情報の中から所定個数の選択患者情報をランダムに選択し、
     前記座標空間における前記複数の患者情報のそれぞれの位置の分散度合いと、前記座標空間における前記所定個数の選択患者情報のそれぞれの位置の分散度合いとの類似性を示す指標が所定のしきい値以上である場合に、前記所定個数の選択患者情報のそれぞれを前記複数の代表患者情報のそれぞれとして選択する、
     処理を前記コンピュータにさらに実行させる請求項2または3記載の検索プログラム。
  5.  前記座標空間は、前記複数の患者情報に基づいて、主成分分析または多次元尺度構成法を用いて設定される、
     請求項2乃至4のいずれか1項に記載の検索プログラム。
  6.  複数の患者のそれぞれに関する複数の患者情報を記憶する記憶部から前記複数の患者情報を取得可能なコンピュータが、
     前記複数の患者情報のうち、それぞれが類似する患者情報の集合である複数の患者情報群をそれぞれ代表する複数の代表患者情報を前記記憶部から取得して、前記複数の代表患者情報の中から、指定された指定患者情報との類似度が最も高い第1の患者情報を特定し、
     前記複数の患者情報群のうち、前記第1の患者情報が属する特定患者情報群に含まれる患者情報を前記記憶部から取得して、前記特定患者情報群に含まれる患者情報の中から、前記指定患者情報との類似度が最も高い第2の患者情報を特定する、
     検索方法。
  7.  複数の患者のそれぞれに関する複数の患者情報のうち、それぞれが類似する患者情報の集合である複数の患者情報群をそれぞれ代表する複数の代表患者情報を少なくとも記憶する記憶部と、
     前記複数の代表患者情報の中から、指定された指定患者情報との類似度が最も高い第1の患者情報を特定し、前記複数の患者情報群のうちの前記第1の患者情報が属する特定患者情報群に含まれる患者情報の中から、前記指定患者情報との類似度が最も高い第2の患者情報を特定する演算部と、
     を有する検索装置。
PCT/JP2015/056638 2015-03-06 2015-03-06 検索プログラム、検索方法および検索装置 WO2016142990A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017504315A JP6521053B2 (ja) 2015-03-06 2015-03-06 検索プログラム、検索方法および検索装置
PCT/JP2015/056638 WO2016142990A1 (ja) 2015-03-06 2015-03-06 検索プログラム、検索方法および検索装置
US15/672,874 US20170372014A1 (en) 2015-03-06 2017-08-09 Search method and search apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/056638 WO2016142990A1 (ja) 2015-03-06 2015-03-06 検索プログラム、検索方法および検索装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/672,874 Continuation US20170372014A1 (en) 2015-03-06 2017-08-09 Search method and search apparatus

Publications (1)

Publication Number Publication Date
WO2016142990A1 true WO2016142990A1 (ja) 2016-09-15

Family

ID=56878597

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/056638 WO2016142990A1 (ja) 2015-03-06 2015-03-06 検索プログラム、検索方法および検索装置

Country Status (3)

Country Link
US (1) US20170372014A1 (ja)
JP (1) JP6521053B2 (ja)
WO (1) WO2016142990A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656395B (zh) * 2021-10-15 2022-03-15 深圳市信润富联数字科技有限公司 数据质量治理方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000123173A (ja) * 1998-10-14 2000-04-28 Ntt Data Corp 画像特徴抽出方法及び類似画像検索システム、記録媒体
WO2010035380A1 (ja) * 2008-09-25 2010-04-01 キヤノン株式会社 データ検索装置およびその制御方法、データ検索システム
WO2013088807A1 (ja) * 2011-12-13 2013-06-20 インターナショナル・ビジネス・マシーンズ・コーポレーション 症例ごとの代表画像及び読影情報を生成する方法、装置及びコンピュータプログラム
US20140074848A1 (en) * 2011-05-13 2014-03-13 Reflect Career Partners Oy Dynamic framework for psychometric testing

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4879519B2 (ja) * 2005-06-03 2012-02-22 株式会社ニデック 医療情報管理システム
JP2013050502A (ja) * 2011-08-30 2013-03-14 Seiko Epson Corp 広告表示制御装置、広告表示制御方法、およびプログラム
JP5263437B2 (ja) * 2012-09-07 2013-08-14 カシオ計算機株式会社 三次元モデリング装置、三次元モデリング方法、ならびに、プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000123173A (ja) * 1998-10-14 2000-04-28 Ntt Data Corp 画像特徴抽出方法及び類似画像検索システム、記録媒体
WO2010035380A1 (ja) * 2008-09-25 2010-04-01 キヤノン株式会社 データ検索装置およびその制御方法、データ検索システム
US20140074848A1 (en) * 2011-05-13 2014-03-13 Reflect Career Partners Oy Dynamic framework for psychometric testing
WO2013088807A1 (ja) * 2011-12-13 2013-06-20 インターナショナル・ビジネス・マシーンズ・コーポレーション 症例ごとの代表画像及び読影情報を生成する方法、装置及びコンピュータプログラム

Also Published As

Publication number Publication date
JP6521053B2 (ja) 2019-05-29
JPWO2016142990A1 (ja) 2017-11-30
US20170372014A1 (en) 2017-12-28

Similar Documents

Publication Publication Date Title
Xu et al. Texture-specific bag of visual words model and spatial cone matching-based method for the retrieval of focal liver lesions using multiphase contrast-enhanced CT images
JP2019153250A (ja) 医療文書作成支援装置、方法およびプログラム
US20080212856A1 (en) Similar case search apparatus and method, and recording medium storing program therefor
JP2007054636A (ja) イメージの対を位置合わせする方法およびコンピュータによって実行される命令からなるプログラムを具現化して該方法を実施するプログラム記憶装置
JP2014029644A (ja) 類似症例検索装置および類似症例検索方法
JP5677521B2 (ja) 情報処理装置、情報処理方法、プログラムおよび記憶媒体
EP3373194B1 (en) Image retrieval apparatus and image retrieval method
JP2008217363A (ja) 類似症例検索装置、方法、およびプログラム
KR101919847B1 (ko) 동일 피사체에 대하여 시간 간격을 두고 촬영된 영상 간에 동일 관심구역을 자동으로 검출하는 방법 및 이를 이용한 장치
JP2014041560A (ja) 画像処理装置、画像処理方法
US20210327583A1 (en) Determination of a growth rate of an object in 3d data sets using deep learning
JP5094775B2 (ja) 症例画像検索装置、方法およびプログラム
JP7542710B2 (ja) 文書作成支援装置、文書作成支援方法及びプログラム
Liang et al. Dense networks with relative location awareness for thorax disease identification
TWI773045B (zh) 影像處理方法、系統及非暫態電腦可讀取儲存媒體
US20230420096A1 (en) Document creation apparatus, document creation method, and document creation program
US20240119750A1 (en) Method of generating language feature extraction model, information processing apparatus, information processing method, and program
JP6642132B2 (ja) 画像処理システム、画像処理方法および画像処理プログラム
JP6521053B2 (ja) 検索プログラム、検索方法および検索装置
JP2013114597A (ja) 情報処理装置、及びその制御方法、プログラム
JP5655327B2 (ja) プログラムおよび情報処理装置
US20220076796A1 (en) Medical document creation apparatus, method and program, learning device, method and program, and trained model
JP2024528381A (ja) 医用画像データの自動追跡読影方法及びシステム
JPWO2018079246A1 (ja) 画像解析装置、方法およびプログラム
US10390798B2 (en) Computer-aided tracking and motion analysis with ultrasound for measuring joint kinematics

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15884488

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017504315

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15884488

Country of ref document: EP

Kind code of ref document: A1