WO2022228347A1 - 药品数据匹配方法、装置、设备及存储介质 - Google Patents
药品数据匹配方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- WO2022228347A1 WO2022228347A1 PCT/CN2022/088784 CN2022088784W WO2022228347A1 WO 2022228347 A1 WO2022228347 A1 WO 2022228347A1 CN 2022088784 W CN2022088784 W CN 2022088784W WO 2022228347 A1 WO2022228347 A1 WO 2022228347A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- drug
- data
- standard
- information
- specification information
- Prior art date
Links
- 239000003814 drug Substances 0.000 title claims abstract description 655
- 229940079593 drug Drugs 0.000 title claims abstract description 645
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000004519 manufacturing process Methods 0.000 claims abstract description 97
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000005516 engineering process Methods 0.000 claims abstract description 10
- 238000006243 chemical reaction Methods 0.000 claims description 26
- 238000001514 detection method Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000003321 amplification Effects 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims 6
- 238000004458 analytical method Methods 0.000 claims 1
- 238000012937 correction Methods 0.000 abstract description 7
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 11
- 238000007726 management method Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 239000006187 pill Substances 0.000 description 2
- 239000007921 spray Substances 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 101100070542 Podospora anserina het-s gene Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
Definitions
- the present application relates to the technical fields of data processing and digital medicine, and in particular, to a drug data matching method, device, device and storage medium.
- the drug database currently under construction not only contains a large amount of drug inventory data, but also includes various usage information of each drug.
- a doctor prescribes a prescription for a patient through the online drug prescribing system, he needs to find the matching drug from the database.
- Even medicines need to be selected based on usage information.
- the drug information in the database is entered by manual input, so it is inevitable that many drug data do not match the standard drugs, so that doctors cannot find matching drugs when prescribing drugs.
- the method used in the prior art is to use artificial intelligence to identify erroneous data and take certain correction and matching methods to achieve. Therefore, the inventor realizes that such a solution needs to use a large amount of historical data to train artificial intelligence. In order to ensure the accuracy of correction, it is difficult to achieve, and the efficiency of drug data matching is not high.
- the main purpose of the present application is to solve the technical problems of difficult technical realization and low efficiency when matching the drug standard information in the existing drug data entry scheme.
- a first aspect of the present application provides a drug data matching method.
- the drug data matching method includes: after the detection drug entry operation is completed, reading the entered drug entry data, where the entered data at least includes drug identification information, drug identification information, and drug identification information. production information and input specification information; sequentially use the drug identification information and the drug production information as query indexes to query whether there is standard drug data that meets the preset conditions in the drug standard library, and obtain the corresponding query result; if the query When the result is that the standard drug data corresponding to the drug identification information does not exist in the drug standard library and there is standard drug data corresponding to the drug production information, the standard specification information of the standard drug data is extracted, and all the standard drug data are extracted. Standardize the standard specification information and the input specification information to obtain standardized specification information; match the standardized specification information of the standard specification information with the standardized specification information of the input rule information to obtain a matching result; The matching result outputs the input result of the drug data.
- a second aspect of the present application provides a drug data matching device, the drug data matching device includes: a reading module, configured to read the input data of the entered drug after the completion of the detection drug entry operation, the entered data at least Including drug identification information, drug production information and input specification information; the query module is used to sequentially use the drug identification information and the drug production information as a query index to query whether there is standard drug data that meets preset conditions in the drug standard library.
- the extraction module is used for if the query result is that the standard drug data corresponding to the drug identification information does not exist in the drug standard library and the standard drug data corresponding to the drug production information exists when the standard specification information of the standard drug data is extracted, and standardize the standard specification information and the input specification information to obtain standardized specification information;
- the matching module is used to standardize the standardized specification information of the standard specification information. The information is matched with the standardized specification information of the input rule information to obtain a matching result; an output module is configured to output the input result of the drug data according to the matching result.
- a third aspect of the present application provides a drug data matching device, comprising: a memory and at least one processor, wherein instructions are stored in the memory; the at least one processor invokes the instructions in the memory, so that all The drug data matching device performs the following steps: after the detection drug input operation is completed, read the input data of the input drug, the input data at least include drug identification information, drug production information and input specification information; The information and the drug production information are query indexes, query whether there is standard drug data that meets the preset conditions in the drug standard database, and obtain the corresponding query result; if the query result is that the drug standard database does not exist and the When the standard drug data corresponding to the drug identification information and the standard drug data corresponding to the drug production information exists, extract the standard specification information of the standard drug data, and standardize the standard specification information and the input specification information to obtain Standardized specification information; match the standardized specification information of the standard specification information with the standardized specification information of the entry rule information to obtain a matching result; output the entry result of the drug data according to the matching result.
- a fourth aspect of the present application provides a computer-readable storage medium, where instructions are stored in the computer-readable storage medium, and when the computer-readable storage medium runs on a computer, the computer performs the following steps: after the detection drug entry operation is completed, Read the input data of the entered drug, the input data at least include drug identification information, drug production information and input specification information; sequentially use the drug identification information and the drug production information as a query index to query whether there is a drug standard database. There is standard drug data that meets the preset conditions, and a corresponding query result is obtained; if the query result is that there is no standard drug data corresponding to the drug identification information in the drug standard library and there is a corresponding drug production information.
- the drug identification information in the input data of the drug is used for matching from the drug standard library. If no match is found, the drug production information is continued to be used to match from the drug standard library. After the data and the specification information in the matched standard drug data are standardized, the matching is carried out. If the matching is consistent, it is determined that the input data is successful; otherwise, the matching fails.
- the above method is used to realize the matching of the drug data. The parameter dimensions of each match are different, thereby improving the accuracy of drug data matching and correction, reducing the amount of data processed at one time, and improving the matching efficiency.
- 1 is a schematic diagram of the first embodiment of the drug data matching method in the embodiment of the application.
- FIG. 2 is a schematic diagram of a second embodiment of the drug data matching method in the embodiment of the application.
- FIG. 3 is a schematic diagram of the third embodiment of the drug data matching method in the embodiment of the application.
- FIG. 4 is a schematic diagram of the fourth embodiment of the drug data matching method in the embodiment of the application.
- FIG. 5 is a schematic diagram of an embodiment of a drug data matching device in an embodiment of the present application.
- FIG. 6 is a schematic diagram of another embodiment of the device for matching drug data in the embodiment of the present application.
- FIG. 7 is a schematic diagram of an embodiment of a drug data matching device in an embodiment of the application.
- FIG. 8 is a schematic matching diagram of the normalization process provided in the embodiment of the present application.
- the embodiments of the present application provide a drug data matching method, device, equipment and storage medium.
- the matching accuracy of drug data is improved. If it does not match, continue to use the drug production information to match from the drug standard library. If it matches, standardize the input data and the specification information in the matched standard drug data, and then match, if the match is consistent , then it is determined that the input data is successful, otherwise, the matching fails.
- the above method is used to achieve the matching of drug data. Since two matches are set, the parameter dimensions of each match are different, thereby improving the accuracy of drug data matching and correction. At the same time, the amount of data to be processed at one time is also reduced, the matching efficiency is improved, and the difficulty of realizing the matching in two rounds is far less than the difficulty of one-time matching in the prior art.
- FIG. 1 is the first embodiment of the drug data matching method in the embodiment of the present application.
- the drug data matching method is mainly used for offline drug data matching. Check whether the drug data entered offline meets the standard drug data. In practical applications, the entered drug data can also be corrected according to the matching results of this method, and even this method can also be used for online prescribing.
- offline matching drugs specifically, the implementation steps of the method are as follows:
- the drug entry operation can be understood as the user's operation of warehousing offline drugs, through which information such as symptom information, specification parameters, drug identification codes, and drug names of offline drugs are entered into the warehousing operation.
- information such as symptom information, specification parameters, drug identification codes, and drug names of offline drugs are entered into the warehousing operation.
- the drug database it is convenient for doctors to prescribe drugs online.
- the drug data is directly converted into drug records and stored in the background database.
- the currently updated data records are read from the background database. And parse out the input data of the drug from the data record.
- the standard database of medicines stores standard data of all medicines or standard parameters of various medicines, and the standard parameters can be understood as different specification parameters of the same medicine.
- the preset condition includes that the similarity between the query index and the drug identification information or drug production information in the drug standard library reaches a preset similarity, or the similarity between the two is added to achieve a preset similarity, or even There is one of the two that is exactly the same.
- the query is specifically performed by parameter matching, that is, whether there is a similar drug in the drug standard library is first matched with the drug identification information.
- the standard drug data of the identification information if there are similar ones and the calculated similarity reaches the preset empirical value, the completeness of the drug identification information will be matched, and if the matching is exactly the same, the corresponding standard drug data will be output directly; If the matching is completely different, then jump to use the drug production information to perform another matching, and the matching principle is the same as that of the drug identification information.
- the similarity between the two corresponding to the standard drug data is calculated, and the two similarities are added to determine whether the sum of the similarities reaches the preset empirical value. , if it is reached, obtain the drug name in the standard drug data for matching, if the names match exactly the same, output the standard drug data, if the sum of the similarity does not reach the preset experience value or the name does not match, the output query fails or Match failed.
- this step before extracting the standard specification information in the standard drug data, it also includes parsing the corresponding specification field name from the input specification information in the input data, and extracting the specification field name from the standard drug data based on the specification field name.
- Standard specification information and then standardize the standard specification information and input specification information by using standardized conversion rules.
- the standardized processing includes de-drying processing, parameter standardization processing, unit standardization processing and data format standardization processing.
- the standardization process specifically includes separately analyzing the standard specification information and the input specification information, and extracting each index and parameter from the standard specification information and the input specification information. Extract the format of its expression in the standard specification information or input specification information. After the extraction is completed, compare the format of the extracted indicators and parameters with the data format set in the standardized conversion rules. If they are consistent, continue to extract. Other indicators and parameters are compared; if they are inconsistent, the standardized conversion rules are used to convert according to the set data format to obtain standardized specification information.
- the query result is that there is standard drug data matching the drug identification information
- the drug name in the input data and the drug name in the standard drug data are obtained for matching, and if the matching is consistent, the output matching is successful If the two are inconsistent, query from the standard library according to the drug production information, and choose whether to execute the standardized processing steps of the specification information according to the query result.
- the standard specification information after standardization is recorded as the first specification information
- the specification information after the standard specification information entered is recorded as the second specification information
- the first specification information and the second specification information are recorded as the first specification information.
- the matching result includes three situations: matching, non-matching, and matching reaching a preset value.
- it also includes determining an adjustment strategy according to the matching result, and adjusting the input data based on the adjustment strategy.
- the drug may be used for the subsequent drug collection of the drug list.
- the input result is specifically determined according to the actual application. For example, when prescribing medicine online, the input result is whether the offline medicine selected by the doctor matches the standard medicine for symptoms, and, for example, the storage operation of medicine, which The entry result is whether the entered drug data is the same as the standard drug data in the standard library.
- the drug identification information and drug production information in the input data of the drug input are respectively queried and matched from the drug standard database in turn. After two query and matching, the specification information is standardized. Then, the matching result of the drug data is determined, thereby determining the input result of the drug data. Based on this method, the matching process is divided into multiple parts, which simplifies the complexity of the matching process and improves the matching efficiency.
- the implementation of the above solution does not require the construction of hardware resources, and only needs to be matched and executed multiple times in the existing system, the implementation process is simple, and the implementation of AI is convenient.
- the second embodiment of the drug data matching method in the embodiment of the present application includes:
- the drug identification information may be an identification code or a drug name.
- the identification code refers to the code number used to identify the drug, such as two-dimensional code, one-dimensional code and 69 code, etc.
- the user can scan the identification code with the code scanning gun and parse it out.
- Information such as drug name and production information can also be generated by a string of digital symbols.
- the drug name and production information take the digital symbol as an example.
- the corresponding data symbol is queried from the drug labeling library based on the digital symbol. If the same digital symbol is queried, then Determine that there are similar standard drug data in the drug standard library, and then extract the drug names in the two for matching. Specifically, after identifying the digital symbol, continue to parse the identification code to obtain the name of the entered drug; if the match is consistent, then It is determined that the same standard drug data exists, and if the matching is inconsistent, the query is continued with the drug production information as the index.
- the identification code of the standard drug data is obtained by scanning the code in the background through the OCR technology.
- the optional identification code is code 69, and the corresponding standard is extracted through the code of season 69. The drug name will then be matched against the drug name entered in the data.
- the drug name when matching the drug name, it includes the recognition of text and special symbols.
- the OCR recognition technology is used to recognize the text of the drug name, and after the text information is obtained, use
- the image processing technology identifies the shape corresponding to the text information and the special symbols in the drug name, and then matches the text information identified from the standard drug name and the entered drug name, the shape corresponding to the text information and the special symbols to obtain Matching result, the matching result includes two kinds of inconsistency and consistency, and the case of consistency also includes that the matching degree reaches the preset experience value and is completely identical.
- the matching process is returned, and this time, the matching process is performed again with the drug production information as the index, and the specific query is to query whether there is drug production information in the fields in the drug standard database.
- the same field content if there is, it is determined that the same standard drug data exists, otherwise there is no.
- this step is specifically implemented as follows:
- the manufacturer information is used as a query index to query whether there is standard drug data with the same manufacturer information in the drug standard library;
- the query based on drug production information is divided into two rounds of query.
- the first round is based on the approval document number, which is the sales batch number of the same drug, and the query is based on the batch number to determine whether there is a previous identical
- the drug data is optional.
- the specific content of different bytes in the approval document number is used. If the contents of the first N-2 bytes in the approval document number are consistent, Then it is determined that the data of the drug is consistent with the data of the standard drug. Otherwise, it is inconsistent, and the matching process of manufacturer information is performed.
- the same standard drug data exists. Specifically, when it is judged that the specific content in the drug production information has a similarity of more than 90%, it is determined that the same standard drug data exists, and then the standard drug data is output. .
- the input drug data is adjusted based on the output standard drug data.
- a prompt box can be displayed in the input interface of the medical management system, or a prompt sound can be sent, and even in the scenario of online prescription, the information about the drug in the deleted drug list can be deleted directly according to the All parameters and usage notes.
- the parameter dimensions of each matching are different, thereby improving the accuracy of drug data matching and correction, reducing the amount of data processed at one time, improving the matching efficiency, and the difficulty of matching in two rounds. Much smaller than the difficulty of one-time matching in the prior art.
- the third embodiment of the drug data matching method in the embodiment of the present application includes:
- the standardization here can be specifically understood as unifying the format of the entered specification information and the specification information queried in the standard library, and matching based on the unified format, which will be more accurate.
- the rules include information parsing rules, data sorting order and data format.
- the standard specification information and the input specification information are respectively standardized according to the preset standardization rules, and the first specification information and the second specification information obtained include:
- the bytes and data in the standard specification information and the input specification information are respectively parsed to obtain the first byte set and the first data set of the standard specification information, and the data of the input specification information. a second set of bytes and a second set of data;
- format conversion is performed on the data in the first data set and the second data set, respectively, to obtain corresponding new data
- the bytes in the first byte set and the second byte set are sorted respectively to obtain a first byte sequence and a second byte sequence;
- the first byte sequence is matched with the corresponding new data
- the second byte sequence is matched with the corresponding new data to obtain the first specification information and the second specification information.
- the replacement dictionary can be referred to as follows:
- MG is converted to mg
- ML is converted to ml.
- the values from va to vh are arranged in order. In other scenarios, the value corresponding to a group will be put it in front.
- the data format includes a unit standard format and a suffix format. According to the data format, the format conversion is performed on the data in the first data set and the second data set respectively, and the corresponding new data obtained includes:
- the suffix characters of each data are adjusted according to the suffix format to form corresponding new data.
- the standardized character tail may have shapes such as 2*3s or 16ml*1s, and another round of simplified operations will be performed to 6s and 16ml.
- the method provided by the above embodiment realizes the matching of drug data. Since two matchings are set, the parameter dimensions of each matching are different, thereby improving the accuracy of matching and correcting drug data, and reducing the one-time processing data. The matching efficiency is improved, and the difficulty of realizing the matching in two rounds is far less than the difficulty of one-time matching in the prior art.
- the fourth embodiment of the drug data matching method in the embodiment of the present application includes:
- f is the preset value
- c is the compatibility probability
- d is the rejection probability
- n is the difference factor number
- e is the amplification factor.
- the setting of the preset value can be determined by collating a large amount of offline data and summarizing the experience of several senior physicians, and the matching result here is that online standard drugs can be realized according to specific information in the drug data.
- the overall implementation process can be as follows:
- the approval number and name will be used to find the drug again, because the approval number and name may find multiple drugs, so the specifications of all drugs need to be standardized and then matched (later Explain how to standardize), that is, in this round, the approval number, name, and specification are used to match standard drugs.
- the drug will be searched using the manufacturer's name and name, because the manufacturer and name may find multiple drugs, so the specifications of all drugs need to be standardized and then matched (how to standardize will be explained later). ), that is, in this round, the manufacturer, name, and specification are used to match standard drugs.
- the parameter dimensions of each matching are different, thereby improving the accuracy of drug data matching and correction, reducing the amount of data processed at one time, improving the matching efficiency, and the difficulty of matching in two rounds. Much smaller than the difficulty of one-time matching in the prior art.
- an embodiment of the drug data matching device in the embodiment of the present application includes:
- the reading module 501 is configured to read the input data of the input drug after the detection drug input operation is completed, and the input data at least include drug identification information, drug production information and input specification information;
- the query module 502 is configured to sequentially use the drug identification information and the drug production information as query indexes to query whether there is standard drug data that meets preset conditions in the drug standard database, and obtain corresponding query results;
- the extraction module 503 is configured to extract the standard drug data corresponding to the drug identification information and the standard drug data corresponding to the drug production information does not exist in the drug standard library if the query result is that the standard drug data corresponds to the drug production information Standard specification information of drug data, and standardize the standard specification information and input specification information to obtain standardized specification information;
- a matching module 504 configured to match the standardized specification information of the standard specification information with the standardized specification information of the entry rule information to obtain a matching result
- the output module 505 is configured to output the input result of the drug data according to the matching result.
- the matching accuracy of drug data is improved by setting up multiple rounds of drug data matching.
- the drug identification information in the input data of the drug is used for matching from the drug standard database. If no match is found, the drug production is continued. The information is matched from the drug standard library. If it is matched, the input data and the specification information in the matched standard drug data are standardized and matched. If the match is consistent, it is determined that the input data is successful; otherwise, the matching fails.
- the matching of drug data is realized by means of two matching methods, and the parameter dimensions of each matching are different, thereby improving the accuracy of matching and correcting drug data, reducing the amount of data processed at one time, and improving the matching efficiency.
- another embodiment of the device for matching drug data in the embodiment of the present application includes:
- the reading module 501 is configured to read the input data of the input drug after the detection drug input operation is completed, and the input data at least include drug identification information, drug production information and input specification information;
- the query module 502 is configured to sequentially use the drug identification information and the drug production information as query indexes to query whether there is standard drug data that meets preset conditions in the drug standard database, and obtain corresponding query results;
- the extraction module 503 is configured to extract the standard drug data corresponding to the drug identification information and the standard drug data corresponding to the drug production information does not exist in the drug standard library if the query result is that the standard drug data corresponds to the drug production information Standard specification information of drug data, and standardize the standard specification information and input specification information to obtain standardized specification information;
- a matching module 504 configured to match the standardized specification information of the standard specification information with the standardized specification information of the entry rule information to obtain a matching result
- the output module 505 is configured to output the input result of the drug data according to the matching result.
- the drug identification information includes an identification code and a drug name
- the query module 502 is specifically used for:
- the drug production information includes an approval number and manufacturer information
- the query module 502 is specifically used for:
- the manufacturer information is used as a query index to query whether there is standard drug data with the same manufacturer information in the drug standard library;
- the extraction module 503 includes:
- a parsing unit 5031 configured to parse the field name in the input specification information
- Extraction unit 5032 configured to identify the record corresponding to the field name in the standard drug data, and extract the standard specification information in the record;
- the standardization processing unit 5033 is configured to perform standardization processing on the standard specification information and the input specification information respectively according to a preset standardization rule to obtain first specification information and second specification information.
- the standardization rules include information parsing rules, data sorting order and data format, and the standardization processing unit 5033 is specifically configured to:
- the bytes and data in the standard specification information and the input specification information are respectively parsed to obtain the first byte set and the first data set of the standard specification information, and the data of the input specification information. a second set of bytes and a second set of data;
- format conversion is performed on the data in the first data set and the second data set, respectively, to obtain corresponding new data
- the bytes in the first byte set and the second byte set are sorted respectively to obtain a first byte sequence and a second byte sequence;
- the first byte sequence is matched with the corresponding new data
- the second byte sequence is matched with the corresponding new data to obtain the first specification information and the second specification information.
- the data format includes a unit standard format and a suffix format
- the standardization processing unit 5033 is specifically used for:
- the suffix characters of each data are adjusted according to the suffix format to form corresponding new data.
- the output module 505 includes:
- the calculation unit 5051 is configured to, if the matching result is that the matching degree between the standardized specification information of the standard specification information and the specification information after the standard entry of the entry rule information is greater than a preset value, determine the matching degree by the following formula: Perform exponential amplification to get the difference value of the specification information of the mismatched part:
- Difference value similar value*log(c/d,n)*e
- f is the preset value
- c is the compatibility probability
- d is the rejection probability
- n is the difference factor number
- e is the amplification factor
- An adjustment unit 5052 configured to determine an adjustment strategy for the input specification information according to the difference value, and based on the standard drug data, adjust the input data according to the adjustment strategy to obtain complete input data;
- the output unit 5053 is configured to output a prompt message that the drug data is corrected successfully after the adjustment is completed.
- the drug identification information and drug production information in the input data of the drug input are respectively queried and matched from the drug standard database in turn. After two query and matching, the specification information is standardized. Then, the matching result of the drug data is determined, thereby determining the input result of the drug data. Based on this method, the matching process is divided into multiple parts, which simplifies the complexity of the matching process and improves the matching efficiency.
- the implementation of the above solution does not require the construction of hardware resources, and only needs to be matched and executed multiple times in the existing system, the implementation process is simple, and the implementation of AI is convenient.
- FIG. 7 is a schematic structural diagram of a drug data matching device provided by an embodiment of the present application.
- the drug data matching device 700 may vary greatly due to different configurations or performances, and may include one or more central processing units. , CPU) 710 (eg, one or more processors) and memory 720, one or more storage media 730 (eg, one or more mass storage devices) storing application programs 733 or data 732.
- the memory 720 and the storage medium 730 may be short-term storage or persistent storage.
- the program stored in the storage medium 730 may include one or more modules (not shown in the figure), and each module may include a series of instruction operations in the route-based user demand prediction device 700 .
- the processor 710 may be configured to communicate with the storage medium 730 to execute a series of instruction operations in the storage medium 730 on the drug data matching device 700 .
- the drug data matching device 700 may also include one or more power supplies 740, one or more wired or wireless network interfaces 750, one or more input and output interfaces 760, and/or, one or more operating systems 731, such as Windows Server , Mac OS X, Unix, Linux, FreeBSD and more.
- operating systems 731 such as Windows Server , Mac OS X, Unix, Linux, FreeBSD and more.
- the blockchain referred to in this application is a new application mode of computer technologies such as distributed data storage, point-to-point transmission, consensus mechanism, and encryption algorithm.
- Blockchain essentially a decentralized database, is a series of data blocks that are associated with cryptographic methods. Each data block contains a batch of information to verify its information. validity (anti-counterfeiting) and generate the next block.
- the blockchain can include the underlying platform of the blockchain, the platform product service layer, and the application service layer.
- the present application also provides a computer-readable storage medium.
- the computer-readable storage medium may be a non-volatile computer-readable storage medium.
- the computer-readable storage medium may also be a volatile computer-readable storage medium. Instructions are stored in the computer-readable storage medium, and when the instructions are run on the computer, the computer is made to perform the following steps: after the completion of the drug entry operation for detection, read the entry data of the entered medicine, and the entry data at least include the medicine Identification information, drug production information and input specification information; sequentially using the drug identification information and the drug production information as query indexes, inquire whether there is standard drug data that meets the preset conditions in the drug standard library, and obtain corresponding query results; If the query result is that there is no standard drug data corresponding to the drug identification information in the drug standard library and there is standard drug data corresponding to the drug production information, extract the standard specification information of the standard drug data , and standardize the standard specification information and the input specification information to obtain standardized specification information; match the standardized specification information of the standard specification information with the
- the integrated unit if implemented in the form of a software functional unit and sold or used as an independent product, may be stored in a computer-readable storage medium.
- the technical solutions of the present application can be embodied in the form of software products in essence, or the parts that contribute to the prior art, or all or part of the technical solutions, and the computer software products are stored in a storage medium , including several instructions for causing a computer device (which may be a personal computer, a server, or a network device, etc.) to execute all or part of the steps of the methods described in the various embodiments of the present application.
- the aforementioned storage medium includes: U disk, mobile hard disk, read-only memory (ROM), random access memory (RAM), magnetic disk or optical disk and other media that can store program codes .
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请涉及数据处理技术领域,公开了一种药品数据匹配方法、装置、设备及存储介质。通过以药品的录入数据中的药品标识信息从药品标准库中进行匹配,若不匹配到,则继续利用药品生产信息从药品标准库中匹配,若匹配到,则对录入数据和匹配的标准药品数据中规格信息进行标准化后,进行匹配,若匹配一致,则确定录入数据成功,反之,则匹配失败,利用上述的方式实现药品数据的匹配,由于设置了两次匹配,每次匹配的参数维度不相同,从而提高了药品数据匹配纠正的准确率,同时也减少一次性处理的数据量,提高了匹配效率。此外,本申请还涉及区块链技术,药品数据可存储于区块链中。
Description
本申请要求于2021年04月30日提交中国专利局、申请号为202110484005.6、发明名称为“药品数据匹配方法、装置、设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在申请中。
本申请涉及数据处理、数字医疗技术领域,尤其涉及一种药品数据匹配方法、装置、设备及存储介质。
随着互联网技术的发展,尤其是在医疗行业中,其正在加速实现医疗信息化智能管理,而药品信息的管理是医疗信息化建设的重要组成部分。目前建设的药品数据库中不仅存在大量的药品库存数据,其还包括每种药品的各种使用信息,而医生通过线上开药系统为患者开药单时,需要从数据库中查找符合的药品,甚至需要根据使用信息选择药品。而在实际应用中,数据库中的药品信息的录入时通过人工录入的方式录入,这样不可避免的出现很多药品数据与标准药品存在不匹配,导致医生在开药时找不到匹配的药品。
针对上述的问题,现有技术中所使用的方式是通过人工智能识别错误数据并采取一定的纠正匹配手段来实现,因此,发明人意识到这样的方案需要使用大量的历史数据对人工智能进行训练才能保证纠正的准确度,实现起来难度大,药品数据匹配的效率也不高。
发明内容
本申请的主要目的在于解决现有的药品数据录入方案在进行药品标准信息匹配时,技术实现难度大,且效率低的技术问题。
本申请第一方面提供了一种药品数据匹配方法,所述药品数据匹配方法包括:在检测药品录入操作完成后,读取录入的药品的录入数据,所述录入数据至少包括药品标识信息、药品生产信息和录入规格信息;依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;若所述查询结果为所述药品标准库中不存在与所述药品标识信息对应的标准药品数据且存在与所述药品生产信息对应的标准药品数据时,提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;将所述标准规格信息标准化后的规格信息与所述录入规则信息标准化后的规格信息进行匹配,得到匹配结果;根据所述匹配结果输出所述药品数据的录入结果。
本申请第二方面提供了一种药品数据匹配装置,所述药品数据匹配装置包括:读取模块,用于在检测药品录入操作完成后,读取录入的药品的录入数据,所述录入数据至少包括药品标识信息、药品生产信息和录入规格信息;查询模块,用于依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;提取模块,用于若所述查询结果为所述药品标准库中不存在与所述药品标识信息对应的标准药品数据且存在与所述药品生产信息对应的标准药品数据时,提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;匹配模块,用于将所述标准规格信息标准化后的规格信息与所述录入规则信息标准化后的规格信息进行匹配,得到匹配结果;输出模块,用于根据所述匹配结果输出所述药品数据的录入结果。
本申请第三方面提供了一种药品数据匹配设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述药品数据匹配设备执行以下步骤:在检测药品录入操作完成后,读取录入的药品的录入数据,所述录入数据至少包括药品标识信息、药品生产信息和录入规格信息;依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的 标准药品数据,得到对应的查询结果;若所述查询结果为所述药品标准库中不存在与所述药品标识信息对应的标准药品数据且存在与所述药品生产信息对应的标准药品数据时,提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;将所述标准规格信息标准化后的规格信息与所述录入规则信息标准化后的规格信息进行匹配,得到匹配结果;根据所述匹配结果输出所述药品数据的录入结果。
本申请的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行以下步骤:在检测药品录入操作完成后,读取录入的药品的录入数据,所述录入数据至少包括药品标识信息、药品生产信息和录入规格信息;依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;若所述查询结果为所述药品标准库中不存在与所述药品标识信息对应的标准药品数据且存在与所述药品生产信息对应的标准药品数据时,提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;将所述标准规格信息标准化后的规格信息与所述录入规则信息标准化后的规格信息进行匹配,得到匹配结果;根据所述匹配结果输出所述药品数据的录入结果。
本申请的技术方案中,以药品的录入数据中的药品标识信息从药品标准库中进行匹配,若不匹配到,则继续利用药品生产信息从药品标准库中匹配,若匹配到,则对录入数据和匹配的标准药品数据中规格信息进行标准化后,进行匹配,若匹配一致,则确定录入数据成功,反之,则匹配失败,利用上述的方式实现药品数据的匹配,由于设置了两次匹配,每次匹配的参数维度不相同,从而提高了药品数据匹配纠正的准确率,同时也减少一次性处理的数据量,提高了匹配效率。
图1为本申请实施例中药品数据匹配方法的第一个实施例示意图;
图2为本申请实施例中药品数据匹配方法的第二个实施例示意图;
图3为本申请实施例中药品数据匹配方法的第三个实施例示意图;
图4为本申请实施例中药品数据匹配方法的第四个实施例示意图;
图5为本申请实施例中药品数据匹配装置的一个实施例示意图;
图6为本申请实施例中药品数据匹配装置的另一个实施例示意图;
图7为本申请实施例中药品数据匹配设备的一个实施例示意图;
图8为本申请实施例中提供的标准化处理的匹配示意图。
本申请实施例提供了一种药品数据匹配方法、装置、设备及存储介质,通过设置多轮药品数据匹配来提高药品数据的匹配精准度,首先以药品的录入数据中的药品标识信息从药品标准库中进行匹配,若不匹配到,则继续利用药品生产信息从药品标准库中匹配,若匹配到,则对录入数据和匹配的标准药品数据中规格信息进行标准化后,进行匹配,若匹配一致,则确定录入数据成功,反之,则匹配失败,利用上述的方式实现药品数据的匹配,由于设置了两次匹配,每次匹配的参数维度不相同,从而提高了药品数据匹配纠正的准确率,同时也减少一次性处理的数据量,提高了匹配效率,分两轮方式匹配的实现难度远小于现有技术中一次性匹配的难度。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意 图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本申请实施例的具体流程进行描述,请参阅图1,本申请实施例中药品数据匹配方法的第一个实施例,该药品数据匹配方法主要是用于对线下药品数据的匹配,检查线下录入的药品数据是否满足标准药品数据,在实际应用中,还可以根据该方法匹配的结果来对录入的药品数据进行纠正,甚至该方法还可以用于在线上开药后对线下匹配药品的使用,具体的,该方法的实现步骤如下:
101、在检测药品录入操作完成后,读取录入的药品的药品标识信息、药品生产信息和录入规格信息;
本实施例中,所述药品录入操作可以理解为是用户对线下药品入库的操作,通过该入库操作将线下药品的症状信息、规格参数、药品识别码和药品名称等信息录入到药品数据库中,以便于医生线上开药的使用。
在该步骤中,每次用户通过手动录入的方式在医药管理系统中输入待录入的药品的数据,具体的在药品管理系统的录入界面中输入药品的各项数据,在检测到用户在录入界面中点击确认按键或者是提交按键时,则确定药品录入操作完成,并启动文字识别小工具,对录入界面中的文字进行解析,以得到药品的录入数据。
在实际应用中,在用户点击确认或者提交按键后,其药品数据直接转换为药品记录,存储至后台数据库中,这时通过触发数据获取小程序,从后台数据库中读取当前更新的数据记录,并从数据记录中解析出药品的录入数据。
102、依次以药品标识信息和药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;
在本实施例中,该药品标准库中存储有所有药品的标准数据或者是存储有各种药品的标准参数,该标准参数可以理解为同一药品的不同规格参数。
该步骤中,在查询时,首先是以药品标识信息查询,在药品标识信息未能查询到时,再利用药品生产信息进行二次查询,当两次查询都未能查询到时,则输出查询结果为匹配失败,若两者中至少存在一种信息能查询到相应的标准药品数据时,则输出查询结果为匹配成功或者是药品数据录入成功。
在本实施例中,该预设条件包括查询索引与药品标准库中的药品标识信息或者药品生产信息相似度达到预设相似度或者是两者的相似度相加达到预设相似度总和,甚至是两者中存在一种完全相同。
在实际应用中,在查询药品标准库中是否存在符合预设条件的标准药品数据时,具体的通过参数匹配的方式进行查询,即是首先以药品标识信息匹配药品标准库中是否存在相似的药品标识信息的标准药品数据,若存在相似的且计算出来的相似度达到预设的经验值时,则对药品标识信息进行完整性的匹配,若匹配完全相同,则直接输出对应的标准药品数据;若匹配完全不相同,则跳转至使用药品生产信息进行再次的匹配,其匹配原理与药品标识信息的相同。
当药品标识信息和药品生产信息均匹配不到完全相同的,则计算两者分别对应于标准药品数据的相似度,并将两个相似度相加,判断相似度总和是否达到预设的经验值,若达到,则获取标准药品数据中的药品名称进行匹配,若名称匹配完全相同,则输出标准药品数据,若相似度总和没有达到预设的经验值或者是名称不匹配,则输出查询失败或者匹配失败。
103、若查询结果为药品标准库中不存在与药品标识信息对应的标准药品数据且存在与药品生产信息对应的标准药品数据时,提取标准药品数据的标准规格信息,并将标准规格 信息和录入规格信息进行标准化处理,得到标准化后的规格信息;
该步骤中,在提取标准药品数据中的标准规格信息之前,还包括从所述录入数据中的录入规格信息中解析对应的规格字段名称,基于该规格字段名称从所述标准药品数据中提取出标准规格信息,然后利用标准化转换规则将标准规格信息和录入规格信息进行标准化处理,在实际应用中,所述标准化处理包括去燥处理、参数标准化处理、单位标准化处理和数据格式标准化处理。
在本实施例中,所述标准化处理的过程具体包括单独对标准规格信息和录入规格信息进行解析处理,将标准规格信息和录入规格信息中的各个指标和参数提取出来,其中在提取时,按照其在标准规格信息或者录入规格信息中的表现格式进行提取,在提取完成后,将提取到的指标和参数的格式与标准化转换规则中设定的数据格式进行比对,若一致,则继续提取其他的指标和参数进行比对;若不一致,则根据设定的数据格式利用标准化转换规则进行转换,得到标准化后的规格信息。
在本实施例中,若查询结果为存在与药品标识信息匹配的标准药品数据时,获取录入数据中的药品名称和标准药品数据中的药品名称进行匹配,若匹配两者一致,则输出匹配成功的提示信息,若匹配两者不一致,则根据药品生产信息从标准库中进行查询,并根据查询的结果选择是否执行规格信息的标准化处理步骤。
104、将标准规格信息标准化后的规格信息与录入规则信息标准化后的规格信息进行匹配,得到匹配结果;
该步骤中,这里将标准规格信息标准后的规格信息记为第一规格信息,将录入规格信息标准化后的规格信息记为第二规格信息,而在将第一规格信息和第二规格信息进行匹配时,具体是按照两者中的字段信息进行逐一匹配,并记录各字段信息的匹配情况,然后根据各字段信息的匹配情况计算出第一规格信息和第二规格信息的匹配程度,即是匹配值,基于匹配值生成匹配结果。
在实际应用中,该匹配结果包括匹配、不匹配和匹配达到预设值三种情况,在该步骤之后,还包括根据匹配结果确定调整策略,基于调整策略对录入数据进行调整。
进一步的,还可以是根据匹配结果确定录入的药品与标准药品是否为同一种药,并基于匹配结果用于后续的药单的采药。
105、根据匹配结果输出药品数据的录入结果。
在本实施例中,该录入结果具体根据实际应用来确定,例如线上开药时,该录入结果为医生选择的线下药品是否与症状的标准药品匹配,再例如药品的入库操作,这时的录入结果为录入后的药品数据是否与标准库中的标准药品数据相同。
通过上述方法的实施,分别通过药品录入的录入数据中的药品标识信息和药品生产信息依次从药品标准库中进行查询匹配,通过两次的查询匹配后,对规格信息进行标准化处理,在标准化处理后确定药品数据的匹配结果,从而确定药品数据的录入结果,基于这样的方式,将匹配流程一分为多,简化了匹配流程的复杂度,同时也可以提高了匹配效率。
进一步的,上述的方案的实施不需要构建硬件资源,在现有的系统中进行多次匹配执行即可,实现流程简单,并且便于AI的实施。
请参阅图2,本申请实施例中药品数据匹配方法的第二个实施例包括:
201,在检测药品录入操作完成后,读取录入的药品的药品标识信息、药品生产信息和录入规格信息;
该步骤中,所述药品标识信息可以是识别码,或者是药品名称。所述识别码指的是用于识别药品的编码号,例如二维码、一维码和69码等,在录入药品的数据时,用户可以通过扫码枪扫该识别码后会解析出该药品名称和生产信息等信息,也可以是产生一串数字符号。
202,以所述识别码作为第一查询索引,查询药品标准库中是否存在识别码相同的标准药品数据;
本实施例中,该药品名称和生产信息以数字符号为例,在扫码解析出数字符号后,基于该数字符号从药品标注库中查询对应的数据符号,若查询到相同的数字符号,则确定药品标准库中存在相似的标准药品数据,然后提取两者中的药品名称进行匹配,具体的在识别到数字符号后,继续对识别码进行解析,得到录入药品的名称;若匹配一致,则确定存在相同的标准药品数据,若匹配不一致,则执行以药品生产信息为索引继续查询。
203,若存在识别码相同的标准药品数据,提取所述标准药品数据中的标准药品名称,并与录入的药品名称进行匹配;
本实施例中,在提取标准药品名称时,具体是通过OCR技术对标准药品数据的识别码进行后台扫码识别得到,可选的该识别码为69码,通过时节69码来提取对应的标准药品名称,然后将与录入数据中的药品名称进行匹配。
在实际应用中,在匹配药品名称时,包括对文字的识别和特殊符号的识别,在文字识别过程中,具体的,首先利用OCR识别技术对药品名称进行文字的识别,得到文字信息后,利用图像处理技术识别出文字信息对应的形状,以及药品名称中的特殊符号,然后将从标准药品名称和录入的药品名称中识别出的文字信息、文字信息对应的形状以及特殊符号进行相互匹配,得到匹配结果,该匹配结果包括不一致和一致两种,而一致的情况还包括匹配度达到预设经验值和完全相同。
204,若匹配不一致,则以所述药品生产信息作为第二查询索引,查询药品标准库中是否存在药品生产信息相同的标准药品数据;
在本实施例中,在药品名称匹配不一致后,返回匹配的流程,而这次的匹配是以药品生产信息为索引重新执行查询程序,具体是查询药品标准库中的字段中是否有药品生产信息相同的字段内容,若有,则确定存在相同的标准药品数据,反之则没有。
在实际应用中,所述药品生产信息包括批准文号和厂商信息时,该步骤具体实现如下:
根据所述批准文号查询药品标准库中是否存在批准文号相同的标准药品数据;
若存在与所述批准文号相同的标准药品数据,提取所述标准药品数据中的标准药品名称,并与录入的药品名称进行匹配;
若不存在与所述批准文号相同的标准药品数据,则以所述厂商信息为查询索引,查询药品标准库中是否存在厂商信息相同的标准药品数据;
若存在厂商信息相同的标准药品数据,则输出对应的标准药品数据;
若不存在厂商信息相同的标准药品数据,则输出匹配失败提示信息。
在本实施例中,以药品生产信息进行查询,具体分为两轮查询,第一轮是以批准文号,该批准文号为同一药品的销售批号,根据该批号来查询判断是否存在先相同的药品数据,可选的,在查询过程中匹配批准文号时,具体是通过批准文号中的不同字节的具体内容,若批准文号中的前N-2个字节的内容一致,则确定该药品的数据与标准药品数据一致。反之则不一致,并执行厂商信息的匹配流程。
在实际应用中,使用名称和厂商匹配时,虽然这两者的数据本身准确度很高,但依然可能存在一定的人工误差,可以使用数据预处理(替换标点符号、删除括号说明内容、使用数据字典映射)增加匹配率。
205,若存在药品生产信息相同的标准药品数据,则输出对应的标准药品数据;
在该步骤中,存在相同的标准药品数据,具体可以是判断药品生产信息中各项具体内容中有90%以上的相似度时,则确定存在相同的标准药品数据,然后将该标准药品数据输出。
进一步的,基于输出的标准药品数据对录入的药品数据进行调整。
206,若不存在药品生产信息相同的标准药品数据,则输出匹配失败提示信息;
该步骤中,对于输出匹配失败提示信息可以是在医药管理系统的录入界面中显示提示框,也可以是发送提示声音,甚至对于在线开药的场景下,直接根据删除药单中对于该药品的所有参数和使用注意事项。
207,若查询结果为药品标准库中不存在与药品标识信息对应的标准药品数据且存在与药品生产信息对应的标准药品数据时,提取标准药品数据的标准规格信息,并将标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;
208,将标准规格信息标准化后的规格信息与录入规则信息标准化后的规格信息进行匹配,得到匹配结果;
209,根据匹配结果输出药品数据的录入结果。
通过上述的方式的实施,每次匹配的参数维度不相同,从而提高了药品数据匹配纠正的准确率,同时也减少一次性处理的数据量,提高了匹配效率,分两轮方式匹配的实现难度远小于现有技术中一次性匹配的难度。
请参阅图3,本申请实施例中药品数据匹配方法的第三个实施例包括:
301、在检测药品录入操作完成后,读取录入的药品的药品标识信息、药品生产信息和录入规格信息;
302、依次以药品标识信息和药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;
303、若查询结果为药品标准库中不存在与药品标识信息对应的标准药品数据且存在与药品生产信息对应的标准药品数据时,解析录入规格信息中的字段名称;
304,识别标准药品数据中与所述字段名称对应的记录,并提取记录中的标准规格信息;
305,根据预设标准化规则,分别对标准规格信息和录入规格信息进行标准化处理,得到第一规格信息和第二规格信息;
本实施例中,这里的标准化具体可以理解为是将录入的规格信息和标准库中查询到的规格信息进行格式统一化,基于统一化的格式进行匹配,这样会更加精准,具体的所述标准化规则包括信息解析规则、数据排序顺序和数据格式,所述根据预设标准化规则,分别对所述标准规格信息和录入规格信息进行标准化处理,得到第一规格信息和第二规格信息包括:
根据所述字段名称确定与规格信息对应的信息解析规则;
根据所述信息解析规则,分别解析所述标准规格信息和录入规格信息中的字节和数据,得到所述标准规格信息的第一字节集合和第一数据集合,以及所述录入规格信息的第二字节集合和第二数据集合;
按照所述数据格式,分别对所述第一数据集合和第二数据集合中的数据进行格式转换,得到对应的新数据;
根据所述数据排序顺序,分别对所述第一字节集合和第二字节集合中的字节进行排序,得到第一字节序列和第二字节序列;
利用正则匹配算法,将所述第一字节序列与对应的新数据进行匹配,以及将所述第二字节序列与对应的新数据进行匹配,得到第一规格信息和第二规格信息。
在实际应用中,对规格信息的标准化的实现具体如下:
首先,进行特殊字符或单位替换。
替换的字典可参考如下:
毫克=mg,毫g=mg,微g=μg,ug=μg,微克=μg,克=g,毫l=ml,毫升=ml,升=l,国际单位=IU,万单位=MU,万U=MU,粒=s,片=s,丸=s,包=s,袋=s,揿=s,喷=s,板=s,小s=s,小盒=s,盒=s,毫米=mm,厘米=cm,CM=cm,片=s,贴=s,板=s,粒=s,片=s,丸=s,瓶=s,揿=s,喷=s,支=s,片=s,枚=s,块=s,张=s,贴=s,`S=s,`s=s,T=s,D=s,'s=s,'S=s,P=s,p=s,T=s,t=s,x=*,×=*,: =:,/=:,(=(,)=)
然后,全部转为小写。
比如MG转为mg,ML转为ml。
进一步的,对配置的每一条正则转换规则从上到下匹配,找到一条则应用。
如"([0-9\\.]+)(mu|g|ml|l|mg|μg|ug)([:/])([0-9\\.]+)(mu|g|ml|l|mg|μg|ug)([x\\*:])([0-9]+)[\\*]?(s):=<va><vb><vc><vd><ve><vf><vg><vh>"这条规则,基于这条规则进行分解,以及进行标准化的匹配,形成如图8所示的分解图,然后将该图中分解信息分别与预设的标准化表格进行匹配,得到的匹配结果,如下表格所示:
对应的group编号对应字母排序,:=符号后的为标准化后的各分组对应的值所在的位置,该例中从va~vh都是顺序排列的,有其他场景会把某个group对应的值放到前面。
如上,最终“11.1mg/12ml:9*s额外说明”这样的人工输入将转变为“11.1mg/12ml:9*s”这样的格式。“<va><vb><vc><vd><ve><vf><vg><vh>”是对提取的重要数据进行的重排,如果认为“11.1mg/12ml:9*s”等效于“11.1mg:12ml:9*s”,那么可以将排版格式改为“<va><vb>:<vd><ve><vf><vg><vh>”,这样两者的最终的转化结果将完全相同。
最后,后缀处理和单位转换,具体实现如下:
所述数据格式包括单位标准格式和后缀格式,所述按照所述数据格式,分别对所述第一数据集合和第二数据集合中的数据进行格式转换,得到对应的新数据包括:
调用文字识别技术,识别所述第一数据集合和第二数据集合中每个数据的单位字段;
判断所述单位字段中的单位格式是否与所述单位标准格式一致;
若不一致,则根据所述单位标准格式对应的转换公式,对所述单位格式进行转换计算;
基于转换计算的结果,根据所述后缀格式调整每个数据的后缀字符,形成对应的新数据。
标准化后的字符尾部可能存在形如2*3s或16ml*1s之类的,会再进行一轮简化操作为6s、16ml。
注意:目前只会对末尾的特殊字符进行简化,中间的不会变动,比如16ml*1s*3s,这就是最终形式,不会在进行简化
单位转换比如1g=1000mg,1L=1000ml等等,将所有单位向最小单位转换。
306、将标准规格信息标准化后的规格信息与录入规则信息标准化后的规格信息进行匹配,得到匹配结果;
307、根据匹配结果输出药品数据的录入结果。
综上,上述实施例提供的方法实现药品数据的匹配,由于设置了两次匹配,每次匹配的参数维度不相同,从而提高了药品数据匹配纠正的准确率,同时也减少一次性处理的数据量,提高了匹配效率,分两轮方式匹配的实现难度远小于现有技术中一次性匹配的难度。
请参阅图4,本申请实施例中药品数据匹配方法的第四个实施例包括:
401,在检测药品录入操作完成后,读取录入的药品的药品标识信息、药品生产信息和录入规格信息;
402,依次以药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;
403,若查询结果为药品标准库中不存在与药品标识信息对应的标准药品数据且存在与药品生产信息对应的标准药品数据时,提取标准药品数据的标准规格信息,并将标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;
404,将标准规格信息标准化后的规格信息与录入规则信息标准化后的规格信息进行匹配,得到匹配结果;
405,若匹配结果为所述标准规格信息标准化后的规格信息与录入规则信息标准话后的规格信息的匹配度大于预设值,通过下式对匹配度进行指数放大得到不匹配部分的规格信息的差异值;
在该步骤中,该差异值=相似值*log(c/d,n)*e
其中,f为预设值、c为相容概率、d为排斥概率、n为差异因子数以及e为放大系数。
406,根据所差异值确定录入规格信息的调整策略,并以标准药品数据为基准,根据调整策略对所述录入数据进行调整,得到完整的录入数据;
407,在调整完成后,输出药品数据纠正成功提示信息。
在实际应用中,该预设值的设置可以通过对线下大量数据的整理和多名资深医师的经验总结确定,而这里的匹配结果是可以根据药品数据中的特定信息来实现线上标准药品的匹配,整体的实现流程具体可以如下:
首先根据69码和药品名称匹配标准药品,因为69码为标准的数字,结合名称如果能查到标准药品,那么找到的数据一定是匹配的,而69码中的输入误差可以通过名称的匹配消除掉。
如果上一轮匹配失败,那么将重新使用批准文号和名称查找药品,因为批准文号和名称可能查到多个药品,因此还需要对所有的药品的规格进行标准化处理再进行匹配(后面会说明如何进行标准化),也就是这一轮使用批准文号、名称、规格三者进行匹配标准药品。
如果第三步匹配失败,那么将使用厂商名称和名称查找药品,因为厂商和名称可能查到多个药品,因此还需要对所有的药品的规格进行标准化处理再进行匹配(后面会说明如何进行标准化),也就是这一轮使用厂商、名称、规格三者进行匹配标准药品。
通过上述的方式的实施,每次匹配的参数维度不相同,从而提高了药品数据匹配纠正的准确率,同时也减少一次性处理的数据量,提高了匹配效率,分两轮方式匹配的实现难度远小于现有技术中一次性匹配的难度。
上面对本申请实施例中的药品数据匹配方法进行了描述,下面对本申请实施例中的药品数据匹配装置进行描述,请参照图5,本申请实施例中的药品数据匹配装置的一个实施例包括:
读取模块501,用于在检测药品录入操作完成后,读取录入的药品的录入数据,所述录入数据至少包括药品标识信息、药品生产信息和录入规格信息;
查询模块502,用于依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;
提取模块503,用于若所述查询结果为所述药品标准库中不存在与所述药品标识信息对应的标准药品数据且存在与所述药品生产信息对应的标准药品数据时,提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;
匹配模块504,用于将所述标准规格信息标准化后的规格信息与所述录入规则信息标准化后的规格信息进行匹配,得到匹配结果;
输出模块505,用于根据所述匹配结果输出所述药品数据的录入结果。
本申请实施例,通过设置多轮药品数据匹配来提高药品数据的匹配精准度,首先以药品的录入数据中的药品标识信息从药品标准库中进行匹配,若不匹配到,则继续利用药品生产信息从药品标准库中匹配,若匹配到,则对录入数据和匹配的标准药品数据中规格信息进行标准化后,进行匹配,若匹配一致,则确定录入数据成功,反之,则匹配失败,利用上述的方式实现药品数据的匹配,由于设置了两次匹配,每次匹配的参数维度不相同,从而提高了药品数据匹配纠正的准确率,同时也减少一次性处理的数据量,提高了匹配效率。
请参阅图6,本申请实施例中的药品数据匹配装置的另一个实施例包括:
读取模块501,用于在检测药品录入操作完成后,读取录入的药品的录入数据,所述录入数据至少包括药品标识信息、药品生产信息和录入规格信息;
查询模块502,用于依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;
提取模块503,用于若所述查询结果为所述药品标准库中不存在与所述药品标识信息对应的标准药品数据且存在与所述药品生产信息对应的标准药品数据时,提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;
匹配模块504,用于将所述标准规格信息标准化后的规格信息与所述录入规则信息标准化后的规格信息进行匹配,得到匹配结果;
输出模块505,用于根据所述匹配结果输出所述药品数据的录入结果。
在本实施例中,所述药品标识信息包括识别码和药品名称,所述查询模块502具体用于:
以所述识别码作为第一查询索引,查询药品标准库中是否存在识别码相同的标准药品数据;
若存在识别码相同的标准药品数据,提取所述标准药品数据中的标准药品名称,并与录入的药品名称进行匹配;
若匹配不一致,则以所述药品生产信息作为第二查询索引,查询药品标准库中是否存在药品生产信息相同的标准药品数据;
若存在药品生产信息相同的标准药品数据,则输出对应的标准药品数据;
若不存在药品生产信息相同的标准药品数据,则输出匹配失败提示信息。
在本实施例中,所述药品生产信息包括批准文号和厂商信息,所述查询模块502具体用于:
根据所述批准文号查询药品标准库中是否存在批准文号相同的标准药品数据;
若存在与所述批准文号相同的标准药品数据,提取所述标准药品数据中的标准药品名称,并与录入的药品名称进行匹配;
若不存在与所述批准文号相同的标准药品数据,则以所述厂商信息为查询索引,查询药品标准库中是否存在厂商信息相同的标准药品数据;
若存在厂商信息相同的标准药品数据,则输出对应的标准药品数据;若不存在厂商信息相同的标准药品数据,则输出匹配失败提示信息。
其中,所述提取模块503包括:
解析单元5031,用于解析所述录入规格信息中的字段名称;
提取单元5032,用于识别所述标准药品数据中与所述字段名称对应的记录,并提取所述记录中的标准规格信息;
标准化处理单元5033,用于根据预设标准化规则,分别对所述标准规格信息和录入规格信息进行标准化处理,得到第一规格信息和第二规格信息。
在本实施例中,所述标准化规则包括信息解析规则、数据排序顺序和数据格式,所述标准化处理单元5033具体用于:
根据所述字段名称确定与规格信息对应的信息解析规则;
根据所述信息解析规则,分别解析所述标准规格信息和录入规格信息中的字节和数据,得到所述标准规格信息的第一字节集合和第一数据集合,以及所述录入规格信息的第二字节集合和第二数据集合;
按照所述数据格式,分别对所述第一数据集合和第二数据集合中的数据进行格式转换,得到对应的新数据;
根据所述数据排序顺序,分别对所述第一字节集合和第二字节集合中的字节进行排序,得到第一字节序列和第二字节序列;
利用正则匹配算法,将所述第一字节序列与对应的新数据进行匹配,以及将所述第二字节序列与对应的新数据进行匹配,得到第一规格信息和第二规格信息。
在本实施例中,所述数据格式包括单位标准格式和后缀格式,所述标准化处理单元5033具体用于:
调用文字识别技术,识别所述第一数据集合和第二数据集合中每个数据的单位字段;
判断所述单位字段中的单位格式是否与所述单位标准格式一致;
若不一致,则根据所述单位标准格式对应的转换公式,对所述单位格式进行转换计算;
基于转换计算的结果,根据所述后缀格式调整每个数据的后缀字符,形成对应的新数据。
其中,所述输出模块505包括:
计算单元5051,用于若所述匹配结果为所述标准规格信息标准化后的规格信息与所述录入规则信息标准话后的规格信息的匹配度大于预设值,通过下式对所述匹配度进行指数放大得到不匹配部分的规格信息的差异值:
差异值=相似值*log(c/d,n)*e,
其中,f为预设值、c为相容概率、d为排斥概率、n为差异因子数以及e为放大系数;
调整单元5052,用于根据所述差异值确定所述录入规格信息的调整策略,并以所述标准药品数据为基准,根据所述调整策略对所述录入数据进行调整,得到完整的录入数据;
输出单元5053,用于在调整完成后,输出药品数据纠正成功提示信息。
通过上述方法的实施,分别通过药品录入的录入数据中的药品标识信息和药品生产信息依次从药品标准库中进行查询匹配,通过两次的查询匹配后,对规格信息进行标准化处理,在标准化处理后确定药品数据的匹配结果,从而确定药品数据的录入结果,基于这样的方式,将匹配流程一分为多,简化了匹配流程的复杂度,同时也可以提高了匹配效率。
进一步的,上述的方案的实施不需要构建硬件资源,在现有的系统中进行多次匹配执行即可,实现流程简单,并且便于AI的实施。
请参阅图7,下面从硬件处理的角度对本申请实施例中的药品数据匹配设备的一个实施例进行详细描述。
图7是本申请实施例提供的一种药品数据匹配设备的结构示意图,该药品数据匹配设备700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)710(例如,一个或一个以上处理器)和存储器720,一个或一个以上存储应用程序733或数据732的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器720和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对基于路由的用户需求预测设备700中的一系列指令操作。更进一步地,处理器710可以设置为与存储介质730通信,在药品数据匹配设备700上执行存储介质730中的一系列指令操作。
药品数据匹配设备700还可以包括一个或一个以上电源740,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口760,和/或,一个或一个以上操作系统731,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图7示出的药品数据匹配设备结构并不构成对药品数据匹配设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Block chain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行以下步骤:在检测药品录入操作完成后,读取录入的药品的录入数据,所述录入数据至少包括药品标识信息、药品生产信息和录入规格信息;依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;若所述查询结果为所述药品标准库中不存在与所述药品标识信息对应的标准药品数据且存在与所述药品生产信息对应的标准药品数据时,提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;将所述标准规格信息标准化后的规格信息与所述录入规则信息标准化后的规格信息进行匹配,得到匹配结果;根据所述匹配结果输出所述药品数据的录入结果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修 改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (20)
- 一种药品数据匹配方法,其中,所述药品数据匹配方法包括:在检测药品录入操作完成后,读取录入的药品的录入数据,所述录入数据至少包括药品标识信息、药品生产信息和录入规格信息;依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;若所述查询结果为所述药品标准库中不存在与所述药品标识信息对应的标准药品数据且存在与所述药品生产信息对应的标准药品数据时,提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;将所述标准规格信息标准化后的规格信息与所述录入规则信息标准化后的规格信息进行匹配,得到匹配结果;根据所述匹配结果输出所述药品数据的录入结果。
- 根据权利要求1所述的药品数据匹配方法,其中,所述药品标识信息包括识别码和药品名称,所述依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果包括:以所述识别码作为第一查询索引,查询药品标准库中是否存在识别码相同的标准药品数据;若存在识别码相同的标准药品数据,提取所述标准药品数据中的标准药品名称,并与录入的药品名称进行匹配;若匹配不一致,则以所述药品生产信息作为第二查询索引,查询药品标准库中是否存在药品生产信息相同的标准药品数据;若存在药品生产信息相同的标准药品数据,则输出对应的标准药品数据;若不存在药品生产信息相同的标准药品数据,则输出匹配失败提示信息。
- 根据权利要求2所述的药品数据匹配方法,其中,所述药品生产信息包括批准文号和厂商信息,所述以所述药品生产信息作为第二查询索引,查询药品标准库中是否存在药品生产信息相同的标准药品数据包括:根据所述批准文号查询药品标准库中是否存在批准文号相同的标准药品数据;若存在与所述批准文号相同的标准药品数据,提取所述标准药品数据中的标准药品名称,并与录入的药品名称进行匹配;若不存在与所述批准文号相同的标准药品数据,则以所述厂商信息为查询索引,查询药品标准库中是否存在厂商信息相同的标准药品数据;若存在厂商信息相同的标准药品数据,则输出对应的标准药品数据;若不存在厂商信息相同的标准药品数据,则输出匹配失败提示信息。
- 根据权利要求1-3中任一项所述的药品数据匹配方法,其中,所述提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息包括:解析所述录入规格信息中的字段名称;识别所述标准药品数据中与所述字段名称对应的记录,并提取所述记录中的标准规格信息;根据预设标准化规则,分别对所述标准规格信息和录入规格信息进行标准化处理,得到第一规格信息和第二规格信息。
- 根据权利要求4所述的药品数据匹配方法,其中,所述标准化规则包括信息解析规则、数据排序顺序和数据格式,所述根据预设标准化规则,分别对所述标准规格信息和录入规格信息进行标准化处理,得到第一规格信息和第二规格信息包括:根据所述字段名称确定与规格信息对应的信息解析规则;根据所述信息解析规则,分别解析所述标准规格信息和录入规格信息中的字节和数据,得到所述标准规格信息的第一字节集合和第一数据集合,以及所述录入规格信息的第二字节集合和第二数据集合;按照所述数据格式,分别对所述第一数据集合和第二数据集合中的数据进行格式转换,得到对应的新数据;根据所述数据排序顺序,分别对所述第一字节集合和第二字节集合中的字节进行排序,得到第一字节序列和第二字节序列;利用正则匹配算法,将所述第一字节序列与对应的新数据进行匹配,以及将所述第二字节序列与对应的新数据进行匹配,得到第一规格信息和第二规格信息。
- 根据权利要求5所述的药品数据匹配方法,其中,所述数据格式包括单位标准格式和后缀格式,所述按照所述数据格式,分别对所述第一数据集合和第二数据集合中的数据进行格式转换,得到对应的新数据包括:调用文字识别技术,识别所述第一数据集合和第二数据集合中每个数据的单位字段;判断所述单位字段中的单位格式是否与所述单位标准格式一致;若不一致,则根据所述单位标准格式对应的转换公式,对所述单位格式进行转换计算;基于转换计算的结果,根据所述后缀格式调整每个数据的后缀字符,形成对应的新数据。
- 根据权利要求4所述的药品数据匹配方法,其中,所述根据所述匹配结果输出所述药品数据的录入结果包括:若所述匹配结果为所述标准规格信息标准化后的规格信息与所述录入规则信息标准话后的规格信息的匹配度大于预设值,通过下式对所述匹配度进行指数放大得到不匹配部分的规格信息的差异值:差异值=相似值*log(c/d,n)*e,其中,f为预设值、c为相容概率、d为排斥概率、n为差异因子数以及e为放大系数;根据所述差异值确定所述录入规格信息的调整策略,并以所述标准药品数据为基准,根据所述调整策略对所述录入数据进行调整,得到完整的录入数据;在调整完成后,输出药品数据纠正成功提示信息。
- 一种药品数据匹配设备,其特征在于,所述药品数据匹配设备包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述药品数据匹配设备执行以下步骤:在检测药品录入操作完成后,读取录入的药品的录入数据,所述录入数据至少包括药品标识信息、药品生产信息和录入规格信息;依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;若所述查询结果为所述药品标准库中不存在与所述药品标识信息对应的标准药品数据且存在与所述药品生产信息对应的标准药品数据时,提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;将所述标准规格信息标准化后的规格信息与所述录入规则信息标准化后的规格信息进行匹配,得到匹配结果;根据所述匹配结果输出所述药品数据的录入结果。
- 根据权利要求8所述的药品数据匹配设备,其中,所述指令被所述处理器执行实现所述药品标识信息包括识别码和药品名称,所述依次以所述药品标识信息和所述药品生产 信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果时,包括:以所述识别码作为第一查询索引,查询药品标准库中是否存在识别码相同的标准药品数据;若存在识别码相同的标准药品数据,提取所述标准药品数据中的标准药品名称,并与录入的药品名称进行匹配;若匹配不一致,则以所述药品生产信息作为第二查询索引,查询药品标准库中是否存在药品生产信息相同的标准药品数据;若存在药品生产信息相同的标准药品数据,则输出对应的标准药品数据;若不存在药品生产信息相同的标准药品数据,则输出匹配失败提示信息。
- 根据权利要求9所述的药品数据匹配设备,其中,所述指令被所述处理器执行实现所述药品生产信息包括批准文号和厂商信息,所述以所述药品生产信息作为第二查询索引,查询药品标准库中是否存在药品生产信息相同的标准药品数据时,包括:根据所述批准文号查询药品标准库中是否存在批准文号相同的标准药品数据;若存在与所述批准文号相同的标准药品数据,提取所述标准药品数据中的标准药品名称,并与录入的药品名称进行匹配;若不存在与所述批准文号相同的标准药品数据,则以所述厂商信息为查询索引,查询药品标准库中是否存在厂商信息相同的标准药品数据;若存在厂商信息相同的标准药品数据,则输出对应的标准药品数据;若不存在厂商信息相同的标准药品数据,则输出匹配失败提示信息。
- 根据权利要求8-10中任一项所述的药品数据匹配设备,其中,所述指令被所述处理器执行实现所述提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息时,包括:解析所述录入规格信息中的字段名称;识别所述标准药品数据中与所述字段名称对应的记录,并提取所述记录中的标准规格信息;根据预设标准化规则,分别对所述标准规格信息和录入规格信息进行标准化处理,得到第一规格信息和第二规格信息。
- 根据权利要求11所述的药品数据匹配设备,其中,所述标准化规则包括信息解析规则、数据排序顺序和数据格式,所述指令被所述处理器执行实现所述根据预设标准化规则,分别对所述标准规格信息和录入规格信息进行标准化处理,得到第一规格信息和第二规格信息时,包括:根据所述字段名称确定与规格信息对应的信息解析规则;根据所述信息解析规则,分别解析所述标准规格信息和录入规格信息中的字节和数据,得到所述标准规格信息的第一字节集合和第一数据集合,以及所述录入规格信息的第二字节集合和第二数据集合;按照所述数据格式,分别对所述第一数据集合和第二数据集合中的数据进行格式转换,得到对应的新数据;根据所述数据排序顺序,分别对所述第一字节集合和第二字节集合中的字节进行排序,得到第一字节序列和第二字节序列;利用正则匹配算法,将所述第一字节序列与对应的新数据进行匹配,以及将所述第二字节序列与对应的新数据进行匹配,得到第一规格信息和第二规格信息。
- 根据权利要求12所述的药品数据匹配设备,其中,所述数据格式包括单位标准格式和后缀格式,所述按照所述数据格式,分别对所述第一数据集合和第二数据集合中的数 据进行格式转换,得到对应的新数据包括:调用文字识别技术,识别所述第一数据集合和第二数据集合中每个数据的单位字段;判断所述单位字段中的单位格式是否与所述单位标准格式一致;若不一致,则根据所述单位标准格式对应的转换公式,对所述单位格式进行转换计算;基于转换计算的结果,根据所述后缀格式调整每个数据的后缀字符,形成对应的新数据。
- 根据权利要求11所述的药品数据匹配设备,其中,所述指令被所述处理器执行实现所述根据所述匹配结果输出所述药品数据的录入结果时,包括:若所述匹配结果为所述标准规格信息标准化后的规格信息与所述录入规则信息标准话后的规格信息的匹配度大于预设值,通过下式对所述匹配度进行指数放大得到不匹配部分的规格信息的差异值:差异值=相似值*log(c/d,n)*e,其中,f为预设值、c为相容概率、d为排斥概率、n为差异因子数以及e为放大系数;根据所述差异值确定所述录入规格信息的调整策略,并以所述标准药品数据为基准,根据所述调整策略对所述录入数据进行调整,得到完整的录入数据;在调整完成后,输出药品数据纠正成功提示信息。
- 一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如下步骤:在检测药品录入操作完成后,读取录入的药品的录入数据,所述录入数据至少包括药品标识信息、药品生产信息和录入规格信息;依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;若所述查询结果为所述药品标准库中不存在与所述药品标识信息对应的标准药品数据且存在与所述药品生产信息对应的标准药品数据时,提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;将所述标准规格信息标准化后的规格信息与所述录入规则信息标准化后的规格信息进行匹配,得到匹配结果;根据所述匹配结果输出所述药品数据的录入结果。。
- 根据权利要求15所述的计算机可读存储介质,其中,所述计算机程序被所述处理器执行实现所述药品标识信息包括识别码和药品名称,所述依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果时,包括:以所述识别码作为第一查询索引,查询药品标准库中是否存在识别码相同的标准药品数据;若存在识别码相同的标准药品数据,提取所述标准药品数据中的标准药品名称,并与录入的药品名称进行匹配;若匹配不一致,则以所述药品生产信息作为第二查询索引,查询药品标准库中是否存在药品生产信息相同的标准药品数据;若存在药品生产信息相同的标准药品数据,则输出对应的标准药品数据;若不存在药品生产信息相同的标准药品数据,则输出匹配失败提示信息。
- 根据权利要求16所述的计算机可读存储介质,其中,所述计算机程序被所述处理器执行实现所述药品生产信息包括批准文号和厂商信息,所述以所述药品生产信息作为第二查询索引,查询药品标准库中是否存在药品生产信息相同的标准药品数据时,包括:根据所述批准文号查询药品标准库中是否存在批准文号相同的标准药品数据;若存在与所述批准文号相同的标准药品数据,提取所述标准药品数据中的标准药品名称,并与录入的药品名称进行匹配;若不存在与所述批准文号相同的标准药品数据,则以所述厂商信息为查询索引,查询药品标准库中是否存在厂商信息相同的标准药品数据;若存在厂商信息相同的标准药品数据,则输出对应的标准药品数据;若不存在厂商信息相同的标准药品数据,则输出匹配失败提示信息。
- 根据权利要求15-17中任一项所述的计算机可读存储介质,其中,所述计算机程序被所述处理器执行实现所述提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息时,包括:解析所述录入规格信息中的字段名称;识别所述标准药品数据中与所述字段名称对应的记录,并提取所述记录中的标准规格信息;根据预设标准化规则,分别对所述标准规格信息和录入规格信息进行标准化处理,得到第一规格信息和第二规格信息。
- 根据权利要求18所述的计算机可读存储介质,其中,所述标准化规则包括信息解析规则、数据排序顺序和数据格式,所述计算机程序被所述处理器执行实现所述根据预设标准化规则,分别对所述标准规格信息和录入规格信息进行标准化处理,得到第一规格信息和第二规格信息时,包括:根据所述字段名称确定与规格信息对应的信息解析规则;根据所述信息解析规则,分别解析所述标准规格信息和录入规格信息中的字节和数据,得到所述标准规格信息的第一字节集合和第一数据集合,以及所述录入规格信息的第二字节集合和第二数据集合;按照所述数据格式,分别对所述第一数据集合和第二数据集合中的数据进行格式转换,得到对应的新数据;根据所述数据排序顺序,分别对所述第一字节集合和第二字节集合中的字节进行排序,得到第一字节序列和第二字节序列;利用正则匹配算法,将所述第一字节序列与对应的新数据进行匹配,以及将所述第二字节序列与对应的新数据进行匹配,得到第一规格信息和第二规格信息。
- 一种药品数据匹配装置,其中,所述药品数据匹配装置包括:读取模块,用于在检测药品录入操作完成后,读取录入的药品的录入数据,所述录入数据至少包括药品标识信息、药品生产信息和录入规格信息;查询模块,用于依次以所述药品标识信息和所述药品生产信息为查询索引,查询药品标准库中是否存在符合预设条件的标准药品数据,得到对应的查询结果;提取模块,用于若所述查询结果为所述药品标准库中不存在与所述药品标识信息对应的标准药品数据且存在与所述药品生产信息对应的标准药品数据时,提取所述标准药品数据的标准规格信息,并将所述标准规格信息和录入规格信息进行标准化处理,得到标准化后的规格信息;匹配模块,用于将所述标准规格信息标准化后的规格信息与所述录入规则信息标准化后的规格信息进行匹配,得到匹配结果;输出模块,用于根据所述匹配结果输出所述药品数据的录入结果。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110484005.6A CN113130038A (zh) | 2021-04-30 | 2021-04-30 | 药品数据匹配方法、装置、设备及存储介质 |
CN202110484005.6 | 2021-04-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022228347A1 true WO2022228347A1 (zh) | 2022-11-03 |
Family
ID=76780779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2022/088784 WO2022228347A1 (zh) | 2021-04-30 | 2022-04-24 | 药品数据匹配方法、装置、设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113130038A (zh) |
WO (1) | WO2022228347A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115545809A (zh) * | 2022-12-02 | 2022-12-30 | 广州数说故事信息科技有限公司 | 电商商品的标品库构建方法、数据对齐方法、装置和设备 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113130038A (zh) * | 2021-04-30 | 2021-07-16 | 康键信息技术(深圳)有限公司 | 药品数据匹配方法、装置、设备及存储介质 |
CN113742348B (zh) * | 2021-09-07 | 2024-05-17 | 上海柯林布瑞信息技术有限公司 | Cdr系统中的患者数据匹配方法、主索引建立方法及装置 |
CN113509387B (zh) * | 2021-09-10 | 2021-12-07 | 江西中医药大学 | 一种中药固体制剂工艺参数的决策方法、制剂方法及系统 |
CN115510049B (zh) * | 2022-11-15 | 2023-03-21 | 阿里健康科技(杭州)有限公司 | 药品的标品数据录入方法、装置、设备和存储介质 |
CN117009998A (zh) * | 2023-08-29 | 2023-11-07 | 上海倍通医药科技咨询有限公司 | 一种数据检验方法及系统 |
CN117056376B (zh) * | 2023-08-30 | 2024-07-19 | 浙江星汉博纳医药科技有限公司 | 一种信息处理方法、装置及设备 |
CN117711593B (zh) * | 2024-02-05 | 2024-04-19 | 苏州绿华科技有限公司 | 一种智慧药房进出药管理系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030120652A1 (en) * | 1999-10-19 | 2003-06-26 | Eclipsys Corporation | Rules analyzer system and method for evaluating and ranking exact and probabilistic search rules in an enterprise database |
CN107203686A (zh) * | 2017-03-31 | 2017-09-26 | 苏州艾隆信息技术有限公司 | 药品信息差异处理方法及系统 |
CN107766395A (zh) * | 2017-03-03 | 2018-03-06 | 平安医疗健康管理股份有限公司 | 数据匹配方法和装置 |
CN107818124A (zh) * | 2017-03-03 | 2018-03-20 | 平安医疗健康管理股份有限公司 | 数据匹配方法及装置 |
CN111180087A (zh) * | 2020-01-02 | 2020-05-19 | 中国中医科学院中医药信息研究所 | 上市药品信息标准化方法、设备、服务器及存储介质 |
CN113130038A (zh) * | 2021-04-30 | 2021-07-16 | 康键信息技术(深圳)有限公司 | 药品数据匹配方法、装置、设备及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678435B (zh) * | 2013-07-08 | 2017-02-08 | 重庆药品交易所股份有限公司 | 一种药品规格数据相似度匹配方法 |
CN103678262A (zh) * | 2013-12-27 | 2014-03-26 | 中西亚通医疗信息科技(北京)有限公司 | 一种文本处理方法和文本处理装置 |
CN105184052B (zh) * | 2015-08-13 | 2018-02-16 | 易保互联医疗信息科技(北京)有限公司 | 一种药品信息的自动编码方法及系统 |
CN107103048B (zh) * | 2017-03-31 | 2021-04-20 | 苏州艾隆信息技术有限公司 | 药品信息匹配方法及系统 |
CN107784058B (zh) * | 2017-04-11 | 2020-11-13 | 平安医疗健康管理股份有限公司 | 药品数据处理方法及装置 |
CN110289058A (zh) * | 2019-06-06 | 2019-09-27 | 北京市天元网络技术股份有限公司 | 一种电子病历规范化匹配方法以及装置 |
CN110781677B (zh) * | 2019-10-12 | 2023-02-07 | 深圳平安医疗健康科技服务有限公司 | 药品信息匹配处理方法、装置、计算机设备和存储介质 |
CN111798969A (zh) * | 2020-06-29 | 2020-10-20 | 平安国际智慧城市科技股份有限公司 | 医学药品匹配方法、装置、电子设备及存储介质 |
CN111931774B (zh) * | 2020-09-27 | 2020-12-18 | 耀方信息技术(上海)有限公司 | 药品数据的入库方法及系统 |
CN112668280A (zh) * | 2020-12-29 | 2021-04-16 | 杭州依图医疗技术有限公司 | 医学数据的处理方法、装置及存储介质 |
-
2021
- 2021-04-30 CN CN202110484005.6A patent/CN113130038A/zh active Pending
-
2022
- 2022-04-24 WO PCT/CN2022/088784 patent/WO2022228347A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030120652A1 (en) * | 1999-10-19 | 2003-06-26 | Eclipsys Corporation | Rules analyzer system and method for evaluating and ranking exact and probabilistic search rules in an enterprise database |
CN107766395A (zh) * | 2017-03-03 | 2018-03-06 | 平安医疗健康管理股份有限公司 | 数据匹配方法和装置 |
CN107818124A (zh) * | 2017-03-03 | 2018-03-20 | 平安医疗健康管理股份有限公司 | 数据匹配方法及装置 |
CN107203686A (zh) * | 2017-03-31 | 2017-09-26 | 苏州艾隆信息技术有限公司 | 药品信息差异处理方法及系统 |
CN111180087A (zh) * | 2020-01-02 | 2020-05-19 | 中国中医科学院中医药信息研究所 | 上市药品信息标准化方法、设备、服务器及存储介质 |
CN113130038A (zh) * | 2021-04-30 | 2021-07-16 | 康键信息技术(深圳)有限公司 | 药品数据匹配方法、装置、设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115545809A (zh) * | 2022-12-02 | 2022-12-30 | 广州数说故事信息科技有限公司 | 电商商品的标品库构建方法、数据对齐方法、装置和设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113130038A (zh) | 2021-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022228347A1 (zh) | 药品数据匹配方法、装置、设备及存储介质 | |
US7769778B2 (en) | Systems and methods for validating an address | |
CN107818124B (zh) | 数据匹配方法及装置 | |
US9754017B2 (en) | Using anchor points in document identification | |
US20040220895A1 (en) | Systems and methods for coding information | |
CN105068994B (zh) | 一种药品信息的自然语言处理方法及系统 | |
JP2011175648A (ja) | データ整理のための方法及びシステム | |
JP2012212437A (ja) | データ整理のための方法及びシステム | |
US20220012231A1 (en) | Automatic content-based append detection | |
CN101198952A (zh) | 用于解析医疗数据的系统和方法 | |
CN111180087A (zh) | 上市药品信息标准化方法、设备、服务器及存储介质 | |
US20200013491A1 (en) | Interoperable Record Matching Process | |
CN111370132B (zh) | 电子文件的解析方法及装置、计算机设备、存储介质 | |
CN114358001A (zh) | 诊断结果的标准化方法及其相关装置、设备和存储介质 | |
JP4955197B2 (ja) | レセプトファイル生成システム | |
CN109545319B (zh) | 基于知识关系分析的处方告警方法及终端设备 | |
WO2009005492A1 (en) | Systems and methods for validating an address | |
CN114913956A (zh) | 基于知识图谱的重复用药提醒方法、装置以及电子设备 | |
CN112420213B (zh) | 一种根据时间查询药品结余的方法 | |
CN111524589B (zh) | 基于cda共享文档的健康医疗大数据质控系统和终端 | |
CN117112772A (zh) | 药品搜索方法及装置、存储介质、计算机设备 | |
CN111145849B (zh) | 医护信息校验方法、装置、介质及电子设备 | |
US11594303B2 (en) | Method and system for normalization of gene names in medical text | |
US20240193162A1 (en) | System and Method for Joining Datasets | |
US20230267274A1 (en) | Mapping entities in unstructured text documents via entity correction and entity resolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22794817 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
32PN | Ep: public notification in the ep bulletin as address of the adressee cannot be established |
Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 14/02/2024) |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 22794817 Country of ref document: EP Kind code of ref document: A1 |