CN112990835B - 一种线下入库检索方法、系统、设备和介质 - Google Patents

一种线下入库检索方法、系统、设备和介质 Download PDF

Info

Publication number
CN112990835B
CN112990835B CN202110514420.1A CN202110514420A CN112990835B CN 112990835 B CN112990835 B CN 112990835B CN 202110514420 A CN202110514420 A CN 202110514420A CN 112990835 B CN112990835 B CN 112990835B
Authority
CN
China
Prior art keywords
entity
information
retrieval
text
matched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110514420.1A
Other languages
English (en)
Other versions
CN112990835A (zh
Inventor
姚娟娟
樊代明
钟南山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Mingping Medical Data Technology Co ltd
Original Assignee
Mingpinyun Beijing Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mingpinyun Beijing Data Technology Co Ltd filed Critical Mingpinyun Beijing Data Technology Co Ltd
Priority to CN202110514420.1A priority Critical patent/CN112990835B/zh
Publication of CN112990835A publication Critical patent/CN112990835A/zh
Application granted granted Critical
Publication of CN112990835B publication Critical patent/CN112990835B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种线下入库检索方法、系统、设备和介质,包括:获取入库目标的待识别文本图像,将所述待识别文本图像输入匹配的文本识别模型,得到实体信息以及实体描述信息,建立实体信息与对应实体描述信息的映射关系;将所述实体信息与预设实体框架类别进行比对,并将所述实体信息录入对应的实体框架类别中,形成实体库;从所述实体描述信息中获取实体信息对应的属性信息,根据所述属性信息以及对应实体框架类别创建所述实体库中每个实体信息对应的检索式;录入检索文本,根据所述检索文本获取匹配的检索式,并输出匹配的实体信息以及对应的实体描述信息;本发明可有效简化线下入库流程,节约人工成本,提高检索准确性。

Description

一种线下入库检索方法、系统、设备和介质
技术领域
本发明涉及自然语言处理领域,尤其涉及一种线下入库检索方法、系统、设备和介质。
背景技术
目前,线下产品入库仍然依赖于人工进行分类记录,录入时需要根据产品说明进行准确分类,防止录入错误,在入库产品数据量大时,人工录入方式效率低。且由于同名产品也会存在生产商和供应商的差异,检索对象在检索时可能仅输入对应产品的简称或缩写信息,检索过程中,如何快速准确地输出与检索信息对应的产品信息是目前亟需解决的一大难题。
发明内容
鉴于以上现有技术存在的问题,本发明提出一种线下入库检索方法、系统、设备和介质,主要解决现有线下入库产品信息效率低,且入库后检索准确性难以保障的问题。
为了实现上述目的及其他目的,本发明采用的技术方案如下。
一种线下入库检索方法,包括:
获取入库目标的待识别文本图像,将所述待识别文本图像输入匹配的文本识别模型,得到实体信息以及实体描述信息,建立实体信息与对应实体描述信息的映射关系;
将所述实体信息与预设实体框架类别进行比对,并将所述实体信息录入对应的实体框架类别中,形成实体库;
从所述实体描述信息中获取实体信息对应的属性信息,根据所述属性信息以及对应实体框架类别创建所述实体库中每个实体信息对应的检索式;
录入检索文本,根据所述检索文本获取匹配的检索式,并输出匹配的实体信息以及对应的实体描述信息。
可选地,根据设置的实体框架类别,构建每个实体框架类别对应的文本识别模型;
对所述待识别文本图像进行标注,根据标注信息获取匹配的文本识别模型。
可选地,将所述实体信息与预设实体框架类别进行比对,包括:
设置每个实体框架类别对应的层级结构,并按照所述层级结构逐级设置优先级,其中,所述层级结构中的每一层级包含多个子类别;
所述实体信息按照优先级顺序与所述层级结构中各层级包含的子类别进行相似度比对,获取匹配的子类别分布,将所述实体信息录入优先级最低的子类别中,构建实体库。
可选地,设置层级结构中每个层级以及对应的子类别的索引标识,根据实体信息对应的子类别分布,创建对应实体信息的索引标识。
可选地,所述属性信息包括:生产方、供应方、使用方式和适用对象。
可选地,对所述实体库中最低优先级的子类别包含的实体信息按照对应属性信息进行聚类,获取聚类类别;
将每个聚类类别中字符数最多的实体信息作为对应聚类类别的类别标识;
在检索时,优先比对聚类标识,当检索信息与所述聚类类别的相似度在阈值范围内时,将检索信息与聚类类别中的实体信息进行比对,验证检索信息是否与聚类类别包含的实体信息匹配,输出匹配的实体信息以及对应的实体描述信息;
当检索信息与所述聚类标识的相似度超出所述阈值范围上限时,输出所述聚类标识以及对应的实体描述信息。
可选地,录入检索文本,根据所述检索文本获取匹配的检索式,包括:
对所述检索文本进行特征提取,获取多个检索特征;
将所述检索特征与所述实体框架类别进行比对,获取对应类别的实体集合;
将所述检索特征与所述实体集合中每个实体信息对应的检索式进行比对,获取匹配的输出。
一种线下入库检索系统,包括:
实体获取模块,用于获取入库目标的待识别文本图像,将所述待识别文本图像输入匹配的文本识别模型,得到实体信息以及实体描述信息,建立实体信息与对应实体描述信息的映射关系;
入库管理模块,用于将所述实体信息与预设实体框架类别进行比对,并将所述实体信息录入对应的实体框架类别中,形成实体库;
索引创建模块,从所述实体描述信息中获取实体信息对应的属性信息,根据所述属性信息以及对应实体框架类别创建所述实体库中每个实体信息对应的检索式;
检索模块,用于录入检索文本,根据所述检索文本获取匹配的检索式,并输出匹配的实体信息以及对应的实体描述信息。
一种线下入库检索设备,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行所述的线下入库检索方法。
一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行所述的线下入库检索方法。
如上所述,本发明一种线下入库检索方法、系统、设备和介质,具有以下有益效果。
自动识别待入库目标对应的文本图像,并根据识别的实体信息进行匹配入库;只需要预设实体框架类别,便可快速识别完成入库;根据入库类别以及实体关联的属性信息,实现快速检索,保障检索结果的准确性,提高整体处理效率,节约人工成本。
附图说明
图1为本发明一实施例中线下入库检索方法的流程示意图。
图2为本发明一实施例中线下入库检索系统的模块图。
图3为本发明一实施例中设备的结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
请参阅图1,本发明提供一种线下入库检索方法,包括步骤S01-S04。
在步骤S01中,获取入库目标的待识别文本图像,将待识别文本图像输入匹配的文本识别模型,得到实体信息以及实体描述信息,建立实体信息与对应实体描述信息的映射关系。
在一实施例中,可预先设置实体框架类别,例如,实体框架可包括药品类、器械类等。进一步,构建每个实体框架类别对应的文本识别模型。按类别构建文本识别模型可有效提高对应类别文本的识别准确性。构建文本识别模型的步骤可包括:
预先选取对应类别的文本图像,对文本图像中的实体进行标注,以药品为例,可整理各类药品的使用说明书图像,构建图像样本集。对图像样本集中药品名称进行标注,并将标注后的文本图像输入预先构建的神经网络框架进行模型预训练,得到对应实体框架类别的文本识别模型。可选地,神经网络框架可采用卷积神经网络与循环神经网络的组合框架结构,通过卷积神经网络对输入的文本图像进行卷积操作,得到多个图像快,通过全连接层提取图像块的卷积特征,将卷积特征输入循环神经网络,循环神经网络可采用长短期记忆神经网络,通过长短期记忆神经网络关注上下文信息,得到文本序列特征,对文本序列特征进行分类,得到对应的实体信息。文本识别模型的网络架构可根据实际应用需求进行调整,这里不作限制,具体训练过程,为现有技术,这里不做赘述。可选地,每个实体框架类别对应的文本识别模型可采用相同的网络架构,训练过程中,通过调整对应的训练样本进行模型训练,得到对应的文本识别模型。
在一实施例中,在进行入库操作时,可通过设置在指定位置的摄像装置采集入库目标的待识别文本图像。可选地,待识别文本图像可包括手写文本对应的图像,产品使用说明书图像或其他文本扫描件等。以药品入库为例,可通过摄像头采集药品使用说明对应的文本图像,同时标注采集图像的类别为药品类,根据标注的信息可匹配对应实体框架类别的文本识别模型。通过文本识别模型可识别实体信息如药品名称,也可从文本图像中提取文本信息作为药品的描述信息。将提取的实体信息和实体描述信息建立映射关系。可选地,可将实体描述信息存入数据库构建对应类别的描述信息库。根据建立的映射关系从描述信息库中提取对应的实体描述信息。
在一实施例中,也可采集同一类的入库目标的文本图像,批量导入系统,对批量导入图像进行统一标注,匹配文本识别模型进行实体信息及实体描述信息提取。
在步骤S02中,将实体信息与预设实体框架类别进行比对,并将对应实体信息录入对应的实体框架类别中,形成实体库。
在一实施例中,可设置每个实体框架类别对应的层级结构,层级结构中每个层级包含多个子类别。示例性地,如药品类对应第一层级包含中药类、西药类;西药类对应第二层级:消炎药、肠胃药、心血管类药;消炎药对应第三层级:外用类和内服类等。以此形成框架式的层级结构。可选地,可将第一层级设置为最高优先级,以第一层级为起点逐级降低优先级。入库时,将文本识别模型提取的实体信息与层级结构中各子类别进行比对。可选地,可将实体信息按照层级结构的优先级与对应的子类别进行比对。如可预先将实体信息与优先级最高的第一层级子类别进行相似度比对,获取匹配的子类别。在将匹配的子类别对应的第二层级子类别与实体信息进行进一步比对,以此方法,逐级比对,将实体信息录入匹配的优先级最低的层级子类别中。根据前述步骤,将所有入库目标录入实体框架类别中,形成实体库。
在一实施例中,可设置层级结构中每个层级以及对应子类别的索引标识,实体信息入库后可根据实体信息在层级结构中的子类别分布,创建该实体信息的索引标识。示例性地,药品A的子类别分布为C-C01-C011-C0112,其中C表示药品类、C01表示第一层级,C011表示第一层级对应的第一子类别,C0112表示第一子类别对应第二层级中的第二个子类别。
在步骤S03中,从实体描述信息中获取实体信息对应的属性信息,根据属性信息以及对应实体框架类别创建实体库中每个实体信息对应的检索式。
在一实施例中,也可通过文本识别模型从文本描述信息提取属性信息。文本识别模型的网络架构可采用与步骤S01中的文本识别模型同样的网络架构。通过标注属性信息构建训练样本集,进行模型训练,得到用于提取属性信息的文本识别模型。具体训练过程,为现有技术,这里不做赘述。可选地,属性信息可包括生产方、供应商、使用方式、适用对象等。
在一实施例中,可将属性信息以及实体框架类别用于生成对应入库实体信息的检索式。示例性地,以药品为例,可根据步骤S02中得到的索引标识结合药品名称、生产方、供应商、使用方式、适用对象等信息生成药品的检索式,具体可表示为:索引标识OR药品名OR供应商OR使用方式OR适用对象。检索式表达也可采用其他方式,这里不作具体限制。
在步骤S04中,录入检索文本,根据检索文本获取匹配的检索式,并输出匹配的实体信息以及对应的实体描述信息。
在一实施例中,由于识别的文本图像可能包含手写文本图像,而手写文本可能存在一些实体名称的简写形式,如布洛芬缓释胶囊,简写为布洛芬胶囊。经过一段时间的入库更新,实体库中可包含同义实体的多个同义信息。因此,可定期对实体库中每个子类别包含的实体信息进行聚类得到对应的聚类类别。可选地,聚类时,可将属性信息相同的实体信息作为一个聚类类别,如生产方相同、供应商相同等。在进行检索时,可直接匹配包含多个同义信息的聚类类别,根据属性判别获取同属性的实体信息。可选地,可将聚类类别中包含字符数最多的实体信息作为该聚类类别的类别标识。
在检索时,首先可通过神经网络对检索文本进行特征提取,得到多个检索特征。进一步地,将检索特征与实体框架类别进行特征比对。可选地,神经网络可采用递归神经网络或循环神经网络等。具体地,可将检索特征按照层级结构逐级进行检索特征比对,计算检索特征与各层级包含的子类别之间的相似度。通过层级比对缩小检索范围,最终相似度达到设定阈值的最低优先级子类别作为匹配的子类别,将该子类别包含的实体信息用于组建实体集合。
在一实施例中,可将检索特征与实体集合中各实体信息对应的检索式进行比对。如检索式中属性信息与检索特征的相似度达到相似度阈值,可进一步比对检索信息与实体信息的相似度。可选地,可优先比对检索信息与聚类类别对应的类别标识的相似度。若二者相似度在设定阈值范围内如60%-80%,则将检索信息与聚类类别中各实体信息进行比对,若存在相似度到达第二设定阈值(如90%)的实体信息,则输出该实体信息,并根据该实体信息从描述信息库中获取实体描述信息一并输出。当未达到第二相似度阈值时,则输出未查找到匹配信息。当检索信息与聚类类别对应的类别标识的相似度大于设定阈值上限80%时,则直接输出聚类类别对应类别标识以及关联的实体描述信息。
请参阅图2,本实施例提供了一种线下入库检索系统,用于执行前述方法实施例中所述的线下入库检索方法。由于系统实施例的技术原理与前述方法实施例的技术原理相似,因而不再对同样的技术细节做重复性赘述。
在一实施例中,线下入库检索系统,包括:
实体获取模块10,用于获取入库目标的待识别文本图像,将所述待识别文本图像输入匹配的文本识别模型,得到实体信息以及实体描述信息,建立实体信息与对应实体描述信息的映射关系;
入库管理模块11,用于将所述实体信息与预设实体框架类别进行比对,并将所述实体信息录入对应的实体框架类别中,形成实体库;
索引创建模块12,从所述实体描述信息中获取实体信息对应的属性信息,根据所述属性信息以及对应实体框架类别创建所述实体库中每个实体信息对应的检索式;
检索模块13,用于录入检索文本,根据所述检索文本获取匹配的检索式,并输出匹配的实体信息以及对应的实体描述信息。
实体获取模块10用于辅助执行前述方法实施例介绍的步骤S01;入库管理模块11用于执行前述方法实施例介绍的步骤S02;索引创建模块12用于执行前述方法实施例介绍的步骤S03;检索模块13用于执行前述方法实施例介绍的步骤S04。
本申请实施例还提供了一种线下入库检索设备,该设备可以包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述设备执行图1所述的方法。在实际应用中,该设备可以作为终端设备,也可以作为服务器,终端设备的例子可以包括:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准语音层面3,Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准语音层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等,本申请实施例对于具体的设备不加以限制。
本申请实施例还提供了一种机器可读介质,该介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例的图1中线下入库检索方法所包含步骤的指令(instructions)。机器可读介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(如:软盘、硬盘、磁带)、光介质(如:DVD)、或者半导体介质(如:固态硬盘Solid State Disk(SSD))等。
参阅图3,本实施例提供一种设备80,设备80可以是台式机、便携式电脑、智能手机等设备。详细的,设备80至少包括通过总线81连接的:存储器82、处理器83,其中,存储器82用于存储计算机程序,处理器83用于执行存储器82存储的计算机程序,以执行前述方法实施例中的全部或部分步骤。
上述提到的系统总线可以是外设部件互连标准(Peripheral PomponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
综上所述,本发明一种线下入库检索方法、系统、设备和介质,自动识别文本图像,进行分类匹配入库,有效提高处理效率;只需要预先构建实体框架类别,便可以自动识别入库,得到结构化的入库实体信息;检索人员可直接根据索引标识进行信息检索,也可输入文本进行信息检索,信息匹配准确性高;聚类同义信息,提高检索的准确性,优化检索体验,简化操作。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (9)

1.一种线下入库检索方法,其特征在于,包括:
获取入库目标的待识别文本图像,将所述待识别文本图像输入匹配的文本识别模型,得到实体信息以及实体描述信息,建立实体信息与对应实体描述信息的映射关系;
将所述实体信息与预设实体框架类别进行比对,并将所述实体信息录入对应的实体框架类别中,形成实体库,其中,所述实体框架类别包括药品类和器械类;
从所述实体描述信息中获取实体信息对应的属性信息,根据所述属性信息以及对应实体框架类别创建所述实体库中每个实体信息对应的检索式;
录入检索文本,根据所述检索文本获取匹配的检索式,包括:对所述检索文本进行特征提取,获取多个检索特征;将所述检索特征与所述实体框架类别进行比对,获取对应类别的实体集合;将所述检索特征与所述实体集合中每个实体信息对应的检索式进行比对,获取匹配的输出,并输出匹配的实体信息以及对应的实体描述信息。
2.根据权利要求1所述的线下入库检索方法,其特征在于,根据设置的实体框架类别,构建每个实体框架类别对应的文本识别模型;
对所述待识别文本图像进行标注,根据标注信息获取匹配的文本识别模型。
3.根据权利要求1所述的线下入库检索方法,其特征在于,将所述实体信息与预设实体框架类别进行比对,包括:
设置每个实体框架类别对应的层级结构,并按照所述层级结构逐级设置优先级,其中,所述层级结构中的每一层级包含多个子类别;
所述实体信息按照优先级顺序与所述层级结构中各层级包含的子类别进行相似度比对,获取匹配的子类别分布,将所述实体信息录入优先级最低的子类别中,构建实体库。
4.根据权利要求3所述的线下入库检索方法,其特征在于,设置层级结构中每个层级以及对应的子类别的索引标识,根据实体信息对应的子类别分布,创建对应实体信息的索引标识。
5.根据权利要求1所述的线下入库检索方法,其特征在于,所述属性信息包括:生产方、供应方、使用方式和适用对象。
6.根据权利要求3所述的线下入库检索方法,其特征在于,对所述实体库中最低优先级的子类别包含的实体信息按照对应属性信息进行聚类,获取聚类类别;
将每个聚类类别中字符数最多的实体信息作为对应聚类类别的类别标识;
在检索时,优先比对聚类标识,当检索信息与所述聚类类别的相似度在阈值范围内时,将检索信息与聚类类别中的实体信息进行比对,验证检索信息是否与聚类类别包含的实体信息匹配,输出匹配的实体信息以及对应的实体描述信息;
当检索信息与所述聚类标识的相似度超出所述阈值范围上限时,输出所述聚类标识以及对应的实体描述信息。
7.一种线下入库检索系统,其特征在于,包括:
实体获取模块,用于获取入库目标的待识别文本图像,将所述待识别文本图像输入匹配的文本识别模型,得到实体信息以及实体描述信息,建立实体信息与对应实体描述信息的映射关系;
入库管理模块,用于将所述实体信息与预设实体框架类别进行比对,并将所述实体信息录入对应的实体框架类别中,形成实体库;其中,所述实体框架类别包括药品类和器械类;
索引创建模块,从所述实体描述信息中获取实体信息对应的属性信息,根据所述属性信息以及对应实体框架类别创建所述实体库中每个实体信息对应的检索式;
检索模块,用于录入检索文本,根据所述检索文本获取匹配的检索式,包括:对所述检索文本进行特征提取,获取多个检索特征;将所述检索特征与所述实体框架类别进行比对,获取对应类别的实体集合;将所述检索特征与所述实体集合中每个实体信息对应的检索式进行比对,获取匹配的输出,并输出匹配的实体信息以及对应的实体描述信息。
8.一种线下入库检索设备,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行如权利要求1-6中任一所述的方法。
9.一种机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得设备执行如权利要求1-6中任一所述的方法。
CN202110514420.1A 2021-05-12 2021-05-12 一种线下入库检索方法、系统、设备和介质 Active CN112990835B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110514420.1A CN112990835B (zh) 2021-05-12 2021-05-12 一种线下入库检索方法、系统、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110514420.1A CN112990835B (zh) 2021-05-12 2021-05-12 一种线下入库检索方法、系统、设备和介质

Publications (2)

Publication Number Publication Date
CN112990835A CN112990835A (zh) 2021-06-18
CN112990835B true CN112990835B (zh) 2021-09-21

Family

ID=76337600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110514420.1A Active CN112990835B (zh) 2021-05-12 2021-05-12 一种线下入库检索方法、系统、设备和介质

Country Status (1)

Country Link
CN (1) CN112990835B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701631A (zh) * 2016-01-06 2016-06-22 北京京东尚科信息技术有限公司 一种商品入库方法和仓库管理系统
CN109064092A (zh) * 2018-07-17 2018-12-21 佛山市南海魔立方软件科技有限公司 钢材入库管理方法、系统及钢材进销存管理平台
CN110162640A (zh) * 2019-04-28 2019-08-23 北京百度网讯科技有限公司 新实体挖掘方法、装置、计算机设备及存储介质
CN112783901A (zh) * 2021-03-01 2021-05-11 合沃物联技术(南京)有限公司 一种基于物联网中间件的物联网时序大数据处理方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107516176B (zh) * 2016-06-17 2021-03-19 菜鸟智能物流控股有限公司 物流信息处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701631A (zh) * 2016-01-06 2016-06-22 北京京东尚科信息技术有限公司 一种商品入库方法和仓库管理系统
CN109064092A (zh) * 2018-07-17 2018-12-21 佛山市南海魔立方软件科技有限公司 钢材入库管理方法、系统及钢材进销存管理平台
CN110162640A (zh) * 2019-04-28 2019-08-23 北京百度网讯科技有限公司 新实体挖掘方法、装置、计算机设备及存储介质
CN112783901A (zh) * 2021-03-01 2021-05-11 合沃物联技术(南京)有限公司 一种基于物联网中间件的物联网时序大数据处理方法

Also Published As

Publication number Publication date
CN112990835A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
JP6629942B2 (ja) 機械学習およびファジーマッチングを使用した階層型の自動的な文書の分類およびメタデータ識別
CN111581976B (zh) 医学术语的标准化方法、装置、计算机设备及存储介质
CN108491543A (zh) 图像检索方法、图像存储方法及图像检索系统
Maihami et al. Automatic image annotation using community detection in neighbor images
CN110083731B (zh) 图像检索方法、装置、计算机设备及存储介质
CN109917978B (zh) 基于bim模型的批注对应构件显示方法、装置以及存储装置
WO2022007596A1 (zh) 图像检索系统、方法和装置
CN111488479A (zh) 超图构建方法、装置以及计算机系统和介质
CN112990835B (zh) 一种线下入库检索方法、系统、设备和介质
WO2010071617A1 (en) Method and apparatus for performing image processing
CN112287140A (zh) 一种基于大数据的图像检索方法及系统
CN110209895B (zh) 向量检索方法、装置和设备
CN116664465A (zh) 一种多模态图像融合方法、装置及计算机设备
CN114329016B (zh) 图片标签生成方法和文字配图方法
CN110765917A (zh) 适用于人脸识别模型训练的主动学习方法、装置、终端、介质
CN114077682B (zh) 一种图像检索智能识别匹配处理方法、系统和存储介质
CN111178455B (zh) 图像聚类方法、系统、设备及介质
CN113779231B (zh) 基于知识图谱的大数据可视化分析方法、装置及设备
CN110647666B (zh) 模板与公式的智能匹配方法、装置及计算机可读存储介质
Hua et al. Cross-modal correlation learning with deep convolutional architecture
CN113505257A (zh) 图像检索方法、商标检索方法、电子设备以及存储介质
Sebastine et al. Semantic web for content based video retrieval
Jiang et al. Gvos: a general system for near-duplicate video-related applications on storm
CN116702024B (zh) 流水数据类型识别方法、装置、计算机设备和存储介质
US11893012B1 (en) Content extraction using related entity group metadata from reference objects

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220707

Address after: 201615 room 1904, G60 Kechuang building, No. 650, Xinzhuan Road, Songjiang District, Shanghai

Patentee after: Shanghai Mingping Medical Data Technology Co.,Ltd.

Address before: 102400 no.86-n3557, Wanxing Road, Changyang, Fangshan District, Beijing

Patentee before: Mingpinyun (Beijing) data Technology Co.,Ltd.

TR01 Transfer of patent right