WO2020034810A1

WO2020034810A1 - 搜索方法、装置、计算机设备和存储介质

Info

Publication number: WO2020034810A1
Application number: PCT/CN2019/096978
Authority: WO
Inventors: 胡帆; 吴迪
Original assignee: 平安医疗健康管理股份有限公司
Priority date: 2018-08-14
Filing date: 2019-07-22
Publication date: 2020-02-20
Also published as: CN109215796A; CN109215796B

Abstract

一种搜索方法，包括：接收终端发送的搜索请求，搜索请求中携带当前待搜索医疗术语及目标语料对应的类型标识（S202）；对当前待搜索医疗术语进行分词，根据分词结果得到当前待搜索医疗术语对应的多个待搜索子词语（S204）；根据待搜索子词语从预先建立的语义网络中获取对应的匹配词，并获取匹配词对应的编码作为当前待搜索医疗术语对应的子编码（S206）；从语义网络中获取每一个子编码对应的关联编码，得到当前待搜索医疗术语对应的关联编码集合（S208）；根据目标语料对应的类型标识从关联编码集合中选取目标关联编码，获取目标关联编码对应的语料得到目标语料（S210）；将目标语料发送至终端（S212）。

Description

搜索方法、装置、计算机设备和存储介质

相关申请的交叉引用

本申请要求于2018年8月14日提交中国专利局，申请号为2018109232587，申请名称为“搜索方法、装置、计算机设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及一种搜索方法、装置、计算机设备和存储介质。

背景技术

随着计算机技术的发展，计算机中存储的医学数据不断积累，已逐步达到海量级。医疗工作者常常需要通过计算机从海量的医学数据中获取自己想要的数据，如获取与某类疾病相关的数据，包括药品、检查项目、手术项目等等。

传统技术中，计算机通常获取到医疗术语搜索词后，通过搜索词从海量数据中搜索包含该搜索词的医学数据，然而发明人意识到，由于同一个医疗术语对应多种不同的表述，因此通过这种方式搜索到的数据并不全面。

发明内容

根据本申请公开的各种实施例，提供一种搜索方法、装置、计算机设备和存储介质。

一种搜索方法包括：接收终端发送的搜索请求，所述搜索请求中携带当前待搜索医疗术语及目标语料对应的类型标识；对所述当前待搜索医疗术语进行分词，根据分词结果得到所述当前待搜索医疗术语对应的多个待搜索子词语；根据所述待搜索子词语从预先建立的语义网络中获取对应的匹配词，并获取所述匹配词对应的编码作为所述当前待搜索医疗术语对应的子编码；从所述语义网络中获取每一个子编码对应的关联编码，得到所述当前待搜索医疗术语对应的第一关联编码集合；根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码，获取所述第一目标关联编码对应的语料得到目标语料；及将所述目标语料发送至所述终端。

一种搜索装置，所述装置包括：搜索请求接收模块，用于接收终端发送的搜索请求，所述搜索请求中携带当前待搜索医疗术语及目标语料对应的类型标识；待搜索子词语获取模块，用于对所述当前待搜索医疗术语进行分词，根据分词结果得到所述当前待搜索医疗术语对应的多个待搜索子词语；子编码获取模块，用于根据所述待搜索子词语从预先建立的语义网络中获取对应的匹配词，并获取所述匹配词对应的编码作为所述当前待搜索医疗术语对应的子编码；关联编码获取模块，用于从所述语义网络中获取每一个子编码对应的关联编码，得到所述当前待搜索医疗术语对应的第一关联编码集合；第一目标语料获取模块，用于根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码，获取所述第一目标关联编码对应的语料得到目标语料；及目标语料发送模块，用于将所述目标语料发送至所述终端。

一种计算机设备，包括存储器和一个或多个处理器，所述存储器中储存有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述一个或多个处理器执行以下步骤：

接收终端发送的搜索请求，所述搜索请求中携带当前待搜索医疗术语及目标语料对应的类型标识；对所述当前待搜索医疗术语进行分词，根据分词结果得到所述当前待搜索医疗术语对应的多个待搜索子词语；根据所述待搜索子词语从预先建立的语义网络中获取对应的匹配词，并获取所述匹配词对应的编码作为所述当前待搜索医疗术语对应的子编码；从所述语义网络中获取每一个子编码对应的关联编码，得到所述当前待搜索医疗术语对应的第一关联编码集合；根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码，获取所述第一目标关联编码对应的语料得到目标语料；及将所述目标语料发送至所述终端。

一个或多个存储有计算机可读指令的非易失性计算机可读存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：

本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为根据一个或多个实施例中搜索方法的应用场景图；

图2为根据一个或多个实施例中搜索方法的流程示意图；

图3为根据一个或多个实施例中语义网络生成的步骤流程示意图；

图4为根据一个或多个实施例中搜索装置的结构框图；

图5为根据一个或多个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的搜索方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。终端102向服务器104发送携带当前待搜索医疗术语及目标语料对应的类型标识的搜索请求，服务器104接收到搜索请求后，对当前待搜索医疗术语进行分词以获取多个待搜索子词语，然后从预先建立的语义网络中获取待搜索子词语对应的匹配词以及匹配词的编码，接着从语义网络中查找获取到的每一个编码对应的关联编码，最后将获取到的关联编码中类型标识与目标语料相同的编码所对应的语料作为目标语料，最后将目标语料发送至终端102。

终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一些实施例中，如图2所示，提供了一种搜索方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

步骤S202，接收终端发送的搜索请求，搜索请求中携带当前待搜索医疗术语及目标语料对应的类型标识。

当前待搜索医疗术语指的是当前用于进行搜索的原始语料，包括但不限于疾病名称、解剖部位词语、疾病词语等等；目标语料指的是期望通过搜索得到的语料；类型标识用于唯一标识目标语料所属的语料维度。在其中一个实施例中，类型标识可以是目标语料所属语料维度的名称。举例说明，当需要搜索某个疾病如“开放性小脑出血”相关的药品时，则“开放性小脑出血”为当前待搜索医疗术语，目标语料为药品类的语料，目标语料对应的类型标识为唯一标识药品这一语料维度的标识。

在一些实施例中，终端可提供一个搜索界面，搜索界面上可包含输入框、下拉选择框等输入控件以及确认搜索控件。当用户在输入框中输入当前待搜索医疗术语，并在下拉选择框中选择一个或多个目标语料的类型，且终端检测到作用于确认搜索控件的点击操作时，获取目标语料的类型标识，然后根据目标语料的类型标识及当前待搜索医疗术语生成搜索请求，将搜索请求发送至服务器。

步骤S204，对当前待搜索医疗术语进行分词，根据分词结果得到当前待搜索医疗术语对应的多个待搜索子词语。

分词结果指的是分词得到的词序列，如对“开放性小脑出血”进行分词得到的分词结果为“开放性/小脑/出血”。

在本实施例中，得到分词结果后，从分词结果中选取具有医学含义的词，包括解剖部位相关的词，比如“小脑”、“食指”等；疾病相关的词，比如“骨折”、“出血”、“脱位”等；程度/类型相关的词，比如“粉碎性”、“开放性”、“慢性”等等。进一步，将从分词结果中选取的具有明确含义的词作为待搜索子词语，如当当前待搜索医疗术语为开放性小脑出血时，其分词结果中的三个词都可以作为该术语对应的待搜索子词语。

步骤S206，根据待搜索子词语从预先建立的语义网络中获取对应的匹配词，并获取匹配词对应的编码作为当前待搜索医疗术语对应的子编码。

具体地，语义网络(semantic network)是一种以网络格式表达医学知识构造的形式。语义网络包括多个语义维度的语料，如解剖部位语料、程度/类型语料、疾病语料、药品语料、检查项目语料、手术项目语料，解剖部位语料指的是对人体解剖学中各个解剖部位的描述，如髋部、尾骨等；疾病语料指的是对疾病的具体医学描述，如骨折、出血、脱位等等；程度/类型语料指的是疾病所对应的严重程度的医学描述或者疾病所对应的类型的医学描述，例如，粉碎性、开放性、慢性、急性等等。

每一个维度的语料按照预设的规则进行编码，并在语义网络中用编码对语料进行标记。在语义网络中，对于属于不同语义维度的任意两个语料，若其共现频率大于预设阈值，则说明这两个语料具有语义上的关联关系，对具有关联关系的两个语料对应的编码之间建立关联关系，则这两个编码互为关联编码，具有关联关系的两个编码在语义网络中通过网络中的一条“边”进行连接。在语义网络中，可通过这些“边”查到任意一个编码的关联编码。匹配词指的是与待搜索子词语相匹配的词语。

在本实施例中，服务器获取到待搜索子词语，从预先建立的语义网络中查到与待搜索子词语相匹配的词作为待搜索子词语的匹配词，然后获取到该匹配词的编码作为当前待搜索医疗术语的子编码，这样，当前待搜索医疗术语将对应多个编码。

步骤S208，从语义网络中获取每一个子编码对应的关联编码，得到当前待搜索医疗术语对应的第一关联编码集合。

具体地，由于语义网络的各个编码之间事先已经建立了关联关系，因此，在获取到匹配词对应的编码作为子编码后，可从语义网络中查找每一个子编码对应的关联编码，所有的关联编码组合得到第一关联编码集合。

步骤S210，根据目标语料对应的类型标识从第一关联编码集合中选取第一目标关联编码，获取第一目标关联编码对应的语料得到目标语料。

具体地，由于语义网络中包含多个语义维度的语料，而目标语料只是其中某一个或某几个语义维度的语料，因此，需要根据目标语料对应的类型标识从第一关联编码集合中来选取目标关联编码。

在一些实施例中，在对各个语义维度的语料进行编码时，可在编码中带上该语义维度对应的类型标识，在获取到第一关联编码集合后，将各个关联编码分别与目标语料对应的类型标识进行比对，若比对成功，即某个关联编码中包含该类型标识时，则选取该关联编码作为目标关联编码。

在另一个实施例中，事先将各个语义维度的编码与该语义维度对应的类型标识建立映射关系，当获取到第一关联编码集合后，根据映射关系查找到第一关联编码集合中各个第一关联编码对应的类型标识，将类型标识与目标语料对应的类型标识相同的关联编码确定为目标关联编码。

进一步，服务器可根据目标关联编码获取到对应的语料，这些语料即为目标语料。

步骤S212，将目标语料发送至终端。

具体地，服务器将获取到的目标语料通过网络发送至终端。

上述搜索方法中，服务器在接收到携带当前待搜索医疗术语及目标语料对应的类型标识的搜索请求后，对搜索请求中携带的当前待搜索医疗术语进行分词以得到多个待搜索子词语，然后在从预先建立的语义网络中获取对应的匹配词，并获取匹配词对应的编码得到子编码，然后查找每一个子编码对应的关联编码，最后根据目标语料对应的类型标识从关联编码集合中选取目标关联编码，获取目标关联编码对应的语料得到目标语料，采用本申请的方法，对于同一术语的任意不同描述，服务器都可以通过分词、获取匹配词，并从语义网络中获取到所有关联的语料以得到目标语料，因此提高了医疗数据搜索的全面性。

在一些实施例中，如图3所示，上述方法还包括生成语义网络的步骤，具体包括：

步骤S302，获取预设多个语义维度的语义树，每一个语义维度的语义树对应一个类型标识，每一个语义维度的语义树包含多个节点语料。

具体地，可首先针对标准化的医学语料库中抽取各个预设维度的语料，按照每一个维度对应的语料之间的语义关系预先构建语义树。预设的语义维度包括但不限于解剖部位、程度、疾病、药品、检查项目、手术项目等等；类型标识用于唯一标识语义树所属的语义维度，可由预设位数的字母组成，如对于解剖部位，可标识为“JP”。如下表1所示，以针对部位“耳”的部分语义树进行举例：

表1

步骤S304，根据类型标识及预设的编码规则对语义树对应的节点语料进行编码。

具体地，可以由类型标识及数字按照预设的编码规则来组成节点语料对应的编码，如对于上表中的耳可编码为JP3，对于外耳，中耳，内耳分别编码为JP3.1、JP3.2、JP3.3，对于耳廓、外耳道、鼓膜分别编码为JP3.1.1、JP3.1.2、JP3.1.3，依次类推。

步骤S306，计算每一个维度的语义树对应的节点语料与其他维度的语义树对应的节点语料两两之间的共现频率。

具体地，对于每一个语义维度的语义树，计算其对应的每一个节点语料，与其他语义维度的语义树对应的节点语料之间的共现频率，共现频率指的是两个语料在预设的上下文范围内共同出现的频率，共现频率越大，表示两个词语的关联程度越大。共现频率常常以共现矩阵的形式来表达，共现矩阵例如可以采用MapReduce模型实现的pairs算法或者stripes算法计算得到。

步骤S308，将共现频率大于预设阈值的两个节点语料对应的编码建立关联关系，以生成语义网络。

具体地，预设阈值可根据对语义网络中两个相互关联的节点语料之间关联程度的不同要求进行不同程度的设定。两个相互关联的节点语料之间关联程度要求越高，则预设阈值越大。

在本实施例中，对于共现频率大于预设阈值的两个节点语料，将其对应的编码通过一条边进行连接，即将两个节点语料对应的编码建立关联关系。当各个语义树对应的编码之间的关联关系建立好后，得到语义网络。在该语义网络中，通过任意一个编码进行搜索，可获取与之相关联的所有编码。

可以理解，由于编码与节点语料之间存在一一对应的映射关系，当编码之间建立关联关系后，编码对应的语料之间自然也有了关联关系。

在一些实施例中，上述方法还包括：获取子编码对应的类型标识；根据子编码对应的类型标识从关联编码集合中选取第二目标关联编码；从语义网络中获取与第二目标关联编码对应的关联编码，得到当前待搜索医疗术语对应的第二关联编码集合；根据目标语料对应的类型标识从第二关联编码集合中选取第三目标关联编码，获取第三目标关联编码对应的语料得到目标语料。

具体地，子编码对应的关联编码包括两类，第一类是类型标识与目标语料对应的类型标识相同的编码，第二类是类型标识与目标语料对应的类型标识不相同的编码，在第二类编码中，包括了与子编码对应的类型标识相同的编码，这些编码对应的语料为与当前待搜索医疗术语语义相关的语料，可用于对当前待搜索医疗术语进行扩展搜索，进一步提升数据搜索的全面性。

在本实施例中，从关联编码集合中选取类型标识与子编码对应的类型标识相同的关联编码，然后以这些关联编码为基准，从语义网络中查找这些关联编码所对应的关联编码，此时得到的关联编码为扩展搜索得到的关联编码，从这些关联编码中再次选取类型标识与目标语料对应的类型标识相同的关联编码作为目标关联编码，获取这些目标关联编码对应的语料，将这些语料与步骤S210中得到的语料一起作为当前待搜索医疗术语对应的目标语料，以对目标语料的数量进行扩展，进一步提升医疗数据搜索的全面性。

在一些实施例中，步骤S206中，根据待搜索子词语从预先建立的语义网络中获取对应的匹配词，包括：根据待搜索子词语，遍历与待搜索子词语所属的语义维度对应的语义树；计算待搜索子词语与每个遍历的节点语料的匹配度；获取匹配度最大值对应的节点语料作为与待搜索子词语对应的匹配词。

具体地，可以首先判断待搜索子词语所属的语义维度，然后遍历该语义维度对应的语义树，每遍历到一个节点语料时，计算该节点语料与待搜索子词语的匹配度，当语义树遍历完毕时，对所有的匹配度进行排序，获取匹配度最大值对应的节点语料作为待搜索子词语的匹配词。在一些实施例中，可通过词性标注来得到带搜索子词语所属的语义维度，具体来说，当某个词的词性标注结果为解剖部位，则该词所属的语义维度为解剖部位。

在一些实施例中，计算匹配度时，可采用word2vec分别得到待搜索子词语、节点语料的词向量，然后计算待搜索子词语、节点语料对应的词向量之间的向量距离或余弦夹角值，将向量距离或余弦夹角值作为匹配度。

在本实施例中，通过遍历待搜索子词语所属的语义维度对应的语义树来查找匹配词，相较于遍历整个语义网络，可以提高匹配词的获取效率，从而提高整体的搜索效率。

在一些实施例中，步骤S204中，根据分词结果得到当前待搜索医疗术语对应的多个待搜索子词语，包括：当分词结果中任意两个词语互为互斥词时，获取每一个互斥词对应的互斥权重，将权重较大的词语作为待搜索子词语。

互斥词指的是存在互斥关系的词，当两个词同时出现时，其中一个词的语义可以忽略时，这两个词存在互斥关系，互为互斥词。如，软组织损伤半骨折中，损伤与骨折为互斥词。

具体地，可预先建立一个互斥词典，并对每一对互斥词分别设定互斥权重。服务器可通过从互斥词典中进行查找，判断分词结果中是否存在互斥词，当存在互斥词，获取每一个互斥词对应的互斥权重，将互斥权重较大的词语作为待搜索子词语。如，软组织损伤半骨折中，若骨折的互斥权重大于损伤，则将骨折作为待搜索子词语。在一些实施例中，为提高互斥词判断的效率，可首先判断是否存在两个以上属于疾病语义维度的词语，若存在，则从互斥词典中，对这几个词语进行查找，判断是否为互斥词。

在本实施例中，通过判断互斥词，可提高搜索的精确性。

应该理解的是，虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一些实施例中，如图4所示，提供一种搜索装置400，包括搜索请求接收模块402、待搜索子词语获取模块404、子编码获取模块406、关联编码获取模块408、第一目标语料获取模块410、目标语料发送模块412，

搜索请求接收模块402用于接收终端发送的搜索请求，搜索请求中携带当前待搜索医疗术语及目标语料对应的类型标识；

待搜索子词语获取模块404用于对当前待搜索医疗术语进行分词，根据分词结果得到当前待搜索医疗术语对应的多个待搜索子词语；

子编码获取模块406用于根据待搜索子词语从预先建立的语义网络中获取对应的匹配词，并获取匹配词对应的编码作为当前待搜索医疗术语对应的子编码；

关联编码获取模块408用于从语义网络中获取每一个子编码对应的关联编码，得到当前待搜索医疗术语对应的第一关联编码集合；

第一目标语料获取模块410用于根据目标语料对应的类型标识从第一关联编码集合中选取第一目标关联编码，获取第一目标关联编码对应的语料得到目标语料；

目标语料发送模块412用于将目标语料发送至终端。

在一些实施例中，装置还包括语义网络生成模块；语义网络生成模块用于获取预设多个语义维度的语义树，每一个语义维度的语义树对应一个类型标识，每一个语义维度的语义树包含多个节点语料；根据类型标识及预设的编码规则对语义树对应的节点语料进行编码；计算每一个维度的语义树对应的节点语料与其他维度的语义树对应的节点语料两两之间的共现频率；将共现频率大于预设阈值的两个节点语料对应的编码建立关联关系，以生成语义网络。

在一些实施例中，装置还包括第一目标语料获取模块；第二目标语料获取模块用于获取子编码对应的类型标识；根据子编码对应的类型标识从关联编码集合中选取第二目标关联编码；从语义网络中获取与第二目标关联编码对应的关联编码，得到当前待搜索医疗术语对应的第二关联编码集合；根据目标语料对应的类型标识从第二关联编码集合中选取第三目标关联编码，获取第三目标关联编码对应的语料得到目标语料。

在一些实施例中，子编码获取模块406还用于根据待搜索子词语，遍历与待搜索子词语所属的语义维度对应的语义树；计算待搜索子词语与每个遍历的节点语料的匹配度；获取匹配度最大值对应的节点语料作为与待搜索子词语对应的匹配词。

在一些实施例中，待搜索子词语获取模块404还用于当分词结果中任意两个词语互为互斥词时，获取每一个互斥词对应的互斥权重，将权重较大的词语作为待搜索子词语。

关于搜索装置的具体限定可以参见上文中对于搜索方法的限定，在此不再赘述。上述搜索装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一些实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储医疗数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种搜索方法。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

一种计算机设备，包括存储器和一个或多个处理器，存储器中储存有计算机可读指令，计算机可读指令被处理器执行时，使得一个或多个处理器执行以下步骤：：接收终端发送的搜索请求，搜索请求中携带当前待搜索医疗术语及目标语料对应的类型标识；对当前待搜索医疗术语进行分词，根据分词结果得到当前待搜索医疗术语对应的多个待搜索子词语；根据待搜索子词语从预先建立的语义网络中获取对应的匹配词，并获取匹配词对应的编码作为当前待搜索医疗术语对应的子编码；从语义网络中获取每一个子编码对应的关联编码，得到当前待搜索医疗术语对应的第一关联编码集合；根据目标语料对应的类型标识从第一关联编码集合中选取第一目标关联编码，获取第一目标关联编码对应的语料得到目标语料；及将目标语料发送至终端。

在一些实施例中，处理器执行计算机可读指令时还实现以下步骤：获取预设多个语义维度的语义树，每一个语义维度的语义树对应一个类型标识，每一个语义维度的语义树包含多个节点语料；根据类型标识及预设的编码规则对语义树对应的节点语料进行编码；计算每一个维度的语义树对应的节点语料与其他维度的语义树对应的节点语料两两之间的共现频率；及将共现频率大于预设阈值的两个节点语料对应的编码建立关联关系，以生成语义网络。

在一些实施例中，在获取第一目标关联编码对应的语料得到目标语料之前，处理器执行计算机可读指令时还实现以下步骤：获取子编码对应的类型标识；根据子编码对应的类型标识从关联编码集合中选取第二目标关联编码；从语义网络中获取与第二目标关联编码对应的关联编码，得到当前待搜索医疗术语对应的第二关联编码集合；及所述获取所述第一目标关联编码对应的语料得到目标语料，包括：获取所述第一目标关联编码对应的语料及所述第三目标关联编码对应的语料得到目标语料。在一些实施例中，根据待搜索子词语从预先建立的语义网络中获取对应的匹配词，包括：根据待搜索子词语，遍历与待搜索子词语所属的语义维度对应的语义树；计算待搜索子词语与每个遍历的节点语料的匹配度；及获取匹配度最大值对应的节点语料作为与待搜索子词语对应的匹配词。

在一些实施例中，根据分词结果得到当前待搜索医疗术语对应的多个待搜索子词语，包括：当分词结果中任意两个词语互为互斥词时，获取每一个互斥词对应的互斥权重，及将权重较大的词语作为待搜索子词语。

在根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码之前，处理器执行计算机可读指令时还实现以下步骤：建立各个语义维度的编码与所述语义维度对应的类型标识之间的映射关系，得到映射关系表；所述根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码，包括：从所述映射关系表中查找所述第一关联编码集合中各个第一关联编码对应的类型标识；及将类型标识与所述目标语料对应的类型标识相同的第一关联编码确定为第一目标关联编码。

一个或多个存储有计算机可读指令的非易失性计算机可读存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：接收终端发送的搜索请求，搜索请求中携带当前待搜索医疗术语及目标语料对应的类型标识；对当前待搜索医疗术语进行分词，根据分词结果得到当前待搜索医疗术语对应的多个待搜索子词语；根据待搜索子词语从预先建立的语义网络中获取对应的匹配词，并获取匹配词对应的编码作为当前待搜索医疗术语对应的子编码；从语义网络中获取每一个子编码对应的关联编码，得到当前待搜索医疗术语对应的第一关联编码集合；根据目标语料对应的类型标识从第一关联编码集合中选取第一目标关联编码，获取第一目标关联编码对应的语料得到目标语料；及将目标语料发送至终端。

在一些实施例中，计算机可读指令被处理器执行时还实现以下步骤：获取预设多个语义维度的语义树，每一个语义维度的语义树对应一个类型标识，每一个语义维度的语义树包含多个节点语料；根据类型标识及预设的编码规则对语义树对应的节点语料进行编码；计算每一个维度的语义树对应的节点语料与其他维度的语义树对应的节点语料两两之间的共现频率；及将共现频率大于预设阈值的两个节点语料对应的编码建立关联关系，以生成语义网络。

在一些实施例中，在获取第一目标关联编码对应的语料得到目标语料之前，计算机可读指令被处理器执行时还实现以下步骤：获取子编码对应的类型标识；根据子编码对应的类型标识从关联编码集合中选取第二目标关联编码；从语义网络中获取与第二目标关联编码对应的关联编码，得到当前待搜索医疗术语对应的第二关联编码集合；及所述获取所述第一目标关联编码对应的语料得到目标语料，包括：获取所述第一目标关联编码对应的语料及所述第三目标关联编码对应的语料得到目标语料。

在一些实施例中，根据待搜索子词语从预先建立的语义网络中获取对应的匹配词，包括：根据待搜索子词语，遍历与待搜索子词语所属的语义维度对应的语义树；计算待搜索子词语与每个遍历的节点语料的匹配度；及获取匹配度最大值对应的节点语料作为与待搜索子词语对应的匹配词。

在一些实施例中，在根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码之前，计算机可读指令被处理器执行时还实现以下步骤：建立各个语义维度的编码与所述语义维度对应的类型标识之间的映射关系，得到映射关系表；所述根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码，包括：从所述映射关系表中查找所述第一关联编码集合中各个第一关联编码对应的类型标识；及将类型标识与所述目标语料对应的类型标识相同的第一关联编码确定为第一目标关联编码。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种搜索方法，包括：

接收终端发送的搜索请求，所述搜索请求中携带当前待搜索医疗术语及目标语料对应的类型标识；

对所述当前待搜索医疗术语进行分词，根据分词结果得到所述当前待搜索医疗术语对应的多个待搜索子词语；

根据所述待搜索子词语从预先建立的语义网络中获取对应的匹配词，并获取所述匹配词对应的编码作为所述当前待搜索医疗术语对应的子编码；

从所述语义网络中获取每一个子编码对应的关联编码，得到所述当前待搜索医疗术语对应的第一关联编码集合；

根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码，获取所述第一目标关联编码对应的语料得到目标语料；及将所述目标语料发送至所述终端。
根据权利要求1所述的方法，其特征在于，所述语义网络的生成步骤包括：

获取预设多个语义维度的语义树，每一个语义维度的所述语义树对应一个类型标识，每一个语义维度的所述语义树包含多个节点语料；

根据所述类型标识及预设的编码规则对所述语义树对应的节点语料进行编码；

计算每一个维度的语义树对应的节点语料与其他维度的语义树对应的节点语料两两之间的共现频率；及

将所述共现频率大于预设阈值的两个节点语料对应的编码建立关联关系，以生成语义网络。
根据权利要求1所述的方法，其特征在于，在所述获取所述第一目标关联编码对应的语料得到目标语料之前，所述方法还包括：

获取所述子编码对应的类型标识；

根据所述子编码对应的类型标识从所述第一关联编码集合中选取第二目标关联编码；

从所述语义网络中获取与所述第二目标关联编码对应的关联编码，得到所述当前待搜索医疗术语对应的第二关联编码集合；

根据所述目标语料对应的类型标识从所述第二关联编码集合中选取第三目标关联编码；及

所述获取所述第一目标关联编码对应的语料得到目标语料，包括：

获取所述第一目标关联编码对应的语料及所述第三目标关联编码对应的语料得到目标语料。
根据权利要求1所述的方法，其特征在于，所述根据所述待搜索子词语从预先建立的语义网络中获取对应的匹配词，包括：

根据所述待搜索子词语，遍历与所述待搜索子词语所属的语义维度对应的语义树；

计算所述待搜索子词语与每个遍历的节点语料的匹配度；及

获取匹配度最大值对应的节点语料作为与所述待搜索子词语对应的匹配词。
根据权利要求1至4任意一项所述的方法，其特征在于，所述根据分词结果得到所述当前待搜索医疗术语对应的多个待搜索子词语，包括：

当分词结果中任意两个词语互为互斥词时，获取每一个互斥词对应的互斥权重；及

将权重较大的词语作为待搜索子词语。
根据权利要求1所述的方法，其特征在于，在根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码之前，所述方法包括：

建立各个语义维度的编码与所述语义维度对应的类型标识之间的映射关系，得到映射关系表；

所述根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码，包括：

从所述映射关系表中查找所述第一关联编码集合中各个第一关联编码对应的类型标识；及

将类型标识与所述目标语料对应的类型标识相同的第一关联编码确定为第一目标关联编码。
一种搜索装置，包括：

搜索请求接收模块，用于接收终端发送的搜索请求，所述搜索请求中携带当前待搜索医疗术语及目标语料对应的类型标识；

待搜索子词语获取模块，用于对所述当前待搜索医疗术语进行分词，根据分词结果得到所述当前待搜索医疗术语对应的多个待搜索子词语；

子编码获取模块，用于根据所述待搜索子词语从预先建立的语义网络中获取对应的匹配词，并获取所述匹配词对应的编码作为所述当前待搜索医疗术语对应的子编码；

关联编码获取模块，用于从所述语义网络中获取每一个子编码对应的关联编码，得到所述当前待搜索医疗术语对应的第一关联编码集合；

第一目标语料获取模块，用于根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码，获取所述第一目标关联编码对应的语料得到目标语料；及目标语料发送模块，用于将所述目标语料发送至所述终端。
根据权利要求7所述的装置，其特征在于，所述装置还包括语义网络生成模块；

所述语义网络生成模块用于获取预设多个语义维度的语义树，每一个语义维度的所述语义树对应一个类型标识，每一个语义维度的所述语义树包含多个节点语料；根据所述类型标识及预设的编码规则对所述语义树对应的节点语料进行编码；计算每一个维度的语义树对应的节点语料与其他维度的语义树对应的节点语料两两之间的共现频率；及将所述共现频率大于预设阈值的两个节点语料对应的编码建立关联关系，以生成语义网络。
一种计算机设备，包括存储器及一个或多个处理器，所述存储器中储存有计算机可读指令，所述计算机可读指令被所述一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

接收终端发送的搜索请求，所述搜索请求中携带当前待搜索医疗术语及目标语料对应的类型标识；

对所述当前待搜索医疗术语进行分词，根据分词结果得到所述当前待搜索医疗术语对应的多个待搜索子词语；

根据所述待搜索子词语从预先建立的语义网络中获取对应的匹配词，并获取所述匹配词对应的编码作为所述当前待搜索医疗术语对应的子编码；

从所述语义网络中获取每一个子编码对应的关联编码，得到所述当前待搜索医疗术语对应的第一关联编码集合；

根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码，获取所述第一目标关联编码对应的语料得到目标语料；及

将所述目标语料发送至所述终端。
根据权利要求9所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

获取预设多个语义维度的语义树，每一个语义维度的所述语义树对应一个类型标识，每一个语义维度的所述语义树包含多个节点语料；

根据所述类型标识及预设的编码规则对所述语义树对应的节点语料进行编码；

计算每一个维度的语义树对应的节点语料与其他维度的语义树对应的节点语料两两之间的共现频率；及

将所述共现频率大于预设阈值的两个节点语料对应的编码建立关联关系，以生成语义网络。
根据权利要求9所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

获取所述子编码对应的类型标识；

根据所述子编码对应的类型标识从所述第一关联编码集合中选取第二目标关联编码；

从所述语义网络中获取与所述第二目标关联编码对应的关联编码，得到所述当前待搜索医疗术语对应的第二关联编码集合；

根据所述目标语料对应的类型标识从所述第二关联编码集合中选取第三目标关联编码；及

获取所述第一目标关联编码对应的语料及所述第三目标关联编码对应的语料得到目标语料。
根据权利要求9所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

根据所述待搜索子词语，遍历与所述待搜索子词语所属的语义维度对应的语义树；

计算所述待搜索子词语与每个遍历的节点语料的匹配度；及

获取匹配度最大值对应的节点语料作为与所述待搜索子词语对应的匹配词。
根据权利要求9至12任意一项所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

当分词结果中任意两个词语互为互斥词时，获取每一个互斥词对应的互斥权重；及

将权重较大的词语作为待搜索子词语。
根据权利要求9所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

建立各个语义维度的编码与所述语义维度对应的类型标识之间的映射关系，得到映射关系表；

从所述映射关系表中查找所述第一关联编码集合中各个第一关联编码对应的类型标识；及

将类型标识与所述目标语料对应的类型标识相同的第一关联编码确定为第一目标关联编码。
一个或多个存储有计算机可读指令的非易失性计算机可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

接收终端发送的搜索请求，所述搜索请求中携带当前待搜索医疗术语及目标语料对应的类型标识；

对所述当前待搜索医疗术语进行分词，根据分词结果得到所述当前待搜索医疗术语对应的多个待搜索子词语；

根据所述待搜索子词语从预先建立的语义网络中获取对应的匹配词，并获取所述匹配词对应的编码作为所述当前待搜索医疗术语对应的子编码；

从所述语义网络中获取每一个子编码对应的关联编码，得到所述当前待搜索医疗术语对应的第一关联编码集合；

根据所述目标语料对应的类型标识从所述第一关联编码集合中选取第一目标关联编码，获取所述第一目标关联编码对应的语料得到目标语料；及

将所述目标语料发送至所述终端。
根据权利要求15所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

获取预设多个语义维度的语义树，每一个语义维度的所述语义树对应一个类型标识，每一个语义维度的所述语义树包含多个节点语料；

根据所述类型标识及预设的编码规则对所述语义树对应的节点语料进行编码；

计算每一个维度的语义树对应的节点语料与其他维度的语义树对应的节点语料两两之间的共现频率；及

将所述共现频率大于预设阈值的两个节点语料对应的编码建立关联关系，以生成语义网络。
根据权利要求15所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

获取所述子编码对应的类型标识；

根据所述子编码对应的类型标识从所述第一关联编码集合中选取第二目标关联编码；

从所述语义网络中获取与所述第二目标关联编码对应的关联编码，得到所述当前待搜索医疗术语对应的第二关联编码集合；

根据所述目标语料对应的类型标识从所述第二关联编码集合中选取第三目标关联编码；及

获取所述第一目标关联编码对应的语料及所述第三目标关联编码对应的语料得到目标语料。
根据权利要求15所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

根据所述待搜索子词语，遍历与所述待搜索子词语所属的语义维度对应的语义树；

计算所述待搜索子词语与每个遍历的节点语料的匹配度；及

获取匹配度最大值对应的节点语料作为与所述待搜索子词语对应的匹配词。
根据权利要求15至18任意一项所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

当分词结果中任意两个词语互为互斥词时，获取每一个互斥词对应的互斥权重；及

将权重较大的词语作为待搜索子词语。
根据权利要求15所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

建立各个语义维度的编码与所述语义维度对应的类型标识之间的映射关系，得到映射关系表；

从所述映射关系表中查找所述第一关联编码集合中各个第一关联编码对应的类型标识；及

将类型标识与所述目标语料对应的类型标识相同的第一关联编码确定为第一目标关联编码。