CN109065129A - 科室推荐方法、装置、计算机设备和存储介质 - Google Patents

科室推荐方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109065129A
CN109065129A CN201810724890.9A CN201810724890A CN109065129A CN 109065129 A CN109065129 A CN 109065129A CN 201810724890 A CN201810724890 A CN 201810724890A CN 109065129 A CN109065129 A CN 109065129A
Authority
CN
China
Prior art keywords
pronouns
nouns
numerals
general term
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810724890.9A
Other languages
English (en)
Inventor
朱姬渊
孙行智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810724890.9A priority Critical patent/CN109065129A/zh
Publication of CN109065129A publication Critical patent/CN109065129A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及一种科室推荐方法、装置、计算机设备和存储介质。所述方法包括:接收终端获取的问诊数据;对所述问诊数据进行分词处理得到分词数据;通过转义词库对所述分词数据进行推导得到不同维度的本体词;将不同维度的所述本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词;根据所述目标关键词得到对应的科室,并将所得到的科室推荐给所述终端。采用本方法能够提高科室推荐的效率。

Description

科室推荐方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种科室推荐方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,用户可以通过手机终端上安装的应用程序进行线上问诊,以实现线上看病,只有遇到线上无法解决的问题时,才会转到线下科室进行处理。然而,由于医院门诊科室名称种类繁多,且与线上问诊科室名称不尽相同,要实现线上线下的转诊,需要大量的翻译过程。
传统地,一般是设置人工审核机制,例如当线上问诊需要转到线下科室时,则由人工进行审核后,分配具体的线下科室,但是这样会耗费大量的人力,使得效率降低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高推荐效率的科室推荐方法、装置、计算机设备和存储介质。
一种科室推荐方法,所述方法包括:
接收终端获取的问诊数据;
对所述问诊数据进行分词处理得到分词数据;
通过转义词库对所述分词数据进行推导得到不同维度的本体词;
将不同维度的所述本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词;
根据所述目标关键词得到对应的科室,并将所得到的科室推荐给所述终端。
在其中一个实施例中,所述将不同维度的所述本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词,包括:
获取当前维度的本体词,并将所述当前维度的本体词与关键词映射管理库中的关键词的对应的属性值进行匹配得到当前关键词;
获取下一维度的本体词,并将所述下一维度的本体词与所述当前关键词的对应的属性值进行匹配得到匹配结果;
根据所述匹配结果更新所述当前关键词,直至所有维度的本体词都匹配完成得到目标关键词。
在其中一个实施例中,所述根据所述目标关键词得到对应的科室,包括:
获取所述目标关键词对应的方向权重;
从所述目标关键词中选取所述方向权重为正值的搜索关键词;
根据所述搜索关键词得到对应的科室。
在其中一个实施例中,所述从所述目标关键词中选取所述方向权重为正值的搜索关键词,包括:
根据所述方向权重对所述目标关键词按照从大到小的顺序进行排序;
选取排序所述方向权重为正值且最大的目标关键词作为搜索关键词。
在其中一个实施例中,所述通过转义词库对所述分词数据进行推导得到不同维度的本体词之前,还包括:
接收所述终端获取的当前场景;
根据所述当前场景加载对应的转义词库。
在其中一个实施例中,所述通过转义词库对所述分词数据进行推导得到不同维度的本体词,包括:
检索所述转义词库中是否存在与当前分词对应的;
当所述转义词库中存在与所述当前分词对应的本体词时,则对所述本体词进行维度处理得到不同维度的本体词,并输出所述不同维度的本体词;
当所述转义词库中不存在与所述当前分词对应的本体词时,检索所述转义词库中是否存在与所述当前分词对应的近义词;
当所述转义词库中存在与所述当前分词对应的近义词时,则通过所述近义词更新所述当前分词,并继续检索所述转义词库中是否存在与当前分词对应的本体词。
一种科室推荐装置,所述装置包括:
第一接收模块,用于接收终端获取的问诊数据;
分词模块,用于对所述问诊数据进行分词处理得到分词数据;
推导模块,用于通过转义词库对所述分词数据进行推导得到不同维度的本体词;
匹配模块,用于将不同维度的所述本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词;
推荐模块,用于根据所述目标关键词得到对应的科室,并将所得到的科室推荐给所述终端。
在其中一个实施例中,所述匹配模块包括:
第一匹配单元,用于获取当前维度的本体词,并将所述当前维度的本体词与关键词映射管理库中的关键词的对应的属性值进行匹配得到当前关键词;
第二匹配单元,用于获取下一维度的本体词,并将所述下一维度的本体词与所述当前关键词的对应的属性值进行匹配得到匹配结果;
结果输出单元,用于根据所述匹配结果更新所述当前关键词,直至所有维度的本体词都匹配完成得到目标关键词。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
上述科室推荐方法、装置、计算机设备和存储介质,服务器在接收到终端获取的问诊数据后,首先对问诊数据进行分词处理得到分词数据,然后通过转义词库对分词数据进行推导得到不同维度的本体词,将本体词与用关键词映射管理库中的属性值进行匹配得到目标关键词,最后根据目标关键词得到对应的科室,从而可以将科室推荐给终端,不需要人工进行审核,提高了推荐效率。
附图说明
图1为一个实施例中科室推荐方法的应用场景图;
图2为一个实施例中科室推荐方法的流程示意图;
图3为一个实施例中前缀树的示意图;
图4为一个实施例中的有向无环图的示意图;
图5为一个实施例中的转义词库的示意图;
图6为一个实施例中的关键词映射管理库的示意图;
图7为一个实施例中科室推荐装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的科室推荐方法,可以应用于如图1所示的应用环境中。其中,终端通过网络与服务器进行通信。用户通过在终端安装的应用程序输入问诊数据,终端获取该问诊数据并上传至服务器,服务器对问诊数据进行分词处理得到分词数据,然后通过转义词库对分词数据进行推导得到不同维度的本体词,将本体词与用关键词映射管理库中的属性值进行匹配得到目标关键词,最后根据目标关键词得到对应的科室,从而可以将科室推荐给终端,不需要人工进行审核,提高了推荐效率。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种科室推荐方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S202:接收终端获取的问诊数据。
具体地,用户可以通过终端中的应用程序输入问诊数据,然后终端获取到用户所输入的问诊数据,终端将用户所输入的问诊数据发送至服务器,即服务器接收终端获取的用户输入的问诊数据。
其中用户输入的问诊数据可以是用户通过终端的虚拟键盘输入的文本,或者是通过终端输入的语音,并且终端将输入的语音转化为相应的文本后发送至服务器,从而服务器接收终端获取的用户输入的问诊数据。
S204:对问诊数据进行分词处理得到分词数据。
具体地,对问诊数据进行分词处理得到分词,即时将所获取的问诊数据,一般是以句子形式的问诊数据进行分词,得到具有独立含义的多个分词。
对所获取的问诊数据进行分词处理得到分词数据,可以包括:加载预设字典,并根据所加载的预设字典生成前缀树;根据前缀树以及问诊数据中的字生成有向无环图,有向无环图用于表示问诊数据中的字所能组成词语的情况;通过动态路径查找有向无环图中的最大概率路径,并获取与最大概率路径对应的分词数据。且可以选地,对于没有出现在有向无环图中的字还可以进行如下处理:从问诊数据中选取未出现在有向无环图中的字;获取预设的隐马尔科夫模型;通过隐马尔科夫模型对所选取的字进行分词处理得到分词数据。
具体地,服务器可以首先加载预先存储的字典,该字典可以是从网上下载的字典,或者是根据各种医疗网站等生成的字典,或者是用户自定义的字典,服务器根据该些字典生成前缀树,具体可以参见图3所示,其中该前缀树的基本性质包括根节点不包含字符,除根节点外的每一个子节点都包含一个字符。从根节点到某一个节点,路径上经过的字符连接起来,为该节点对应的字符串。每个节点的所有子节点包含的字符互不相同。从第一字符开始有连续重复的字符只占用一个节点,比如图3中的to,和ten,中重复的单词t只占用了一个节点。
其次服务器根据前缀树以及问诊数据中的字生成有向无环图,有向无环图用于表示问诊数据中的字所能组成词语的情况,具体地,参见图4所示,图4为一实施例中的有向无环图的示意图,其中有向无环图是根据前缀树的每一个根节点进行生成的,首先获取到与文本中的字复印的前缀树,然后根据该前缀树的根节点生成对应的有向无环图。
第三,服务器通过动态路径查找有向无环图中的最大概率路径,并获取与最大概率路径对应的分词数据,具体地,动态规划是基于有向无环图进行的,首先查找待分词问诊数据中已经切分好的词语,对该词语查找该词语出现的频率(次数/总数,在字典中给出了每个词的频率和词性),如有字典中没有该词语,则将词典中出现频率最小的那个词语的频率作为该词的频率,然后从右往左计算最大概率路径。即通过从右往左的频率相乘得到的概率最大的路径。如图4中,有-意见-分歧的概率最大,则最后得到的分词为“有”、“意见”和“分歧”。
第四,服务器从问诊数据中选取未出现在有向无环图中的字;获取预设的隐马尔科夫模型;通过隐马尔科夫模型对所选取的字进行分词处理得到分词数据。中文词汇按照BEMS四个状态来标记,B是开始begin位置,E是end,是结束位置,M是middle,是中间位置,S是singgle,单独成词的位置,没有前,也没有后,也就是说,采用了状态为(B,E,M,S)这四种状态来标记中文词语,比如北京可以标注为BE,即北/B京/E,表示北是开始位置,京是结束位置,中华民族可以标注为BMME,就是开始、中间、中间、结束,从而服务器根据开始和结束位置即可以获取到没有出现在有向无环图中的字的分词数据。
S206:通过转义词库对分词数据进行推导得到不同维度的本体词。
具体地,具体地,参见图5,转义词库是用于将分词数据转换成多个不同维度的本体词的词库,其中存储了分词数据和不同维度的本体词之间的转义关系,例如分词“肚子疼”其通过转义词库可能转换为{部位:腹部,症状:疼痛}。其中转义词库中本体词的维度可以包括:人群分类(男性、女性、儿童、老人等)、科室诉求、检查诉求、器官、部位、分类系统、症状、处置(例如手术、拔牙等)。其中:人群分类(Population):男性、女性、儿童、老人、孕妇等;科室诉求(Department):用户意向就诊的科室,例如用户要挂口腔科;检查诉求(Examination):问诊过程中已确定用户应该检查的项目或用户指明要检查的项目,例如四维彩超;脏器(Organ):用户疾病和症状所属的人体脏器、器官,例如肠胃、心脏、乳腺等;部位(Body part):用户疾病和症状所属的人体部位,例如胸部、腹部、四肢、头面等;分类系统(Category system):用户疾病和症状所属的医学分类系统,例如女性生殖系统及乳腺、泌尿系统、呼吸系统等;症状(Symptom):用户疾病症状,例如咳痰、嗜睡、痛等;处置(Procedure):建议的治疗方式,例如手术、拔牙等。
且转义词库中存在两类转义关系,包括本体转义关系和近似转义关系,其中本体转义转系是转义词库中可以直接进行转义得到不同维度的本体词的映射关系,近似转义关系是转义词库中将一个分词数据转换为另外一个分词数据的映射关系。具体可以参见5所示的转义词库。
服务器在加载完对应的转义词库后,将分词处理得到的分词数据与转义词库中对应的词语进行匹配,例如将得到的分词数据与转义词库中不同的词语进行匹配,从而可以获取到不同维度的本体词,即服务器将分词数据与转义词库中的不同词语进行匹配,当匹配成功时,则获取到该词语对应的维度,并将该维度与该词语进行输出,例如当匹配到腹部时,则获取腹部的维度为部位,则输出“部位:腹部”,当匹配到疼痛时,则获取到疼痛的维度为症状,则输出“症状:疼痛”。其中匹配的方式可以采用模糊匹配,从而可以提高匹配的成功率。
S208:将不同维度的本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词。
具体地,关键词映射管理库是用于存储关键词和关键词属性值的库,其中每一个关键词均对应有以下属性值:科室、CAT描述、cat分类、部位、脏器、人群、症状、病种、病因、非病、特殊、临床、外因、检查、处置、药物以及方向权重。其中科室=标准科室名称;CAT描述=国际疾病分类标准的描述;CAT分类=国际疾病分类标准代码;部位=人体的部位;脏器=人体器官;人群=人的分类,如男,女,老人,儿童;症状=疾病的症状,如“发热”;病种=疾病的种类,如“病毒感染类”;病因=疾病发生的原因,如“术后并发”;非病=并非疾病的表述,如“惧怕肥胖”;特殊=其他;临床=临床表现;外因=疾病的外部原因,比如“蛇咬”;检查=临床检查,如“X光检查”;处置=临床处置,如“静脉输液”;药物=药品名称;方向权重=数字类型,正数表示关键字有效,负数表示关键字命中的结果要排除。正数越大,排序约靠前。参见图6,图6为一实施例中的关键词映射管理库。其中用户可以通过点击“修改”按钮、“删除”按钮和“复制”按钮等对相应的关键词进行匹配。
该匹配过程主要是本体词与关键词中的属性值进行匹配的过程,即将相同为对的本体词和关键词进行匹配,将维度和属性值都匹配成功的目标关键词输出,或者可选地将维度和属性值的匹配成功率达到预设值的目标关键词输出。
S210:根据目标关键词得到对应的科室,并将所得到的科室推荐给终端。
具体地,在得到目标关键词后,则根据目标关键词得到对应的科室,可选地,关键词可以为科室的名称,从而在得到唯一一个关键词后,即可以得到对应的科室。具体可以根据目标关键词的方向权重进行计算,例如将方向权重最大的目标关键词对应的科室进行输出。在获取到科室后,服务器将该科室发送至终端,从而终端将该科室进行显示,以供用户进行参考。
可选地,当得到科室并推荐给用户后,终端还可以接收用户输入的挂号指令,服务器可以根据用户输入的挂号指令,以及终端当前所处的位置,所推荐给终端的科室,选取距离用户最近的医院的相应科室进行推荐,以便于用户及时挂号。可选地还可以将多个医院的相应科室按照距离进行排序,以便于用户进行选择。
上述科室推荐方法,服务器在接收到终端获取的问诊数据后,首先对问诊数据进行分词处理得到分词数据,然后通过转义词库对分词数据进行推导得到不同维度的本体词,将本体词与用关键词映射管理库中的属性值进行匹配得到目标关键词,最后根据目标关键词得到对应的科室,从而可以将科室推荐给终端,不需要人工进行审核,提高了推荐效率。
在其中一个实施例中,将不同维度的本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词,可以包括:获取当前维度的本体词,并将当前维度的本体词与关键词映射管理库中的关键词的对应的属性值进行匹配得到当前关键词;获取下一维度的本体词,并将下一维度的本体词与当前关键词的对应的属性值进行匹配得到匹配结果;根据匹配结果更新当前关键词,直至所有维度的本体词都匹配完成得到目标关键词。
具体地,在通过本体词得到目标关键词的过程中,服务器首先获取到不同维度的本体词,然后将本体词与关键词映射管理库中维度对应的属性值向匹配,例如将维度为部位的本体词与关键词映射管理库中的维度为部位的属性值进行匹配,从而可以得到当前关键词。
如果此时不存在其他维度的本体词,则当前关键词即为目标关键词。如果还存在其他维度的本体词,则服务器继续获取到下一维度的本体词,将下一维度的本体词与上述得到的关键词的对应的维度的属性相匹配,例如假设下一维度为症状,当前维度得到的当前关键词包含10个,则将维度为症状的本体词,再与该10个当前关键词的维度为症状的属性值进行匹配,并根据匹配结果更新当前关键词,直至不存在其他维度的本体词时,所得到的当前关键词即为目标关键词。
可选地,参见下表,为了提高匹配效率,当存在下表中的属性值的维度的组合方式时,则默认一定能够匹配到目标关键词,因此如果根据下表的属性值的维度组合没有匹配到目标关键词时,则可以进行报错,以便于及时处理。
上述实施例中,通过不同维度的本体词依次与关键词的属性值进行匹配,可以提高匹配效率,保证匹配结果的正确性。
在其中一个实施例中,根据目标关键词得到对应的科室,可以包括:获取目标关键词对应的方向权重;从目标关键词中选取方向权重为正值的搜索关键词;根据搜索关键词得到对应的科室。
在其中一个实施例中,从目标关键词中选取方向权重为正值的搜索关键词,可以包括:根据方向权重对目标关键词按照从大到小的顺序进行排序;选取排序方向权重为正值且最大的目标关键词作为搜索关键词。
具体地,方向权重是关键词属性值中的其中一个,其是在生成关键词的时候,由人工填入的,其中方向权重的数值越大表示对应的上述几个属性值与关键词的相关度越高。其中方向权重可以设置为正值或负值,正值表示正相关,在根据关键词得到科室时,应该包含该关键词;负值表示负相关,在根据关键词得到科室时,应该从得到的结果中删除包含该关键词的选项。
其中对于方向权重的生成还可以是基于机器学习模型进行的,例如将训练样本集,即关键词、关键词对应的属性值以及关键词对应的方向权重输入至原始机器学习模型中进行训练得到训练后的机器学习模型。且可选地,可以通过验证样本集中的关键词对应的属性值输入至训练后的机器学习模型中得到经过机器学习模型后的关键词和方向权重,然后与该验证样本集中的对应的关键词和方向权重进行比较,如果两者相同,或者是两者的误差在允许范围内,则该训练后的机器学习模型可用,否则根据比较后的验证样本集来修正该训练后的机器学习模型,以提高机器学习模型的准确性。
当训练得到机器学习模型后,可以将关键词对应的属性值输入至该机器学习模型,从而可以直接得到该属性值对应的关键词和方向权重,从而在生成关键词的时候,可以根据用户问诊数据得到的本体词,即关键词对应的属性值得到对应的关键词和方向权重。从而在科室匹配的时候可以直接获取到该方向权重。
具体地,服务器在获取到目标关键词后,然后得到目标关键词对应的方向权重,然后获取到方向权重为正值的目标关键词对应的科室作为最终的科室。
例如:用户本体词-儿童贫血,命中关键词属性中的人群-儿童、症状-贫血,推算出两个目标关键词“儿科”和“耳鼻喉”,其中“儿科”的方向权重为5,“耳鼻喉”的方向权重为-1,那么在搜索线下科室时,应匹配关键词包含“儿科”且不包含“耳鼻喉”的科室,即匹配方向权重为正的目标关键词对应的线下科室。
可选地,当存在多个方向权重为正值的目标关键词时,可以按照下面为处理方式进行处理:首先根据方向权重对目标关键词进行排序,例如正值排在负值之前,大的排在小的之前,然后获取到方向权重为正值的关键词对应的科室,将方向权重最大的关键词对应的科室作为最终科室。
例如:如用户会输入问诊数据“我家宝宝咳嗽发烧,鼻子不通”,目标关键词“宝宝”、“咳嗽发烧”、“鼻子不通”,那么“宝宝”+“咳嗽发烧”是儿科,但是“宝宝”+“鼻子不通”则可能会推出“耳鼻喉科”,在此种情况下由于更适合“儿科”,其中,儿科的权重为+5,耳鼻喉科的权重为+3,经过排序后+5>+3,所以排除“耳鼻喉科”。
上述实施例中,通过关键词的属性值与不通维度的本体词向匹配得到目标关键词后,再根据目标关键词的方向权重得到对应的科室,准确率高。
在其中一个实施例中,通过转义词库对分词数据进行推导得到不同维度的本体词之前,还可以包括:接收终端获取的当前场景;根据当前场景加载对应的转义词库。
在其中一个实施例中,通过转义词库对分词数据进行推导得到不同维度的本体词,可以包括:检索转义词库中是否存在与当前分词对应的;当转义词库中存在与当前分词对应的本体词时,则对本体词进行维度处理得到不同维度的本体词,并输出不同维度的本体词;当转义词库中不存在与当前分词对应的本体词时,检索转义词库中是否存在与当前分词对应的近义词;当转义词库中存在与当前分词对应的近义词时,则通过近义词更新当前分词,并继续检索转义词库中是否存在与当前分词对应的本体词。
当前场景是指用户在使用终端进行操作时所处于的客户端的场景,其中该场景是在设计客户端的时候预置的,例如可以包括科室推荐场景、药品推荐场景、医生推荐场景等,终端可以根据用户操作所处于的当前客户端的位置来获取到对应的当前场景,或者是根据标志位的方式获取到对应的当前场景。
在服务器中,不同的场景对应了不同的转义词库,这是由于在不同的场景下,相同的分词可能对应不同的本体词,例如在科室推荐场景下,发烧可能对应内科,但是在药品推荐场景下,发烧可能对应感冒,因此在获取到对应的场景后,首先服务器加载与场景对应的转义词库,以为下一步推导奠定基础。
具体地,获取场景是终端首先根据用户所处的操作位置得到场景,即根据预先的埋点获取用户所处的操作的位置,从而将该操作位置发送至服务器,从而服务器可以获取到对应的当前操作位置,从而判断该操作位置所处于的场景,由于场景是在设计客户端的时候预置的,即在设计客户端的时候首先建立埋点与场景的映射关系,即操作位置与场景的映射关系,当服务器获取到当前操作位置时,则首先根据预置的操作位置与场景的映射关系得到对应的场景,例如科室推荐场景、药品推荐场景还是医生推荐场景等,进而服务器可以根据场景获取到对应的转义词库,这样可以避免不同的场景的转义词库的不同,且同一个词在不同的场景下其可能代表的含义不同所造成的本体词匹配错误的情况的出现,提高了匹配的准确率,且选择其中的一个转义词库进行匹配,从而可以降低匹配的次数,提高匹配的效率。
具体地,转义词库具体可以参见上文图5所示,服务器首先获取当前分词,然后检测转义词库中是否存在与当前分词对应的本体词,即首先检测转义词库中是否存在与当前分词向匹配的本体词,其中匹配方式可以通过模糊匹配进行。且可选地,为了提高匹配效率,可以分线程进行同步匹配,即多个分词均衡分配在不同的线程中进行同步匹配,从而可以提高匹配效率。
当转义词库中存在与当前分词对应的本体词时,则获取到本体词对应的维度,例如上述的人群,系统划分,部位和器官,症状,病因,检查,药品,临床处置,比如:{部位:腹部,症状:疼痛},服务器输出该不同维度的本体词。
近义词是指与当前分词具有近似关系的词汇,当服务器未检索到与当前分词对应的本体词时,则检索转义词库中是否存在与当前分词对应的近义词,其中可以根据分词与近义词的近似关系库进行检索,该近似关系库中存储了分词与近义词的近似关系,即首先检索近似关系库是否存在与当前分词对应的预检索近义词,然后从转义关系库中获取到与预检索近义词对应的近义词。
当转义关系库中存在与当前分词对应的近义词时,则通过该近义词在转义关系库中继续进行检索,即获取到该近义词对应的本体词,从而可以输出该近义词对应的不同维度的本体词,当未检索到近义词时,则服务器向终端返回无检索结果的处理结果。
在实际应用中,服务器首先获取到分词后的词汇,然后进行本体关系检索,当存在本体词时,即存在与分词后的词汇对应的本体词时,则输出该本体词以及该本体词的词性(即对应的维度);当不存在本体时,即不存在与分析后的词汇对应的本体词时,则继续进行近义词检索,即通过近似关系进行检索,当未检索到近义词,则无结果输出,当检索到近义词时,则继续以该近义词为词汇输出,进行本体关系检索,直至存在本体词输出或者是直至不存在其他的近义词。
上述实施例中,首先进行通过转义词库中的本体关系进行检索,当检索失败时,再通过转义词库中的近似关系进行检索,提高了检索结果的准确性。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种科室推荐装置,包括:第一接收模块100、分词模块200、推导模块300、匹配模块400和推荐模块500,其中:
第一接收模块100,用于接收终端获取的问诊数据。
分词模块200,用于对问诊数据进行分词处理得到分词数据。
推导模块300,用于通过转义词库对分词数据进行推导得到不同维度的本体词。
匹配模块400,用于将不同维度的本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词。
推荐模块500,用于根据目标关键词得到对应的科室,并将所得到的科室推荐给终端。
在其中一个实施例中,匹配模块400可以包括:
第一匹配单元,用于获取当前维度的本体词,并将当前维度的本体词与关键词映射管理库中的关键词的对应的属性值进行匹配得到当前关键词。
第二匹配单元,用于获取下一维度的本体词,并将下一维度的本体词与当前关键词的对应的属性值进行匹配得到匹配结果。
结果输出单元,用于根据匹配结果更新当前关键词,直至所有维度的本体词都匹配完成得到目标关键词。
在其中一个实施例中,推荐模块500可以包括:
方向权重获取单元,用于获取目标关键词对应的方向权重。
搜索关键词选取单元,用于从目标关键词中选取方向权重为正值的搜索关键词。
科室获取单元,用于根据搜索关键词得到对应的科室。
在其中一个实施例中,搜索关键词获取单元可以包括:
排序单元,用于根据方向权重对目标关键词按照从大到小的顺序进行排序。
选择单元,用于选取排序方向权重为正值且最大的目标关键词作为搜索关键词。
在其中一个实施例中,科室推荐装置还可以包括:
第二接收模块,用于接收终端获取的当前场景。
加载模块,用于根据当前场景加载对应的转义词库。
在其中一个实施例中,推导模块300可以包括:
检索单元,用于检索转义词库中是否存在与当前分词对应的。
第一推导单元,用于当转义词库中存在与当前分词对应的本体词时,则对本体词进行维度处理得到不同维度的本体词,并输出不同维度的本体词。
第二推导单元,用于当转义词库中不存在与当前分词对应的本体词时,检索转义词库中是否存在与当前分词对应的近义词。
第三推导单元,用于当转义词库中存在与当前分词对应的近义词时,则通过近义词更新当前分词,并继续检索转义词库中是否存在与当前分词对应的本体词。
关于科室推荐装置的具体限定可以参见上文中对于科室推荐方法的限定,在此不再赘述。上述科室推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储转义词库数据、关键词映射管理库数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种科室推荐方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:接收终端获取的问诊数据;对问诊数据进行分词处理得到分词数据;通过转义词库对分词数据进行推导得到不同维度的本体词;将不同维度的本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词;根据目标关键词得到对应的科室,并将所得到的科室推荐给终端。
在一个实施例中,处理器执行计算机程序时所实现的将不同维度的本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词,可以包括:获取当前维度的本体词,并将当前维度的本体词与关键词映射管理库中的关键词的对应的属性值进行匹配得到当前关键词;获取下一维度的本体词,并将下一维度的本体词与当前关键词的对应的属性值进行匹配得到匹配结果;根据匹配结果更新当前关键词,直至所有维度的本体词都匹配完成得到目标关键词。
在一个实施例中,处理器执行计算机程序时所实现的根据目标关键词得到对应的科室,可以包括:获取目标关键词对应的方向权重;从目标关键词中选取方向权重为正值的搜索关键词;根据搜索关键词得到对应的科室。
在一个实施例中,处理器执行计算机程序时所实现的从目标关键词中选取方向权重为正值的搜索关键词,可以包括:根据方向权重对目标关键词按照从大到小的顺序进行排序;选取排序方向权重为正值且最大的目标关键词作为搜索关键词。
在一个实施例中,处理器执行计算机程序时所实现的通过转义词库对分词数据进行推导得到不同维度的本体词之前,还可以包括:接收终端获取的当前场景;根据当前场景加载对应的转义词库。
在一个实施例中,处理器执行计算机程序时所实现的通过转义词库对分词数据进行推导得到不同维度的本体词,可以包括:检索转义词库中是否存在与当前分词对应的;当转义词库中存在与当前分词对应的本体词时,则对本体词进行维度处理得到不同维度的本体词,并输出不同维度的本体词;当转义词库中不存在与当前分词对应的本体词时,检索转义词库中是否存在与当前分词对应的近义词;当转义词库中存在与当前分词对应的近义词时,则通过近义词更新当前分词,并继续检索转义词库中是否存在与当前分词对应的本体词。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:接收终端获取的问诊数据;对问诊数据进行分词处理得到分词数据;通过转义词库对分词数据进行推导得到不同维度的本体词;将不同维度的本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词;根据目标关键词得到对应的科室,并将所得到的科室推荐给终端。
在一个实施例中,处理器执行计算机程序时所实现的将不同维度的本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词,可以包括:获取当前维度的本体词,并将当前维度的本体词与关键词映射管理库中的关键词的对应的属性值进行匹配得到当前关键词;获取下一维度的本体词,并将下一维度的本体词与当前关键词的对应的属性值进行匹配得到匹配结果;根据匹配结果更新当前关键词,直至所有维度的本体词都匹配完成得到目标关键词。
在一个实施例中,计算机程序被处理器执行时所实现的根据目标关键词得到对应的科室,可以包括:获取目标关键词对应的方向权重;从目标关键词中选取方向权重为正值的搜索关键词;根据搜索关键词得到对应的科室。
在一个实施例中,计算机程序被处理器执行时所实现的从目标关键词中选取方向权重为正值的搜索关键词,可以包括:根据方向权重对目标关键词按照从大到小的顺序进行排序;选取排序方向权重为正值且最大的目标关键词作为搜索关键词。
在一个实施例中,计算机程序被处理器执行时所实现的通过转义词库对分词数据进行推导得到不同维度的本体词之前,还可以包括:接收终端获取的当前场景;根据当前场景加载对应的转义词库。
在一个实施例中,计算机程序被处理器执行时所实现的通过转义词库对分词数据进行推导得到不同维度的本体词,可以包括:检索转义词库中是否存在与当前分词对应的;当转义词库中存在与当前分词对应的本体词时,则对本体词进行维度处理得到不同维度的本体词,并输出不同维度的本体词;当转义词库中不存在与当前分词对应的本体词时,检索转义词库中是否存在与当前分词对应的近义词;当转义词库中存在与当前分词对应的近义词时,则通过近义词更新当前分词,并继续检索转义词库中是否存在与当前分词对应的本体词。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种科室推荐方法,所述方法包括:
接收终端获取的问诊数据;
对所述问诊数据进行分词处理得到分词数据;
通过转义词库对所述分词数据进行推导得到不同维度的本体词;
将不同维度的所述本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词;
根据所述目标关键词得到对应的科室,并将所得到的科室推荐给所述终端。
2.根据权利要求1所述的方法,其特征在于,所述将不同维度的所述本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词,包括:
获取当前维度的本体词,并将所述当前维度的本体词与关键词映射管理库中的关键词的对应的属性值进行匹配得到当前关键词;
获取下一维度的本体词,并将所述下一维度的本体词与所述当前关键词的对应的属性值进行匹配得到匹配结果;
根据所述匹配结果更新所述当前关键词,直至所有维度的本体词都匹配完成得到目标关键词。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标关键词得到对应的科室,包括:
获取所述目标关键词对应的方向权重;
从所述目标关键词中选取所述方向权重为正值的搜索关键词;
根据所述搜索关键词得到对应的科室。
4.根据权利要求3所述的方法,其特征在于,所述从所述目标关键词中选取所述方向权重为正值的搜索关键词,包括:
根据所述方向权重对所述目标关键词按照从大到小的顺序进行排序;
选取排序所述方向权重为正值且最大的目标关键词作为搜索关键词。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述通过转义词库对所述分词数据进行推导得到不同维度的本体词之前,还包括:
接收所述终端获取的当前场景;
根据所述当前场景加载对应的转义词库。
6.根据权利要求5所述的方法,其特征在于,所述通过转义词库对所述分词数据进行推导得到不同维度的本体词,包括:
检索所述转义词库中是否存在与当前分词对应的;
当所述转义词库中存在与所述当前分词对应的本体词时,则对所述本体词进行维度处理得到不同维度的本体词,并输出所述不同维度的本体词;
当所述转义词库中不存在与所述当前分词对应的本体词时,检索所述转义词库中是否存在与所述当前分词对应的近义词;
当所述转义词库中存在与所述当前分词对应的近义词时,则通过所述近义词更新所述当前分词,并继续检索所述转义词库中是否存在与当前分词对应的本体词。
7.一种科室推荐装置,其特征在于,所述装置包括:
第一接收模块,用于接收终端获取的问诊数据;
分词模块,用于对所述问诊数据进行分词处理得到分词数据;
推导模块,用于通过转义词库对所述分词数据进行推导得到不同维度的本体词;
匹配模块,用于将不同维度的所述本体词与关键词映射管理库中的关键词的属性值进行匹配得到目标关键词;
推荐模块,用于根据所述目标关键词得到对应的科室,并将所得到的科室推荐给所述终端。
8.根据权利要求7所述的装置,其特征在于,所述匹配模块包括:
第一匹配单元,用于获取当前维度的本体词,并将所述当前维度的本体词与关键词映射管理库中的关键词的对应的属性值进行匹配得到当前关键词;
第二匹配单元,用于获取下一维度的本体词,并将所述下一维度的本体词与所述当前关键词的对应的属性值进行匹配得到匹配结果;
结果输出单元,用于根据所述匹配结果更新所述当前关键词,直至所有维度的本体词都匹配完成得到目标关键词。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN201810724890.9A 2018-07-04 2018-07-04 科室推荐方法、装置、计算机设备和存储介质 Withdrawn CN109065129A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810724890.9A CN109065129A (zh) 2018-07-04 2018-07-04 科室推荐方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810724890.9A CN109065129A (zh) 2018-07-04 2018-07-04 科室推荐方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN109065129A true CN109065129A (zh) 2018-12-21

Family

ID=64818692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810724890.9A Withdrawn CN109065129A (zh) 2018-07-04 2018-07-04 科室推荐方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN109065129A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069631A (zh) * 2019-04-08 2019-07-30 腾讯科技(深圳)有限公司 一种文本处理方法、装置以及相关设备
CN110210018A (zh) * 2019-05-14 2019-09-06 北京百度网讯科技有限公司 挂号科室的匹配方法和装置
CN110838359A (zh) * 2019-10-16 2020-02-25 平安科技(深圳)有限公司 基于对话机器人的分诊方法、装置、存储介质及机器人
CN111931026A (zh) * 2020-08-10 2020-11-13 湖南快乐阳光互动娱乐传媒有限公司 一种基于词性扩展的搜索优化方法及系统
CN113077318A (zh) * 2021-04-19 2021-07-06 北京京东拓先科技有限公司 一种业务处理方法和装置
CN113191146A (zh) * 2021-05-26 2021-07-30 平安国际智慧城市科技股份有限公司 诉求数据的分配方法、装置、计算机设备和存储介质
CN114783627A (zh) * 2022-04-12 2022-07-22 平辅寅健康科技(上海)有限公司 基于ai的健康医疗服务推荐系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069631A (zh) * 2019-04-08 2019-07-30 腾讯科技(深圳)有限公司 一种文本处理方法、装置以及相关设备
CN110069631B (zh) * 2019-04-08 2022-11-29 腾讯科技(深圳)有限公司 一种文本处理方法、装置以及相关设备
CN110210018A (zh) * 2019-05-14 2019-09-06 北京百度网讯科技有限公司 挂号科室的匹配方法和装置
CN110210018B (zh) * 2019-05-14 2023-07-11 北京百度网讯科技有限公司 挂号科室的匹配方法和装置
CN110838359A (zh) * 2019-10-16 2020-02-25 平安科技(深圳)有限公司 基于对话机器人的分诊方法、装置、存储介质及机器人
WO2021073110A1 (zh) * 2019-10-16 2021-04-22 平安科技(深圳)有限公司 基于对话机器人的分诊方法、装置、存储介质及机器人
CN111931026A (zh) * 2020-08-10 2020-11-13 湖南快乐阳光互动娱乐传媒有限公司 一种基于词性扩展的搜索优化方法及系统
CN113077318A (zh) * 2021-04-19 2021-07-06 北京京东拓先科技有限公司 一种业务处理方法和装置
CN113077318B (zh) * 2021-04-19 2024-09-20 北京京东拓先科技有限公司 一种业务处理方法和装置
CN113191146A (zh) * 2021-05-26 2021-07-30 平安国际智慧城市科技股份有限公司 诉求数据的分配方法、装置、计算机设备和存储介质
CN114783627A (zh) * 2022-04-12 2022-07-22 平辅寅健康科技(上海)有限公司 基于ai的健康医疗服务推荐系统

Similar Documents

Publication Publication Date Title
CN109065129A (zh) 科室推荐方法、装置、计算机设备和存储介质
LeClair et al. A neural model for generating natural language summaries of program subroutines
CN108874773A (zh) 关键词新增方法、装置、计算机设备和存储介质
Islam et al. A comprehensive survey on applications of transformers for deep learning tasks
CN111274373B (zh) 一种基于知识图谱的电子病历问答方法及系统
CN108986910B (zh) 线上问答方法、装置、计算机设备和存储介质
CN109871538A (zh) 一种中文电子病历命名实体识别方法
CN110069631A (zh) 一种文本处理方法、装置以及相关设备
CN110675944A (zh) 分诊方法及装置、计算机设备及介质
CN109215754A (zh) 病历数据处理方法、装置、计算机设备和存储介质
CN109933785A (zh) 用于实体关联的方法、装置、设备和介质
CN109255013A (zh) 理赔决策方法、装置、计算机设备和存储介质
CN111984771A (zh) 一种基于智能对话的自动问诊系统
WO2018188981A1 (en) Drawing conclusions from free form texts with deep reinforcement learning
CN109215796A (zh) 搜索方法、装置、计算机设备和存储介质
CN113343694A (zh) 一种医疗命名实体识别方法及系统
CN112037904A (zh) 在线诊疗数据处理方法、装置、计算机设备和存储介质
CN117854715B (zh) 基于问诊分析的智能助诊系统
CN113657109A (zh) 基于模型的临床术语的标准化方法、装置和计算机设备
CN116092699A (zh) 一种基于预训练模型的癌症问答交互方法
CN114664431A (zh) 一种人工智能辅助问答方法、装置、设备及介质
CN117253629A (zh) 导医信息推送方法、装置、设备、介质和计算机程序产品
CN116994689A (zh) 医疗数据的特征化处理方法、装置、设备、介质及产品
CN111125100A (zh) 数据存储方法、装置、存储介质及电子设备
CN110287270A (zh) 实体关系挖掘方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20181221