CN112527973A - 一种搜索疾病信息的方法和系统 - Google Patents

一种搜索疾病信息的方法和系统 Download PDF

Info

Publication number
CN112527973A
CN112527973A CN202011567626.2A CN202011567626A CN112527973A CN 112527973 A CN112527973 A CN 112527973A CN 202011567626 A CN202011567626 A CN 202011567626A CN 112527973 A CN112527973 A CN 112527973A
Authority
CN
China
Prior art keywords
data
information
disease
search
article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011567626.2A
Other languages
English (en)
Inventor
李井娜
胡鑫平
刘作来
石李虹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Borui Tongyun Technology Co ltd
Original Assignee
Beijing Borui Tongyun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Borui Tongyun Technology Co ltd filed Critical Beijing Borui Tongyun Technology Co ltd
Priority to CN202011567626.2A priority Critical patent/CN112527973A/zh
Publication of CN112527973A publication Critical patent/CN112527973A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/381Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using identifiers, e.g. barcodes, RFIDs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例涉及一种搜索疾病信息的方法和系统,所述方法包括:获取第一搜索模式数据和第一输入数据;当第一搜索模式数据为文字模式时,将第一输入数据,做为第一关键词数据;当第一搜索模式数据为语音模式时,对第一输入数据进行语音识别处理,并将识别结果做为第一关键词数据;根据第一关键词数据,对预设的疾病信息库,进行疾病信息搜索处理,生成第一搜索数据集合。本发明实施例,基于可持续更新的疾病信息库,为用户提供了丰富的专项知识,并同时提供文字搜索和语音搜索两种处理方式,提高了用户的使用体验度。

Description

一种搜索疾病信息的方法和系统
技术领域
本发明涉及数据处理技术领域,特别涉及一种搜索疾病信息的方法和系统。
背景技术
在生活节奏与工作节奏都比较紧张的现代社会中,基于对自身健康的担忧,越来越多的人开始关注与疾病、健康有关的知识。但是,互联网上的信息过于庞大,搜索的内容也比较发散,需要人们自行梳理、整理、归档、学习,这无疑降低了人们获取知识与信息的效率。
发明内容
本发明的目的,就是针对现有技术的缺陷,提供一种搜索疾病信息的方法和系统,基于可持续更新的疾病信息库,为用户提供了丰富的专项知识,并同时提供文字搜索和语音搜索两种处理方式,提高了用户的使用体验度。
为实现上述目的,本发明实施例第一方面提供了一种搜索疾病信息的方法,所述方法包括:
获取第一搜索指令数据;所述第一搜索指令数据包括第一搜索模式数据和第一输入数据;
根据所述第一搜索模式数据,对所述第一输入数据,进行关键词提取处理;当所述第一搜索模式数据为文字模式时,将所述第一输入数据,做为第一关键词数据;当所述第一搜索模式数据为语音模式时,对所述第一输入数据,进行语音识别处理,并将识别结果做为所述第一关键词数据;
根据所述第一关键词数据,对预设的疾病信息库,进行疾病信息搜索处理,生成第一搜索数据集合;所述第一搜索数据集合包括第一疾病介绍数据、第一医院数据、第一文章数据和第二文章数据。
优选的,
所述疾病信息库包括一级索引信息表和多个二级信息库;所述一级索引信息表包括多个一级索引信息记录;所述一级索引信息记录包括第一关键词信息、第一标识数据、第二标识数据、第三标识数据和第四标识数据;所述二级信息库至少包括二级疾病介绍信息库、二级医院介绍信息库、二级分析文章信息库和二级治疗文章信息库。
优选的,所述对所述第一输入数据,进行语音识别处理,并将识别结果做为所述第一关键词数据,具体包括:
对所述第一输入数据,进行第一音频滤波和降噪处理,生成所述第一音频数据;
将所述第一音频数据,输入第一人工智能语音识别模型中进行识别处理,并将识别结果做为所述第一关键词数据。
优选的,所述根据所述第一关键词数据,对预设的疾病信息库,进行疾病信息搜索处理,生成第一搜索数据集合,具体包括:
根据所述第一关键词数据,搜索所述一级索引信息表,将所述第一关键词信息与所述第一关键词数据匹配的所述一级索引信息记录,做为第一记录;从所述第一记录中,提取出所述第一标识数据、所述第二标识数据、所述第三标识数据和所述第四标识数据;
根据所述第一标识数据,对所述二级疾病介绍信息库,进行疾病介绍信息搜索处理,生成所述第一疾病介绍数据;
根据所述第二标识数据,对所述二级医院介绍信息库,进行医院介绍信息搜索处理,生成所述第一医院数据;
根据所述第三标识数据,对所述二级分析文章信息库,进行分析文章信息搜索处理,生成所述第一文章数据;
根据所述第四标识数据,对所述二级治疗文章信息库,进行治疗文章信息搜索处理,生成所述第二文章数据;
由所述第一疾病介绍数据、所述第一医院数据、所述第一文章数据和所述第二文章数据,组成所述第一搜索数据集合。
进一步的,所述根据所述第一标识数据,对所述二级疾病介绍信息库,进行疾病介绍信息搜索处理,生成所述第一疾病介绍数据,具体包括:
从所述二级疾病介绍信息库中,提取记录索引位置为所述第一标识数据的二级疾病介绍信息记录,做为第二记录;并从所述第二记录中提取第一疾病介绍信息,做为所述第一疾病介绍数据;所述二级疾病介绍信息库包括多个所述二级疾病介绍信息记录;所述二级疾病介绍信息记录至少包括所述第一疾病介绍信息。
进一步的,所述根据所述第二标识数据,对所述二级医院介绍信息库,进行医院介绍信息搜索处理,生成所述第一医院数据,具体包括:
从所述二级医院介绍信息库中,提取记录索引位置为所述第二标识数据的二级医院介绍信息记录,做为第三记录;并从所述第三记录中提取第一医院介绍信息,做为所述第一医院数据;所述二级医院介绍信息库包括多个所述二级医院介绍信息记录;所述二级医院介绍信息记录至少包括所述第一医院介绍信息。
进一步的,所述根据所述第三标识数据,对所述二级分析文章信息库,进行分析文章信息搜索处理,生成所述第一文章数据,具体包括:
从所述二级分析文章信息库中,提取记录索引位置为所述第三标识数据的二级分析文章信息记录,做为第四记录;并从所述第四记录中提取第一分析文章信息,做为所述第一文章数据;所述二级分析文章信息库包括多个所述二级分析文章信息记录;所述二级分析文章信息记录至少包括所述第一分析文章信息。
进一步的,所述根据所述第四标识数据,对所述二级治疗文章信息库,进行治疗文章信息搜索处理,生成所述第二文章数据,具体包括:
从所述二级治疗文章信息库中,提取记录索引位置为所述第四标识数据的二级治疗文章信息记录,做为第五记录;并从所述第五记录中提取第一治疗文章信息,做为所述第二文章数据;所述二级治疗文章信息库包括多个所述二级治疗文章信息记录;所述二级治疗文章信息记录至少包括所述第一治疗文章信息。
本发明实施例第二方面提供了一种搜索疾病信息的系统,所述系统包括:
数据获取模块用于获取第一搜索指令数据;所述第一搜索指令数据包括第一搜索模式数据和第一输入数据;
关键词处理模块用于根据所述第一搜索模式数据,对所述第一输入数据,进行关键词提取处理;当所述第一搜索模式数据为文字模式时,将所述第一输入数据,做为第一关键词数据;当所述第一搜索模式数据为语音模式时,对所述第一输入数据,进行语音识别处理,并将识别结果做为所述第一关键词数据;
搜索处理模块用于根据所述第一关键词数据,对预设的疾病信息库,进行疾病信息搜索处理,生成第一搜索数据集合;所述第一搜索数据集合包括第一疾病介绍数据、第一医院数据、第一文章数据和第二文章数据。
本发明实施例提供一种搜索疾病信息的方法和系统,基于可持续更新的疾病信息库,为用户提供了丰富的专项知识,并同时提供文字搜索和语音搜索两种处理方式,提高了用户的使用体验度。
附图说明
图1为本发明实施例一提供的一种搜索疾病信息的方法示意图;
图2为本发明实施例二提供的一种搜索疾病信息的系统结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例一提供一种搜索疾病信息的方法,如图1为本发明实施例一提供的一种搜索疾病信息的方法示意图所示,本方法主要包括如下步骤:
步骤1,获取第一搜索指令数据;
其中,第一搜索指令数据包括第一搜索模式数据和第一输入数据。
这里,疾病信息搜索系统的数据获取模块获取到用户输入处理模块处发送的第一搜索指令数据;疾病信息搜索系统是自带疾病信息库的用于获取用户输入信息、并根据输入信息进行疾病信息搜索的系统;疾病信息搜索系统至少包括用户输入处理模块、数据获取模块、关键词处理模块和搜索处理模块;第一搜索模式数据包括两种模式:文字模式和语音模式;在用户通过输入文字启动搜索时,由用户输入处理模块对用户的信息录入模式进行识别,生成的第一搜索模式数据具体为文字模式,并将用户输入的文字作为第一输入数据;在用户通过录入语音启动搜索时,由用户输入处理模块对用户的信息录入模式进行识别,生成的第一搜索模式数据具体为语音模式,并将用户录入的语音作为第一输入数据。
步骤2,根据第一搜索模式数据,对第一输入数据,进行关键词提取处理;
这里,疾病信息搜索系统的关键词处理模块用于按第一搜索模式数据,对第一输入数据进行对应的关键词提取处理;
具体包括:步骤21,当第一搜索模式数据为文字模式时,将第一输入数据,做为第一关键词数据;
这里,若第一搜索模式数据为文字模式,关键词处理模块将第一输入数据直接作为搜索关键词;
步骤22,当第一搜索模式数据为语音模式时,对第一输入数据,进行语音识别处理,并将识别结果做为第一关键词数据;
具体包括:对第一输入数据,进行第一音频滤波和降噪处理,生成第一音频数据;将第一音频数据,输入第一人工智能语音识别模型中进行识别处理,并将识别结果做为第一关键词数据。
这里,若第一搜索模式数据为语音模式,说明第一输入数据为语音数据,就需要关键词处理模块对语音数据进行语音文字转换;在对语音数据进行,转换之前,先将语音数据中的环境噪声、混响、回声等噪声消除,得到第一音频数据;再使用第一人工智能语音识别模型对第一音频数据进行识别;这里的第一人工智能语音识别模型包括第一声学模型和第一语言模型;第一声学模型用于从第一语句音频数据中,按时间先后顺序提取出基础发音的发音序列,第一语言模型用于对发音序列进行顺序组合得到多个字词,并对所有字词按定向语义顺序,进行语义分析,得到最大概率的一句文字数据;第一声学模型常用的有1)由隐马尔科夫模型((Hidden Markov Model,HMM)+高斯混合模型(Gaussian Mixture Model,GMM)组成的声学模型,2)由HMM+深度神经网络(Deep Neural Network,DNN)组成的声学模型;第一语言模型常用的有:1)N-Gram语言模型,2)汉语语言模型(Chinese LanguageModel,CLM);通过第一声学模型和第一语言模型对第一音频数据进行转换之后,会得到与第一音频数据内容最大匹配度的文字信息;关键词处理模块会将该文字信息作为第一关键词数据。
例如,第一音频数据的语音内容为“口腔溃疡”,则第一声学模型对第一音频数据进行基础发音提取后,得到的汉语拼音发音序列为(k,o,q,on,k,ui,y,on);第一语言模型对汉语拼音发音序列进行顺序组合可以得到多个字词[口,(腔,枪),(口腔,抠枪),(葵,溃),(羊,阳,疡),(溃疡,葵阳)];第一语言模型再对所有字词按时间先后顺序也就是从前到后的顺序进行语义分析也就是常说的词性与语法分析,得到几个不同概率的文字语句,例如“抠枪葵阳”的概率为6%、“口腔葵阳”的概率为8%、“抠枪溃疡”的概率7为%,“口腔溃疡”的概率为67%;第一语言模型从其中提取概率最高的文字语句,也就是“口腔溃疡”作为最终的识别结果也就是第一关键词数据。
步骤3,根据第一关键词数据,对预设的疾病信息库,进行疾病信息搜索处理,生成第一搜索数据集合;
其中,疾病信息库包括一级索引信息表和多个二级信息库;一级索引信息表包括多个一级索引信息记录;一级索引信息记录包括第一关键词信息、第一标识数据、第二标识数据、第三标识数据和第四标识数据;二级信息库至少包括二级疾病介绍信息库、二级医院介绍信息库、二级分析文章信息库和二级治疗文章信息库;第一搜索数据集合包括第一疾病介绍数据、第一医院数据、第一文章数据和第二文章数据;
这里,疾病信息搜索系统的搜索处理模块用于按第一关键词数据,从疾病信息库中搜索与关键词相关的疾病信息;在提供基本疾病信息的同时,搜索处理模块还向用户提供与之关联的医院信息、疾病分析的文章信息、以及治疗该疾病的文章信息;
具体包括:步骤31,根据第一关键词数据,搜索一级索引信息表,将第一关键词信息与第一关键词数据匹配的一级索引信息记录,做为第一记录;从第一记录中,提取出第一标识数据、第二标识数据、第三标识数据和第四标识数据;
这里,本发明实施例的疾病信息库中用于存储信息的都是二级信息库:二级疾病介绍信息库用于存储与疾病相关的介绍信息、二级医院介绍信息库用于存储与疾病相关的推荐医院的信息、二级分析文章信息库用于存储收集到的用于分析疾病的文章信息、二级治疗文章信息库用于存储收集到的用于描述与疾病治疗相关的文章信息;疾病信息库中反映关键词与信息库关联关系就是一级索引信息表;一级索引信息表中存储了多个一级索引信息记录,每个一级索引信息记录的数据格式包括一个关键词信息和四个标识数据,这里的关键词信息用于匹配用户输入的关键词,四个标识数据分别为四个信息库中与当前关键词有关的记录索引;搜索处理模块在执行搜索时,首先对一级索引信息表进行搜索,搜索依据是第一关键词数据,搜索方法是定位所含关键词信息与第一关键词数据匹配的记录,并从该记录中提取出四个标识数据,做为后续搜索的依据;
步骤32,根据第一标识数据,对二级疾病介绍信息库,进行疾病介绍信息搜索处理,生成第一疾病介绍数据;
其中,二级疾病介绍信息库包括多个二级疾病介绍信息记录;二级疾病介绍信息记录至少包括第一疾病介绍信息;
具体包括:从二级疾病介绍信息库中,提取记录索引位置为第一标识数据的二级疾病介绍信息记录,做为第二记录;并从第二记录中提取第一疾病介绍信息,做为第一疾病介绍数据;
这里,二级疾病介绍信息库中存储了大量与疾病相关的信息,每条二级疾病介绍信息记录对应一个具体的疾病,每条二级疾病介绍信息记录中至少应存储一个用描述对应疾病的第一疾病介绍信息;使用第一标识数据可以直接定位到对应的记录上,再从该记录中将第一疾病介绍信息提取出来,就可以做为搜索结果之一的第一疾病介绍数据;
步骤33,根据第二标识数据,对二级医院介绍信息库,进行医院介绍信息搜索处理,生成第一医院数据;
其中,二级医院介绍信息库包括多个二级医院介绍信息记录;二级医院介绍信息记录至少包括第一医院介绍信息;
具体包括:从二级医院介绍信息库中,提取记录索引位置为第二标识数据的二级医院介绍信息记录,做为第三记录;并从第三记录中提取第一医院介绍信息,做为第一医院数据;
这里,二级医院介绍信息库中存储了大量与疾病相关的推荐医院信息,每条二级医院介绍信息记录对应一个具体的医院,每条二级医院介绍信息记录中至少应存储一个用描述对应医院的第一医院介绍信息;使用第二标识数据可以直接定位到对应的记录上,再从该记录中将第一医院介绍信息提取出来,就可以做为搜索结果之二的第一医院数据;
步骤34,根据第三标识数据,对二级分析文章信息库,进行分析文章信息搜索处理,生成第一文章数据;
其中,二级分析文章信息库包括多个二级分析文章信息记录;二级分析文章信息记录至少包括第一分析文章信息;
具体包括:从二级分析文章信息库中,提取记录索引位置为第三标识数据的二级分析文章信息记录,做为第四记录;并从第四记录中提取第一分析文章信息,做为第一文章数据;
这里,二级分析文章信息库中存储了大量与疾病相关的分析文章信息,每条二级分析文章信息记录对应一个具体的疾病,每条二级分析文章信息记录中至少应存储一个用描述对应疾病的第一分析文章信息;使用第三标识数据可以直接定位到对应的记录上,再从该记录中将第一分析文章信息提取出来,就可以做为搜索结果之三的第一文章数据;
步骤35,根据第四标识数据,对二级治疗文章信息库,进行治疗文章信息搜索处理,生成第二文章数据;
其中,二级治疗文章信息库包括多个二级治疗文章信息记录;二级治疗文章信息记录至少包括第一治疗文章信息;
具体包括:从二级治疗文章信息库中,提取记录索引位置为第四标识数据的二级治疗文章信息记录,做为第五记录;并从第五记录中提取第一治疗文章信息,做为第二文章数据;
这里,二级治疗文章信息库中存储了大量与治疗疾病相关的文章信息,每条二级治疗文章信息记录对应一个具体的疾病,每条二级治疗文章信息记录中至少应存储一个用描述治疗对应疾病的第一治疗文章信息;使用第四标识数据可以直接定位到对应的记录上,再从该记录中将第一治疗文章信息提取出来,就可以做为搜索结果之四的第二文章数据;
步骤36,由第一疾病介绍数据、第一医院数据、第一文章数据和第二文章数据,组成第一搜索数据集合。
这里,将由步骤32-35得到的四个搜索结果,也就是第一疾病介绍数据、第一医院数据、第一文章数据和第二文章数据,组成第一搜索数据集合;得到第一搜索数据集合之后,疾病信息搜索系统的搜索处理模块会调用系统的显示装置对用户进行结果显示。
本发明实施例二提供一种搜索疾病信息的系统,该系统用于实现与上述实施例中的疾病信息搜索系统的系统功能,具体如图2为本发明实施例二提供的一种搜索疾病信息的系统结构示意图所示,该系统20包括:数据获取模块201、关键词处理模块202和搜索处理模块203。
数据获取模块201用于获取第一搜索指令数据;第一搜索指令数据包括第一搜索模式数据和第一输入数据。
关键词处理模块202用于根据第一搜索模式数据,对第一输入数据,进行关键词提取处理;当第一搜索模式数据为文字模式时,将第一输入数据,做为第一关键词数据;当第一搜索模式数据为语音模式时,对第一输入数据,进行语音识别处理,并将识别结果做为第一关键词数据。
搜索处理模块203用于根据第一关键词数据,对预设的疾病信息库,进行疾病信息搜索处理,生成第一搜索数据集合;第一搜索数据集合包括第一疾病介绍数据、第一医院数据、第一文章数据和第二文章数据。
这里,本发明实施例二提供的一种搜索疾病信息的系统,其模块功能与实施例一中疾病信息搜索系统对应模块的功能一致,在此不做进一步赘述。
本发明实施例提供一种搜索疾病信息的方法和系统,基于可持续更新的疾病信息库,为用户提供了丰富的专项知识,并同时提供文字搜索和语音搜索两种处理方式,提高了用户的使用体验度。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种搜索疾病信息的方法,其特征在于,所述方法包括:
获取第一搜索指令数据;所述第一搜索指令数据包括第一搜索模式数据和第一输入数据;
根据所述第一搜索模式数据,对所述第一输入数据,进行关键词提取处理;当所述第一搜索模式数据为文字模式时,将所述第一输入数据,做为第一关键词数据;当所述第一搜索模式数据为语音模式时,对所述第一输入数据,进行语音识别处理,并将识别结果做为所述第一关键词数据;
根据所述第一关键词数据,对预设的疾病信息库,进行疾病信息搜索处理,生成第一搜索数据集合;所述第一搜索数据集合包括第一疾病介绍数据、第一医院数据、第一文章数据和第二文章数据。
2.根据权利要求1所述的搜索疾病信息的方法,其特征在于,
所述疾病信息库包括一级索引信息表和多个二级信息库;所述一级索引信息表包括多个一级索引信息记录;所述一级索引信息记录包括第一关键词信息、第一标识数据、第二标识数据、第三标识数据和第四标识数据;所述二级信息库至少包括二级疾病介绍信息库、二级医院介绍信息库、二级分析文章信息库和二级治疗文章信息库。
3.根据权利要求1所述的搜索疾病信息的方法,其特征在于,所述对所述第一输入数据,进行语音识别处理,并将识别结果做为所述第一关键词数据,具体包括:
对所述第一输入数据,进行第一音频滤波和降噪处理,生成所述第一音频数据;
将所述第一音频数据,输入第一人工智能语音识别模型中进行识别处理,并将识别结果做为所述第一关键词数据。
4.根据权利要求2所述的搜索疾病信息的方法,其特征在于,所述根据所述第一关键词数据,对预设的疾病信息库,进行疾病信息搜索处理,生成第一搜索数据集合,具体包括:
根据所述第一关键词数据,搜索所述一级索引信息表,将所述第一关键词信息与所述第一关键词数据匹配的所述一级索引信息记录,做为第一记录;从所述第一记录中,提取出所述第一标识数据、所述第二标识数据、所述第三标识数据和所述第四标识数据;
根据所述第一标识数据,对所述二级疾病介绍信息库,进行疾病介绍信息搜索处理,生成所述第一疾病介绍数据;
根据所述第二标识数据,对所述二级医院介绍信息库,进行医院介绍信息搜索处理,生成所述第一医院数据;
根据所述第三标识数据,对所述二级分析文章信息库,进行分析文章信息搜索处理,生成所述第一文章数据;
根据所述第四标识数据,对所述二级治疗文章信息库,进行治疗文章信息搜索处理,生成所述第二文章数据;
由所述第一疾病介绍数据、所述第一医院数据、所述第一文章数据和所述第二文章数据,组成所述第一搜索数据集合。
5.根据权利要求4所述的搜索疾病信息的方法,其特征在于,所述根据所述第一标识数据,对所述二级疾病介绍信息库,进行疾病介绍信息搜索处理,生成所述第一疾病介绍数据,具体包括:
从所述二级疾病介绍信息库中,提取记录索引位置为所述第一标识数据的二级疾病介绍信息记录,做为第二记录;并从所述第二记录中提取第一疾病介绍信息,做为所述第一疾病介绍数据;所述二级疾病介绍信息库包括多个所述二级疾病介绍信息记录;所述二级疾病介绍信息记录至少包括所述第一疾病介绍信息。
6.根据权利要求4所述的搜索疾病信息的方法,其特征在于,所述根据所述第二标识数据,对所述二级医院介绍信息库,进行医院介绍信息搜索处理,生成所述第一医院数据,具体包括:
从所述二级医院介绍信息库中,提取记录索引位置为所述第二标识数据的二级医院介绍信息记录,做为第三记录;并从所述第三记录中提取第一医院介绍信息,做为所述第一医院数据;所述二级医院介绍信息库包括多个所述二级医院介绍信息记录;所述二级医院介绍信息记录至少包括所述第一医院介绍信息。
7.根据权利要求4所述的搜索疾病信息的方法,其特征在于,所述根据所述第三标识数据,对所述二级分析文章信息库,进行分析文章信息搜索处理,生成所述第一文章数据,具体包括:
从所述二级分析文章信息库中,提取记录索引位置为所述第三标识数据的二级分析文章信息记录,做为第四记录;并从所述第四记录中提取第一分析文章信息,做为所述第一文章数据;所述二级分析文章信息库包括多个所述二级分析文章信息记录;所述二级分析文章信息记录至少包括所述第一分析文章信息。
8.根据权利要求4所述的搜索疾病信息的方法,其特征在于,所述根据所述第四标识数据,对所述二级治疗文章信息库,进行治疗文章信息搜索处理,生成所述第二文章数据,具体包括:
从所述二级治疗文章信息库中,提取记录索引位置为所述第四标识数据的二级治疗文章信息记录,做为第五记录;并从所述第五记录中提取第一治疗文章信息,做为所述第二文章数据;所述二级治疗文章信息库包括多个所述二级治疗文章信息记录;所述二级治疗文章信息记录至少包括所述第一治疗文章信息。
9.一种搜索疾病信息的系统,其特征在于,所述系统包括:
数据获取模块用于获取第一搜索指令数据;所述第一搜索指令数据包括第一搜索模式数据和第一输入数据;
关键词处理模块用于根据所述第一搜索模式数据,对所述第一输入数据,进行关键词提取处理;当所述第一搜索模式数据为文字模式时,将所述第一输入数据,做为第一关键词数据;当所述第一搜索模式数据为语音模式时,对所述第一输入数据,进行语音识别处理,并将识别结果做为所述第一关键词数据;
搜索处理模块用于根据所述第一关键词数据,对预设的疾病信息库,进行疾病信息搜索处理,生成第一搜索数据集合;所述第一搜索数据集合包括第一疾病介绍数据、第一医院数据、第一文章数据和第二文章数据。
CN202011567626.2A 2020-12-25 2020-12-25 一种搜索疾病信息的方法和系统 Pending CN112527973A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011567626.2A CN112527973A (zh) 2020-12-25 2020-12-25 一种搜索疾病信息的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011567626.2A CN112527973A (zh) 2020-12-25 2020-12-25 一种搜索疾病信息的方法和系统

Publications (1)

Publication Number Publication Date
CN112527973A true CN112527973A (zh) 2021-03-19

Family

ID=74976596

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011567626.2A Pending CN112527973A (zh) 2020-12-25 2020-12-25 一种搜索疾病信息的方法和系统

Country Status (1)

Country Link
CN (1) CN112527973A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114512241A (zh) * 2021-12-27 2022-05-17 中国人民解放军总医院第一医学中心 一种基于频次分析的食管静脉瘤信息智能搜寻方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101404035A (zh) * 2008-11-21 2009-04-08 北京得意音通技术有限责任公司 一种基于文本或语音的信息搜索方法
CN105760399A (zh) * 2014-12-19 2016-07-13 华为软件技术有限公司 一种数据检索方法及设备
US20180137250A1 (en) * 2016-11-15 2018-05-17 Hefei University Of Technology Mobile health intelligent medical guide system and method thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101404035A (zh) * 2008-11-21 2009-04-08 北京得意音通技术有限责任公司 一种基于文本或语音的信息搜索方法
CN105760399A (zh) * 2014-12-19 2016-07-13 华为软件技术有限公司 一种数据检索方法及设备
US20180137250A1 (en) * 2016-11-15 2018-05-17 Hefei University Of Technology Mobile health intelligent medical guide system and method thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王星星等: "基于元数据的语义识别搜索方法的研究与实现", 《测绘科学》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114512241A (zh) * 2021-12-27 2022-05-17 中国人民解放军总医院第一医学中心 一种基于频次分析的食管静脉瘤信息智能搜寻方法及系统
CN114512241B (zh) * 2021-12-27 2024-05-03 中国人民解放军总医院第一医学中心 一种基于频次分析的食管静脉瘤信息智能搜寻方法及系统

Similar Documents

Publication Publication Date Title
CN110096567B (zh) 基于qa知识库推理的多轮对话回复选择方法、系统
CN107945805B (zh) 一种智能化跨语言语音识别转化方法
CN109493850B (zh) 成长型对话装置
CN110717018A (zh) 一种基于知识图谱的工业设备故障维修问答系统
US7650283B2 (en) Dialogue supporting apparatus
CN111597308A (zh) 一种基于知识图谱的语音问答系统及其应用方法
EP1617409B1 (en) Multimodal method to provide input to a computing device
CN112182252B (zh) 基于药品知识图谱的智能用药问答方法及其设备
CN106601259A (zh) 一种基于声纹搜索的信息推荐方法及装置
CN114116994A (zh) 一种迎宾机器人对话方法
KR20060070605A (ko) 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법
JP5723711B2 (ja) 音声認識装置および音声認識プログラム
CN112527973A (zh) 一种搜索疾病信息的方法和系统
CN112735412B (zh) 一种根据语音指令搜索信息的方法和系统
Ullah et al. Speech emotion recognition using deep neural networks
CN114168885A (zh) 一种基于语音识别和nl2sql模型的智能类案检索的方法
CN112562856B (zh) 一种通过语音搜索健康知识的方法和系统
CN112767923B (zh) 一种语音识别方法及装置
CN112820274B (zh) 一种语音信息识别校正方法和系统
CN112735475B (zh) 一种通过语音搜索疾病知识的方法和系统
CN115019777B (zh) 一种在线学习语音识别应答装置及方法
Cerisara Automatic discovery of topics and acoustic morphemes from speech
Lendvai et al. Multi-feature error detection in spoken dialogue systems
Alibagon et al. On the Use of Multilingual Approach for a Cloud-based Transcription System for the’Ilonggoish’Dialect
CN117935783A (zh) 一种随访语音识别自校验方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210319

RJ01 Rejection of invention patent application after publication