CN106776888A - 智能结构化搜索系统及其搜索方法 - Google Patents

智能结构化搜索系统及其搜索方法 Download PDF

Info

Publication number
CN106776888A
CN106776888A CN201611077952.9A CN201611077952A CN106776888A CN 106776888 A CN106776888 A CN 106776888A CN 201611077952 A CN201611077952 A CN 201611077952A CN 106776888 A CN106776888 A CN 106776888A
Authority
CN
China
Prior art keywords
data
module
structured
search system
logical expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611077952.9A
Other languages
English (en)
Inventor
贺长征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Terui Semitool Medical Technology Co Ltd
Original Assignee
Beijing Terui Semitool Medical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Terui Semitool Medical Technology Co Ltd filed Critical Beijing Terui Semitool Medical Technology Co Ltd
Priority to CN201611077952.9A priority Critical patent/CN106776888A/zh
Publication of CN106776888A publication Critical patent/CN106776888A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2428Query predicate definition using graphical user interfaces, including menus and forms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种智能结构化搜索系统,包括采集模块,用于采集客户端输入的自然语言查询数据;处理模块,用于对自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的自然语言查询数据拆分为单独的关键词词汇,并对每个关键词词汇进行同义词转换;分析模块,用于分析识别处理模块处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;数据存储模块,用于存储结构化数据及关系数据;查询模块,将逻辑表达式或结构化逻辑树与数据存储模块中的数据进行对比,并将查询结果输出。本发明还公开了一种智能结构化搜索系统的搜索方法。本发明用户可随意输入搜索条件,操作简单,能够准确的实现搜索需求。

Description

智能结构化搜索系统及其搜索方法
技术领域
本发明涉及医疗信息领域,更具体地,涉及一种智能结构化搜索系统及其搜索方法。
背景技术
随着信息技术的发展和医疗信息化的建设,现在医院及各种医疗机构早已实施了各类信息化系统软件,如“HIS(医院信息管理系统)”、“EMR(电子病历系统)”、“PACS(医学影像存档及传输系统)”、“RIS(影像信息管理系统)”等。随着信息化系统遍布各个医疗领域,多年以来,生成并积攒了大量数据,其中既有基本的患者人口学信息,也有非常有价值的医学诊断等大量信息,如何对这些数据进行快速有效的搜索成为日益困难的问题。
现有的信息系统软件,对于搜索条件的录入主要有如下三种方式:
1直接列出所有的搜索项供用户选择(如图1所示),该种方法虽然操作简单,但是搜索条件严格受限于软件的设计,即使有的软件可以在后期填加查询项目,也不可能把所有可能性全部排布到软件界面中。
2采用树型结构显示更多的查询项目(如图2所示),此方法虽然可以不受屏幕空间的限制,显示更多的查询项目,但也无法穷举出所有的查询可能;而且操作复杂,界面繁琐,用户不易找到自己想要的查询项目。
3类似百度等搜索引擎,查询关键字,虽然此种方法比较灵活,可以任意录入内容,但是只能进行关键字匹配查询,无法精确定位,使用极其受限。例如无法实现类似于“所有年龄大于50岁的患者”的搜索。
因此以上无论何种方法,都无法简单并且准确的实现搜索需求。随着医疗信息系统的普及以及深入应用,更多未知类型的数据正在产生,因此如何帮助医生及其他用户方便准确的搜索到感兴趣数据也日益迫切。
发明内容
有鉴于此,本发明的主要目的在于提供一种智能结构化搜索系统及其搜索方法,能够解决现有技术中存在的搜索不准确、操作复杂以及搜索界面繁琐的问题。
为达到上述目的,本发明的技术方案是这样实现的:
一方面,本发明提供了一种智能结构化搜索系统,包括采集模块、处理模块、分析模块、数据存储模块和查询模块,其中,采集模块,与处理模块相连,用于采集客户端输入的自然语言查询数据;处理模块,分别与采集模块和分析模块相连,用于对自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的自然语言查询数据拆分为单独的关键词词汇,并对每个关键词词汇进行同义词转换,根据同义词字典进行同义词归一;分析模块,与处理模块相连,用于分析识别处理模块处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;数据存储模块,与查询模块相连,用于存储结构化数据以及关系数据;查询模块,分别与分析模块和数据存储模块相连,将逻辑表达式或结构化逻辑树与数据存储模块中的数据进行对比,并将查询结果输出。
优选地,当分析模块生成的是逻辑表达式时,查询模块将逻辑表达式与关系数据进行对比,并将符合该逻辑表达式的相关数据输出。
优选地,当分析模块生成的是结构化逻辑树时,查询模块将结构化逻辑树与结构化数据进行匹配,并将符合该结构化逻辑树的相关数据输出。
优选地,分析模块还包括结构化语言查询生成单元,用于将逻辑表达式生成结构化语言查询表达式,此时,查询模块将结构化语言查询表达式与关系数据进行对比,并将符合该结构化语言查询表达式的相关数据输出。
优选地,该系统还包括存储模块,与查询模块相连,用于在查询模块输出查询结果之后自动保存客户端输入的自然语言查询数据。
另一方面,本发明还提供了一种智能结构化搜索系统的搜索方法,包括:采集模块采集客户端输入的自然语言查询数据;处理模块对自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的自然语言查询数据拆分为单独的关键词词汇,并对每个关键词词汇进行同义词转换,根据同义词字典进行同义词归一;分析模块分析识别处理模块处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;查询模块将逻辑表达式或结构化逻辑树与数据存储模块中的数据进行对比,并将查询结果输出;其中,数据存储模块存储的数据为结构化数据以及关系数据。
优选地,当分析模块生成的是逻辑表达式时,查询模块将逻辑表达式与关系数据进行对比,并将符合该逻辑表达式的相关数据输出。
优选地,当分析模块生成的是结构化逻辑树时,查询模块将结构化逻辑树与结构化数据进行匹配,并将符合该结构化逻辑树的相关数据输出。
优选地,该方法还包括:结构化语言查询生成单元将逻辑表达式生成结构化语言查询表达式,此时,查询模块将结构化语言查询表达式与关系数据进行对比,并将符合该结构化语言查询表达式的相关数据输出。
优选地,在查询模块输出查询结果之后,存储模块自动保存客户端输入的自然语言查询数据。
本发明的技术效果:
1.由于本发明中设置了处理模块和分析模块,用户可以随意输入搜索条件,例如,用户可以直接以“年龄大于50岁”、“有吸烟史”、“左肺有肿瘤”等作为搜索条件,可以将用户输入的自然语言查询数据进行处理并生成逻辑表达式或结构化逻辑树,不受软件设计或现有的数据种类的限制,兼容未来新产生的数据,使用户操作简单,易于使用,提高了搜索效率;
2.本发明不受搜索条件限制,解决了现有技术中存在的搜索受限于软件本身的设计,无法穷举所有的搜索可能的问题,能够简单准确的实现搜索需求,提高了搜索的准确度;
3.由于本发明设置了存储模块,在查询模块输出查询结果之后自动保存客户端输入的自然语言查询数据,自动保存历史搜索条件,随着搜索次数的增多,本发明可以根据用户的录入习惯自动提示相关的搜索条件,方便了用户的录入,使之更加人性化。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了现有技术中直接列出所有的搜索项用户界面示意图;
图2示出了现有技术中树型结构显示的用户界面示意图;
图3示出了根据本发明实施例一的智能结构化搜索系统结构示意图;
图4示出了根据本发明实施例一的智能结构化搜索系统的文本结构树示意图;
图5示出了根据本发明实施例一的智能结构化搜索系统的文本结构树示意图;
图6示出了根据本发明实施例一的智能结构化搜索系统中分析模块生成逻辑表达式的示意图;
图7示出了根据本发明实施例一的智能结构化搜索系统中分析模块生成结构化逻辑树的示意图;
图8示出了根据本发明实施例二的智能结构化搜索系统结构示意图;
图9示出了根据本发明实施例三的智能结构化搜索系统结构示意图;
图10示出了根据本发明实施例四的智能结构化搜索系统的搜索方法流程图;
图11示出了根据本发明实施例四的智能结构化搜索系统的搜索方法中文本结构树示意图;
图12示出了根据本发明实施例四的智能结构化搜索系统的搜索方法中文本结构树示意图;
图13示出了根据本发明实施例四的智能结构化搜索系统的搜索方法中逻辑表达式生成的示意图;
图14示出了根据本发明实施例四的智能结构化搜索系统的搜索方法中结构化逻辑树生成的示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
实施例一
图3示出了根据本发明实施例一的智能结构化搜索系统结构示意图;如图1所示,该系统包括:采集模块10、处理模块20、分析模块30、数据存储模块40和查询模块50,其中,
采集模块10,与处理模块20相连,用于采集客户端输入的自然语言查询数据;
处理模块20,分别与采集模块10和分析模块30相连,用于对自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的自然语言查询数据拆分为单独的关键词词汇,并对每个关键词词汇进行同义词转换,根据同义词字典进行同义词归一;
分析模块30,与处理模块20相连,用于分析识别处理模块20处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;
数据存储模块40,与查询模块50相连,用于存储结构化数据以及关系数据;
结构化数据是系统对非结构化数据进行处理得到的,具体的,系统对每条非结构化数据进行分词处理,将非结构化数据拆分为单独的关键词词汇,对关键词词汇进行同义词转换,根据同义词字典进行同义词归一,识别关键词词汇的范围值,并根据语法上下文建立一个对应于该非结构化数据的文本结构树。
查询模块50,分别与分析模块30和数据存储模40块相连,将逻辑表达式或结构化逻辑树与数据存储模块中的数据进行对比,并将查询结果输出。
这里所提及的非结构化数据为医生录入或是患者口述,如患者主诉、病史、影像学报告等等;
图4示出了根据本发明实施例一的智能结构化搜索系统的文本结构树示意图;如图4所示;
下面以一个例子来具体说明文本结构树的生成:
图5示出了根据本发明实施例一的智能结构化搜索系统的文本结构树示意图;如图5所示;
例如医生书写了如下描述:
“食管下段管壁明显不均匀增厚,并见软组织肿块影形成,最厚层面约2.8厘米”
系统将其进行结构化重构后生成如图5所示的文本结构树。
其中,当分析模块30生成的是逻辑表达式时,查询模块50将逻辑表达式与关系数据进行对比,并将符合该逻辑表达式的相关数据输出。
其中,当分析模块30生成的是结构化逻辑树时,查询模块50将结构化逻辑树与结构化数据进行匹配,并将符合该结构化逻辑树的相关数据输出。
下面以一个例子来具体说明本实施例:
例如用户要查找符合条件“年龄大于50岁并且有吸烟史且影像检查为核磁共振”的记录:
图6示出了根据本发明实施例一的智能结构化搜索系统中分析模块生成逻辑表达式的示意图;如图6所示;经过处理模块和分析模块的处理,生成了年龄﹥50Y and吸烟史=true and影像检查=MR逻辑表达式,查询模块将上述生成的逻辑表达式(年龄﹥50Y and吸烟史=trueand影像检查=MR)与关系数据进行对比,并将符合年龄﹥50Y and吸烟史=trueand影像检查=MR的逻辑表达式的相关搜索数据输出至客户端。
再如,用户要查找符合条件“食管下部分管壁明显增厚,并且可见软组织肿块影形成”的记录:
图7示出了根据本发明实施例一的智能结构化搜索系统中分析模块生成结构化逻辑树的示意图;如图7所示;经过处理模块和分析模块的处理,生成了如图7所示的结构化逻辑树,查询模块将上述生成的结构化逻辑树与数据存储模块中的每个文本结构树进行匹配,将符合条件的相关搜索数据输出至客户端。
本发明的实施例中设置了处理模块和分析模块,用户可以随意输入搜索条件,例如,用户可以直接以“年龄大于50岁”、“有吸烟史”、“左肺有肿瘤”等作为搜索条件,可以将用户输入的自然语言查询数据进行处理并生成逻辑表达式或结构化逻辑树,不受软件设计或现有的数据种类的限制,兼容未来新产生的数据,使用户操作简单,易于使用,提高了搜索效率;同时,本发明不受搜索条件限制,解决了现有技术中存在的搜索受限于软件本身的设计,无法穷举所有的搜索可能的问题,能够简单准确的实现搜索需求,提高了搜索的准确度。
实施例二
图8示出了根据本发明实施例二的智能结构化搜索系统结构示意图;如图8所示,分析模块30还包括结构化语言查询(SQL)生成单元302,用于将逻辑表达式生成结构化语言查询(SQL)表达式,此时,查询模块50将结构化语言查询(SQL)表达式与关系数据进行对比,并将符合该结构化语言查询表达式的相关数据输出。
例如将实施例一中的对应于“年龄大于50岁并且有吸烟史且影像检查为核磁共振”的逻辑表达式生成结构化语言查询表达式为:age﹥50Y and smoke=true andmodality=MR,查询模块将上述生成的结构化语言查询表达式age﹥50Y and smoke=trueand modality=MR与关系数据进行对比,并将符合age﹥50Y and smoke=true andmodality=MR的结构化语言查询表达式的相关搜索数据输出至客户端。
实施例三
图9示出了根据本发明实施例三的智能结构化搜索系统结构示意图;如图9所示,该系统还包括:存储模块60,与所述查询模块50相连,用于在查询模块50输出查询结果之后自动保存客户端输入的自然语言查询数据。
本发明的实施例设置了存储模块,在查询模块输出查询结果之后自动保存客户端输入的自然语言查询数据,自动保存历史搜索条件,随着搜索次数的增多,本发明可以根据用户的录入习惯自动提示相关的搜索条件,方便了用户的录入,使之更加人性化。
实施例四
图10示出了根据本发明实施例四的智能结构化搜索系统的搜索方法流程图,如图10所示,该方法包括以下步骤:
步骤S401,采集模块采集客户端输入的自然语言查询数据;
步骤S402,处理模块对自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的自然语言查询数据拆分为单独的关键词词汇,并对每个关键词词汇进行同义词转换,根据同义词字典进行同义词归一;
步骤S403,分析模块分析识别处理模块处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;
步骤S404,查询模块将逻辑表达式或结构化逻辑树与数据存储模块中的数据进行对比,并将查询结果输出。
其中,数据存储模块存储的数据为结构化数据以及关系数据。
结构化数据是系统对非结构化数据进行处理得到的,具体的,系统对每条非结构化数据进行分词处理,将非结构化数据拆分为单独的关键词词汇,对关键词词汇进行同义词转换,根据同义词字典进行同义词归一,识别关键词词汇的范围值,并根据语法上下文建立一个对应于该非结构化数据的文本结构树。
这里所提及的非结构化数据为医生录入或是患者口述,如患者主诉、病史、影像学报告等等;
图11示出了根据本发明实施例四的智能结构化搜索系统的搜索方法中文本结构树示意图;如图11所示;
下面以一个例子来具体说明文本结构树的生成:
图12示出了根据本发明实施例四的智能结构化搜索系统的搜索方法中文本结构树示意图;如图12所示;
例如医生书写了如下描述:
“食管下段管壁明显不均匀增厚,并见软组织肿块影形成,最厚层面约2.8厘米”
该方法将其进行结构化重构后生成如图12所示的文本结构树。
其中,当分析模块生成的是逻辑表达式时,查询模块将逻辑表达式与关系数据进行对比,并将符合该逻辑表达式的相关数据输出。
其中,当分析模块生成的是结构化逻辑树时,查询模块将结构化逻辑树与结构化数据进行匹配,并将符合该结构化逻辑树的相关数据输出。
下面以一个例子来具体说明本实施例:
例如用户要查找符合条件“年龄大于50岁并且有吸烟史且影像检查为核磁共振”的记录:
图13示出了根据本发明实施例四的智能结构化搜索系统的搜索方法中逻辑表达式生成的示意图;如图13所示;经过处理模块和分析模块的处理,生成了年龄﹥50Y and吸烟史=trueand影像检查=MR逻辑表达式,查询模块将上述生成的逻辑表达式(年龄﹥50Y and吸烟史=true and影像检查=MR)与关系数据进行对比,并将符合年龄﹥50Y and吸烟史=true and影像检查=MR的逻辑表达式的相关搜索数据输出至客户端。
再如,用户要查找符合条件“食管下部分管壁明显增厚,并且可见软组织肿块影形成”的记录:
图14示出了根据本发明实施例四的智能结构化搜索系统的搜索方法中结构化逻辑树生成的示意图;如图14所示;经过处理模块和分析模块的处理,生成了如图14所示的结构化逻辑树,查询模块将上述生成的结构化逻辑树与数据存储模块中的每个文本结构树进行匹配,将符合条件的相关搜索数据输出至客户端。
其中,该方法还包括:结构化语言查询(SQL)生成单元将逻辑表达式生成结构化语言查询(SQL)表达式,此时,查询模块将结构化语言查询(SQL)表达式与关系数据进行对比,并将符合该结构化语言查询表达式的相关数据输出。
例如将上述例子中的对应于“年龄大于50岁并且有吸烟史且影像检查为核磁共振”的逻辑表达式生成结构化语言查询表达式为:age﹥50Y and smoke=true andmodality=MR,查询模块将上述生成的结构化语言查询表达式age﹥50Y and smoke=trueand modality=MR与关系数据进行对比,并将符合age﹥50Y and smoke=true andmodality=MR的结构化语言查询表达式的相关搜索数据输出至客户端。
其中,在查询模块输出查询结果之后存储模块自动保存客户端输入的自然语言查询数据。
本发明的实施例中用户可以随意输入搜索条件,例如,用户可以直接以“年龄大于50岁”、“有吸烟史”、“左肺有肿瘤”等作为搜索条件,可以将用户输入的自然语言查询数据进行处理并生成逻辑表达式或结构化逻辑树,不受软件设计或现有的数据种类的限制,兼容未来新产生的数据,使用户操作简单,易于使用,提高了搜索效率;同时,本发明不受搜索条件限制,解决了现有技术中存在的搜索受限于软件本身的设计,无法穷举所有的搜索可能的问题,能够简单准确的实现搜索需求,提高了搜索的准确度;由于在查询结果输出之后自动保存客户端输入的自然语言查询数据,自动保存历史搜索条件,随着搜索次数的增多,本实施例可以根据用户的录入习惯自动提示相关的搜索条件,方便了用户的录入,使之更加人性化。
从以上描述中,可以看出,本发明的上述实施例实现了如下技术效果:本发明的实施例用户可以随意输入搜索条件,例如,用户可以直接以“年龄大于50岁”、“有吸烟史”、“左肺有肿瘤”等作为搜索条件,可以将用户输入的自然语言查询数据进行处理并生成逻辑表达式或结构化逻辑树,不受软件设计或现有的数据种类的限制,兼容未来新产生的数据,使用户操作简单,易于使用,提高了搜索效率;同时,本发明不受搜索条件限制,解决了现有技术中存在的搜索受限于软件本身的设计,无法穷举所有的搜索可能的问题,能够简单准确的实现搜索需求,提高了搜索的准确度;由于在查询结果输出之后自动保存客户端输入的自然语言查询数据,自动保存历史搜索条件,随着搜索次数的增多,本实施例可以根据用户的录入习惯自动提示相关的搜索条件,方便了用户的录入,使之更加人性化。
显然,本本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种智能结构化搜索系统,其特征在于,包括采集模块、处理模块、分析模块、数据存储模块和查询模块,其中,
所述采集模块,与所述处理模块相连,用于采集客户端输入的自然语言查询数据;
所述处理模块,分别与所述采集模块和所述分析模块相连,用于对所述自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的所述自然语言查询数据拆分为单独的关键词词汇,并对每个所述关键词词汇进行同义词转换,根据同义词字典进行同义词归一;
所述分析模块,与所述处理模块相连,用于分析识别所述处理模块处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;
所述数据存储模块,与所述查询模块相连,用于存储结构化数据以及关系数据;
所述查询模块,分别与所述分析模块和所述数据存储模块相连,将所述逻辑表达式或所述结构化逻辑树与所述数据存储模块中的数据进行对比,并将查询结果输出。
2.根据权利要求1所述的智能结构化搜索系统,其特征在于,当所述分析模块生成的是逻辑表达式时,所述查询模块将所述逻辑表达式与所述关系数据进行对比,并将符合该逻辑表达式的相关数据输出。
3.根据权利要求1所述的智能结构化搜索系统,其特征在于,当所述分析模块生成的是结构化逻辑树时,所述查询模块将所述结构化逻辑树与所述结构化数据进行匹配,并将符合该结构化逻辑树的相关数据输出。
4.根据权利要求1所述的智能结构化搜索系统,其特征在于,所述分析模块还包括结构化语言查询生成单元,用于将所述逻辑表达式生成结构化语言查询表达式,此时,所述查询模块将所述结构化语言查询表达式与所述关系数据进行对比,并将符合该结构化语言查询表达式的相关数据输出。
5.根据权利要求1所述的智能结构化搜索系统,其特征在于,该系统还包括存储模块,与所述查询模块相连,用于在所述查询模块输出查询结果之后自动保存客户端输入的所述自然语言查询数据。
6.一种智能结构化搜索系统的搜索方法,其特征在于,包括:
采集模块采集客户端输入的自然语言查询数据;
处理模块对所述自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的所述自然语言查询数据拆分为单独的关键词词汇,并对每个所述关键词词汇进行同义词转换,根据同义词字典进行同义词归一;
分析模块分析识别所述处理模块处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;
查询模块将所述逻辑表达式或所述结构化逻辑树与数据存储模块中的数据进行对比,并将查询结果输出;
其中,所述数据存储模块存储的数据为结构化数据以及关系数据。
7.根据权利要求6所述的智能结构化搜索系统的搜索方法,其特征在于,当所述分析模块生成的是逻辑表达式时,所述查询模块将所述逻辑表达式与所述关系数据进行对比,并将符合该逻辑表达式的相关数据输出。
8.根据权利要求6所述的智能结构化搜索系统的搜索方法,其特征在于,当所述分析模块生成的是结构化逻辑树时,所述查询模块将所述结构化逻辑树与所述结构化数据进行匹配,并将符合该结构化逻辑树的相关数据输出。
9.根据权利要求6所述的智能结构化搜索系统的搜索方法,其特征在于,该方法还包括:结构化语言查询生成单元将所述逻辑表达式生成结构化语言查询表达式,此时,所述查询模块将所述结构化语言查询表达式与所述关系数据进行对比,并将符合该结构化语言查询表达式的相关数据输出。
10.根据权利要求6所述的智能结构化搜索系统的搜索方法,其特征在于,在所述查询模块输出查询结果之后,存储模块自动保存客户端输入的所述自然语言查询数据。
CN201611077952.9A 2016-11-30 2016-11-30 智能结构化搜索系统及其搜索方法 Pending CN106776888A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611077952.9A CN106776888A (zh) 2016-11-30 2016-11-30 智能结构化搜索系统及其搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611077952.9A CN106776888A (zh) 2016-11-30 2016-11-30 智能结构化搜索系统及其搜索方法

Publications (1)

Publication Number Publication Date
CN106776888A true CN106776888A (zh) 2017-05-31

Family

ID=58898017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611077952.9A Pending CN106776888A (zh) 2016-11-30 2016-11-30 智能结构化搜索系统及其搜索方法

Country Status (1)

Country Link
CN (1) CN106776888A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107992630A (zh) * 2017-12-26 2018-05-04 医渡云(北京)技术有限公司 医疗数据检索方法及装置、存储介质、电子设备
CN108648017A (zh) * 2018-05-14 2018-10-12 广东因特利信息科技股份有限公司 易于扩展的用户需求匹配方法、装置、设备及存储介质
CN109034938A (zh) * 2018-06-11 2018-12-18 广东因特利信息科技股份有限公司 信息快速筛选匹配方法、装置、电子设备及存储介质
CN109684376A (zh) * 2018-12-11 2019-04-26 孙炜 启发式精准知识数据搜索引擎及数据自学习自诊断方法
CN109686443A (zh) * 2018-12-26 2019-04-26 孙炜 一种临床诊断辅助决策系统和医学知识图谱积累方式
CN110413963A (zh) * 2019-07-03 2019-11-05 东华大学 基于领域本体的乳腺超声检查报告结构化方法
CN110532260A (zh) * 2019-07-23 2019-12-03 北京三快在线科技有限公司 逻辑表达式的存储及读取方法、装置、电子设备及介质
CN111309853A (zh) * 2019-09-03 2020-06-19 东南大学 一种基于结构化信息的代码搜索方法
CN113486048A (zh) * 2021-07-13 2021-10-08 广西电力职业技术学院 一种数据检索系统和数据检索方法
CN114238467A (zh) * 2021-12-01 2022-03-25 中冶赛迪重庆信息技术有限公司 一种结构化数据分析方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104252533A (zh) * 2014-09-12 2014-12-31 百度在线网络技术(北京)有限公司 搜索方法和搜索装置
CN104657439A (zh) * 2015-01-30 2015-05-27 欧阳江 用于自然语言精准检索的结构化查询语句生成系统及方法
CN104657440A (zh) * 2015-01-30 2015-05-27 欧阳江 结构化查询语句生成系统及方法
CN104679784A (zh) * 2013-12-03 2015-06-03 上海博科资讯股份有限公司 一种o2b智能搜索方法及系统
US20160140123A1 (en) * 2014-11-13 2016-05-19 Adobe Systems Incorporated Generating a query statement based on unstructured input
WO2016127740A1 (zh) * 2015-02-13 2016-08-18 广州神马移动信息科技有限公司 信息查询方法和设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679784A (zh) * 2013-12-03 2015-06-03 上海博科资讯股份有限公司 一种o2b智能搜索方法及系统
CN104252533A (zh) * 2014-09-12 2014-12-31 百度在线网络技术(北京)有限公司 搜索方法和搜索装置
US20160140123A1 (en) * 2014-11-13 2016-05-19 Adobe Systems Incorporated Generating a query statement based on unstructured input
CN104657439A (zh) * 2015-01-30 2015-05-27 欧阳江 用于自然语言精准检索的结构化查询语句生成系统及方法
CN104657440A (zh) * 2015-01-30 2015-05-27 欧阳江 结构化查询语句生成系统及方法
WO2016127740A1 (zh) * 2015-02-13 2016-08-18 广州神马移动信息科技有限公司 信息查询方法和设备

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107992630A (zh) * 2017-12-26 2018-05-04 医渡云(北京)技术有限公司 医疗数据检索方法及装置、存储介质、电子设备
CN108648017B (zh) * 2018-05-14 2022-04-08 广东因特利信息科技股份有限公司 易于扩展的用户需求匹配方法、装置、设备及存储介质
CN108648017A (zh) * 2018-05-14 2018-10-12 广东因特利信息科技股份有限公司 易于扩展的用户需求匹配方法、装置、设备及存储介质
CN109034938A (zh) * 2018-06-11 2018-12-18 广东因特利信息科技股份有限公司 信息快速筛选匹配方法、装置、电子设备及存储介质
CN109034938B (zh) * 2018-06-11 2022-07-05 广东因特利信息科技股份有限公司 信息快速筛选匹配方法、装置、电子设备及存储介质
CN109684376A (zh) * 2018-12-11 2019-04-26 孙炜 启发式精准知识数据搜索引擎及数据自学习自诊断方法
CN109686443A (zh) * 2018-12-26 2019-04-26 孙炜 一种临床诊断辅助决策系统和医学知识图谱积累方式
CN109686443B (zh) * 2018-12-26 2021-05-25 孙炜 一种临床诊断辅助决策系统和医学知识图谱积累方式
CN110413963A (zh) * 2019-07-03 2019-11-05 东华大学 基于领域本体的乳腺超声检查报告结构化方法
CN110532260A (zh) * 2019-07-23 2019-12-03 北京三快在线科技有限公司 逻辑表达式的存储及读取方法、装置、电子设备及介质
CN110532260B (zh) * 2019-07-23 2021-05-25 北京三快在线科技有限公司 逻辑表达式的存储及读取方法、装置、电子设备及介质
CN111309853A (zh) * 2019-09-03 2020-06-19 东南大学 一种基于结构化信息的代码搜索方法
CN111309853B (zh) * 2019-09-03 2024-03-22 东南大学 一种基于结构化信息的代码搜索方法
CN113486048A (zh) * 2021-07-13 2021-10-08 广西电力职业技术学院 一种数据检索系统和数据检索方法
CN114238467A (zh) * 2021-12-01 2022-03-25 中冶赛迪重庆信息技术有限公司 一种结构化数据分析方法及系统

Similar Documents

Publication Publication Date Title
CN106776888A (zh) 智能结构化搜索系统及其搜索方法
US20220382752A1 (en) Mapping Natural Language To Queries Using A Query Grammar
Sun et al. Data processing and text mining technologies on electronic medical records: a review
CN105701253B (zh) 中文自然语言问句语义化的知识库自动问答方法
US9619583B2 (en) Predictive analysis by example
CN109284396A (zh) 医学知识图谱构建方法、装置、服务器及存储介质
CN106407666A (zh) 一种电子病历信息的生成方法、装置及系统
WO2018192269A1 (zh) 计算机模拟人脑学习知识的方法、逻辑推理机及类脑人工智能服务平台
CN109299239A (zh) 一种基于es的电子病历检索方法
CN112487202B (zh) 融合知识图谱与bert的中文医学命名实体识别方法、装置
KR102424085B1 (ko) 기계-보조 대화 시스템 및 의학적 상태 문의 장치 및 방법
CN103530840A (zh) 一种准确快速的电子病历录入系统
Wan et al. A self-attention based neural architecture for Chinese medical named entity recognition
WO2011013007A2 (en) Ontological information retrieval system
TWI735380B (zh) 自然語言處理方法與其計算裝置
WO2021169203A1 (zh) 基于多层级结构相似度的单基因病名称推荐方法和系统
CN103530358A (zh) 一种基于递增式术语库的电子病历快速录入系统
CN109408658A (zh) 表情图片提示方法、装置、计算机设备及存储介质
CN103246642B (zh) 信息处理装置以及信息处理方法
CN110188170A (zh) 一种多入口医学问句模板装置及其方法
Niu et al. Retrieve and rerank for automated icd coding via contrastive learning
CN103544384A (zh) 一种基于递增式术语库的电子病历快速录入系统
Khare et al. Exploiting semantic structure for mapping user-specified form terms to SNOMED CT concepts
CN116737879A (zh) 知识库查询方法、装置、电子设备及存储介质
CN109685590A (zh) 一种智能购药的系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination