CN111949755B - 危化品的信息查询方法、装置、电子设备和介质 - Google Patents
危化品的信息查询方法、装置、电子设备和介质 Download PDFInfo
- Publication number
- CN111949755B CN111949755B CN202010622546.6A CN202010622546A CN111949755B CN 111949755 B CN111949755 B CN 111949755B CN 202010622546 A CN202010622546 A CN 202010622546A CN 111949755 B CN111949755 B CN 111949755B
- Authority
- CN
- China
- Prior art keywords
- dangerous
- information
- chemical
- attribute
- dangerous chemical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/319—Inverted lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种危化品的信息查询方法、装置、电子设备和介质。本申请中危化品的信息查询方法包括:获取危化品查询请求,提取所述危化品查询请求中的危化品名称和问题内容;根据所述危化品名称进行检索,获取预设数据库中对应的危化品信息,以及获取问答分词索引数据中存储的对应的索引信息;将所述问题内容依次与所述索引信息中的属性名称进行比对,从所述属性名称中确定与所述问题内容匹配的目标属性名称;获取所述用目标属性名称对应的属性内容,将所述属性内容和所述危化品信息作为所述危化品查询请求的回答信息返回,可以准确、快速地回复用户输入的危化品问题,匹配度高。
Description
技术领域
本发明涉及数据处理技术领域,尤其是涉及一种危化品的信息查询方法、装置、电子设备和介质。
背景技术
危险化学品又简称危化品,是指具有毒害、腐蚀、爆炸、燃烧、助燃等性质,对人体、设施、环境具有危害的剧毒化学品和其他化学品。由于危险化学品的危害性重大,国家有关部门制定了易制毒、易制爆危化品名录和管理条例,针对这两条危险化学品进行重点管理。
而目前涉及到危化品的使用单位或个人,对于危化品的专业知识了解不够全面,而危化品的接触、使用操作危险性较大,很有可能发生意外情况,用户对危化品的性质、使用等存在疑问时难以及时地获得专业的解答。
发明内容
本申请提供了一种危化品的信息查询方法、装置、电子设备和介质。
第一方面,提供了一种危化品的信息查询方法,包括:
获取危化品查询请求,提取所述危化品查询请求中的危化品名称和问题内容;
根据所述危化品名称进行检索,获取预设数据库中对应的危化品信息,以及获取问答分词索引数据中存储的对应的索引信息;
将所述问题内容依次与所述索引信息中的属性名称进行比对,从所述属性名称中确定与所述问题内容匹配的目标属性名称;
获取所述用目标属性名称对应的属性内容,将所述属性内容和所述危化品信息作为所述危化品查询请求的回答信息返回。
在一种可选的实施方式中,所述获取危化品查询请求之前,所述方法还包括:
将预存的危化品数据中各个危化品的属性名称和对应的属性内容进行组合,生成所述各个危化品的属性信息;
对所述属性信息进行倒排索引,获得分词为多个表示所述属性名称的单词和所述属性内容的单词,作为所述问答分词索引数据的索引信息存储;其中所述属性名称和所述属性内容一一对应。
在一种可选的实施方式中,所述获取危化品查询请求之前,所述方法还包括:
获取危化品的医学信息数据集,使用分词工具包对所述医学信息数据集进行处理,获得分词结果数据,将所述分词结果数据导入问答模型;
所述提取所述危化品查询请求中的危化品名称和问题内容包括:
将所述危化品查询请求输入所述问答模型处理,提取所述危化品名称和所述问题内容。
在一种可选的实施方式中,所述根据所述危化品名称进行检索,获取对应的数据库中的危化品信息,以及获取对应的问答分词索引数据中存储的索引信息,包括:
检测所述危化品名称是否包括化学文摘登记号,所述化学文摘登记号在所述预设数据库中有记录;
若包括,从所述预设数据库中获取所述化学文摘登记号对应的危化品信息;获取所述化学文摘登记号对应的问答分词索引数据中存储的索引信息。
在一种可选的实施方式中,所述方法还包括:
若所述危化品名称不包括化学文摘登记号,根据预设的正则表达式,将预设危化品数据库中存储的索引与所述危化品查询请求进行匹配,获得所述危化品信息,所述危化品信息携带对应的危化品标识,所述匹配包括使用中文索引匹配和使用英文索引匹配。
在一种可选的实施方式中,所述将所述问题内容依次与所述索引信息中属性名称进行比对,从所述属性名称中确定与所述问题内容匹配的目标属性名称,包括:
当查找到与所述问题内容一致的属性名称的情况下,确定与所述问题内容一致的属性名称为所述目标属性名称;
当未查找到与所述问题内容一致的属性名称的情况下,将与所述问题内容匹配度最高的属性名称作为所述目标属性名称。
在一种可选的实施方式中,所述方法还包括:
识别所述问题内容中是否存在预设的危险关键词组,所述危险关键词组包括一个或者多个预设危险关键字;
若是,获取所述危险关键词组对应的应急信息并返回用户侧,所述应急信息包括危化品应急管理机构、救援组织和/或医疗机构的联系方式。
第二方面,提供了一种危化品的信息查询装置,包括:
提取模块,用于获取危化品查询请求,提取所述危化品查询请求中的危化品名称和问题内容;
检索模块,用于根据所述危化品名称进行检索,获取预设数据库中对应的危化品信息,以及获取问答分词索引数据中存储的对应的索引信息;
查询模块,用于将所述问题内容依次与所述索引信息中的属性名称进行比对,从所述属性名称中确定与所述问题内容匹配的目标属性名称;
所述查询模块还用于,获取所述用目标属性名称对应的属性内容,将所述属性内容和所述危化品信息作为所述危化品查询请求的回答信息返回。
第三方面,提供了一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如第一方面及其任一种可能的实现方式的步骤。
第四方面,提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如上述第一方面及其任一种可能的实现方式的步骤。
本申请通过获取危化品查询请求,提取上述危化品查询请求中的危化品名称和问题内容,根据上述危化品名称进行检索,获取预设数据库中对应的危化品信息,以及获取问答分词索引数据中存储的对应的索引信息,将上述问题内容依次与上述索引信息中的属性名称进行比对,从上述属性名称中确定与上述问题内容匹配的目标属性名称,获取上述用目标属性名称对应的属性内容,将上述属性内容和上述危化品信息作为上述危化品查询请求的回答信息返回,通过预先建立的问答分词索引数据进行数据检索和问答匹配,可以准确、快速地回复用户输入的危化品问题,匹配度高。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1为本申请实施例提供的一种危化品的信息查询方法的流程示意图;
图2为本申请实施例提供的另一种危化品的信息查询方法的流程示意图;
图3为本申请实施例提供的一种危化品的信息查询装置的结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面结合本申请实施例中的附图对本申请实施例进行描述。
请参阅图1,图1是本申请实施例提供的一种危化品的信息查询方法的流程示意图。该方法可包括:
101、获取危化品查询请求,提取上述危化品查询请求中的危化品名称和问题内容。
本申请实施例的执行主体可以为一种危化品的信息查询装置,可以为电子设备,具体实现中,上述电子设备为一种终端,也可称为终端设备,包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,上述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。在一种可选的实施方式中,上述危化品的信息查询方法可以通过相应的软件程序在服务器中运行,用户可以通过客户端输入危化品信息查询内容,由服务器执行处理并返回答复。
危险化学品又简称危化品,是指具有毒害、腐蚀、爆炸、燃烧、助燃等性质,对人体、设施、环境具有危害的剧毒化学品和其他化学品。
本申请实施例中提到的化学文摘登记号(CAS NO)是美国化学文摘服务社(Chemical Abstracts Service,CAS)为化学物质制订的登记号,该号是检索有多个名称的化学物质信息的重要工具。是某种物质(化合物、高分子材料、生物序列(Biologicalsequences)、混合物或合金的唯一的数字识别号码。
通过化工词典等在线查询工具,在搜索框输入CAS登录号就可以查找所对应的化学物质,以及该CAS NO对应物质的详细化学知识。
上述危化品查询请求可以是由用户触发,比如通过页面采集用户输入的危化品相关问题,再分析该危化品查询请求做出答复内容。上述危化品查询请求需要包括危化品名称上述危化品名称可以是用户能够提供的任意危化品的俗称、简称、专有名词、化学式和/或CAS NO等。其中用户提供的危化品名称不一定是完全准确的,即用户可能不清楚该危化品的准确名称,可以模糊输入,由程序进行分析处理。上述问题内容可以是与该危化品相关的任意问题,比如使用方法、物理性质、化学性质、发生了何种事故如何应急处理等内容,本申请实施例对此不作限制。在获取到上述危化品查询请求之后,可以执行步骤102。
102、根据上述危化品名称进行检索,获取预设数据库中对应的危化品信息,以及获取问答分词索引数据中存储的对应的索引信息。
具体的,通过上述危化品名称可以确定待查询的具体危化品,从而从预设数据库中获取对应的危化品信息。
在一种实施方式中,上述包步骤102包括:
检测上述危化品名称是否包括化学文摘登记号,上述化学文摘登记号在上述预设数据库中有记录;
若包括,从上述预设数据库中获取上述化学文摘登记号对应的危化品信息;获取上述化学文摘登记号对应的问答分词索引数据中存储的索引信息。
危化品的信息查询装置可以先识别出危化品查询请求中的危化品名称,检测其是否为在预设数据库中有记录的CAS NO,具体可以获取其中的数字字符串在预设数据库中进行比对,以确定是否包含有记录的CAS NO。
若包括,可以直接从预设数据库中获取该CAS NO对应的危化品信息;以及可获取该CAS NO对应的问答分词索引数据中存储的索引信息。
进一步可选的,若上述危化品名称不包括化学文摘登记号,该方法还包括:
根据预设的正则表达式,将预设危化品数据库中存储的索引与上述危化品查询请求进行匹配,获得上述危化品信息,上述危化品信息携带对应的危化品标识,上述匹配包括使用中文索引匹配和使用英文索引匹配。
正则表达式又称规则表达式(Regular Expression),在代码中常简写为regex、regexp或RE,属于计算机科学的一个概念。正则表达式是对字符串操作的一种逻辑公式,上述字符串可包括普通字符(例如,a到z之间的字母)和特殊字符(称为“元字符”),就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式,该模式描述在搜索文本时要匹配的一个或多个字符串。
可以根据预设的正则表达式,将预设危化品数据库中存储的索引与上述危化品查询请求的内容进行匹配,即比对两个语句或短语中是否具有相同的文字或者单词,可以先使用中文索引匹配再使用英文索引匹配,获得对应的危化品信息,得到初步的搜索结果。
其中,建立的上述预设数据库可包括多个危化品信息,上述危化品信息可包括但不限于危化品的危化品标识、性质信息、使用信息、分类情况中的一种或几种,此处不做限制。上述危化品信息中有对应的危化品标识,可以理解为危化品的编号或者专有名称,可包括危化品的CAS NO。
具体的,上述性质信息描述危化品的物理性质和/或化学性质,上述使用信息描述该危化品的使用方法、警示标签和/或使用注意事项。可以根据危化品名称确定危化品标识,再根据危化品标识从预设数据库中查找到对应的危化品信息。
本申请实施例中可以预先构建上述问答分词索引数据,用于危化品问答分析。对于危化品的问题内容的处理,可以获取上述问答分词索引数据中存储的对应的索引信息。按照前述的检索方法,确定该危化品在预设数据库中对应的数据,通过确定的危化品标识,由此,也可确定该危化品在上述问答分词索引数据中存储的索引信息。可以根据对应的索引信息分析危化品查询请求中的上述问题内容,做出问题的回答,具体执行步骤103。
103、将上述问题内容依次与上述索引信息中的属性名称进行比对,从上述属性名称中确定与上述问题内容匹配的目标属性名称。
根据该查询危化品对应的索引信息,可以将上述问题内容依次与上述索引信息中的属性名称进行识别比对,查找与用户的问题内容匹配的属性名称,即上述目标属性名称。
在一种实施方式中,上述步骤103具体包括:
当查找到与上述问题内容一致的属性名称的情况下,确定与上述问题内容一致的属性名称为上述目标属性名称;
当未查找到与上述问题内容一致的属性名称的情况下,将与上述问题内容匹配度最高的属性名称作为上述目标属性名称。
具体可以理解为,把用户的问题依次与上述问答分词索引数据中的属性名称进行核对,如果两者完全一致,则可以确定用户的问题。
具体的,上述匹配时可以计算问题内容与各属性名称的匹配度,若没有匹配完全一致的数据,则可以将上述匹配度最高的属性名称作为目标属性名称,以进行后续的问题答复处理。
104、获取上述用目标属性名称对应的属性内容,将上述属性内容和上述危化品信息作为上述危化品查询请求的回答信息返回。
进一步地,通过确定目标属性名称锁定用户的问题,则也可以直接获取到该问题对应的答案(即对应的属性内容)。只要匹配到第一对完全一致的数据,则此程序结束,可以返回答案。
在一种可选的实施方式中,所述方法还包括:
识别上述问题内容中是否存在预设的危险关键词组,上述危险关键词组包括一个或者多个预设危险关键字;
若是,获取上述危险关键词组对应的应急信息并返回用户侧,上述应急信息包括危化品应急管理机构、救援组织和/或医疗机构的联系方式。
具体的,可以预设多个危险关键词组,其中每个危险关键词组可包括一个或者多个预设危险关键字,危险关键词组还可以预先设置对应的应急信息,上述应急信息包括危化品应急管理机构、救援组织和/或医疗机构的联系方式,可以提供给用户。在进行信息查询和答复的过程中,还可以识别上述问题内容中是否存在上述预设的危险关键词组,若检测到用户的问题包含上述危险关键词组,可以获取该危险关键词组所对应的应急信息,返回用户侧,便于快速地为用户查找到对应的应急信息,在用户处于危险、受伤等关于危化品的紧急场景时可以及时准确地为用户提供专业机构的联系方式,从而联系专业机构咨询或者请求帮助,以解决当前危化品问题。
本申请通过获取危化品查询请求,提取上述危化品查询请求中的危化品名称和问题内容,根据上述危化品名称进行检索,获取预设数据库中对应的危化品信息,以及获取问答分词索引数据中存储的对应的索引信息,将上述问题内容依次与上述索引信息中的属性名称进行比对,从上述属性名称中确定与上述问题内容匹配的目标属性名称,获取上述用目标属性名称对应的属性内容,将上述属性内容和上述危化品信息作为上述危化品查询请求的回答信息返回,通过预先建立的问答分词索引数据进行数据检索和问答匹配,可以准确、快速地回复用户输入的危化品问题,匹配度高。
请参阅图2,图2是本申请实施例提供的另一种危化品的信息查询方法的流程示意图。如图2所示,该方法可以应用于图1所示实施例的步骤之前,用于建立危化品的信息查询模型,包括问答模型以及对应的数据库。该方法可具体包括:
201、将预存的危化品数据中各个危化品的属性名称和对应的属性内容进行组合,生成上述各个危化品的属性信息。
上述预存的危化品数据可以包含多个危化品及其相应的各种介绍信息,其内容也可以包含但不限于如前述所述的危化品的危化品标识、性质信息、使用信息、分类情况中的一种或几种,此处不做限制,该危化品数据可以先进性预处理,转换为一致的数据类型,使数据更加标准化。
进一步地,可以基于目前的危化品数据,把每一种危化品的属性名称和属性内容进行组合,即每一种危化品生成一段描述此危化品的属性信息,然后可执行步骤202。
202、对上述属性信息进行倒排索引,获得分词为多个表示上述属性名称的单词和上述属性内容的单词,作为上述问答分词索引数据的索引信息存储,其中上述属性名称和上述属性内容一一对应。
具体的,对生成的每段属性信息进行倒排索引操作,分解成一系列具有属性名称和内容的单词,并加以存储,其中属性名称和内容具有一一对应关系,可以用于在危化品问答处理中的分析。
203、获取危化品的医学信息数据集,使用分词工具包对上述医学信息数据集进行处理,获得分词结果数据,将上述分词结果数据导入问答模型。
具体的,可以采用任意与危化品相关的医学信息数据集,作为问答模型的知识依据。可以使用分词工具包,在程序中导入医学方面的数据,从而问答模型可以在进行的处理时加载用户输入的问题内容到程序中,提取出危化品名称和用户想问的问题内容。
在一种实施方式中,可以使用北京大学开源的一个中文的分词工具包pkuseg。相比于现在已有的开源工具,pkuseg大幅度的提升了分词的准确率。包括训练、场景模型切换(msra/新闻领域、ctb8/混合领域、weibo/网页领域)、硬编码词典加载、模型支持对文件的处理、支持python多进程处理、提供预训练好的模型。使用pkuseg开源技术处理上述医学信息数据集获得的分词结果数据,可以导入问答模型,使该问答模型具有强大的数据支持和准确的分析能力,能够处理多方面的危化品问题。
其中,上述步骤201和步骤203可以不分先后顺序执行。本申请实施例通过将预存的危化品数据中各个危化品的属性名称和对应的属性内容进行组合,生成上述各个危化品的属性信息,对上述属性信息进行倒排索引,获得分词为多个表示上述属性名称的单词和上述属性内容的单词,作为上述问答分词索引数据的索引信息存储,其中上述属性名称和上述属性内容一一对应,还可以获取危化品的医学信息数据集,使用分词工具包对医学信息数据集进行处理,获得分词结果数据,导入问答模型,通过上述方法可以建立危化品问答模型和问答分词索引数据,可以进行数据检索和问答匹配,实现如图1所示实施例中的用户对危化品的信息查询和疑问解答,可以准确、快速地回复用户输入的危化品问题,匹配度高。
基于上述危化品的信息查询方法实施例的描述,本申请实施例还公开了一种危化品的信息查询装置。请参见图3,危化品的信息查询装置300包括:
提取模块310,用于获取危化品查询请求,提取上述危化品查询请求中的危化品名称和问题内容;
检索模块320,用于根据上述危化品名称进行检索,获取预设数据库中对应的危化品信息,以及获取问答分词索引数据中存储的对应的索引信息;
查询模块330,用于将上述问题内容依次与上述索引信息中的属性名称进行比对,从上述属性名称中确定与上述问题内容匹配的目标属性名称;
上述查询模块330还用于,获取上述用目标属性名称对应的属性内容,将上述属性内容和上述危化品信息作为上述危化品查询请求的回答信息返回。
可选的,还包括生成模块340,用于:
将预存的危化品数据中各个危化品的属性名称和对应的属性内容进行组合,生成上述各个危化品的属性信息;
对上述属性信息进行倒排索引,获得分词为多个表示上述属性名称的单词和上述属性内容的单词,作为上述问答分词索引数据的索引信息存储;其中上述属性名称和上述属性内容一一对应。
可选的,上述生成模块340还用于:
获取危化品的医学信息数据集,使用分词工具包对上述医学信息数据集进行处理,获得分词结果数据,将上述分词结果数据导入问答模型;
上述提取模块310具体用于,将上述危化品查询请求输入上述问答模型处理,提取上述危化品名称和上述问题内容。
可选的,上述检索模块320具体用于:
检测上述危化品名称是否包括化学文摘登记号,上述化学文摘登记号在上述预设数据库中有记录;
若包括,从上述预设数据库中获取上述化学文摘登记号对应的危化品信息;获取上述化学文摘登记号对应的问答分词索引数据中存储的索引信息。
进一步可选的,上述检索模块320还用于,若上述危化品名称不包括化学文摘登记号,根据预设的正则表达式,将预设危化品数据库中存储的索引与上述危化品查询请求进行匹配,获得上述危化品信息,上述危化品信息携带对应的危化品标识,上述匹配包括使用中文索引匹配和使用英文索引匹配。
可选的,上述查询模块330具体用于:
当查找到与上述问题内容一致的属性名称的情况下,确定与上述问题内容一致的属性名称为上述目标属性名称;
当未查找到与上述问题内容一致的属性名称的情况下,将与上述问题内容匹配度最高的属性名称作为上述目标属性名称。
可选的,上述查询模块330还用于:
识别上述问题内容中是否存在预设的危险关键词组,上述危险关键词组包括一个或者多个预设危险关键字;
若是,获取上述危险关键词组对应的应急信息并返回用户侧,上述应急信息包括危化品应急管理机构、救援组织和/或医疗机构的联系方式。
根据本申请的一个实施例,图1和图2所示的方法所涉及的各个步骤均可以是由图3所示的危化品的信息查询装置300中的各个模块执行的,此处不再赘述。
本申请实施例中的危化品的信息查询装置300,通过获取危化品查询请求,提取上述危化品查询请求中的危化品名称和问题内容,根据上述危化品名称进行检索,获取预设数据库中对应的危化品信息,以及获取问答分词索引数据中存储的对应的索引信息,将上述问题内容依次与上述索引信息中的属性名称进行比对,从上述属性名称中确定与上述问题内容匹配的目标属性名称,获取上述用目标属性名称对应的属性内容,将上述属性内容和上述危化品信息作为上述危化品查询请求的回答信息返回,通过预先建立的问答分词索引数据进行数据检索和问答匹配,可以准确、快速地回复用户输入的危化品问题,匹配度高。
基于上述方法实施例以及装置实施例的描述,本申请实施例还提供一种电子设备。请参见图4,该电子设备400至少包括处理器401、输入设备402、输出设备403以及计算机存储介质404。其中,终端内的处理器401、输入设备402、输出设备403以及计算机存储介质404可通过总线或其他方式连接。
计算机存储介质404可以存储在终端的存储器中,上述计算机存储介质404用于存储计算机程序,上述计算机程序包括程序指令,上述处理器401用于执行上述计算机存储介质404存储的程序指令。处理器401(或称CPU(Central Processing Unit,中央处理器))是终端的计算核心以及控制核心,其适于实现一条或多条指令,具体适于加载并执行一条或多条指令从而实现相应方法流程或相应功能;在一个实施例中,本申请实施例上述的处理器401可以用于进行一系列的处理,包括如图1和图2所示实施例中方法等等。
本申请实施例还提供了一种计算机存储介质(Memory),上述计算机存储介质是终端中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括终端中的内置存储介质,当然也可以包括终端所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器401加载并执行的一条或多条的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器;可选的还可以是至少一个位于远离前述处理器的计算机存储介质。
在一个实施例中,可由处理器401加载并执行计算机存储介质中存放的一条或多条指令,以实现上述实施例中的相应步骤;具体实现中,计算机存储介质中的一条或多条指令可以由处理器401加载并执行图1和/或图2中方法的任意步骤,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。所显示或讨论的相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者通过该计算机可读存储介质进行传输。该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是只读存储器(read-onlymemory,ROM),或随机存储存储器(random access memory,RAM),或磁性介质,例如,软盘、硬盘、磁带、磁碟、或光介质,例如,数字通用光盘(digital versatile disc,DVD)、或者半导体介质,例如,固态硬盘(solid state disk,SSD)等。
Claims (10)
1.一种危化品的信息查询方法,其特征在于,包括:
获取危化品查询请求,提取所述危化品查询请求中的危化品名称和问题内容;
根据所述危化品名称进行检索,获取预设数据库中对应的危化品信息,以及获取问答分词索引数据中存储的对应的索引信息;
将所述问题内容依次与所述索引信息中的属性名称进行比对,从所述属性名称中确定与所述问题内容匹配的目标属性名称;
获取所述目标属性名称对应的属性内容,将所述属性内容和所述危化品信息作为所述危化品查询请求的回答信息返回。
2.根据权利要求1所述的危化品的信息查询方法,其特征在于,所述获取危化品查询请求之前,所述方法还包括:
将预存的危化品数据中各个危化品的属性名称和对应的属性内容进行组合,生成所述各个危化品的属性信息;
对所述属性信息进行倒排索引,获得分词为多个表示所述属性名称的单词和所述属性内容的单词,作为所述问答分词索引数据的索引信息存储;其中所述属性名称和所述属性内容一一对应。
3.根据权利要求1所述的危化品的信息查询方法,其特征在于,所述获取危化品查询请求之前,所述方法还包括:
获取危化品的医学信息数据集,使用分词工具包对所述医学信息数据集进行处理,获得分词结果数据,将所述分词结果数据导入问答模型;
所述提取所述危化品查询请求中的危化品名称和问题内容包括:
将所述危化品查询请求输入所述问答模型处理,提取所述危化品名称和所述问题内容。
4.根据权利要求1-3任一项所述的危化品的信息查询方法,其特征在于,所述根据所述危化品名称进行检索,获取对应的数据库中的危化品信息,以及获取对应的问答分词索引数据中存储的索引信息,包括:
检测所述危化品名称是否包括化学文摘登记号,所述化学文摘登记号在所述预设数据库中有记录;
若包括,从所述预设数据库中获取所述化学文摘登记号对应的危化品信息;获取所述化学文摘登记号对应的问答分词索引数据中存储的索引信息。
5.根据权利要求4所述的危化品的信息查询方法,其特征在于,所述方法还包括:
若所述危化品名称不包括化学文摘登记号,根据预设的正则表达式,将预设危化品数据库中存储的索引与所述危化品查询请求进行匹配,获得所述危化品信息,所述危化品信息携带对应的危化品标识,所述匹配包括使用中文索引匹配和使用英文索引匹配。
6.根据权利要求5所述的危化品的信息查询方法,其特征在于,所述将所述问题内容依次与所述索引信息中属性名称进行比对,从所述属性名称中确定与所述问题内容匹配的目标属性名称,包括:
当查找到与所述问题内容一致的属性名称的情况下,确定与所述问题内容一致的属性名称为所述目标属性名称;
当未查找到与所述问题内容一致的属性名称的情况下,将与所述问题内容匹配度最高的属性名称作为所述目标属性名称。
7.根据权利要求5或6所述的危化品的信息查询方法,其特征在于,所述方法还包括:
识别所述问题内容中是否存在预设的危险关键词组,所述危险关键词组包括一个或者多个预设危险关键字;
若是,获取所述危险关键词组对应的应急信息并返回用户侧,所述应急信息包括危化品应急管理机构、救援组织和/或医疗机构的联系方式。
8.一种危化品的信息查询装置,其特征在于,包括:
提取模块,用于获取危化品查询请求,提取所述危化品查询请求中的危化品名称和问题内容;
检索模块,用于根据所述危化品名称进行检索,获取预设数据库中对应的危化品信息,以及获取问答分词索引数据中存储的对应的索引信息;
查询模块,用于将所述问题内容依次与所述索引信息中的属性名称进行比对,从所述属性名称中确定与所述问题内容匹配的目标属性名称;
所述查询模块还用于,获取所述目标属性名称对应的属性内容,将所述属性内容和所述危化品信息作为所述危化品查询请求的回答信息返回。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的危化品的信息查询方法的步骤。
10.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的危化品的信息查询方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010622546.6A CN111949755B (zh) | 2020-07-01 | 2020-07-01 | 危化品的信息查询方法、装置、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010622546.6A CN111949755B (zh) | 2020-07-01 | 2020-07-01 | 危化品的信息查询方法、装置、电子设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111949755A CN111949755A (zh) | 2020-11-17 |
CN111949755B true CN111949755B (zh) | 2023-09-22 |
Family
ID=73337823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010622546.6A Active CN111949755B (zh) | 2020-07-01 | 2020-07-01 | 危化品的信息查询方法、装置、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111949755B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112685613B (zh) * | 2021-01-06 | 2022-10-25 | 青岛海尔科技有限公司 | 一种资源包查询的方法、装置及信息处理系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009080576A (ja) * | 2007-09-25 | 2009-04-16 | Toshiba Corp | 検索装置、方法及びプログラム |
CN102682122A (zh) * | 2012-05-15 | 2012-09-19 | 北京科技大学 | 基于本体构建材料科学领域语义数据模型的方法 |
CN103824149A (zh) * | 2013-10-18 | 2014-05-28 | 中国石油化工股份有限公司 | 石化企业化学品全生命周期安全管理方法 |
CN108345672A (zh) * | 2018-02-09 | 2018-07-31 | 平安科技(深圳)有限公司 | 智能应答方法、电子装置及存储介质 |
CN110265091A (zh) * | 2019-06-26 | 2019-09-20 | 王乔健 | 化学品信息查询方法、装置和电子化学词典 |
CN110570056A (zh) * | 2018-06-06 | 2019-12-13 | 中国石油化工股份有限公司 | 石油化工企业突发事故应急辅助决策方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190258807A1 (en) * | 2017-09-26 | 2019-08-22 | Mcs2, Llc | Automated adjusting of devices |
-
2020
- 2020-07-01 CN CN202010622546.6A patent/CN111949755B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009080576A (ja) * | 2007-09-25 | 2009-04-16 | Toshiba Corp | 検索装置、方法及びプログラム |
CN102682122A (zh) * | 2012-05-15 | 2012-09-19 | 北京科技大学 | 基于本体构建材料科学领域语义数据模型的方法 |
CN103824149A (zh) * | 2013-10-18 | 2014-05-28 | 中国石油化工股份有限公司 | 石化企业化学品全生命周期安全管理方法 |
CN108345672A (zh) * | 2018-02-09 | 2018-07-31 | 平安科技(深圳)有限公司 | 智能应答方法、电子装置及存储介质 |
CN110570056A (zh) * | 2018-06-06 | 2019-12-13 | 中国石油化工股份有限公司 | 石油化工企业突发事故应急辅助决策方法 |
CN110265091A (zh) * | 2019-06-26 | 2019-09-20 | 王乔健 | 化学品信息查询方法、装置和电子化学词典 |
Non-Patent Citations (5)
Title |
---|
Development of the Emergency Decision System for Dangerous Chemicals Burst Leaking Accident;H. Yanju 等;2010 International Forum on Information Technology and Applications;49-51 * |
危险化学品查询系统的设计与实现;李鑫, 陆海东;吉林化工学院学报(04);91-98 * |
基于网络的危险化学品信息查询系统;姚建华 等;上海化工;第43卷(第01期);23-25 * |
姚建华 ; 徐雯丽 ; 黄迎 ; 蒋舒仰 ; 胡静 ; 李佳 ; .基于网络的危险化学品信息查询系统.上海化工.2018,(第01期),29-31. * |
定向查询引擎在Web化学数据库集成检索中的应用;储春梅, 李晓霞, 郭力;计算机与应用化学(08);51-53 * |
Also Published As
Publication number | Publication date |
---|---|
CN111949755A (zh) | 2020-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8161059B2 (en) | Method and apparatus for collecting entity aliases | |
US8370278B2 (en) | Ontological categorization of question concepts from document summaries | |
US8407781B2 (en) | Information providing support device and information providing support method | |
CN110069610A (zh) | 基于Solr的检索方法、装置、设备和存储介质 | |
EP1429258A1 (en) | DATA PROCESSING METHOD, DATA PROCESSING SYSTEM, AND PROGRAM | |
Falessi et al. | A comprehensive characterization of NLP techniques for identifying equivalent requirements | |
Sleeman et al. | Entity type recognition for heterogeneous semantic graphs | |
Wu et al. | Evaluation of negation and uncertainty detection and its impact on precision and recall in search | |
WO2011072172A1 (en) | System and method for quickly determining a subset of irrelevant data from large data content | |
Hamborg et al. | Extraction of main event descriptors from news articles by answering the journalistic five W and one H questions | |
GB2375192A (en) | Search engine system | |
Mehrbod et al. | Tender calls search using a procurement product named entity recogniser | |
KR20120064559A (ko) | 오픈 웹 질의응답을 위한 질문분석 장치 및 방법 | |
Adams et al. | Choosing your platform for social media drug research and improving your keyword filter list | |
CN111949755B (zh) | 危化品的信息查询方法、装置、电子设备和介质 | |
CN116910374B (zh) | 一种基于知识图谱的康养服务推荐方法、装置及存储介质 | |
CN110489032B (zh) | 用于电子书的词典查询方法及电子设备 | |
KR100659370B1 (ko) | 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법 | |
CN109844737B (zh) | 用于非监督式信息提取的方法和设备 | |
CN113704462A (zh) | 文本处理方法、装置、计算机设备及存储介质 | |
KR20220075815A (ko) | 유사 임상 시험 데이터 제공 방법 및 이를 실행하는 서버 | |
US20140236940A1 (en) | System and method for organizing search results | |
CN113094469B (zh) | 文本数据分析方法、装置、电子设备及存储介质 | |
Lee et al. | Predictive Food Safety Risk Monitoring | |
CN110609959B (zh) | 基于项目生命周期的检索方法、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |