CN111414531B - 事件的搜索方法、装置和电子设备 - Google Patents

事件的搜索方法、装置和电子设备 Download PDF

Info

Publication number
CN111414531B
CN111414531B CN202010199628.4A CN202010199628A CN111414531B CN 111414531 B CN111414531 B CN 111414531B CN 202010199628 A CN202010199628 A CN 202010199628A CN 111414531 B CN111414531 B CN 111414531B
Authority
CN
China
Prior art keywords
event
structured
event information
phrase
information corresponding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010199628.4A
Other languages
English (en)
Other versions
CN111414531A (zh
Inventor
韩翠云
陈玉光
黄佳艳
李法远
刘远圳
潘禄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010199628.4A priority Critical patent/CN111414531B/zh
Publication of CN111414531A publication Critical patent/CN111414531A/zh
Application granted granted Critical
Publication of CN111414531B publication Critical patent/CN111414531B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本申请公开了事件的搜索方法、装置和电子设备,涉及智能搜索技术领域,尤其是知识图谱技术领域。具体实现方案为:在接收到包括事件短语的搜索请求后,可以通过语义检索方式在预先建立的用于存储结构化的事件信息的语义数据库中查询与事件短语相关联的多个结构化的事件信息,实现了搜索事件短语对应的结构化的事件信息,并采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度,根据第一匹配度确定与事件短语对应的结构化的事件信息,不仅实现了搜索事件短语对应的结构化的事件信息,而且,在一定程度上保证了获取到的结构化的事件信息的准确度。

Description

事件的搜索方法、装置和电子设备
技术领域
本申请涉及计算机技术,尤其涉及智能搜索技术。
背景技术
在通过搜索引擎搜索某一事件时,通常返回的是与该事件关联的资讯信息,其资讯信息的格式比较繁多,没有较为固定的格式。
随着事件链接技术的提出,该事件链接技术是指给定一个事件短语,返回事件图谱中结构化的事件信息,该结构化的事件信息包括事件名、时间以地点等,其事件信息的格式较为固定。但是,现有的技术无法支持搜索事件短语对应的结构化的事件信息,因此,如何搜索事件短语对应的结构化的事件信息是至关重要的。
发明内容
本申请实施例提供了一种用于事件的搜索方法、装置和电子设备,实现了搜索事件短语对应的结构化的事件信息。
第一方面,本申请实施例提供了一种事件的搜索方法,该事件的搜索方法可以包括:
获取用户输入的搜索请求,所述搜索请求包括:事件短语。
采用语义检索方式查询语义数据库,获取与所述事件短语相关联的多个结构化的事件信息。
采用事件归一化判别模型,分别获取所述事件短语与每个结构化的事件信息之间的第一匹配度。
根据多个所述第一匹配度,从所述多个结构化的事件信息中,确定与所述事件短语对应的结构化的事件信息。
第二方面,本申请实施例还提供了一种事件的搜索装置,该事件的搜索装置可以包括:
获取模块,用于获取用户输入的搜索请求,所述搜索请求包括:事件短语。
所述获取模块,还用于采用语义检索方式查询语义数据库,获取与所述事件短语相关联的多个结构化的事件信息;其中,所述语义数据库中包括多个事件各自对应的结构化的事件信息。
所述处理模块,用于采用事件归一化判别模型,分别获取所述事件短语与每个结构化的事件信息之间的第一匹配度。
所述处理模块,还用于根据多个所述第一匹配度,从所述多个结构化的事件信息中,确定与所述事件短语对应的结构化的事件信息。
第三方面,本申请实施例还提供一种电子设备,该电子设备可以包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的事件的搜索方法。
第四方面,本申请实施例还提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述第一方面所述的事件的搜索方法。
根据本申请的技术方案,在接收到包括事件短语的搜索请求后,可以通过语义检索方式在预先建立的用于存储结构化的事件信息的语义数据库中查询与事件短语相关联的多个结构化的事件信息,实现了搜索事件短语对应的结构化的事件信息,并采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度,根据第一匹配度确定与事件短语对应的结构化的事件信息,不仅实现了搜索事件短语对应的结构化的事件信息,而且,在一定程度上保证了获取到的结构化的事件信息的准确度。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是可以实现本申请实施例的事件的搜索方法的一种场景图;
图2是根据本申请第一实施例提供的事件的搜索方法的流程示意图;
图3是根据本申请第三实施例提供的事件的搜索装置的结构示意图;
图4是根据本申请实施例的事件的搜索方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在本申请的实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。在本申请的文字描述中,字符“/”一般表示前后关联对象是一种“或”的关系。
本申请实施例提供的事件的搜索方法可以应用于基于事件图谱进行事件搜索的场景中,示例的,请参见图1所示,图1是可以实现本申请实施例的事件的搜索方法的一种场景图,在通过搜索引擎搜索某一事件时,例如,“人物A去世”,通常返回的是与该事件“人物A去世”关联的资讯信息,其资讯信息的格式比较繁多,虽然结构化的事件信息会包括事件、时间以地点等,其事件信息的格式较为固定。但是,现有的技术无法支持搜索事件短语,例如“人物A去世”对应的结构化的事件信息。
为了实现搜索事件短语对应的结构化的事件信息,本申请实施例提供了一种事件的搜索方法,在接收到用户输入的包括事件短语的搜索请求后,采用语义检索方式查询语义数据库,获取与事件短语相关联的多个结构化的事件信息;并采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度;然后再根据多个第一匹配度,从多个结构化的事件信息中,确定与事件短语对应的结构化的事件信息。可以看出,本申请实施例提供的事件的搜索方法,在接收到包括事件短语的搜索请求后,可以通过语义检索方式在预先建立的用于存储结构化的事件信息的语义数据库中查询与事件短语相关联的多个结构化的事件信息,实现了搜索事件短语对应的结构化的事件信息,并采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度,根据第一匹配度确定与事件短语对应的结构化的事件信息,不仅实现了搜索事件短语对应的结构化的事件信息,而且,在一定程度上保证了获取到的结构化的事件信息的准确度。
其中,结构化的事件信息为描述事件的事件信息,与事件对应的资讯信息不同的是,该结构化的事件信息包括事件名、时间、以及地点等信息,其信息格式较为固定。
下面,将通过具体的实施例对本申请提供的样本数据的获取方法进行详细地说明。可以理解的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
实施例一
图2是根据本申请第一实施例提供的事件的搜索方法的流程示意图,该事件的搜索方法可以由软件和/或硬件装置执行,例如,该硬件装置可以为事件的搜索装置,该事件的搜索装置可以设置在电子设备中。示例的,请参见图2所示,该事件的搜索方法可以包括:
S201、获取用户输入的搜索请求,搜索请求包括:事件短语。
示例的,搜索请求可以为语音形式的搜索请求,也可以为文本形式的搜索请求,具体可以根据实际需要进行设置,在此,对于搜索请求的形式,本申请实施例不做具体限制。
示例的,在获取用户输入的搜索请求时,可以直接接收用户输入的搜索请求,也可以通过接收其它电子设备发送的用户的搜索请求,获取用户输入的搜索请求,具体可以根据实际需要进行设置,在此,对于如何获取用户输入的搜索请求,本申请实施例不做具体限制。
以事件短语为“人物A去世”为例,在获取到用户输入的包括“人物A去世”的搜索请求之后,可以先对该事件短语“人物A去世”进行分词处理,得到关键词“人物A”和“去世”,在分别得到关键词“人物A”和“去世”之后,就可以执行下述S202:
S202、采用语义检索方式查询语义数据库,获取与事件短语相关联的多个结构化的事件信息。
其中,语义数据库中包括多个事件各自对应的结构化的事件信息。
可以理解的是,在采用语义检索方式查询语义数据库,获取与事件短语相关联的多个结构化的事件信息之前,需要预先建立该语义数据库。示例的,在建立该语义数据库时,可以基于事件图谱,将多个事件对应的结构化的事件信息存入至语义数据库,例如es数据库。在将多个事件对应的结构化的事件信息存入至语义数据库时,存入的结构化的事件信息的数量越多,其语义数据库越丰富,因此,在预先建立语义数据库时,可以构建一个全量的语义数据库,该全量的语义数据库中可以在一定程度上包括各个领域中时间对应的结构化的事件信息。
这样在预先建立得到该语义数据库之后,就可以采用语义检索方式查询语义数据库,获取与事件短语相关联的多个结构化的事件信息。在查找获取与事件短语相关联的多个结构化的事件信息时,可以在该语义数据库中分别查找与关键词“人物A”和“去世”关联的结构化的事件信息,值得注意的是,由于是采用语义检索方式查询语义数据库,因此,还可以在语义数据库中查找与关键词“去世”具有相同含义的关键词,例如关键词“死亡”关联的结构化的事件信息,这样获取的与事件短语相关联的多个结构化的事件信息包括:与关键词“人物A”相关联的结构化的事件信息、与关键词“去世”相关联的结构化的事件信息、以及关键词“死亡”相关联的结构化的事件信息。
由于与关键词“人物A”相关联的结构化的事件信息中不仅会包括与“人物A”去世事件相关联的结构化的事件信息,还会包括与“人物A”的其它事件相关联的结构化的事件信息,这些与“人物A”的其它事件相关联的结构化的事件信息都是无效的;同理,与关键词“去世”或者“死亡”相关联的结构化的事件信息中不仅会包括与人物A“去世”或者“死亡”事件相关联的结构化的事件信息,还会包括与其他人物“去世”或者“死亡”事件相关联的结构化的事件信息,这些与其他人物“去世”或者“死亡”事件相关联的结构化的事件信息都是无效的,因此,在获取的与事件短语“人物A去世”相关联的多个结构化的事件信息之后,为了在一定程度上保证获取到的结构化的事件信息的准确度,还需要采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度,并根据多个第一匹配度,从多个结构化的事件信息中,进一步确定与事件短语对应的结构化的事件信息,即执行下述S203-S204。
S203、采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度。
其中,事件归一化判别模型,用于判断输入的事件短语和结构化的事件信息之间的匹配度,其输入为事件短语和结构化的事件信息,输入为该事件短语和结构化的事件信息之间的匹配度。示例的,匹配度可以用百分比值表示,例如匹配度为80%,完全匹配时匹配值为100%;匹配度也可以为小数值表示,例如匹配度为0.8,完全匹配时匹配值为1;当然,匹配度还可以用于匹配程度表示,例如匹配程度为匹配度较高,完全匹配时匹程度为完全匹配,具体可以根据实际需要进行设置,在此,对于匹配度的表示方法,本申请实施例不做进一步地限制。
可以理解的是,采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度之前,需要先建立该事件归一化判别模型。示例的,在建立该事件归一化判别模型时,可以通过样本标注数据,对初始深度学习模型进行训练,得到用于判断输入的事件短语和结构化的事件信息之间的匹配度的事件归一化判别模型,例如,ernie模型。
在训练得到事件归一化判别模型之后,就可以将待匹配的事件短语和结构化的事件信息输入至事件归一化判别模型,以获取事件短语与每个结构化的事件信息之间的第一匹配度。示例的,在采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度时,可以包括两种可能的实现方式:
在一种可能的实现方式中,可以先将待匹配的事件短语和上述S202得到的多个结构化的事件信息中的第一个结构化的事件信息输入至事件归一化判别模型,以获取事件短语与该第一个结构化的事件信息之间的第一匹配度;再将待匹配的事件短语和上述S202得到的多个结构化的事件信息中的第二个结构化的事件信息输入至事件归一化判别模型,以获取事件短语与该第二个结构化的事件信息之间的第一匹配度;以此类推,直至将待匹配的事件短语和上述S202得到的多个结构化的事件信息中的最后一个结构化的事件信息输入至事件归一化判别模型,以获取事件短语与该最后一个结构化的事件信息之间的第一匹配度,从而得到多个第一匹配度。
可以看出,上述可能的方式在分别获取到事件短语与每个结构化的事件信息之间的第一匹配度,是采用事件归一化判别模型单独获取到事件短语与每个结构化的事件信息之间的第一匹配度,每一个第一匹配度的获取过程都是独立的。为了提高多个第一匹配度的计算效率,还可以包括下述另一种可能的实现方式:
在另一种可能的实现方式中,由于归一化判别模型支持并行处理,因此,在采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度时,可以将事件短语和多个结构化的事件信息一并输入至事件归一化判别模型,并行获取事件短语与每一个结构化的事件信息之间的第一匹配度,从而得到多个第一匹配度,这样可以一次性计算得到事件短语与每个结构化的事件信息之间的第一匹配度,从而提高了多个第一匹配度的计算效率。
可以理解的是,在采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度时,本申请实施例只是以上述两种可能的实现方式为例进行说明,但并不代表本申请实施例仅局限于此。示例的,在本申请实施例中,为了提高多个第一匹配度的计算效率,可以并行获取所述事件短语与每个结构化的事件信息之间的第一匹配度。
结合上述S202中的描述,在获取到与事件短语相关联的多个结构化的事件信息后,该多个结构化的事件信息包括:与关键词“人物A”相关联的结构化的事件信息、与关键词“去世”相关联的结构化的事件信息、以及关键词“死亡”相关联的结构化的事件信息;可以将事件短语“人物A去世”、与关键词“人物A”相关联的结构化的事件信息、与关键词“去世”相关联的结构化的事件信息、以及关键词“死亡”相关联的结构化的事件信息一并输入至事件归一化判别模型,以通过该事件归一化判别模型输出事件短语“人物A去世”与多个结构化的事件信息中每一个结构化的事件信息之间的第一匹配度。
在得到事件短语“人物A去世”与多个结构化的事件信息中每一个结构化的事件信息之间的第一匹配度之后,就可以根据第一匹配度的大小,从多个结构化的事件信息中,筛选得到与事件短语对应的结构化的事件信息,即执行下述S204:
S204、根据多个第一匹配度,从多个结构化的事件信息中,确定与事件短语对应的结构化的事件信息。
示例的,在根据多个第一匹配度,从多个结构化的事件信息中,确定与事件短语对应的结构化的事件信息时,在一种可能的实现方式中,可以根据多个第一匹配度的大小,按照从大到小的顺序,对多个第一匹配度进行排序;并将排序为前N个的第一匹配度对应的结构化的事件信息确定为与事件短语对应的结构化的事件信息,从而在多个结构化的事件信息中,确定与事件短语对应的结构化的事件信息,提高了获取到的结构化的事件信息的准确度。其中,N为正整数。
在另一种可能的实现方式中,可以分别将多个第一匹配度分别与预设阈值进行比较,将多个第一匹配度中,大于预设阈值的第一匹配度对应的结构化事件信息确定为与事件短语对应的结构化的事件信息,从而在多个结构化的事件信息中,确定与事件短语对应的结构化的事件信息,提高了获取到的结构化的事件信息的准确度。其中,用于指示匹配度的预设阈值的大小可以根据实际需要进行设置,在此,对于预设阈值的取值,本申请实施例不做进一步地限制。
结合上述S203中的描述,在分别得到事件短语“人物A去世”、与关键词“人物A”相关联的结构化的事件信息、与关键词“去世”相关联的结构化的事件信息、以及关键词“死亡”相关联的结构化的事件信息中每一个结构化的事件信息之间的第一匹配度后,就可以根据多个第一匹配度对关键词“人物A”相关联的结构化的事件信息、与关键词“去世”相关联的结构化的事件信息、以及关键词“死亡”相关联的结构化的事件信息中的结构化的事件信息进行筛选。例如,事件短语“人物A去世”和与关键词“人物A”相关联的结构化的事件信息中关于“去世”或者“死亡”的结构化的事件信息的匹配度较高,且和与关键词“去世”或者“死亡”相关联的结构化的事件信息中关于“人物A”的结构化的事件信息的匹配度较高,则将这部分结构化的事件信息确定为与事件短语“人物A去世”对应的结构化的事件信息。由于事件短语“人物A去世”和与关键词“人物A”相关联的结构化的事件信息中关于非“去世”或者非“死亡”的结构化的事件信息的匹配度较低,或者,由于事件短语“人物A去世”和与关键词“去世”或者“死亡”相关联的结构化的事件信息中关于非“人物A”的结构化的事件信息的匹配度较低,则可以将这部分无效的结构化的事件信息剔除,不将部分无效的结构化的事件信息确定为与事件短语“人物A去世”对应的结构化的事件信息。
由此可见,本申请实施例提供的事件的搜索方法,在接收到包括事件短语的搜索请求后,可以通过语义检索方式在预先建立的用于存储结构化的事件信息的语义数据库中查询与事件短语相关联的多个结构化的事件信息,实现了搜索事件短语对应的结构化的事件信息,并采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度,根据第一匹配度确定与事件短语对应的结构化的事件信息,不仅实现了搜索事件短语对应的结构化的事件信息,而且,在一定程度上保证了获取到的结构化的事件信息的准确度。
实施例二
基于上述图2或图3所示的实施例,不仅实现了搜索事件短语对应的结构化的事件信息,而且,在一定程度上保证了获取到的结构化的事件信息的准确度。为了进一步提高获取到结构化的事件信息的准确度,可以对上述S204获取到的与事件短语对应的结构化的事件信息做进一步地筛选,例如,可以结合事件名和/或结构化的事件信息所属的正文信息做进一步地筛选,从而得到与事件短语匹配度更高的结构化的事件信息。下面,将分别描述在本申请实施例中,如何结合事件名和结构化的事件信息所属的正文信息,对上述S204获取到的与事件短语对应的结构化的事件信息做进一步地筛选。
在一种可能的场景中,在结合事件名对上述S204获取到的与事件短语对应的结构化的事件信息做进一步地筛选时,可以先分别获取事件短语中的事件名,以及上述S204获取到的与事件短语对应的结构化的事件信息中每一个结构化的事件信息中的事件名,并分别获取事件短语中的事件名与每一个结构化的事件信息中的事件名之间的第二匹配度,再根据多个第二匹配度,对上述S204得到的与事件短语对应的结构化的事件信息进行筛选,得到与事件短语对应的最终结构化的事件信息。
示例的,在该种可能的场景中,根据多个第二匹配度,对上述S204得到的与事件短语对应的结构化的事件信息进行筛选,得到与事件短语对应的最终结构化的事件信息时,可以通过两种方式实现,在一种方式中,可以根据多个第二匹配度的大小,按照从大到小的顺序,对多个第二匹配度进行排序;并将排序为前M个的第二匹配度对应的结构化的事件信息确定为与事件短语对应的最终结构化的事件信息。其中,M为正整数。在另一种可能的方式中,可以分别将多个第二匹配度分别与设置的匹配度阈值进行比较,将多个第二匹配度中,大于匹配度阈值的第二匹配度对应的结构化事件信息确定为与事件短语对应的最终结构化的事件信息。其中,匹配度阈值的大小可以根据实际需要进行设置,在此,对于匹配度阈值的取值,本申请实施例不做进一步地限制。
由此可见,在本申请实施例中,在获取到的与事件短语对应的结构化的事件信息后,还可以结合事件短语的事件名和与事件短语对应的结构化的事件信息中一个结构化的事件信息中的事件名之间的第二匹配度,对获取到的与事件短语对应的结构化的事件信息做进一步地筛选,得到与事件短语匹配度更高的结构化的事件信息,从而进一步提高了获取到的结构化的事件信息的准确度。
在另一种可能的场景中,在结合结构化的事件信息所属的正文信息对上述S204获取到的与事件短语对应的结构化的事件信息做进一步地筛选时,可以先分别获取上述S204获取到的与事件短语对应的结构化的事件信息中每一个结构化的事件信息所属的正文信息,并分别获取事件短语与每个结构化的事件信息所属的正文信息之间的语义相似度,再根据多个语义相似度,对上述S204得到的与事件短语对应的结构化的事件信息进行筛选,得到与事件短语对应的最终结构化的事件信息。
示例的,在该种可能的场景中,根据多个语义相似度,对上述S204得到的与事件短语对应的结构化的事件信息进行筛选,得到与事件短语对应的最终结构化的事件信息时,可以通过两种方式实现,在一种方式中,可以根据多个语义相似度的大小,按照从大到小的顺序,对多个语义相似度进行排序;并将排序为前P个的语义相似度对应的结构化的事件信息确定为与事件短语对应的最终结构化的事件信息。其中,P为正整数。在另一种可能的方式中,可以分别将多个语义相似度分别与设置的语义匹配度阈值进行比较,将多个语义相似度中,大于匹语义配度阈值的语义相似度对应的结构化事件信息确定为与事件短语对应的最终结构化的事件信息。其中,语义匹配度阈值的大小可以根据实际需要进行设置,在此,对于语义匹配度阈值的取值,本申请实施例不做进一步地限制。
由此可见,在本申请实施例中,在获取到的与事件短语对应的结构化的事件信息后,还可以结合事件短语与每个结构化的事件信息所属的正文信息之间的语义相似度对获取到的与事件短语对应的结构化的事件信息做进一步地筛选,得到与事件短语匹配度更高的结构化的事件信息,从而进一步提高了获取到的结构化的事件信息的准确度。
可以理解的是,在本申请实施例中,为了提高获取到的结构化的事件信息的准确度,可以通过结合事件名,或者,结合结构化的事件信息所属的正文信息对获取到的与事件短语对应的结构化的事件信息做进一步地筛选,可参见上述两种可能的实现方式,当然,也可以同时结合事件名和结合结构化的事件信息所属的正文信息对获取到的与事件短语对应的结构化的事件信息做进一步地筛选,即上述两种可能的实现方式可以互相结合,在结合时,其筛选方法与这两种可能的实现方式单独筛选的方法类似,在此,本申请实施例不再进行赘述。
实施例三
图3是根据本申请第三实施例提供的事件的搜索装置30的结构示意图,示例的,请参见图3所示,该事件的搜索装置30可以包括:
获取模块301,用于获取用户输入的搜索请求,搜索请求包括:事件短语。
获取模块301,还用于采用语义检索方式查询语义数据库,获取与事件短语相关联的多个结构化的事件信息;其中,语义数据库中包括多个事件各自对应的结构化的事件信息。
处理模块302,用于采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度。
处理模块302,还用于根据多个第一匹配度,从多个结构化的事件信息中,确定与事件短语对应的结构化的事件信息。
可选的,处理模块302,具体用于采用事件归一化判别模型,并行获取事件短语与每个结构化的事件信息之间的第一匹配度。
可选的,处理模块302,具体用于根据多个第一匹配度的大小,按照从大到小的顺序,对多个第一匹配度进行排序;并将排序为前N个的第一匹配度对应的结构化的事件信息确定为与事件短语对应的结构化的事件信息;其中,N为正整数。
可选的,处理模块302,具体用于将多个第一匹配度中,大于预设阈值的第一匹配度对应的结构化事件信息确定为与事件短语对应的结构化的事件信息。
可选的,获取模块301,还用于分别获取事件短语中的事件名,以及与事件短语对应的结构化的事件信息中每一个结构化的事件信息中的事件名。
处理模块302,还用于分别获取事件短语中的事件名与每一个结构化的事件信息中的事件名之间的第二匹配度。
处理模块302,还用于根据多个第二匹配度,对与事件短语对应的结构化的事件信息进行筛选,得到与事件短语对应的最终结构化的事件信息。
可选的,获取模块301,还用于获取与事件短语对应的结构化的事件信息中,每一个结构化的事件信息所属的正文信息。
处理模块302,还用于分别获取事件短语与每个结构化的事件信息所属的正文信息之间的语义相似度。
处理模块302,还用于根据多个语义相似度,对与事件短语对应的结构化的事件信息进行筛选,得到与事件短语对应的最终结构化的事件信息。
本申请实施例提供的事件的搜索装置30,可以执行上述任一实施例中的事件的搜索方法的技术方案,其实现原理以及有益效果与事件的搜索方法的实现原理及有益效果类似,可参见事件的搜索方法的实现原理及有益效果,此处不再进行赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图4所示,图4是根据本申请实施例的事件的搜索方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图4所示,该电子设备包括:一个或多个处理器401、存储器402,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图4中以一个处理器401为例。
存储器402即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的事件的搜索方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的事件的搜索方法。
存储器402作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的事件的搜索方法对应的程序指令/模块(例如,附图3所示的获取模块301和处理模块302)。处理器401通过运行存储在存储器402中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的事件的搜索方法。
存储器402可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据事件的搜索方法的电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器402可选包括相对于处理器401远程设置的存储器,这些远程存储器可以通过网络连接至事件的搜索方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
事件的搜索方法的电子设备还可以包括:输入装置403和输出装置404。处理器401、存储器402、输入装置403和输出装置404可以通过总线或者其他方式连接,图4中以通过总线连接为例。
输入装置403可接收输入的数字或字符信息,以及产生与事件的搜索方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置404可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,在接收到包括事件短语的搜索请求后,可以通过语义检索方式在预先建立的用于存储结构化的事件信息的语义数据库中查询与事件短语相关联的多个结构化的事件信息,实现了搜索事件短语对应的结构化的事件信息,并采用事件归一化判别模型,分别获取事件短语与每个结构化的事件信息之间的第一匹配度,根据第一匹配度确定与事件短语对应的结构化的事件信息,不仅实现了搜索事件短语对应的结构化的事件信息,而且,在一定程度上保证了获取到的结构化的事件信息的准确度。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (12)

1.一种事件的搜索方法,其特征在于,包括:
获取用户输入的搜索请求,所述搜索请求包括:事件短语;
采用语义检索方式查询语义数据库,获取与所述事件短语相关联的多个结构化的事件信息;其中,所述语义数据库中包括多个事件各自对应的结构化的事件信息;
采用事件归一化判别模型,分别获取所述事件短语与每个结构化的事件信息之间的第一匹配度;
根据多个所述第一匹配度,从所述多个结构化的事件信息中,确定与所述事件短语对应的第一结构化的事件信息;
获取与所述事件短语对应的第一结构化的事件信息中每一个结构化的事件信息所属的正文信息;
分别获取所述事件短语与每个第一结构化的事件信息所属的正文信息之间的语义相似度;
根据多个所述语义相似度,对与所述事件短语对应的第一结构化的事件信息进行筛选,得到与所述事件短语对应的第二结构化的事件信息。
2.根据权利要求1所述的方法,其特征在于,所述采用事件归一化判别模型,分别获取所述事件短语与每个结构化的事件信息之间的第一匹配度,包括:
采用所述事件归一化判别模型,并行获取所述事件短语与每个结构化的事件信息之间的第一匹配度。
3.根据权利要求1所述的方法,其特征在于,所述根据多个所述第一匹配度,从所述多个结构化的事件信息中,确定与所述事件短语对应的第一结构化的事件信息,包括:
根据多个所述第一匹配度的大小,按照从大到小的顺序,对多个所述第一匹配度进行排序;
将排序为前N个的第一匹配度对应的结构化的事件信息确定为与所述事件短语对应的第一结构化的事件信息;其中,N为正整数。
4.根据权利要求1所述的方法,其特征在于,所述根据多个所述第一匹配度,从所述多个结构化的事件信息中,确定与所述事件短语对应的第一结构化的事件信息,包括:
将多个所述第一匹配度中,大于预设阈值的第一匹配度对应的结构化事件信息确定为与所述事件短语对应的第一结构化的事件信息。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
分别获取所述事件短语中的事件名,以及与所述事件短语对应的第一结构化的事件信息中每一个结构化的事件信息中的事件名;
分别获取所述事件短语中的事件名与所述每一个结构化的事件信息中的事件名之间的第二匹配度;
根据多个第二匹配度,对与所述事件短语对应的第一结构化的事件信息进行筛选,得到与所述事件短语对应的第三结构化的事件信息。
6.一种事件的搜索装置,其特征在于,包括:
获取模块,用于获取用户输入的搜索请求,所述搜索请求包括:事件短语;
所述获取模块,还用于采用语义检索方式查询语义数据库,获取与所述事件短语相关联的多个结构化的事件信息;其中,所述语义数据库中包括多个事件各自对应的结构化的事件信息;
所述处理模块,用于采用事件归一化判别模型,分别获取所述事件短语与每个结构化的事件信息之间的第一匹配度;
所述处理模块,还用于根据多个所述第一匹配度,从所述多个结构化的事件信息中,确定与所述事件短语对应的第一结构化的事件信息;
所述获取模块,还用于获取与所述事件短语对应的第一结构化的事件信息中每一个结构化的事件信息所属的正文信息;
所述处理模块,还用于分别获取所述事件短语与每个第一结构化的事件信息所属的正文信息之间的语义相似度;
所述处理模块,还用于根据多个所述语义相似度,对与所述事件短语对应的第一结构化的事件信息进行筛选,得到与所述事件短语对应的第二结构化的事件信息。
7.根据权利要求6所述的装置,其特征在于,
所述处理模块,具体用于采用所述事件归一化判别模型,并行获取所述事件短语与每个结构化的事件信息之间的第一匹配度。
8.根据权利要求6所述的装置,其特征在于,
所述处理模块,具体用于根据多个所述第一匹配度的大小,按照从大到小的顺序,对多个所述第一匹配度进行排序;并将排序为前N个的第一匹配度对应的结构化的事件信息确定为与所述事件短语对应的第一结构化的事件信息;其中,N为正整数。
9.根据权利要求6所述的装置,其特征在于,
所述处理模块,具体用于将多个所述第一匹配度中,大于预设阈值的第一匹配度对应的结构化事件信息确定为与所述事件短语对应的第一结构化的事件信息。
10.根据权利要求6至9任一项所述的装置,其特征在于,
所述获取模块,还用于分别获取所述事件短语中的事件名,以及与所述事件短语对应的第一结构化的事件信息中每一个结构化的事件信息中的事件名;
所述处理模块,还用于分别获取所述事件短语中的事件名与所述每一个结构化的事件信息中的事件名之间的第二匹配度;
所述处理模块,还用于根据多个第二匹配度,对与所述事件短语对应的第一结构化的事件信息进行筛选,得到与所述事件短语对应的第三结构化的事件信息。
11.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述权利要求1-5中任一项所述的事件的搜索方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行上述权利要求1-5中任一项所述的事件的搜索方法。
CN202010199628.4A 2020-03-20 事件的搜索方法、装置和电子设备 Active CN111414531B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010199628.4A CN111414531B (zh) 2020-03-20 事件的搜索方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010199628.4A CN111414531B (zh) 2020-03-20 事件的搜索方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN111414531A CN111414531A (zh) 2020-07-14
CN111414531B true CN111414531B (zh) 2023-08-08

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350012A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地址匹配的方法和系统
CN103309886A (zh) * 2012-03-13 2013-09-18 阿里巴巴集团控股有限公司 一种基于交易平台的结构化信息搜索方法和装置
CN104462060A (zh) * 2014-12-03 2015-03-25 百度在线网络技术(北京)有限公司 通过计算机实现的计算文本相似度和搜索处理方法及装置
CN106959944A (zh) * 2017-02-14 2017-07-18 中国电子科技集团公司第二十八研究所 一种基于中文语法规则的事件提取方法和系统
CN108509547A (zh) * 2018-03-20 2018-09-07 中国长城科技集团股份有限公司 一种信息管理方法、信息管理系统及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350012A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地址匹配的方法和系统
CN103309886A (zh) * 2012-03-13 2013-09-18 阿里巴巴集团控股有限公司 一种基于交易平台的结构化信息搜索方法和装置
CN104462060A (zh) * 2014-12-03 2015-03-25 百度在线网络技术(北京)有限公司 通过计算机实现的计算文本相似度和搜索处理方法及装置
CN106959944A (zh) * 2017-02-14 2017-07-18 中国电子科技集团公司第二十八研究所 一种基于中文语法规则的事件提取方法和系统
CN108509547A (zh) * 2018-03-20 2018-09-07 中国长城科技集团股份有限公司 一种信息管理方法、信息管理系统及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨旸;杨书略;蔡圣暐;刘佳;李光滟.排序可验证的语义模糊可搜索加密方案.工程科学与技术.2017,(04), *

Similar Documents

Publication Publication Date Title
CN110517785B (zh) 相似病例的查找方法、装置及设备
CN111241282B (zh) 文本主题生成方法、装置及电子设备
CN111428049B (zh) 一种事件专题的生成方法、装置、设备和存储介质
CN110955764B (zh) 场景知识图谱的生成方法、人机对话方法以及相关设备
CN111488740B (zh) 一种因果关系的判别方法、装置、电子设备及存储介质
CN111522967B (zh) 知识图谱构建方法、装置、设备以及存储介质
CN111597433B (zh) 资源搜索方法、装置以及电子设备
CN110020422A (zh) 特征词的确定方法、装置和服务器
CN111949814A (zh) 搜索方法、装置、电子设备和存储介质
CN111460289B (zh) 新闻资讯的推送方法和装置
CN113553414B (zh) 智能对话方法、装置、电子设备和存储介质
CN111078878B (zh) 文本处理方法、装置、设备及计算机可读存储介质
CN111538815B (zh) 一种文本查询方法、装置、设备及存储介质
CN111984774B (zh) 搜索方法、装置、设备以及存储介质
CN112380847B (zh) 兴趣点处理方法、装置、电子设备及存储介质
CN111797216B (zh) 检索项改写方法、装置、设备以及存储介质
CN111782785B (zh) 自动问答方法、装置、设备以及存储介质
CN112417103A (zh) 用于检测敏感词的方法、装置、设备和存储介质
CN111090991A (zh) 场景纠错方法、装置、电子设备和存储介质
CN112328896B (zh) 用于输出信息的方法、装置、电子设备和介质
CN114444462A (zh) 模型训练方法及人机交互方法、装置
CN111414487B (zh) 事件主题的关联扩展方法、装置、设备及介质
CN111460257B (zh) 专题生成方法、装置、电子设备和存储介质
CN111339314B (zh) 一种三元组数据的生成方法、装置和电子设备
CN111666417B (zh) 生成同义词的方法、装置、电子设备以及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant