CN115544218A - 一种信息搜索方法、装置及存储介质 - Google Patents
一种信息搜索方法、装置及存储介质 Download PDFInfo
- Publication number
- CN115544218A CN115544218A CN202110739570.2A CN202110739570A CN115544218A CN 115544218 A CN115544218 A CN 115544218A CN 202110739570 A CN202110739570 A CN 202110739570A CN 115544218 A CN115544218 A CN 115544218A
- Authority
- CN
- China
- Prior art keywords
- entity
- information
- search
- intention
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种信息搜索方法、装置及存储介质,涉及数据处理技术领域,解决了无法准确识别用户的搜索意图,导致搜索结果准确率低的问题。该信息搜索方法包括:获取查询文本,并将查询文本输入到实体识别模型,识别查询文本中的每一实体,得到查询文本中的实体以及实体的内容,该实体识别模型至少用于基于预设的正则规则确定预设类型的实体对应的实体内容;根据得到的实体,确定查询文本的搜索意图;生成与搜索意图对应且包括实体的内容的查询语句;根据查询语句进行信息搜索,得到满足查询语句的信息。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种信息搜索方法、装置及存储介质。
背景技术
当用户搜索相关内容时,计算机设备通常是基于用户输入的搜索语句,识别用户的搜索意图,并根据该用户的搜索意图进行搜索,进而为用户推荐相关内容。但是,在搜索语句包括模糊的时空信息/格式类似的数字的场景中,现有技术难以准确地识别用户的搜索意图,导致搜索结果准确率较低,难以满足用户需求。
发明内容
本申请实施例提供一种信息搜索方法、装置及存储介质,用于解决无法准确识别用户的搜索意图,导致搜索结果准确率低的问题。
为达到上述目的,本申请的实施例采用如下技术方案:
第一方面,提供了一种信息搜索方法,该方法包括:在获取到查询文本后,将该查询文本输入到实体识别模型(该实体识别模型至少用于基于预设的正则规则确定预设类型的实体对应的实体内容),识别查询文本中的每一实体,以得到查询文本中的实体以及实体的内容;然后,根据得到的实体,确定查询文本的搜索意图,并生成与搜索意图对应、包括实体的内容的查询语句,这样,即可根据查询语句进行信息搜索,得到满足查询语句的信息。
正则规则通常用于检查一个字符串是否含有某种子串,或者从某个字符串中提取符合某个条件的子串。本申请中的正则规则能够识别出预设类型的实体的内容,如时空实体的内容、数字实体的内容。本申请中的实体识别模型至少用于基于预设的正则规则确定预设类型的实体对应的实体内容。因此,本申请提供的方案能够精准的识别出查询文本中预设类型的实体以及该类型实体的内容。由于识别出的实体的准确度较高,因此,后续根据识别出的实体确定出的搜索意图的准确度也较高。进而,在根据与搜索意图对应且包括实体的内容的查询语句进行信息搜索时,有效地提高了搜索结果的准确率。
结合第一方面,在一种可能的设计方式中,在上述实体识别模型包括正则识别模型的情况下,上述“识别查询文本中的每一实体,得到查询文本中的实体以及实体的内容”包括:对查询文本进行分词,获得分词结果;确定分词结果中与正则识别模型中正则规则匹配的目标分词;根据目标分词,利用正则规则识别并确定与目标分词对应的预设类型的实体的内容。
结合第一方面,在另一种可能的设计方式中,上述预设类型的实体包括时空实体,上述“根据目标分词,利用正则规则识别并确定与目标分词对应的预设类型的实体的内容”包括:根据正则规则对应的时空配置信息,将目标分词转换为对应的时空信息,时空信息为时空实体的内容。
结合第一方面,在另一种可能的设计方式中,上述预设类型的实体包括数字实体;上述“根据目标分词,利用正则规则识别并确定与目标分词对应的预设类型的实体的内容”包括:读取与正则规则匹配的数字格式类型库,确定目标分词属于目标数字格式类型;数字格式类型库包括多种数字格式类型;确定目标分词的内容为具备目标数字格式类型的数字信息,数字信息为数字实体的内容。
结合第一方面,在另一种可能的设计方式中,上述“根据得到的实体,确定查询文本的搜索意图”包括:统计得到的实体中每一类型的实体的分布,并根据分布确定搜索意图。
结合第一方面,在另一种可能的设计方式中,上述“根据得到的实体,确定查询文本的搜索意图”包括:将查询文本输入到意图识别模型,进行意图识别,得到第一搜索意图和第一搜索意图的置信度;统计得到的实体中每一类型的实体的分布,并根据分布确定第二搜索意图和第二搜索意图的置信度;将第一搜索意图和第二搜索意图中置信度满足预设条件的搜索意图作为搜索意图。
本申请利用意图识别模型初步确定出第一搜索意图,并根据确定出的每一类型的实体的分布确定出第二搜索意图,即采用两种不同的方式确定出第一搜索意图和第二搜索意图,还分别确定出这两种搜索意图的置信度,后续,根据置信度的数值大小从这两种搜索意图中确定出最终的搜索意图。这样从多个维度的角度出发确定出的搜索意图的准确度更高。
第二方面,本申请提供一种信息搜索装置。该信息搜索装置包括用于执行第一方面或第一方面中任一种可能的设计方式所述的方法的各个模块。
第三方面,本申请提供一种信息搜索装置,该信息搜索装置包括存储器和处理器。上述存储器和处理器耦合。该存储器用于存储计算机程序代码,该计算机程序代码包括计算机指令。当处理器执行该计算机指令时,信息搜索装置执行如第一方面及其任一种可能的设计方式所述的信息搜索方法。
第四方面,本申请提供一种芯片系统,该芯片系统应用于信息搜索装置;所述芯片系统包括一个或多个接口电路,以及一个或多个处理器。所述接口电路和所述处理器通过线路互联;所述接口电路用于从所述信息搜索装置的存储器接收信号,并向所述处理器发送所述信号,所述信号包括所述存储器中存储的计算机指令。当所述处理器执行所述计算机指令时,所述信息搜索装置执行如第一方面及其任一种可能的设计方式所述的信息搜索方法。
第五方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质包括计算机指令,当所述计算机指令在信息搜索装置上运行时,使得所述信息搜索装置执行如第一方面及其任一种可能的设计方式所述的信息搜索方法。
第六方面,本申请提供一种计算机程序产品,该计算机程序产品包括计算机指令,当所述计算机指令在信息搜索装置上运行时,使得所述信息搜索装置执行如第一方面及其任一种可能的设计方式所述的信息搜索方法。
本申请中第二方面到第六方面及其各种实现方式的具体描述,可以参考第一方面及其各种实现方式中的详细描述;并且,第二方面到第六方面及其各种实现方式的有益效果,可以参考第一方面及其各种实现方式中的有益效果分析,此处不再赘述。
本申请的这些方面或其他方面在以下的描述中会更加简明易懂。
附图说明
图1为现有技术中计算机设备响应用户输入的文本显示的界面;
图2为本申请实施例提供的信息搜索系统的结构示意图;
图3为本申请实施例中服务器的结构示意图一;
图4为本申请实施例中信息搜索装置的硬件结构示意图;
图5为本申请实施例提供的信息搜索方法的流程示意图一;
图6为本申请实施例提供的信息搜索方法的流程示意图二;
图7A为本申请实施例提供的信息搜索方法的流程示意图三;
图7B为本申请实施例提供的信息搜索方法的流程示意图四;
图8为本申请实施例中一种搜索显示界面的示意图;
图9为本申请实施例中另一种搜索显示界面的示意图;
图10为本申请实施例中信息搜索装置的一种结构示意图。
具体实施方式
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
此外,本申请实施例描述的网络架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着网络架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
通常,用户在提交自然语言表述的问题之后,计算机设备会利用各种自然语言处理技术去理解用户的搜索意图,然后根据用户的搜索意图将自然语言表述的文本分析成搜索引擎所需要的查询语句,将查询语句输入搜索引擎,并获取搜索引擎输出的相关信息,以及将相关信息反馈给用户。但是,在搜索语句包括模糊的时空信息/格式类似的数字的场景中,现有技术难以准确地识别用户的搜索意图,导致搜索结果准确率较低,难以满足用户需求。
例如:如图1中的(A)所示,用户于2021年6月24日在计算机设备显示的搜索框中输入搜索语句“昨天、A路口、女孩”。可以看出,用户的真实搜索意图是想要搜索2021年6月23日出现在A路口的女孩。现有技术中,计算机设备响应于用户点击的搜索操作,会显示如图1中的(B)显示的界面。该界面显示命名/内容包括有“昨天A路口女孩”的相关内容,或者呈现命名/内容包括有“昨天”、“A路口”、“女孩”等关键字的相关内容。可以看出,计算机设备最终呈现给用户的内容并不符合用户的真实需求。
基于此,本申请实施例提供一种信息搜索方法,利用实体识别模型准确地确定查询文本中的实体(包括预设类型,如时空类型、数字类型,的实体)以及实体的内容,并根据识别出的实体和查询文本确定搜索意图,以及生成与搜索意图对应且包括实体的内容的查询语句进行信息搜索,有效地提高了搜索结果的准确率。
本申请涉及到的实体是指客观存在并可相互区别的事务,包括具体的人、事、物、抽象的概念或联系等。实体的类型可以根据事务的类型确定,如时空类型、人物类型、车辆类型等。搜索意图可以表征查询文本对应的用户真实需求。
本申请实施例提供的信息搜索方法适用于信息搜索系统。图2示出了该信息搜索系统的结构。如图2所示,信息搜索系统包括终端20和服务器21。终端20和服务器21之间通过网络连接进行数据交互。
可选的,信息搜索系统还可以包括存储设备22,服务器21与存储设备22连接。在实际应用中,服务器21与存储设备22可以集成在一个计算机设备中,也可以位于相互独立的两个计算机设备中,本申请实施例对服务器21与存储设备22的位置关系不作任何限定。
对于信息搜索系统而言,其中下述情景:终端20可以运行服务器21关联的应用程序,基于该应用程序可以登录服务器21,从而与服务器21进行数据交互。具体的,终端20通过该应用程序向服务器21发送查询文本。服务器21接收查询文本,并根据查询文本从存储设备22中存储的数据中搜索对应信息。
上述应用程序可以是安装在终端20中具备信息搜索功能的嵌入式应用程序(即设备的系统应用),也可以是具备信息搜索功能的可下载应用程序。其中,嵌入式应用程序是作为终端20实现的一部分提供的应用程序。可下载应用程序是一个可以提供自己的因特网协议多媒体子系统(internet protocol multimedia subsystem,IMS)连接的应用程序,该可下载应用程序是可以预先安装在终端20中的应用或可以由用户下载并安装在终端20中的第三方应用。
终端20可以为任一具有信息搜索功能的设备。例如,该终端20可以为手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device,MID)、可穿戴设备(例如智能手表、智能手环)等,本申请实施例对此不作具体限定。该信息搜索功能可以为通过终端20信息搜索入口实现的信息搜索功能,也可以为目标对话界面提供的搜索功能,本申请实施例对此不作具体限定。这里的目标对话界面可以为终端20中安装的第三方应用程序中的对话界面,也可以为终端20中安装的第三方应用程序中的小程序或公众号中的目标对话界面,本申请实施例对此也不作具体限定。
服务器21在获取到查询文本后,根据该查询文本进行信息搜索。具体的,服务器21可以利用实体识别模型、意图识别模型等机器模型对查询文本进行实体识别和意图识别。本申请中的实体识别模型至少用于基于预设的正则规则确定预设类型的实体对应的实体内容,这样,如果查询文本中存在预设类型的实体,服务器21即可准确地确定出该实体的实体内容。在获取到查询文本的实体和每一实体的内容后,服务器21还可以根据确定出的实体确定查询文本的搜索意图,并生成与该搜索意图对应且包括实体的内容的查询语句。之后,服务器21根据生成的查询语句进行信息搜索,得到满足查询语句的信息。
具体的,服务器21可以从存储设备22中获取到预先配置的预设类型的实体的正则规则,以及正则规则对应的实体配置信息。这样,服务器21在获取到查询文本的实体后,可以根据该实体的类型获取相应的正则规则以及实体配置信息,并根据实体配置信息确定实体的内容。
示例性的,服务器21预先获取到了时空类型对应的正则规则以及时空配置信息。在服务器21获取到包括时空信息的查询文本后,服务器确定与该正则规则匹配的查询文本中的分词(简称为目标分词)。之后,服务器21根据时空配置信息,将目标分词转换为对应的时空信息,并根据该正则规则确定查询文本中时间信息的具体内容。
图3示出了该场景中上述服务器21的结构示意图。如图3所示,服务器21可以包括:实体识别模块210、意图识别模块211、查询语句管理模块212和信息搜索模块213。
实体识别模块210,用于对获取到的查询文本进行实体识别,确定查询文本中的实体以及实体的内容。后续,实体识别模块210该实体识别模块210中可以包括实体识别模型和正则识别模型。
这里的实体识别模型可以为Bert模型、Spacy模型、Span模型中的至少一个,可以用于识别非时空实体。正则识别模型可以用于识别时空实体,也可以用于识别具备固定格式的数字信息,如身份证号、电话号码。
意图识别模块211,用于根据实体识别模块210确定出的实体确定搜索意图,并将该搜索意图输入至查询语句管理模块212。
可选的,意图识别模块211可以采用下述实现方式I~实现方式III中任意一种可能的实现方式,确定搜索意图。当然,本申请实施例对意图识别模块211确定搜索意图的方式并不作具体限定。
实现方式I:意图识别模块211可以包括意图识别模型。意图识别模块211将查询语句输入到意图识别模型,得到搜索意图。
实现方式II:意图识别模块211可以统计实体识别模块210确定出的每一类型的实体的分布,并根据确定出的分布确定搜索意图。
实现方式III:意图识别模块211采用上述实现方式I确定出第一搜索意图以及该第一搜索意图的置信度,并采用上述实现方式II确定出第二搜索意图以及该第二搜索意图的置信度,然后,将第一搜索意图和第二搜索意图中置信度满足预设条件的搜索意图作为搜索意图。
查询语句管理模块212,用于在获取到意图识别模块211确定出的搜索意图后,生成与搜索意图对应、且包括实体的内容的查询语句,并向信息搜索模块213发送该查询语句。
信息搜索模块213,用于接收查询语句管理模块212输出的查询语句,确定该查询语句对应的搜索字段,根据该搜索字段进行信息搜索,以得到满足查询语句的信息。
对于信息搜索系统而言,除了上述情景外,还可能存在下述情景:终端20预先与服务器21进行数据交互,并将从服务器21获取到的数据存储于本地数据库中。具体的,终端20自身具备识别查询文本中实体和意图的功能;在确定出查询文本的实体和搜索意图后,终端20确定出与搜索意图对应且包括实体的内容的查询语句,并根据该查询语句从本地数据库中搜索与该查询语句匹配的信息。
这一情景中对查询文本的处理操作以及搜索操作均是在终端20执行的。终端20执行的步骤均与上一情景中服务器21执行的步骤相同,这里不再进行赘述。
可以看出,本申请实施例提供的信息搜索方法的执行主体可以是终端20,也可以是终端20中的通用中央处理单元(central processing unit,CPU),还可以是终端20中用于识别信息搜索的控制模块,还可以是终端20中用于信息搜索的客户端。此外,执行主体也可以是服务器21,也可以是服务器21中的CPU,还可以是服务器21中用于识别信息搜索的控制模块。不论本申请实施例中信息搜索方法的执行主体是上述哪一设备,这里统一采用信息搜索装置表征。
图4示出了本申请实施例中信息搜索装置的一种硬件结构。如图4所示,信息搜索装置包括处理器41、存储器42、通信器件43、总线44。处理器41、存储器42以及通信器件43之间可以通过总线44连接。
处理器41是信息搜索装置的控制中心,可以是一个CPU,也可以是其他通用处理器等。其中,通用处理器可以是微处理器或者是任何常规的处理器等。
作为一个示例,处理器41可以包括一个或多个CPU,例如图4中所示的CPU 0和CPU1。
存储器42可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
一种可能的实现方式中,存储器42可以独立于处理器41存在。存储器42可以通过总线44与处理器41相连接,用于存储数据、指令或者程序代码。处理器41调用并执行存储器42中存储的指令或程序代码时,能够实现本申请实施例提供的基于知识图谱的问答方法。
另一种可能的实现方式中,存储器42也可以和处理器41集成在一起。
通信器件43,用于信息搜索装置与其他设备(如终端、服务器等)通过通信网络连接,所述通信网络可以是以太网,无线接入网(radio access network,RAN),无线局域网(wireless local area networks,WLAN)等。通信器件43具体用于接收数据或发送数据,如本申请实施例中的“获取查询文本”等。
当信息搜索装置为计算设备(例如服务器)时,通信器件34可以是网络接口等。
当信息搜索装置为便携式设备(例如手机)时,通信器件34可以是天线、触摸屏、麦克风、扬声器等。触摸屏具体可以包括触控板和显示屏。
其中,触控板可采集便携式设备的用户在其上或附近的触摸事件(比如用户使用手指、触控笔等任何适合的物体在触控板上或在触控板附近的操作),并将采集到的触摸信息发送给其他器件(例如处理器41)。其中,用户在触控板附近的触摸事件可以称之为悬浮触控;悬浮触控可以是指,用户无需为了选择、移动或拖动目标(例如图标等)而直接接触触控板,而只需用户位于设备附近以便执行所想要的功能。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型来实现触控板。
显示屏可用于显示由用户输入的信息或提供给用户的信息以及便携式设备的各种菜单。可以采用液晶显示屏、有机发光二极管等形式来配置显示屏。触控板可以覆盖在显示屏之上,当触控板检测到在其上或附近的触摸事件后,传送给处理器41以确定触摸事件的类型,随后处理器41可以根据触摸事件的类型在显示屏上提供相应的视觉输出。
总线44,可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
需要指出的是,图4中示出的结构并不构成对该信息搜索装置的限定,除图4所示部件之外,该信息搜索装置可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合附图对本申请实施例提供的信息搜索方法进行描述。
本申请实施例提供的信息搜索方法可以应用于医疗、影视、购物、汽车、体育、监控等领域的搜索。本申请实施例主要以监控领域为例对搜索方法进行说明,其他领域对应的搜索方法相互参照即可。
如图5所示,本申请实施例提供的信息搜索方法包括如下步骤。
S501、信息搜索装置获取查询文本。
该查询文本可以为用户输入的待查询的问题。例如,该查询文本为“昨天有哪些女孩通过A路口”。
该查询文本也可以为用户输入的关键字或者或关键短语组成的文本。例如,该查询文本为“昨天、A路口、女孩”。
该查询文本还可以为对用户输入的待处理文件进行关键字识别后得到的关键字或关键短语组成的文本。
S502、信息搜索装置将查询文本输入到实体识别模型,识别查询文本中的每一实体,得到查询文本中的实体以及实体的内容。
本申请实施例中的实体识别模型至少用于基于预设的正则规则确定预设类型的实体对应的实体内容。
预设类型的实体可以为时空类型的实体(简称为时空实体)、与人相关的实体、与车相关的实体、数字类型的实体(简称为数字实体)等,本申请实施例对此不作具体限定。
本申请实施例中的实体识别模型可以包括正则识别模型和语义分析模型。正则识别模型用于识别预设类型的实体以及该实体的内容。语义分析模型用于识别除预设类型的实体以外的其他实体以及其他实体的内容。
可选的,信息搜索装置将查询文本输入到正则识别模型,利用正则识别模型对查询文本进行分词,以获得分词结果。后续,信息搜索装置确定分词结果中与正则识别模型中的正则规则(该正则规则与预设类型的实体对应)所匹配的目标分词,并根据目标分词,利用正则规则识别并确定与目标分词对应的预设类型的实体的内容。
例如,若预设类型的实体为时空实体,工作人员于2021年6月25日在计算机设备中输入“昨天、A路口、女孩”,则信息搜索装置利用正则识别模型可以识别出“时间:2021年6月24日00:00-23:59”,即时空实体的内容为2021年6月24日00:00-23:59。
可选的,信息搜索装置利用语义分析模型对除预设类型的实体以外的其他实体进行识别,得到其他实体的内容。这里的语义分析模型可以为Bert模型、Spacy模型、Span模型中的至少一个,当然,还可以为其他用于识别除预设类型的实体以外的其他实体的模型,本申请实施例对此不作具体限定。
本申请实施例涉及到的模型(如正则识别模型、语义分析模型)均可以为预先训练好的神经网络模型,具体可以为基于卷积和循环神经网络的实体识别模型。
若信息搜索装置利用不同类型的实体识别模型确定出实体的内容,则信息搜索装置需要将每一类型的实体识别模型确定出的实体的内容进行合并。若不同类型的实体识别模型确定出的实体的内容中存在重复的内容,则信息搜索装置还需要将重复的实体的内容进行移除处理。
S503、信息搜索装置根据得到的实体,确定查询文本的搜索意图。
可选的,信息搜索装置可以采用下述实现方式一或实现方式二确定查询文本的搜索意图。当然,信息搜索装置还可以采用其他方式确定查询文本的搜索意图,本申请实施例对此不作具体限定。
实现方式一:信息搜索装置可以统计得到的实体中每一类型的实体的分布,并根据分布确定搜索意图。
信息搜索装置可以先根据确定出的实体预先确定候选搜索意图,然后,统计每一类型的实体在每一候选搜索意图中的数量(该数量可以表征对应候选搜索意图的置信度),并根据数量从候选搜索意图中确定出与查询文本对应的搜索意图。
示例性的,若查询文本为“浙A12345、蓝牌车、轨迹”,信息搜索装置确定出候选搜索意图包括人物搜索意图和车辆搜索意图,并确定出该查询文本的实体与人物搜索意图中预设的实体类型匹配的实体的数量为2,人物搜索意图的置信度为40%,以及确定出在查询文本的实体与车辆搜索意图中预设的实体类型匹配的实体的数量为3,车辆搜索意图的置信度为60%。因为2小于3,或者因为40%小于60%,因此,信息搜索装置确定出与“浙A12345、蓝牌车、轨迹”对应的搜索意图是车辆搜索意图。
实现方式二:信息搜索装置将查询文本输入到意图识别模型,进行意图识别,得到第一搜索意图和第一搜索意图的置信度。信息搜索装置还统计得到的实体中每一类型的实体的分布,并根据分布确定第二搜索意图和第二搜索意图的置信度。最后,信息搜索装置将第一搜索意图和第二搜索意图中置信度满足预设条件的搜索意图作为搜索意图。
这里的意图识别模型可以为信息搜索装置预先根据需要获取训练样本,并根据获取到的训练样本对初始神经网络模型进行迭代训练后得到的,也可以是从别的设备获取到的其预先训练好的神经网络模型,本申请实施例对此不作具体限定。
例如,当查询文本为“浙A12345、蓝牌车、轨迹”时,信息搜索装置将该查询文本输入到意图识别模型,得到与该查询文本对应的第一搜索意图为人物搜索意图,且人物搜索意图的置信度为40%。这一场景可以理解为,将这种查询文本对应为人物搜索意图,适用于例如查询车主的场景。该查询文本对应的搜索意图可以根据意图识别模型的不同而不同,本申请实施例对此不作具体限定。
信息搜索装置确定第二搜索意图和第二搜索意图的置信度的方法可以参考上述实现方式一的描述,这里不再赘述。
实现方式二中信息搜索装置将第一搜索意图和第二搜索意图中置信度满足预设条件的搜索意图作为搜索意图。
示例性的,预设条件为将第一搜索意图和第二搜索意图中置信度最高的搜索意图确定为最终的搜索意图。结合上述示例,查询文本为“浙A12345、蓝牌车、轨迹”;第一搜索意图为人物搜索意图,且人物搜索意图的置信度为40%;第二搜索意图为车辆搜索意图,且车辆搜索意图的置信度为60%;信息搜索装置确定与“浙A12345、蓝牌车、轨迹”对应的搜索意图为车辆搜索意图。
在实际应用中,信息搜索装置可能会根据实体的分布确定出多个搜索意图。这种情况下,信息搜索装置能够得到多个第二搜索意图信息。若第一搜索意图和多个第二搜索意图中,置信度满足预设条件的搜索意图的数量不唯一,则该信息搜索装置最终能够确定出多个搜索意图。
例如,若查询为本为“围城”,信息搜索装置确定该查询文本属于下载意图、信息查找意图,且确定出这两意图的置信度均满足预设条件,则信息搜索装置确定该查询文本的搜索意图包括下载意图和信息查找意图。
S504、信息搜索装置生成与搜索意图对应、且包括实体的内容的查询语句。
可选的,信息搜索装置在获取到查询文本中实体的内容和搜索意图后,可以将实体的内容输入到与该搜索意图对应的查询语句生成模型,以得到查询语句。其中,查询语句生成模型可以为自注意机制和语言模型联合网络模型。
该查询语句可以为任一格式的查询语言,本申请实施例对该查询语句的类型不作具体限定。例如,该查询语句可以为结构化查询语句(structured query language,SQL)编程语言的查询语句。
例如,查询文本的实体的内容为“2021年6月24日00:00-23:59”、“A路口”、“女”,搜索意图为“人”,信息搜索装置中存储的“A路口”的标识为a,信息搜索装置生成的查询语句为:select*from database where 2021年6月24日00:00-23:59and A路口and ID a。其中,database表示数据库,该数据库为与信息搜索装置连接的数据库,可以根据实际需求确定。如,在视频监控领域,这一数据库通常是用于存储抓拍数据的数据库。
又可选的,信息搜索装置中预先存储有语言模版库,该语言模版库包括各个类型的意图对应的语言模版。在获取到查询语句中每一实体的内容和搜索意图后,信息搜索装置读取语言模版库,确定与搜索意图对应的目标语言模版。随后,将实体的内容写入目标语言模版,以生成查询语句。
在本申请实施例中,语言模版库是开发人员预设的。语言模版库包括多个语句,每个语句可以由查询语言和模板部分构成。例如,查询身高的语句为:select y fromdatabase where<{人物实体}x>and<{身高实体}y>,其中,select y from database where<x>and<y>为语言部分,{人物实体}和{身高实体}为模板部分。
S505、信息搜索装置根据查询语句进行信息搜索,得到满足查询语句的信息。
本申请中的实体识别模型至少用于基于预设的正则规则确定预设类型的实体对应的实体内容。因此,本申请提供的方案能够精准的识别出查询文本中预设类型的实体以及该类型实体的内容。由于识别出的实体的准确度较高,因此,后续根据识别出的实体和查询文本确定出的搜索意图的准确度也较高。进而,在根据与搜索意图对应且包括实体的内容的查询语句进行信息搜索时,有效地提高了搜索结果的准确率。
结合上述图5,如图6所示,上述S502可以包括:
S5021、信息搜索装置对查询文本进行分词,获得分词结果。
S5022、信息搜索装置确定分词结果中与正则识别模型中的正则规则匹配的目标分词。
S5023、信息搜索装置根据目标分词,利用正则规则识别并确定与目标分词对应的预设类型的实体的内容。
正则规则通常是描述一种字符串匹配的模式,用于检查一个字符串是否含有某种子串,或者从某个字符串中提取符合某个条件的子串。本申请实施例中的正则规则可以是一种特定的、用于识别预设类型的实体(即事务)的正则规则。该预设类型可以为模糊的时间,也可以为具备固定格式的数字,如身份证号。
正则规则可以用正则表达式定义。正则表达式可以视为由普通字符和元字符组成的文字模板。普通字符可以理解为所有未显式指定为元字符的打印和非打印字符组成,可以包括所有的大写或小写字母、数字、标点符号、汉字等。元字符可以理解为具有特殊意义的字符。例如,“$”字符可以匹配输入字符串的结尾位置,“\”可以将下一个字符标记为特殊字符、原义字符、向后引用或转义字符,“^”可以匹配输入字符串的开始位置,“丨”可以表示“或”逻辑关系。
在一个示例中,正则规则[\d{4}年]可以用于识别4位数字的年份的字符串,例如:“2021年”。
在另一个示例中,正则规则[(\d丨10丨11丨12)月]可以用于识别数字加月份的字符串,例如:“8月”。
针对中文识别,还可以在数字表示时间基础上,增加包括有汉字的正则规则。例如:将数字替换为“一”、“二”、“壹”、“贰”等的正则规则,用于识别二零二一年等类似表述的时间。针对有歧义的字符串,例如,“8号”可以为口语中的8日,也可以为8号球员,可以在正则规则中增加一些限定,不对单独的xx号进行判断,例如仅识别“xx月8号”、或“xx号上午”等。
在另一个示例中,正则规则[(明丨大?后丨大?前)天]可以用于识别“明天”、“后天”、“大后天”、“前天”和/或“大前天”。其中,“?”表示匹配前面的字符串零次或一次。
在另一个示例中,正则规则[每(一?年|一?月|一?日|一?天|一?周|一?时|一?刻|一?分|一?秒)]可以用于识别每年、每月、每分、每一秒、每一刻等类似表述的时间。
在另一个示例中,正则规则[几(十|百|千|万)?个?小时]可以用于识别几个小时、几小时、几十小时、几百个小时等类似表述的时间。
针对节假日时间,朝代时间、模糊时间、时间段及其他时间等,可以查阅世界各地常见的节假日和中国朝代以及其他时间,按照上述相同的方法编写正则规则来识别,本申请实施例在此不再赘述。
若预设类型的实体包括时空实体,则信息搜索装置根据正则规则对应的时空配置信息,将目标分词转换为对应的时空信息。例如,若查询文本为“昨天出现在A路口的女孩有哪些”的输入时间为2021年6月24日,则查询文本中的目标分词为“昨天”,信息搜索装置可以根据正则规则[(昨丨大?后丨大?前)天]对应的时空配置信息,将目标分词“昨天”转换为“2021年6月23日”。
若预设类型的实体包括数字实体,则信息搜索装置读取与正则规则匹配的数字格式类型库(该数字格式类型库包括多种数字格式类型),确定目标分词属于目标数字格式类型,并确定目标分词的内容为具备目标数字格式类型的数字信息。例如,若查询文本为“141181abcdefhjklmn、女孩”,则查询文本中的目标分词为“141181abcdefhjklmn”,信息搜索装置读取数字格式类型库,确定该目标分词与数字格式类型库中用于表征身份证号码的数字的段位匹配,则确定目标分析将目标分词“141181abcdefhjklmn”为身份证号码,内容为141181abcdefhjklmn。
可选的,结合上述图5,如图7A所示,上述S503可以包括:
S5031、信息搜索装置将查询文本输入到意图识别模型,进行意图识别,得到第一搜索意图和第一搜索意图的置信度。
S5032、信息搜索装置统计得到的实体中每一类型的实体的分布,并根据分布确定第二搜索意图和第二搜索意图的置信度。
S5033、信息搜索装置将第一搜索意图和第二搜索意图中置信度满足预设条件的搜索意图作为搜索意图。
可选的,结合上述图5,如图7B所示,上述S503可以包括:
S5034、信息搜索装置统计得到的实体中每一类型的实体的分布,并根据分布确定搜索意图。
下面结合具体示例对本申请实施例提供的信息搜索方法进行说明。
在视频监控场景的一个示例中,如图8中的(A)所示,工作人员于2021年6月25日在计算机设备显示的搜索框中输入查询文本“昨天A路口女孩”。采用本申请实施例提供的信息搜索方法确定与所述查询文本对应的信息后,计算机设备在获取到该信息后,显示如图8中的(B)显示的界面。图8中的(B)所示的界面包括在2021年6月24日、A路口抓拍到的女孩的信息:用户MM和用户JJ的信息。可以看出,图8中的(B)所示的界面显示的内容准确地反映了工作人员的搜索意图。这样,工作人员即可根据该界面显示的内容迅速获取到自己想要搜索的内容。
在视频监控场景的另一个示例中,如图9中的(A)所示,工作人员于2021年6月25日在计算机设备显示的文本输入的界面中上传了文档1,该文档1的内容不存在固定格式,具体内容为“昨天在A路口出现了一名女孩,行走较慢”。计算机设备对文档1中的内容进行关键字识别,之后可以显示识别到的关键字,用于为工作人员提供选择。如图9中的(B)所示,计算机设备显示识别到的5条信息:“地址:A路口”、“抓拍时间:昨天”、“其他:行走”、“性别:女”。在工作人员对着5条信息进行选择后,计算机设备将工作人员选择的信息作为查询文本,并采用本申请实施例提供的信息搜索方法确定与所述查询文本对应的信息。计算机设备在获取到搜索结果后,显示如图9中的(C)显示的界面。图9中的(C)与上述图8中的(B)所示的界面相同,这里不再描述。可以看出,对于工作人员直接上传一个内容不具备固定格式的文档的场景,本申请实施例提供的信息搜索方法依旧能够准确地反映工作人员的搜索意图。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例还提供一种信息搜索装置。如图10所示,为本申请实施例提供的一种信息搜索装置10的结构示意图。信息搜索装置10用于执行图5-图7B中任一附图所示的信息搜索方法。信息搜索装置10可以包括获取单元101、确定单元102、生成单元103以及搜索单元104。
获取单元101,用于获取查询文本。例如,结合图5,获取单元101可以用于执行S501。确定单元102,用于将获取单元101获取到的查询文本输入到实体识别模型,识别查询文本中的每一实体,得到查询文本中的实体以及实体的内容;实体识别模型至少用于基于预设的正则规则确定预设类型的实体对应的实体内容;以及用于根据得到的实体,确定查询文本的搜索意图。例如,结合图5,确定单元102可以用于执行S502和S503。生成单元103,用于生成与确定单元102确定出的搜索意图对应的查询语句,查询语句包括实体的内容。例如,结合图5,生成单元103以用于执行S504。搜索单元104,用于根据生成单元103生成的查询语句进行信息搜索,得到满足查询语句的信息。例如,结合图5,搜索单元104可以用于执行S505。
可选的,实体识别模型包括正则识别模型,确定单元102具体用于:对查询文本进行分词,获得分词结果;确定分词结果中与正则识别模型中正则规则匹配的目标分词;根据目标分词,利用正则规则识别并确定与目标分词对应的预设类型的实体的内容。
可选的,预设类型的实体包括时空实体;确定单元102具体用于:根据正则规则对应的时空配置信息,将目标分词转换为对应的时空信息,时空信息为时空实体的内容。
可选的,预设类型的实体包括数字实体;确定单元102具体用于:读取与正则规则匹配的数字格式类型库,确定目标分词属于目标数字格式类型;数字格式类型库包括多种数字格式类型;确定目标分词的内容为具备目标数字格式类型的数字信息,数字信息为数字实体的内容。
可选的,确定单元102具体用于:统计得到的实体中每一类型的实体的分布,并根据分布确定搜索意图。
可选的,确定单元102具体用于:将查询文本输入到意图识别模型,进行意图识别,得到第一搜索意图和第一搜索意图的置信度;统计得到的实体中每一类型的实体的分布,并根据分布确定第二搜索意图和第二搜索意图的置信度;将第一搜索意图和第二搜索意图中置信度满足预设条件的搜索意图作为搜索意图。
当然,本申请实施例提供的信息搜索装置10包括但不限于上述模块。
在实际实现时,确定单元102、生成单元103以及搜索单元104可以由图4所示的处理器41调用存储器42中的程序代码来实现。其具体的执行过程可参考图5-图7B中任一附图所示的信息搜索方法部分的描述,这里不再赘述。
本申请另一实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机指令,当计算机指令在信息搜索装置上运行时,使得信息搜索装置执行上述方法实施例所示的方法流程中信息搜索装置执行的各个步骤。
本申请另一实施例还提供一种芯片系统,该芯片系统应用于信息搜索装置。所述芯片系统包括一个或多个接口电路,以及一个或多个处理器。接口电路和处理器通过线路互联。接口电路用于从信息搜索装置的存储器接收信号,并向处理器发送所述信号,所述信号包括所述存储器中存储的计算机指令。当处理器执行计算机指令时,信息搜索装置执行上述方法实施例所示的方法流程中信息搜索装置执行的各个步骤。
在本申请另一实施例中,还提供一种计算机程序产品,该计算机程序产品包括指令,当指令在信息搜索装置上运行时,使得信息搜索装置执行上述方法实施例所示的方法流程中信息搜索装置执行的各个步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
以上所述,仅为本申请的具体实施方式。熟悉本技术领域的技术人员根据本申请提供的具体实施方式,可想到变化或替换,都应涵盖在本申请的保护范围之内。
Claims (10)
1.一种信息搜索方法,其特征在于,包括:
获取查询文本;
将所述查询文本输入到实体识别模型,识别所述查询文本中的每一实体,得到所述查询文本中的实体以及所述实体的内容;所述实体识别模型至少用于基于预设的正则规则确定预设类型的实体对应的实体内容;
根据得到的实体,确定所述查询文本的搜索意图;
生成与所述搜索意图对应的查询语句,所述查询语句包括所述实体的内容;
根据所述查询语句进行信息搜索,得到满足所述查询语句的信息。
2.根据权利要求1所述的信息搜索方法,其特征在于,所述实体识别模型包括正则识别模型,所述识别所述查询文本中的每一实体,得到所述查询文本中的实体以及所述实体的内容,包括:
对所述查询文本进行分词,获得分词结果;
确定所述分词结果中与所述正则识别模型中的所述正则规则匹配的目标分词;
根据所述目标分词,利用所述正则规则识别并确定与所述目标分词对应的所述预设类型的实体的内容。
3.根据权利要求2所述的信息搜索方法,其特征在于,所述预设类型的实体包括时空实体;所述根据所述目标分词,利用所述正则规则识别并确定与所述目标分词对应的所述预设类型的实体的内容,包括:
根据所述正则规则对应的时空配置信息,将所述目标分词转换为对应的时空信息,所述时空信息为所述时空实体的内容。
4.根据权利要求2所述的信息搜索方法,其特征在于,所述预设类型的实体包括数字实体;所述根据所述目标分词,利用所述正则规则识别并确定与所述目标分词对应的所述预设类型的实体的内容,包括:
读取与所述正则规则匹配的数字格式类型库,确定所述目标分词属于目标数字格式类型;所述数字格式类型库包括多种数字格式类型;
确定所述目标分词的内容为具备所述目标数字格式类型的数字信息,所述数字信息为所述数字实体的内容。
5.根据权利要求1-4中任意一项所述的信息搜索方法,其特征在于,所述根据得到的实体,确定所述查询文本的搜索意图,包括:
统计所述得到的实体中每一类型的实体的分布,并根据所述分布确定所述搜索意图。
6.根据权利要求1-4中任意一项所述的信息搜索方法,其特征在于,所述根据得到的实体,确定所述查询文本的搜索意图,包括:
将所述查询文本输入到意图识别模型,进行意图识别,得到第一搜索意图和所述第一搜索意图的置信度;
统计所述得到的实体中每一类型的实体的分布,并根据所述分布确定第二搜索意图和所述第二搜索意图的置信度;
将所述第一搜索意图和所述第二搜索意图中置信度满足预设条件的搜索意图作为所述搜索意图。
7.一种信息搜索装置,其特征在于,包括:
获取单元,用于获取查询文本;
确定单元,用于将所述获取单元获取到的所述查询文本输入到实体识别模型,识别所述查询文本中的每一实体,得到所述查询文本中的实体以及所述实体的内容;所述实体识别模型至少用于基于预设的正则规则确定预设类型的实体对应的实体内容;以及用于根据得到的实体,确定所述查询文本的搜索意图;
生成单元,用于生成与所述确定单元确定出的所述搜索意图对应的查询语句,所述查询语句包括所述实体的内容;
搜索单元,用于根据所述生成单元生成的所述查询语句进行信息搜索,得到满足所述查询语句的信息。
8.根据权利要求7所述的信息搜索装置,其特征在于,
所述实体识别模型包括正则识别模型,所述确定单元具体用于:对所述查询文本进行分词,获得分词结果;确定所述分词结果中与所述正则识别模型中所述正则规则匹配的目标分词;根据所述目标分词,利用所述正则规则识别并确定与所述目标分词对应的所述预设类型的实体的内容;
所述预设类型的实体包括时空实体;所述确定单元具体用于:根据所述正则规则对应的时空配置信息,将所述目标分词转换为对应的时空信息,所述时空信息为所述时空实体的内容;
所述预设类型的实体包括数字实体;所述确定单元具体用于:读取与所述正则规则匹配的数字格式类型库,确定所述目标分词属于目标数字格式类型;所述数字格式类型库包括多种数字格式类型;确定所述目标分词的内容为具备所述目标数字格式类型的数字信息,所述数字信息为所述数字实体的内容;
所述确定单元具体用于:统计所述得到的实体中每一类型的实体的分布,并根据所述分布确定所述搜索意图;
所述确定单元具体用于:将所述查询文本输入到意图识别模型,进行意图识别,得到第一搜索意图和所述第一搜索意图的置信度;统计所述得到的实体中每一类型的实体的分布,并根据所述分布确定第二搜索意图和所述第二搜索意图的置信度;将所述第一搜索意图和所述第二搜索意图中置信度满足预设条件的搜索意图作为所述搜索意图。
9.一种信息搜索装置,其特征在于,所述信息搜索装置包括处理器和存储器;所述处理器和所述存储器耦合;其中,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述处理器执行所述计算机指令时,所述信息搜索装置执行如权利要求1-6任意一项所述的信息搜索方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机指令,当所述计算机指令在信息搜索装置上运行时,所述信息搜索装置执行如权利要求1-6任意一项所述的信息搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110739570.2A CN115544218A (zh) | 2021-06-30 | 2021-06-30 | 一种信息搜索方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110739570.2A CN115544218A (zh) | 2021-06-30 | 2021-06-30 | 一种信息搜索方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115544218A true CN115544218A (zh) | 2022-12-30 |
Family
ID=84716936
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110739570.2A Pending CN115544218A (zh) | 2021-06-30 | 2021-06-30 | 一种信息搜索方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115544218A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117271851A (zh) * | 2023-11-22 | 2023-12-22 | 北京小米移动软件有限公司 | 垂类搜索方法及装置、搜索系统、存储介质 |
-
2021
- 2021-06-30 CN CN202110739570.2A patent/CN115544218A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117271851A (zh) * | 2023-11-22 | 2023-12-22 | 北京小米移动软件有限公司 | 垂类搜索方法及装置、搜索系统、存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020237856A1 (zh) | 基于知识图谱的智能问答方法、装置及计算机存储介质 | |
CN112329964B (zh) | 用于推送信息的方法、装置、设备以及存储介质 | |
WO2020108063A1 (zh) | 特征词的确定方法、装置和服务器 | |
US11275906B2 (en) | Natural language text conversion and method therefor | |
US11172040B2 (en) | Method and apparatus for pushing information | |
EP4109295A1 (en) | Knowledge graph-based question answering method and apparatus, computer device, and medium | |
CN111274365A (zh) | 基于语义理解的智能问诊方法、装置、存储介质及服务器 | |
CN111813905B (zh) | 语料生成方法、装置、计算机设备及存储介质 | |
CN105550206B (zh) | 结构化查询语句的版本控制方法及装置 | |
WO2022222943A1 (zh) | 科室推荐方法、装置、电子设备及存储介质 | |
CN112885478B (zh) | 医疗文献的检索方法、装置、电子设备及存储介质 | |
US11763393B2 (en) | Machine-learning driven real-time data analysis | |
US11176126B2 (en) | Generating a reliable response to a query | |
US11321530B2 (en) | Interpreting a meaning of a word string | |
US20180067986A1 (en) | Database model with improved storage and search string generation techniques | |
CN113051362A (zh) | 数据的查询方法、装置和服务器 | |
CN111931488A (zh) | 用于验证判断结果准确性的方法、装置、电子设备及介质 | |
CN111459977B (zh) | 自然语言查询的转换 | |
CN114141384A (zh) | 用于检索医学数据的方法、设备和介质 | |
CN113392205A (zh) | 用户画像构建方法、装置、设备及存储介质 | |
CN115544218A (zh) | 一种信息搜索方法、装置及存储介质 | |
CN111403011B (zh) | 挂号科室推送方法、装置、系统、电子设备及存储介质 | |
US20230359817A1 (en) | Identifying utilization of intellectual property | |
US11314793B2 (en) | Query processing | |
EP4174795A1 (en) | Multiple input machine learning framework for anomaly detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |