CN116013296B - 基于计算机自然语言处理的搜索方法 - Google Patents

基于计算机自然语言处理的搜索方法 Download PDF

Info

Publication number
CN116013296B
CN116013296B CN202310314342.XA CN202310314342A CN116013296B CN 116013296 B CN116013296 B CN 116013296B CN 202310314342 A CN202310314342 A CN 202310314342A CN 116013296 B CN116013296 B CN 116013296B
Authority
CN
China
Prior art keywords
target
document
user
supplementary
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310314342.XA
Other languages
English (en)
Other versions
CN116013296A (zh
Inventor
谷泓杰
茅仁伟
胡鹏飞
陈可
王玲
何正旭
俞佳莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd filed Critical Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd
Priority to CN202310314342.XA priority Critical patent/CN116013296B/zh
Publication of CN116013296A publication Critical patent/CN116013296A/zh
Application granted granted Critical
Publication of CN116013296B publication Critical patent/CN116013296B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提供一种基于计算机自然语言处理的搜索方法,包括:采集用户音频中的搜索关键词;提取开启位置词中的位置关键词填充至第一位置开启语句相应的槽位处,得到第二位置开启语句;提取文档名称中的名称关键词填充至第一文档开启语句相应的槽位处,得到第二文档开启语句;确定第二位置开启语句的第一位置目标,以及第二文档开启语句的第一文档目标,若第一位置目标和第一文档目标相对应,则控制数字化文件柜将与第一位置目标对应的门体打开;接收用户输入的第二位置目标或第二文档目标,根据第一位置目标与第二文档目标、或第二位置目标与第一文档目标,将相应的第一位置目标或第二位置目标对应的门体打开。

Description

基于计算机自然语言处理的搜索方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于计算机自然语言处理的搜索方法。
背景技术
文件柜是放置文件、资料等的柜子。一般使用在办公室、档案室、资料室、存储室或个人书房等。随着电子时代的到来,文件柜也开始步入了电子智能化道路。
现有技术中,电子化文件柜可以在文件存储后对文件进行位置记忆,用户在搜寻文件时,需要在电子化文件柜上输入文字信息,来打开对应的存储格,取出所需的文件。
然而,现有技术中,用户无法与电子化文件柜采用语音交互的方式搜寻文件,也无法结合音频交互的方式对用户进行验证,导致用户在通过文件柜取出相应的文件时操作复杂。
发明内容
本发明实施例提供一种基于计算机自然语言处理的搜索方法,用户可以与电子化文件柜采用语音交互的方式搜寻文件,并结合用户主动输入的位置开启语句和文档开启语句进行组合验证,在位置开启语句和文档开启语句无法通过验证时,则在对用户的音色进行验证后,通过语音交互方式协助用户准确快速的找到所需文件,具有验证简单、操作效率高的优势。
本发明实施例的第一方面,提供一种基于计算机自然语言处理的搜索方法,包括:
S1,在判断用户输入唤醒词后,采集用户音频中的搜索关键词;
S2,若判断所述搜索关键词为开启位置词,则调取与开启位置词相对应的第一位置开启语句,提取所述开启位置词中的位置关键词填充至所述第一位置开启语句相应的槽位处,得到第二位置开启语句;
S3,若判断所述搜索关键词为文档名称,则调取与文档名称相对应的第一文档开启语句,提取所述文档名称中的名称关键词填充至所述第一文档开启语句相应的槽位处,得到第二文档开启语句;
S4,确定所述第二位置开启语句的第一位置目标,以及第二文档开启语句的第一文档目标,若所述第一位置目标和第一文档目标相对应,则用户通过数字化文件柜的验证,控制数字化文件柜将与第一位置目标对应的门体打开;
S5,若所述第一位置目标和第一文档目标不对应,则提取所述用户音频中的音色信息,若所述音色信息满足预设要求,则输出补充提醒指令,接收用户输入的第二位置目标或第二文档目标,根据所述第一位置目标与第二文档目标、或第二位置目标与第一文档目标,将相应的第一位置目标或第二位置目标对应的门体打开;
S6,若所述音色信息不满足预设要求,则提醒用户通过手动方式与数字化文件柜交互。
可选地,在第一方面的一种可能实现方式中,所述S2包括:
接收预先设置的位置子词,所述位置子词为行、列、排中的任意一种或多种;
若判断搜索关键词存在位置子词,则判断所述搜索关键词为开启位置词,调取与开启位置词相对应的第一位置开启语句;
根据所述位置子词确定第一位置开启语句中相对应的槽位,提取开启位置词中位置子词前部的数量子词,将所述数量子词填充至与位置子词相对应的槽位内,得到第二位置开启语句。
可选地,在第一方面的一种可能实现方式中,还包括:
若判断所述第一位置开启语句中存在部分未填充的槽位,则根据所述用户音频中的音色信息获取相对应的历史操作记录,所述历史操作记录具有每个时刻相应用户对历史位置目标的开启信息;
提取第一位置开启语句中已填充的槽位,将所述已填充的槽位与所有的历史位置目标比对,将包含已填充的槽位内数量子词的历史位置目标作为第三位置目标;
基于所述第三位置目标生成问询语句的问询内容,根据所述问询语句与用户交互,确定一个第三位置目标为第一位置目标。
可选地,在第一方面的一种可能实现方式中,所述基于所述第三位置目标生成问询语句的问询内容,根据所述问询语句与用户交互,确定一个第三位置目标为第一位置目标,包括:
根据所述第三位置目标的数量在初始化问询语句中建立相对应的槽位,将第三位置目标分别填充至初始化问询语句的槽位内,得到用于问询的问询语句;
对所述问询语句播放后,采集用户的问询补充内容,若判断所述问询补充内容中的数量子词与第三位置目标内的数量子词完全对应,则将完全对应的第三位置目标作为第一位置目标。
可选地,在第一方面的一种可能实现方式中,所述S3包括:
接收预先设置的文件子词,所述文件子词为合同、简介、扫描件、图片、书中的任意一种或多种;
若判断搜索关键词存在文件子词,则判断所述搜索关键词为文档名称,调取与文档名称相对应的第一文档开启语句;
根据所述文件子词确定第一文档开启语句中相对应的槽位,提取文档名称中文件子词前部的名称子词,将所述名称子词填充至与文件子词相对应的槽位内,得到第二文档开启语句。
可选地,在第一方面的一种可能实现方式中,所述S4包括:
获取数字化文件柜预先配置的对应表,所述对应表中具有柜体的预设位置和预设文档的对应关系;
将所述第一位置目标与对应表比对,确定与第一位置目标对应的预设文档,若所确定的预设文档与第一文档目标相对应,则判断第一位置目标和第一文档目标相对应,此时用户通过数字化文件柜的验证;
控制数字化文件柜将与第一位置目标对应的门体打开。
可选地,在第一方面的一种可能实现方式中,所述S5包括:
若所述第一位置目标和第一文档目标不对应,则提取所述用户音频中的音色信息,若所述音色信息满足预设要求,则判断用户为白名单用户;
将所述第一位置目标、第一文档目标分别与对应表比对,确定与第一位置目标对应的第一补充文档或与第一位置目标对应的第一补充位置;
对所述第一位置目标和第一补充文档组合得到第一组合,或将所述第一文档目标与第一补充位置组合得到第二组合,将所述第一组合和/或第二组合作为补充提醒指令输出;
采集白名单用户的补充音频,提取所述补充音频中的第一补充文档或第一补充位置,将第一补充文档作为第二文档目标,或将第一补充位置作为第二位置目标;
若提取到第二文档目标,则对相应的第一位置目标对应的门体打开;
若提取到第二位置目标,则对相应的第二位置目标对应的门体打开。
可选地,在第一方面的一种可能实现方式中,还包括:
对每个白名单用户在输出补充提醒指令后的补充音频进行归类,得到每个白名单用户的第一音频集合和第二音频集合,所述第一音频集合中的元素为相应的补充音频具有第二文档目标,所述第二音频集合中的元素为相应的补充音频具有第二位置目标;
根据所述第一音频集合中的元素的第一数量、第二音频集合中的元素的第二数量进行计算得到总数量;
若所述总数量大于等于预设数量,则根据所述第一数量、第二数量以及总数量进行计算,得到文档补充比例系数和位置补充比例系数;
若白名单用户的文档补充比例系数大于第一预设系数,则对白名单用户添加文档主动推荐标签;
若白名单用户的位置补充比例系数大于第一预设系数,则对白名单用户添加位置主动推荐标签;
通过以下公式计算文档补充比例系数和位置补充比例系数,
Figure SMS_1
其中,
Figure SMS_2
为总数量,/>
Figure SMS_3
为第一数量,/>
Figure SMS_4
为第二数量,/>
Figure SMS_5
为预设数量,/>
Figure SMS_6
为文档补充比例系数,/>
Figure SMS_7
为位置补充比例系数。
可选地,在第一方面的一种可能实现方式中,还包括:
若所述第一位置目标和第一文档目标不对应,则提取白名单用户添加的文档主动推荐标签或位置主动推荐标签;
根据所述文档主动推荐标签或位置主动推荐标签生成主动推荐语句,对所述主动推荐语句进行播放;
在对主动推荐语句播放后,若白名单用户音频中能够采集到预设关键词,则将第一位置目标所对应的门体打开,或将第一文档目标对应的第二位置目标打开。
可选地,在第一方面的一种可能实现方式中,所述根据所述文档主动推荐标签或位置主动推荐标签生成主动推荐语句,对所述主动推荐语句进行播放,包括:
若判断白名单用户具有文档主动推荐标签,则确定与第一位置目标对应的第二文档目标,根据所述第一位置目标、第二文档目标得到相对应的主动推荐语句;
若判断白名单用户具有位置主动推荐标签,则确定与第一文档目标对应的第二位置目标,根据所述第一文档目标、第二位置目标得到相对应的主动推荐语句。
有益效果:1、本方案可以采集用户的音频信息,对音频信息进行解析,得到搜索关键词,对相应的第一位置开启语句和第一文档开启语句进行填充处理,得到第二位置开启语句和第二文档开启语句,最后得到第一位置目标和第一文档目标,只有第一位置目标和第一文档目标相对应时,相应的用户才能够算是通过验证,本方案才会判定用户输入的位置信息和文件信息同时正确,才可以打开数字化文件柜中的文件,可以确保用户所取的文件是准确的、经过验证的;此外,如果第一位置目标和第一文档目标不对应时,本发明会提取用户音频中的音色信息,并且在音频信息满足要求时,本方案会生成相应的提醒信息对用户进行提示,协助用户取到所需的文件;针对提醒信息,本方案布局了2种实施方式。一种是参照对照表对用户的音频信息处理,得到第一组合和第二组合,从而自动生成与第一组合和第二组合对应的两组提示信息,来在用户输入信息有误时,对用户进行准确文档或者准确位置的提醒,用户可以从提醒信息中快速明确自己所需要的文件对应的信息,从而协助用户准确高效的找到自己所需要的文件;另一种是对用户的补充音频进行归类,计算出文档补充比例系数和位置补充比例系数,贴合用户习惯,来为用户生成一个相对准确的主动推荐语句,为用户更快的引导,提升用户体验。
2、本方案在得到第二位置开启语句的过程中,会用位置子词来确定相应的数量子词,对第一位置开启语句进行填充,得到第二位置开启语句,实现对不同格式数据的统一转化,提高服务器后续处理数据的准确性;同时,本方案可以在用户讲话不完整时,自动根据用户的历史数据生成问询语句,从而根据历史数据对用户进行引导,向用户提示,协助用户找到对应的准确位置,另外,在生成问询语句的过程中,还会参考第三位置目标的数量对槽位进行调整,以自动得到完整规则的问询语句。在得到第二文档开启语句的过程中,利用文件子词来确定相应的名称子词,对第一文档开启语句进行填充,得到第二文档开启语句,实现对不同格式数据的统一转化,提高服务器后续处理数据的准确性。
3、本方案当第一位置目标和第一文档目标不对应,且文档补充比例系数大于第一预设系数时,会认为该用户文档错误的几率较大,默认第一位置目标是准确的,然后依据第一位置目标主动的为用户推荐出对应表中所对应的文档,向用户提示;在位置补充比例系数大于第一预设系数时,会认为该用户位置错误的几率较大,会默认第一文档目标是准确的,然后依据第一文档目标主动的为用户推荐出对应表中所对应的位置,向用户提示;从而可以贴合用户习惯,来为用户生成一个相对准确的主动推荐语句,为用户更快的引导,提升用户体验。
附图说明
图1是本发明实施例提供的一种场景示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。
应当理解,在本发明中,“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
参见图1,是本发明实施例提供的一种场景示意图,数字化文件柜与服务器和终端可以进行数据交互。其中,数字化文件柜可以有很多个存储格,每个存储格都有对应的位置信息和所存储的文档信息,数字化文件柜上可以设置有语音采集模块,来采集用户的语音信息,还可以设置有扬声器模块,来向用户播放提示信息。
为了实现用户对数字化文件柜的搜索,本发明实施例提供一种基于计算机自然语言处理的搜索方法,该方法包括步骤S1-S5:
S1,在判断用户输入唤醒词后,采集用户音频中的搜索关键词。
可以理解的是,用户想要搜寻文件时,可以以口述的形式形成音频信息,服务器可以对音频信息进行解析,在判断用户输入唤醒词后,会采集用户音频中的搜索关键词。
示例性的,用户输入的音频信息可以是“嘿,小智,请打开第3行第1列的A公司合同文件”,其中的,“嘿,小智”可以是唤醒词。
在实际应用中,本方案可以对用户的音频信息进行分词处理,得到多个搜索关键词,例如是“第3行”、“第1列”、“A公司”、“合同文件”等。
S2,若判断所述搜索关键词为开启位置词,则调取与开启位置词相对应的第一位置开启语句,提取所述开启位置词中的位置关键词填充至所述第一位置开启语句相应的槽位处,得到第二位置开启语句。
可以理解的是,本方案会通过步骤S2依据搜索关键词中的开启位置词,形成第二位置开启语句。
在一些实施例中,所述S2包括S21- S23:
S21,接收预先设置的位置子词,所述位置子词为行、列、排中的任意一种或多种。
本方案会预先设置一些位置子词,位置子词为行、列、排中的任意一种或多种。
S22,若判断搜索关键词存在位置子词,则判断所述搜索关键词为开启位置词,调取与开启位置词相对应的第一位置开启语句。
本方案会基于位置子词对搜索关键词进行处理,如果判断搜索关键词存在位置子词,那么本方案会确定搜索关键词为开启位置词,然后调取与开启位置词相对应的第一位置开启语句。
示例性的,第一位置开启语句例如是“打开第_行第_列”,其中的多少行多少列处为空余的。
S23,根据所述位置子词确定第一位置开启语句中相对应的槽位,提取开启位置词中位置子词前部的数量子词,将所述数量子词填充至与位置子词相对应的槽位内,得到第二位置开启语句。
首先,本方案会根据位置子词确定第一位置开启语句中相对应的槽位,例如根据行确定相对应的行的槽位,根据列确定相对应的列的槽位。然后,提取开启位置词中位置子词前部的数量子词,例如上述的“3”和“1”。最后,将数量子词填充至与位置子词相对应的槽位内,得到第二位置开启语句。
示例性的,得到第二位置开启语句可以是“打开第3行第1列”。
本方案通过上述方案,可以对用户音频信息进行解析,利用位置子词来确定相应的数量子词,对第一位置开启语句进行填充,得到第二位置开启语句,实现对不同格式数据的统一转化,提高服务器后续处理数据的准确性。
本方案考虑到用户在讲话时,可能未说完整,例如,音频信息为“嘿,小智,请打开第1列的A公司合同文件”,此时,音频信息中未体现多少行的信息,此时,可能导致第一位置开启语句中存在部分未填充的槽位,为了解决上述问题,在上述实施例的基础上,本方案还包括步骤S24-S26:
S24,若判断所述第一位置开启语句中存在部分未填充的槽位,则根据所述用户音频中的音色信息获取相对应的历史操作记录,所述历史操作记录具有每个时刻相应用户对历史位置目标的开启信息。
本方案在判断第一位置开启语句中存在部分未填充的槽位时,会依据用户音频中的音色信息获取相对应的历史操作记录,其中,历史操作记录具有每个时刻相应用户对历史位置目标的开启信息。
可以理解的是,本方案会依据音频中的音色信息来确定到对应的用户,然后确定对应用户的历史操作记录,从历史操作记录中找到历史位置目标的开启信息。
S25,提取第一位置开启语句中已填充的槽位,将所述已填充的槽位与所有的历史位置目标比对,将包含已填充的槽位内数量子词的历史位置目标作为第三位置目标。
本方案会提取第一位置开启语句中已填充的槽位,例如“打开第行第1列”中的“1”,将已填充的槽位与所有的历史位置目标比对,将包含已填充的槽位内数量子词的历史位置目标作为第三位置目标。
示例性的,本方案可以从历史位置目标中找到包含已填充的槽位内数量子词的历史位置目标作为第三位置目标,例如“第3行第1列”、“第4行第1列”等等。
S26,基于所述第三位置目标生成问询语句的问询内容,根据所述问询语句与用户交互,确定一个第三位置目标为第一位置目标。
本方案在得到第三位置目标后,会生成相关的问询内容,然后根据问询语句与用户交互,确定一个第三位置目标为第一位置目标。
示例性的,本方案可以将“第3行第1列”、“第4行第1列”播放给用户,然后用户可以从中选择一个作为第一位置目标,例如可以选取“第3行第1列” 作为第一位置目标。
在一些实施例中,S26(所述基于所述第三位置目标生成问询语句的问询内容,根据所述问询语句与用户交互,确定一个第三位置目标为第一位置目标)包括S261- S262:
S261,根据所述第三位置目标的数量在初始化问询语句中建立相对应的槽位,将第三位置目标分别填充至初始化问询语句的槽位内,得到用于问询的问询语句。
示例性的,初始化问询语句可以是“请问是要打开_吗”。
可以理解的是,本方案考虑到第三位置目标的数量可能是多个,例如有2个,分别是“第3行第1列”、“第4行第1列”,这个时候生成的问询语句中需要有2个槽位,此时的初始化问询语句可以是“请问是要打开_、_吗”,其中,下划线代表槽位的含义。其中,一个槽位用于放置“第3行第1列”,另一个用于放置“第4行第1列”。最终生成的问询语句可以是“请问是要打开第3行第1列、第4行第1列吗” 。
S262,对所述问询语句播放后,采集用户的问询补充内容,若判断所述问询补充内容中的数量子词与第三位置目标内的数量子词完全对应,则将完全对应的第三位置目标作为第一位置目标。
用户在听了问询语句后,用户可以再次讲话,生成问询补充内容,问询补充内容例如是“第3行第1列”,此时,服务器会判断问询补充内容中的数量子词与第三位置目标内的数量子词是否完全对应,如果是,服务器会将完全对应的第三位置目标作为第一位置目标。
本方案通过上述方案,可以在用户讲话不完整时,自动根据用户的历史数据生成问询语句,从而根据历史数据对用户进行引导,向用户提示,协助用户找到对应的准确位置,另外,在生成问询语句的过程中,还会参考第三位置目标的数量对槽位进行调整,以自动得到完整规则的问询语句。
S3,若判断所述搜索关键词为文档名称,则调取与文档名称相对应的第一文档开启语句,提取所述文档名称中的名称关键词填充至所述第一文档开启语句相应的槽位处,得到第二文档开启语句。
可以理解的是,本方案会通过步骤S3依据搜索关键词中的文档名称,对第一文档开启语句进行处理,形成第二文档开启语句。
在一些实施例中,所述S3包括S31- S33:
S31,接收预先设置的文件子词,所述文件子词为合同、简介、扫描件、图片、书中的任意一种或多种。
本方案会预先设置一些文件子词,文件子词为合同、简介、扫描件、图片、书中的任意一种或多种。
S32,若判断搜索关键词存在文件子词,则判断所述搜索关键词为文档名称,调取与文档名称相对应的第一文档开启语句。
本方案会基于文件子词对搜索关键词进行处理,如果判断搜索关键词存在文件子词,那么本方案会确定搜索关键词为文档名称,然后调取与文档名称相对应的第一文档开启语句。
示例性的,第一文档开启语句例如是“打开_的_文件”,其中的空余处对应需要填写的内容。
S33,根据所述文件子词确定第一文档开启语句中相对应的槽位,提取文档名称中文件子词前部的名称子词,将所述名称子词填充至与文件子词相对应的槽位内,得到第二文档开启语句。
首先,本方案会根据文件子词确定第一文档开启语句中相对应的槽位。然后,提取文档名称中文件子词前部的名称子词,例如上述的“A公司”和“合同”。最后,将名称子词填充至与文件子词相对应的槽位内,得到第二位置开启语句。
示例性的,得到第二位置开启语句可以是“打开第A公司的合同文件”。
本方案通过上述方案,可以对用户音频信息进行解析,利用文件子词来确定相应的名称子词,对第一文档开启语句进行填充,得到第二文档开启语句,实现对不同格式数据的统一转化,提高服务器后续处理数据的准确性。
S4,确定所述第二位置开启语句的第一位置目标,以及第二文档开启语句的第一文档目标,若所述第一位置目标和第一文档目标相对应,则用户通过数字化文件柜的验证,控制数字化文件柜将与第一位置目标对应的门体打开。
本方案通过步骤S1-S3确定了第二位置开启语句和第二文档开启语句后,会得到第二位置开启语句的第一位置目标,以及第二文档开启语句的第一文档目标,如果第一位置目标和第一文档目标相对应,说明用户输入的信息是相对应的,此时可以控制数字化文件柜将与第一位置目标对应的门体打开。
可以理解的是,本方案需要用户输入的位置信息和文件信息同时正确,才可以打开数字化文件柜中的文件,该种方式能够实现对用户的验证,并且可以确保用户所取的文件是准确的。
例如,用户A向数字化文件柜的“第3行第1列”存入了“第A公司的合同文件”,此时只有用户A知道相应的“第3行第1列”对应的是什么文件,其余用户并不清楚,所以此时本发明可以认为当某一个用户所说的位置和文件相对应时,则认为当前与数字化文件柜交互的用户即为存储相应文件的用户。
在一个可能的场景中,例如用户A需要用户B(非白名单用户)去协助取其文件,则此时用户A即可以将“第3行第1列”、“第A公司的合同文件”告知用户B,用户B即可以同时输入开启位置词和文档名称即可以打开由用户A所存储文件的门体。达到远程通过其他用户协助打开的目的和效果。
在一些实施例中,所述S4包括S41- S43:
S41,获取数字化文件柜预先配置的对应表,所述对应表中具有柜体的预设位置和预设文档的对应关系。
本方案会预先配置有对应表,对应表中有柜体的预设位置和预设文档的对应关系。该对应表可以在用户向柜体内存放文件时进行更新,例如,用户向第3行第1列中存A公司的合同文件时,可以对对应表进行更新,确保对应表中的信息是准确的。
S42,将所述第一位置目标与对应表比对,确定与第一位置目标对应的预设文档,若所确定的预设文档与第一文档目标相对应,则判断第一位置目标和第一文档目标相对应,此时用户通过数字化文件柜的验证。
本方案会将第一位置目标和对应表比对,找到第一位置目标对应的预设文档,如果所确定的预设文档与第一文档目标相对应,说明第一位置目标和第一文档目标相对应。此时用户通过验证,可能是用户A直接自己取用相应的文件,也可以用户B协助用户A取用相应的文件。
S43,控制数字化文件柜将与第一位置目标对应的门体打开。
在第一位置目标和第一文档目标相对应后,说明用户输入的信息是准确的,此时,数字化文件柜达到了对用户进行验证的效果,可以控制数字化文件柜将与第一位置目标对应的门体打开。
S5,若所述第一位置目标和第一文档目标不对应,则提取所述用户音频中的音色信息,若所述音色信息满足预设要求,则输出补充提醒指令,接收用户输入的第二位置目标或第二文档目标,根据所述第一位置目标与第二文档目标、或第二位置目标与第一文档目标,将相应的第一位置目标或第二位置目标对应的门体打开。
与步骤S4不同的是,本步骤会在第一位置目标和第一文档目标不对应时,说明第一位置目标和第一文档目标中的一个出现了错误,此时可能会出现两种情况,第1种情况是用户并不知道第一位置目标内所放置的文档是什么,第2种情况是用户忘记了第一位置目标放的是哪种文档,或者用户忘记了第一文档目标具体所放置的位置,所以本发明会提取用户音频中的音色信息。
在音色信息与预设白名单内的音色信息不相对应时,则判断用户音频中的音色信息是不满足预设要求的,此时认为是出现了如上所说的第1种情况。在音色信息与预设白名单内的音色信息相对应时,则判断用户音频中的音色信息是满足预设要求的,此时认为是出现了如上所说的第2种情况。
在出现如上所说的第2种情况时,此时本方案会向用户输出补充提醒指令,然后接收用户输入的第二位置目标或第二文档目标,根据第一位置目标与第二文档目标、或第二位置目标与第一文档目标,将相应的第一位置目标或第二位置目标对应的门体打开。
在一些实施例中,所述S5包括S51- S55:
S51,若所述第一位置目标和第一文档目标不对应,则提取所述用户音频中的音色信息,若所述音色信息满足预设要求,则判断用户为白名单用户;
将所述第一位置目标、第一文档目标分别与对应表比对,确定与第一位置目标对应的第一补充文档或与第一位置目标对应的第一补充位置。
当第一位置目标和第一文档目标不对应时,本方案会将第一位置目标、第一文档目标分别与对应表比对,找到与第一位置目标对应的第一补充文档或与第一位置目标对应的第一补充位置。
本发明中的数字化文件柜,会预先录入多个白名单用户,以及为每个白名单用户设置录入相对应的、预设的音色信息,在音色信息与预设白名单内的音色信息相对应时,则判断用户音频中的音色信息是满足预设要求的。所以此时认为是相应用户对数字文件柜内文档的位置、文档的内容记录错误。所以此时需要用户所选择的错误的位置、文档,对白名单用户进行相应的提醒。
例如,用户对应的第一位置目标为“第3行第1列”,第一文档目标为“B公司的合同文件”,本方案会依据以下示例得到对应的第一补充文档和第一补充位置。
示例性的, 对应表中“第3行第1列”对应的文档是“A公司的合同文件”。第一位置目标为“第3行第1列”,则本方案会依据对应表,得到的对应的第一补充文档为“A公司的合同文件”。
另一示例性的, 对应表中“第4行第2列”对应的文档是“B公司的合同文件”。第一位置目标为“B公司的合同文件”,则本方案会依据对应表,得到的对应的第一补充位置为“第4行第2列”。
S52,对所述第一位置目标和第一补充文档组合得到第一组合,或将所述第一文档目标与第一补充位置组合得到第二组合,将所述第一组合和/或第二组合作为补充提醒指令输出。
示例性的,第一组合为“第3行第1列中的A公司的合同文件”,第二组合为“第4行第2列中的B公司的合同文件”。
本方案会将第一组合和/或第二组合作为补充提醒指令输出,给用户进行提示。
S53,采集白名单用户的补充音频,提取所述补充音频中的第一补充文档或第一补充位置,将第一补充文档作为第二文档目标,或将第一补充位置作为第二位置目标。
白名单用户收到提示信息后,可以输入补充音频,服务器会实时采集用户的补充音频,然后提取补充音频中的第一补充文档或第一补充位置,将第一补充文档作为第二文档目标,或将第一补充位置作为第二位置目标。
S54,若提取到第二文档目标,则对相应的第一位置目标对应的门体打开。
例如,白名单用户的补充音频可以是“A公司的合同文件”,则本方案会提取到第二文档目标,此时,本方案会认为第一位置目标是正确的,本方案将相应的第一位置目标对应的门体打开即可。
S55,若提取到第二位置目标,则对相应的第二位置目标对应的门体打开。
例如,白名单用户的补充音频可以是“第4行第2列”,则本方案会提取到第二位置目标,此时,本方案会认为第二位置目标是正确的,本方案将相应的第二位置目标对应的门体打开即可。
本方案通过上述方式,可以在第一位置目标和第一文档目标不对应时,自动生成与第一组合和第二组合对应的两组提示信息,来对用户进行准确文档或者准确位置的提醒,用户可以从提醒信息中快速明确自己所需要的文件。所对应的信息,从而准确高效的找到自己所需要的文件。
S6,若所述音色信息不满足预设要求,则提醒用户通过手动方式与数字化文件柜交互。
此时则相应的用户不是白名单用户,所以此时不能够通过语音方式对其进行文件搜索的引导,避免出现文件丢失、泄露的情况,所以此时提醒相应的用户通过手动方式与数字化文件柜交互,例如与数字化文件柜的触摸屏幕进行交互,通过输入相应账号密码等形式进行验证,对于非白名单用户通过手动方式与数字化文件柜交互的技术方案,本发明不做任何限定。
在上述实施例的基础上,本方案还包括A1-A5:
A1,对每个白名单用户在输出补充提醒指令后的补充音频进行归类,得到每个用户的第一音频集合和第二音频集合,所述第一音频集合中的元素为相应的补充音频具有第二文档目标,所述第二音频集合中的元素为相应的补充音频具有第二位置目标。
本方案会对每个白名单用户在输出补充提醒指令后的补充音频进行归类,得到每个白名单用户的第一音频集合和第二音频集合。其中,第一音频集合中的元素为相应的补充音频具有第二文档目标,第二音频集合中的元素为相应的补充音频具有第二位置目标。
A2,根据所述第一音频集合中的元素的第一数量、第二音频集合中的元素的第二数量,进行计算得到总数量。
本方案会统计第一音频集合中的元素的第一数量,第二音频集合中的元素的第二数量,然后对第一数量和第二数量进行计算得到总数量。
A3,若所述总数量大于等于预设数量,则根据所述第一数量、第二数量以及总数量进行计算,得到文档补充比例系数和位置补充比例系数。
本方案会设置有预设数量,例如10,如果总数量大于等于10,本方案会利用第一数量、第二数量以及总数量进行计算,得到文档补充比例系数和位置补充比例系数。
需要说明的是,总数量大于等于预设数量时,说明用户输入信息的错误次数较多,对应的数据才具有一定的可参考性,在实际应用中,预设数量可以贴合实际情况设置的较大。
在一些实施例中,可以通过以下公式计算文档补充比例系数和位置补充比例系数,
Figure SMS_8
其中,
Figure SMS_9
为总数量,/>
Figure SMS_10
为第一数量,/>
Figure SMS_11
为第二数量,/>
Figure SMS_12
为预设数量,/>
Figure SMS_13
为文档补充比例系数,/>
Figure SMS_14
为位置补充比例系数。
上述公式中,
Figure SMS_15
代表总数量/>
Figure SMS_16
,可以通过上述公式计算出文档补充比例系数和位置补充比例系数,可以理解的是,第一数量/>
Figure SMS_17
越多,对应的文档补充比例系数/>
Figure SMS_18
也就越大,同理,第二数量/>
Figure SMS_19
越大,位置补充比例系数/>
Figure SMS_20
越大。
A4,若白名单用户的文档补充比例系数大于第一预设系数,则对白名单用户添加文档主动推荐标签。
可以理解的是,如果用户的文档补充比例系数大于第一预设系数,说明对应用户的用户习惯所展示的是,该用户输入信息中文档错误的次数较多,本方案会为该用户添加文档主动推荐标签,来为用户主动推荐相应的文档。
示例性的,当第一位置目标和第一文档目标不对应时,本方案会默认第一位置目标是准确的,然后依据第一位置目标主动的为用户推荐出对应表中所对应的文档,向用户提示。
A5,若白名单用户的位置补充比例系数大于第一预设系数,则对白名单用户添加位置主动推荐标签。
可以理解的是,如果白名单用户的位置补充比例大于第一预设系数,说明对应白名单用户的用户习惯所展示的是,该白名单用户输入信息中位置错误的次数较多,本方案会为该用户添加位置主动推荐标签,来为白名单用户主动推荐相应的位置。
示例性的,当第一位置目标和第一文档目标不对应时,本方案会默认第一文档目标是准确的,然后依据第一文档目标主动的为白名单用户推荐出对应表中所对应的位置,向用户提示。
在一些实施例中,还包括A6- A8:
A6,若所述第一位置目标和第一文档目标不对应,则提取白名单用户添加的文档主动推荐标签或位置主动推荐标签。
具体的,参见A4和A5。
A7,根据所述文档主动推荐标签或位置主动推荐标签生成主动推荐语句,对所述主动推荐语句进行播放。
本方案为了向白名单用户提示,会利用文档主动推荐标签或位置主动推荐标签生成主动推荐语句,对主动推荐语句进行播放。
A8,在对主动推荐语句播放后,若白名单用户音频中能够采集到预设关键词,则将第一位置目标所对应的门体打开,或将第一文档目标对应的第二位置目标打开。
可以理解的是,白名单用户听了主动推荐语句后,可以再次讲话,生成音频信息,本方案的服务器会对音频信息进行解析,得到预设关键词,预设关键词例如是“是的”,本方案会将第一位置目标所对应的门体打开,或将第一文档目标对应的第二位置目标打开。
在一些实施例中,A7(所述根据所述文档主动推荐标签或位置主动推荐标签生成主动推荐语句,对所述主动推荐语句进行播放)包括A71- A72:
A71,若判断白名单用户具有文档主动推荐标签,则确定与第一位置目标对应的第二文档目标,根据所述第一位置目标、第二文档目标得到相对应的主动推荐语句。
可以理解的是,本方案以第一位置目标为基准,来确定对应的第二文档目标,生成对应的主动推荐语句。
A72,若判断白名单用户具有位置主动推荐标签,则确定与第一文档目标对应的第二位置目标,根据所述第一文档目标、第二位置目标得到相对应的主动推荐语句。
可以理解的是,本方案以第一文档目标为基准,来确定对应的第二位置目标,生成对应的主动推荐语句。
本方案通过上述方式,可以贴合白名单用户习惯,来为用户生成一个相对准确的主动推荐语句,为用户更快的引导,提升用户体验。
本发明还提供一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现上述的各种实施方式提供的方法。
其中,存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和存储介质也可以作为分立组件存在于通信设备中。存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在存储介质中。设备的至少一个处理器可以从存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。
在上述终端或者服务器的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.基于计算机自然语言处理的搜索方法,其特征在于,包括:
S1,在判断用户输入唤醒词后,采集用户音频中的搜索关键词;
S2,若判断所述搜索关键词为开启位置词,则调取与开启位置词相对应的第一位置开启语句,提取所述开启位置词中的位置关键词填充至所述第一位置开启语句相应的槽位处,得到第二位置开启语句;
S3,若判断所述搜索关键词为文档名称,则调取与文档名称相对应的第一文档开启语句,提取所述文档名称中的名称关键词填充至所述第一文档开启语句相应的槽位处,得到第二文档开启语句;
S4,确定所述第二位置开启语句的第一位置目标,以及第二文档开启语句的第一文档目标,若所述第一位置目标和第一文档目标相对应,则用户通过数字化文件柜的验证,控制数字化文件柜将与第一位置目标对应的门体打开;
S5,若所述第一位置目标和第一文档目标不对应,则提取所述用户音频中的音色信息,若所述音色信息满足预设要求,则输出补充提醒指令,接收用户输入的第二位置目标或第二文档目标,根据所述第一位置目标与第二文档目标、或第二位置目标与第一文档目标,将相应的第一位置目标或第二位置目标对应的门体打开;
S6,若所述音色信息不满足预设要求,则提醒用户通过手动方式与数字化文件柜交互。
2.根据权利要求1所述的基于计算机自然语言处理的搜索方法,其特征在于,
所述S2包括:
接收预先设置的位置子词,所述位置子词为行、列、排中的任意一种或多种;
若判断搜索关键词存在位置子词,则判断所述搜索关键词为开启位置词,调取与开启位置词相对应的第一位置开启语句;
根据所述位置子词确定第一位置开启语句中相对应的槽位,提取开启位置词中位置子词前部的数量子词,将所述数量子词填充至与位置子词相对应的槽位内,得到第二位置开启语句。
3.根据权利要求2所述的基于计算机自然语言处理的搜索方法,其特征在于,还包括:
若判断所述第一位置开启语句中存在部分未填充的槽位,则根据所述用户音频中的音色信息获取相对应的历史操作记录,所述历史操作记录具有每个时刻相应用户对历史位置目标的开启信息;
提取第一位置开启语句中已填充的槽位,将所述已填充的槽位与所有的历史位置目标比对,将包含已填充的槽位内数量子词的历史位置目标作为第三位置目标;
基于所述第三位置目标生成问询语句的问询内容,根据所述问询语句与用户交互,确定一个第三位置目标为第一位置目标。
4.根据权利要求3所述的基于计算机自然语言处理的搜索方法,其特征在于,
所述基于所述第三位置目标生成问询语句的问询内容,根据所述问询语句与用户交互,确定一个第三位置目标为第一位置目标,包括:
根据所述第三位置目标的数量在初始化问询语句中建立相对应的槽位,将第三位置目标分别填充至初始化问询语句的槽位内,得到用于问询的问询语句;
对所述问询语句播放后,采集用户的问询补充内容,若判断所述问询补充内容中的数量子词与第三位置目标内的数量子词完全对应,则将完全对应的第三位置目标作为第一位置目标。
5.根据权利要求1所述的基于计算机自然语言处理的搜索方法,其特征在于,
所述S3包括:
接收预先设置的文件子词,所述文件子词为合同、简介、扫描件、图片、书中的任意一种或多种;
若判断搜索关键词存在文件子词,则判断所述搜索关键词为文档名称,调取与文档名称相对应的第一文档开启语句;
根据所述文件子词确定第一文档开启语句中相对应的槽位,提取文档名称中文件子词前部的名称子词,将所述名称子词填充至与文件子词相对应的槽位内,得到第二文档开启语句。
6.根据权利要求1所述的基于计算机自然语言处理的搜索方法,其特征在于,
所述S4包括:
获取数字化文件柜预先配置的对应表,所述对应表中具有柜体的预设位置和预设文档的对应关系;
将所述第一位置目标与对应表比对,确定与第一位置目标对应的预设文档,若所确定的预设文档与第一文档目标相对应,则判断第一位置目标和第一文档目标相对应,此时用户通过数字化文件柜的验证;
控制数字化文件柜将与第一位置目标对应的门体打开。
7.根据权利要求6所述的基于计算机自然语言处理的搜索方法,其特征在于,
所述S5包括:
若所述第一位置目标和第一文档目标不对应,则提取所述用户音频中的音色信息,若所述音色信息满足预设要求,则判断用户为白名单用户;
将所述第一位置目标、第一文档目标分别与对应表比对,确定与第一位置目标对应的第一补充文档或与第一位置目标对应的第一补充位置;
对所述第一位置目标和第一补充文档组合得到第一组合,或将所述第一文档目标与第一补充位置组合得到第二组合,将所述第一组合和/或第二组合作为补充提醒指令输出;
采集白名单用户的补充音频,提取所述补充音频中的第一补充文档或第一补充位置,将第一补充文档作为第二文档目标,或将第一补充位置作为第二位置目标;
若提取到第二文档目标,则将相应的第一位置目标对应的门体打开;
若提取到第二位置目标,则将相应的第二位置目标对应的门体打开。
8.根据权利要求7所述的基于计算机自然语言处理的搜索方法,其特征在于,还包括:
对每个白名单用户在输出补充提醒指令后的补充音频进行归类,得到每个白名单用户的第一音频集合和第二音频集合,所述第一音频集合中的元素为相应的补充音频具有第二文档目标,所述第二音频集合中的元素为相应的补充音频具有第二位置目标;
根据所述第一音频集合中的元素的第一数量、第二音频集合中的元素的第二数量进行计算得到总数量;
若所述总数量大于等于预设数量,则根据所述第一数量、第二数量以及总数量进行计算,得到文档补充比例系数和位置补充比例系数;
若白名单用户的文档补充比例系数大于第一预设系数,则对白名单用户添加文档主动推荐标签;
若白名单用户的位置补充比例系数大于第一预设系数,则对白名单用户添加位置主动推荐标签;
通过以下公式计算文档补充比例系数和位置补充比例系数,
Figure QLYQS_1
其中,
Figure QLYQS_2
为总数量,/>
Figure QLYQS_3
为第一数量,/>
Figure QLYQS_4
为第二数量,/>
Figure QLYQS_5
为预设数量,/>
Figure QLYQS_6
为文档补充比例系数,/>
Figure QLYQS_7
为位置补充比例系数。
9.根据权利要求8所述的基于计算机自然语言处理的搜索方法,其特征在于,还包括:
若所述第一位置目标和第一文档目标不对应,则提取白名单用户添加的文档主动推荐标签或位置主动推荐标签;
根据所述文档主动推荐标签或位置主动推荐标签生成主动推荐语句,对所述主动推荐语句进行播放;
在对主动推荐语句播放后,若白名单用户音频中能够采集到预设关键词,则将第一位置目标所对应的门体打开,或将第一文档目标对应的第二位置目标打开。
10.根据权利要求9所述的基于计算机自然语言处理的搜索方法,其特征在于,
所述根据所述文档主动推荐标签或位置主动推荐标签生成主动推荐语句,对所述主动推荐语句进行播放,包括:
若判断白名单用户具有文档主动推荐标签,则确定与第一位置目标对应的第二文档目标,根据所述第一位置目标、第二文档目标得到相对应的主动推荐语句;
若判断白名单用户具有位置主动推荐标签,则确定与第一文档目标对应的第二位置目标,根据所述第一文档目标、第二位置目标得到相对应的主动推荐语句。
CN202310314342.XA 2023-03-28 2023-03-28 基于计算机自然语言处理的搜索方法 Active CN116013296B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310314342.XA CN116013296B (zh) 2023-03-28 2023-03-28 基于计算机自然语言处理的搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310314342.XA CN116013296B (zh) 2023-03-28 2023-03-28 基于计算机自然语言处理的搜索方法

Publications (2)

Publication Number Publication Date
CN116013296A CN116013296A (zh) 2023-04-25
CN116013296B true CN116013296B (zh) 2023-05-30

Family

ID=86037686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310314342.XA Active CN116013296B (zh) 2023-03-28 2023-03-28 基于计算机自然语言处理的搜索方法

Country Status (1)

Country Link
CN (1) CN116013296B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081634A (zh) * 2009-11-27 2011-06-01 株式会社理光 语音检索装置和语音检索方法
CN103956166A (zh) * 2014-05-27 2014-07-30 华东理工大学 一种基于语音关键词识别的多媒体课件检索系统
CN110347784A (zh) * 2019-05-23 2019-10-18 深圳壹账通智能科技有限公司 报表查询方法、装置、存储介质及电子设备
CN112507068A (zh) * 2020-11-30 2021-03-16 北京百度网讯科技有限公司 文档查询方法、装置、电子设备和存储介质
KR20210044697A (ko) * 2019-10-15 2021-04-23 (주)포스윈 Ai 기반 질의응답 시스템 및 방법
JP2022059523A (ja) * 2020-10-01 2022-04-13 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム
CN115374061A (zh) * 2022-08-26 2022-11-22 中国银行股份有限公司 文档搜索的优化处理方法、装置及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7702673B2 (en) * 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081634A (zh) * 2009-11-27 2011-06-01 株式会社理光 语音检索装置和语音检索方法
CN103956166A (zh) * 2014-05-27 2014-07-30 华东理工大学 一种基于语音关键词识别的多媒体课件检索系统
CN110347784A (zh) * 2019-05-23 2019-10-18 深圳壹账通智能科技有限公司 报表查询方法、装置、存储介质及电子设备
KR20210044697A (ko) * 2019-10-15 2021-04-23 (주)포스윈 Ai 기반 질의응답 시스템 및 방법
JP2022059523A (ja) * 2020-10-01 2022-04-13 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム
CN112507068A (zh) * 2020-11-30 2021-03-16 北京百度网讯科技有限公司 文档查询方法、装置、电子设备和存储介质
CN115374061A (zh) * 2022-08-26 2022-11-22 中国银行股份有限公司 文档搜索的优化处理方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A novel MIR framework and application with automatic voice processing, database construction and fuzzy matching;Peng Li et al.;2010 The 2nd International Conference on Computer and Automation Engineering (ICCAE);全文 *
基于RFID技术的智能文件定位柜设计;丁双定等;物联网技术;全文 *

Also Published As

Publication number Publication date
CN116013296A (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
US10176804B2 (en) Analyzing textual data
CN111968649B (zh) 一种字幕纠正方法、字幕显示方法、装置、设备及介质
CN111710333B (zh) 用于生成语音转录的方法和系统
TWI455111B (zh) 使用聲音資料之用於字素至音素轉換的方法、電腦系統,及與其相關的電腦可讀取媒體
US6208971B1 (en) Method and apparatus for command recognition using data-driven semantic inference
US8666726B2 (en) Sample clustering to reduce manual transcriptions in speech recognition system
US7289950B2 (en) Extended finite state grammar for speech recognition systems
CN107239547B (zh) 用于语音点歌的语音纠错方法、终端及存储介质
US20050143999A1 (en) Question-answering method, system, and program for answering question input by speech
TWI554984B (zh) 電子裝置
US10140976B2 (en) Discriminative training of automatic speech recognition models with natural language processing dictionary for spoken language processing
CN109545185B (zh) 交互系统评价方法、评价系统、服务器及计算机可读介质
KR20090111825A (ko) 언어 독립적인 음성 인덱싱 및 검색 방법 및 장치
US11158349B2 (en) Methods and systems of automatically generating video content from scripts/text
CN111079423A (zh) 一种听写报读音频的生成方法、电子设备及存储介质
CN108153875B (zh) 语料处理方法、装置、智能音箱和存储介质
CN111126084B (zh) 数据处理方法、装置、电子设备和存储介质
CN113393841B (zh) 语音识别模型的训练方法、装置、设备及存储介质
CN116013296B (zh) 基于计算机自然语言处理的搜索方法
US20050125224A1 (en) Method and apparatus for fusion of recognition results from multiple types of data sources
CN114691907B (zh) 一种跨模态检索的方法、设备及介质
US11922944B2 (en) Phrase alternatives representation for automatic speech recognition and methods of use
US11289095B2 (en) Method of and system for translating speech to text
US11069341B2 (en) Speech correction system and speech correction method
WO2021017302A1 (zh) 一种数据提取方法、装置、计算机系统及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant