CN109697244A - 信息处理方法、装置及存储介质 - Google Patents

信息处理方法、装置及存储介质 Download PDF

Info

Publication number
CN109697244A
CN109697244A CN201811293274.9A CN201811293274A CN109697244A CN 109697244 A CN109697244 A CN 109697244A CN 201811293274 A CN201811293274 A CN 201811293274A CN 109697244 A CN109697244 A CN 109697244A
Authority
CN
China
Prior art keywords
information
target information
matching degree
keyword
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811293274.9A
Other languages
English (en)
Inventor
叶静宇
张萌萌
范中吉
万立
张刘辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811293274.9A priority Critical patent/CN109697244A/zh
Publication of CN109697244A publication Critical patent/CN109697244A/zh
Priority to US16/564,122 priority patent/US20200005767A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种信息处理方法、装置及存储介质。该方法包括:对接收到的目标语音信号进行语音识别处理,得到语音识别结果,并在未匹配到与该语音识别结果相同的信息时,查找与该语音识别结果的匹配度大于预设阈值的信息为目标信息,之后,将目标信息通知给用户,从而提供一种新的信息处理方案,为用户提供更多更智能的服务。

Description

信息处理方法、装置及存储介质
技术领域
本发明实施例涉及信息处理技术,尤其涉及一种信息处理方法、装置及存储介质。
背景技术
随着信息处理技术的不断,智能设备的类型和功能愈来愈多,例如智能音箱。对于智能设备而言,通常情况下,智能设备识别用户语音,进而根据识别到的语音信息执行后续处理,例如,包括歌曲、视频等内容的信息推荐,等等。
目前的智能设备,当用户表达不清楚,或,智能设备基于当前语音未匹配到与该当前语音相同的信息时,智能设备进入无结果状态,从而影响用户使用体验。
发明内容
本发明实施例提供一种信息处理方法、装置及存储介质,为用户提供更多更智能的服务。
第一方面,本发明实施例提供一种信息处理方法,包括:
对接收到的目标语音信号进行语音识别处理,得到语音识别结果;
若未匹配到与所述语音识别结果相同的信息,则查找与所述语音识别结果的匹配度大于预设阈值的信息为目标信息;
将所述目标信息通知给用户。
在一种可能的设计中,所述查找与所述语音识别结果的匹配度大于预设阈值的信息为目标信息,包括:
提取所述语音识别结果中的关键词;
查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息。
在一种可能的设计中,所述查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息,包括:
在不同的功能中,查找与所述关键词的匹配度大于所述预设阈值的信息为第一结果;
在所述第一结果中,按照匹配度大小确定预设个数的信息为所述目标信息。
在一种可能的设计中,所述在所述第一结果中,按照匹配度大小确定预设个数的信息为所述目标信息,包括:在所述第一结果中,确定匹配度最高的信息为所述目标信息。
在一种可能的设计中,所述查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息,包括:
根据所述关键字,确定待查找的功能;
在所述待查找的功能中,查找与所述关键词的匹配度大于所述预设阈值的信息为第二结果;
确定所述第二结果中,匹配度最高的信息为所述目标信息。
在一种可能的设计中,所述将所述目标信息通知给用户,包括:
根据所述目标信息确定从文本到语音TTS的话术类型;
通过音频播放设备,采用所述话术类型将所述目标信息语音播放给所述用户。
在一种可能的设计中,所述查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息,包括:
根据所述关键字,确定至少一待查找的功能;
在所述至少一待查找的功能中,查找与所述关键词的匹配度大于所述预设阈值的信息为第三结果;
在所述第三结果中,按照匹配度大小确定预设个数的信息为所述目标信息。
在一种可能的设计中于,所述将所述目标信息通知给用户,包括:通过显示设备,显示所述目标信息给所述用户。
在一种可能的设计中,所述将所述目标信息通知给用户之后,所述方法还包括:
接收用户的播放指令,所述播放指令用于指定待播放的目标信息;
播放所述播放指令对应的目标信息。
第二方面,本发明实施例提供一种信息处理装置,包括:
处理模块,用于对接收到的目标语音信号进行语音识别处理,得到语音识别结果;及,在未匹配到与所述语音识别结果相同的信息时,查找与所述语音识别结果的匹配度大于预设阈值的信息为目标信息;
通知模块,用于将所述目标信息通知给用户。
在一种可能的设计中,所述处理模块在用于查找与所述语音识别结果的匹配度大于预设阈值的信息为目标信息时,具体用于:
提取所述语音识别结果中的关键词;
查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息。
在一种可能的设计中,所述处理模块在查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息时,具体用于:
在不同的功能中,查找与所述关键词的匹配度大于所述预设阈值的信息为第一结果;
在所述第一结果中,按照匹配度大小确定预设个数的信息为所述目标信息。
在一种可能的设计中,所述处理模块用于在所述第一结果中,按照匹配度大小确定预设个数的信息为所述目标信息时,具体用于:在所述第一结果中,确定匹配度最高的信息为所述目标信息。
在一种可能的设计中,所述处理模块在用于查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息时,具体用于:
根据所述关键字,确定待查找的功能;
在所述待查找的功能中,查找与所述关键词的匹配度大于所述预设阈值的信息为第二结果;
确定所述第二结果中,匹配度最高的信息为所述目标信息。
在一种可能的设计中,所述通知模块具体用于:
根据所述目标信息确定从文本到语音TTS的话术类型;
通过音频播放设备,采用所述话术类型将所述目标信息语音播放给所述用户。
在一种可能的设计中,所述处理模块在用于查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息时,具体用于:
根据所述关键字,确定至少一待查找的功能;
在所述至少一待查找的功能中,查找与所述关键词的匹配度大于所述预设阈值的信息为第三结果;
在所述第三结果中,按照匹配度大小确定预设个数的信息为所述目标信息。
在一种可能的设计中,所述通知模块具体用于:通过显示设备,显示所述目标信息给所述用户。
在一种可能的设计中,所述装置还包括:接收模块,用于在所述通知模块将所述目标信息通知给用户之后,接收用户的播放指令,所述播放指令用于指定待播放的目标信息;对应地,
所述通知模块,还用于播放所述播放指令对应的目标信息。
第三方面,本发明实施例提供一种信息处理装置,包括:处理器和存储器;存储器存储计算机执行指令;处理器执行计算机执行指令,使得该处理器执行如第一方面任一项所述的信息处理方法。
第四方面,本发明实施例提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,该计算机执行指令被处理器执行时用于实现如第一方面任一项所述的信息处理方法。
本发明实施例提供的信息处理方法、装置及存储介质,对接收到的目标语音信号进行语音识别处理,得到语音识别结果,并在未匹配到与该语音识别结果相同的信息时,查找与该语音识别结果的匹配度大于预设阈值的信息为目标信息,之后,将目标信息通知给用户,从而提供一种新的信息处理方案,为用户提供更多更智能的服务。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明一实施例提供的信息处理方法的流程图;
图2为本发明另一实施例提供的信息处理方法的流程图;
图3为本发明一实施例提供的信息处理装置的结构示意图;
图4为本发明另一实施例提供的信息处理装置的结构示意图;
图5为本发明又一实施例提供的信息处理装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
首先,明确的是,本发明实施例中的智能设备可以包括但不限于智能音箱、智能机器人,还包括其它具有语音识别功能和/或在语音识别的基础上进行音/视频播放等处理的终端设备。
图1为本发明一实施例提供的信息处理方法的流程图。本发明实施例提供一种信息处理方法,该信息处理方法的执行主体可以为信息处理装置,该信息处理装置可以通过软件/硬件的方式实现。实际应用中,该信息处理装置可以为一独立设备,例如智能设备或服务器;或者,该信息处理装置还可以集成于智能设备或服务器,作为智能设备或服务器的一部分存在,本发明不限制信息处理装置的存在形式。
在实际应用中,当信息处理装置为服务器时,该服务器与智能音箱等智能设备建立连接,进行信息交互,其中,智能音箱等智能设备接收语音信号,并将该语音信号传输给服务器,以使服务器执行本发明实施例提供的信息处理方法,之后,服务器将根据上述语音信号得到的目标信息传输给智能音箱等智能设备,以使智能音箱等智能设备将目标信息通知给用户。
如图1所示,该信息处理方法包括:
S101、对接收到的目标语音信号进行语音识别处理,得到语音识别结果。
具体地,接收目标语音信号,并对该目标语音信号进行语音识别处理,得到语音识别结果。其中,目标语音信号即当前处理的语音信号,通常情况下,不同时刻对应的目标语音信号是不同的。语音识别结果通常为文本形式,语音识别处理将目标语音信号由语音形式转换为文本形式。
至于语音信号处理所采用的语音识别技术,本发明实施例不对其进行限制,其可以为任何一种可以识别语音的技术。
在得到目标语音信号对应的语音识别结果之后,信息处理装置在数据库等信息存储模块中匹配该语音识别结果,若匹配到与该语音识别结果相同的信息,将与该语音识别结果相同的信息通知给用户;否则,信息处理装置执行S102。可选地,与语音识别结果相同的信息表现为文本形式。
示例性地,若用户带有口音,此时,智能音箱识别到的该用户的语音,与该用户表达的意思可能存在差别,而数据库等信息存储模块中存储的通常为标准用语,例如普通话,因此,在数据库等信息存储模块中可能匹配不到识别到的该用户的语音。此时,信息处理装置执行S102。
S102、若未匹配到与语音识别结果相同的信息,则查找与该语音识别结果的匹配度大于预设阈值的信息为目标信息。
可以理解,若不存在与语音识别结果相同的信息,不同于相关技术中使智能设备进入无结果状态,在本发明实施例中,信息处理装置继续查找与该语音识别结果的匹配度较高的信息,并将其作为目标信息,例如,与该语音识别结果的匹配度大于预设阈值的信息,等等。其中,预设阈值可根据历史经验或实际情况进行设置,本发明实施例不限制其取值。
例如,语音识别结果为“风大声音”,信息处理装置未在数据库等信息存储模块中匹配到与“风大声音”相同的信息,则继续查找,查找到与“风大声音”的匹配度大于预设阈值的信息:“放大声音”,将“放大声音”作为目标信息。
对于语音识别结果和与该语音识别结果的匹配度大于预设阈值的信息,二者存在一定的关联,该关联例如客人表现为整体语音纠错或整体语义纠错等。其中,整体语义纠错可以包括人名纠错,例如,对“中学友的歌”进行整体语义纠错,得到“张学友的歌”,等等。
另外,与该语音识别结果的匹配度大于预设阈值的信息,不限于与该语音识别结果的匹配度大于预设阈值的全文本信息,其还可以为与该语音识别结果中部分关键字的匹配度大于预设阈值的信息,该种情况在后续实施例解释说明,此处不再赘述。
S103、将目标信息通知给用户。
其中,对于目标信息的个数,可以为一个,也可以为多个。所述多个包括两个或两个以上。一种设计中,当目标信息的个数为多个时,默认将第一个目标信息通知给用户。
可选地,将目标信息套用在预设格式中通知给用户。例如,目标信息为“张学友的歌”,信息处理装置将“请问你想要的是“张学友的歌”吗?”通知给用户,或者,信息处理装置将“你是否想说“张学友的歌”?”通知给用户,等等。
一些实施例中,若信息处理装置执行S103、将目标信息通知给用户之后,预设时间段内没有接收其它指令,则播放该目标信息指代的内容给用户。例如,播放张学友的歌给用户。
或者,可选地,信息处理装置将目标信息对应的资源或资源列表或资源链接等通知给用户。
需明确的是,本发明任一实施例中的示例仅为便于理解,不对本发明实施例构成限制。
至于将目标信息通知给用户所采用的具体形式,可以为音频形式,也可以为视频形式。例如,对于具备音频播放功能,但不具备显示功能的智能设备,可以通过该智能设备中的音频播放设备将目标信息播放给用户;对于具备显示功能,但不具备音频播放功能的智能设备,可以通过该智能设备中的显示设备,显示目标信息给用户;对于同时具备显示功能和音频播放功能的智能设备,可以通过该智能设备中的显示设备,显示目标信息给用户,并通过该智能设备中的音频播放设备将目标信息播放给用户。
该实施例,通过对接收到的目标语音信号进行语音识别处理,得到语音识别结果,并在未匹配到与该语音识别结果相同的信息时,查找与该语音识别结果的匹配度大于预设阈值的信息为目标信息,之后,将目标信息通知给用户,从而提供一种新的信息处理方案,为用户提供更多更智能的服务。
接下来,解释说明与该语音识别结果的匹配度大于预设阈值的信息,为与该语音识别结果中部分关键字的匹配度大于预设阈值的信息,的情况。
该情况下,一种可能的实现方式中,上述查找与语音识别结果的匹配度大于预设阈值的信息为目标信息,可以包括:提取语音识别结果中的关键词;查找与该关键词的匹配度大于预设阈值的信息为目标信息。其中,所述关键词可以为以下实体中的至少一个:
1)资源名称,例如,视频资源名称(例如电影片名、电视剧片名等),歌曲名称和有声资源名称等。
2)人物姓名,例如,明星、导演、科学家等有一定热度的公众人物姓名。
3)专有名词,例如,比特币、世界杯、港珠澳大桥等。
4)动物名称,例如,狐狸、海豚、恐龙等。
等等。
一种可能的设计中,查找与关键词的匹配度大于预设阈值的信息为目标信息,可以包括:在不同的功能中,查找与关键词的匹配度大于预设阈值的信息为第一结果;在第一结果中,按照匹配度大小确定预设个数的信息为目标信息。其中,功能可以例如为视频、音乐、有声、百科等。可选地,当播放设备为音频播放设备时,对应要查找的功能为音频资源对应的功能,例如,有声、音乐等。或者,当播放设备为显示设备时,对应要查找的功能为视频资源对应的功能,例如,百科、视频等。
可选地,当播放设备为音频播放设备时,第一种可能的实现方式中,上述在第一结果中,按照匹配度大小确定预设个数的信息为目标信息,可以包括:在第一结果中,确定匹配度最高的信息为目标信息。对应地,将目标信息通知给用户,可以包括:根据目标信息确定从文本到语音(Text To Speech,简称:TTS)的话术类型;通过音频播放设备,采用该话术类型将目标信息语音播放给用户。该实施例中,信息处理装置为具有音频播放功能的智能设备;或,信息处理装置为服务器,服务器将目标信息传输给具有音频播放功能的智能设备。
第二种可能的实现方式中,上述查找与关键词的匹配度大于预设阈值的信息为目标信息,可以包括:根据关键字,确定待查找的功能;在待查找的功能中,查找与关键词的匹配度大于预设阈值的信息为第二结果;确定第二结果中,匹配度最高的信息为目标信息。对应地,将目标信息通知给用户,可以包括:根据目标信息确定TTS的话术类型;通过音频播放设备,采用该话术类型将目标信息语音播放给用户。该实施例中,信息处理装置为具有音频播放功能的智能设备;或,信息处理装置为服务器,服务器将目标信息传输给具有音频播放功能的智能设备。
该实现方式与上述第一种可能的实现方式的区别在于:第一种可能的实现方式首先在不同的功能中,查找与关键词的匹配度大于预设阈值的信息为第一结果,之后在第一结果中,确定匹配度最高的信息为目标信息;第二种可能的实现方式首先根据关键字,确定待查找的功能,之后在该确定的待查找的功能中,查找与关键词的匹配度大于预设阈值的信息为第二结果,并确定第二结果中匹配度最高的信息为目标信息。
示例性地,上述话术类型可以为:
【音乐类】我没完全理解,但我为你找到了{关键词}相关的音乐内容,让我为你播放好不好?
【有声类】我没完全理解,但我为你找到了{关键词}相关的广播内容,让我为你播放好不好?
【百科类】我没完全理解,但我为你找到了{关键词}相关的介绍,让我为你播放好不好?
可选地,当播放设备为显示设备时,一种实现方式中,上述查找与关键词的匹配度大于预设阈值的信息为目标信息,可以包括:在不同的功能中,查找与关键词的匹配度大于预设阈值的信息为第一结果;在第一结果中,按照匹配度大小确定预设个数的信息为目标信息。对应地,将目标信息通知给用户,可以包括:通过显示设备显示目标信息给用户。该实施例中,信息处理装置可以为具有显示功能的智能设备;或,信息处理装置为服务器,服务器将目标信息传输给具有显示功能的智能设备。
另一种实现方式中,上述查找与关键词的匹配度大于预设阈值的信息为目标信息,可以包括:根据关键字,确定至少一待查找的功能;在至少一待查找的功能中,查找与关键词的匹配度大于预设阈值的信息为第三结果;在第三结果中,按照匹配度大小确定预设个数的信息为目标信息。对应地,将目标信息通知给用户,可以包括:通过显示设备显示目标信息给用户。该实施例中,信息处理装置可以为具有显示功能的智能设备;或,信息处理装置为服务器,服务器将目标信息传输给具有显示功能的智能设备。
该实现方式与上述实现方式的区别在于:一种实现方式首先在不同的功能中,查找与关键词的匹配度大于预设阈值的信息为第一结果,之后在第一结果中按照匹配度大小确定预设个数的信息为目标信息;该实现方式首先根据关键字,确定至少一待查找的功能,之后在该确定的至少一待查找的功能中,查找与关键词的匹配度大于预设阈值的信息为第三结果,并在第三结果中按照匹配度大小确定预设个数的信息为目标信息。
其中,上述两种实现方式中,预设个数的取值可根据历史经验或实际情况进行设置,例如,预设个数为3或4。可选地,当满足与关键词的匹配度大于预设阈值的信息的实际个数少于预设个数时,按照实际数量确定目标信息。
图2为本发明另一实施例提供的信息处理方法的流程图。该实施例中信息处理装置为具有显示功能的智能设备。参考图2,在图1所示实施例的基础上,S103、将目标信息通知给用户之后,该实施例中的信息处理方法还可以包括:
S201、接收用户的播放指令。
其中,该播放指令用于指定待播放的目标信息。
S202、播放播放指令对应的目标信息。
例如,播放指令可以为“播放”、“好”等肯定回答,此时,当目标信息为一个时,信息处理装置显示该目标信息对应的资源的内容;或者,当目标信息为多个时,信息处理装置默认显示该多个目标信息中排列在第一位的目标信息对应的资源的内容;或者,当目标信息有多个时,信息处理装置通过显示设备显示多个目标信息给用户之后,接收用户选择播放其中一个目标信息对应的资源的内容,例如,用户表达“播放第几个目标信息”,对应地,信息处理装置通过显示设备播放第几个目标信息或其对应的资源的内容。
示例一
智能设备端TTS,即智能设备通过音频播放设备(例如,扬声器)播放:我没完全理解,但我为你找到了{关键词}相关的内容,你想要播放第几个?
同时,智能设备通过显示设备显示:猜你可能想要“关键词”相关内容:内容1内容2,等等。
用户“播放”、“好"等肯定回答,播放第一个目标信息对应的资源的内容。
用户表达其他,退出多轮。
以下为本发明装置实施例,可以用于执行上述方法实施例。
图3为本发明一实施例提供的信息处理装置的结构示意图。本发明实施例提供一种信息处理装置,该信息处理装置可以通过软件和/或硬件的方式实现。该信息处理装置的具体描述可参考上述方法实施例,此处不再赘述。
如图3所示,信息处理装置30包括:处理模块31和通知模块32。其中:
该处理模块31,用于对接收到的目标语音信号进行语音识别处理,得到语音识别结果;及,在未匹配到与所述语音识别结果相同的信息时,查找与所述语音识别结果的匹配度大于预设阈值的信息为目标信息。
该通知模块,用于将所述目标信息通知给用户。
本实施例提供的信息处理装置,通过对接收到的目标语音信号进行语音识别处理,得到语音识别结果,并在未匹配到与该语音识别结果相同的信息时,查找与该语音识别结果的匹配度大于预设阈值的信息为目标信息,之后,将目标信息通知给用户,从而提供一种新的信息处理方案,为用户提供更多更智能的服务。
可选地,处理模块31在用于查找与所述语音识别结果的匹配度大于预设阈值的信息为目标信息时,可具体用于:提取所述语音识别结果中的关键词;查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息。
进一步地,处理模块31在查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息时,可具体用于:在不同的功能中,查找与所述关键词的匹配度大于所述预设阈值的信息为第一结果;在所述第一结果中,按照匹配度大小确定预设个数的信息为所述目标信息。
更进一步地,处理模块31用于在所述第一结果中,按照匹配度大小确定预设个数的信息为所述目标信息时,可具体用于:在所述第一结果中,确定匹配度最高的信息为所述目标信息。
另一种实现方式中,处理模块31在用于查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息时,可具体用于:根据所述关键字,确定待查找的功能;在所述待查找的功能中,查找与所述关键词的匹配度大于所述预设阈值的信息为第二结果;确定所述第二结果中,匹配度最高的信息为所述目标信息。
在上述基础上,通知模块32可具体用于:根据所述目标信息确定TTS的话术类型;通过音频播放设备,采用所述话术类型将所述目标信息语音播放给所述用户。
又一种实现方式中,处理模块31在用于查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息时,可具体用于:根据所述关键字,确定至少一待查找的功能;在所述至少一待查找的功能中,查找与所述关键词的匹配度大于所述预设阈值的信息为第三结果;在所述第三结果中,按照匹配度大小确定预设个数的信息为所述目标信息。
可选地,通知模块32可具体用于:通过显示设备,显示所述目标信息给所述用户。
图4为本发明另一实施例提供的信息处理装置的结构示意图。参考图4,在图3所示结构的基础上,信息处理装置40还可以包括:接收模块41。该接收模块41用于在通知模块32将所述目标信息通知给用户之后,接收用户的播放指令。其中,所述播放指令用于指定待播放的目标信息。对应地,通知模块32还可以用于播放所述播放指令对应的目标信息。
图5为本发明又一实施例提供的信息处理装置的结构示意图。如图5所示,该信息处理装置50包括:
至少一个处理器51和存储器52;
存储器52存储计算机执行指令;
至少一个处理器51执行存储器52存储的计算机执行指令,使得至少一个处理器51执行如上任一方法实施例。
处理器51的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
可选地,该信息处理装置50还包括通信部件53。其中,处理器51、存储器52以及通信部件53相互连接。信息处理装置50可以通过通信部件53与服务器或其它设备进行信息交互。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上所述的信息处理方法。
在上述的实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。
应理解,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其它通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称:ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于终端或服务器中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (12)

1.一种信息处理方法,其特征在于,包括:
对接收到的目标语音信号进行语音识别处理,得到语音识别结果;
若未匹配到与所述语音识别结果相同的信息,则查找与所述语音识别结果的匹配度大于预设阈值的信息为目标信息;
将所述目标信息通知给用户。
2.根据权利要求1所述的方法,其特征在于,所述查找与所述语音识别结果的匹配度大于预设阈值的信息为目标信息,包括:
提取所述语音识别结果中的关键词;
查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息。
3.根据权利要求2所述的方法,其特征在于,所述查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息,包括:
在不同的功能中,查找与所述关键词的匹配度大于所述预设阈值的信息为第一结果;
在所述第一结果中,按照匹配度大小确定预设个数的信息为所述目标信息。
4.根据权利要求3所述的方法,其特征在于,所述在所述第一结果中,按照匹配度大小确定预设个数的信息为所述目标信息,包括:
在所述第一结果中,确定匹配度最高的信息为所述目标信息。
5.根据权利要求2所述的方法,其特征在于,所述查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息,包括:
根据所述关键字,确定待查找的功能;
在所述待查找的功能中,查找与所述关键词的匹配度大于所述预设阈值的信息为第二结果;
确定所述第二结果中,匹配度最高的信息为所述目标信息。
6.根据权利要求4或5所述的方法,其特征在于,所述将所述目标信息通知给用户,包括:
根据所述目标信息确定从文本到语音TTS的话术类型;
通过音频播放设备,采用所述话术类型将所述目标信息语音播放给所述用户。
7.根据权利要求2所述的方法,其特征在于,所述查找与所述关键词的匹配度大于所述预设阈值的信息为所述目标信息,包括:
根据所述关键字,确定至少一待查找的功能;
在所述至少一待查找的功能中,查找与所述关键词的匹配度大于所述预设阈值的信息为第三结果;
在所述第三结果中,按照匹配度大小确定预设个数的信息为所述目标信息。
8.根据权利要求3或7所述的方法,其特征在于,所述将所述目标信息通知给用户,包括:
通过显示设备显示所述目标信息给所述用户。
9.根据权利要求1所述的方法,其特征在于,所述将所述目标信息通知给用户之后,还包括:
接收用户的播放指令,所述播放指令用于指定待播放的目标信息;
播放所述播放指令对应的目标信息。
10.一种信息处理装置,其特征在于,包括:
处理模块,用于对接收到的目标语音信号进行语音识别处理,得到语音识别结果;及,在未匹配到与所述语音识别结果相同的信息时,查找与所述语音识别结果的匹配度大于预设阈值的信息为目标信息;
通知模块,用于将所述目标信息通知给用户。
11.一种信息处理装置,其特征在于,包括:处理器和存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述计算机执行指令,使得所述信息处理装置执行如权利要求1至9任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至9任一项所述的方法。
CN201811293274.9A 2018-11-01 2018-11-01 信息处理方法、装置及存储介质 Pending CN109697244A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811293274.9A CN109697244A (zh) 2018-11-01 2018-11-01 信息处理方法、装置及存储介质
US16/564,122 US20200005767A1 (en) 2018-11-01 2019-09-09 Information processing method, apparatus and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811293274.9A CN109697244A (zh) 2018-11-01 2018-11-01 信息处理方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN109697244A true CN109697244A (zh) 2019-04-30

Family

ID=66230087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811293274.9A Pending CN109697244A (zh) 2018-11-01 2018-11-01 信息处理方法、装置及存储介质

Country Status (2)

Country Link
US (1) US20200005767A1 (zh)
CN (1) CN109697244A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111354334A (zh) * 2020-03-17 2020-06-30 北京百度网讯科技有限公司 语音输出方法、装置、设备和介质
CN113204669A (zh) * 2021-06-08 2021-08-03 武汉亿融信科科技有限公司 一种基于语音识别的短视频搜索推荐方法、系统及计算机存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112307162A (zh) * 2020-02-26 2021-02-02 北京字节跳动网络技术有限公司 用于信息交互的方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389400A (zh) * 2015-12-24 2016-03-09 Tcl集团股份有限公司 语音交互方法及装置
CN106098063A (zh) * 2016-07-01 2016-11-09 海信集团有限公司 一种语音控制方法、终端设备和服务器
CN107609101A (zh) * 2017-09-11 2018-01-19 远光软件股份有限公司 智能交互方法、设备及存储介质
KR20180040426A (ko) * 2016-10-12 2018-04-20 삼성전자주식회사 전자 장치 및 이의 제어 방법
CN108520748A (zh) * 2018-02-01 2018-09-11 百度在线网络技术(北京)有限公司 一种智能设备功能引导方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389400A (zh) * 2015-12-24 2016-03-09 Tcl集团股份有限公司 语音交互方法及装置
CN106098063A (zh) * 2016-07-01 2016-11-09 海信集团有限公司 一种语音控制方法、终端设备和服务器
KR20180040426A (ko) * 2016-10-12 2018-04-20 삼성전자주식회사 전자 장치 및 이의 제어 방법
CN107609101A (zh) * 2017-09-11 2018-01-19 远光软件股份有限公司 智能交互方法、设备及存储介质
CN108520748A (zh) * 2018-02-01 2018-09-11 百度在线网络技术(北京)有限公司 一种智能设备功能引导方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111354334A (zh) * 2020-03-17 2020-06-30 北京百度网讯科技有限公司 语音输出方法、装置、设备和介质
CN111354334B (zh) * 2020-03-17 2023-09-15 阿波罗智联(北京)科技有限公司 语音输出方法、装置、设备和介质
CN113204669A (zh) * 2021-06-08 2021-08-03 武汉亿融信科科技有限公司 一种基于语音识别的短视频搜索推荐方法、系统及计算机存储介质
CN113204669B (zh) * 2021-06-08 2022-12-06 以特心坊(深圳)科技有限公司 基于语音识别的短视频搜索推荐方法、系统及存储介质

Also Published As

Publication number Publication date
US20200005767A1 (en) 2020-01-02

Similar Documents

Publication Publication Date Title
EP3522151B1 (en) Method and device for processing dual-source audio data
US10811013B1 (en) Intent-specific automatic speech recognition result generation
CN107731219B (zh) 语音合成处理方法、装置及设备
CN109979450B (zh) 信息处理方法、装置及电子设备
CN109697244A (zh) 信息处理方法、装置及存储介质
JP7086137B2 (ja) 情報を表示する方法及び装置
US20140164371A1 (en) Extraction of media portions in association with correlated input
CN101689267A (zh) 基于语音输入的自然语言处理选择演示广告的系统和方法
CN104683852B (zh) 处理广播信息的方法和设备
CN108899036A (zh) 一种语音数据的处理方法及装置
CN105489072A (zh) 用于确定电子设备中增补内容的方法
WO2021115346A1 (zh) 媒体文件处理方法、装置、可读介质及电子设备
CN109710799B (zh) 语音交互方法、介质、装置和计算设备
CN108153875B (zh) 语料处理方法、装置、智能音箱和存储介质
CN111079423A (zh) 一种听写报读音频的生成方法、电子设备及存储介质
CN110334292A (zh) 页面处理方法、装置及设备
US20140161423A1 (en) Message composition of media portions in association with image content
CN109618229A (zh) 音视频的关联播放方法、装置、服务器及存储介质
CN109684497A (zh) 一种图文匹配的信息发送方法、装置及电子设备
US20140163956A1 (en) Message composition of media portions in association with correlated text
CN115640398A (zh) 评论生成模型训练方法、评论生成方法、设备及存储介质
CN113066480B (zh) 语音识别方法、装置、电子设备及存储介质
CN109492126B (zh) 一种智能交互方法及装置
CN110489674A (zh) 页面处理方法、装置及设备
CN110189752A (zh) 一种多意图的识别方法及装置、终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210520

Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant after: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd.

Applicant after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant before: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190430