CN110570837B - 一种语音交互方法、装置及存储介质 - Google Patents

一种语音交互方法、装置及存储介质 Download PDF

Info

Publication number
CN110570837B
CN110570837B CN201910804663.1A CN201910804663A CN110570837B CN 110570837 B CN110570837 B CN 110570837B CN 201910804663 A CN201910804663 A CN 201910804663A CN 110570837 B CN110570837 B CN 110570837B
Authority
CN
China
Prior art keywords
user
information
attribute
determining
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910804663.1A
Other languages
English (en)
Other versions
CN110570837A (zh
Inventor
蔡天琪
邓承
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuo Erzhi Lian Wuhan Research Institute Co Ltd
Original Assignee
Zhuo Erzhi Lian Wuhan Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuo Erzhi Lian Wuhan Research Institute Co Ltd filed Critical Zhuo Erzhi Lian Wuhan Research Institute Co Ltd
Priority to CN201910804663.1A priority Critical patent/CN110570837B/zh
Publication of CN110570837A publication Critical patent/CN110570837A/zh
Application granted granted Critical
Publication of CN110570837B publication Critical patent/CN110570837B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Abstract

本发明实施例公开了一种语音交互方法、装置及存储介质,其中,所述方法包括:获取用户的地方语音信息;对所述地方语音信息进行处理,得到官方语言;对所述官方语言中是否包含目标产品信息进行判断,得到判断结果;基于所述判断结果、所述用户的特征属性,确定所述用户的操作属性;其中,所述操作属性包括再次操作、操作前的咨询之一;基于所述用户的操作属性,生成推荐信息。

Description

一种语音交互方法、装置及存储介质
技术领域
本发明涉及智能语音领域,尤其涉及一种语音交互方法、装置及存储介质。
背景技术
目前的信息推荐都是通过用户的具体操作行为进行的,比如通过用户的搜索、浏览等行为进行各类信息的推荐。还没有出现通过语音交互的形式来进行信息推荐的应用场景。而对于语音交互而言,由于不同的地方的用户的口音不一样,导致在实际操作中通过语音交互来推荐信息存在很多困难。
发明内容
有鉴于此,本发明实施例期望提供一种语音交互方法、装置及存储介质,能够将用户的语音输入转化为官方语言,进而针对所述官方语言,生成推荐信息,从而实现通过语音交互来进行信息推荐。
为达到上述目的,本发明的技术方案是这样实现的:
本发明实施例提供一种语音交互方法,所述方法包括:
获取用户的地方语音信息;
对所述地方语音信息进行处理,得到官方语言;
对所述官方语言中是否包含目标产品信息进行判断,得到判断结果;
基于所述判断结果、所述用户的特征属性,确定所述用户的操作属性;其中,所述操作属性包括再次操作、操作前的咨询之一;
基于所述用户的操作属性,生成推荐信息。
在上述方案中,所述对所述地方语音信息进行处理,得到官方语言,包括:
获取所述用户的户籍信息;
基于所述户籍信息,确定所述户籍信息对应的地理位置;
基于所述户籍信息对应的地理位置,确定需要调用的语音识别数据库;
基于所述语音识别数据库对所述地方语音信息进行识别,得到官方语言。
在上述方案中,所述基于所述判断结果、所述用户的特征属性,确定所述用户的操作属性之前,所述方法包括:
获取所述用户的账号信息;
基于所述账号信息,确定所述用户的特征属性;其中,所述特征属性包括:第一类、第二类之一,所述第一类用于表征操作频次达到预设值,所述第二类用于表征操作频次未达到预设值。
在上述方案中,所述基于所述判断结果、所述用户的特征属性,确定所述用户的操作属性,包括:
确定所述判断结果为是,用户的特征属性为第一类,确定所述用户的操作属性为再次操作;
确定所述判断结果为否,用户的特征属性为第二类,确定所述用户的操作属性为操作前的咨询。
在上述方案中,所述基于所述用户的操作属性,生成推荐信息,包括:
确定所述用户的操作属性为再次操作,获取所述官方语言中包含的目标产品信息;
基于所述目标产品信息,获取与所述产品信息相关联的所述用户的历史操作信息;
基于所述历史操作信息,生成第一推荐信息。
在上述方案中,所述基于所述用户的操作属性,生成推荐信息,还包括:
确定所述用户的操作属性为操作前的咨询,获取所述用户的意图;
基于所述意图,得到产品类别,依据所述产品类别,获取与所述产品类别相关联的所述用户的历史操作信息以及所述用户的地址信息;
基于所述产品类别、与所述产品类别相关联的所述用户的历史操作信息以及所述用户的地址信息,生成第二推荐信息。
本发明实施例还提供一种语音交互装置,所述装置包括:获取单元、处理单元、判断单元、确定单元、生成单元;其中,
所述获取单元,用于获取用户的地方语音信息;
所述处理单元,用于对所述地方语音信息进行处理,得到官方语言;
所述判断单元,用于对所述官方语言中是否包含目标产品信息进行判断,得到判断结果;
所述确定单元,用于基于所述判断结果、所述用户的特征属性,确定所述用户的操作属性;其中,所述操作属性包括再次操作、操作前的咨询之一;
所述生成单元,用于基于所述操作属性,生成推荐信息。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的任一步骤。
本发明实施例还提供一种语音交互装置,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行上述方法的任一步骤。
本发明实施例提供的语音交互方法、装置及存储介质,通过获取用户的地方语音信息来进行信息推荐,以语音交互的形式增加了信息推荐方式的多样性;并且考虑到地方语音信息的不适配性,对地方语音信息进行了处理,转化为官方语言后再通过对官方语言中是否包含目标产品信息进行判断,结合判断结果及用户的特征属性确定出用户的操作属性,进而基于用户的操作属性,生成针对所述用户的推荐信息。如此,通过对语音信息的判断来确定了用户的操作属性,进而根据用户的操作属性能快速捕获用户的意图,使得信息推荐效率实现了大幅提升。
附图说明
图1为本发明实施例提供一种语音交互方法的实现流程示意图一;
图2为本发明实施例提供的将地方语音信息转换为官方语言的流程示意图;
图3为本发明实施例提供的一种语音交互方法的实现流程示意图二;
图4为本发明实施例提供的一种语音交互装置的结构示意图;
图5为本发明实施例提供的一种语音交互装置的具体硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了实现根据语音信息来推荐信息,本发明实施例提供一种语音交互方法,如图1所示,所述方法包括:
步骤101,获取用户的地方语音信息。
需要说明的是,所述语音交互方法可以应用于信息推荐平台,这里的信息推荐平台是指服务器侧的信息推荐平台。所述信息推荐平台的客户端/终端侧可以是附加在一种即时通讯软件上,通过即时通讯软件的语音识别功能来获取语音信息,无需下载单独的信息推荐平台的客户端/终端侧软件;如此,可以简化用户使用信息推荐平台的操作流程,提高操作效率。
这里,所述信息推荐平台的客户端附加在一种即时通讯软件上可以是以小程序的形式存在,用户在登录信息推荐平台的小程序后,可以进行语音输入。
还需要说明的是,所述地方语音信息是指方言,根据地理位置的不同,所述地方语音信息存在区别;所述地方语音信息包括:粤语、闽南语、客家语等。
这里,所述地方语音信息的获取可以是使用所述信息推荐平台的用户在终端侧的小程序上进行语音输入,所述信息推荐平台的小程序上的采集设备采集到地方语音信息后,将所述地方语音信息发送至信息推荐平台,由此所述信息推荐平台获取到地方语音信息。
步骤102,对所述地方语音信息进行处理,得到官方语言。
需要说明的是,所述官方语言是指一个国家通用的正式语言或认定的正式语言。因国家和地区范围界定不同,官方语言只是个相对概念,在本发明实施例中,所述官方语言是指普通话、中文汉字。
需要说明的是,一般在识别地方语音信息时,信息推荐平台会确定所述地方语音信息所的对应的用户所在的地区/省份,以地区/省份信息推测出该地方语音信息属于的语系,然后连接至相应的数据库进行特征比对和解析。例如,王某是广东人,信息推荐平台会把语音识别数据库调至粤语数据库。但是,在某些省与省的交界处的地方语音信息可能会和邻省的更相似,如果连接至本省的语音识别数据库,则语音识别效率和准确率都会变低;例如,如果识别用户为湖北十堰人,而湖北十堰的地方语音信息更接近于河南省的地方语音信息,则连接至河南省的语音识别数据库会更有利于识别的效率及准确率。
基于此,所述对所述地方语音信息进行处理,得到官方语言,包括:
获取所述用户的户籍信息;基于所述户籍信息,确定所述户籍信息对应的地理位置;基于所述户籍信息对应的地理位置,确定需要调用的语音识别数据库;基于所述语音识别数据库对所述地方语音信息进行识别,得到官方语言。
需要说明的是,为了防止某些地区交界处的地方语音信息的识别存在问题,需要确定用户所在的地理位置、户籍等信息,通过具体的地理位置、户籍来确定需要调用的语音识别数据库。
这里,所述户籍信息是指出生地信息;所述户籍信息可以是在用户在信息推荐平台上注册账号信息时获取得到。所述户籍信息对应的地理位置是指出生地对应的地理信息,这里的确定地理信息的除了是指确定方位,尤其还需要确定所述出生地是否处于地区与地区的交界处。例如,假设用户的户籍为湖北十堰,十堰对应的地理位置是中部,位于湖北西北部,与河南省相邻;假设用户的户籍为广东佛山,佛山对应的地理位置是南部,位于广东省内部,并未与其他省份相邻。
所述基于所述户籍信息,确定所述户籍信息对应的地理位置,可以是在获得户籍信息后,查询地图即可确定户籍信息对应的地理位置。
接着,在得到地理位置后,所述基于所述户籍信息对应的地理位置,确定需要调用的语音识别数据库可以是:判断所述地理位置是否处于边界地带;确定属于边界地带,则进一步确定属于哪些地区的边界,根据确定的地区来调用对应的语音识别数据库;确定不属于边界地带,则调用所述地理位置对应的语音识别数据库。
需要说明的是,上述判断所述地理位置是否处于边界地带可以是以户籍地点为中心,预设距离为半径来作圆,当圆中包括有其他地区,则认为所述地理位置处于边界地带;当圆中不包括有其他地区,则认为所述地理位置未处于边界地带。这里,预设半径可以根据需要来确定,如设置预设半径为30公里。
所述语音识别数据库包括粤语识别数据库、闽南语识别数据库、客家语识别数据库等。各类语音识别数据库中包含有各类地方语音信息的特征,通过将获取到的地方语音信息与语音识别数据库进行特征比对及解析即可确定该地方语音信息的内容,以及将地方语音信息转换为对应的普通话,或者文字信息,以便于信息推荐平台根据转化后的官方语言来进行信息推荐。
需要说明的是,所述语音识别数据库可以是所述信息推荐平台中预先配置的。所述语音识别数据库中可以存储有映射表,通过查询映射表即可知道地方语音信息与官方语言的对应关系。如此,上述基于所述语音识别数据库对所述地方语音信息进行识别,得到官方语言可以是查询所述语音识别数据库中存储的映射表即可得到。
还需要说明的是,当所述地理位置是处于交界处时,需要将交界处所涉及的所有的地方语音信息的特征数据都纳入需要调用的语音识别数据库,即此时调用的语音识别数据库包括多种语音识别数据库。
图2为本发明实施例提供的将地方语音信息转换为官方语言的流程示意图;如图2所示,所述方法主要包括以下步骤:
步骤201,获取用户的户籍信息,确定户籍信息对应的地理位置。
步骤202,判断地理位置是否处于边界地带;若是,转入步骤203,若否,转入步骤204。
步骤203,调用户籍信息对应的地理位置所属于的地区以及相邻地区的语音识别数据库;
步骤204,调用户籍信息对应的地理位置所属于的地区的语音识别数据库。
步骤205,对地方语音信息进行处理,得到官方语言。
需要说明的是,上述步骤102中,对所述地方语音信息进行处理,得到官方语言还可以是通过构建语音识别模型来实现,通过搜集各地区的地方语音信息,提取各地区的地方语音信息的特征,基于提取的特征建立语音识别模型,进而直接通过建立的语音识别模型对获取的地方语音信息进行识别,判断所述地方语音信息是属于哪一地区,再通过调用相应的语音识别数据库进行特征比对及解析得到官方语言。
这里,上述搜集各地区的地方语音信息可以是通过在各个城市都采集100个语音素材,通过样本的多样性来保证提取的特征的全面性。
还需要说明的是,如果采用的语音识别模型来实现的直接识别,所述语音识别模型可以是混合声学模型、混合高斯模型-隐马尔可夫模型等。
步骤103,对所述官方语言中是否包含目标产品信息进行判断,得到判断结果。
这里,由于在上述步骤102中已识别得到了地方语音信息对应的官方语言,那么直接通过产品识别模型对所述官方语言进行识别即可实现对官方语言中是否包含目标产品信息的判断。
需要说明的是,对于官方语言的识别来说,如果官方语言是文本信息的形式,即官方语言为中文汉字,那么所述产品识别模型的构建可以是通过提取与目标产品相关的关键字来实现,如提取目标产品的名称,基于目标产品的名称构建产品识别模型。对应的,在得到产品识别模型后,通过所述产品识别模型对官方语言进行处理,输出判断结果。所述处理结果可以通过“是/否”、“1/0”等来表示;“1”即表示“是”,“0”即表示“否”。
如果官方语言是以语音的形式呈现,即官方语言为普通话,则可以先将语音转化为文字,进而通过上述的产品识别模型进行处理,得到判断结果。
这里,将语音转化为文字可以是获取官方语言的声音波形,从声音波形中提取声学特征,再将声学特征转换成因素,进而再将因素转为文本信息来实现。所述音素是人发音的基本单位。常用的英文音素是一套39个音素组成的集合。常用的汉语音素就是汉语拼音的生母和韵母组成的音素集合。
需要说明的是,由于声音实际上一种波,可以对声音进行分帧;分帧后,音频数据就变成了很多小的片段,然后针对小片段进行声学特征提取。常见的提取声学特征的方法有:线性预测编码(Linear Predictive Coding,LPC),梅尔频率倒谱系数(Mel-frequencyCepstrum,MC)等。
上述将声学特征转换成音素可以通过声学模型实现;所述声学模型可以是长短期记忆(Long Short Term Memory,LSTM)模型与连接时序分类器(connectionist temporalclassifier,CTC)组成的神经网络模型。上述将音素转文本信息可以是在得到声音的音素序列后,使用语言模型等解码技术将音素序列转换成文本信息。
步骤104,基于所述判断结果、所述用户的特征属性,确定所述用户的操作属性;其中,所述操作属性包括再次操作、操作前的咨询之一。
需要说明的是,所述操作属性用于表征用户在所述信息推荐平台上对应的类别。所述再次操作是指再次使用该信息推荐平台,所述操作前的咨询是指在操作前向信息推荐平台咨询信息。这里,当所述信息推荐平台用于产品类信息的推荐时,所述操作即为购买产品,所述再次操作即为回购产品,所述操作前的咨询即为售前咨询。
这里,所述用户的操作属性的确定可以是通过用户使用该信息推荐平台的频次以及用户的地方语言信息中是否存在目标产品信息来决定。换句话说,如果用户使用该信息推荐平台的频次很高,且此次采集到的用户的地方语音数据中直接存在目标产品信息,那么就可以认为用户是回购产品。相对应的,如果用户使用该信息推荐平台的频次很低,且此次采集到的用户的地方语音数据中不存在目标产品信息,那么就可以认为用户此次只是想进行售前咨询。
基于此,在确定所述官方语言对应的用户的操作属性之前,需要先确定用户使用该信息推荐平台的频次,即操作频次,这里通过用户的特征属性的类别来表征操作频次。
如此,所述方法包括:获取所述用户的账号信息;基于所述账号信息,确定所述用户的特征属性;其中,所述特征属性包括:第一类、第二类之一,所述第一类用于表征操作频次达到预设值,所述第二类用于表征操作频次未达到预设值。
需要说明的是,对于已多次在所述信息推荐平台上进行操作的用户而言,再次使用所述信息推荐平台的目的更多的在于回购。而对于第一次或者说很少使用该信息推荐平台的用户而言,由于使用过少,则使用的目的更多的在于咨询。
还需要说明的是,基于所述账号信息,确定所述用户的特征属性可以是通过用户的账户信息得到所述账户信息对应的操作信息;其中,所述操作信息包括操作时间、操作次数;基于所述操作信息的操作时间、操作次数来确定操作频次,基于操作频次,确定所述用户的特征属性。
这里,当所述信息推荐平台用于产品类信息的推荐时,所述账户信息对应的操作信息即为该账户信息下的订单信息,通过查询用户的订单信息可以确定用户在所述信息推荐平台上进行操作的时间、次数,基于操作的时间、次数即可确定出操作频次,进而确定所述用户的特征属性。
上述操作频次达到预设值中的预设值可以根据实际情况来确定,例如,可以设置每月在所述信息推荐平台上的操作次数达到3次即认为用户的特征属性为第一类。相对应的,未达到3次即认为用户的特征属性为第二类。
在完成对所述官方语言中是否包含目标产品信息的判断、以及完成对用户的特征属性的确定后,即可基于判断结果、用户的特征属性来确定用户的操作属性。这里,上述基于判断结果、用户的特征属性来确定用户的操作属性,包括:
确定所述判断结果为是,所述用户的特征属性为第一类,确定所述用户的操作属性为再次操作;确定所述判断结果为否,所述用户的特征属性为第二类,确定所述用户的操作属性为操作前的咨询。
步骤105,基于所述用户的操作属性,生成推荐信息。
这里,由于用户的操作属性存在不同,则进行信息推荐的形式、内容都会存在不同。
对于用户的操作属性为再次操作的情况:所述基于所述操作属性,生成推荐信息,包括:确定所述用户的操作属性为再次操作,获取所述官方语言中包含的目标产品信息;基于所述目标产品信息,获取与所述产品信息相关联的所述用户的历史操作信息;基于所述历史操作信息,生成第一推荐信息。
这里,所述官方语言中包含的目标产品信息为用户的期望添置的具体的产品信息;所述目标产品信息包含产品名称、品牌、规格、数量、目标送达时间等。对于操作属性为再次操作的用户而言,由于是为了回购,那么所述用户在登陆信息推荐平台后,输入的地方语音信息中会包含他想要添置的产品信息。如此,通过识别上述用户的地方语音信息对应的官方语言即可获取所包含的目标产品信息。
需要说明的是,所述用户的历史操作信息为用户之前在所述信息推荐平台上进行操作所产生的信息。当所述信息推荐平台用于产品类信息的推荐时,则所述历史操作信息为历史订单信息。基于此,上述获取与所述目标产品信息相关联的所述用户的历史操作信息是指在用户的历史订单中查询出与目标产品信息相关联的历史订单,进而根据所述历史订单,生成推荐信息。
作为一个示例,假设用户之前已经多次在所述信息推荐平台上购买过某品牌的洗衣液,那么,当在此次的官方语言中获取到的目标产品信息为该品牌的洗衣液,则可以结合用户关于该品牌的洗衣液的历史购买记录,将之前所购买的该品牌洗衣液推荐给用户。这里,所述第一推荐信息即为该品牌的洗衣液的信息。
还需要说明的是,由于用户的操作属性为再次操作,即回购,那么在生成第一推荐信息的同时,可以基于所述第一推荐信息生成推荐订单,并发送给用户进行确认;当接收到用户的确认后,即可通知相应的商家准备货品。
对于用户的操作属性为操作前的咨询的情况:所述基于所述用户的操作属性,生成推荐信息,包括:确定所述用户的操作属性为操作前的咨询,获取所述用户的意图;基于所述意图,得到产品类别;基于所述产品类别,获取与所述产品类别相关联的所述用户的历史操作信息以及用户的地址信息;基于所述产品类别、与所述产品类别相关联的所述用户的历史操作信息以及地址信息,生成第二推荐信息。
需要说明的是,所述用户的意图是指用户使用所述信息推荐平台的目地。在登陆信息推荐平台后,输入的地方语音信息中会包含用户的意图,可以通过用户的意图来确定出用户的感兴趣的产品类别。
这里,所述用户的意图的获取可以基于用户的地方语音信息对应的官方语言的类型以及包含的关键字来实现;当识别到所述官方语言的类型为疑问语句或者需求语句之一,且所述疑问句中包含“能给我推荐…吗”等关键字、所述需求语句中包含“我想要…”等关键字,则认为用户的意图为期望被推荐某种产品。
在了解用户的意图后,可基于所述意图进一步得到产品类别。这里,一般而言,所述疑问句中“能给我推荐…吗”的关键词后面的词即为产品类别;相对应的,所述需求语句中包含“我想要…”的关键词后面的词即为产品类别。例如,当官方语言为疑问语句:能给我推荐一种洗衣液吗?或者当官方语言为需求语句:我想要洗衣液,则产品类别为洗衣液,可以确定用户的意图是期望所述信息推荐平台能推荐一种洗衣液。
这里,上述基于所述意图,得到产品类别同样可以通过对官方语句进行识别,通过提取官方语句中的关键词得到产品类别。如,提取产品类别的关键词,基于提取的关键词构建关键词识别模型,通过构建的关键词识别模型对官方语言进行处理,确定产品类别。关于具体的提取过程在此不作赘述。
在得到产品类别后,可以结合与所述产品类别相关联的所述用户的历史操作信息以及用户的地址信息来实现推荐。这里与所述产品信类别相关联的所述用户的历史操作信息是指在用户的历史订单中查询出与产品类别相关联的历史操作信息。
这里,当用户的历史操作信息中有与产品类别相关的历史操作信息时,即可将与所述产品类别相关联的所述用户的历史操作信息中的店铺信息、品牌信息或者产品信息推荐给用户。
需要说明的是,由于用户的操作属性为操作前的咨询,即用户在所述信息推荐平台上的操作频次较低,那么获取的用户的历史操作信息的数量对应的也会很少,实际操作中,很可能无法获取到与所述产品类别相关联的历史操作信息,此时就可以进一步获取用户的地址信息;通过获取的地址信息来进行信息推荐。
这里,通过地址信息来推荐可以将离用户地址信息较近的、与产品类别有关的店铺信息向用户进行推荐。由于是按距离实现的推荐,用户可以享受到便捷、快速的服务。
作为一个示例,当获取到的产品类别为洗衣液,则进一步获取与洗衣液相关联的用户的历史订单,以及用户的地址信息;当在用户的历史订单中可以找到与洗衣液相关联的历史订单时,则将与洗衣液相关联的历史订单中的产品信息推荐给用户;当在用户的历史订单中无法找到与洗衣液相关联的历史订单时,则进一步获取用户的地址信息;将离所述地址信息较近的、有洗衣液出售的店铺信息中的洗衣液推荐给用户。
进一步地,所述推荐信息可以以推荐列表的形式进行显示,当然还可以是其他形式,例如文字信息的形式。
其中,所述推荐列表可以以单位参数、总存储数量、距离用户的地址信息的远近、总操作次数、用户的历史操作频次之一进行排序显示。
这里,以单位参数进行排序显示是指以单位参数的高低来进行排序显示。以产品的推荐操作为例,可以是按照相同类型的产品以价格的高低进行排序显示。
所述以总存储数量进行排序显示是以店铺的存储数量的大小进行排序。
所述以距离用户的地址信息的远近进行排序显示是以店铺的地址信息距离用户的地址信息的距离远近进行排序。
所述以总操作次数进行排序显示是以用户的目标产品的总操作次数的大小进行排序;以产品的推荐操作为例,则是以用户的目标产品的总销量的大小进行排序。
所述以用户的历史操作频次进行排序显示是指依据用户的对某一产品的历史操作次数来进行排序显示;以产品的推荐操作为例,则是以用户的历史购买次数来进行排序显示。
需要说明的是,所述推荐列表以单位参数进行排序显示,包括:接收所述用户选择的单位参数区间;基于选择的单位参数区间,在单位参数区间内以单位参数的大小进行排序显示。
还需要说明的是,在以距离用户的地址信息的远近进行排序显示时,还可以结合该店铺的总操作次数一起来进行排序显示。例如,当两个店铺离用户的地址信息的距离相同时,则可根据店铺的总操作次数来进行排序。这里,以产品的推荐操作为例,当距离一样时,当同样销售某产品的店铺的目标产品的总销量大于另一家时,则该店铺排在另一家的前面。
本发明实施例提供的语音交互方法,通过获取用户的地方语音信息来进行信息推荐,以语音交互的形式增加了信息推荐方式的多样性;并且考虑到地方语音信息的不适配性,对地方语音信息进行了处理,转化为官方语言后再通过对官方语言中是否包含目标产品信息进行判断,结合判断结果及用户的特征属性确定出用户的操作属性,进而基于用户的操作属性,生成针对所述用户的推荐信息。如此,通过对语音信息的判断来确定了用户的操作属性,进而根据用户的操作属性能快速捕获用户的意图,使得信息推荐效率实现了大幅提升。
本发明实施例提供一种语音交互方法,图3为本发明实施例提供的一种语音交互方法的实现流程示意图二,如图3所示,该方法主要包括以下步骤:
步骤301,获取地方语音信息,识别地方语音信息得到官方语言。
步骤302,获取用户的账号信息,基于账号信息,确定用户的操作频次。
步骤303,判断用户的操作频次是否达到预设值;若是,转入步骤304;若否,转入步骤306。
步骤304,判断官方语言中是否包含目标产品信息;若是,转入步骤305;若否,转入步骤306。
步骤305,确定用户的操作属性为再次操作,完成对应的操作。
步骤306,判断官方语言是否为疑问句;若是,转入步骤307;若否,转入步骤308。
步骤307,判断官方语言中是否包含产品类别;若是,转入步骤309;若否,转入步骤310。
步骤308,判断官方语言是否为需求语句;若是,转入步骤307;若否,结束流程。
步骤309,确定用户的操作属性为操作前的咨询,完成对应的操作。
步骤310,调用其他模块执行处理;结束流程。
本发明实施例提供的语音交互方法,通过获取用户的地方语音信息来进行信息推荐,以语音交互的形式增加了信息推荐方式的多样性;并且考虑到地方语音信息的不适配性,对地方语音信息进行了处理,转化为官方语言后再通过对官方语言中是否包含目标产品信息进行判断,结合判断结果及用户的特征属性确定出用户的操作属性,进而基于用户的操作属性,生成针对所述用户的推荐信息。如此,通过对语音信息的判断来确定了用户的操作属性,进而根据用户的操作属性能快速捕获用户的意图,使得信息推荐效率实现了大幅提升。
基于上述实施例的同一发明构思,本发明实施例提供一种语音交互装置,图4为本发明实施例提供的一种语音交互装置400的结构示意图,如图4所示,所述语音交互装置400包括:获取单元401单元、处理单元402元、判断单元403、确定单元404、生成单元405;其中,
所述获取单元401,用于获取用户的地方语音信息;
所述处理单元402,用于对所述地方语音信息进行处理,得到官方语言;
所述判断单元403,用于对所述官方语言中是否包含目标产品信息进行判断,得到判断结果;
所述确定单元404,用于基于所述判断结果、所述用户的特征属性,确定所述用户的操作属性;其中,所述操作属性包括再次操作、操作前的咨询之一;所述生成单元405,用于基于所述用户的操作属性,生成推荐信息。
需要说明的是,所述处理单元402,还用于获取所述用户的户籍信息;基于所述户籍信息,确定所述户籍信息对应的地理位置;基于所述户籍信息对应的地理位置,确定需要调用的语音识别数据库;基于所述语音识别数据库对所述地方语音信息进行识别,得到官方语言。
需要说明的是,所述语音交互装置400包括特征属性确定单元,所述特征属性确定单元,用于获取所述用户的账号信息;基于所述账号信息,确定所述用户的特征属性;其中,所述特征属性包括:第一类、第二类之一,所述第一类用于表征操作频次达到预设值,所述第二类用于表征操作频次未达到预设值。
还需要说明的是,所述确定单元404,还用于确定所述判断结果为是,用户的特征属性为第一类,确定所述用户的操作属性为再次操作;确定所述判断结果为否,用户的特征属性为第二类,确定所述用户的操作属性为操作前的咨询。
所述生成单元405,包括第一生成单元、第二生成单元;其中,所述第一生成单元,用于确定所述用户的操作属性为再次操作,获取所述官方语言中包含的目标产品信息;基于所述目标产品信息,获取与所述目标产品信息相关联的所述用户的历史操作信息;基于所述历史操作信息,生成第一推荐信息。
所述第二生成单元,用于确定所述用户的操作属性为操作前的咨询,获取所述用户的意图;基于所述意图,得到产品类别,依据所述产品类别,获取与所述产品类别相关联的所述用户的历史操作信息以及所述用户的地址信息;基于所述产品类别、与所述产品类别相关联的所述用户的历史操作信息以及所述用户的地址信息,生成第二推荐信息。
还需要说明的是,由于所述语音交互装置400解决问题的原理与前述语音交互方法相似,因此,所述语音交互装置400的具体实施过程及实施原理均可以参见前述方法和实施过程,重复之处不再赘述。
本发明实施例提供的语音交互装置,通过获取用户的地方语音信息来进行信息推荐,以语音交互的形式增加了信息推荐方式的多样性;并且考虑到地方语音信息的不适配性,对地方语音信息进行了处理,转化为官方语言后再通过对官方语言中是否包含目标产品信息进行判断,结合判断结果及用户的特征属性确定出用户的操作属性,进而基于用户的操作属性,生成针对所述用户的推荐信息。如此,通过对语音信息的判断来确定了用户的操作属性,进而根据用户的操作属性能快速捕获用户的意图,使得信息推荐效率实现了大幅提升。
在本发明实施例中的各组成部分可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时,可以存储在一个计算机可读取存储介质中,基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或processor(处理器)执行本发明实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
因此,本发明实施例提供了一种计算机存储介质,该计算机存储介质存储有计算机程序,所述计算机程序被至少一个处理器执行时实现上述实施例所述的步骤。
参见图5,示出了本发明实施例提供的一种语音交互装置500的具体硬件结构,包括:网络接口501、存储器502和处理器503;各个组件通过总线系统504耦合在一起。可理解,总线系统504用于实现这些组件之间的连接通信。总线系统504除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为总线系统504。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (7)

1.一种语音交互方法,其特征在于,所述方法包括:
获取用户的地方语音信息;
对所述地方语音信息进行处理,得到官方语言;
对所述官方语言中是否包含目标产品信息进行判断,得到判断结果;
获取所述用户的账号信息;
基于所述账号信息,确定所述用户的特征属性;其中,所述特征属性包括第一类、第二类之一,所述第一类用于表征操作频次达到预设值,所述第二类用于表征操作频次未达到预设值;
确定所述判断结果为是,用户的特征属性为第一类,确定所述用户的操作属性为再次操作;
确定所述判断结果为否,用户的特征属性为第二类,确定所述用户的操作属性为操作前的咨询;
基于所述用户的操作属性,生成推荐信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述地方语音信息进行处理,得到官方语言,包括:
获取所述用户的户籍信息;
基于所述户籍信息,确定所述户籍信息对应的地理位置;
基于所述户籍信息对应的地理位置,确定需要调用的语音识别数据库;
基于所述语音识别数据库对所述地方语音信息进行识别,得到官方语言。
3.根据权利要求1所述的方法,其特征在于,所述基于所述用户的操作属性,生成推荐信息,包括:
确定所述用户的操作属性为再次操作,获取所述官方语言中包含的目标产品信息;
基于所述目标产品信息,获取与所述目标产品信息相关联的所述用户的历史操作信息;
基于所述历史操作信息,生成第一推荐信息。
4.根据权利要求3所述的方法,其特征在于,所述基于所述用户的操作属性,生成推荐信息,还包括:
确定所述用户的操作属性为操作前的咨询,获取所述用户的意图;
基于所述意图,得到产品类别,依据所述产品类别,获取与所述产品类别相关联的所述用户的历史操作信息以及所述用户的地址信息;
基于所述产品类别、与所述产品类别相关联的所述用户的历史操作信息以及所述用户的地址信息,生成第二推荐信息。
5.一种语音交互装置,其特征在于,所述装置包括:获取单元、处理单元、判断单元、确定单元、生成单元;其中,
所述获取单元,用于获取用户的地方语音信息;
所述处理单元,用于对所述地方语音信息进行处理,得到官方语言;
所述判断单元,用于对所述官方语言中是否包含目标产品信息进行判断,得到判断结果;
所述确定单元,用于获取所述用户的账号信息;基于所述账号信息,确定所述用户的特征属性;其中,所述特征属性包括第一类、第二类之一,所述第一类用于表征操作频次达到预设值,所述第二类用于表征操作频次未达到预设值;确定所述判断结果为是,用户的特征属性为第一类,确定所述用户的操作属性为再次操作;确定所述判断结果为否,用户的特征属性为第二类,确定所述用户的操作属性为操作前的咨询;
所述生成单元,用于基于所述用户的操作属性,生成推荐信息。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4任一项所述方法的步骤。
7.一种语音交互装置,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行权利要求1至4任一项所述方法的步骤。
CN201910804663.1A 2019-08-28 2019-08-28 一种语音交互方法、装置及存储介质 Active CN110570837B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910804663.1A CN110570837B (zh) 2019-08-28 2019-08-28 一种语音交互方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910804663.1A CN110570837B (zh) 2019-08-28 2019-08-28 一种语音交互方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110570837A CN110570837A (zh) 2019-12-13
CN110570837B true CN110570837B (zh) 2022-03-11

Family

ID=68776617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910804663.1A Active CN110570837B (zh) 2019-08-28 2019-08-28 一种语音交互方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110570837B (zh)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239459B (zh) * 2014-09-02 2018-03-09 百度在线网络技术(北京)有限公司 语音搜索方法、装置和系统
CN105868255A (zh) * 2015-12-25 2016-08-17 乐视网信息技术(北京)股份有限公司 查询推荐方法及装置
CN106251859B (zh) * 2016-07-22 2019-05-31 百度在线网络技术(北京)有限公司 语音识别处理方法和装置
CN107170454B (zh) * 2017-05-31 2022-04-05 Oppo广东移动通信有限公司 语音识别方法及相关产品
CN107274885B (zh) * 2017-05-31 2020-05-26 Oppo广东移动通信有限公司 语音识别方法及相关产品
CN107885836B (zh) * 2017-11-09 2021-12-07 广东小天才科技有限公司 一种用于智能终端的应用程序推荐方法及装置
CN107886949B (zh) * 2017-11-24 2021-04-30 科大讯飞股份有限公司 一种内容推荐方法及装置
KR102540001B1 (ko) * 2018-01-29 2023-06-05 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 화면 표시방법
CN108922520B (zh) * 2018-07-12 2021-06-01 Oppo广东移动通信有限公司 语音识别方法、装置、存储介质及电子设备
CN109640142B (zh) * 2018-12-21 2021-08-06 咪咕数字传媒有限公司 一种内容推荐方法及装置、设备、存储介质
CN109660672A (zh) * 2019-01-09 2019-04-19 浙江强脑科技有限公司 语音类型的转换方法、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN110570837A (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
US11030412B2 (en) System and method for chatbot conversation construction and management
US20170164049A1 (en) Recommending method and device thereof
CN107391493B (zh) 一种舆情信息提取方法、装置、终端设备及存储介质
CN104794122A (zh) 一种位置信息推荐方法、装置和系统
CN110110038B (zh) 话务预测方法、装置、服务器及存储介质
CN111625632A (zh) 一种问答对推荐方法、装置、设备及存储介质
CN110597952A (zh) 信息处理方法、服务器及计算机存储介质
WO2020015479A1 (zh) 播报语音的确定方法、装置和设备
JP2020521210A (ja) 情報処理方法及び端末、コンピュータ記憶媒体
CN109961786B (zh) 基于语音分析的产品推荐方法、装置、设备和存储介质
CN111291158B (zh) 一种信息查询方法、装置、电子设备及存储介质
CN109033075A (zh) 意图匹配的方法、装置、存储介质和终端设备
CN112256845A (zh) 意图识别方法、装置、电子设备和计算机可读存储介质
CN113570413A (zh) 广告关键词的生成方法、装置、存储介质及电子设备
CN111611358A (zh) 信息交互方法、装置、电子设备及存储介质
CN110457454A (zh) 一种对话方法、服务器、对话系统及存储介质
CN111429157A (zh) 投诉工单的评价处理方法、装置、设备及存储介质
CN110187780B (zh) 长文本预测方法、装置、设备和存储介质
CN113051380A (zh) 信息生成方法、装置、电子设备和存储介质
CN112364622A (zh) 对话文本分析方法、装置、电子装置及存储介质
CN113111264B (zh) 界面内容显示方法、装置、电子设备及存储介质
CN111209367A (zh) 信息查找方法、信息查找装置、电子设备及存储介质
CN108305629B (zh) 一种场景学习内容获取方法、装置、学习设备及存储介质
CN113297365A (zh) 一种用户意向判定方法、装置、设备及存储介质
CN108595141A (zh) 语音输入方法及装置、计算机装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant