CN109919657A - 用户需求信息的获取方法、装置、存储介质及语音设备 - Google Patents
用户需求信息的获取方法、装置、存储介质及语音设备 Download PDFInfo
- Publication number
- CN109919657A CN109919657A CN201910069186.9A CN201910069186A CN109919657A CN 109919657 A CN109919657 A CN 109919657A CN 201910069186 A CN201910069186 A CN 201910069186A CN 109919657 A CN109919657 A CN 109919657A
- Authority
- CN
- China
- Prior art keywords
- user
- article
- information
- speech
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012545 processing Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 12
- 230000001755 vocal effect Effects 0.000 description 12
- 238000004378 air conditioning Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000004140 cleaning Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种用户需求信息的获取方法、装置、存储介质及语音设备,所述方法包括:包括:获取至少一个用户的用户语音信息所对应的用户语音文本信息以及至少一种物品的物品信息;所述用户语音信息,包括:所述至少一个用户的与所述至少一种物品相关的语音信息;将所述至少一个用户的用户语音文本信息与所述至少一种物品的物品信息进行匹配,以匹配出所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词;根据所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词,确定所述至少一个用户对所述至少一种物品的需求信息。本发明提供的方案能够根据用户语音信息获取用户对物品的需求信息。
Description
技术领域
本发明涉及控制领域,尤其涉及一种用户需求信息的获取方法、装置、存储介质及语音设备。
背景技术
如今,语音助手的应用越来越广泛,比如智能音箱、百科问答、智能导航、导购、导游等领域。语音助手的兴起,不仅仅在于给人们的生活带来了的便利,更高的是其中的信息价值。通过分析用户在语音问答的过程中问到的问题,可以挖掘出很多有用的价值。但如今我们却没有好好将这些信息利用。
发明内容
本发明的主要目的在于克服上述现有技术的缺陷,提供一种用户需求信息的获取方法、装置、存储介质及语音设备,以解决现有技术中用户语音可以挖掘出很多信息,但没有被好好利用的问题。
本发明一方面提供了一种用户需求信息的获取方法,包括:获取至少一个用户的用户语音信息所对应的用户语音文本信息以及至少一种物品的物品信息;所述用户语音信息,包括:所述至少一个用户的与所述至少一种物品相关的语音信息;将所述至少一个用户的用户语音文本信息与所述至少一种物品的物品信息进行匹配,以匹配出所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词;根据所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词,确定所述至少一个用户对所述至少一种物品的需求信息。
可选地,将所述至少一个用户的用户语音文本信息与所述至少一种物品的信息进行匹配,以匹配出所述至少一个用户的用户语音文本信中与所述至少一种物品的物品信息匹配的关键词,包括:对所述至少一个用户的用户语音文本信息进行断句处理后,查找断句处理后的所述至少一个用户的用户语音文本信息中与所述至少一个物品的物品信息匹配的关键词。
可选地,根据所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词,获取所述至少一个用户对所述至少一种物品的需求信息,包括:统计所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的每一个关键词的出现概率,以根据所述每一个关键词的出现概率获取所述至少一个用户对所述至少一种物品的需求信息。
可选地,还包括:根据所述至少一个用户的用户语音信息对所述至少一个用户进行特征分析,以确定所述至少一种物品中每种物品的目标用户的特征信息。
可选地,根据所述至少一个用户的用户语音信息对所述至少一个用户进行特征分析,以确定所述至少一种物品中每种物品的目标用户的特征信息,包括:对所述至少一个用户的用户语音信息进行语义分析,以得到所述至少一个用户中的每个用户对所述至少一种物品中的每种物品的关注度;对所述至少一个用户的用户语音信息进行分析,以得到所述至少一个用户中的每个用户的特征信息;根据所述每个用户对所述至少一种物品中的每种物品的关注度以及所述每个用户的特征信息,统计出所述至少一种物品中的每种物品的目标用户的特征信息。
可选地,根据所述每个用户对所述至少一种物品中的每种物品的关注度以及所述每个用户的特征信息,统计出所述至少一种物品中的每种物品的目标用户的特征信息,包括:针对所述至少一种物品中的每种物品,获取所述至少一个用户中对该物品的关注度高于预设阈值的用户的特征信息,并根据对该物品的关注度高于预设阈值的用户的特征信息,统计该物品的目标用户的特征信息。
可选地,所述特征信息,包括:性别、年龄、性格和籍贯中的至少之一。
本发明另一方面提供了一种用户需求信息的获取装置,包括:获取单元,用于获取至少一个用户的用户语音信息所对应的用户语音文本信息以及至少一种物品的物品信息;所述用户语音信息,包括:所述至少一个用户的与所述至少一种物品相关的语音信息;匹配单元,用于将所述至少一个用户的用户语音文本信息与所述至少一种物品的物品信息进行匹配,以匹配出所述至少一个用户的用户语音文本信中与所述至少一种物品的物品信息匹配的关键词;确定单元,用于根据所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词,确定所述至少一个用户对所述至少一种物品的需求信息。
可选地,所述匹配单元,进一步用于:对所述至少一个用户的用户语音文本信息进行断句处理后,查找断句处理后的所述至少一个用户的用户语音文本信息中与所述至少一个物品的物品信息匹配的关键词。
可选地,所述确定单元,进一步用于:统计所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的每一个关键词的出现概率,以根据所述每一个关键词的出现概率获取所述至少一个用户对所述至少一种物品的需求信息。
可选地,还包括:分析单元,用于根据所述至少一个用户的用户语音信息对所述至少一个用户进行特征分析,以确定所述至少一种物品中每种物品的目标用户的特征信息。
可选地,所述分析单元,包括:语义分析单元,用于对所述至少一个用户的用户语音信息进行语义分析,以得到所述至少一个用户中的每个用户对所述至少一种物品中的每种物品的关注度;特征分析单元,用于对所述至少一个用户的用户语音信息进行分析,以得到所述至少一个用户中的每个用户的特征信息;信息统计单元,用于根据所述每个用户对所述至少一种物品中的每种物品的关注度以及所述每个用户的特征信息,统计出所述至少一种物品中的每种物品的目标用户的特征信息。
可选地,所述信息统计单元,进一步用于:针对所述至少一种物品中的每种物品,获取所述至少一个用户中对该物品的关注度高于预设阈值的用户的特征信息,并根据对该物品的关注度高于预设阈值的用户的特征信息,统计该物品的目标用户的特征信息。
可选地,所述特征信息,包括:性别、年龄、性格和籍贯中的至少之一。
本发明又一方面提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现前述任一所述方法的步骤。
本发明再一方面提供了一种语音设备,包括处理器、存储器以及存储在存储器上可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述任一所述方法的步骤。
本发明再一方面提供了一种语音设备,包括前述任一所述的用户需求信息的获取装置。
根据本发明的技术方案,通过将至少一个用户的用户语音文本信息与至少一种物品的物品信息进行匹配,以匹配出所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词,从而根据匹配得到的关键词,确定用户对所述至少一种物品的需求信息,能够统计用户对所述至少一种物品中每种物品关注或感兴趣的部分,从而对被用户频繁提到的部分进行重点设计和优化,对于用户不满意的部分,能够及时改善;并且本发明能够根据至少一个用户的用户语音信息对所述至少一个用户进行特征分析,以确定所述至少一种物品中每种物品的目标用户的特征信息,从而针对每种物品统计出对该物品比较关注会感兴趣的用户的特征,从而得到该物品的用户定位。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明提供的用户需求信息的获取方法的一实施例的方法示意图;
图2是本发明提供的用户需求信息的获取方法的另一实施例的方法示意图;
图3是确定所述至少一种物品中每种物品的目标用户的特征信息的步骤的一具体实施方式的流程示意图;
图4是本发明提供的用户需求信息的获取装置的一实施例的结构示意图;
图5是本发明提供的用户需求信息的获取装置的另一实施例的结构示意图;
图6是根据本发明实施例的分析单元的一具体实施方式的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明提供一种用户需求信息的获取方法。所述方法可以用于语音设备中,所述语音设备即能够与用户通过语音进行交互的设备。例如,语音导购机器人。
图1是本发明提供的用户需求信息的获取方法的一实施例的方法示意图。如图1所示,根据本发明的一个实施例,所述用户需求信息的获取方法至少包括步骤S110、步骤S120和步骤S130。
步骤S110,获取至少一个用户的用户语音信息所对应的用户语音文本信息以及至少一种物品的物品信息。
所述用户语音信息包括所述至少一个用户的与所述至少一种物品相关的语音信息。更具体而言,所述用户语音信息包括语音设备(例如,语音导购机器人)针对所述至少一种物品与所述至少一个用户进行语音交互所产生的所述至少一个用户的用户语音信息。
具体地,可以预先收集所述语音设备针对所述至少一种物品与所述至少一个用户进行语音交互所产生的所述至少一个用户的用户语音信息,并对所述至少一个用户的用户语音信息进行语义解析,以解析成所述至少一个用户的用户语音信息所对应的用户语音文本信息。优选地,预先建立保存所述至少一个用户的用户语音信息所对应的用户语音文本信息的用户语音文本库,将解析成的所述至少一个用户的用户语音信息所对应的用户语音文本信息保存至所述用户语音文本库中,以便从所述预先建立的用户语音文本库中获取所述至少一个用户的用户语音信息所对应的用于语音文本信息。
所述至少一种物品包括:不同种类的物品和/或相同种类物品中不同型号的物品。在一种具体实施方式,可以从预先建立的物品信息库获取所述至少一种物品的物品信息。也就是说,预先建立保存所述至少一种物品的物品信息的物品功能信息库,以从所述物品信息库中调取所述至少一种物品的物品信息。所述物品信息具体可以包括物品功能信息。
步骤S120,将所述至少一个用户的用户语音文本信息与所述至少一种物品的物品信息进行匹配,以匹配出所述至少一个用户的用户语音文本信中与所述至少一种物品的物品信息匹配的关键词。
具体地,可以将所述用户语音文本库中的所述至少一个用户的用户语音文本信息与所述物品信息库中的所述至少一种物品的物品信息进行匹配,以匹配出所述用户语音文本库中的所述至少一个用户的用户语音文本信中与所述物品信息库中的所述至少一种物品的物品功能信息匹配的关键词。更具体而言,可以对所述至少一个用户的用户语音文本信息进行断句处理后,查找断句处理后的所述至少一个用户的用户语音文本信息中与所述至少一个物品的物品信息匹配的关键词。可选地,所述物品信息具体包括物品功能信息。例如,用户针对某空调产品问到“这款空调的制冷速度怎样?”、“每晚耗电量多少?”、“有没有自清洁的功能?”等,其中“制冷速度”、“耗电量”、“自清洁”这几个词就是与空调功能信息匹配的关键词。
步骤S130,根据所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词,获取所述至少一个用户对所述至少一种物品的需求信息。
具体地,统计所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的每一个关键词的出现概率,以根据所述每一个关键词的出现概率获取所述至少一个用户对所述至少一种物品的需求信息。更具体地,统计所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的每一个关键词的出现概率,根据统计的所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品功能信息匹配的每一个关键词的出现概率,统计出现概率超过预设概率值的关键词,根据所述出现概率超过预设概率值的关键词获得所述至少一个用户对所述至少一种物品的需求信息。也就是说,出现概率较高的关键词反映了用户对物品的需求,所述用户对物品的需求例如包括用户对物品的功能的需求,例如,针对空调统计出所述至少一个用户的语音文本信息中,与空调的功能信息匹配的关键词包括“制冷速度”、“耗电量”、“自清洁”等,而其中“耗电量”的出现概率较高,则可以分析得到用户对空调的低耗电量需求较高。
根据本发明的上述实施例,通过将用户语音文本信息与物品信息进行匹配,从而能够统计用户对物品感兴趣的部分,从而对被用户频繁提到的部分进行重点设计和优化,对于用户不满意的部分,能够及时改善。
图2是本发明提供的用户需求信息的获取方法的另一实施例的方法示意图。如图2所示,根据本发明的一个实施例,所述用户需求信息的获取方法还包括步骤S140。
步骤S140,根据所述至少一个用户的用户语音信息对所述至少一个用户进行特征分析,以确定所述至少一种物品中每种物品的目标用户的特征信息。
所述每种物品的目标用户具体包括所述至少一个用户中对该物品感兴趣的用户,其中,任一用户对任一物品是否感兴趣可以根据该用户对该物品的关注度来确定。即,对于任意一种物品,对该物品的关注度超过预设阈值的用户为该物品的目标用户。
图3是根据本发明实施例的根据所述至少一个用户的用户语音信息对所述至少一个用户进行特征分析,以确定所述至少一种物品中每种物品的目标用户的特征信息的步骤的一具体实施方式的流程示意图。如图3所示,步骤S140具体可以包括步骤S141、步骤S142和步骤S143。
步骤S141,根据所述至少一个用户的用户语音信息所对应的用户语音文本信息,获取所述至少一个用户中的每个用户对所述至少一种物品中的每种物品的关注度。
具体地,可以根据所述至少一个用户的用户语音信息所对应的用户语音文本信息统计所述至少一个用户中的每个用户针对所述至少一种物品中的每种物品的询问次数和/或问题个数,确定所述至少一个用户中的每个用户对所述至少一种物品中的每种物品的关注度。例如,不同的询问次数和/或问题个数对应不同的关注度,例如询问1-2次,对应关注度50%,询问3-4次,对应关注度70%,询问5-6次,对应关注度90。
步骤S142,对所述至少一个用户的用户语音信息进行分析,以得到所述至少一个用户中的每个用户的特征信息。
具体地,所述特征信息具体可以包括性别、年龄、性格和籍贯中的至少之一。从所述至少一个用户的用户语音信息中能够得到所述至少一个用户的声纹、语调和/或口音等信息。所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱,可以通过对所述至少一个用户的用户语音进行声纹特征提取,得到所述至少一个用户中每个用户的声纹特征,众所周知,通过分析用户的声纹特征能够判断出用户的性别、年龄、方言(生活地区)等特征。
所述语调,具体可以包括用户说话时声音的高低、快慢、长短、轻重等。通过分析用户的语调特征能够判断出用户的性格。具体地,建立语音样本库,样本库中包含大量不同语调的语音样本,对每一个语音样本标记对应的用户性格。基于语音样本训练个性分析模型,个性分析模型学习不同性格对应的语调,训练完成后,可根据用户说话时的语调,通过个性分析模型识别出用户的性格。
所述口音,是一种对词或特殊音节的模块化强调程度的变化。这些变化都是由口腔肌肉和舌头的动作所产生。口音是可以通过自小培养及练习而得来的,因此从口音可以反映人的出生地或居住地。通过分析用户的口音特征能够判断出用户的籍贯或居住地,例如,不同地区的用户说话的口音具有不同的特点(例如,对个别词语的发音不同),通过分析某一用户说话的口音特征能够大致判断出该用户籍贯或居住地。例如,收集不同地区的用户的方言数据(例如包括每个地区特有的方言词语或者每个地区对于某些词语特有的发音)预先建立口音识别模型,通过该预先建立的口音识别模型识别用户的口音,再根据用户的口音识别用户的出生地或居住地,或者还可以根据语音识别模型识别出的用户使用的方言,从而确定用户的口音,再根据用户的口音识别用户的出生地或居住地。
步骤S143,根据所述每个用户对所述至少一种物品中的每种物品的关注度以及所述每个用户的特征信息,统计出所述至少一种物品中的每种物品的目标用户的特征信息。
具体地,针对所述至少一种物品中的每种物品,获取所述至少一个用户中对该物品的关注度高于预设阈值的用户的特征信息;并根据对该物品的关注度高于预设阈值的用户的特征信息,统计该物品的目标用户的特征信息,从而统计出所述至少一种物品中的每种物品的目标用户特征信息。例如,针对所述每种物品,统计对该物品的关注度高于预设阈值的用户的不同的特征信息在同类特征信息中所占比例,得到同类特征信息中占比最高的特征信息。例如,统计不同的籍贯信息在所有籍贯信息中所占的比例(例如,统计不同籍贯的用户在所有用户中所占比例,其中广东用户占比最高);又例如,统计不同的性别信息在所有性别信息中所占比例,(例如,统计不同性别的用户在所有用户中所占比例,其中男性用户在所有用户中所占比例最高)。根据得到的同类特征信息中占比最高的特征信息可以得到该物品的目标用户的群体特征,例如,住在广东的开朗的年轻男性对此产品比较感兴趣。
本发明还提供一种用户需求信息的获取装置。所述装置可以用于语音设备中,所述语音设备即能够与用户通过语音进行交互的设备。例如,语音导购机器人。
图4是本发明提供的用户需求信息的获取装置的一实施例的结构示意图。如图4所示,所述用户需求信息的获取装置100包括获取单元110、匹配单元120和确定单元130。
获取单元110用于获取至少一个用户的用户语音信息所对应的用户语音文本信息以及至少一种物品的物品信息;所述用户语音信息,包括:所述至少一个用户的与所述至少一种物品相关的语音信息;匹配单元120用于将所述至少一个用户的用户语音文本信息与所述至少一种物品的物品信息进行匹配,以匹配出所述至少一个用户的用户语音文本信中与所述至少一种物品的物品信息匹配的关键词;确定单元130用于根据所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词,确定所述至少一个用户对所述至少一种物品的需求信息。
获取单元110获取至少一个用户的用户语音信息所对应的用户语音文本信息以及至少一种物品的物品功能信息。
所述用户语音信息包括所述至少一个用户的与所述至少一种物品相关的语音信息。更具体而言,所述用户语音信息包括语音设备(例如,语音导购机器人)针对所述至少一种物品与所述至少一个用户进行语音交互所产生的所述至少一个用户的用户语音信息。
具体地,可以预先收集所述语音设备针对所述至少一种物品与所述至少一个用户进行语音交互所产生的所述至少一个用户的用户语音信息,并对所述至少一个用户的用户语音信息进行语义解析,以解析成所述至少一个用户的用户语音信息所对应的用户语音文本信息。优选地,预先建立保存所述至少一个用户的用户语音信息所对应的用户语音文本信息的用户语音文本库,将解析成的所述至少一个用户的用户语音信息所对应的用户语音文本信息保存至所述用户语音文本库中,以便获取单元110从所述预先建立的用户语音文本库中获取所述至少一个用户的用户语音信息所对应的用于语音文本信息。
所述至少一种物品包括:不同种类的物品和/或相同种类物品中不同型号的物品。在一种具体实施方式,所述获取单元110可以从预先建立的物品信息库获取所述至少一种物品的物品信息。也就是说,预先建立保存所述至少一种物品的物品信息的物品功能信息库,以便所述获取单元110从所述物品信息库中调取所述至少一种物品的物品信息。所述物品信息具体可以包括物品功能信息。
匹配单元120将所述至少一个用户的用户语音文本信息与所述至少一种物品的物品信息进行匹配,以匹配出所述至少一个用户的用户语音文本信中与所述至少一种物品的物品信息匹配的关键词。
具体地,匹配单元120可以将所述用户语音文本库中的所述至少一个用户的用户语音文本信息与所述物品信息库中的所述至少一种物品的物品信息进行匹配,以匹配出所述用户语音文本库中的所述至少一个用户的用户语音文本信中与所述物品信息库中的所述至少一种物品的物品功能信息匹配的关键词。更具体而言,匹配单元120可以对所述至少一个用户的用户语音文本信息进行断句处理后,查找断句处理后的所述至少一个用户的用户语音文本信息中与所述至少一个物品的物品信息匹配的关键词。可选地,所述物品信息具体包括物品功能信息。例如,用户针对某空调产品问到“这款空调的制冷速度怎样?”、“每晚耗电量多少?”、“有没有自清洁的功能?”等,其中“制冷速度”、“耗电量”、“自清洁”这几个词就是与空调功能信息匹配的关键词。
确定单元130统计所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的每一个关键词的出现概率,以根据所述每一个关键词的出现概率获取所述至少一个用户对所述至少一种物品的需求信息。
具体地,确定单元130统计所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的每一个关键词的出现概率,以根据所述每一个关键词的出现概率获取所述至少一个用户对所述至少一种物品的需求信息。更具体地,确定单元130可以统计所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的每一个关键词的出现概率,根据统计的所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品功能信息匹配的每一个关键词的出现概率,统计出现概率超过预设概率值的关键词,根据所述出现概率超过预设概率值的关键词获得所述至少一个用户对所述至少一种物品的需求信息。也就是说,出现概率较高的关键词反映了用户对物品的需求,所述用户对物品的需求例如包括用户对物品的功能的需求,例如,针对空调统计出所述至少一个用户的语音文本信息中,与空调的功能信息匹配的关键词包括“制冷速度”、“耗电量”、“自清洁”等,而其中“耗电量”的出现概率较高,则可以分析得到用户对空调的低耗电量需求较高。
根据本发明的上述实施例,通过将用户语音文本信息与物品信息进行匹配,从而能够统计用户对物品感兴趣的部分,从而对被用户频繁提到的部分进行重点设计和优化,同时还能对于用户不满意的部分,能够及时改善。
图5是本发明提供的用户需求信息的获取装置的另一实施例的结构示意图。如图5所示,所述用户需求信息的获取装置100还包括分析单元140。
分析单元140用于根据所述至少一个用户的用户语音信息对所述至少一个用户进行特征分析,以确定所述至少一种物品中每种物品的目标用户的特征信息。
所述每种物品的目标用户具体包括所述至少一个用户中对该物品感兴趣的用户,其中,任一用户对任一物品是否感兴趣可以根据该用户对该物品的关注度来确定。即,对于任意一种物品,对该物品的关注度超过预设阈值的用户为该物品的目标用户。
图6是根据本发明实施例的分析单元的一具体实施方式的结构示意图。如图6所示,分析单元140具体可以包括语义分析单元141、特征分析单元142和信息统计单元143。
语义分析单元141用于对所述至少一个用户的用户语音信息进行语义分析,以得到所述至少一个用户中的每个用户对所述至少一种物品中的每种物品的关注度。
具体地,语义分析单元141可以根据所述至少一个用户的用户语音信息所对应的用户语音文本信息统计所述至少一个用户中的每个用户针对所述至少一种物品中的每种物品的询问次数和/或问题个数,确定所述至少一个用户中的每个用户对所述至少一种物品中的每种物品的关注度。例如,不同的询问次数和/或问题个数对应不同的关注度,例如询问1-2次,对应关注度50%,询问3-4次,对应关注度70%,询问5-6次,对应关注度90。
特征分析单元142用于对所述至少一个用户的用户语音信息进行分析,以得到所述至少一个用户中的每个用户的特征信息。
所述特征信息具体可以包括性别、年龄、性格和籍贯中的至少之一。从所述至少一个用户的用户语音信息中能够得到所述至少一个用户的声纹、语调和/或口音等信息。所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱,可以通过对所述至少一个用户的用户语音进行声纹特征提取,得到所述至少一个用户中每个用户的声纹特征,众所周知,通过分析用户的声纹特征能够判断出用户的性别、年龄、方言(生活地区)等特征。
所述语调,具体可以包括用户说话时声音的高低、快慢、长短、轻重等。通过分析用户的语调特征能够判断出用户的性格。具体地,建立语音样本库,样本库中包含大量不同语调的语音样本,对每一个语音样本标记对应的用户性格。基于语音样本训练个性分析模型,个性分析模型学习不同性格对应的语调,训练完成后,可根据用户说话时的语调,通过个性分析模型识别出用户的性格。
所述口音,是一种对词或特殊音节的模块化强调程度的变化。这些变化都是由口腔肌肉和舌头的动作所产生。口音是可以通过自小培养及练习而得来的,因此从口音可以反映人的出生地或居住地。通过分析用户的口音特征能够判断出用户的籍贯或居住地,例如,不同地区的用户说话的口音具有不同的特点(例如,对个别词语的发音不同),通过分析某一用户说话的口音特征能够大致判断出该用户籍贯或居住地。例如,收集不同地区的用户的方言数据(例如包括每个地区特有的方言词语或者每个地区对于某些词语特有的发音)预先建立口音识别模型,通过该预先建立的口音识别模型识别用户的口音,再根据用户的口音识别用户的出生地或居住地,或者还可以根据语音识别模型识别出的用户使用的方言,从而确定用户的口音,再根据用户的口音识别用户的出生地或居住地。
信息统计单元143用于根据所述每个用户对所述至少一种物品中的每种物品的关注度以及所述每个用户的特征信息,统计出所述至少一种物品中的每种物品的目标用户的特征信息。
具体地,信息统计单元143针对所述至少一种物品中的每种物品,获取所述至少一个用户中对该物品的关注度高于预设阈值的用户的特征信息;并根据对该物品的关注度高于预设阈值的用户的特征信息,统计该物品的目标用户的特征信息,从而统计出所述至少一种物品中的每种物品的目标用户特征信息。例如,针对所述每种物品,统计对该物品的关注度高于预设阈值的用户的不同的特征信息在同类特征信息中所占比例,得到同类特征信息中占比最高的特征信息。例如,统计不同的籍贯信息在所有籍贯信息中所占的比例(例如,统计不同籍贯的用户在所有用户中所占比例,其中广东用户占比最高);又例如,统计不同的性别信息在所有性别信息中所占比例,(例如,统计不同性别的用户在所有用户中所占比例,其中男性用户在所有用户中所占比例最高)。根据得到的同类特征信息中占比最高的特征信息可以得到该物品的目标用户的群体特征,例如,住在广东的开朗的年轻男性对此产品比较感兴趣。
本发明还提供对应于所述用户需求信息的获取方法的一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现前述任一所述方法的步骤。
本发明还提供对应于所述用户需求信息的获取方法的一种语音设备,包括处理器、存储器以及存储在存储器上可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述任一所述方法的步骤。
本发明还提供对应于所述用户需求信息的获取装置的一种语音设备,包括前述任一所述的用户需求信息的获取装置。
据此,本发明提供的方案,通过将至少一个用户的用户语音文本信息与至少一种物品的物品信息进行匹配,以匹配出所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词,从而根据匹配得到的关键词,确定用户对所述至少一种物品的需求信息,能够统计用户对所述至少一种物品中每种物品关注或感兴趣的部分,从而对被用户频繁提到的部分进行重点设计和优化,对于用户不满意的部分,能够及时改善;并且本发明能够根据至少一个用户的用户语音信息对所述至少一个用户进行特征分析,以确定所述至少一种物品中每种物品的目标用户的特征信息,从而针对每种物品统计出对该物品比较关注会感兴趣的用户的特征,从而得到该物品的用户定位。
本文中所描述的功能可在硬件、由处理器执行的软件、固件或其任何组合中实施。如果在由处理器执行的软件中实施,那么可将功能作为一或多个指令或代码存储于计算机可读媒体上或经由计算机可读媒体予以传输。其它实例及实施方案在本发明及所附权利要求书的范围及精神内。举例来说,归因于软件的性质,上文所描述的功能可使用由处理器、硬件、固件、硬连线或这些中的任何者的组合执行的软件实施。此外,各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为控制装置的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (17)
1.一种用户需求信息的获取方法,其特征在于,包括:
获取至少一个用户的用户语音信息所对应的用户语音文本信息以及至少一种物品的物品信息;所述用户语音信息,包括:所述至少一个用户的与所述至少一种物品相关的语音信息;
将所述至少一个用户的用户语音文本信息与所述至少一种物品的物品信息进行匹配,以匹配出所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词;
根据所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词,确定所述至少一个用户对所述至少一种物品的需求信息。
2.根据权利要求1所述的方法,其特征在于,将所述至少一个用户的用户语音文本信息与所述至少一种物品的信息进行匹配,以匹配出所述至少一个用户的用户语音文本信中与所述至少一种物品的物品信息匹配的关键词,包括:
对所述至少一个用户的用户语音文本信息进行断句处理后,查找断句处理后的所述至少一个用户的用户语音文本信息中与所述至少一个物品的物品信息匹配的关键词。
3.根据权利要求1或2所述的方法,其特征在于,根据所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词,获取所述至少一个用户对所述至少一种物品的需求信息,包括:
统计所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的每一个关键词的出现概率,以根据所述每一个关键词的出现概率获取所述至少一个用户对所述至少一种物品的需求信息。
4.根据权利要求1-3任一项所述的方法,其特征在于,还包括:
根据所述至少一个用户的用户语音信息对所述至少一个用户进行特征分析,以确定所述至少一种物品中每种物品的目标用户的特征信息。
5.根据权利要求4所述的方法,其特征在于,根据所述至少一个用户的用户语音信息对所述至少一个用户进行特征分析,以确定所述至少一种物品中每种物品的目标用户的特征信息,包括:
对所述至少一个用户的用户语音信息进行语义分析,以得到所述至少一个用户中的每个用户对所述至少一种物品中的每种物品的关注度;
对所述至少一个用户的用户语音信息进行分析,以得到所述至少一个用户中的每个用户的特征信息;
根据所述每个用户对所述至少一种物品中的每种物品的关注度以及所述每个用户的特征信息,统计出所述至少一种物品中的每种物品的目标用户的特征信息。
6.根据权利要求5所述的方法,其特征在于,根据所述每个用户对所述至少一种物品中的每种物品的关注度以及所述每个用户的特征信息,统计出所述至少一种物品中的每种物品的目标用户的特征信息,包括:
针对所述至少一种物品中的每种物品,获取所述至少一个用户中对该物品的关注度高于预设阈值的用户的特征信息,并根据对该物品的关注度高于预设阈值的用户的特征信息,统计该物品的目标用户的特征信息。
7.根据权利要求4-6任一项所述的方法,其特征在于,
所述特征信息,包括:性别、年龄、性格和籍贯中的至少之一。
8.一种用户需求信息的获取装置,其特征在于,包括:
获取单元,用于获取至少一个用户的用户语音信息所对应的用户语音文本信息以及至少一种物品的物品信息;所述用户语音信息,包括:所述至少一个用户的与所述至少一种物品相关的语音信息;
匹配单元,用于将所述至少一个用户的用户语音文本信息与所述至少一种物品的物品信息进行匹配,以匹配出所述至少一个用户的用户语音文本信中与所述至少一种物品的物品信息匹配的关键词;
确定单元,用于根据所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的关键词,确定所述至少一个用户对所述至少一种物品的需求信息。
9.根据权利要求8所述的装置,其特征在于,所述匹配单元,进一步用于:对所述至少一个用户的用户语音文本信息进行断句处理后,查找断句处理后的所述至少一个用户的用户语音文本信息中与所述至少一个物品的物品信息匹配的关键词。
10.根据权利要求8或9所述的装置,其特征在于,所述确定单元,进一步用于:
统计所述至少一个用户的用户语音文本信息中与所述至少一种物品的物品信息匹配的每一个关键词的出现概率,以根据所述每一个关键词的出现概率获取所述至少一个用户对所述至少一种物品的需求信息。
11.根据权利要求8-10任一项所述的装置,其特征在于,还包括:
分析单元,用于根据所述至少一个用户的用户语音信息对所述至少一个用户进行特征分析,以确定所述至少一种物品中每种物品的目标用户的特征信息。
12.根据权利要求11所述的装置,其特征在于,所述分析单元,包括:
语义分析单元,用于对所述至少一个用户的用户语音信息进行语义分析,以得到所述至少一个用户中的每个用户对所述至少一种物品中的每种物品的关注度;
特征分析单元,用于对所述至少一个用户的用户语音信息进行分析,以得到所述至少一个用户中的每个用户的特征信息;
信息统计单元,用于根据所述每个用户对所述至少一种物品中的每种物品的关注度以及所述每个用户的特征信息,统计出所述至少一种物品中的每种物品的目标用户的特征信息。
13.根据权利要求12所述的装置,其特征在于,所述信息统计单元,进一步用于:
针对所述至少一种物品中的每种物品,获取所述至少一个用户中对该物品的关注度高于预设阈值的用户的特征信息,并根据对该物品的关注度高于预设阈值的用户的特征信息,统计该物品的目标用户的特征信息。
14.根据权利要求11-13任一项所述的装置,其特征在于,
所述特征信息,包括:性别、年龄、性格和籍贯中的至少之一。
15.一种存储介质,其特征在于,其上存储有计算机程序,所述程序被处理器执行时实现权利要求1-7任一所述方法的步骤。
16.一种语音设备,其特征在于,包括处理器、存储器以及存储在存储器上可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-7任一所述方法的步骤。
17.一种语音设备,其特征在于,包括如权利要求8-14任一所述的用户需求信息的获取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910069186.9A CN109919657A (zh) | 2019-01-24 | 2019-01-24 | 用户需求信息的获取方法、装置、存储介质及语音设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910069186.9A CN109919657A (zh) | 2019-01-24 | 2019-01-24 | 用户需求信息的获取方法、装置、存储介质及语音设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109919657A true CN109919657A (zh) | 2019-06-21 |
Family
ID=66960675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910069186.9A Pending CN109919657A (zh) | 2019-01-24 | 2019-01-24 | 用户需求信息的获取方法、装置、存储介质及语音设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109919657A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110910876A (zh) * | 2019-11-25 | 2020-03-24 | 杭州智芯科微电子科技有限公司 | 物品声寻装置及控制方法、语音控制设置方法和系统 |
CN113593552A (zh) * | 2021-07-12 | 2021-11-02 | 深圳市明源云客电子商务有限公司 | 需求信息统计方法、装置、终端设备以及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239456A (zh) * | 2014-09-02 | 2014-12-24 | 百度在线网络技术(北京)有限公司 | 用户特征数据的提取方法和装置 |
CN105224278A (zh) * | 2015-08-21 | 2016-01-06 | 百度在线网络技术(北京)有限公司 | 语音交互服务处理方法及装置 |
CN105243143A (zh) * | 2015-10-14 | 2016-01-13 | 湖南大学 | 基于即时语音内容检测的推荐方法及系统 |
CN106204295A (zh) * | 2016-07-08 | 2016-12-07 | 乐视控股(北京)有限公司 | 基于自然语言的社交方法及装置 |
CN107391706A (zh) * | 2017-07-28 | 2017-11-24 | 湖北文理学院 | 一种基于移动互联网的城市旅游问答系统 |
CN107656969A (zh) * | 2017-08-31 | 2018-02-02 | 深圳市谷熊网络科技有限公司 | 一种信息推荐方法及装置 |
CN107833574A (zh) * | 2017-11-16 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 用于提供语音服务的方法和装置 |
-
2019
- 2019-01-24 CN CN201910069186.9A patent/CN109919657A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239456A (zh) * | 2014-09-02 | 2014-12-24 | 百度在线网络技术(北京)有限公司 | 用户特征数据的提取方法和装置 |
CN105224278A (zh) * | 2015-08-21 | 2016-01-06 | 百度在线网络技术(北京)有限公司 | 语音交互服务处理方法及装置 |
CN105243143A (zh) * | 2015-10-14 | 2016-01-13 | 湖南大学 | 基于即时语音内容检测的推荐方法及系统 |
CN106204295A (zh) * | 2016-07-08 | 2016-12-07 | 乐视控股(北京)有限公司 | 基于自然语言的社交方法及装置 |
CN107391706A (zh) * | 2017-07-28 | 2017-11-24 | 湖北文理学院 | 一种基于移动互联网的城市旅游问答系统 |
CN107656969A (zh) * | 2017-08-31 | 2018-02-02 | 深圳市谷熊网络科技有限公司 | 一种信息推荐方法及装置 |
CN107833574A (zh) * | 2017-11-16 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 用于提供语音服务的方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110910876A (zh) * | 2019-11-25 | 2020-03-24 | 杭州智芯科微电子科技有限公司 | 物品声寻装置及控制方法、语音控制设置方法和系统 |
CN113593552A (zh) * | 2021-07-12 | 2021-11-02 | 深圳市明源云客电子商务有限公司 | 需求信息统计方法、装置、终端设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115238101B (zh) | 一种面向多类型知识库的多引擎智能问答系统 | |
CN109522556B (zh) | 一种意图识别方法及装置 | |
CN105427858B (zh) | 实现语音自动分类的方法及系统 | |
CN101599071B (zh) | 对话文本主题的自动提取方法 | |
CN111241357A (zh) | 对话训练方法、装置、系统及存储介质 | |
CN108763510A (zh) | 意图识别方法、装置、设备及存储介质 | |
CN109241255A (zh) | 一种基于深度学习的意图识别方法 | |
CN110717018A (zh) | 一种基于知识图谱的工业设备故障维修问答系统 | |
CN109637537B (zh) | 一种自动获取标注数据优化自定义唤醒模型的方法 | |
CN105574067A (zh) | 项目推荐装置以及项目推荐方法 | |
CN105354199B (zh) | 一种基于场景信息的实体含义识别方法和系统 | |
KR101677859B1 (ko) | 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치 | |
CN105808721A (zh) | 一种基于数据挖掘的客服内容分析方法及其系统 | |
CN110992988B (zh) | 一种基于领域对抗的语音情感识别方法及装置 | |
CN109325780A (zh) | 一种面向电子政务领域的智能客服系统的交互方法 | |
CN116110405B (zh) | 一种基于半监督学习的陆空通话说话人识别方法及设备 | |
CN112860896A (zh) | 语料泛化方法及用于工业领域的人机对话情感分析方法 | |
CN103164399A (zh) | 一种语音识别中的标点添加方法和装置 | |
CN107967302A (zh) | 基于深度神经网络的游戏客服对话系统 | |
CN114783421A (zh) | 智能推荐方法和装置、设备、介质 | |
TW202034207A (zh) | 使用意圖偵測集成學習之對話系統及其方法 | |
CN111159405B (zh) | 基于背景知识的讽刺检测方法 | |
CN106710588B (zh) | 语音数据句类识别方法和装置及系统 | |
KR101333485B1 (ko) | 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치 | |
CN109919657A (zh) | 用户需求信息的获取方法、装置、存储介质及语音设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190621 |
|
RJ01 | Rejection of invention patent application after publication |