一种智能交互方法、装置及终端设备
技术领域
本发明实施例涉及人工智能技术,尤其涉及一种智能交互方法、装置及终端设备。
背景技术
随着计算机技术的发展和普及,大量数码产品走进了普通大众的生活中,如儿童使用的学习机、故事机等。以故事机为例,其为了迎合儿童早教,提高儿童早期情商教育而被大量普及,主要功能是播放儿歌、故事、国学、诗词、英语启蒙、生活常识等,可以有效的锻炼儿童的情商、语言交流能力,深受各个家庭的欢迎。
现有的数码产品如故事机,其交互方法都是人为编辑、设定,交互方式通常为人工或半自动,无法根据不同用户进行智能交互,交互方式单一,灵活性差,交互效率较低。
发明内容
本发明提供了一种智能交互方法、装置及终端设备,提高了用户和机器之间的交互灵活性,使得交互方式多元化,交互效率显著提高。
第一方面,本发明实施例提供了一种智能交互方法,包括:
获取用户的身份信息,对所述身份信息进行识别以确定和所述用户相关联的属性信息;
对情景内容进行识别,以确定和所述情景内容对应的情景信息;
对所述属性信息和所述情景信息进行匹配处理,依据匹配结果确定交互事件和触发条件,当所述触发条件满足时,触发所述交互事件以和所述用户进行信息交互;
对所述用户相关联的属性信息进行实时更新,如果更新后的属性信息和历史记录的属性信息不同,则对所述更新后的属性信息和所述情景信息进行匹配处理,重新确定交互事件和触发条件。
第二方面,本发明实施例还提供了一种智能交互装置,包括:
身份识别模块,用于获取用户的身份信息,对所述身份信息进行识别以确定和所述用户相关联的属性信息;
情景内容识别模块,用于对情景内容进行识别,以确定和所述情景内容对应的情景信息;
信息匹配模块,用于对所述属性信息和所述情景信息进行匹配处理,依据匹配结果确定交互事件和触发条件;
交互模块,用于当所述触发条件满足时,触发所述交互事件以和所述用户进行信息交互;
更新模块,用于对所述用户相关联的属性信息进行实时更新,所述信息匹配模块还用于:如果更新后的属性信息和历史记录的属性信息不同,则对所述更新后的属性信息和所述情景信息进行匹配处理,重新确定交互事件和触发条件。
第三方面,本发明实施例还提供了一种智能交互终端设备,所述智能交互终端设备集成了上述描述的装置。
本发明实施例提供的技术方案,分别对用户和情景内容进行识别,对识别的用户的属性信息和情景内容的情景信息进行匹配处理,依据匹配结果确定交互事件和触发条件,以在触发条件满足时,触发交互事件和用户进行信息交互,并对用户关联的属性信息进行实时更新以匹配新的交互事件,解决了现有的交互方法采用人为编辑、设定,无法根据不同用户进行智能交互的问题,提高了用户和机器之间的交互灵活性,使得交互方式多元化,交互效率显著提高。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明实施例一提供的智能交互方法的流程图;
图2是本发明实施例二提供的智能交互方法的流程图;
图3是本发明实施例三提供的智能交互方法的流程图;
图4是本发明实施例四提供的智能交互装置的结构框图;
图5是本发明实施例五提供的智能交互终端设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的智能交互方法的流程图,本实施例可适用于用户使用终端设备进行交互的情况,该方法可以由终端设备如手机、平板电脑、儿童故事机来执行,如图1所示,本实施例提供的具体方案如下:
S101、获取用户的身份信息,对所述身份信息进行识别以确定和所述用户相关联的属性信息。
本实施例中,用户可以是一个或多个成年人、儿童,在对用户进行身份识别时,可通过终端设备内部集成的图像识别单元、指纹识别单元或声纹识别单元等对用户的身份信息进行获取和识别。
本实施例中,识别出的用户的属性信息包括用户的年龄、性别、人数、性格特点。其中,识别出的用户的年龄可以是用户的年龄区间段,如5-10岁、20-30岁、30-40岁等,识别出的用户的人数可以是1人、2人、3人或4人等,识别出的用户的性格特点可以是生气、开心、大笑等。当识别出的用户的人数大于1人时,该确定出的用户的属性信息还包括用户之间的人物关系,示例性的,当识别出有两个用户,同时,识别出的一个用户的年龄段在30-40岁之间,另一个用户的年龄段在5-10岁之间,则可确定出的这两个用户的身份关系为家长和孩子的关系。
本实施例中,在对用户进行身份识别时,可以是对用户的首次识别,也可以是对历史记录中已识别过或录入过属性信息的用户的再次识别。
S102、对情景内容进行识别,以确定和所述情景内容对应的情景信息。
本实施例中,该情景内容可以是文本形式的故事内容,如:西游记、三国演义、三个和尚等,该情景内容可预先传输保存至终端设备中,或终端设备通过网络实时进行情景内容的获取。其中,依据情景内容确定出的情景信息包括该情景内容对应的人物个数、人物性别、人物年龄、人物关系、人物性格特征以及具体的情景事件等。
S103、对所述属性信息和所述情景信息进行匹配处理,依据匹配结果确定交互事件和触发条件,当所述触发条件满足时,触发所述交互事件以和所述用户进行信息交互。
本实施例中,用户的属性信息和情景内容的情景信息进行的匹配包括:用户人数和情景人物个数的匹配;用户性别、年龄和情景人物性别、年龄的匹配;用户之间人物关系和情景人物之间关系的匹配;用户性格特点和情景人物性格特征的匹配。
本实施例中,根据属性信息和情景信息的匹配结果,来最终确定用户和终端设备的交互事件以及该交互事件触发的条件。示例性的,当确定出的情景信息中的人物个数为3,人物年龄为5-10岁,当前确定出的用户的人数也为3,同时用户年龄也均在5-10岁,此时,可将当前用户和情景内容中的人物进行匹配,将情景信息中的3个人物和现实中的3个用户对应关联。其中,确定出的交互事件可以是提示3个用户分别对情景中的3个人物进行语言、动作模拟,当情景内容进展到不同的情景人物时对应触发该交互事件。
S104、对所述用户相关联的属性信息进行实时更新,如果更新后的属性信息和历史记录的属性信息不同,则对所述更新后的属性信息和所述情景信息进行匹配处理,重新确定交互事件和触发条件。
本实施例中,终端设备和用户在交互过程中,可根据预设时间如1分钟的时间间隔对用户的属性信息进行更新,包括重新获取用户的身份信息,对身份信息进行再次识别;还可以是,根据用户输入的指令触发对用户的身份识别以重新确定和用户相关联的属性信息。
本实施例中,当更新后的属性信息和历史记录的属性信息不同,意味着和终端设备交互的用户的人数、性别、年龄和性格特点发生改变,此时,为满足交互的正常进行以及智能对话,需根据更新后的属性信息重新进行匹配处理,确定新一轮的交互事件和触发条件以和用户进行精确的交互。
需要说明的是,本发明实施例中,S102在S101之后执行,但在本发明其它实施例中,S102也可在S101之前执行,或者S101和S102同时执行,并不影响智能交互过程。
本实施例提供了一种智能交互方法,分别对用户和情景内容进行识别,对识别的用户的属性信息和情景内容的情景信息进行匹配处理,依据匹配结果确定交互事件和触发条件,以在触发条件满足时,触发交互事件和用户进行信息交互,并对用户关联的属性信息进行实时更新以匹配新的交互事件,提高了用户和机器之间的交互灵活性,使得交互方式多元化,交互效率显著提高。
实施例二
图2是本发明实施例二提供的智能交互方法的流程图,在上述实施例一的基础上,可选的,所述获取用户的身份信息,对所述身份信息进行识别以确定和所述用户相关联的属性信息包括:
获取用户的语音,对所述语音进行声纹识别,以确定用户的属性信息。
由此,通过对用户的语音进行声纹识别,实现了用户仅需通过正常说话交流,即可完成用户身份识别过程,确定出和用户相对应的属性信息。
进一步,可选的,所述对情景内容进行识别,以确定和所述情景内容对应的情景信息包括:
对情景内容进行自然语义识别处理,以确定和所述情景内容对应情景信息。
由此,通过对情景内容进行自然语义识别处理,实现了对情景内容的高效识别、分析,以准确的确定出对应的情景信息用于后续匹配处理。
基于上述优化,如图2所示,本实施例提供的技术方案具体如下:
S201、获取用户的语音,对所述语音进行声纹识别,以确定和所述用户相关联的属性信息。
本实施例中,在对用户进行身份识别时采取语音识别的方式。终端设备可通过集成的麦克风获取一定时间段内的用户语音,如:在30秒内获取用户的普通对话声音。其中,声纹识别是生物识别技术的一种,也称为说话人识别。由于不同用户的发生器官的区别,使得任何两个人的声纹图谱都有差异,通过对声纹图谱的分析可以确定出说话的人数、性别以及年龄范围等信息。
示例性的,当有几个(如3个)儿童进行对话时,终端设备通过麦克风采集到儿童的对话语音,通过对语音的声纹识别分析,可以最终确定出有3个儿童,同时,根据不同的声纹图谱可以确定出此时不同儿童的情绪状态,如:开心、生气。
S202、对情景内容进行自然语义识别处理,以确定和所述情景内容对应情景信息。
本实施例中,对情景内容进行自然语义识别处理,其中,自然语义识别处理涉及计算机科学领域,通过语言学中固定的词法、语法结合计算机软件算法对情景内容进行分析处理。
示例性的,情景内容为故事《三个和尚》,通过对故事的文本进行自然语义识别处理,可以确定情景信息包括的情景人物个数为3个,年龄范围5-10岁,情景事件为“一个和尚挑水吃,两个和尚抬水吃,三个和尚没水吃”。
S203、对所述属性信息和所述情景信息进行匹配处理,依据匹配结果确定交互事件和触发条件,当所述触发条件满足时,触发所述交互事件以和所述用户进行信息交互。
S204、对所述用户相关联的属性信息进行实时更新,如果更新后的属性信息和历史记录的属性信息不同,则对所述更新后的属性信息和所述情景信息进行匹配处理,重新确定交互事件和触发条件。
需要说明的是,本发明示例性的将S201-S204组成一个实施例执行一种智能交互方法,但仅仅是本发明的一种实例,在本发明的其它实施例中,可以将S201和S102、S103、S104组成一个新的实施例,或者也可以将S202和S101、S103、S104组成一个实施例。另外,本发明实施例中,S202在S201之后执行,但在本发明其它实施例中,S202也可在S201之前执行,或者S201和S202同时执行,并不影响智能交互过程。
本实施例提供了一种智能交互方法,分别对用户的语音和情景内容进行声纹识别和自然语义识别处理,简洁、高效、准确的确定出用户对应的属性信息以及情景内容对应的情景信息,使得后续的匹配处理更加精确,用户和终端设备的交互效果更佳。
在上述技术方案的基础上,S201还可以是:获取用户的图像,对用户的图像进行识别,以确定用户的属性信息。其中,该图像可通过终端设备集成的摄像装置获取。示例性的,终端设备的摄像头拍摄到用户的图像,通过对图像进行识别,识别到存在3个用户,且年龄段在5-10岁,通过对图像中的人脸进行识别还可确定出当前3个用户各自的情绪,如:愤怒、大笑、哭泣。本方案中,通过图像识别方式确定用户的属性信息,缩短了对用户的识别时间,识别准确率进一步提高。
在上述技术方案的基础上,在对用户进行身份识别时确定关联的属性信息时,还可以是:依据问题信息和接收到的用户的音频信息确定用户的属性信息。示例性的,终端设备通过扬声器广播问题信息,如:“请问交互参与人员是几个?年龄?性别?”,当用户听到语音问题是,相应的进行回答,终端设备获取用户回答的语音信息,并进行语音识别以确定用户的属性信息。
实施例三
图3是本发明实施例三提供的智能交互方法的流程图,在上述实施例一的基础上,可选的,所述对所述属性信息和所述情景信息进行匹配处理包括:
依据所述属性信息中用户的数量、性别和年龄范围与所述情景信息中参与情景的人数、性别和年龄范围进行对应匹配。
由此,通过将用户的数量、性别和年龄范围直接与情景中情景人物的人数、性别和年龄范围进行对应匹配,使得终端设备在和用户进行交互的过程中针对性更强,交互内容和交互方式的匹配度更高,交互方式更加智能化。
进一步,可选的,所述依据匹配结果确定交互事件和触发条件包括:
如果匹配成功,则根据匹配的人数、性别和年龄范围以及所述情景信息中的时间轴信息确定交互事件和触发条件。
由此,通过情景信息中的时间轴信息和匹配的人数、性别和年龄范围确定交互事件和触发条件,使得终端设备可根据情景内容的进展分别和相匹配的用户进行交互,交互针对性更强、智能化更高,同时提高了用户进行交互的趣味性。
基于上述优化,如图3所示,本实施例提供的技术方案具体如下:
S301、获取用户的身份信息,对所述身份信息进行识别以确定和所述用户相关联的属性信息。
S302、对情景内容进行识别,以确定和所述情景内容对应的情景信息。
S303、依据所述属性信息中用户的数量、性别和年龄范围与所述情景信息中参与情景的人数、性别和年龄范围进行对应匹配。
S304、如果匹配成功,则根据匹配的人数、性别和年龄范围以及所述情景信息中的时间轴信息确定交互事件和触发条件,当所述触发条件满足时,触发所述交互事件以和所述用户进行信息交互。
本实施例中,该时间轴信息可以是根据情景内容生成的人物、事件、属性的时间轴。示例性的,时刻1对应有:人物1,人物2,...,人物N,其中每个人物又包含属性1,属性2,...,属性N,其中人物的属性可以是姓名、年龄、情绪、状态等;事件,其中,事件包括事件本身的事件属性,如执行动作、动作施动体、动作受动体、动作执行时间等。其中,触发条件可以是情景内容进展到的不同的时刻。
示例性的,以故事《三个和尚》为例,在时刻1对应有:人物1,属性为5-10岁、高兴,事件为挑水;在时刻2对应有:人物1,属性为5-10岁、开心,事件为挑水;人物2,属性为5-10岁、开心,事件为挑水;在时刻3对应有:人物1,属性为5-10岁、不开心,事件为发脾气,动作施动体为人物1,动作受动体为人物2和人物3;人物2,属性为5-10岁、不开心,事件为发脾气,动作施动体为人物2,动作受动体为人物1和人物3;人物3,属性为5-10岁、不开心,事件为发脾气,动作施动体为人物3,动作受动体为人物1和人物2。相对应的,触发条件可以是当情景内容分别进展到时刻1、时刻2和时刻3。
本实施例中,触发的交互事件包括答题交互、角色扮演交互和对话交互等。其中,答题交互可以是在情景内容的时间轴信息中选取问题,并依据匹配情况有针对性的和用户进行问答,通过声纹识别方式可以分别识别不同用户的回答结果;角色扮演交互可以是根据匹配处理的结果,将情景内容中的人物和参与交互的用户进行对应匹配,不同用户演绎各自对应的动作、台词等来模拟故事情节;对话交互可以是在情景内容的时间轴信息中选取对话内容,终端设备和用户进行对话交互,可由第三方进行评判。
S305、对所述用户相关联的属性信息进行实时更新,如果更新后的属性信息和历史记录的属性信息不同,则对所述更新后的属性信息和所述情景信息进行匹配处理,重新确定交互事件和触发条件。
需要说明的是,本发明示例性的将S301-S305组成一个实施例执行一种智能交互方法,但仅仅是本发明的一种实例,在本发明的其它实施例中,可以将S201、S202和S303-S305组成一个新的实施例。
本实施例提供了一种智能交互方法,依据属性信息中用户的数量、性别和年龄范围与情景信息中参与情景的人数、性别和年龄范围进行对应匹配,如果匹配成功,则根据匹配的人数、性别和年龄范围以及情景信息中的时间轴信息确定交互事件和触发条件,提高了用户和机器之间的交互灵活性,使得交互方式多元化,交互效率显著提高。
实施例四
图4是本发明实施例四提供的智能交互装置的结构框图,所述装置用于执行上述实施例提供的智能交互方法,具备执行方法相应的功能模块和有益效果。如图4所示,所述装置包括身份识别模块401、情景内容识别模块402、信息匹配模块403、交互模块404和更新模块405。
其中,身份识别模块401,用于获取用户的身份信息,对所述身份信息进行识别以确定和所述用户相关联的属性信息;情景内容识别模块402,用于对情景内容进行识别,以确定和所述情景内容对应的情景信息;信息匹配模块403,用于对所述属性信息和所述情景信息进行匹配处理,依据匹配结果确定交互事件和触发条件;交互模块404,用于当所述触发条件满足时,触发所述交互事件以和所述用户进行信息交互;更新模块405,用于对所述用户相关联的属性信息进行实时更新,所述信息匹配模块还用于:如果更新后的属性信息和历史记录的属性信息不同,则对所述更新后的属性信息和所述情景信息进行匹配处理,重新确定交互事件和触发条件。
本实施例提供的智能交互装置,分别对用户和情景内容进行识别,对识别的用户的属性信息和情景内容的情景信息进行匹配处理,依据匹配结果确定交互事件和触发条件,以在触发条件满足时,触发交互事件和用户进行信息交互,并对用户关联的属性信息进行实时更新以匹配新的交互事件,提高了用户和机器之间的交互灵活性,使得交互方式多元化,交互效率显著提高。
在上述技术方案的基础上,所述身份识别模块401具体用于:
获取用户的语音,对所述语音进行声纹识别,以确定和所述用户相关联的属性信息;
所述情景内容识别模块402具体用于:
对情景内容进行自然语义识别处理,以确定和所述情景内容对应情景信息。
在上述技术方案的基础上,所述信息匹配模块403具体用于:
依据所述属性信息中用户的数量、性别和年龄范围与所述情景信息中参与情景的人数、性别和年龄范围进行对应匹配。
在上述技术方案的基础上,所述信息匹配模块403具体用于:
如果匹配成功,则根据匹配的人数、性别和年龄范围以及所述情景信息中的时间轴信息确定交互事件和触发条件。
在上述技术方案的基础上,所述交互事件包括答题交互、角色扮演交互和对话交互中至少一种。
实施例五
本实施例在上述各实施例的基础上提供了一种智能交互终端设备,该终端设备可以包括本发明实施例四提供的智能交互装置。图5是本发明实施例五提供的智能交互终端设备的结构示意图,如图5所示,该终端设备可以包括:存储器501、中央处理器(CentralProcessing Unit,CPU)502、外设接口503、音频电路505、扬声器511、电源管理芯片508、输入/输出(I/O)子系统509、触摸屏512、其他输入/控制设备510以及外部端口504,这些部件通过一个或多个通信总线或信号线507来通信。
应该理解的是,图示终端设备500仅仅是终端设备的一个范例,并且终端设备500可以具有比图中所示出的更多的或者更少的部件,可以组合两个或更多的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。
下面就本实施例提供的用于智能交互的终端设备进行详细的描述,该终端设备以故事机为例。
存储器501,所述存储器501可以被CPU502、外设接口503等访问,所述存储器501可以包括高速随机存取存储器,还可以包括非易失性存储器,例如一个或多个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
外设接口503,所述外设接口503可以将设备的输入和输出外设连接到CPU502和存储器501。
I/O子系统509,所述I/O子系统509可以将设备上的输入输出外设,例如触摸屏512和其他输入/控制设备510,连接到外设接口503。I/O子系统509可以包括显示控制器5091和用于控制其他输入/控制设备510的一个或多个输入控制器5092。其中,一个或多个输入控制器5092从其他输入/控制设备510接收电信号或者向其他输入/控制设备510发送电信号,其他输入/控制设备510可以包括物理按钮、操纵杆、点击滚轮。
电源管理芯片508,用于为CPU502、I/O子系统及外设接口所连接的硬件进行供电及电源管理。
本发明实施例提供的CPU502可执行如下操作:
根据获取到的用户的身份信息确定和所述用户相关联的属性信息;
对情景内容进行识别,以确定和所述情景内容对应的情景信息;
对所述属性信息和所述情景信息进行匹配处理,依据匹配结果确定交互事件和触发条件,当所述触发条件满足时,触发所述交互事件以和所述用户进行信息交互;
对所述用户相关联的属性信息进行实时更新,如果更新后的属性信息和历史记录的属性信息不同,则对所述更新后的属性信息和所述情景信息进行匹配处理,重新确定交互事件和触发条件。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。