CN109087644B - 电子设备及其语音助手的交互方法、具有存储功能的装置 - Google Patents
电子设备及其语音助手的交互方法、具有存储功能的装置 Download PDFInfo
- Publication number
- CN109087644B CN109087644B CN201811232495.5A CN201811232495A CN109087644B CN 109087644 B CN109087644 B CN 109087644B CN 201811232495 A CN201811232495 A CN 201811232495A CN 109087644 B CN109087644 B CN 109087644B
- Authority
- CN
- China
- Prior art keywords
- voice
- information
- model data
- acquiring
- interaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 149
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000004088 simulation Methods 0.000 claims abstract description 97
- 230000003238 somatosensory effect Effects 0.000 claims description 11
- 230000008451 emotion Effects 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 4
- 238000010171 animal model Methods 0.000 claims description 4
- 230000007613 environmental effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 230000036544 posture Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 210000000697 sensory organ Anatomy 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种语音助手的交互方法,用于电子设备,电子设备设置有语音助手,该交互方法包括:在电子设备接收到开启指令时,开启语音助手;获取用户的语音信息,从语音信息获取关键词;从数据库中获取与关键词对应的模型数据;根据模型数据在电子设备的显示屏上显示模拟模型;根据语音信息获取语音交互信息;通过语音交互信息与用户进行交互,并根据语音交互信息调整模拟模型的状态。通过这种方式,能够提高语音助手交互的智能化水平,提高用户体验。
Description
技术领域
本申请涉及终端技术领域,特别是涉及一种电子设备及其语音助手的交互方法、具有存储功能的装置。
背景技术
语音识别技术随着智能终端的普及而不断发展,语音识别技术是一种使机器可以通过识别和理解的过程,将语音信号转化为相应的文本或者命令的技术。现有的语音识别技术主要应用于智能终端的语音助手。
语音助手是一款智能型的电子设备应用,通过智能对话与即时问答的智能交互,实现帮忙用户解决问题,其主要是帮忙用户解决生活类问题。
本申请的发明人在长期的研发过程中发现,现有技术中,语音助手只是一个显示在电子设备显示屏上的静态的图片,语音助手只能通过语音内容与用户进行互动,智能化程度较低,用户体验较差。
发明内容
本申请主要解决的技术问题是如何提高语音助手交互的智能化水平,以提高用户体验。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种语音助手的交互方法,用于电子设备,该电子设备设置有语音助手,该交互方法包括:在电子设备接收到开启指令时,开启语音助手;获取用户的语音信息,从语音信息获取关键词;从数据库中获取与关键词对应的模型数据;根据模型数据在电子设备的显示屏上显示模拟模型;根据语音信息获取语音交互信息;通过语音交互信息与用户进行交互,并根据语音交互信息调整模拟模型的状态。
其中,上述根据语音信息获取语音交互信息的步骤包括:获取语音信息的语音内容信息,并根据语音内容信息获取第一语音交互信息;获取语音信息的语音状态信息,并根据语音状态信息获取第二语音交互信息;根据第一语音交互信息及第二语音交互信息生成语音交互信息;其中,语音状态信息至少包括语气、语音音量及语速中的任一种。
其中,上述根据语音交互信息调整模拟模型的状态的步骤包括:获取与语音状态信息对应的表情交互信息和/或肢体交互信息;根据表情交互信息调整模拟模型的表情和/或根据肢体交互信息调整模拟模型的肢体动作。
其中,上述根据语音交互信息调整模拟模型的状态的步骤包括:获取与语音状态信息对应的第一模拟模型;根据与第一模拟模型更新显示屏当前显示的模拟模型。
其中,语音交互信息进一步包括与语音状态信息对应的情感关键词信息和/或社会事件信息。
其中,在上述从语音信息获取语音状态信息的步骤之前进一步包括:获取用户的体感信息;上述从语音信息获取语音状态信息的步骤包括:根据体感信息和语音信息获取语音状态信息。
其中,在上述根据语音交互信息调整模拟模型的状态的步骤之前进一步包括:获取电子设备的环境信息;根据语音交互信息及环境信息调整模拟模型的状态。
其中,关键词包括第一关键词及第二关键词,上述从数据库中获取与关键词对应的模型数据的步骤包括:从数据库中获取与第一关键词对应的基础模型数据及与第二关键词对应的附加模型数据;上述根据模型数据在电子设备的显示屏上显示模拟模型的步骤包括:将基础模型数据与附加模型数据进行融合处理,以获取模拟模型数据,并根据模拟模型数据将模拟模型显示在电子设备的显示屏上;其中,基础模型数据至少包括人物模型数据、动物模型数据及植物模型数据中的任一种;附加模型数据至少包括头部模型数据、手部模型数据及着装模型数据中的任一种。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,该电子设备设置有语音助手,电子设备包括显示屏及与显示屏耦接的处理器,其中,处理器用于在电子设备接收到开启指令时,开启语音助手,并获取用户的语音信息,从语音信息获取关键词;处理器用于从数据库中获取与关键词对应的模型数据,并根据模型数据在显示屏上显示模拟模型;处理器用于根据语音信息获取语音交互信息;语音助手用于通过语音交互信息与用户进行交互,处理器用于根据语音交互信息调整模拟模型的状态。
为解决上述技术问题,本申请采用的又一个技术方案是:提供一种具有存储功能的装置,该装置存储有程序数据,该程序数据能够被执行以实现上述语音助手的交互方法。
本申请实施例的有益效果是:区别于现有技术,本申请实施例语音助手的交互方法,用于电子设备,电子设备设置有语音助手,该交互方法包括:在电子设备接收到开启指令时,开启语音助手;获取用户的语音信息,从语音信息获取关键词;从数据库中获取与关键词对应的模型数据;根据模型数据在电子设备的显示屏上显示模拟模型;根据语音信息获取语音交互信息;通过语音交互信息与用户进行交互,并根据语音交互信息调整模拟模型的状态。通过这种方式,语音助手不仅能够与用户进行听觉上的语音交流,而且还能通过模拟模型与用户进行视觉上的交流,能够提高语音助手与用户交互的智能化水平,使用户感觉更亲切、更舒服,能够提高用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请电子设备一实施例的结构示意图;
图2是本申请语音助手的交互方法第一实施例的流程示意图;
图3是图2实施例语音助手的交互方法中步骤S203及步骤S204的具体流程示意图;
图4是图2实施例语音助手的交互方法中步骤S205的具体流程示意图;
图5是图2实施例语音助手的交互方法中步骤S206的一具体流程示意图;
图6是图2实施例语音助手的交互方法中步骤S206的另一具体流程示意图;
图7是本申请语音助手的交互方法第二实施例的流程示意图;
图8是本申请语音助手的交互方法第三实施例的流程示意图;
图9是本申请语音助手的交互方法第四实施例的流程示意图;
图10是本申请电子设备另一实施例的结构示意图;
图11是本申请具有存储功能的装置一实施例的结构示意图。
具体实施方式
下面结合附图和实施例,对本申请作进一步的详细描述。特别指出的是,以下实施例仅用于说明本申请,但不对本申请的范围进行限定。同样的,以下实施例仅为本申请的部分实施例而非全部实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
本申请首先提出一种电子设备,如图1所示,图1是本申请电子设备一实施例的结构示意图。本实施例电子设备101设置有语音助手,电子设备101包括显示器102、拾音器103及扬声器104,其中,显示器102用于显示语音助手的模拟模型105,拾音器103用于获取用户的语音信息,语音助手用于根据用户的语音信息生成语音交互信息,并根据该交互信息调整模拟模型105的状态,扬声器104用于将语音交互信息进行播放。
语音助手是电子设备101的一个应用,其依赖电子设备101的处理器进行语音信息的处理。
其中,本实施例的模拟模型105为人物模型,具体为女孩模型。
在其它实施例中,模拟模型还可以是男女老幼及某个特定职业形象的2D或者3D人物模型,当然,模拟模型还可以是各种拟人化的2D或者3D动植物模型等。电子设备101可以根据用户的喜好、状态或者所处环境等信息更新模拟模型。
区别于现有技术,本实施例语音助手不仅能够与用户进行听觉上的语音交流,而且还能通过模拟模型与用户进行视觉上的交流,能够提高语音助手与用户交互的智能化水平,能够提高用户体验。
本申请进一步提出一种语音助手的交互方法,用于上述电子设备101。如图2所示,本实施例的交互方法具体包括以下步骤:
步骤S201:在电子设备101接收到开启指令时,开启语音助手。
电子设备101监测到语音助手开启指令时,开启语音助手,该开启指令包括语音指令或者触控指令。
步骤S202:获取用户的语音信息,从语音信息获取关键词。
具体地,电子设备101通过拾音器103获取用户的语音信息,并通过语音识别技术将用于语音信息中的词汇内容转换成计算机可读编码或字符序列,然后从该编码或字符序列中获取关键词。
例如,电子设备101获取的语音信息为“我想买裙子”。电子设备101获取该语音信息的关键词为“我”及“裙子”。
步骤S203:从数据库中获取与关键词对应的模型数据。
例如,电子设备101从数据库中获取与关键词“我”及“裙子”对应的女性模型数据,该模型数据用于建立女性模型。
可选地,本实施例的关键词包括第一关键词及第二关键词。本实施例的方法可以通过图3所示方法中步骤S301实现上述步骤S203:
步骤S301:从数据库中获取与第一关键词对应的基础模型数据及与第二关键词对应的附加模型数据。
其中,基础模型数据至少包括人物模型数据、动物模型数据及植物模型数据中的任一种。基础模型数据用于建立模拟模型的基础结构。附加模型数据至少包括头部模型数据、手部模型数据及着装模型数据中的任一种。附加模型数据用于建立模拟模型的具体部位的细节结构,如五官相貌、身高体重、发肤颜色及着装等。
当然,附加模型数据还可以包括下身模型数据或者脚部模型数据。
其中,电子设备101还可以通过图像识别获取上述附加模型数据。例如,电子设备101通过识别用户图像获取用于的脸部、身材及着装等信息作为附加模型数据。
进一步地,基础模型数据及附加模型数据可以不断的根据用户的形象、状态、声音特色、性格、爱好等进行更新进化。
例如,电子设备101从数据库中获取与第一关键词“我”对应的女性人物模型数据,并从数据库中获取与第二关键词“裙子”对应的着装模型数据。当然,电子设备101还可以进一步根据女性人物模型数据及着装模型数据获取相应的头部模型数据及手部模型数据等。
步骤S204:根据模型数据在电子设备101的显示屏102上显示模拟模型。
可选地,本实施例的方法可以通过图3所示方法中步骤S302实现上述步骤S204:
步骤S302:将基础模型数据与附加模型数据进行融合处理,以获取模拟模型数据,并根据模拟模型数据将模拟模型显示在电子设备101的显示屏102上。
本实施例的模型数据可以是点云数据,点云数据包括模型中每个数据的三维坐标、颜色信息及反射强度信息等。当然,在其它实施例中,基础模型数据及附加模型数据还可以以其它形式存储。
电子设备101将基础模型数据及附加模型数据进行叠加,并获取模拟模型数据,电子设备101进一步根据模拟模型数据建立模拟模型,并将模拟模型显示在显示屏102上。
例如,电子设备101将上述女性人物模型数据、裙子模型数据、头部模型数据及手部模型数据等进行叠加,根据叠加后的模型数据建立模拟模型,并显示模拟模型,如图1所示。
步骤S205:根据语音信息获取语音交互信息。
可选地,本实施例可以通过如图4所示的方法实现上述步骤S205。具体地,本实施例的方法包括以下步骤:
步骤S401:获取语音信息的语音内容信息,并根据语音内容信息获取第一语音交互信息。
电子设备101从语音信息中获取语音内容信息,该语音内容信息可以是语音信息的完整语义信息,或者是语音信息中的关键词信息;电子设备101进一步从预设表中获取与该语音内容信息对应的第一语音交互信息。
第一语音交互信息包括与用户语音信息中语义对应的反馈语义信息。
步骤S402:获取语音信息的语音状态信息,并根据语音状态信息获取第二语音交互信息。
其中,语音状态信息至少包括语气、语音音量及语速中的任一种。
语音状态信息能够反映用户当前的状态,如情绪等。
步骤S403:根据第一语音交互信息及第二语音交互信息生成语音交互信息。
步骤S206:通过语音交互信息与用户进行交互,并根据语音交互信息调整模拟模型的状态。
具体的,语音助手根据第一语音交互信息与用户进行语音语义交互,根据第二语音交互信息与用户进行语音状态交互。
同时,电子设备101可以根据语音交互信息调整模拟模型105的着装及各个部位的状态及姿态等。例如,电子设备101根据用户的语音信息“我要买裙子”(不仅包括“我要买裙子”的语义信息,还包括用户高兴状态信息等)生成语音交互信息,并通过扬声器104播放第一语音交互信息“xx商场有好多漂亮的裙子”,同时根据第二语音交互信息将模拟模型105调整为笑脸及高兴的状态,如图1所示。
可选地,本实施例可以通过如图5所述的方法实现上述步骤S206,本实施例的方法包括以下步骤:
步骤S501:获取与语音状态信息对应的表情交互信息和/或肢体交互信息。
电子设备101可以根据不同的基础模型数据设置不同的表情交互信息库及不同的肢体交互信息库。
上述语音信息“我要买裙子”的语音状态信息为“高兴”,电子设备101可以从与女性人物模型数据对应的表情交互信息库中获取“笑脸”,或者从与女性人物模型数据对应的肢体交互信息库中获取“抬手”等表现高兴状态的肢体状态信息。
步骤S502:根据表情交互信息调整模拟模型的表情和/或根据肢体交互信息调整模拟模型的肢体动作。
本实施例能够根据用于语音的语音状态信息调整显示屏102中模拟模型105的表情、肢体动作等,能够语音助手交互的生动性,提高用户体验。
在另一实施例中,可以通过如图6所述的方法实现上述步骤S206,本实施例的方法包括以下步骤:
步骤S601:获取与语音状态信息对应的第一模拟模型。
语音助手设置有多个模拟模型。
步骤S602:根据与第一模拟模型更新显示屏当前显示的模拟模型。
电子设备101可以获取与用户的语音状态信息对应的第一模拟模型,并将显示屏102显示的当前模拟模型更新为第一模拟模型。
由上述分析可知,可以根据用户语音信息的关键词获取语音助手的模拟模型105,还可以根据用户语音状态信息更新模拟模型105。当然,还可以根据用户语音状态信息更新模拟模型105的部分结构的状态。
用户的语音信息不仅能够体现用户行为意图,而且还能体现用户的当前状态,本实施例语音助手能够通过对语音交互信息及模拟模型105的状态与用户进行更生动的交互。
区别于现有技术,本实施例语音助手不仅能够与用户进行听觉上的语音交流,而且还能通过模拟模型与用户进行视觉上的交流,能够提高语音助手与用户交互的智能化水平,能够提高用户体验。
本申请进一步提出第二实施例的语音助手的交互方法,如图7所示,本实施例的交互方法包括以下步骤:
步骤S701:在电子设备接收到开启指令时,开启语音助手。
步骤S702:获取用户的语音信息,从语音信息获取关键词。
步骤S703:从数据库中获取与关键词对应的模型数据。
步骤S704:根据模型数据在电子设备的显示屏上显示模拟模型。
步骤S701-S704与上述步骤S201-S204相同,这里不赘述。
步骤S705:获取语音信息的语音内容信息,并根据语音内容信息获取第一语音交互信息。
第一语音交互信息包括与用户语音信息中语义对应的反馈语义信息。
步骤S705与上述步骤S401相同,这里不赘述。
步骤S706:获取语音信息的语音状态信息,并根据语音状态信息获取第二语音交互信息及第三交互信息。
其中,语音状态信息至少包括语气、语音音量及语速中的任一种。第三语音交互信息包括与语音状态信息对应的情感关键词信息和/或社会事件信息。
步骤S707:根据第一语音交互信息、第二语音交互信息及第三交互语音信息生成语音交互信息。
步骤S708:通过语音交互信息与用户进行交互,并根据语音交互信息调整模拟模型的状态。
语音助手根据第一语音交互信息与用户进行语音语义交互;根据第二语音交互信息与用户进行语音状态交互;根据第三语音交互信息向用户主动推送情感关键词信息和/或社会事件信息,例如,用于语音状态信息为“生气”时,语音助手可以向用户主动推送“消消气”、“别生气”等情感关键词。
本申请实施例语音助手能够向用户主动推送与用户状态对应的情感关键词信息和/或社会事件信息,能够进一步提高语音助手交互的智能化水平。
本申请进一步提出第三实施例的语音助手的交互方法,如图8所示,本实施例的交互方法包括以下步骤:
步骤S801:在电子设备接收到开启指令时,开启语音助手。
步骤S802:获取用户的语音信息,从语音信息获取关键词。
步骤S803:从数据库中获取与关键词对应的模型数据。
步骤S804:根据模型数据在电子设备的显示屏上显示模拟模型。
步骤S805:获取语音信息的语音内容信息,并根据语音内容信息获取第一语音交互信息。
步骤S801-S805与上述步骤S701-S705相同,这里不赘述。
步骤S806:获取用户的体感信息。
其中,体感信息至少包括用户的姿态信息或者动作信息等。
步骤S807:根据体感信息和语音信息获取语音状态信息,并根据语音状态信息获取第二语音交互信息。
用户与语音助手进行语音交互时,通常伴随有与语音信息对应的体感信息,本实施例根据用户体感信息和语音信息获取语音状态信息,能够提高语音状态信息的精度。
步骤S808:通过语音交互信息与用户进行交互,并根据语音交互信息调整模拟模型的状态。
步骤S808与上述步骤S708相同,这里不赘述。
在其它实施例中,还可以获取用户的表情信息等,以根据表情信息及语音信息获取语音状态信息。
本申请进一步提出第四实施例的语音助手的交互方法,如图9所示,本实施例的交互方法包括以下步骤:
步骤S901:在电子设备接收到开启指令时,开启语音助手。
步骤S902:获取用户的语音信息,从语音信息获取关键词。
步骤S903:从数据库中获取与关键词对应的模型数据。
步骤S904:根据模型数据在电子设备的显示屏上显示模拟模型。
步骤S905:根据语音信息获取语音交互信息。
步骤S901-S905与上述步骤S201-S205相同,这里不赘述。
步骤S906:获取电子设备的环境信息。
环境信息包括场景信息等,如家里、休闲场所、办公场所等等。
步骤S907:通过语音交互信息与用户进行交互,并根据述语音交互信息及环境信息调整模拟模型的状态。
用户在不同的场景中,状态不同,本实施例根据述语音交互信息及环境信息调整模拟模型的状态,能够使模拟模型的状态更符合用户所处的场景,提高用户体验。
例如,在电子设备判断用户所处的场景是家里时,可以将模拟模型调整为可爱装扮、可爱的表情,或者将模拟模型更新为小孩模型;在电子设备判断用户所处的场景是办公室时,可以将模拟模型调整为秘书模型,等等。
本申请进一步提出另一实施例的电子设备,如图10所示,图10是本申请终端另一实施例的结构示意图。本实施例电子设备1001设置有语音助手,电子设备1001包括显示屏1002及与显示屏1002耦接的处理器1003,其中,处理器1003用于在电子设备1001接收到开启指令时,开启语音助手,并获取用户的语音信息,从语音信息获取关键词;处理器1003用于从数据库中获取与关键词对应的模型数据,并根据模型数据在显示屏上显示模拟模型;处理器1003用于根据语音信息获取语音交互信息;语音助手用于通过语音交互信息与用户进行交互,处理器1003用于根据语音交互信息调整模拟模型的状态。
电子设备1001还可以实现上述方法,这里不赘述。
区别于现有技术,本实施例电子设备1001的语音助手不仅能够与用户进行听觉上的语音交流,而且还能通过模拟模型与用户进行视觉上的交流,能够提高语音助手与用户交互的智能化水平,能够提高用户体验。
本实施例电子设备1001可以是手机、平板、IPAD及可穿戴设备等。
本申请进一步提出一种具有存储功能的装置,如图11所示,图11是本申请具有存储功能的装置一实施例的结构示意图。本实施例具有存储功能的装置1101用于存储上述实施例的相关数据1102及程序数据1103,其中,相关数据1102至少包括上述数据库等,程序数据1103能够被执行以上述方法实施例的方法。相关数据1102及程序数据1103已在上述方法实施例中进行了详细的叙述,这里不赘述。
本实施例具有存储功能的装置1101可以是但不局限于U盘、SD卡、PD光驱、移动硬盘、大容量软驱、闪存、多媒体记忆卡、服务器等。
本申请实施例语音助手的交互方法,用于电子设备,电子设备设置有语音助手,该交互方法包括:在电子设备接收到开启指令时,开启语音助手;获取用户的语音信息,从语音信息获取关键词;从数据库中获取与关键词对应的模型数据;根据模型数据在电子设备的显示屏上显示模拟模型;根据语音信息获取语音交互信息;通过语音交互信息与用户进行交互,并根据语音交互信息调整模拟模型的状态。通过这种方式,语音助手不仅能够与用户进行听觉上的语音交流,而且还能通过模拟模型与用户进行视觉上的交流,能够提高语音助手与用户交互的智能化水平,使用户感觉更亲切、更舒服,能够提高用户体验。
本申请实施例不仅能够提高拍摄界面中预览图像的显示清晰度而且还能提高预览图像和已拍图像在终端屏幕上的上呈现效果,能使这些更显示更生动鲜明,视觉效果更好。
另外,上述功能如果以软件功能的形式实现并作为独立产品销售或使用时,可存储在一个移动终端可读取存储介质中,即,本申请还提供一种存储有程序数据的存储装置,所述程序数据能够被执行以实现上述实施例的方法,该存储装置可以为如U盘、光盘、服务器等。也就是说,本申请可以以软件产品的形式体现出来,其包括若干指令用以使得一台智能终端执行各个实施例所述方法的全部或部分步骤。
在本申请的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(可以是个人计算机,服务器,网络设备或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (8)
1.一种语音助手的交互方法,其特征在于,用于电子设备,所述电子设备设置有语音助手,所述交互方法包括:
在所述电子设备接收到开启指令时,开启所述语音助手,所述语音助手中设置有多个模拟模型;
获取用户的语音信息,从所述语音信息获取关键词;
从数据库中获取与所述关键词对应的模型数据;
根据所述模型数据在所述电子设备的显示屏上显示所述模拟模型;
获取所述用户的体感信息;
根据所述体感信息和所述语音信息获取语音交互信息;
通过所述语音交互信息与所述用户进行交互,并根据所述语音交互信息调整所述模拟模型的状态;
其中,所述关键词包括第一关键词及第二关键词,所述从数据库中获取与所述关键词对应的模型数据的步骤包括:
从数据库中获取与所述第一关键词对应的基础模型数据及与所述第二关键词对应的附加模型数据,所述基础模型数据至少包括人物模型数据、动物模型数据及植物模型数据中的任一种;所述附加模型数据至少包括头部模型数据、手部模型数据及着装模型数据中的任一种;
所述根据所述模型数据在所述电子设备的显示屏上显示模拟模型的步骤包括:
将所述基础模型数据与所述附加模型数据进行融合处理,以获取模拟模型数据,并根据所述模拟模型数据将模拟模型显示在所述电子设备的显示屏上。
2.根据权利要求1所述的交互方法,其特征在于,所述根据所述语音信息获取语音交互信息的步骤包括:
获取所述语音信息的语音内容信息,并根据所述语音内容信息获取第一语音交互信息;
获取所述语音信息的语音状态信息,并根据所述语音状态信息获取第二语音交互信息;
根据所述第一语音交互信息及所述第二语音交互信息生成所述语音交互信息;
其中,所述语音状态信息至少包括语气、语音音量及语速中的任一种。
3.根据权利要求2所述的交互方法,其特征在于,所述根据所述语音交互信息调整所述模拟模型的状态的步骤包括:
获取与所述语音状态信息对应的表情交互信息和/或肢体交互信息;
根据所述表情交互信息调整所述模拟模型的表情和/或根据所述肢体交互信息调整所述模拟模型的肢体动作。
4.根据权利要求2所述的交互方法,其特征在于,所述根据所述语音交互信息调整所述模拟模型的状态的步骤包括:
获取与所述语音状态信息对应的第一模拟模型;
根据与所述第一模拟模型更新所述显示屏当前显示的模拟模型。
5.根据权利要求2所述的交互方法,其特征在于,所述语音交互信息进一步包括与所述语音状态信息对应的情感关键词信息和/或社会事件信息。
6.根据权利要求1所述的交互方法,其特征在于,在所述根据所述语音交互信息调整所述模拟模型的状态的步骤之前进一步包括:
获取所述电子设备的环境信息;
根据所述语音交互信息及所述环境信息调整所述模拟模型的状态。
7.一种电子设备,其特征在于,所述电子设备设置有语音助手,所述电子设备包括显示屏及与所述显示屏耦接的处理器,其中,所述处理器用于在所述电子设备接收到开启指令时,开启所述语音助手,所述语音助手中设置有多个模拟模型,并获取用户的语音信息,从所述语音信息获取关键词;所述处理器用于从数据库中获取与所述关键词对应的模型数据,并根据所述模型数据在所述显示屏上显示所述模拟模型;所述处理器用于获取所述用户的体感信息并根据所述体感信息和所述语音信息获取语音交互信息;所述语音助手用于通过所述语音交互信息与所述用户进行交互,所述处理器用于根据所述语音交互信息调整所述模拟模型的状态,其中,所述关键词包括第一关键词及第二关键词,所述处理器还用于:从数据库中获取与所述第一关键词对应的基础模型数据及与所述第二关键词对应的附加模型数据,所述基础模型数据至少包括人物模型数据、动物模型数据及植物模型数据中的任一种;所述附加模型数据至少包括头部模型数据、手部模型数据及着装模型数据中的任一种;所述处理器用于将所述基础模型数据与所述附加模型数据进行融合处理,以获取模拟模型数据,并根据所述模拟模型数据将模拟模型显示在所述电子设备的显示屏上。
8.一种具有存储功能的装置,其特征在于,所述装置存储有程序数据,所述程序数据能够被执行以实现权利要求1-6任一项所述的语音助手的交互方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811232495.5A CN109087644B (zh) | 2018-10-22 | 2018-10-22 | 电子设备及其语音助手的交互方法、具有存储功能的装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811232495.5A CN109087644B (zh) | 2018-10-22 | 2018-10-22 | 电子设备及其语音助手的交互方法、具有存储功能的装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109087644A CN109087644A (zh) | 2018-12-25 |
CN109087644B true CN109087644B (zh) | 2021-06-25 |
Family
ID=64844087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811232495.5A Active CN109087644B (zh) | 2018-10-22 | 2018-10-22 | 电子设备及其语音助手的交互方法、具有存储功能的装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109087644B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413841A (zh) * | 2019-06-13 | 2019-11-05 | 深圳追一科技有限公司 | 多态交互方法、装置、系统、电子设备及存储介质 |
CN110450789B (zh) * | 2019-08-13 | 2020-12-15 | 广州小鹏汽车科技有限公司 | 一种信息处理方法和装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105208056A (zh) * | 2014-06-18 | 2015-12-30 | 腾讯科技(深圳)有限公司 | 信息交互的方法及终端 |
CN105957525A (zh) * | 2016-04-26 | 2016-09-21 | 珠海市魅族科技有限公司 | 一种语音助手的交互方法以及用户设备 |
CN106710590A (zh) * | 2017-02-24 | 2017-05-24 | 广州幻境科技有限公司 | 基于虚拟现实环境的具有情感功能的语音交互系统及方法 |
CN107247750A (zh) * | 2017-05-26 | 2017-10-13 | 深圳千尘计算机技术有限公司 | 人工智能交互方法及系统 |
CN107329990A (zh) * | 2017-06-06 | 2017-11-07 | 北京光年无限科技有限公司 | 一种用于虚拟机器人的情绪输出方法以及对话交互系统 |
WO2017191874A1 (ko) * | 2016-05-03 | 2017-11-09 | 엘지전자 주식회사 | 전자 장치 및 그 제어 방법 |
CN107393529A (zh) * | 2017-07-13 | 2017-11-24 | 珠海市魅族科技有限公司 | 语音识别方法、装置、终端及计算机可读存储介质 |
JP2017228030A (ja) * | 2016-06-21 | 2017-12-28 | 日本電気株式会社 | 作業支援システム、管理サーバ、携帯端末、作業支援方法およびプログラム |
CN108320738A (zh) * | 2017-12-18 | 2018-07-24 | 上海科大讯飞信息科技有限公司 | 语音数据处理方法及装置、存储介质、电子设备 |
CN108326855A (zh) * | 2018-01-26 | 2018-07-27 | 上海器魂智能科技有限公司 | 一种机器人的交互方法、装置、设备以及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096716A (zh) * | 2016-06-01 | 2016-11-09 | 安徽声讯信息技术有限公司 | 一种面部表情机器人多通道信息情感表达映射方法 |
CN106384591A (zh) * | 2016-10-27 | 2017-02-08 | 乐视控股(北京)有限公司 | 一种与语音助手应用交互的方法和装置 |
CN107748621A (zh) * | 2017-11-06 | 2018-03-02 | 潘柏霖 | 一种智能交互机器人 |
CN107944542A (zh) * | 2017-11-21 | 2018-04-20 | 北京光年无限科技有限公司 | 一种基于虚拟人的多模态交互输出方法及系统 |
CN108648251B (zh) * | 2018-05-15 | 2022-05-24 | 奥比中光科技集团股份有限公司 | 3d表情制作方法及系统 |
-
2018
- 2018-10-22 CN CN201811232495.5A patent/CN109087644B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105208056A (zh) * | 2014-06-18 | 2015-12-30 | 腾讯科技(深圳)有限公司 | 信息交互的方法及终端 |
CN105957525A (zh) * | 2016-04-26 | 2016-09-21 | 珠海市魅族科技有限公司 | 一种语音助手的交互方法以及用户设备 |
WO2017191874A1 (ko) * | 2016-05-03 | 2017-11-09 | 엘지전자 주식회사 | 전자 장치 및 그 제어 방법 |
JP2017228030A (ja) * | 2016-06-21 | 2017-12-28 | 日本電気株式会社 | 作業支援システム、管理サーバ、携帯端末、作業支援方法およびプログラム |
CN106710590A (zh) * | 2017-02-24 | 2017-05-24 | 广州幻境科技有限公司 | 基于虚拟现实环境的具有情感功能的语音交互系统及方法 |
CN107247750A (zh) * | 2017-05-26 | 2017-10-13 | 深圳千尘计算机技术有限公司 | 人工智能交互方法及系统 |
CN107329990A (zh) * | 2017-06-06 | 2017-11-07 | 北京光年无限科技有限公司 | 一种用于虚拟机器人的情绪输出方法以及对话交互系统 |
CN107393529A (zh) * | 2017-07-13 | 2017-11-24 | 珠海市魅族科技有限公司 | 语音识别方法、装置、终端及计算机可读存储介质 |
CN108320738A (zh) * | 2017-12-18 | 2018-07-24 | 上海科大讯飞信息科技有限公司 | 语音数据处理方法及装置、存储介质、电子设备 |
CN108326855A (zh) * | 2018-01-26 | 2018-07-27 | 上海器魂智能科技有限公司 | 一种机器人的交互方法、装置、设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109087644A (zh) | 2018-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7408048B2 (ja) | 人工知能に基づくアニメキャラクター駆動方法及び関連装置 | |
TWI778477B (zh) | 互動方法、裝置、電子設備以及儲存媒體 | |
CN110688911B (zh) | 视频处理方法、装置、系统、终端设备及存储介质 | |
CN107340859B (zh) | 多模态虚拟机器人的多模态交互方法和系统 | |
CN104184760B (zh) | 通讯过程中的信息交互方法、客户端及服务器 | |
TWI766499B (zh) | 互動物件的驅動方法、裝置、設備以及儲存媒體 | |
CN110286756A (zh) | 视频处理方法、装置、系统、终端设备及存储介质 | |
CN110555507B (zh) | 虚拟机器人的交互方法、装置、电子设备及存储介质 | |
US11960792B2 (en) | Communication assistance program, communication assistance method, communication assistance system, terminal device, and non-verbal expression program | |
CN110400251A (zh) | 视频处理方法、装置、终端设备及存储介质 | |
CN108877336A (zh) | 基于增强现实技术的教学方法、云服务平台和教学系统 | |
CN111538456A (zh) | 基于虚拟形象的人机交互方法、装置、终端以及存储介质 | |
CN113508369A (zh) | 交流支持系统、交流支持方法、交流支持程序以及图像控制程序 | |
CN105141587B (zh) | 一种虚拟玩偶互动方法及装置 | |
CN109086860B (zh) | 一种基于虚拟人的交互方法及系统 | |
JP2018014094A (ja) | 仮想ロボットのインタラクション方法、システム及びロボット | |
CN111327772B (zh) | 进行自动语音应答处理的方法、装置、设备及存储介质 | |
KR20180071833A (ko) | 3d 디지털 액터형 컴퓨터 인터페이스 운용시스템 | |
CN109409255A (zh) | 一种手语场景生成方法及装置 | |
CN109324688A (zh) | 基于虚拟人行为标准的交互方法及系统 | |
EP4300431A1 (en) | Action processing method and apparatus for virtual object, and storage medium | |
CN108629821A (zh) | 动画生成方法和装置 | |
CN109343695A (zh) | 基于虚拟人行为标准的交互方法及系统 | |
CN111414506A (zh) | 基于人工智能情绪处理方法、装置、电子设备及存储介质 | |
CN109087644B (zh) | 电子设备及其语音助手的交互方法、具有存储功能的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 518000 1-10 Floor, Building A2, Nanshan Zhiyuan, 1001 Xueyuan Avenue, Nanshan District, Shenzhen City, Guangdong Province Applicant after: Our Internet Network Technology (Shenzhen) Co., Ltd. Address before: 518000 1-10 Floor, Building A2, Nanshan Zhiyuan, 1001 Xueyuan Avenue, Shenzhen City, Guangdong Province Applicant before: Our Internet Network Technology (Shenzhen) Co., Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |