CN114424259A - 基于个性的智能个人助理系统 - Google Patents
基于个性的智能个人助理系统 Download PDFInfo
- Publication number
- CN114424259A CN114424259A CN201980100634.5A CN201980100634A CN114424259A CN 114424259 A CN114424259 A CN 114424259A CN 201980100634 A CN201980100634 A CN 201980100634A CN 114424259 A CN114424259 A CN 114424259A
- Authority
- CN
- China
- Prior art keywords
- ipa
- user
- personality
- entity
- personal assistant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 claims abstract description 26
- 230000003993 interaction Effects 0.000 claims abstract description 9
- 230000010354 integration Effects 0.000 claims abstract description 4
- 230000006399 behavior Effects 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 230000036651 mood Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 3
- SAZUGELZHZOXHB-UHFFFAOYSA-N acecarbromal Chemical compound CCC(Br)(CC)C(=O)NC(=O)NC(C)=O SAZUGELZHZOXHB-UHFFFAOYSA-N 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
- G06F9/453—Help systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2203/00—Indexing scheme relating to G06F3/00 - G06F3/048
- G06F2203/01—Indexing scheme relating to G06F3/01
- G06F2203/011—Emotion or mood input determined on the basis of sensed human body parameters such as pulse, heart rate or beat, temperature of skin, facial expressions, iris, voice pitch, brain activity patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Acoustics & Sound (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
提供了一种基于个性的智能个人助理IPA系统,其包括:至少一个第一实体,其适于确定有关信息提供的用户偏好;以及至少一个第二实体,其适于接收所述第一实体的确定结果。所述第二实体进一步适于根据所确定的用户偏好调节与所述用户的沟通行为有关的IPA属性,其中,沟通行为属性包括:向所述用户提供的信息量和/或系统发起的交互频率和/或自动化的主动性和/或第三方内容的集成。
Description
技术领域
本发明涉及一种基于个性的智能个人助理IPA系统。
背景技术
目前有许多有关智能个人助理(IPA)的系统在销售和处于研发之中。这些IPA系统允许用户以自然的方式、优选经由所谓的声音控制与技术系统进行交互。这些系统使用各种交互形式(例如,言语提示、图形显示)以及各种设备(例如,智能手机、个人电脑、扬声器)帮助用户提出个性化建议,以便与用户进行交互。由于沟通方式和消息内容,形成了从技术到个人都在变化的角色。该角色通常是开发公司预期设计的结果。此外,已知系统可以通过调节其信息输出来适应用户的实际情绪。
例如可在US2015/0371663A1中发现已知IPA的示例,其中使用了一个或多个模式化角色,以便对用户请求做出反应。在此文献中,IPA的输出被调节为使得选择出优选的输出风格(例如,口头或书面)并且调节时间设置以适应用户偏好。
然而,已知的现有技术目前专注于通过分析言语来识别情绪。根据所识别的情绪信息,提供输出,对该输出进行调整以便与用户的情绪一致,即,不会改变用户的情绪或者将用户的情绪引导至更积极的情绪。然而,由于已知的IPA系统仅提供一个或多个模式化角色,不同的用户会不同地感知角色的特定存在。根据个别用户偏好,该特定存在可能不受喜欢,这将会导致不愿使用该系统。
发明内容
为了避免个人偏好与预定IPA角色的冲突,本发明的范围用以提供一种特别用在车辆中的新的IPA,其提供了更为个性化的角色,因此导致更高的用户接受度。
该问题由如在独立权利要求中描述的基于个性的IPA系统得以解决。在从属权利要求中提出了特定的附加特征。
提供了一种基于个性的智能个人助理IPA系统,其包括:
-至少一个第一实体,其适于确定有关信息提供的用户偏好,以及
-至少一个第二实体,其适于接收第一实体的确定结果,并且其进一步适于根据所确定的用户偏好调节与用户的沟通行为有关的IPA属性,其中,沟通行为属性包括:
○向用户提供的信息量和/或
○系统发起的交互频率和/或
○自动化的主动性和/或
○第三方内容的集成。
由于新的基于个性的IPA,角色的特定性可以许多不同的方式在关于用户偏好的若干属性中进行调节。
通过根据用户偏好调节一般提供的或者关于预定主题的信息量,可以考虑用户在一个或多个主题方面的精通性。
通过根据待沟通的问题的设置优先级采用由IPA系统输出的沟通频率,该系统可以在从只通知用户最重要的问题至使用户对所有新信息保持更新的若干级别中调节系统发起的交互的频率。
进一步,第三方内容被包括在IPA系统的沟通任务中。通常,IPA与原生环境、例如汽车环境有关。因此,其通常仅将其沟通指向与该原生环境直接相关的主题,即,基于汽车的IPA仅与汽车相关的主题进行交互。通过集成更多的内容(这些内容例如由诸如社交网络、智能家居、新闻提供商的第三方提供商提供),IPA系统可提供更多的信息并因此对用户更有价值。
进一步,IPA属性,即其沟通行为,附加地在言语输出的风格、声音输出的方式、书面输出的风格方面是变化的。由于IPA系统与用户进行沟通的方式可以与其使用的言语风格有关地、既在书面输出中且也在口头输出中变化,所以用户不会因系统向其提出的方式或者因系统输出信息的方式而感觉到恼火或生气。
进一步,言语和/或书面输出的风格的范围从使用短句子、抽象词和/或陈述的技术性沟通风格到使用完整句子、描述性语言的沟通风格,或者这二者之间的任意沟通风格。这意味着,IPA系统的范围可从技术言语至正式或个人风格,由系统引用其自身、用户和其他对象的方式以及使用的填充短语的数量来限定。
进一步,根据用户偏好,使用不同的性别、年龄或语调对言语输出所使用的声音种类进行调节。
进一步,IPA系统使用学习算法,该学习算法通过观察用户对所提供的沟通的反应持续学习用户偏好。
由于IPA学习用户的习惯和偏好,所以其可以导出规则以使通常由用户手动控制的功能自动化。另外,用以使这些功能自动化的这种能力的主动性可以被调节。服务范围从仅使用户明令地对IPA编程执行的功能自动化到请求准许开始新学习的自动化任务并独立执行新的规则,除非被告知不能这么做。
进一步,IPA属性的调节可由用户手动完成来提供,或者其可自动调节,例如基于对用户反应的解释自动调节。
进一步,属性的调节可以独立提供,或者其特定值可分组成若干个一致的角色。示例角色是下述角色,所述角色为下述之一:冷静且深思熟虑、活泼且健谈、和/或仅使用短句子、和/或使用复杂语言、安静或洪亮。因此,可以提供具有彼此匹配的一串属性的预定角色。
进一步,所述智能个人助理系统使用在汽车环境中。
附图说明
这些和/或其他方面根据示例性实施例的以下描述并结合附图将变得明显且更易于理解,在附图中:
图1显示了根据本发明的一个实施例的IPA的主要组件。
具体实施方式
本发明的基本原理是提供一种IPA,该IPA基于用户3的个性向用户3提供沟通。
目前,有一些IPA系统关注于比如识别用户3情绪的详细沟通问题,例如用户3是否疲倦或者注意力不集中。利用该信息,IPA的模式化(即,预定)角色用来与用户3进行沟通。
然而,对于那些IPA,只有标准化角色可以利用,其并不根据用户3的偏好调节其输出,而是只以一般预定的方式采用其输出来响应于用户3的输入。因此,由于所建议的IPA系统,可生成下述IPA,其沟通行为、即沟通行为的属性可被调节以适应用户3的偏好。
为了实现这一点,提供第一实体1,该第一实体适于确定有关信息提供的用户3偏好。该第一实体1可以是一个或多个相机和/或一个或多个传感器,其适于感测用户3的生理状况和用户3的其他状况,这些状况已知是用于确定有关沟通行为的用户3偏好的指标。进一步,提供第二实体2,该第二实体适于接收第一实体1的确定结果。该第二实体2优选为控制单元,其适于控制对用户3的沟通输出,并且进一步适于根据所确定的用户3偏好来调节与用户3的沟通行为有关的IPA属性。沟通行为属性包括向用户3提供的信息量和/或系统发起的交互频率和/或自动化的主动性和/或第三方内容的集成。通过使用这些属性中的至少一个属性,IPA变得更为个性化并因此用户3的接受度将增加。
向用户3提供的信息量的属性指的是提供了多少详细信息作为IPA的输出,特别是关于向用户3提供更多或更少的详细指示。
系统发起的交互频率的属性指的是系统多久与用户3发起对话。其可能是“从不”,因此每次交互由用户3发起,或者是任何更高的频率,也取决于交互所涉及的主题的重要性。
自动化的主动性的属性指的是调节的可能性,IPA是否基于从用户3观察到和学习到的行为独立地执行功能,或其是否总是请求准许采用新的自动化,或其自身是否从不主动开始自动化。
第三方内容的集成的属性指的是允许或禁止IPA访问第三方提供的信息和功能、例如社交媒体上的信息、智能家居的控制等的可能性。
如上所述的IPA系统可在汽车环境中使用,例如作为驾驶员的辅助系统,或者在想要或需要技术实体支持用户3的其他技术领域中使用。
Claims (6)
1.一种基于个性的智能个人助理(IPA)系统,包括:
-至少一个第一实体(1),其适于确定有关信息提供的用户(3)偏好,以及
-至少一个第二实体(2),其适于接收所述第一实体的确定结果,并且其进一步适于根据所确定的用户(3)偏好调节与所述用户(3)的沟通行为有关的IPA属性,其中,沟通行为属性包括:
○向所述用户(3)提供的信息量和/或
○系统发起的交互频率和/或
○自动化的主动性和/或
○第三方内容的集成。
2.根据权利要求1所述的基于个性的智能个人助理(IPA)系统,其中,沟通行为附加地在言语输出的风格、声音输出的方式、书面输出的风格方式方面是变化的。
3.根据前述权利要求中任一项所述的基于个性的智能个人助理(IPA)系统,其中,通过使用不同的性别、年龄或语调,沟通行为附加地在言语输出所使用的声音种类方面是变化的。
4.根据前述权利要求中任一项所述的基于个性的智能个人助理(IPA)系统,其中,在所述第一实体中实施学习算法,该学习算法通过观察所述用户(3)对所提供的沟通的反应持续学习所述用户(3)偏好。
5.根据前述权利要求中任一项所述的基于个性的智能个人助理(IPA)系统,其中,所述第一实体适于创建角色,该角色包括有关IPA的沟通行为的一串属性,所述一串属性与所确定的用户(3)偏好匹配。
6.根据前述任一项权利要求所述的基于个性的智能个人助理(IPA)系统,其中,所述智能个人助理系统用于汽车环境。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/122021 WO2021102924A1 (en) | 2019-11-29 | 2019-11-29 | Personality-based intelligent personal assistant system |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114424259A true CN114424259A (zh) | 2022-04-29 |
Family
ID=76129003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980100634.5A Pending CN114424259A (zh) | 2019-11-29 | 2019-11-29 | 基于个性的智能个人助理系统 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20240095489A1 (zh) |
CN (1) | CN114424259A (zh) |
DE (1) | DE112019007941T5 (zh) |
WO (1) | WO2021102924A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115524989A (zh) * | 2022-05-31 | 2022-12-27 | 青岛海尔智能家电科技有限公司 | 用于进行场景交互的方法及装置、电子设备、存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015200153A1 (en) * | 2014-06-25 | 2015-12-30 | Microsoft Technology Licensing, Llc | Leveraging user signals for initiating communications |
CN108205830A (zh) * | 2016-12-20 | 2018-06-26 | 百度(美国)有限责任公司 | 识别对于无人驾驶车辆的个人驾驶偏好的方法和系统 |
CN109189980A (zh) * | 2018-09-26 | 2019-01-11 | 三星电子(中国)研发中心 | 与用户进行语音交互的方法和电子设备 |
CN110300986A (zh) * | 2017-02-15 | 2019-10-01 | 微软技术许可有限责任公司 | 与智能个人助理的辅助通信 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11328265B1 (en) * | 2011-05-02 | 2022-05-10 | Givoly Inventions, LLC | System, method, and computer program product for allocating time to achieve objectives |
US9965553B2 (en) * | 2013-05-29 | 2018-05-08 | Philip Scott Lyren | User agent with personality |
US10088972B2 (en) * | 2013-12-31 | 2018-10-02 | Verint Americas Inc. | Virtual assistant conversations |
US9390706B2 (en) | 2014-06-19 | 2016-07-12 | Mattersight Corporation | Personality-based intelligent personal assistant system and methods |
US10261830B2 (en) * | 2016-06-14 | 2019-04-16 | Microsoft Technology Licensing, Llc | Cross-device task execution |
US10339926B2 (en) * | 2016-12-31 | 2019-07-02 | Oath Inc. | Digital assistant |
US20210056610A1 (en) * | 2017-03-16 | 2021-02-25 | Wells Fargo Bank, N.A. | Building Customer Trust in Digital Financial Tools |
US10643632B2 (en) * | 2018-01-12 | 2020-05-05 | Wells Fargo Bank, N.A. | Automated voice assistant personality selector |
US20190354594A1 (en) * | 2018-05-20 | 2019-11-21 | Microsoft Technology Licensing, Llc | Building and deploying persona-based language generation models |
US10198877B1 (en) * | 2018-05-23 | 2019-02-05 | Google Llc | Providing a communications channel between instances of automated assistants |
CN108965578A (zh) * | 2018-05-31 | 2018-12-07 | 出门问问信息科技有限公司 | 信息推送方法及装置 |
-
2019
- 2019-11-29 US US17/767,964 patent/US20240095489A1/en active Pending
- 2019-11-29 CN CN201980100634.5A patent/CN114424259A/zh active Pending
- 2019-11-29 DE DE112019007941.7T patent/DE112019007941T5/de active Pending
- 2019-11-29 WO PCT/CN2019/122021 patent/WO2021102924A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015200153A1 (en) * | 2014-06-25 | 2015-12-30 | Microsoft Technology Licensing, Llc | Leveraging user signals for initiating communications |
CN108205830A (zh) * | 2016-12-20 | 2018-06-26 | 百度(美国)有限责任公司 | 识别对于无人驾驶车辆的个人驾驶偏好的方法和系统 |
CN110300986A (zh) * | 2017-02-15 | 2019-10-01 | 微软技术许可有限责任公司 | 与智能个人助理的辅助通信 |
CN109189980A (zh) * | 2018-09-26 | 2019-01-11 | 三星电子(中国)研发中心 | 与用户进行语音交互的方法和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2021102924A1 (en) | 2021-06-03 |
US20240095489A1 (en) | 2024-03-21 |
DE112019007941T5 (de) | 2022-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113557566B (zh) | 动态地适配助理响应 | |
KR102625761B1 (ko) | 사용자 프로그래머블 자동화 어시스턴트 | |
KR102439740B1 (ko) | 제작자 제공 콘텐츠 기반 인터랙티브 대화 애플리케이션 테일링 | |
EP3545427B1 (en) | Service for developing dialog-driven applications | |
WO2018231459A1 (en) | Exporting dialog-driven applications to digital communication platforms | |
US20090066722A1 (en) | System, Device, and Method for Conveying Information Using Enhanced Rapid Serial Presentation | |
CN110050303B (zh) | 基于第三方代理内容的语音到文本转换 | |
KR20200059054A (ko) | 사용자 발화를 처리하는 전자 장치, 및 그 전자 장치의 제어 방법 | |
WO2020213468A1 (ja) | 情報処理システム、情報処理方法、及びプログラム | |
Nowacki et al. | Improving the usability of voice user interfaces: a new set of ergonomic criteria | |
KR102464120B1 (ko) | 사용자 발화를 처리하는 전자 장치 | |
Bortoli et al. | Conversational interfaces for a smart campus: A case study | |
CN114424259A (zh) | 基于个性的智能个人助理系统 | |
Meck et al. | How may I interrupt? Linguistic-driven design guidelines for proactive in-car voice assistants | |
CN112083985A (zh) | 用于生成个性化虚拟用户界面的装置和方法 | |
Demaeght et al. | A survey-based study to identify user annoyances of german voice assistant users | |
Möller et al. | Quantifying the impact of system characteristics on perceived quality dimensions of a spoken dialogue service | |
Maguire | Interface design and usability evaluation of voice-based user interfaces | |
Bakardzhiev | The role of voice character in navigational assistants: prosodic differences and dialogue style’s effect on perceptions of naturalness and anthropomorphism. | |
EP4181120A1 (en) | Electronic device for generating response to user input and operation method of same | |
US20240347041A1 (en) | Digital assistant for providing and modifying an output of an electronic document | |
Tu et al. | Accessibility Research on Multimodal Interaction for the Elderly | |
Akotkar et al. | AUGUST (Any User Generates Undetermine Solution Task) | |
Pakarinen | Students' perceptions of female gendered voice assistants | |
Grassi et al. | Enhancing LLM-Based Human-Robot Interaction with Nuances for Diversity Awareness |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |