CN109986569B - 具有角色化和性格化的聊天机器人 - Google Patents
具有角色化和性格化的聊天机器人 Download PDFInfo
- Publication number
- CN109986569B CN109986569B CN201711487229.2A CN201711487229A CN109986569B CN 109986569 B CN109986569 B CN 109986569B CN 201711487229 A CN201711487229 A CN 201711487229A CN 109986569 B CN109986569 B CN 109986569B
- Authority
- CN
- China
- Prior art keywords
- role
- session
- reply information
- content
- reply
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims description 64
- 238000003672 processing method Methods 0.000 claims description 16
- 230000008451 emotion Effects 0.000 abstract description 219
- 238000000034 method Methods 0.000 abstract description 40
- 230000008569 process Effects 0.000 abstract description 21
- 238000005516 engineering process Methods 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 18
- 230000002996 emotional effect Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000011084 recovery Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 206010020675 Hypermetropia Diseases 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 201000006318 hyperopia Diseases 0.000 description 2
- 230000004305 hyperopia Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000001272 neurogenic effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 206010063659 Aversion Diseases 0.000 description 1
- 206010029216 Nervousness Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J11/00—Manipulators not otherwise provided for
- B25J11/0005—Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
Abstract
本文公开的具有角色化和性格化的聊天机器人技术,一方面,通过建立与特定角色匹配的角色语料库,然后在会话的过程中,将生成的常规回复信息转换为带有角色特征的角色回复信息,从而使得聊天机器人的会话风格具有特定的角色化特点。另一方面,聊天机器人在针对用户输入的会话内容生成回复信息时,通过与性格对应的情绪会话表来选择具有特定情绪的回复信息来进行输出,从而实现具有性格化的聊天机器人。
Description
技术领域
本公开实施例一般涉及会话处理技术,具体地,涉及应用于聊天机器人的会话处理。
背景技术
聊天机器人(chatbot)是一个用来模拟人类对话或聊天的应用程序或者计算机系统。随着语言处理技术的发展,聊天机器人已经广泛地应用到各种应用程序或者智能设备中,以提供人机间灵活的交流方式。
现有的聊天机器人主要还是侧重于对用户说出的话进行答复的内容,如何帮助用户解决问题等等。而随着聊天机器人深入应用,用户更希望能够出现更加拟人化的聊天机器人,从而使得用户能够感受到更加丰富的人格特性。
发明内容
提供本发明实施例内容是为了以精简的形式介绍将在以下详细描述中进一步描述的一些概念。本发明内容并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。
本文公开的具有角色化和性格化的聊天机器人技术,一方面,通过建立与特定角色匹配的角色语料库,然后在会话的过程中,将生成的常规回复信息转换为带有角色特征的角色回复信息,从而使得聊天机器人的会话风格具有特定的角色化特点。另一方面,聊天机器人在针对用户输入的会话内容生成回复信息时,通过与性格对应的情绪会话表来选择具有特定情绪的回复信息来进行输出,从而实现具有性格化的聊天机器人。
上述说明仅是本公开技术方案的概述,为了能够更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为了让本公开的上述和其它目的、特征和优点能够更明显易懂,以下特举本公开的具体实施方式。
附图说明
图1为本发明实施例的会话处理设备之一的应用示例框图;
图2为本发明实施例的会话处理方法之一的流程示意框图;
图3为本发明实施例的会话处理方法之二的流程示意框图;
图4为本发明实施例的会话处理设备之二的应用示例框图;
图5为本发明实施例的会话处理设备之三的应用示例框图;
图6为本发明实施例的会话处理方法之三的流程示意框图;
图7为本发明实施例的会话处理方法之四的流程示意框图;
图8为本发明实施例的电子设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本文中,术语“技术”可以指代例如(一个或多个)系统、(一个或多个)方法、计算机可读指令、(一个或多个)模块、算法、硬件逻辑(例如,现场可编程门阵列(FPGA))、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)和/或上述上下文以及在本文档通篇中所允许的(一项或多项)其它技术。
本文提出一种能够使聊天机器人具有某种角色化的会话风格和具有某种性格的会话风格的技术。
具有某种角色化的会话风格的聊天机器人:通过建立与特定角色匹配的角色语料库,然后在会话的过程中,将生成的常规回复信息转换为带有角色特征的角色回复信息,从而使得聊天机器人的会话风格具有特定的角色化特点。
具有某种性格的会话风格的聊天机器人:不同的性格在会话中可以体现为针对输入的某种情绪的会话内容时,更容易以何种情绪的会话内容进行回复。基于这样的原理,聊天机器人在针对用户输入的会话内容生成回复信息时,通过与性格对应的情绪会话表来选择具有特定情绪的回复信息来进行输出,通过这种方式来体现出性格特点。
下面将分别介绍这两种聊天机器人的具体实现方式。
如图1所示,其为本发明实施例的会话处理设备之一的应用示例框图100。图中的会话处理设备101可以被实现为或者设置于小型因素便携式(或移动)电子装置(例如,蜂窝电话、个人数据助理(PDA)、个人媒体播放器装置、无线网络观看装置、个人头戴装置、专用装置或包括以上功能中的任何一个的混合装置)。会话处理设备101还可以被实现为或者设置于包括膝上型计算机和非膝上型计算机配置这二者的个人计算机。另外,会话处理设备101还可以被实现为或者设置于互联网中的服务器,该服务器通过一个或多个计算机系统中实现(分布式服务器),也可以实现为基于云的服务器,该服务器可以通过互联网与用户终端连接,接收用户终端采集的用户的语音输出,进行会话处理后,生成回复信息,再返回给用户终端向用户输出。本实施例的会话处理设备101可以实现上述的聊天机器人的功能。
图1所示的会话处理设备101包括:常规会话生成模块102、角色会话生成模块103以及输出控制模块104。会话处理设备101会通过访问常规语料库105和角色语料库106来获取需要的会话内容。
常规会话生成模块102,用于获取到用户110输入的第一会话内容107,根据第一会话内容107,生成能够作为回复信息的第二会话内容108。在问答模式(QA模式)的会话模式下,第一会话内容107对应于用户输入的询问(Query)信息,而第二会话内容108对应于针对该询问的回复(Answer)信息,在常规语料库105中,询问信息和回复信息会建立映射关系,常规语料库105中的语料就是具有映射关系的询问信息和回复信息的组合,一个询问信息可以对应一个回复信息也可以对应多个回复信息。
在根据第一会话内容107获取第二会话内容108时,可以先根据第一会话内容107去常规语料库105中检索与第一会话内容107相似的多个询问信息,然后根据多个询问信息去获取相对应的多个回复信息,然后再根据排序算法对多个回复信息进行排序,选择排序靠前的回复信息作为第二会话内容108。
角色会话生成模块103,用于根据第二会话内容108,从角色语料库106中检索与该第二会话内容108匹配的第三会话内容109。
角色语料库106中的语料是具有映射关系的回复信息对(Answer Pair),每个回复信息对中包含从常规语料库105中提取的第一回复信息和根据该第一回复信息生成的带有角色特征的第二回复信息。在常规会话生成模块102确定了第二会话内容108后,角色会话生成模块103就可以以第二会话内容108作为第一回复信息在角色语料库106中进行检索,以获取与该第一回复信息配对的第二回复信息作为上述的第三会话内容109。
在本发明实施例中,角色语料库106中的回复信息对不一定会涵盖常规语料库105中的全部回复信息。从处理效率角度考虑,角色语料库106可以只针对常规语料库105中出现频率较高的第一回复信息生成具有角色特征的第二回复信息。因此,在根据第二会话内容108在角色语料库106中进行检索的过程中,也有可能检索不到匹配的第三会话内容109。
此外,为了更加有效率的利用角色语料库106,可以引入一个相似度阈值,在检索与第二会话内容108匹配的第三会话内容109的过程中,可以先检索与第二会话内容108的相似度满足该相似度阈值的一个或多个第一回复信息,然后再获取与该第一回复信息对应的第二回复信息作为第三会话内容109。通过这个相似度阈值可以来调整角色语料库106在会话中的介入程度,如果调高这个相似度阈值,则能够获取到第三会话内容109的概率就会降低,那么输出控制模块104将会更多地输出从常规语料库105中获取到的第二会话内容108,反之如果调低这个相似度阈值,则获取到第三会话内容109的概率就会变高,那么输出控制模块104将会更多地输出带有角色特征的第三会话内容109,则聊天机器人的会话就会更多体现角色特征。
输出控制模块104,用于在检索到第三会话内容109的情况下,根据会话输出控制规则,输出该第二会话内容108或者第三会话内容109给用户110。如果在角色语料库106中没有检索到第三会话内容109,则输出第二会话内容108。其中,会话输出控制规则可以具体为对角色回复和常规回复的概率控制,具体地,根据角色回复概率和常规回复概率,选择输出第二会话内容108或者第三会话内容109。其中,角色回复概率和常规回复概率可以是预先设定,也可以是动态调整的。在实际的会话处理中,经过检索所获得的第二会话内容108和第三会话内容109可能为多个,一种示例性的概率分配方式可以为:全部第二会话内容108的输出概率共享上述的角色回复概率,全部的第三会话内容109共享上述的常规回复概率,这样的输出控制方式,可以很好地控制角色特征的出现概率,即能够更好地控制聊天机器人呈现的角色深度。
另一种示例性的概率分配方式可以为:无论是第二会话内容108还是第三会话内容109,每个会话内容都享有均等的输出概率,这样的输出控制方式,较少地破坏原本各个会话内容的输出概率,从而更多地保留回复信息的合理性。
此外,上述的常规语料库105和角色语料库106可以是设置于互联网中的远程数据库,也可以是与会话处理设备101连接的本地数据库,也可以是嵌入到会话处理设备101中的数据存储单元。
如图2所示,其为本发明实施例的会话处理方法之一的流程示意框图200,上述的会话处理设备101所执行的处理流程如框图200所示,可以包括:
S201:获取到用户输入的第一会话内容,根据第一会话内容,生成能够作为回复信息的第二会话内容。该步骤可以由常规会话生成模块102来执行。
S202:根据第二会话内容,从角色语料库中检索与该第二会话内容匹配的第三会话内容。该步骤可以由角色会话生成模块103来执行。具体地,可以先从角色语料库中检索与第二会话内容的相似度满足相似度阈值的一个或多个第一回复信息,然后获取与该第一回复信息对应的第二回复信息作为第三会话内容。
S203:判断是否检索到第三会话内容,如果检索到第三会话内容,则执行S204,如果没有检索到第三会话内容,则执行S205。步骤S203、S204以及S205可以由输出控制模块104来执行。
S204:根据会话输出控制规则,输出该第二会话内容或者第三会话内容。其中,根据会话输出控制规则进行输出可以具体为:根据角色回复概率和常规回复概率,选择输出第二会话内容或者第三会话内容。
S205:输出第二会话内容。
本发明实施例的技术方案,通过引入了角色语料库,可以在已有的第二会话内容的生成模式基础上,根据回复信息的匹配关系找到符合角色的第三会话内容,从而以一种简单高效的方式实现聊天机器人的角色转换。
以上介绍了基于已经构建好的常规语料库105和角色语料库106进行会话处理的技术方案,下面介绍一下角色语料库106的生成过程。
基于统计研究结果,聊天机器人的回复信息具有很强的长尾效应,在聊天机器人的常规语料库中,有一部分语料是经常使用的,但这些语料可能只会占据整个语料库的一小部分。基于这样的统计结果,在构建角色语料库时,可以只针对这些常用语料来事先准备角色语料。聊天机器人通过只将常用的语料改变为带有角色特征的角色语料就能够实现会话的角色风格。
如图3所示,其为本发明实施例的会话处理方法之二的流程示意框图300,该会话处理方法包括:
S301:从常规语料库中获取输出概率大于概率阈值的多个第一回复信息。这里的概率阈值可以根据针对聊天机器人的回复信息的统计结果进行灵活设定,该概率阈值决定了需要进行角色转换的第一回复信息的数量,考虑到效率因素,可以选择常用的回复信息来进行角色特征的处理。通过选择常用的回复信息来进行角色语料的转换,能够大量节省在构建角色语料库时所花费的时间成本。
S302:根据第一回复信息生成具有角色特征的第二回复信息。加入角色特征的具体方式可以为:在第一回复信息基础上,加入角色的概念内容,生成第二回复信息。这里所说的角色的概念内容是指例如角色讲话的上下文或者该角色特有的概念或者角色的口头禅等。
S303:将第一回复信息和第二回复信息进行关联形成回复信息对,并存储于角色语料库中。
通过上述的处理过程,就可以生成存储有带有角色特色的语料的角色语料库。本发明实施例通过在内容上增加角色的概念内容来体现角色特性,相比简单地从语音角度改变语气或者讲话方式等,能够更加突出角色特征,给用户留下更加深刻的与某个角色进行聊天的印象。
如图4所示,其为本发明实施例的会话处理设备之二的应用示例框图400。上述的角色语料库的生成处理可以通过会话处理设备401实现,该会话处理设备401包括:
第一回复信息获取模块402,用于从常规语料库405中获取输出概率大于概率阈值的多个第一回复信息407;
第二回复信息生成模块403,用于根据第一回复信息407生成具有角色特征的第二回复信息408。
回复信息存储模块404,用于将第一回复信息407和第二回复信息408进行关联形成回复信息对409,并存储于角色语料库406中。
图3的会话处理方法也可以结合到上述图2的会话处理方法中,作为上述图2中的会话处理方法的前置处理步骤。上述的图4的会话处理设备也可以嵌入到上述的图1的会话处理设备中。
以上介绍了实现具有某种角色化的会话风格的聊天机器人的技术方案,下面介绍一下实现具有某种性格的会话风格的聊天机器人的技术方案。
如图5所示,其为本发明实施例的会话处理设备之三的应用示例框图500。图中的会话处理设备501可以被实现为或者设置于小型因素便携式(或移动)电子装置(例如,蜂窝电话、个人数据助理(PDA)、个人媒体播放器装置、无线网络观看装置、个人头戴装置、专用装置或包括以上功能中的任何一个的混合装置)。会话处理设备501还可以被实现为或者设置于包括膝上型计算机和非膝上型计算机配置这二者的个人计算机。另外,会话处理设备501还可以被实现为或者设置于互联网中的服务器,该服务器通过一个或多个计算机系统中实现(分布式服务器),也可以实现为基于云的服务器,该服务器可以通过互联网与用户终端连接,接收用户终端采集的用户的语音输出,进行会话处理后,生成回复信息,再返回给用户终端向用户输出。本实施例的会话处理设备501可以实现的聊天机器人的功能。
图5所示的会话处理设备501包括:第一情绪类型确定模块502、第二情绪类型确定模块503以及会话内容生成模块504。
第一情绪类型确定模块502,用于获取用户510输入的第一会话内容505,并确定该第一会话内容505的第一情绪类型506。对于根据第一会话内容505确定其情绪类型的方法可以采用已有的机器学习模型来进行处理。典型的情绪类型可以包括:例如高兴、惊讶、中性、生气、悲伤、厌恶等。
第二情绪类型确定模块503,用于根据第一情绪类型506和预设性格对应的情绪会话表507,确定第二情绪类型508。
在情绪会话表中,记录了在会话的双方中,一方输入会话的情绪与另一方回复会话的情绪的对应关系,这种对应关系就体现了某种具体性格的特性,通过查询与具体性格对应的情绪会话表就可以获得在某种性格下回复信息的第二情绪类型。
一种示例性的情绪会话表如下表所示:
情绪会话表(1)
在上述的情绪会话表(1)中,情绪类型1至5可以具体为高兴、惊讶、中性、生气、悲伤、厌恶等具体情绪。对于不同的性格而言,第一情绪类型与第二情绪类型之间的对应关系是不同的。例如,极度悲观性格的人,在听到情绪类型为高兴的第一会话内容时,其回复信息的情绪类型往往是悲伤的情绪类型,而极度乐观性格的人,在听到情绪类型为悲伤的第一会话内容时,其回复信息的情绪类型往往是高兴的情绪类型。
会话内容生成模块504,用于根据第一会话内容505和第二情绪类型508,生成具有第二情绪类型508并能够作为回复信息的第二会话内容509,并输出该第二会话内容509给用户510。
具体地,在本发明实施例中,检索回复信息的语料数据库可以对各个语料设置相应的情绪类型标签。会话内容生成模块504在生成第二会话内容509的过程中,可以在该带有情绪类型标签的情绪语料库511中检索对应的具有第二情绪类型508的回复信息作为第二会话内容509。
上述的情绪会话表(1)体现的是较为极端的性格对应的情绪类型的匹配关系。在更多的人与人之间的对话中,各种性格的人其回复信息的情绪类型可能会具有一定的不确定性和多变性,人的性格也很难从一两句对话中很明显的体现处理,而是更多地从较长的对话过程中体现,在较长的对话过程中,不同性格的人的回复信息的各种情绪类型呈现一种概率模式。例如,较为悲观性格的人,上百条会话的过程中,其针对情绪类型为高兴的第一会话内容的回复信息有60%呈现悲伤的情绪类型,20%呈现厌恶的情绪类型,20%呈现中性的情绪类型,这种不同情绪类型的概率分布,更准确地体现了人物的性格特征。
基于上述分析,作为另一种示例性的情绪会话表如下表所示:
情绪会话表(2)
在上述的情绪会话表(2)中,第一列中的情绪类型1至n代表用户输入的第一会话内容的第一情绪类型,第一行中的情绪类型1至n代表针对用户输入的第一会话内容的回复信息的第二情绪类型。表格中的各个单元格中的输出概率11至输出概率nn代表第一情绪类型和第二情绪类型组合时的输出概率。不同的性格对应的情绪会话表中,第一情绪类型和第二情绪类型组合时的输出概率是不同的。
在会话的过程中,在用户输入的第一会话内容的第一情绪类型确定的前提下,各个第二情绪类型的输出概率为上述的情绪会话表(2)中该确定的第一情绪类型对应的行。
该情绪会话表(2)使用方式如下:
第二情绪类型确定模块503根据第一情绪类型506和情绪会话表507,确定多个第二情绪类型508以及各个第二情绪类型508的输出概率;
会话内容生成模块504根据第一会话内容505和多个第二情绪类型508,生成分别具有多个第二情绪类型508的多个第二会话内容509,并根据多个第二情绪类型508的输出概率从多个第二会话内容509中进行选择输出。
如图6所示,其为本发明实施例的会话处理方法之三的流程示意框图600,该会话处理方法可以基于上述的情绪会话表(1)实现,其包括:
S601:获取用户输入的第一会话内容,并确定该第一会话内容的第一情绪类型。该步骤的处理可以由第一情绪类型确定模块502执行。
S602:根据第一情绪类型和预设性格对应的情绪会话表,确定第二情绪类型。该步骤的处理可以由第二情绪类型确定模块503执行。
S603:根据第一会话内容和第二情绪类型,生成具有第二情绪类型并能够作为回复信息的第二会话内容,并输出该第二会话内容。该步骤的处理可以由会话内容生成模块504执行。
如图7所示,其为本发明实施例的会话处理方法之四的流程示意框图700,该会话处理方法可以基于上述的情绪会话表(2)实现,其包括:
S701:获取用户输入的第一会话内容,并确定该第一会话内容的第一情绪类型。该步骤的处理可以由第一情绪类型确定模块502执行。
S702:根据第一情绪类型和情绪会话表,确定多个第二情绪类型以及各个第二情绪类型的输出概率。该步骤的处理可以由第二情绪类型确定模块503执行。
S703:根据第一会话内容和多个第二情绪类型,生成分别具有多个第二情绪类型的多个第二会话内容,并根据多个第二情绪类型的输出概率从多个第二会话内容中进行选择输出。该步骤的处理可以由会话内容生成模块504执行。
本发明实施例的基于情绪会话表的会话处理方法及设备,在会话处理过程中,通过能够体现不同性格类型的情绪会话表,来控制聊天机器人,针对输入会话的情绪类型,选择符合设定性格的输出会话的情绪类型,从而从会话的情绪特征角度来实现性格特点的模拟。进一步地,通过在情绪会话表中引入各种情绪类型组合的输出概率,从而在较长的会话过程中,实现体现性格特征的情绪类型分布,使得用户能够在较长时间的对话中感受到聊天机器人的性格特征,从而更加接近人与人之间对话的感觉。
具体应用示例
关于本发明实施例的性格分类,可以采用大五(Big Five)的分类体系。人格结构中的五个因素被称为大五,该分类体系强调该人格模型中每一维度的广泛性。这五个维度因素是神经质、外倾性、经验开放性、宜人性和认真性。
在本发明实施例中,为了形成鲜明的性格特征,对每个因素进行了二分法的处理,从而构成了五组对立性格,并形成相应的情绪会话表。
在本发明实施例的性格体系中可以包括如下10种性格:
神经质性格和非神经质性格;
外向型性格和内向型性格;
经验开放性性格和非开放型性格;
宜人性性格和非宜人性性格;
认真性性格和非认真性性格。
下面提供内向型性格对应的情绪会话表(3)和外向型性格对应的情绪会话表(4)的示例,与情绪会话表(2)类似,第一列为用户输入的第一会话内容对应的第一情绪类型,第一行为针对用户输入的第一会话内容的回复信息的第二情绪类型。
情绪会话表(3)—内向型性格
情绪会话表(4)—外向型性格
在实际应用中,为了使得各种类型的性格更加明显,可以将对立性格中情绪类型组合的差别放大,比如,上述的情绪会话表(3)和情绪会话表(4)中,第一情绪类型为高兴时,内外向性格的第二情绪类型为高兴的概率分别为0.11和0.16,而在实际应用中,可以将两个值分别调整为0.055和0.32,相应地,也可以适应性地调整该行其他值,使得每行的概率之和仍为1。
具体实现示例
在一些例子中,上述附图涉及的一个或多个模块或者一个或多个步骤或者一个或多个处理过程,可以通过软件程序、硬件电路,也可以通过软件程序和硬件电路相结合的方式来实现。例如,上述各个组件或者模块以及一个或多个步骤都可在芯片上系统(SoC)中实现。SoC可包括:集成电路芯片,该集成电路芯片包括以下一个或多个:处理单元(如中央处理单元(CPU)、微控制器、微处理单元、数字信号处理单元(DSP)等)、存储器、一个或多个通信接口、和/或用于执行其功能的进一步的电路和可任选的嵌入的固件。
如图8所示,其为发明实施例的电子设备800的结构框图。电子设备800包括:存储器801和处理器802。
存储器801,用于存储程序。除上述程序之外,存储器801还可被配置为存储其它各种数据以支持在电子设备800上的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。
存储器801可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
存储器801耦合至处理器802并且包含存储于其上的指令,所说的指令在由处理器802执行时使电子设备执行动作,作为一种电子设备的实施例,该动作可以包括:
获取到用户输入的第一会话内容,根据第一会话内容,生成能够作为回复信息的第二会话内容;
根据第二会话内容,从角色语料库中检索与该第二会话内容匹配的第三会话内容;
如果检索到第三会话内容,则根据会话输出控制规则,输出该第二会话内容或者第三会话内容。
其中,根据会话输出控制规则,输出该第二会话内容或者第三会话内容可以包括:
根据角色回复概率和常规回复概率,选择输出第二会话内容或者第三会话内容。
其中,角色语料库中配置有多个回复信息对,每个回复信息对包括第一回复信息和第二回复信息,第一回复信息为常规回复信息,第二回复信息为与该常规回复信息对应的角色回复信息;
从角色语料库中检索与该第二会话内容匹配的第三会话内容可以包括:
从角色语料库中检索与第二会话内容的相似度满足相似度阈值的一个或多个第一回复信息,并获取与该第一回复信息对应的第二回复信息作为第三会话内容。
作为另一种电子设备的实施例,上述的动作可以包括:
从常规语料库中获取输出概率大于概率阈值的多个第一回复信息;
根据第一回复信息生成具有角色特征的第二回复信息;
将第一回复信息和第二回复信息进行关联形成回复信息对,并存储于角色语料库中。
其中,根据第一回复信息生成具有角色特征的第二回复信息可以包括:
在第一回复信息基础上,加入角色的概念内容,生成第二回复信息。
作为另一种电子设备的实施例,上述的动作可以包括:
获取用户输入的第一会话内容,并确定该第一会话内容的第一情绪类型;
根据第一情绪类型和预设性格对应的情绪会话表,确定第二情绪类型;
根据第一会话内容和第二情绪类型,生成具有第二情绪类型并能够作为回复信息的第二会话内容,并输出该第二会话内容。
其中,在情绪会话表中,每个第一情绪类型对应多个第二情绪类型,在情绪会话表中记录有每个第一情绪类型对应各个第二情绪类型的输出概率,
根据第一情绪类型和预设性格对应的情绪会话表,确定第二情绪类型可以包括:根据第一情绪类型和情绪会话表,确定多个第二情绪类型以及各个第二情绪类型的输出概率,
根据第一会话内容和第二情绪类型,生成具有第二情绪类型并能够作为回复信息的第二会话内容,并输出该第二会话内容可以包括:
根据第一会话内容和多个第二情绪类型,生成分别具有多个第二情绪类型的多个第二会话内容,并根据多个第二情绪类型的输出概率从多个第二会话内容中进行选择输出。
其中,根据第一会话内容和第二情绪类型,生成具有第二情绪类型的第二会话内容可以包括:
根据第一会话内容和第二情绪类型,在带有情绪类型标签的情绪语料库中进行检索,生成第二会话内容。
对于上述的处理操作,在前面方法和装置的实施例中已经进行了详细说明,对于上述的处理操作的详细内容同样也适用于电子设备800中,即可以将前面实施例中提到的具体处理操作,以程序的方式写入在存储器801,并通过处理器802来进行执行。
进一步,如图8所示,电子设备800还可以包括:通信组件803、电源组件804、音频组件805、显示器806、芯片组807等其它组件。图8中仅示意性给出部分组件,并不意味着电子设备800只包括图8所示组件。
通信组件803被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件803经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件803还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
电源组件804,为电子设备的各种组件提供电力。电源组件804可以包括电源管理系统,一个或多个电源,及其他与为电子设备生成、管理和分配电力相关联的组件。
音频组件805被配置为输出和/或输入音频信号。例如,音频组件805包括一个麦克风(MIC),当电子设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器801或经由通信组件803发送。在一些实施例中,音频组件805还包括一个扬声器,用于输出音频信号。
显示器806包括屏幕,其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。
上述的存储器801、处理器802、通信组件803、电源组件804、音频组件805以及显示器806可以与芯片组807连接。芯片组807可以提供处理器802与电子设备800中的其余组件之间的接口。此外,芯片组807还可以提供电子设备800中的各个组件对存储器801的访问接口以及各个组件间相互访问的通讯接口。
示例条款
A:一种方法,包括:
获取到用户输入的第一会话内容,根据所述第一会话内容,生成能够作为回复信息的第二会话内容;
根据所述第二会话内容,从角色语料库中检索与该第二会话内容匹配的第三会话内容;
如果检索到所述第三会话内容,则根据会话输出控制规则,输出该第二会话内容或者第三会话内容。
B、根据段落A所述的方法,其中,所述根据会话输出控制规则,输出该第二会话内容或者第三会话内容包括:
根据角色回复概率和常规回复概率,选择输出所述第二会话内容或者所述第三会话内容。
C、根据段落A所述的方法,其中,所述角色语料库中配置有多个回复信息对,每个回复信息对包括第一回复信息和第二回复信息,所述第一回复信息为常规回复信息,所述第二回复信息为与该常规回复信息对应的角色回复信息;
所述从角色语料库中检索与该第二会话内容匹配的第三会话内容包括:
从所述角色语料库中检索与所述第二会话内容的相似度满足相似度阈值的一个或多个所述第一回复信息,并获取与该第一回复信息对应的第二回复信息作为所述第三会话内容。
D、一种方法,包括:
从常规语料库中获取输出概率大于概率阈值的多个第一回复信息;
根据所述第一回复信息生成具有角色特征的第二回复信息;
将所述第一回复信息和所述第二回复信息进行关联形成回复信息对,并存储于所述角色语料库中。
E、根据段落D所述的方法,其中,所述根据所述第一回复信息生成具有角色特征的第二回复信息包括:
在第一回复信息基础上,加入角色的概念内容,生成所述第二回复信息。
F、一种方法,包括:
获取用户输入的第一会话内容,并确定该第一会话内容的第一情绪类型;
根据所述第一情绪类型和预设性格对应的情绪会话表,确定第二情绪类型;
根据所述第一会话内容和所述第二情绪类型,生成具有所述第二情绪类型并能够作为所述回复信息的第二会话内容,并输出该第二会话内容。
G、根据段落F所述的方法,其中,在所述情绪会话表中,每个所述第一情绪类型对应多个第二情绪类型,在所述情绪会话表中记录有每个所述第一情绪类型对应各个第二情绪类型的输出概率,
所述根据所述第一情绪类型和预设性格对应的情绪会话表,确定第二情绪类型包括:根据所述第一情绪类型和所述情绪会话表,确定多个所述第二情绪类型以及各个第二情绪类型的输出概率,
所述根据所述第一会话内容和所述第二情绪类型,生成具有所述第二情绪类型并能够作为所述回复信息的第二会话内容,并输出该第二会话内容包括:
根据所述第一会话内容和所述多个第二情绪类型,生成分别具有所述多个第二情绪类型的多个第二会话内容,并根据所述多个第二情绪类型的输出概率从所述多个第二会话内容中进行选择输出。
H、根据段落F所述的方法,其中,所述根据所述第一会话内容和所述第二情绪类型,生成具有第二情绪类型的第二会话内容包括:
根据所述第一会话内容和所述第二情绪类型,在带有情绪类型标签的情绪语料库中进行检索,生成所述第二会话内容。
I、一种装置,包括:
常规会话生成模块,用于获取到用户输入的第一会话内容,根据所述第一会话内容,生成能够作为回复信息第二会话内容;
角色会话生成模块,用于根据所述第二会话内容,从角色语料库中检索与该第二会话内容匹配的第三会话内容;
输出控制模块,用于在检索到所述第三会话内容的情况下,根据会话输出控制规则,输出该第二会话内容或者第三会话内容。
J、根据段落I所述的装置,其中,所述根据会话输出控制规则,输出该第二会话内容或者第三会话内容包括:
根据角色回复概率和常规回复概率,选择输出所述第二会话内容或者所述第三会话内容。
K、根据段落I所述的装置,其中,所述角色语料库中配置有多个回复信息对,每个回复信息对包括第一回复信息和第二回复信息,所述第一回复信息为常规回复信息,所述第二回复信息为与该常规回复信息对应的角色回复信息;
所述从角色语料库中检索与该第二会话内容匹配的第三会话内容包括:
从所述角色语料库中检索与所述第二会话内容的相似度满足相似度阈值的一个或多个所述第一回复信息,并获取与该第一回复信息对应的第二回复信息作为所述第三会话内容。
L、一种装置,其中,包括:
第一回复信息获取模块,用于从常规语料库中获取输出概率大于概率阈值的多个第一回复信息;
第二回复信息生成模块,用于根据所述第一回复信息生成具有角色特征的第二回复信息;
回复信息存储模块,用于将所述第一回复信息和所述第二回复信息进行关联形成回复信息对,并存储于所述角色语料库中。
M、根据段落L所述的装置,其中,所述根据所述第一回复信息生成具有角色特征的第二回复信息包括:
在第一回复信息基础上,加入角色的概念内容,生成所述第二回复信息。
N、一种装置,包括:
第一情绪类型确定模块,用于获取用户输入的第一会话内容,并确定该第一会话内容的第一情绪类型;
第二情绪类型确定模块,用于根据所述第一情绪类型和预设性格对应的情绪会话表,确定第二情绪类型;
会话内容生成模块,用于根据所述第一会话内容和所述第二情绪类型,生成具有所述第二情绪类型并能够作为所述回复信息的第二会话内容,并输出该第二会话内容。
O、根据段落N所述的装置,其中,在所述情绪会话表中,每个所述第一情绪类型对应多个第二情绪类型,在所述情绪会话表中记录有每个所述第一情绪类型对应各个第二情绪类型的输出概率,
所述根据所述第一情绪类型和预设性格对应的情绪会话表,确定第二情绪类型包括:根据所述第一情绪类型和所述情绪会话表,确定多个所述第二情绪类型以及各个第二情绪类型的输出概率,
所述根据所述第一会话内容和所述第二情绪类型,生成具有所述第二情绪类型并能够作为所述回复信息的第二会话内容,并输出该第二会话内容包括:
根据所述第一会话内容和所述多个第二情绪类型,生成分别具有所述多个第二情绪类型的多个第二会话内容,并根据所述多个第二情绪类型的输出概率从所述多个第二会话内容中进行选择输出。
P、根据段落N所述的装置,其中,所述根据所述第一会话内容和所述第二情绪类型,生成具有第二情绪类型的第二会话内容包括:
根据所述第一会话内容和所述第二情绪类型,在带有情绪类型标签的情绪语料库中进行检索,生成所述第二会话内容。
Q、一种电子设备,包括:
处理单元;以及
存储器,耦合至所述处理单元并且包含存储于其上的指令,所述指令在由所述处理单元执行时使所述设备执行动作,所述动作包括:
获取到用户输入的第一会话内容,根据所述第一会话内容,生成能够作为回复信息的第二会话内容;
根据所述第二会话内容,从角色语料库中检索与该第二会话内容匹配的第三会话内容;
如果检索到所述第三会话内容,则根据会话输出控制规则,输出该第二会话内容或者第三会话内容。
R、根据段落Q所述的电子设备,其中,所述根据会话输出控制规则,输出该第二会话内容或者第三会话内容包括:
根据角色回复概率和常规回复概率,选择输出所述第二会话内容或者所述第三会话内容。
S、根据段落Q所述的电子设备,其中,所述角色语料库中配置有多个回复信息对,每个回复信息对包括第一回复信息和第二回复信息,所述第一回复信息为常规回复信息,所述第二回复信息为与该常规回复信息对应的角色回复信息;
所述从角色语料库中检索与该第二会话内容匹配的第三会话内容包括:
从所述角色语料库中检索与所述第二会话内容的相似度满足相似度阈值的一个或多个所述第一回复信息,并获取与该第一回复信息对应的第二回复信息作为所述第三会话内容。
T、一种电子设备,包括:
处理单元;以及
存储器,耦合至所述处理单元并且包含存储于其上的指令,所述指令在由所述处理单元执行时使所述设备执行动作,所述动作包括:
从常规语料库中获取输出概率大于概率阈值的多个第一回复信息;
根据所述第一回复信息生成具有角色特征的第二回复信息;
将所述第一回复信息和所述第二回复信息进行关联形成回复信息对,并存储于所述角色语料库中。
U、根据段落T所述的电子设备,其中,所述根据所述第一回复信息生成具有角色特征的第二回复信息包括:
在第一回复信息基础上,加入角色的概念内容,生成所述第二回复信息。
V、一种电子设备,包括:
处理单元;以及
存储器,耦合至所述处理单元并且包含存储于其上的指令,所述指令在由所述处理单元执行时使所述设备执行动作,所述动作包括:
获取用户输入的第一会话内容,并确定该第一会话内容的第一情绪类型;
根据所述第一情绪类型和预设性格对应的情绪会话表,确定第二情绪类型;
根据所述第一会话内容和所述第二情绪类型,生成具有所述第二情绪类型并能够作为所述回复信息的第二会话内容,并输出该第二会话内容。
W、根据段落V所述的电子设备,其中,在所述情绪会话表中,每个所述第一情绪类型对应多个第二情绪类型,在所述情绪会话表中记录有每个所述第一情绪类型对应各个第二情绪类型的输出概率,
所述根据所述第一情绪类型和预设性格对应的情绪会话表,确定第二情绪类型包括:根据所述第一情绪类型和所述情绪会话表,确定多个所述第二情绪类型以及各个第二情绪类型的输出概率,
所述根据所述第一会话内容和所述第二情绪类型,生成具有所述第二情绪类型并能够作为所述回复信息的第二会话内容,并输出该第二会话内容包括:
根据所述第一会话内容和所述多个第二情绪类型,生成分别具有所述多个第二情绪类型的多个第二会话内容,并根据所述多个第二情绪类型的输出概率从所述多个第二会话内容中进行选择输出。
X、根据段落V所述的电子设备,其中,所述根据所述第一会话内容和所述第二情绪类型,生成具有第二情绪类型的第二会话内容包括:
根据所述第一会话内容和所述第二情绪类型,在带有情绪类型标签的情绪语料库中进行检索,生成所述第二会话内容。
结语
系统的多个方面的硬件与软件实现之间区别不大;使用硬件还是软件通常(但并不总是,因为在某些背景下,硬件与软件之间的选择可以变得显著)是表示成本与效率权衡的设计选择。存在可以实现在此描述的处理和/或系统和/或其它技术(例如,硬件、软件,以及/或固件)的各种承载工具,并且优选承载工具将随着部署该处理和/或系统和/或其它技术的背景而改变。例如,如果实现方确定速度和准确度最重要,则该实现方可以选择主要硬件和/或固件承载工具;如果灵活性最重要,则该实现方可以选择主要软件实现;或者,此外又另选地,该实现方可以选择硬件、软件,以及/或固件的一些组合。
前述详细描述已经经由使用框图、流程图,以及/或示例阐述了该装置和/或处理的各种实施方式。至于这种框图、流程图,以及/或示例包含一个或更多个功能和/或操作,本领域技术人员应当明白,这种框图、流程图,或示例内的每一个功能和/或操作可以单独地和/或共同地,通过宽范围的硬件、软件、固件,或者实际上其任何组合来实现。在一个实施方式中,在此描述的主旨的几个部分可以经由专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP),或其它集成格式来实现。然而,本领域技术人员应当认识到,在此公开的实施方式的一些方面整个地或者部分地可以等同地在集成电路中实现,实现为运行在一个或更多个计算机上的一个或更多个计算机程序(例如,实现为运行在一个或更多个计算机系统上的一个或更多个程序),实现为运行在一个或更多个处理器上的一个或更多个程序(例如,实现为运行在一个或更多个微处理器上的一个或更多个程序),实现为固件,或者实际上实现为其任何组合,并且根据本公开,设计电路和/或编写用于软件和/或固件的代码完全处于本领域技术人员的技术内。另外,本领域技术人员应当清楚的是,在此描述的主题的机制能够按多种形式作为程序产品分配,并且在此描述的主题的例示性实施方式适用,而与被用于实际执行该分配的特定类型的信号承载介质无关。信号承载介质的示例包括但不限于,以下:可记录型介质,如软盘、硬盘驱动器(HDD)、质密盘(CD)、数字通用盘(DVD)、数字磁带、计算机存储器等;和传输型介质,如数字和/或模拟通信媒介(例如,光纤线缆、波导管、有线通信链路、无线通信链路等)。
本领域技术人员应当认识到,按在此阐述的方式来描述装置和/或处理,并且此后,使用工程实践将这样描述的装置和/或处理集成到数据处理系统中是本领域内常见的。即,在此描述的装置和/或处理的至少一部分可以经由合理量的实验而集成到数据处理系统中。本领域技术人员应当认识到的是,通常的数据处理系统通常包括以下中的一个或更多个:系统单元外壳、视频显示装置、诸如易失性和非易失性存储器的存储器、诸如微处理器和数字信号处理器的处理器、诸如操作系统、驱动器、图形用户接口,以及应用程序的计算实体、诸如触摸板或触摸屏的一个或更多个交互式装置,以及/或包括反馈回路和控制电动机的控制系统(例如,用于感测位置和/或速度的反馈;用于移动和/或调节组件和/或数量的控制马达)。通常的数据处理系统可以利用任何合适商业可获组件来实现,如通常在数据计算/通信和/或网络通信/计算系统中找到的那些。
在此描述的主题有时例示了包含在不同的其它组件内或与其相连接的不同组件。要明白的是,这样描绘的架构仅仅是示例性的,并且实际上,可以实现获得相同功能的许多其它架构。在概念意义上,用于获得相同功能的组件的任何排布结构都有效地“关联”,以使获得希望功能。因此,在此为获得特定功能而组合的任两个组件都可以被看作彼此“相关联”,以使获得希望功能,而与架构或中间组件无关。同样地,这样关联的任两个组件还可以被视作彼此“可操作地连接”,或“可操作地耦接”,以获得希望功能,并且能够这样关联的任两个组件也可以被视作可彼此“操作地耦接”,以获得希望功能。可操作地耦接的具体示例包括但不限于,物理上可配合和/或物理上交互的组件和/或可无线地交互和/或无线地交互的组件和/或逻辑上交互和/或逻辑上可交互组件。
针对在此实质上使用的任何复数和/或单数术语,本领域技术人员可以针对背景和/或应用在适当时候从复数翻译成单数和/或从单数翻译成复数。为清楚起见,各种单数/多数置换在此可以确切地阐述。
本领域技术人员应当明白,一般来说,在此使用的,而且尤其是在本申请文件中(例如,本申请文件的主体)使用的术语通常旨在作为“开放式”措辞(例如,措辞“包括(including)”应当解释为“包括但不限于”,措辞“具有(having)”应当解释为“至少具有”,措辞“包括(include)”应当解释为“包括但不限于”等)。本领域技术人员还应当明白,如果想要特定数量的介绍本申请文件列举,则这种意图将明确地在本申请文件中陈述,并且在没有这些列举的情况下,不存在这种意图。例如,为帮助理解,本申请文件可以包含使用介绍性短语“至少一个”和“一个或更多个”来介绍本申请文件列举。然而,使用这种短语不应被认作,暗示由不定冠词“一(a)”或“一(an)”介绍的本申请文件列举将包含这种介绍本申请文件列举的任何特定内容限制于仅包含一个这种列举的发明,即使同一内容包括介绍性短语“一个或更多个”或“至少一个”以及诸如“一(a)”或“一(an)”的不定冠词(例如,“一(a)”或“一(an)”通常应当被解释成意指“至少一个”或“一个或更多个”);其对于使用为介绍本申请文件列举而使用的定冠词来说同样保持为真。另外,即使明确地陈述特定数量的介绍本申请文件列举,本领域技术人员也应当认识到,这种列举通常应当被解释成,至少意指所陈述数量(例如,“两个列举”的仅有的列举在没有其它修饰语的情况下通常意指至少两个列举,或者两个或更多个列举)。而且,在使用类似于“A、B,以及C等中的至少一个”的惯例的那些实例中,一般来说,这种句法结构希望本领域技术人员在意义上应当理解这种惯例(例如,“具有A、B,以及C中的至少一个的系统”应当包括但不限于具有单独A、单独B、单独C、A和B一起、A和C一起、B和C一起,以及/或A、B以及C一起等的系统)。在使用类似于“A、B,或C等中的至少一个”的惯例的那些实例中,一般来说,这种句法结构希望本领域技术人员在意义上应当理解这种惯例(例如,“具有A、B,或C中的至少一个的系统”应当包括但不限于具有单独A、单独B、单独C、A和B一起、A和C一起、B和C一起,以及/或A、B以及C一起等的系统)。本领域技术人员还应当明白的是,实际上,呈现两个或更多个另选术语的任何转折词和/短语(无论处于本申请文件的描述中,还是在附图中)应当被理解成,设想包括这些术语、这些术语中的任一个,或者两个术语的可能性。例如,短语“A或B”应当被理解成,包括“A”或“B”或“A和B”的可能性。
本说明书中针对“实现方式”、“一个实现方式”、“一些实现方式”,或“其它实现方式”的引用可以意指,结合一个或更多个实现方式描述的特定特征、结构,或特性可以被包括在至少一些实现方式中,但不必被包括在所有实现方式中。前述描述中不同出现的“实现方式”、“一个实现方式”,或“一些实现方式”不必全部针对同一实现方式而引用。
虽然利用不同方法和系统描述和示出了特定示例性技术,但本领域技术人员应当明白,在不脱离要求保护的主题的情况下,可以进行各种其它修改,并且可以代替等同物。另外,在不脱离在此描述的中心概念的情况下,可以进行许多修改以使适应针对要求保护的主题的教导的特定情况。因此,要求保护的主题不限于所公开的特定示例,而是这种要求保护的主题还可以包括落入本申请文件及其等同物的范围内的所有实现。
尽管已经用结构特征和/或方法动作专用的语言描述了本主题,但要理解,本申请文件中定义的主题不必限于所描述的具体特征或动作。而是,这些具体特征和动作是作为实现本申请文件的解说性形式而公开的。
除非另外具体声明,否则在上下文中可以理解并一般地使用条件语言(诸如“能”、“能够”、“可能”或“可以”)表示特定示例包括而其他示例不包括特定特征、元素和/或步骤。因此,这样的条件语言一般并非旨在暗示对于一个或多个示例以任何方式要求特征、元素和/或步骤,或者一个或多个示例必然包括用于决定的逻辑、具有或不具有用户输入或提示、在任何特定实施例中是否要包括或要执行这些特征、元素和/或步骤。
除非另外具体声明,应理解联合语言(诸如短语“X、Y或Z中至少一个”)表示项、词语等可以是X、Y或Z中的任一者、或其组合。
本文所述和/或附图中描述的流程图中任何例行描述、元素或框应理解成潜在地表示包括用于实现该例程中具体逻辑功能或元素的一个或多个可执行指令的代码的模块、片段或部分。替换示例被包括在本文描述的示例的范围内,其中各元素或功能可被删除,或与所示出或讨论的顺序不一致地执行,包括基本上同步地执行或按相反顺序执行,这取决于所涉及的功能,如本领域技术人也将理解的。
应当强调,可对上述示例作出许多变型和修改,其中的元素如同其他可接受的示例那样应被理解。所有这样的修改和变型在此旨在包括在本公开的范围内并且由本申请文件保护。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (9)
1.一种会话处理方法,包括:
基于常规语料库中的回复信息的输出概率,获取所述常规语料库中的多个第一回复信息;
生成包括角色回复的角色语料库,所述角色回复是通过对所述多个第一回复信息应用角色特征而生成的;
获取到用户输入的第一会话内容,并且根据所述第一会话内容,使用所述常规语料库来生成能够作为回复信息的第二会话内容;
根据所述第二会话内容,针对所述角色语料库中的与该第二会话内容匹配的第三会话内容来检索所述角色语料库;以及
根据会话输出控制规则,输出该第二会话内容或者第三会话内容。
2.根据权利要求1所述的会话处理方法,其中,所述根据会话输出控制规则,输出该第二会话内容或者第三会话内容包括:
根据角色回复概率和常规回复概率,选择输出所述第二会话内容或者所述第三会话内容。
3.根据权利要求1所述的会话处理方法,其中,所述角色语料库中配置有多个回复信息对,每个回复信息对包括第一回复信息和第二回复信息,所述第一回复信息为常规回复信息,并且所述第二回复信息为与该常规回复信息对应的角色回复;
所述根据所述第二会话内容、针对所述角色语料库中的与该第二会话内容匹配的第三会话内容来检索所述角色语料库包括:
从所述角色语料库中检索与所述第二会话内容的相似度分别满足相似度阈值的一个或多个第一回复信息,并获取与该第一回复信息对应的第二回复信息作为所述第三会话内容。
4.一种会话处理装置,包括:
至少一个处理器;以及
存储器,其包括指令,所述指令在由所述至少一个处理器执行时使得所述至少一个处理器执行动作以便:
基于常规语料库中的回复信息的输出概率,获取所述常规语料库中的多个第一回复信息;
生成包括角色回复的角色语料库,所述角色回复是通过对所述多个第一回复信息应用角色特征而生成的;
获取到用户输入的第一会话内容,并且根据所述第一会话内容,使用所述常规语料库来生成能够作为回复信息的第二会话内容;
根据所述第二会话内容,针对所述角色语料库中的与该第二会话内容匹配的第三会话内容来检索所述角色语料库;以及
根据会话输出控制规则,输出该第二会话内容或者第三会话内容。
5.根据权利要求4所述的会话处理装置,其中,所述根据会话输出控制规则,输出该第二会话内容或者第三会话内容包括:
根据角色回复概率和常规回复概率,选择输出所述第二会话内容或者所述第三会话内容。
6.根据权利要求4所述的会话处理装置,其中,所述角色语料库中配置有多个回复信息对,每个回复信息对包括第一回复信息和第二回复信息,所述第一回复信息为常规回复信息,并且所述第二回复信息为与该常规回复信息对应的角色回复;
所述根据所述第二会话内容、针对所述角色语料库中的与该第二会话内容匹配的第三会话内容来检索所述角色语料库包括:
从所述角色语料库中检索与所述第二会话内容的相似度分别满足相似度阈值的一个或多个第一回复信息,并获取与该第一回复信息对应的第二回复信息作为所述第三会话内容。
7.一种电子设备,包括:
处理单元;以及
存储器,耦合至所述处理单元并且包含存储于其上的指令,所述指令在由所述处理单元执行时使所述电子设备执行动作,所述动作包括:
基于常规语料库中的回复信息的输出概率,获取所述常规语料库中的多个第一回复信息;
生成包括角色回复的角色语料库,所述角色回复是通过对所述多个第一回复信息应用角色特征而生成的;
获取到用户输入的第一会话内容,并且根据所述第一会话内容,使用所述常规语料库来生成能够作为回复信息的第二会话内容;
根据所述第二会话内容,针对所述角色语料库中的与该第二会话内容匹配的第三会话内容来检索所述角色语料库;以及
根据会话输出控制规则,输出该第二会话内容或者第三会话内容。
8.根据权利要求7所述的电子设备,其中,所述根据会话输出控制规则,输出该第二会话内容或者第三会话内容包括:
根据角色回复概率和常规回复概率,选择输出所述第二会话内容或者所述第三会话内容。
9.根据权利要求7所述的电子设备,其中,所述角色语料库中配置有多个回复信息对,每个回复信息对包括第一回复信息和第二回复信息,所述第一回复信息为常规回复信息,并且所述第二回复信息为与该常规回复信息对应的角色回复;
所述根据所述第二会话内容、针对所述角色语料库中的与该第二会话内容匹配的第三会话内容来检索所述角色语料库包括:
从所述角色语料库中检索与所述第二会话内容的相似度分别满足相似度阈值的一个或多个第一回复信息,并获取与该第一回复信息对应的第二回复信息作为所述第三会话内容。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711487229.2A CN109986569B (zh) | 2017-12-29 | 2017-12-29 | 具有角色化和性格化的聊天机器人 |
PCT/US2018/065316 WO2019133267A1 (en) | 2017-12-29 | 2018-12-13 | Characterized chatbot with personality |
US16/765,368 US11361166B2 (en) | 2017-12-29 | 2018-12-13 | Characterized chatbot with personality |
EP18830119.6A EP3714383A1 (en) | 2017-12-29 | 2018-12-13 | Characterized chatbot with personality |
US17/741,945 US11922128B2 (en) | 2017-12-29 | 2022-05-11 | Characterized chatbot with personality |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711487229.2A CN109986569B (zh) | 2017-12-29 | 2017-12-29 | 具有角色化和性格化的聊天机器人 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109986569A CN109986569A (zh) | 2019-07-09 |
CN109986569B true CN109986569B (zh) | 2022-08-23 |
Family
ID=64949464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711487229.2A Active CN109986569B (zh) | 2017-12-29 | 2017-12-29 | 具有角色化和性格化的聊天机器人 |
Country Status (4)
Country | Link |
---|---|
US (2) | US11361166B2 (zh) |
EP (1) | EP3714383A1 (zh) |
CN (1) | CN109986569B (zh) |
WO (1) | WO2019133267A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3089324A1 (fr) * | 2018-11-29 | 2020-06-05 | Orange | Procédé de détermination d’un agent conversationnel sur un terminal |
CN110399474B (zh) * | 2019-07-18 | 2023-06-09 | 腾讯科技(深圳)有限公司 | 一种智能对话方法、装置、设备及存储介质 |
US11409965B2 (en) * | 2020-01-15 | 2022-08-09 | International Business Machines Corporation | Searching conversation logs of a virtual agent dialog system for contrastive temporal patterns |
US11381682B2 (en) * | 2020-05-18 | 2022-07-05 | Avaya Management L.P. | Tunable chatbots |
CN114925192A (zh) * | 2022-07-21 | 2022-08-19 | 北京聆心智能科技有限公司 | 一种人机协同对话方法、装置、设备及存储介质 |
CN116603249B (zh) * | 2023-07-19 | 2023-10-03 | 深圳须弥云图空间科技有限公司 | 应用于角色扮演推理类游戏的大语言模型的训练方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0798652A2 (en) * | 1996-03-27 | 1997-10-01 | Hitachi Business International, Ltd. | Document composition supporting method and system, and electronic dictionary for terminology |
KR20070008477A (ko) * | 2006-12-06 | 2007-01-17 | 주식회사 아이오. 테크 | 감성 전달 기능을 가진 동작 포함 로봇 채팅 시스템 |
CN104290097A (zh) * | 2014-08-19 | 2015-01-21 | 白劲实 | 一种学习型智能家庭社交机器人系统和方法 |
CN105425953A (zh) * | 2015-11-02 | 2016-03-23 | 小天才科技有限公司 | 一种人机交互的方法及系统 |
CN106649404A (zh) * | 2015-11-04 | 2017-05-10 | 陈包容 | 一种会话场景数据库的创建方法及装置 |
CN106874472A (zh) * | 2017-02-16 | 2017-06-20 | 深圳追科技有限公司 | 一种拟人机器人客服方法 |
CN107340991A (zh) * | 2017-07-18 | 2017-11-10 | 百度在线网络技术(北京)有限公司 | 语音角色的切换方法、装置、设备以及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2007264420B8 (en) * | 2006-06-29 | 2012-04-12 | International Business Machines Corporation | Cyberpersonalities in artificial reality |
US7814048B2 (en) * | 2006-08-14 | 2010-10-12 | Microsoft Corporation | Knowledge extraction from online discussion forums |
US8818926B2 (en) * | 2009-09-29 | 2014-08-26 | Richard Scot Wallace | Method for personalizing chat bots |
US8972240B2 (en) * | 2011-05-19 | 2015-03-03 | Microsoft Corporation | User-modifiable word lattice display for editing documents and search queries |
US10382366B2 (en) * | 2015-11-11 | 2019-08-13 | Kik Interactive Inc. | Method, system and apparatus for autonomous message generation |
US11108708B2 (en) * | 2016-06-06 | 2021-08-31 | Global Tel*Link Corporation | Personalized chatbots for inmates |
US10162816B1 (en) * | 2017-06-15 | 2018-12-25 | Oath Inc. | Computerized system and method for automatically transforming and providing domain specific chatbot responses |
EP3644173A4 (en) * | 2017-06-20 | 2020-07-01 | Sony Corporation | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND PROGRAM |
-
2017
- 2017-12-29 CN CN201711487229.2A patent/CN109986569B/zh active Active
-
2018
- 2018-12-13 EP EP18830119.6A patent/EP3714383A1/en active Pending
- 2018-12-13 US US16/765,368 patent/US11361166B2/en active Active
- 2018-12-13 WO PCT/US2018/065316 patent/WO2019133267A1/en unknown
-
2022
- 2022-05-11 US US17/741,945 patent/US11922128B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0798652A2 (en) * | 1996-03-27 | 1997-10-01 | Hitachi Business International, Ltd. | Document composition supporting method and system, and electronic dictionary for terminology |
KR20070008477A (ko) * | 2006-12-06 | 2007-01-17 | 주식회사 아이오. 테크 | 감성 전달 기능을 가진 동작 포함 로봇 채팅 시스템 |
CN104290097A (zh) * | 2014-08-19 | 2015-01-21 | 白劲实 | 一种学习型智能家庭社交机器人系统和方法 |
CN105425953A (zh) * | 2015-11-02 | 2016-03-23 | 小天才科技有限公司 | 一种人机交互的方法及系统 |
CN106649404A (zh) * | 2015-11-04 | 2017-05-10 | 陈包容 | 一种会话场景数据库的创建方法及装置 |
CN106874472A (zh) * | 2017-02-16 | 2017-06-20 | 深圳追科技有限公司 | 一种拟人机器人客服方法 |
CN107340991A (zh) * | 2017-07-18 | 2017-11-10 | 百度在线网络技术(北京)有限公司 | 语音角色的切换方法、装置、设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109986569A (zh) | 2019-07-09 |
WO2019133267A1 (en) | 2019-07-04 |
EP3714383A1 (en) | 2020-09-30 |
US11361166B2 (en) | 2022-06-14 |
US11922128B2 (en) | 2024-03-05 |
US20200342179A1 (en) | 2020-10-29 |
US20220318519A1 (en) | 2022-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109986569B (zh) | 具有角色化和性格化的聊天机器人 | |
CN107134279B (zh) | 一种语音唤醒方法、装置、终端和存储介质 | |
US8811638B2 (en) | Audible assistance | |
US20130144619A1 (en) | Enhanced voice conferencing | |
US9141588B2 (en) | Communication using handwritten input | |
CN113168619A (zh) | 用于经由人工智能和数字助理进行事件安排的句子注意力建模 | |
CN111128183B (zh) | 语音识别方法、装置和介质 | |
CN111753551B (zh) | 基于词向量生成模型的信息生成方法和装置 | |
US11328711B2 (en) | User adaptive conversation apparatus and method based on monitoring of emotional and ethical states | |
CN112632244A (zh) | 一种人机通话的优化方法、装置、计算机设备及存储介质 | |
CN114154459A (zh) | 语音识别文本处理方法、装置、电子设备及存储介质 | |
CN114155860A (zh) | 摘要记录方法、装置、计算机设备和存储介质 | |
CN110555329A (zh) | 一种手语翻译的方法、终端以及存储介质 | |
CN114756677A (zh) | 样本生成方法、文本分类模型的训练方法及文本分类方法 | |
CN112748828B (zh) | 一种信息处理方法、装置、终端设备及介质 | |
CN113535969B (zh) | 语料扩充方法、装置、计算机设备及存储介质 | |
CN111159472B (zh) | 多模态聊天技术 | |
CN111984765B (zh) | 知识库问答过程关系检测方法及装置 | |
CN114186535A (zh) | 结构图还原方法、装置、电子设备、介质及程序产品 | |
CN113420553A (zh) | 文本生成方法、装置、存储介质及电子设备 | |
CN110765338A (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN110931014A (zh) | 基于正则匹配规则的语音识别方法及装置 | |
WO2019199456A1 (en) | Chatbot with a stance taking | |
CN113535926B (zh) | 主动对话方法、装置及语音终端 | |
WO2024088039A1 (zh) | 人机对话方法、对话网络模型的训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |