CN106233377A - 信息处理装置和控制程序 - Google Patents
信息处理装置和控制程序 Download PDFInfo
- Publication number
- CN106233377A CN106233377A CN201580021261.4A CN201580021261A CN106233377A CN 106233377 A CN106233377 A CN 106233377A CN 201580021261 A CN201580021261 A CN 201580021261A CN 106233377 A CN106233377 A CN 106233377A
- Authority
- CN
- China
- Prior art keywords
- calling
- phrase
- mentioned
- situation
- corresponding situation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004044 response Effects 0.000 claims abstract description 95
- 238000000034 method Methods 0.000 description 46
- 230000008569 process Effects 0.000 description 42
- 241001465754 Metazoa Species 0.000 description 11
- 230000008859 change Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 230000010365 information processing Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 206010011469 Crying Diseases 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004513 sizing Methods 0.000 description 2
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 101100005280 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cat-3 gene Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Abstract
一种信息处理装置,即使在连续进行多个呼叫的情况下,也进行适当的应答。具备:模式确定部(42),其在接收到应决定应答的短语的对象呼叫的情况下,确定对与该对象呼叫不同的其它呼叫的对应状况;以及短语生成部(43),其决定与上述模式确定部所确定的对应状况相应的短语作为对上述对象呼叫进行应答的短语。
Description
技术领域
本发明涉及决定与发话者发出的声音相应的短语的信息处理装置等。
背景技术
以往已广泛研究能使人类与机器人对话的对话系统。例如,专利文献1中记载有:切换进行输入声音信号的存储、输入声音信号的分析以及所存储的输入声音信号的分析中的任一处理,在存储输入声音信号的情况下,更换输入声音信号的顺序而进行声音识别。
现有技术文献
专利文献
专利文献1:日本公开特许公报“特开平10-124087号公报(1998年5月15日公开)”
专利文献2:日本公开特许公报“特开2006-106761号公报(2006年4月20日公开)”
专利文献3:日本公开特许公报“特开2006-171719号公报(2006年6月29日公开)”
专利文献4:日本公开特许公报“特开2007-79397号公报(2007年3月29日公开)”
发明内容
发明要解决的问题
在以专利文献1~4公开的技术为首的现有技术中,是以假定发话者要等待到机器人对提问的回答结束为止的一问一答的交流为前提的。因此,存在有时在连续进行多个呼叫的情况下会进行不适当的应答的问题。此外,该问题不限于机器人,其是识别人类发出的声音而决定对该声音的应答的信息处理装置普遍产生的问题。本发明是鉴于上述问题而完成的,其目的在于提供即使在连续进行多个呼叫的情况下也能进行适当的应答的信息处理装置等。
用于解决问题的方案
为了解决上述问题,本发明的一方式的信息处理装置是决定对用户呼叫的声音进行应答的短语的信息处理装置,具备:对应状况确定部,其在接收到应决定应答的短语的对象呼叫的情况下,确定本装置对与该对象呼叫不同的其它呼叫的对应状况;以及短语决定部,其决定与上述对应状况确定部所确定的对应状况相应的短语作为对上述对象呼叫进行应答的短语。
发明效果
根据本发明的一方式,可取得即使在连续进行多个呼叫的情况下也能进行适当的应答的效果。
附图说明
图1是示出本发明的实施方式1的信息处理装置的构成的功能框图。
图2是示出本发明的实施方式1的信息处理装置输出对呼叫的应答的处理的流程图。
图3是示出对呼叫的对应状况的例子的图。
图4是示出选择与所确定的对应状况的模式相应的模板的处理的详细内容的流程图。
图5是示出本发明的实施方式2的信息处理装置的构成的功能框图。
图6是示出本发明的实施方式2的信息处理装置输出对呼叫的应答的处理的流程图。
图7是示出本发明的实施方式3的信息处理装置的硬件构成的框图。
具体实施方式
〔实施方式1〕
〔1.信息处理装置1的概要〕首先,基于图1说明信息处理装置1的构成。图1是示出信息处理装置1的构成的功能框图。信息处理装置1是如下装置:作为对由用户的声音发出的一个呼叫(以下,将该呼叫表示为“处理对象的呼叫(对象呼叫)”)的应答,输出基于信息处理装置1对该处理对象的呼叫以外的呼叫(以下,表示为“其它呼叫”。)的对应状况而生成的短语(Phrase)。信息处理装置1可以是例如对话机器人这种以与用户的对话为主要功能的装置,或者也可以是例如清扫机器人这种以其它功能为主要功能的装置。另外,如图1所示,信息处理装置1具备声音输入部2、声音输出部3、控制部4以及存储部5。
声音输入部2将用户的声音转换为信号,并将其输出给控制部4。声音输入部2可以是麦克风,另外也可以具备A/D(Analog/Digital:模拟/数字)转换器。声音输出部3基于从控制部4输出的信号输出声音。声音输出部3可以是扬声器,另外也可以具备放大电路或D/A(Digital/Analog:数字/模拟)转换器。如图1所示,控制部4包含声音解析部41、模式确定部(对应状况确定部)42、短语生成部(短语决定部)43以及短语输出控制部44。
声音解析部41对从声音输入部2输出的信号进行解析,并将其作为呼叫来接收。在接收到呼叫的情况下,声音解析部41将表示接收该呼叫的顺序的编号(以下,表示为接收编号)和接收到该呼叫的情况记录到对应状况信息51中,另外,将接收编号通知给模式确定部42。另外,声音解析部41将对声音进行解析的结果作为声音解析信息53按每个呼叫记录到存储部5中。
模式确定部42在被声音解析部41通知了接收编号的情况下,通过参照对应状况信息51,确定信息处理装置1对多个呼叫各自的对应状况(以下,简单表示为对应状况)与预先设定的模式中的哪个模式一致。更详细地说,模式确定部42根据在确定模式的时点(处理对象的呼叫的接收后,应答前)的最近进行的其它呼叫的处理(其它呼叫的接收或应答)确定对应状况。然后,模式确定部42将所确定的对应状况的模式与接收编号一起通知给短语生成部43。此外,模式确定部42判断对应状况的定时不限于被通知了接收编号的紧后(接收到处理对象的呼叫的紧后)。例如,模式确定部42可以在被通知了接收编号后经过规定的时间时判断对应状况。
短语生成部43根据模式确定部42所确定的对应状况的模式,生成(决定)作为对呼叫的应答的短语。后面详细描述短语生成部43生成短语的处理。另外,短语生成部43将所生成的短语与接收编号一起输出给短语输出控制部44。
短语输出控制部44将从短语生成部43输出的短语作为声音从声音输出部3输出。另外,短语输出控制部44将已对呼叫进行应答的情况与接收编号一起作为对应状况信息51记录到存储部5中。
存储部5存储对应状况信息51、模板信息52、声音解析信息53以及基本短语信息54。存储部5可以包括易失性记录介质和/或非易失性记录介质。对应状况信息51包含表示呼换的接收顺序的信息和表示输出对呼叫的应答的顺序的信息。下述表1是表示对应状况信息51的一例的表。在该表中,“#”行表示所记录的顺序,“接收编号”行表示呼叫的接收编号,“处理”行表示信息处理装置1进行了接收呼叫的处理或进行了输出对呼叫的应答的处理。
[表1]
# | 接收编号 | 处理 |
1 | N-1 | 接收 |
2 | N | 接收 |
3 | N+1 | 接收 |
4 | N | 应答 |
5 | N-1 | 应答 |
6 | N+1 | 应答 |
模板信息52是短语生成部43为了生成作为对呼叫的应答的短语而使用的按每个对应状况的模式设定有预先设定的模板的信息。此外,之后参照表4详细说明对应状况的模式与模板的关联。本实施方式的模板信息52包含下述说明的模板A~E的信息。
模板A是针对呼叫而将作为呼叫的直接回答(应答)的短语(基于基本短语信息54决定的短语)直接设为作为应答的短语的模板。模板A用于用户能识别呼叫与对呼叫的应答的对应关系的对应状况。
模板B是作为应答的短语包含表示是对哪个呼叫的应答的词句的模板。模板B用于例如连续进行多个呼叫的情况这种用户难以识别呼叫与对呼叫的应答的对应关系的对应状况。表示是对哪个呼叫的应答的词句可以是“这么说来刚才所说的是”等预先设定的词句。另外,也可以是概括呼叫的词句。具体地说,例如在呼叫是“你喜欢的动物是什么?”的情况下,可以是“我喜欢的动物是”、“我喜欢的是”、“我喜欢的动物”等词句。另外,也可以是反复呼叫并还附加定型句的词句。具体地说,例如,在呼叫为“你喜欢的动物是什么?”的情况下,可以是“‘你喜欢的动物是什么?’(反复呼叫)‘你问我吗?’(定型句)”这样的词句。另外,也可以是“关于前一个话题”等确定要返回应答的呼叫的顺序的词句。
模板C是用于生成用于让用户再次进行呼叫的短语的模板。模板C例如可以是“你刚才在讲什么?”、“你刚才说什么?”、“再讲一次你刚才讲的话”等预先设定的短语。模板C与模板B同样,用于用户难以识别呼叫与对呼叫的应答的对应关系的对应状况。在模板C的情况下,让用户再次进行呼叫,因此例如在连续进行2个呼叫而都未返回应答的对应状况下,能让用户选择想要应答哪个呼叫。
模板D是用于生成表示由于正在进行与在处理对象的呼叫之前所接收到的呼叫有关的处理而无法返回对处理对象的呼叫的直接应答这一情况的短语的模板。模板D也与模板B、C同样,用于用户难以识别呼叫与对呼叫的应答的对应关系的对应状况。在模板D中,通过将以先前接收的呼叫为优先的意思传达给用户,取消对之后的呼叫(处理对象的呼叫)的应答(先前者赢),来让用户识别呼叫与对呼叫的应答的对应关系。模板D例如也可以是“我无法回答,因为我在考虑其他事情”、“稍等”、“你能等会再问吗”等预先设定的短语。
模板E是用于生成表示由于已开始对在处理对象的呼叫之后所接收到的呼叫的处理而无法返回对处理对象的呼叫的应答这一情况的短语的模板。模板E也与模板B~D同样,用于用户难以识别呼叫与对呼叫的应答的对应关系的对应状况。在模板E中,通过将以之后接收的呼叫(处理对象的呼叫)为优先的意思传达给用户,取消对之后的呼叫的应答(之后者赢),来让用户识别呼叫与对呼叫的应答的对应关系。模板E例如也可以是“我忘了我要说什么”、“由于你连续发问,我忘了你刚才问我什么了”等预先设定的短语。
声音解析信息53是表示对由来自用户的声音发出的呼叫进行解析的结果的信息。对由来自用户的声音发出的呼叫进行解析的结果与接收编号相关联。基本短语信息54是用于生成作为对呼叫的直接回答的短语的信息。具体地说,是使预先设定的呼叫的词句与作为直接回答的短语或用于生成作为直接回答的短语的信息相关联的信息。下述表2是基本短语信息54的一例。在基本短语信息54是表2所示的信息的情况下,作为对“你喜欢的动物是什么?”这样的呼叫的直接回答的短语(使用模板A的情况下的短语)为“是狗”。另外,作为对“今天的天气如何?”这样的呼叫的直接回答的短语是经由未图示的通信部向未图示的服务器查询的结果。此外,基本短语信息54可以存储在信息处理装置1的存储部5中,但是也可以存储在外置于信息处理装置1的外部存储装置中。另外,也可以将基本短语信息54存储在未图示的服务器中。其它信息也是同样的。
[表2]
# | 呼叫 | 短语 |
1 | 你喜欢的动物是什么? | 是狗 |
2 | 你不喜欢的动物是什么? | 是猫 |
3 | 今天的天气如何? | (向服务器查询) |
〔2.对呼叫的应答的生成处理〕其次,基于图2说明信息处理装置1输出对呼叫的应答的处理。图2是表示信息处理装置1输出对呼叫的应答的处理的流程图。
首先,在用户通过声音发起呼叫的情况下(S0),声音输入部2将该声音的输入转换为信号,并将其输出给声音解析部41。声音解析部41对从声音输入部2输出的信号进行解析,并将其作为来自用户的呼叫来接收(S1)。在接收到呼叫的情况下,声音解析部41将该呼叫(处理对象的呼叫)的接收编号和接收到处理对象的呼叫的情况记录到对应状况信息51中,另外,将接收编号通知给模式确定部42。另外,声音解析部41将对处理对象的呼叫的声音进行解析的结果作为声音解析信息53记录到存储部5中。
被声音解析部41通知了接收编号的模式确定部42参照对应状况信息51,确定信息处理装置1对呼叫的紧前的对应状况与预先设定的哪个对应状况的模式一致(S2)。接着,模式确定部42将所确定的对应状况的模式与接收编号一起通知给短语生成部43。
从模式确定部42接收到接收编号和对应状况的模式的通知的短语生成部43选择与该对应状况的模式相应的模板(S3)。接着,模式确定部42判断所选择的模板是否有多个(S4)。在所选择的模板有多个的情况下(在S4中为“是”),短语生成部43从所选择的模板中选择一个模板(S5)。短语生成部43可以参照声音解析信息53并基于呼叫的内容来决定要选择的一个模板,也可以基于与信息处理装置1有关的其它信息来决定。
接着,短语生成部43使用所选择的一个模板生成(决定)对呼叫的短语(应答)(S6)。另外,短语生成部43将所生成的短语与接收编号一起输出给短语输出控制部44。接着,短语输出控制部44将从短语生成部43输出的短语作为声音从声音输出部3输出(S7)。另外,短语输出控制部44将已对呼叫进行应答的情况与接收编号一起作为对应状况信息51记录到存储部5中。
〔2.1.对应状况的模式的确定〕基于图3和下述表3详细说明图2的S2所示的对应状况的模式的确定。图3是示出对呼叫的对应状况的例子的图。另外,表3是表示由模式确定部42确定的呼叫的对应状况的模式的表。在表3的例子中,将接收处理对象呼叫后接收到其它呼叫(呼叫N+L)的情况和接收其它呼叫(呼叫N-M)后接收到处理对象呼叫的情况分别作为不同的模式。
[表3]
此外,N、M、L分别表示正整数。但是,以下为了简单,说明M=1,L=1的例子。另外,“●”和“○”均表示在模式确定部42确定模式的时点进行处理(呼叫的接收或对呼叫的应答)。“●”和“○”的差别在于如下这点:“●”表示在接收到呼叫N的时点已经进行了处理,而“○”表示在接收到呼叫N的时点还没有进行处理。“×”表示在确定模式的时点不进行处理。此外,基于表示处理对象的呼叫的“接收”的列的“#”行的值与表示该规定的处理的列的“#”行的值的大小关系来识别规定的处理的“●”和“○”。“呼叫a”表示接收编号为“a”的呼叫,“应答a”表示对“呼叫a”的应答。模式确定部42在图2的S2所示的处理中确定的模式是表3所示的模式1~5中的任意一个模式。
首先,说明模式确定部42基于对应状况信息51确定对应状况的模式的方法。此外,将处理对象的呼叫称为呼叫N。例如,在表1的对应状况信息51中的#=2的处理的接收完成的时点,呼叫N-M(M=1)的接收完成,未应答该呼叫N-M。由此,在该时点,呼叫N-M的接收为“●”,应答为“×”,因此模式确定部42根据表3确定为对应状况是模式2。
另外,例如,在呼叫N的接收后、应答前进行下个呼叫N+L(L=1)并先对该呼叫N+L(L=1)应答的情况下,对应状况信息51的“#”行的数值最大的列为呼叫N+1,该列的“处理”行为“应答”。由此,模式确定部42判断为呼叫N+L的“接收”和“应答”为“●”。从而,在该情况下,模式确定部42确定为对应状况是模式5。
接着,基于图3例示在图2的S1所示的处理中接收到呼叫N的情况下在图3的α所示的时点进行对应状况的模式的确定的情况。此外,模式的确定只要在呼叫N的接收后到应答之前的期间(对呼叫N的应答的生成期间)进行即可,确定模式的定时不限于图示的α。
在图3的(1-2)的α所示的时点,紧前的呼叫为呼叫N-1(即,呼叫N-M的接收处理为“●”)。另外,在接收到呼叫N的时点,已输出对呼叫N-1的应答N-1(即,呼叫N-M的应答处理为“●”)。从而,模式确定部42根据表3确定为图3的(1-2)的α的对应状况是模式1。
在图3的(2)的α所示的时点,紧前的呼叫为呼叫N-1(即,呼叫N-M的接收处理为“●”)。另外,尚未输出对呼叫N-1的应答(即,呼叫N-M的应答处理为“×”)。从而,模式确定部42根据表3确定为图3的(2)的α的对应状况是模式2。
以下,同样地,模式确定部42确定为在图3的(3)的α时是模式3,在(4)的α时是模式4,在(5)的α时是模式5。此外,在图3的(1-1)的α时不存在紧前的呼叫,但是在本实施方式中,模式确定部42在不存在这种紧前的呼叫的情况下确定为模式1。
〔2.2.与对应状况的模式相应的模板的选择〕基于图4和下述表4详细说明图2的S3所示的选择与所确定的模式相应的模板的处理。图4是表示图2的S3所示的处理的详细的流程图。另外,表4是表示各模式与选择的模板的对应关系的表。
[表4]
模板A | 模板B | 模板C | 模板D | 模板E | |
模式1 | ○ | × | × | × | × |
模式2 | ○ | ○ | × | ○ | × |
模式3 | × | ○ | ○ | × | × |
模式4 | × | ○ | × | × | ○ |
模式5 | × | ○ | ○ | × | × |
短语生成部43确认从模式确定部42通知的模式是哪个模式(S31)。接着,短语生成部43选择与所通知的模式对应的模板(S32~S35)。选择的模板是在表4中记载有“○”的模板。例如,在所通知的模式为模式1的情况下,选择模板A(S32)。
根据上述构成,在清楚是对哪个呼叫的应答的情况下(为模式1-1或1-2的情况下),使用的是用于生成作为对呼叫的直接回答的简洁的短语的模板。另一方面,在不是一定清楚是对哪个呼叫的应答的情况下(为模式2~5的情况下),使用的是考虑到对其它呼叫的对应状况的模板(模板B~E)。
〔变形例〕
在上述实施方式中,在图2的S2中确定的对应状况是模式2~5中的任意一个模式(第2对应状况)的情况下,短语生成部43也可以选择作为应答的短语包含表示是对哪个呼叫的应答的词句的模板(模板B)。
根据上述构成,能对连续进行的多个呼叫进行清楚是对哪个呼叫的应答的应答。由此,用户能知道应答与哪个呼叫对应。另外,在对应状况是模式1(第1对应状况)的情况下,不使用模板B(使用模板A),因此与总是使用模板B的情况相比,在清楚是对哪个呼叫的应答的情况下(模式1的情况下),能将简洁的短语作为应答来输出。
另外,在如模式2、4那样接收后、未应答的呼叫并存有多个的对应状况的情况下,短语生成部43也可以选择模板D、E这样的生成表示锁定作为应答对象的呼叫的短语的模板。并且,在该情况下,对锁定的对象以外的呼叫(取消应答的呼叫),也可以取消声音解析等处理。另外,在信息处理装置1的处理负荷大于预先设定的阈值的情况下,也可以对未应答的呼叫中的至少1个呼叫取消声音解析等处理。并且,在该情况下,也可以选择与未取消处理的呼叫相应的模板。另外,在使用模板D、E等这样的不对呼叫的内容进行解析就能生成应答的模板的情况下,能直接返回应答。因此,在设为上述构成的情况下,与用户的交流更顺畅。
另外,也可以判断用户识别应答的内容是对哪个呼叫的应答是否是困难的,在判断为困难的情况下选择模板B。对上述判断的方法不作特别限定,例如可以基于呼叫或其应答(登记到基本短语信息54中的应答的短语)所包含的词和/或短语进行判断。例如,在进行了“你不喜欢的动物是什么?”和“你喜欢的动物是什么?”的呼叫的情况下,这些呼叫均为包含“动物”一词的类似的呼叫,有可能应答也是类似的,因此可以选择模板B。
另外,在上述实施方式中,说明了其它呼叫为1个的情况的例子,因此对应状况的模式仅确定1个,但是在其它呼叫存在多个的情况下,也可以针对其它呼叫分别确定对应状况的模式。在该情况下,有时会确定多个不同的模式。在确定了多个模式的情况下,可以对确定的全部模式选择共同的模板。例如,在确定了模式2和模式4的情况下,选择在表4中在模式2和模式4的行这两行记载有“○”的模板B。另外,在将模式1以外的多个模式确定为对应状况的模式的情况下,可以选择模板E。
另外,在上述实施方式中,说明了信息处理装置1直接接收用户的呼叫的例子,但是即使在将信息处理装置1和接收用户的呼叫的装置作为独立的装置的对话系统中,也能实现与上述实施方式同样的功能。该对话系统例如可以包含:声音对话装置,其接收用户的呼叫,输出对该呼叫进行应答的声音;以及信息处理装置,其控制该声音对话装置输出的声音。并且,也可以是声音对话装置将表示用户的呼叫内容的信息通知给上述信息处理装置,该信息处理装置基于该通知进行与信息处理装置1同样的处理。此外,在该情况下,信息处理装置只要至少具备决定声音对话装置所输出的短语的功能即可,短语的生成可以由该信息处理装置进行,也可以由声音对话装置进行。
〔实施方式2〕
以下基于图5和6说明本发明的另一实施方式。此外,为了说明方便,对具有与上述实施方式中所说明的构件相同的功能的构件和处理附上相同的附图标记,而省略其说明。首先,基于图5说明本实施方式的信息处理装置1A与实施方式1的信息处理装置1的差异。图5是表示实施方式2的信息处理装置1A的构成的功能框图。
本实施方式的信息处理装置1A与实施方式1的信息处理装置1的差异在于不具备控制部4而具备控制部4A这点。另外,控制部4A与控制部4的差异在于不具备模式确定部42和短语生成部43而具备模式确定部42A和短语生成部43A这点。
模式确定部42A与模式确定部42的差异在于如下这点:模式确定部42A从短语生成部43A接收到已生成作为对处理对象的呼叫的应答的短语的通知后,再次确定对应状况与哪个模式一致。模式确定部42A将所确定的对应状况的模式与接收编号一起再次通知给短语生成部43A。
短语生成部43A与短语生成部43的差异在于如下这点:短语生成部43A在生成了作为处理对象的呼叫的应答的短语的情况下,将已生成该短语的情况通知给模式确定部42A。另外,在被模式确定部42A通知了对应状况的模式和同一接收编号的情况下,判断对应状况的模式是否发生了变化,在对应状况的模式发生了变化的情况下,生成与变化后的对应状况的模式相应的短语,这点也不同。
接着,基于图6说明信息处理装置1A输出对呼叫的应答的处理。图6是示出信息处理装置1A输出对呼叫的应答的处理的流程图。
在S6所示的处理中,生成了对处理对象的呼叫的应答的短语生成部43A将已生成该短语的情况通知给模式确定部42A。模式确定部42A接收到该通知后,确认其它呼叫的对应状况(S6A),将该对应状况与接收编号一起通知给短语生成部43A。
再次接收到对应状况的通知的短语生成部43A判断对应状况的模式是否发生了变化(S6B)。在对应状况的模式发生了变化的情况下(在S6B中为“是”),短语生成部43A再次执行S3以下的处理。即,再次生成作为对处理对象的呼叫的应答的短语。另一方面,在对应状况的模式未发生变化的情况下(在S6B中为“否”),执行S7的处理,从而将在S6中生成的短语作为对处理对象的呼叫的应答输出。
根据上述的构成,即使在生成与呼叫相应的短语的期间,其它呼叫的对应状况发生了变化的情况下,也能输出适当的短语。此外,再次确认对应状况的定时只要是在第1次确认对应状况后到输出对处理对象的呼叫的应答之前的期间且是对应状况有可能变化的时点即可,不限于上述例子(短语的生成完成时)。例如,也可以在第1次确认对应状况后经过规定的时间时再次确认对应状况。
〔实施方式3〕
信息处理装置1和1A的各部分可以利用形成于集成电路(IC芯片)等的逻辑电路(硬件)实现,也可以使用CPU(Central Processing Unit:中央处理单元)来通过软件实现。在后者的情况下,能使用图7所示的计算机(电子计算机)构成信息处理装置1和1A。图7是例示能用作上述信息处理装置1和1A的计算机的构成的框图。
在该情况下,如图7所示,信息处理装置1和1A具备经由总线14相互连接的计算部11、主存储部12、辅助存储部13、声音输入部2以及声音输出部3。计算部11、主存储部12以及辅助存储部13分别可以是例如CPU、RAM(Random Access Memory:随机存取存储器)、硬盘驱动器。此外,主存储部12只要是计算机可读取的“非暂时性有形介质”即可,例如能使用带、盘、卡、半导体存储器、可编程逻辑电路等。
在辅助存储部13中存储有用于使计算机作为信息处理装置1和1A进行动作的各种程序。并且,计算部11通过将存储在辅助存储部13中的上述各程序展开在主存储部12上,执行展开在主存储部12上的上述各程序所包含的命令,而使计算机作为信息处理装置1和1A所具备的各部分发挥功能。
此外,在此,说明了使用记录在作为内部记录介质的辅助存储部13中的上述各程序使计算机作为信息处理装置1和1A发挥功能的构成,但是也可以使用记录在外部记录介质中的程序。另外,上述程序可以经由能传送该程序的任意的传送介质(通信网络、放送波等)供应给上述计算机。此外,在本发明中,上述程序也能以通过电子传送具体化的嵌入于载波的数据信号的形式实现。
〔总结〕
本发明的方式1的信息处理装置(1、1A)是决定对用户呼叫的声音进行应答的短语的信息处理装置,具备:对应状况确定部(模式确定部42、42A),其在接收到应决定应答的短语的对象呼叫的情况下,确定本装置对与该对象呼叫不同的其它呼叫的对应状况;以及短语决定部(短语生成部43),其决定与上述对应状况确定部所确定的对应状况相应的短语作为对上述对象呼叫进行应答的短语。
根据上述构成,针对用户发出的呼叫,输出与其它呼叫的对应状况相应的短语。此外,其它呼叫是为了决定对对象呼叫进行应答的短语而应考虑的呼叫,例如可以是在对象呼叫的紧前接收到的M个呼叫,也可以是在对象呼叫的紧后接收到的L个呼叫,也可以是这两者(L、M为正数)。另外,在其它呼叫存在多个的情况下,其它呼叫的对应状况可以是对多个其它呼叫中的1个呼叫的对应状况,也可以是将多个其它呼叫的各对应状况综合而确定的对应状况。由此,与无论对其它呼叫的对应状况如何都针对呼叫输出统一的短语的构成相比,能针对多个呼叫输出适当的短语。此外,对应状况确定部在接收到呼叫后到输出与该呼叫相应的短语之前的任意时点判断对应状况。另外,上述信息处理装置所决定的短语可以从该信息处理装置输出,也可以由其它装置输出。
本发明的方式2的信息处理装置可以是,在上述方式1中,上述对应状况确定部将在接收上述对象呼叫后接收到上述其它呼叫的情况和在接收上述其它呼叫后接收到上述对象呼叫的情况分别确定为不同的对应状况。根据该构成,能决定在接收上述对象呼叫后接收到上述其它呼叫的情况和在接收上述其它呼叫后接收到上述对象呼叫的情况各自相应的适当的短语。例如,在连续进行2个呼叫的情况下,能输出适于(1)仅已应答先前的呼叫和(2)仅已应答之后的呼叫的各对应状况的短语。
本发明的方式3的信息处理装置可以是,在上述方式1或2中,上述对应状况包含:第1对应状况,在已决定了针对上述其它呼叫的短语的状态下接收到上述对象呼叫;以及第2对应状况,在没有决定针对上述其它呼叫的短语的状态下接收到上述对象呼叫,在上述对应状况确定部确定为是上述第2对应状况的情况下,上述短语决定部决定将在上述第1对应状况下决定的短语和表示上述对象呼叫的短语组合后的短语。根据该构成,在用户难以识别呼叫与其应答的对应的第2对应状况下,决定将在用户清楚呼叫与其应答的对应的第1对应状况下决定的短语和表示对象呼叫的短语组合后的短语,因此用户能识别所输出的短语是对对象呼叫进行应答的短语。
本发明的方式4的信息处理装置可以是,在上述方式1至3中,上述对应状况确定部在确定对应状况后,在所确定的对应状况有可能变化为其它对应状况的时点再次确定对应状况,上述短语决定部(短语生成部43A)在上述对应状况确定部先前确定的对应状况和之后确定的对应状况不同的情况下,决定与之后确定的对应状况相应的短语。根据该构成,即使在生成与呼叫相应的短语的期间,对应状况发生了变化的情况下,也能输出适当的短语。
本发明的各方式的信息处理装置可以由计算机来实现,在该情况下,通过使计算机作为上述信息处理装置所具备的各部分(软件要素)动作而使上述信息处理装置由计算机来实现的信息处理装置的控制程序和记录其的计算机可读取的记录介质也纳入本发明的范畴中。
本发明不限于上述各实施方式,能在权利要求示出的范围内进行各种变更,将不同的实施方式分别公开的技术手段适当组合而得到的实施方式也包含在本发明的技术范围中。而且,通过将各实施方式中分别公开的技术手段组合,能形成新的技术特征。
工业上的可利用性
本发明能用于根据用户发出的声音而向该用户输出规定的短语的信息处理装置和信息处理系统。
附图标记说明
1、1A 信息处理装置
42、42A 模式确定部(对应状况确定部)
43、43A 短语生成部(短语决定部)。
Claims (5)
1.一种信息处理装置,决定对用户呼叫的声音进行应答的短语,其特征在于,具备:
对应状况确定部,其在接收到应决定应答的短语的对象呼叫的情况下,确定对与该对象呼叫不同的其它呼叫的对应状况;以及
短语决定部,其决定与上述对应状况确定部所确定的对应状况相应的短语作为对上述对象呼叫进行应答的短语。
2.根据权利要求1所述的信息处理装置,其特征在于,
上述对应状况确定部将在接收上述对象呼叫后接收到上述其它呼叫的情况和在接收上述其它呼叫后接收到上述对象呼叫的情况分别确定为不同的对应状况。
3.根据权利要求1或2所述的信息处理装置,其特征在于,
上述对应状况包含:第1对应状况,在已决定了针对上述其它呼叫的短语的状态下接收到上述对象呼叫;以及第2对应状况,在没有决定针对上述其它呼叫的短语的状态下接收到上述对象呼叫,
在上述对应状况确定部确定为是上述第2对应状况的情况下,上述短语决定部决定将在上述第1对应状况下决定的短语和表示上述对象呼叫的短语组合后的短语。
4.根据权利要求1至3中的任一项所述的信息处理装置,其特征在于,
上述对应状况确定部在确定对应状况后,在所确定的对应状况有可能变化为其它对应状况的时点再次确定对应状况,
上述短语决定部在上述对应状况确定部先前确定的对应状况和之后确定的对应状况不同的情况下,决定与之后确定的对应状况相应的短语。
5.一种控制程序,
用于使计算机作为权利要求1所述的信息处理装置发挥功能,其特征在于,用于使计算机作为上述对应状况确定部和上述短语决定部发挥功能。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014091919A JP6359327B2 (ja) | 2014-04-25 | 2014-04-25 | 情報処理装置および制御プログラム |
JP2014-091919 | 2014-04-25 | ||
PCT/JP2015/051703 WO2015162953A1 (ja) | 2014-04-25 | 2015-01-22 | 情報処理装置および制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106233377A true CN106233377A (zh) | 2016-12-14 |
CN106233377B CN106233377B (zh) | 2019-08-20 |
Family
ID=54332127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580021261.4A Expired - Fee Related CN106233377B (zh) | 2014-04-25 | 2015-01-22 | 信息处理装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20170032788A1 (zh) |
JP (1) | JP6359327B2 (zh) |
CN (1) | CN106233377B (zh) |
WO (1) | WO2015162953A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020106315A1 (en) | 2018-11-21 | 2020-05-28 | Google Llc | Orchestrating execution of a series of actions requested to be performed via an automated assistant |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07311671A (ja) * | 1994-05-17 | 1995-11-28 | Oki Electric Ind Co Ltd | 音声情報通信システム |
JPH0991112A (ja) * | 1995-07-19 | 1997-04-04 | Toshiba Corp | マルチモーダル対話装置及び対話方法 |
CN1291112A (zh) * | 1998-12-24 | 2001-04-11 | 索尼公司 | 信息处理装置、便携设备、电子宠物装置、存储信息处理过程的记录介质和信息处理放法 |
US20060276230A1 (en) * | 2002-10-01 | 2006-12-07 | Mcconnell Christopher F | System and method for wireless audio communication with a computer |
CN101075435A (zh) * | 2007-04-19 | 2007-11-21 | 深圳先进技术研究院 | 一种智能聊天系统及其实现方法 |
US20080015864A1 (en) * | 2001-01-12 | 2008-01-17 | Ross Steven I | Method and Apparatus for Managing Dialog Management in a Computer Conversation |
CN101609671A (zh) * | 2009-07-21 | 2009-12-23 | 北京邮电大学 | 一种连续语音识别结果评价的方法和装置 |
CN202736475U (zh) * | 2011-12-08 | 2013-02-13 | 华南理工大学 | 一种聊天机器人 |
CN103198831A (zh) * | 2013-04-10 | 2013-07-10 | 威盛电子股份有限公司 | 语音操控方法与移动终端装置 |
CN103413549A (zh) * | 2013-07-31 | 2013-11-27 | 深圳创维-Rgb电子有限公司 | 语音交互的方法、系统以及交互终端 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2770747B2 (ja) * | 1994-08-18 | 1998-07-02 | 日本電気株式会社 | 音声合成装置 |
US5483588A (en) * | 1994-12-23 | 1996-01-09 | Latitute Communications | Voice processing interface for a teleconference system |
JPH11296975A (ja) * | 1998-04-06 | 1999-10-29 | Sony Corp | 編集装置および方法、並びに提供媒体 |
TW501046B (en) * | 1999-06-11 | 2002-09-01 | Ind Tech Res Inst | A portable dialogue manager |
JP3762327B2 (ja) * | 2002-04-24 | 2006-04-05 | 株式会社東芝 | 音声認識方法および音声認識装置および音声認識プログラム |
CN1842788B (zh) * | 2004-10-08 | 2012-04-04 | 松下电器产业株式会社 | 对话支援装置、系统及方法 |
WO2007032003A2 (en) * | 2005-09-13 | 2007-03-22 | Yedda, Inc. | Device, system and method of handling user requests |
JP2008203559A (ja) * | 2007-02-20 | 2008-09-04 | Toshiba Corp | 対話装置及び方法 |
US7962578B2 (en) * | 2008-05-21 | 2011-06-14 | The Delfin Project, Inc. | Management system for a conversational system |
US8943094B2 (en) * | 2009-09-22 | 2015-01-27 | Next It Corporation | Apparatus, system, and method for natural language processing |
US8700405B2 (en) * | 2010-02-16 | 2014-04-15 | Honeywell International Inc | Audio system and method for coordinating tasks |
US9570086B1 (en) * | 2011-11-18 | 2017-02-14 | Google Inc. | Intelligently canceling user input |
WO2013080406A1 (ja) * | 2011-11-28 | 2013-06-06 | Necソフト株式会社 | 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム |
US9934780B2 (en) * | 2012-01-17 | 2018-04-03 | GM Global Technology Operations LLC | Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch |
US9236064B2 (en) * | 2012-02-15 | 2016-01-12 | Microsoft Technology Licensing, Llc | Sample rate converter with automatic anti-aliasing filter |
CN104159783B (zh) * | 2012-03-08 | 2019-05-17 | 亮锐控股有限公司 | 具有移动光源的可控高亮度照明 |
US9924002B1 (en) * | 2012-06-21 | 2018-03-20 | EMC IP Holding Company LLC | Managing stateless processes |
US9576574B2 (en) * | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
TWI557722B (zh) * | 2012-11-15 | 2016-11-11 | 緯創資通股份有限公司 | 語音干擾的濾除方法、系統,與電腦可讀記錄媒體 |
JP6257368B2 (ja) * | 2014-02-18 | 2018-01-10 | シャープ株式会社 | 情報処理装置 |
US9589562B2 (en) * | 2014-02-21 | 2017-03-07 | Microsoft Technology Licensing, Llc | Pronunciation learning through correction logs |
US20150370787A1 (en) * | 2014-06-18 | 2015-12-24 | Microsoft Corporation | Session Context Modeling For Conversational Understanding Systems |
US9767794B2 (en) * | 2014-08-11 | 2017-09-19 | Nuance Communications, Inc. | Dialog flow management in hierarchical task dialogs |
-
2014
- 2014-04-25 JP JP2014091919A patent/JP6359327B2/ja not_active Expired - Fee Related
-
2015
- 2015-01-22 WO PCT/JP2015/051703 patent/WO2015162953A1/ja active Application Filing
- 2015-01-22 US US15/303,583 patent/US20170032788A1/en not_active Abandoned
- 2015-01-22 CN CN201580021261.4A patent/CN106233377B/zh not_active Expired - Fee Related
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07311671A (ja) * | 1994-05-17 | 1995-11-28 | Oki Electric Ind Co Ltd | 音声情報通信システム |
JPH0991112A (ja) * | 1995-07-19 | 1997-04-04 | Toshiba Corp | マルチモーダル対話装置及び対話方法 |
CN1291112A (zh) * | 1998-12-24 | 2001-04-11 | 索尼公司 | 信息处理装置、便携设备、电子宠物装置、存储信息处理过程的记录介质和信息处理放法 |
US20080015864A1 (en) * | 2001-01-12 | 2008-01-17 | Ross Steven I | Method and Apparatus for Managing Dialog Management in a Computer Conversation |
US20060276230A1 (en) * | 2002-10-01 | 2006-12-07 | Mcconnell Christopher F | System and method for wireless audio communication with a computer |
CN101075435A (zh) * | 2007-04-19 | 2007-11-21 | 深圳先进技术研究院 | 一种智能聊天系统及其实现方法 |
CN101609671A (zh) * | 2009-07-21 | 2009-12-23 | 北京邮电大学 | 一种连续语音识别结果评价的方法和装置 |
CN202736475U (zh) * | 2011-12-08 | 2013-02-13 | 华南理工大学 | 一种聊天机器人 |
CN103198831A (zh) * | 2013-04-10 | 2013-07-10 | 威盛电子股份有限公司 | 语音操控方法与移动终端装置 |
CN103413549A (zh) * | 2013-07-31 | 2013-11-27 | 深圳创维-Rgb电子有限公司 | 语音交互的方法、系统以及交互终端 |
Also Published As
Publication number | Publication date |
---|---|
US20170032788A1 (en) | 2017-02-02 |
WO2015162953A1 (ja) | 2015-10-29 |
CN106233377B (zh) | 2019-08-20 |
JP2015210390A (ja) | 2015-11-24 |
JP6359327B2 (ja) | 2018-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Spencer | A radical solution to the race problem | |
US10303758B2 (en) | Systems methods and computer-readable storage media for real-time automated conversational agent | |
CN101068735B (zh) | 电梯系统 | |
CN108021934B (zh) | 多要素识别的方法及装置 | |
CN105960674A (zh) | 信息处理装置 | |
KR20190046631A (ko) | 자연어 프로세싱을 위한 시스템 및 방법 | |
CN110457709A (zh) | 外呼对话处理方法、装置及服务器 | |
CN107610698A (zh) | 一种实现语音控制的方法、机器人及计算机可读存储介质 | |
CN106233378A (zh) | 控制装置和消息输出控制系统 | |
JP7006401B2 (ja) | 学習プログラム、学習方法および学習装置 | |
CN108091030A (zh) | 自动排号处理方法和装置 | |
CN110168544A (zh) | 应答装置、应答装置的控制方法、及控制程序 | |
CN109791571A (zh) | 信息处理系统、信息处理装置、信息处理方法及存储介质 | |
CN106233377A (zh) | 信息处理装置和控制程序 | |
EP3712887A1 (en) | Vehicle operation assistance device | |
CN109785830A (zh) | 信息处理装置 | |
CN107332991A (zh) | 锁屏界面信息处理方法及装置 | |
US20150262313A1 (en) | Multiplicative incentive mechanisms | |
CN115083412A (zh) | 语音交互方法及相关装置、电子设备、存储介质 | |
US10984792B2 (en) | Voice output system, voice output method, and program storage medium | |
CN107533741A (zh) | 信息处理装置和方法以及程序 | |
CN107958289A (zh) | 用于机器人的数据处理方法和装置、机器人 | |
Hiraishi et al. | Information supervisory control of human behavior—Experiments and formal modeling | |
WO2024009890A1 (ja) | 学習データ生成装置、音声認識モデル生成装置、学習データ生成方法、音声認識モデル生成方法、および記録媒体 | |
CN114281971A (zh) | 用户意图的预测方法、装置、存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190820 |
|
CF01 | Termination of patent right due to non-payment of annual fee |