CN1890710B - 设备控制装置、以及设备控制方法 - Google Patents

设备控制装置、以及设备控制方法 Download PDF

Info

Publication number
CN1890710B
CN1890710B CN2004800361146A CN200480036114A CN1890710B CN 1890710 B CN1890710 B CN 1890710B CN 2004800361146 A CN2004800361146 A CN 2004800361146A CN 200480036114 A CN200480036114 A CN 200480036114A CN 1890710 B CN1890710 B CN 1890710B
Authority
CN
China
Prior art keywords
data
definition
processing
mentioned
project
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2004800361146A
Other languages
English (en)
Other versions
CN1890710A (zh
Inventor
佐藤宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
Kenwood KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kenwood KK filed Critical Kenwood KK
Publication of CN1890710A publication Critical patent/CN1890710A/zh
Application granted granted Critical
Publication of CN1890710B publication Critical patent/CN1890710B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

语言分析部(2)对语音输入部(1)输入的语音进行语音识别,确定具有表示该语音的可能性的单词和其分数,将表示这些单词和分数的数据供给到代理处理部(6)。代理处理部(6)存储获取单词数据等的数据获取处理、判断处理、定义输入输出处理的处理项目数据,定义从一个处理向下一个处理的转移并对该转移赋予的转移常数的数据、即线路,作为整体执行表示的处理项目数据和线路的流程,从而控制属于输入输出对象设备群(5)的设备。向流程内的哪一个处理转移由处理进行位置和线路的连接关系决定的各条线路的权重系数以及单词数据的分数决定。

Description

设备控制装置、以及设备控制方法
技术领域
本发明涉及设备控制装置、语音识别装置、代理装置、数据结构以及设备控制方法。
背景技术
近年来,利用语音识别技术识别语音,响应识别结果从而控制电气设备等的方法被采用。具体地说,该方法识别表示输入的语音的单词,并判断该识别的单词与规定的关键词是否一致,根据判断结果控制外部的设备(例如,参照专利文献1)。
专利文献1:特开平8-339288号公报
发明内容
但是,完全识别出由人类的语音形态所发出的指示是困难的。为此,在上述方法中,存在不能适当地响应人类用语音的形态所发出的指示的情况。
本发明是鉴于上述问题提出的,目的在于提供一种可以正确地响应人类用语音的形态所发出的指示的设备控制装置、语音识别装置、代理装置、数据结构以及设备控制方法。
为了达到上述目的,本发明的第1技术方案的设备控制装置的特征在于,具备:
输入信息识别机构(2),识别输入的输入信息;
处理项目数据存储机构(D4),存储有多个执行与由输入信息识别机构(2)识别的识别信息对应的处理的处理项目;
转移定义数据存储机构(D5),存储有多个定义从多个处理项目中的一个处理项目向其它处理项目的转移的转移定义数据;
上述各个转移定义数据分别具有对应于输入信息的条件,
至少从上述识别信息和各个转移定义数据的条件中选择一个转移定义数据,并将状态转移到由被选择的转移定义数据指定的处理项目。
也可以是,上述识别信息具有输入信息和比较对象信息的似然度(分数);
上述一个转移定义数据的选择是使用上述似然度(分数)进行的。
可以在从规定的处理项目跳转到没有被转移定义数据定义转移的处理项目或转移定义数据时,生成对于从该规定的处理项目跳转到的处理项目或转移定义数据的转移定义数据。
也可以是,上述输入信息是语音信号,
上述转移定义数据的条件是与该转移定义数据相关联的单词。
也可以将上述转移定义数据的条件设定为多个。
本发明的第2技术方案的设备控制装置,是存储有定义了从执行对应于输入信息的处理的处理项目中的一个处理项目向其它处理项目的转移的转移定义数据、根据输入信息而选择一个转移定义数据、将状态转移到由被选择的一个转移定义数据指定的处理项目的设备控制装置(6),其特征在于:
上述转移定义数据具有:
与输入信息对应的条件、
与上述条件对应的权重系数、
和作为用来计算上述权重系数的基准、对该转移定义数据分别设定的常数;
与状态转移的一个处理项目相连的其它处理项目的转移定义数据的权重系数是将从一个处理项目的转移定义数据的上述常数到其它处理项目的转移定义数据的常数累积而计算的。
本发明的第3技术方案的设备控制装置的特征在于,具备:
输入信息识别机构(2),识别输入的输入信息;
处理项目数据存储机构(D4),存储有执行与由输入信息识别机构(2)识别的识别信息对应的处理的处理项目;
转移定义数据存储机构(D5),存储有多个定义从多个处理项目中的一个处理项目向其它处理项目的转移的转移定义数据;
上述各个转移定义数据具有对应于输入信息的条件和与上述条件对应的权重系数,
上述识别信息具有表示上述输入信息与上述转移定义数据所具有的条件的一致状态的似然度(分数),
使上述权重系数与对应于上述转移定义数据的条件的似然度(分数)相对应,得到对于各个转移定义数据的条件的判断结果,
根据上述判断结果选择一个转移定义数据,将状态转移到由被选择的转移定义数据指定的处理项目。
可以在从规定的处理项目跳转到没有由转移定义数据定义转移的处理项目或转移定义数据时,生成对于从该规定的处理项目跳转到的处理项目或转移定义数据的转移定义数据。
也可以是,作为上述权重系数的计算基准的转移常数对应于上述转移定义数据而设定为常数,
与状态转移的一个处理项目相连的其它处理项目的转移定义数据的权重系数是将从一个处理项目的转移定义数据的上述常数到其它处理项目的转移定义数据的常数累积而计算的。
也可以是,上述转移常数以选择了该转移常数的转移定义数据为条件而变化。
也可以是,即使在状态转移到一个处理项目的情况下,规定处理项目的转移定义数据的权重系数也设定得高于规定的值。
也可以是,上述输入信息是语音信号,
上述转移定义数据的条件是进行语音识别的对象的单词。
也可以是,上述条件对一个转移定义数据设定多个。
本发明的第4技术方案的设备控制装置的特征在于,
具备处理项目数据存储机构(D4),存储有多个执行对应于由识别输入信息得到的识别信息的处理的处理项目;
由转移定义数据定义从多个处理项目中的一个处理项目向其它处理项目的转移,
通过根据与所需的处理项目的联系追加或消除上述转移定义数据,生成处理项目的流程图。
也可以是,上述处理项目数据存储机构(D4)构成为可以适当地追加处理项目。
也可以是,上述转移定义数据分别具有对应于输入信息的条件。
也可以是,上述识别信息具有表示输入信息和上述转移定义数据的条件的一致状态的似然度(分数),
对应于上述转移定义数据的条件的上述似然度(分数)设定在上述转移定义数据中。
也可以是,上述输入信息是语音信号,
上述转移定义数据的条件是进行语音识别的对象单词,
上述识别信息具有表示语音信号与上述转移定义数据的对象单词的一致状态的似然度(分数),
对应于上述转移定义数据的对象单词的上述似然度(分数)设定在上述转移定义数据中,
根据上述似然度(分数)选择一个上述转移定义数据,并使状态转移到由被选择的一个转移定义数据表示的处理项目。
也可以是,上述转移定义数据具有对应于输入信息的条件、
和对应于上述条件的权重系数。
也可以是,作为上述权重系数的计算基准的转移常数对应于上述转移定义数据而设定为常数,
与状态转移的一个处理项目相连的其它处理项目的转移定义数据的权重系数是将从一个处理项目的转移定义数据的上述常数到其它处理项目的转移定义数据的常数累积而计算的。
本发明的第5语音识别装置的特征在于,具备:
输入信息识别机构(2),识别输入的输入信息;
处理项目数据存储机构(D4),存储有多个执行与由输入信息识别机构(2)识别的识别信息对应的处理的处理项目;
转移定义数据存储机构(D5),存储有多个定义从多个处理项目中的一个处理项目向其它处理项目的转移的转移定义数据;
上述各个转移定义数据分别具有对应于输入信息的条件,
至少从上述识别信息和各个转移定义数据的条件中选择一个转移定义数据,并将状态转移到由被选择的转移定义数据指定的处理项目。
本发明的第6语音识别装置的特征在于,
具备设备控制装置(6),存储定义从执行对应于输入信息的处理的处理项目中的一个处理项目向其它处理项目的转移的转移定义数据,根据输入信息选择一个转移定义数据,并将状态转移到由被选择的一个转移定义数据指定的处理项目;
上述转移定义数据具有:
对应于输入信息的条件、
对应于上述条件的权重系数、
和作为用来计算上述权重系数的基准、分别对该转移数据设定的常数;
与状态转移的一个处理项目相连的其它处理项目的转移定义数据的权重系数是将从一个处理项目的转移定义数据的上述常数到其它处理项目的转移定义数据的常数累积而计算的。
本发明的第7技术方案的语音识别装置的特征在于,具备:
输入信息识别机构(2),识别输入的输入信息;
处理项目数据存储机构(D4),存储有多个执行与由输入信息识别机构(2)识别的识别信息对应的处理的处理项目;
转移定义数据存储机构(D5),存储有多个定义从多个处理项目中的一个处理项目向其它处理项目的转移的转移定义数据;
上述各个转移定义数据分别具有对应于输入信息的条件和与上述条件对应的权重系数,
上述识别信息具有表示上述输入信息和上述转移定义数据所具有的条件的一致状态的似然度(分数),
使上述权重系数与对应于上述转移定义数据的条件的似然度(分数)相对应,并得到对于各个转移定义数据的条件的判断结果,
根据上述判断结果选择一个转移定义数据,将状态转移到由被选择的转移定义数据指定的处理项目。
本发明的第8技术方案的语音识别装置的特征在于,
具备处理项目数据存储机构(D4),存储有多个执行对应于由识别输入信息得到的识别信息的处理的处理项目,
由转移定义数据定义从多个处理项目中的一个处理项目向其它处理项目的转移,
通过根据与所需的处理项目的联系追加或消除上述转移定义数据,生成处理项目的流程图。
本发明的第9技术方案的代理装置的特征在于,具备:
输入信息识别机构(2),识别输入的输入信息;
处理项目数据存储机构(D4),存储有多个执行与由输入信息识别机构(2)识别的识别信息对应的处理的处理项目;
转移定义数据存储机构(D5),存储有多个定义从多个处理项目中的一个处理项目向其它处理项目的转移的转移定义数据;
上述各个转移定义数据分别具有对应于输入信息的条件,
至少从上述识别信息和各个转移定义数据的条件中选择一个转移定义数据,并将状态转移到由被选择的转移定义数据指定的处理项目。
本发明的第10技术方案的代理装置的特征在于,
具备设备控制装置(6),存储有定义从执行对应于输入信息的处理的处理项目中的一个处理项目向其它处理项目的转移的转移定义数据,根据输入信息选择一个转移定义数据,并将状态转移到由被选择的一个转移定义数据指定的处理项目;
上述转移定义数据具有:
对应于输入信息的条件、
对应于上述条件的权重系数、
和作为用来计算上述权重系数的基准、分别对该转移数据设定的常数;
与状态转移的一个处理项目相连的其它处理项目的转移定义数据的权重系数是将从一个处理项目的转移定义数据的上述常数到其它处理项目的转移定义数据的常数累积而计算的。
本发明的第11技术方案的代理装置的特征在于,具备:
输入信息识别机构(2),识别输入的输入信息;
处理项目数据存储机构(D4),存储有多个执行与由输入信息识别机构(2)识别的识别信息对应的处理的处理项目;
转移定义数据存储机构(D5),存储有多个定义从多个处理项目中的一个处理项目向其它处理项目的转移的转移定义数据;
上述各个转移定义数据分别具有对应于输入信息的条件和与上述条件对应的权重系数,
上述识别信息具有表示上述输入信息和上述转移定义数据所具有的条件的一致状态的似然度(分数),
使上述权重系数与对应于上述转移定义数据的条件的似然度(分数)相对应,并得到对于各个转移定义数据的条件的判断结果,
根据上述判断结果选择一个转移定义数据,将状态转移到由被选择的转移定义数据指定的处理项目。
本发明的第12技术方案的代理装置的特征在于,
具备处理项目数据存储机构(D4),存储有多个执行对应于通过识别输入信息得到识别信息的处理的处理项目,
由转移定义数据定义从多个处理项目中的一个处理项目向其它处理项目的转移,
通过根据与所需的处理项目的联系追加或消除上述转移定义数据,生成处理项目的流程图。
本发明的第13技术方案的数据结构,是定义从执行对应于输入信息的处理的处理项目中的一个向其它处理项目的转移的转移定义数据的数据结构,其特征在于,
上述转移定义数据具有:
对应于输入信息的条件、
和对应于上述条件的权重系数;
作为上述权重系数的计算基准的转移常数对应于转移定义数据而设定为常数,
与状态转移的一个处理项目相连的其它处理项目的转移定义数据的权重系数是将从一个处理项目的转移定义数据的上述常数到其它处理项目的转移定义数据的常数累积而计算的。
也可以是,上述输入信息是语音信息,
对应于上述输入信息的条件是进行语音识别的对象单词。
本发明的第14技术方案的设备控制方法,是存储有多个执行对应于由输入信息识别机构(2)识别的识别信息的处理的处理项目、并存储有多个定义从多个处理项目中的一个处理项目向其它的处理项目的转移的转移定义数据的设备(2,6)的设备控制方法,其特征在于,具有:
输入信息识别步骤,识别输入的输入信息;
至少从由上述输入信息识别步骤识别的识别信息和对应于上述转移定义数据设定的条件中选择一个转移定义数据的步骤;
将状态转移到由被选择的定义数据指定的处理项目的步骤。
本发明的第15技术方案的设备控制方法的特征在于,具有:
识别输入的输入信息的输入信息识别步骤;
根据由上述输入信息识别步骤识别的识别信息,确定表示与定义从多个处理项目中的一个处理项目向其它处理项目转移的转移定义数据对应的条件和上述输入信息的一致状态的似然度(分数)的步骤;
通过使对应于上述转移定义数据的权重系数与上述似然度(分数)对应而得到判断结果的步骤;
根据上述判断结果选择一个转移定义数据的步骤;
将状态转移到由被选择的转移定义数据指定的处理项目的步骤。
本发明的第16技术方案的设备控制方法的特征在于,具有:
存储多个执行与输入信息对应的处理的处理项目的处理项目数据存储步骤;
由转移定义数据定义从多个处理项目中的一个处理项目向其它的处理项目的转移,根据与所需的处理项目的联系追加或消除上述转移定义数据,来生成处理项目的流程图的步骤。
根据本发明,可以实现能够正确地响应人类以语言的形式所发出的指示来控制设备的设备控制装置、语音识别装置、代理装置、数据结构以及设备控制方法。
附图说明
图1是表示本发明实施方式的车内空调系统的图。
图2是该实施方式的车内空调系统的更详细的结构图。
图3是示意性地表示分组用标志的具体例子的图。
图4是用于说明触发获取处理的图。
图5是用于说明判断处理的图。
图6是用于说明带询问的判断处理的图。
图7是用于说明输入输出处理的图。
图8是表示线路的图。
图9是表示处理项目数据库和线路数据库整体所表示的流程的图。
图10是用于说明权重系数的设定的图。
图11是用于说明代理处理部的动作的流程图。
标号说明
1语音输入部
2语言分析部
3语音合成处理部
4语音输出部
5输入输出对象设备群
51空调装置
52窗开闭控制装置
6代理处理部
具体实施方式
下面,参照附图,以设置在车辆内的车内空调系统为例说明本发明的实施方式。还有,在本发明中,可以使车内空调系统具有作为对应于输入信息进行使状态转移的处理的代理装置的功能。此外,车内空调系统的一部分具有作为语音识别装置的功能。
图1是表示该车内空调系统的结构的方框图。如图所示,该车内空调系统由语音输入部1、语言分析部2、语音合成处理部3、语音输出部4、输入输出对象设备群5以及代理处理部6构成。
语音输入部1输入语音,由输入的语音生成数字形式的语音数据,并将该语音数据供给语言分析部2。具体地说,如图2所示,语音输入部1例如由麦克风11、AF(Audio Frequency)放大器12、内置采样保持电路的A/D(Analog-to-Digital)转换器13等构成。麦克风11将语音变换为语音信号并输出。AF放大器12对来自麦克风11的语音信号进行放大并输出。A/D转换器13通过对由AF放大器12放大后的语音信号进行采样、并进行A/D转换,生成数字语音数据,供给语言分析部2。
如图2所示,语言分析部2和语音合成处理部3以及代理处理部6分别由例如由CPU(Central Processing Unit)等构成的处理器21、31、61,对这些处理器21、31、61执行的程序进行存储的硬盘装置等的非易失性存储器22、32、62,具有成为处理器的工作区的存储区域的RAM(Random Access Memory)等的易失性存储器23、33、63构成。
此外也可以由一个处理器和一个非易失性存储器以及一个易失性存储器构成语言分析部2、语音合成处理部3以及代理处理部6的一部分或全部功能。
语言分析部2对由语音输入部1供给的语音数据进行语音识别处理。
语言分析部2通过语音识别处理,确定语音数据表示的单词备选以及该备选的似然度(分数)S。分数S的值低于规定值的单词不作为备选选择。语音识别的方法是任意的,此外,也可以确定多个备选。并且,生成表示确定的备选以及该备选的分数S的数据(下面,称为单词数据),并供给代理处理部6。还有,单词数据虽然也可以作为单词信息数据和含有分数S的数据,但是实际上,含有单词ID和分数S的数据在数据的处理方面是有利的。
语音合成处理部3的非易失性存储器32对存储表示单词波形的数据的音带数据库D1以及存储表示用于构成音素波形的数据的单元(素片)数据库D2进行存储。
音带数据库D1存储表示单词波形的数据。单元数据库D2存储表示构成音素波形的数据。语音合成处理部3使用存储在音带数据库D1和/或单元数据库D2中的数据,生成表示读取由代理处理部6供给的文章数据的语音的数字语音数据。
语音合成部3将生成的语音数据供给语音输出部4。
生成数字语音数据的方法是任意的,例如可以使用录音编辑方式和规则合成方式(Rule-based synthesis)。此外,录音编辑方式是例如预先让播音员读取单词单位的语音,对其进行对接并输出的方式。此外,规则合成方式是对音韵(子/音或母音)和假名这种较小的单位进行对接并输出的方式。
语音输出部4对由语音合成处理部3供给的数字语音数据表示的语音进行再生。更详细地说,如图2所示,语音输出部4包括D/A(Digital-to-Analog)转换器41、AF放大器42以及话筒43。
D/A转换器41对由语音合成处理部3供给的数字语音数据进行D/A转换,并变换为模拟语音信号。AF放大器42对模拟语音信号进行放大。话筒43根据模拟语音信号振动,并对模拟音频数据表示的音频进行再生、放出声音。
输入输出对象设备群5,例如由空调装置51和窗开闭控制部52等构成。
空调装置51根据供给本身的控制信号,进行冷气、暖气或送风的动作。此外,空调51,作为表示本身动作状态的数据,例如,生成并输出表示本身是在冷气动作中、暖气动作中、向设定温度的温度调整中、送风动作中以及停止中的哪一个状态的数据。此外,空调51作为表示设定状态的数据,例如生成并输出表示当前设定温度的数据。
窗开闭控制部52由电动机、根据控制信号控制电动机的旋转以及停止的控制电路以及用于根据电动机的旋转使窗框动作的铰链等构成,根据供给自身的控制信号,进行窗的开闭。此外,窗开闭控制部52的控制电路,作为表示窗开闭控制部52的动作状态的数据,生成并输出例如表示开闭对象的窗的打开量的数据。
代理处理部6的非易失性存储器62存储单词数据库D3。单词数据库D3相互对应地存储多个单词数据以及一个以上的用于表示多个单词的分组的单词分组用的标志。
与一个单词对应提供的各个标志对应互不相同的概念。并且,在标志表示规定值(下面,该值是“1”)的情况下,与该标志对应的单词表示在与该标志对应的概念下被分组。另一方面,在该标志表示其它值(例如为“0”)的情况下,该单词表示在该概念下没有分组。
图3是示意性地表示分组用标志的具体例子的图。
在图3的例子中,单词“上升”、“热”以及“打开”每个对应四位的单词分组用标志。
四位位群的最上位(MSB)的标志对应“温度”的概念。从上位开始第二位的标志对应“空调的操作”的概念。从上位开始第三位的标志对应“窗的开闭”的概念。最下位的标志对应“故障”的概念。另一方面,如图所示,与单词“上升”对应的四位的标志群的值是二进制数“1110”,与单词“热”对应的标志群的值是二进制数“1100”,与单词“打开”对应的标志群的值是二进制数“1010”。
此种情况下,表示该标志群在概念“温度”下将单词“上升”、“热”以及“打开”分组,在概念“空调的操作”下将单词“上升”以及“热”分组,在概念“窗的开闭”下将单词“热”以及“打开”分组,在概念“故障”的概念下没有将单词“上升”、“热”或“打开”值的任何一个分组。当然,如果增加位数,可以表示与多个概念的关系。
还有,各个单词以及各个概念作为存储在处理项目数据库D4中的各个处理项目的“判断条件”使用。
代理处理部6的非易失性存储器还存储处理项目数据库D4和导线路数据库D5。
处理项目数据库D4是存储了将代理处理部6进行的触发获取处理(TGxx)、判断处理(CNxx或QBxx)以及输入输出处理(后述的EXxx)的内容记述为每个处理项目(点)的数据(处理项目数据)的数据库。此外,“xx”是识别序号。
存储在处理项目数据库D4中的处理项目中,描述“触发获取处理(TGxx)”的内容的数据含有确定使这些处理开始的触发的触发数据(指定作为触发获取的数据内容的数据)以及后述进行方向决定用的转移常数(由于是表示在该进行方向转移程度的数据,成为后述的权重系数J的计算标准的常数)。
触发数据是任意的,例如,是表示空调装置处于冷气动作中、暖气动作中、温度调整中、送风动作中以及停止中的哪一个状态的数据、或表示窗打开量的数据、或表示室内温度的数据、或由语言分析部2供给的上述的单词数据。或者,触发数据也可以是由代理处理部6本身进行的处理提交的数据。此外,在触发数据(由触发获取处理取得的数据)是单词数据的情况下,也可以是表示分配给该单词数据表示的单词所属的分组的“概念”的数据。但是,如后所述,触发获取处理的内容描述为使得多个触发获取处理不获取表示相互相同的单词的单词数据。
在图4(a)中表示触发获取处理TGxx的例子。在该例子中,触发器TG01是取得作为触发器的概念“热”(识别分组在单词“热”中的单词(图3的例子中识别单词“温度”或“空调操作”)的处理,用于决定是否前进(转移)到该处理后续的处理的转移常数k是0.8。图4(b)表示触发获取处理TG01的流程图。
触发获取处理TG02是获取单词“打开”的处理。触发获取处理TG03是取得属于与概念“温度”对应的分组的单词(图3中,取得“上升”、“热”、“打开”中的任何一个)的处理。TG04是获取属于与概念“空调操作的处理”动作对应的分组的单词(在图3中,取得“上升”、“热”中的任何一个)的处理。
描述存储在处理项目数据库D4中的“判断处理(CNxx)的内容的数据含有判断条件、作为判断结果得到的结果列表、后述的返回方向的转移常数k、对不同判断处理描述的数据。描述判断处理内容的数据含有用于决定进行方向的转移常数k、在每个判断结果中描述的数据。
图5(a)表示判断处理CNxx的例子。在该例子中,判断处理CN01是判断“窗是否已打开的处理”,在判断为打开时,用于决定是否前进到后续的处理的转移常数k为0.3,在判断为没有打开时,用于决定是否前进到其后续处理的转移常数k为0.4。在图5(b)中表示该例子的流程图。在图5(b)中示出的节点CN01.1是表示处理开始点的起点节点,节点CN01.2是判断窗关闭时的进行方向的节点,该转移常数k是0.4。而且,节点CN01.3是判断窗打开时的进行方向的节点,该转移常数k是0.3。此外,判断处理CN02是判断空调装置51的状态是否为打开(动作中)的处理,在判断为动作中时,用于决定是否前进到后续处理的转移常数k是0.5,在判断为停止(没有在动作中)时的转移常数k是0.3。
“判断处理”也可以是从任意的获取源获取判断时使用的数据的情况。作为获取源,例如考虑语言分析部2、代理处理部6进行的其它处理、属于输入输出对象设备群5的设备、其它外部设备等。并且,该情况下,描述判断处理内容的数据,只要还含有例如对判断中使用的数据的取得源进行指定的数据就可以。
此外,“判断处理”也可以使得在判断前先将规定的数据输出到规定的输出目的地(此种情况下,使表示处理的记号为例如QBxx)。例如,可以考虑在判断之前将表示规定询问的数据提交给语音合成处理部3等。在判断处理中在判断规定的数据之前输出规定的数据的情况下,描述判断处理内容的数据含有例如输出数据的内容、和指定该数据的输出目的地的数据。
图6(a)表示判断处理QBxx的例子。在该例子中,例如,判断处理QB01向使用者提问“打开窗?还是打开空调装置?”,其回答(使用者的回答)是“打开空调装置”时进行方向的转移常数k是0.7,是“打开窗”时进行方向的转移常数k是0.4。该例子的流程图在图6(b)中示出。图6(b)中示出的节点QB01.1表示处理的开始点的起点节点,节点QB01.2是判断为对应于提问指定了打开“空调装置”时的进行方向的节点,其转移常数k是0.7。而且,节点QB01.3是判断为指定了打开窗时的进行方向的节点,其转移常数k是0.4。此外,判断处理QB02向使用者提问“关闭窗吗?”,当其回答(使用者的回答)是关闭时的进行方向的转移常数k是0.5,是“不关闭”时的进行方向的转移常数k是0.3。
描述存储在处理项目数据库D4中的“输入输出处理”的内容的数据由指定输入或输出数据的内容的数据构成。输入数据和输出数据可以具有任意的内容。例如,输出数据可以是表示通过语音合成处理部3在语音输出部4中发生的语音的读取的数据和控制外部设备的控制信号。此外,输入数据也可以是例如由外部设备供给的数据。
图7(a)表示输出处理EXxx的例子。在该例子中,例如,输出处理EX01是“关闭窗且使空调装置动作”的动作,进行动作后的处理的进行方向的转移常数k是0.8。该例子的流程图在图7(b)中示出。图7(b)中示出的节点EX01.1是表示处理开始点的起点节点,节点EX01.2是表示处理结束的节点,转移常数k是0.8。还有,对于输出处理Exxx,也可以不进行转移常数k的设定等,而是进行选择表示处理结束节点所需的处理。
线路数据库D5由描述多个处理(TG、CNxx、QBxx、EXxx)之间的转移的数据(下面,称该转移定义数据为线路(wire))的集合构成。线路由例如图8所示的书写形式描述的数据构成。线路Wn(W1、W2...)如图所示,是对于从先进行的处理X(From(X))到后续的处理Y(To(Y))的转移(From(X)To(Y))指定该先进行的处理(X)、该后续处理(Y)、以及对该转移赋予的权重系数J的数据。此外,在先进行的处理X是判断处理的情况下,需要描述是来自该判断处理的哪一个判断结果的转移。
此外,转移源处理X和转移目的地Y分别由各个处理的节点号确定。各个线路的权重系数J不是固定值,是对应于处理的进行而适宜地计算、设定的。线路的权重系数J的计算参照图9在后面描述。
执行处理项目数据库D4和线路数据库D5整体表示的流程。例如,根据图3~图7的例子,处理项目数据库D4和线路数据库D5可以作为整体描述图9中示出的流程。
在图9示出的流程中,代理处理部6在触发处理步骤TG01中,等待由语言分析部2供给表示“热”单词的单词数据。如果被供给了表示“热”的单词的单词数据,则取得该数据,如果判断输入的语音为“热”,则提交给判断处理步骤CN01(线路W1)。这里,通过表示“热”的单词的单词数据的分数S和前述的权重系数J可以提高语音识别的判断结果,这将在后面描述。
代理处理部6在判断处理步骤CN01中,由窗开闭控制部52获取表示窗是否已打开的信息,当判断为已打开时将处理转移到输入输出处理步骤EX01(线路W2),在输入输出处理EX01中,将指示将窗关闭的控制信号输出到窗开闭控制部52,将指示开始冷气动作的控制信号输出到空调装置51。结果,窗开闭控制部52将窗关闭,空调装置51开始冷气动作。
另一方面,在判断处理步骤CN01中,当判断为窗已关闭时,将处理转移到含有询问的判断处理QB01(线路W3)。在判断处理步骤QB01中,代理处理部6首先将表示“打开窗还是使空调装置工作”的文本的数据供给到语音合成处理部3。语音合成处理部3通过语音输出部4,再生出朗读该文章的语音。
在判断处理步骤QB01中,代理处理部6接下来等待从语言分析部2供给表示单词“窗”或单词“空调装置”的单词数据,当被供给了对应的单词数据时,判断该单词数据表示单词“窗”或单词“空调装置”中的哪一个。并且,当判断为表示单词“窗”时,将处理转移到输入输出处理步骤EX03(线路W5),当判断为表示单词“空调装置”时,将处理转移到输入输出处理步骤EX02(线路W6)。
代理处理部6在输入输出处理步骤EX02中将指示开始冷气的控制信号输出到空调装置51。另一方面,代理处理部6在输入输出处理步骤EX03中将指示打开换气用窗的控制信号输出到窗开闭控制部52。
另一方面,代理处理部6等待由语言分析部2供给表示“打开窗”的单词的单词数据(触发处理步骤TG02),如果被供给了表示“打开窗”的单词的单词数据、并判断输入的语音是“打开窗”的单词时,将处理转移到输入输出处理步骤EX03(线路W4)。
在例如语言分析部2供给了多个单词数据等情况下,代理处理部6并行进行多个判断处理。此外,在该情况下,在有多个以同一单词为输入对象的处理(例如,触发获取处理和判断处理中的数据输入)、表示对应的单词的单词数据由语言分析部2提供的情况下,代理处理部6并行进行所有这些处理。此时,可以如前所述那样使用表示单词数据的分数S和权重系数J进行对所输入的单词是哪一种的最终的判断,这在后面描述。
接下来,说明计算各个线路的权重系数J的方法。
在多个处理由线路W连接的情况下,被关注的线路W的权重系数J是通过将以现在处理中的处理为起点、到被关注的线路W为止的转移的路径上的进行方向决定用的转移常数k依次相乘而求出的。
为了容易理解,假设为在图10(a)中表示的流程的处理。
在该例子中,由线路W51定义执行先进行的第一处理(在该例子中是触发获取处理TGxx)后转移到后续的第二处理(在该例子中是判断处理CNxx),此外,由线路52定义执行第二处理后转移到后续的第三处理(在该例子中是QBxx),还有,由线路53定义执行第三处理后转移到后续的处理。
还有,假设在第一~第三处理的任何一个中,各进行方向决定用的任何一个转移常数k都是0.5。
此种情况下,线路是例如如图10(b)所示那样定义的。
例如,当代理处理部6的处理(或控制)到达第一处理时,代理处理部6通过以第一处理为起点、沿着转移路径依次将进行方向的转移常数k相乘,计算线路W51~W55(在存在未图示的线路的情况下首先含有这些线路)的各自的权重系数J,对应于线路W51~W55将计算结果写入到线路数据库DB5中。
具体地说,在到达第一处理时,例如,线路51的权重系数J是分配给第一处理与第二处理连接的节点的转移常数k的值,即0.5。第二处理的线路W52的权重系数J是第一处理的线路W51的转移常数k=0.5与连接第二处理的线路W52的节点的转移常数k=0.5相乘的结果,即为0.25。
线路W53的权重系数J是第一处理的线路W51的转移常数k=0.5与第二处理的线路W52的转移常数k=0.5相乘的结果再与第三处理的线路W53的转移常数k=0.5相乘的结果,即为0.125。
如此,计算以处理中的处理为基点时的各个线路的权重系数J。所以,如果当前的状态转移,则以当前的处理为基点每次计算各个线路的权重系数J。
具体地说,当当前的状态转移到第二处理时,线路W54的权重系数J是与第二处理的线路W52的转移常数k相等的值0.5,线路W55的权重系数J是第二处理的线路W52的转移常数k=0.5与第三处理的线路W55的转移常数k=0.5的积,即0.25。此时,代理处理部6也计算反方向、即返回第一处理的方向的线路W51的权重系数J并写入到数据库中。在转移到第二处理后的情况下,当设返回到线路W51的方向的转移常数k为0.1时,0.1就是线路W51的权重系数J。在转移到第三处理后的情况下,再使返回线路W52的方向的转移常数k=0.1为线路W52的权重系数J。并且,在转移到第三处理后的状态下,线路W51的权重系数J为转移到第三处理状态的线路W52的权重系数J(=转移常数k)0.1与返回第二处理的方向的转移常数k=0.1相乘的值,即为0.01。
在图10(c)中示出了各个线路Wn的权重系数J的变化。
权重系数J的计算不是仅对相关的流程的处理、而是对全部流程的全部线路进行的,对各个线路设定计算出的权重系数。这里,对于与当前的处理不相关的线路,只要分配预先设定的低的计数值就可以。但是,特别是对于以触发获取处理为先进行的处理的线路,将转移常数k设定得稍高。由此,可以转移到与前面描述的内容明显不同的内容的说明。
还有,分别设定各个线路的条件。具体地说,在W01设定单词“热”为条件,在W05设定单词“窗”为条件。并且,当由语言分析部2供给单词数据时,在该单词数据表示单词“热”的情况下,对W01设定表示该单词数据的分数S。此外,在由语言分析部2供给的单词数据表示单词“窗”的情况下,对W05设定表示该单词数据的分数S。
进而,对各个线路设定的条件,不局限于设定单个单词的情况。例如,也可以将表示同样意思的多个单词设定为条件。该条件的设定只要存储有这些单词与线路的关系就可以,作为分数计算对象的单词存储在上述单词数据库中。
例如,在进行语音识别的情况下,对于所输入的语音,语言分析部2对单词数据库中登录的全部单词进行分数S的计算,生成单词数据,并将单词数据输出到代理处理部6。接下来,代理处理部6判断输入的各个单词数据与哪一条线路关联,将表示单词数据的分数S设定给相关联的线路。这样,即使在对多条线路将相同的单词设定为条件的情况下,输入的语音信号与单词分数S的计算也只要有一次就够了。并且,将得到的各个单词的分数S分别设定给相关联的线路。还有,虽然产生了对一条线路得到多个分数S的情况,但在该情况下,只要选择例如最高值的分数S就可以。
由此,例如,如果对一条线路分别设定了“是”、“好”、“没错”等表示同一意思的单词数据,则不论用户通过“是”、“好”、“没错”的哪一个语音输出指示,作为语音识别的分数S都能够得到适合的结果。
此外,根据判断处理,存在得到来自输入输出对象设备群5的信息作为输入信息的情况。此种情况下,表示输入输出对象设备群5的各个设备的状态的数据作为状态数据库被管理(相当于上述的“单词数据库”),参照状态数据库决定输入信息是表示哪个设备的哪个状态,将其和分数S作为状态数据输出到代理处理部6。还有,与语音识别的情况不同的是,如果对应的状态在状态数据库中,则分数S必会是100%。并且,代理处理部6判断与表示状态数据的状态相关的线路,并对各个线路设定分数S。
接下来,参照图11说明这样构成的系统整体的动作。
语音输入部1和语言分析部2独自动作,获取、分析语音,并将单词数据提供给代理处理部6。
并且,当由语言分析部2提供了有关判断条件的(一个或多个)单词数据时,代理处理部6进行下面的处理。
认识(识别)供给的单词(步骤S11),判断其是否对应于登录在单词数据库DB4中的单词(步骤S12)。如果没有登录(步骤S12,否),则结束单词输入处理。
另一方面,如果已经登录(步骤S12,是),则根据该单词或该单词所属的分组的“概念”成为条件的处理,计算单词的似然度S和线路的权重系数J的积S·J(步骤S13)。
例如,在执行图10(a)表示的流程的情况下,假设处理指针PP指示第一处理。该情况下的各个线路的权重系数J是如图10(c)中图示那样的。
在该情况下,假设输入了表示分数S为80%的单词“热”和分数S为50%的单词“窗”的单词数据。
在图10(a)和图10(b)中表示的例子中,在第一处理中,单词“热”与判断条件相关,在第三处理中,单词“窗”与判断条件相关。
如图10(c-1)所示,以输入表示单词“热”的单词数据的处理为先进行的处理的线路W51的权重系数J为0.5,以输入表示单词“窗”的单词数据的处理为先进行的处理的线路W53的权重系数J为0.125。此种情况下,对线路W51和W53求出的似然度S和权重系数J的积S·J如计算式1和2所示。
(计算式1)对于线路W51的积S·J:“热”的分数S(=80%)×线路W51的权重系数J(=0.5)=40
(计算式2)对于线路W53的积S·J:“窗”的分数S(=50%)×线路W53的权重系数J(=0.125)=6.25
代理处理部6对流程所具有的所有的线路进行求出分数S和权重系数J的积的S·J的上述处理。
接下来,代理处理部6选择计算出的S·J的值最大的线路(图11的步骤S14)。代理处理部6将控制前进到后接所选择的线路的处理(步骤S15)。例如,在对线路W51求出的积S·J表示最高值的情况下,识别出所输入的单词数据表示单词“热”,并转移到线路W51后续的处理即第二处理。通常,如果以正在执行中的处理为起点,则线路的权重系数J较大。因此,一般转移到接下来的处理,但在输入了与从前完全不同的单词且似然度S高的数据的情况下,开始与该单词对应的处理。
当转移处理时,代理处理部6根据转移后的状态,再一次计算各个线路的权重系数J(步骤S16)。
以后,根据其处理的内容进行处理(步骤S17)。在该例子中,进行第二处理。即,代理处理部6从窗开闭控制部52获取窗的开闭信息,根据获取的信息求出对于线路W52的似然度S和权重系数J的积S·J,求出对于线路W54的似然度S和权重系数J的积S·J,选择某一个线路,执行后接于所选择的线路的处理。
还有,来自窗开闭控制部52的表示窗开闭的信号也可以是,开的似然度S为100%或0%、关的似然度S为0%或100%。此外,也可以使其对应于开度而变化。并且,在处理过程中,有输入输出处理Exxx,如果代理处理部6通过执行该处理输出语音数据,则将其作为语音放出。
此外,在处理过程中,如果如输入输出处理EX01那样,执行对空调装置和窗开闭控制部52进行控制的处理,则根据其处理内容,进行对空调装置51和窗开闭控制部52的控制。
此外,在图8、图9中,虽然主要说明了根据“单词”的判断处理,但如果是根据如图11所示的概念的判断处理也同样地进行。此外,来自根据单词或概念的触发获取处理的线路也成为判断的对象。对于从触发获取处理的转移,可以设定某种高程度的转移常数k。具体地说,在例如图8的线路群、即在图9的流程中,对于从获取表示“开窗”的单词的单词数据的触发获取处理T02的转移,例如可以赋予转移常数k=0.8。由此,例如在代理处理部6的处理属于触发获取处理TG01的情况下,用户发出“开窗”的声音,例如如果得到对于单词“开窗”的分数S是90%的单词数据,则该分数S和有关“用户”是否说了“开窗”的判断的线路W5的权重系数J(=转移常数k)的积S·J为90%×0.8,即为72。如果该值是由其它线路得不到的较大的值,则识别输入的语音为“开窗”,代理处理部6的处理跳转到输入输出处理EX03的可能性变高。另一方面,如果事先将其它的线路的权重系数J设定得极低,则由这些其它的线路定义的转移发生的可能性变得极低,结果,可以沿着某种程度的假设的会话的流程提高识别率来进行控制处理。
在该实施例中,也能够引起向返回方向的转移。但是,在现实中,使会话返回大多是不优选的。因此,只要将返回方向的转移常数k设定为比进行方向的转移常数k低的值就可以。由此,即使假设从输入的语音得到了高的分数S的单词数据,也会由于对于返回方向的转移常数k作为权重系数J写入的线路求出的积S·J是较低的值,而能够将向返回方向转移的可能性抑制为较低。
此外,代理处理部6也可以进行处理,以将所求出的积S·J的值不满足规定的条件的处理(例如,积S·J的值没有达到规定值的处理)排除在执行转移的对象以外。
还有,例如,如图8所示,线路以从处理项目到处理项目的形式定义转移。并且,通过将线路存储在如图8所示的形态描述的线路数据库D5中,能够如计算机的宏处理那样定义各个处理项目的关系。由此,可以容易地连接各个处理项目。
此外,作为触发的处理项目,实际上成为对有关连接的线路的识别对象单词等(也可以有由其它输入对象设备群输入的情况)的分数S的判断,所以在线路中,触发处理项目并不被定义为线路的开始点,而是将线路本身定义为转移源。
进而,通过如上所述由线路定义各个处理项目的连接关系,可以简单地追加线路。例如,在“热”的语音输入后,在用户想要休息并输入“寻找家庭餐馆”的语音的机会较多的情况下,对家庭餐馆的检索处理项目自动地追加线路。由此,在自动地追加线路之后,通过使与家庭餐馆检索处理项目连接的线路的权重系数J某种程度地增大,可以与该输入“寻找家庭餐馆”适当地对应。(但是该情况下,假设代理处理部6存储有例如含有表示家庭餐馆位置信息的地图数据等,或者可访问外部的地图数据等。)
该线路的自动追加可以对从某个处理项目到另一个处理项目的跳转次数进行计数,在其达到规定的次数时自动地进行。
在以上说明的该车内空调系统中,只要适当地描述表示处理内容的数据和线路,则不一定需要完全地确定作为控制对象的设备或施加控制的内容,而是可以响应用户发出的语言,根据该语言推测用户的需求,适宜地判断为了满足该需求而只要对哪一台设备施加什么样的控制就可以,对设备施加基于判断结果的控制。
此外,该车内空调系统的结构也不局限于上述结构。
例如,属于输入输出对象设备群5的设备不一定需要是直接满足用户需求的结果的设备,例如,也可以由控制外部的显示装置等而对用户输出促使其采取特定的行动的消息的设备(例如液晶显示器等的显示装置)构成。
此外,单词数据库并不一定仅是表示单词的数据,也可以将表示由多个单词构成的语句的数据作为单词数据库的要素进行存储,也可以将用于构成单词的一部分或音素的数据作为单词数据库的要素进行存储。此外,单词等并不一定需要在特定概念下被分组,在进行分组的情况下,用于进行分组的数据也不一定采取标签的集合的形式。
此外,代理处理部6也可以根据在过去执行该线路表示的转移的数量等的规定的标准使对应于线路的转移常数k变化,改写线路以使得权重系数J成为根据变换后的转移常数k计算的值。
具体地说,例如,将对各个线路执行的表示该线路的转移的次数存储到线路数据库中。并且,代理处理部6通过在每次新进行该转移时改写该次数的值,对该次数的值每次增加1,将对应于各个线路的转移常数k,例如改写为与该线路中存储的次数成比例的值。
还有,在上述实施例中,对线路设定的条件虽然对于各个线路的设定进行了说明,但是并不局限于此。例如,也可以在判断处理中描述各个线路的条件。此种情况下,可以预先确定各个条件对应于哪一个线路。
此外,代理处理部6也可以使在判断处理和输入输出处理中输出的数据按照提交给这些处理的数据、伴随着这些处理输入的数据、以及其它任意的条件而变化。
此外,该车内空调系统也可以具备用于根据代理处理部6的控制输出图像的显示装置(例如,液晶显示器等),代理处理部6也可以在输入输出处理和判断处理中控制该显示装置以便在每个处理中显示规定的图像。
此外,代理处理部6也可以在一个输入处理和一个判断处理中一次获取连续发出等的多个单词数据。此外,代理处理部6也可以确定一次获取的多个单词数据在哪个概念下、是否被分组在同一个组内,仅在确定的概念与规定的概念一致的情况下,将获取的单词数据的一部分或全部用于处理。
此外,代理处理部6也可以由分担进行触发获取处理、判断处理、输入输出处理等的各种处理和线路整体形成的流程的、相互连接的多个数据处理装置(例如,计算机等)构成。此种情况下,构成代理处理部6的各个数据处理装置只要将在代理处理部6能够执行的全部流程中的表示本身有执行的可能性的部分的数据作为处理项目数据库D4和线路数据库D5的要素存储就可以。并且,如果各个数据处理装置存储的数据为对该数据处理装置执行的部分的处理进行了宏定义的数据,则也很容易使多个数据处理装置进行分散处理。
此外,该车内空调系统也可以具备多个语音输入部1和语言分析部2或语音输出部4。
此外,语音输入部1例如也可以具备记录有表示语音的数据的记录媒体(例如从软(注册商标)盘、CD(Compact Disc)、和MO(Magneto-Optical Disk)等读取波形信号并供给到语言分析部2中的记录媒体驱动装置(例如软(注册商标)盘驱动、CD-ROM驱动、MO驱动等)。
以上,对本发明的实施例进行了说明,但是该发明的设备控制装置可以不通过专用的系统、而是使用通常的计算机系统来实现。
例如,在与输入输出对象设备群5连接的个人计算机中,通过由存储有用于执行上述语音输入部1、语言分析部2、语音合成处理部3、语音输出部4以及代理处理部6的动作的程序的记录媒体安装该程序,可以构成执行上述处理的车内空调系统。并且,执行该程序的个人计算机作为与图1的车内空调系统的动作相对应的处理,例如可以执行图9所示的流程。
还有,使个人计算机进行上述车内空调系统的功能的程序例如也可以加载到通信线路的公告板(BBS)上,通过通信线路发送,此外,也可以由表示该程序的信号调制传送波,传送得到的调制波,接收到该调制波的装置解调调制波并复原该程序。并且,通过起动该程序,在OS的控制下,与其它应用程序同样地执行,可以执行上述处理。
此外,在OS分担处理的一部分的情况下,或者在OS构成本申请发明的一个构成要素的一部分的情况下,也可以在记录媒体上存储去除了该部分的程序。该情况下,在本发明中,在该记录媒体上,存储有用于执行计算机执行的各种功能或步骤的程序。
工业实用性
本发明可以用于能够适当地响应人类以语言的形式发出的指示来控制设备的各种设备控制装置等中。

Claims (20)

1.一种设备控制装置,其特征在于,具备:
输入信息识别机构(2),识别输入的输入信息;
处理项目数据存储机构(D4),存储有多个执行与由输入信息识别机构(2)识别的识别信息对应的处理的处理项目;
转移定义数据存储机构(D5),存储有多个定义从多个处理项目中的一个处理项目向其它处理项目的转移的转移定义数据;
上述各个转移定义数据分别具有对应于输入信息的条件,
至少从上述识别信息和各个转移定义数据的条件中选择一个转移定义数据,并将状态转移到由被选择的转移定义数据指定的处理项目,
从规定的处理项目跳转到没有被转移定义数据定义转移的处理项目或转移定义数据时,生成针对从该规定的处理项目跳转到的处理项目或转移定义数据的转移定义数据。
2.根据权利要求1记载的设备控制装置,其特征在于:
上述识别信息具有输入信息和比较对象信息的似然度;
上述一个转移定义数据的选择是使用上述似然度进行的。
3.根据权利要求1记载的设备控制装置,其特征在于:
上述输入信息是语音信号,
上述转移定义数据的条件是与该转移定义数据相关联的单词。
4.根据权利要求1记载的设备控制装置,其特征在于:
上述转移定义数据的条件设定为多个。
5.根据权利要求1记载的设备控制装置,其特征在于:
上述转移定义数据具有:
与输入信息对应的条件、
与上述条件对应的权重系数、
和作为用来计算上述权重系数的基准、对该转移定义数据分别设定的常数;
与状态转移的一个处理项目相连的其它处理项目的转移定义数据的权重系数是将从一个处理项目的转移定义数据的上述常数到其它处理项目的转移定义数据的常数累积而计算的。
6.一种设备控制装置,其特征在于,具备:
输入信息识别机构(2),识别输入的输入信息;
处理项目数据存储机构(D4),存储有执行与由输入信息识别机构(2)识别的识别信息对应的处理的处理项目;
转移定义数据存储机构(D5),存储有多个定义从多个处理项目中的一个处理项目向其它处理项目的转移的转移定义数据;
上述各个转移定义数据具有对应于输入信息的条件和与上述条件对应的权重系数,
上述识别信息具有表示上述输入信息与上述转移定义数据所具有的条件的一致状态的似然度,
使上述权重系数与对应于上述转移定义数据的条件的似然度相对应,得到对于各个转移定义数据的条件的判断结果,
根据上述判断结果选择一个转移定义数据,将状态转移到由被选择的转移定义数据指定的处理项目,
在从规定的处理项目跳转到没有由转移定义数据定义转移的处理项目或转移定义数据时,生成针对从该规定的处理项目跳转到的处理项目或转移定义数据的转移定义数据。
7.根据权利要求6记载的设备控制装置,其特征在于:
作为上述权重系数的计算基准的转移常数对应于上述转移定义数据而设定为常数,
与状态转移的一个处理项目相连的其它处理项目的转移定义数据的权重系数是将从一个处理项目的转移定义数据的上述常数到其它处理项目的转移定义数据的常数累积而计算的。
8.根据权利要求7记载的设备控制装置,其特征在于:
上述转移常数以选择了该转移常数的转移定义数据为条件而变化。
9.根据权利要求6记载的设备控制装置,其特征在于:
即使在状态转移到一个处理项目的情况下,规定处理项目的转移定义数据的权重系数也设定得高于规定的值。
10.根据权利要求6记载的设备控制装置,其特征在于:
上述输入信息是语音信号,
上述转移定义数据的条件是进行语音识别的对象的单词。
11.根据权利要求6记载的设备控制装置,其特征在于:
上述条件对一个转移定义数据设定多个。
12.一种设备控制装置,其特征在于,
具备处理项目数据存储机构(D4),存储有多个执行对应于由识别输入信息得到的识别信息的处理的处理项目;
由转移定义数据定义从多个处理项目中的一个处理项目向其它处理项目的转移,
通过根据与所需的处理项目的联系追加或消除上述转移定义数据,生成处理项目的流程图,
上述处理项目数据存储机构(D4)构成为可以适当地追加处理项目。
13.根据权利要求12记载的设备控制装置,其特征在于:
上述转移定义数据分别具有对应于输入信息的条件。
14.根据权利要求13记载的设备控制装置,其特征在于:
上述识别信息具有表示输入信息和上述转移定义数据的条件的一致状态的似然度,
对应于上述转移定义数据的条件的上述似然度设定在上述转移定义数据中。
15.根据权利要求13记载的设备控制装置,其特征在于:
上述输入信息是语音信号,
上述转移定义数据的条件是进行语音识别的对象单词,
上述识别信息具有表示语音信号与上述转移定义数据的对象单词的一致状态的似然度,
对应于上述转移定义数据的对象单词的上述似然度设定在上述转移定义数据中,
根据上述似然度选择一个上述转移定义数据,并使状态转移到由被选择的一个转移定义数据表示的处理项目。
16.根据权利要求12记载的设备控制装置,其特征在于:
上述转移定义数据具有对应于输入信息的条件,和对应于上述条件的权重系数。
17.根据权利要求16记载的设备控制装置,其特征在于:
作为上述权重系数的计算基准的转移常数对应于上述转移定义数据而设定为常数,
与状态转移的一个处理项目相连的其它处理项目的转移定义数据的权重系数是将从一个处理项目的转移定义数据的上述常数到其它处理项目的转移定义数据的常数累积而计算的。
18.一种设备控制方法,是存储有多个执行对应于由输入信息识别机构(2)识别的识别信息的处理的处理项目、并存储有多个定义从多个处理项目中的一个处理项目向其它的处理项目的转移的转移定义数据的设备(2,6)的设备控制方法,其特征在于,具有:
输入信息识别步骤,识别输入的输入信息;
至少从由上述输入信息识别步骤识别的识别信息和对应于上述转移定义数据设定的条件中选择一个转移定义数据的步骤;
将状态转移到由被选择的定义数据指定的处理项目的步骤,
从规定的处理项目跳转到没有被转移定义数据定义转移的处理项目或转移定义数据时,生成对于从该规定的处理项目跳转到的处理项目或转移定义数据的转移定义数据。
19.一种设备控制方法,其特征在于,具有:
识别输入的输入信息的输入信息识别步骤;
根据由上述输入信息识别步骤识别的识别信息,确定表示与定义从多个处理项目中的一个处理项目向其它处理项目转移的转移定义数据对应的条件和上述输入信息的一致状态的似然度的步骤;
通过使对应于上述转移定义数据的权重系数与上述似然度对应而得到判断结果的步骤;
根据上述判断结果选择一个转移定义数据的步骤;
将状态转移到由被选择的转移定义数据指定的处理项目的步骤,
在从规定的处理项目跳转到没有由转移定义数据定义转移的处理项目或转移定义数据时,生成对于从该规定的处理项目跳转到的处理项目或转移定义数据的转移定义数据。
20.一种设备控制方法,其特征在于,具有:
存储多个执行与输入信息对应的处理的处理项目的处理项目数据存储步骤;
由转移定义数据定义从多个处理项目中的一个处理项目向其它的处理项目的转移,根据与所需的处理项目的联系追加或消除上述转移定义数据,来生成处理项目的流程图的步骤,
在上述处理项目数据存储步骤,可以适当地追加处理项目。
CN2004800361146A 2003-12-05 2004-12-06 设备控制装置、以及设备控制方法 Expired - Fee Related CN1890710B (zh)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
JP2003406638 2003-12-05
JP406655/2003 2003-12-05
JP2003406645 2003-12-05
JP406638/2003 2003-12-05
JP2003406671 2003-12-05
JP406640/2003 2003-12-05
JP406671/2003 2003-12-05
JP2003406655 2003-12-05
JP406645/2003 2003-12-05
JP2003406640 2003-12-05
PCT/IB2004/004001 WO2005062294A1 (ja) 2003-12-05 2004-12-06 機器制御装置、音声認識装置、エージェント装置、データ構造及び機器制御方法

Publications (2)

Publication Number Publication Date
CN1890710A CN1890710A (zh) 2007-01-03
CN1890710B true CN1890710B (zh) 2010-04-28

Family

ID=34714614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800361146A Expired - Fee Related CN1890710B (zh) 2003-12-05 2004-12-06 设备控制装置、以及设备控制方法

Country Status (5)

Country Link
US (1) US20080228492A1 (zh)
EP (1) EP1691345A4 (zh)
JP (2) JP4516918B2 (zh)
CN (1) CN1890710B (zh)
WO (1) WO2005062294A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004017496D1 (de) * 2003-12-05 2008-12-11 Kenwood Corp Einrichtungssteuereinrichtung und einrichtungssteuerverfahren
CN103329196B (zh) * 2011-05-20 2015-11-25 三菱电机株式会社 信息设备
CN103971688B (zh) * 2013-02-01 2016-05-04 腾讯科技(深圳)有限公司 一种语音数据采集服务系统及方法
WO2017141502A1 (ja) * 2016-02-18 2017-08-24 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
WO2019053864A1 (ja) * 2017-09-14 2019-03-21 株式会社ソシオネクスト 電子機器制御システム、音声出力装置及びそれらの方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020059067A1 (en) * 2000-10-11 2002-05-16 Nissan Motor Co., Ltd. Audio input device and method of controling the same
EP1020847B1 (en) * 1999-01-18 2005-12-07 Nokia Corporation Method for multistage speech recognition using confidence measures

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57118299A (en) * 1981-01-14 1982-07-23 Nissan Motor Voice load driver
US4827520A (en) * 1987-01-16 1989-05-02 Prince Corporation Voice actuated control system for use in a vehicle
JP3267395B2 (ja) * 1993-07-14 2002-03-18 株式会社東芝 階層化状態遷移モデル記述方法
JPH08339288A (ja) 1995-06-14 1996-12-24 Canon Inc 情報処理装置及びその制御方法
JP3884160B2 (ja) * 1997-11-17 2007-02-21 富士通株式会社 用語付きデータを扱うデータ処理方法,データ処理装置およびプログラム記憶媒体
JP2000181500A (ja) * 1998-12-15 2000-06-30 Equos Research Co Ltd 音声認識装置及びエ―ジェント装置
EP1092514A4 (en) * 1999-01-07 2007-05-23 Sony Corp MACHINE, ITS CONTROL METHOD AND RECORDING MEDIUM
JP2001022373A (ja) * 1999-07-02 2001-01-26 Alpine Electronics Inc 音声認識方法
JP3557373B2 (ja) * 1999-08-12 2004-08-25 シャープ株式会社 ネットワークの自動分節装置及び自動分節プログラムを記録した記録媒体
JP3842497B2 (ja) * 1999-10-22 2006-11-08 アルパイン株式会社 音声処理装置
JP2001157976A (ja) * 1999-11-30 2001-06-12 Sony Corp ロボット制御装置およびロボット制御方法、並びに記録媒体
US6956348B2 (en) * 2004-01-28 2005-10-18 Irobot Corporation Debris sensor for cleaning apparatus
JP2002149181A (ja) * 2000-11-15 2002-05-24 Sharp Corp 機器制御システム
JP4155383B2 (ja) * 2001-03-05 2008-09-24 アルパイン株式会社 音声認識機器操作装置
JP2002297185A (ja) * 2001-03-29 2002-10-11 Pioneer Electronic Corp 情報処理装置および情報処理方法
JP3731499B2 (ja) * 2001-05-25 2006-01-05 三菱電機株式会社 音声認識制御装置、及び車載用情報処理装置
JP4266552B2 (ja) * 2001-10-16 2009-05-20 日本電気株式会社 ロボット装置及びその制御方法
DE10338512A1 (de) * 2003-08-22 2005-03-17 Daimlerchrysler Ag Unterstützungsverfahren für Sprachdialoge zur Bedienung von Kraftfahrzeugfunktionen

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1020847B1 (en) * 1999-01-18 2005-12-07 Nokia Corporation Method for multistage speech recognition using confidence measures
US20020059067A1 (en) * 2000-10-11 2002-05-16 Nissan Motor Co., Ltd. Audio input device and method of controling the same

Also Published As

Publication number Publication date
WO2005062294A1 (ja) 2005-07-07
JPWO2005062294A1 (ja) 2007-07-19
JP2009288815A (ja) 2009-12-10
US20080228492A1 (en) 2008-09-18
JP4516918B2 (ja) 2010-08-04
EP1691345A1 (en) 2006-08-16
CN1890710A (zh) 2007-01-03
JP4905522B2 (ja) 2012-03-28
EP1691345A4 (en) 2008-08-13

Similar Documents

Publication Publication Date Title
CN1890708B (zh) 音频设备控制装置、音频设备控制方法及程序
Griol et al. A statistical approach to spoken dialog systems design and evaluation
EP0752129B1 (en) A method and apparatus for providing a human-machine dialog supportable by operator intervention
RU2726739C1 (ru) Способ, аппарат и устройство для обработки естественного языка
JP3729918B2 (ja) マルチモーダル対話装置及び対話方法
Fu et al. Real-time optimization model for dynamic scheduling of transit operations
CN109754778A (zh) 文本的语音合成方法、装置和计算机设备
CN101992779A (zh) 车辆中的智能音乐选择方法
UA73495C2 (en) Method and system for automatically transcribing voice information
CN107357849A (zh) 基于测试类应用的交互方法和装置
CN1906661B (zh) 设备控制装置和设备控制方法
Heitmeier et al. Modeling morphology with linear discriminative learning: Considerations and design choices
CN1890710B (zh) 设备控制装置、以及设备控制方法
JP4594885B2 (ja) 音響モデル適応装置、音響モデル適応方法、音響モデル適応プログラム及び記録媒体
Apostolopoulos et al. Complex systems and population health
US20070256435A1 (en) Air Conditioner Control Device and Air Conditioner Control Method
CN109616101A (zh) 声学模型训练方法、装置、计算机设备和可读存储介质
CN100590710C (zh) 设备控制装置及设备控制方法
Bugmann et al. Using verbal instructions for route learning: Instruction analysis
Batliner et al. A taxonomy of applications that utilize emotional awareness
Lokesh et al. Speech to speech interaction system using Multimedia Tools and Partially Observable Markov Decision Process for visually impaired students
Deng Articulatory Features and Associated Production Models Statistical Speech Recognition
US20220391246A1 (en) Information processing system, information processing method, and program
CN116168704B (zh) 语音交互的引导方法、装置、设备、介质及车辆
JPH06139227A (ja) 時系列予測装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: JVC KENWOOD CORPORATION

Free format text: FORMER OWNER: KABUSHIKI KAISHA KENWOOD;KABUSHIKI KAISHA KENWOOD

Effective date: 20140304

TR01 Transfer of patent right

Effective date of registration: 20140304

Address after: Kanagawa

Patentee after: JVC KENWOOD Corp.

Address before: Tokyo, Japan

Patentee before: Kabushiki Kaisha KENWOOD

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100428

CF01 Termination of patent right due to non-payment of annual fee