发明内容
因此,本发明是鉴于上述状况而做出的,其目的为提供一种可以将识别对象字词的增加抑制到最低限度,且使识别率得到提高的语音识别词典制作装置及信息检索装置。
为了达到上述目的,本发明所涉及的语音识别词典制作装置用来制作语音识别所使用的识别词典,其特征为具备词典制作装置,用于根据利用者经验的有无来制作多个内容不同的上述识别词典。
在此,上述经验的有无是视听经验的有无,上述词典制作装置也可以根据上述视听经验的有无来制作多个内容不同的上述识别词典。
在此,上述经验的有无是利用经验的有无,上述词典制作装置也可以根据上述利用经验的有无来制作多个内容不同的上述识别词典。
在此,上述经验的有无是访问经验的有无,上述词典制作装置也可以根据上述访问经验的有无来制作多个内容不同的上述识别词典。
据此,例如利用者以今后播送的节目或者以前观看(或录制)的节目的任一方为对象进行检索之类的、根据对象的视听经验有无制作出多个识别词典,因此可以按照目的制作使语音识别的识别率得以提高的识别词典。
另外,上述语音识别词典制作装置进一步具备:行动履历字词取得装置,用于根据利用者的行动取得行动履历字词,该行动履历字词是作为识别对象的字词;行动履历字词储存装置,用来储存所取得的上述行动履历字词;固定字词储存装置,储存有预先设定的指定的固定字词;字词提取装置,用来从所输入的数据提取新识别用字词,该新识别用字词是作为识别对象的字词;词典储存装置,用来储存所制作出的上述识别词典,上述词典制作装置也可以通过上述新识别用字词、上述固定字词及上述行动履历字词来决定新登录字词,该新登录字词是向上述识别词典登录的字词,向上述新登录字词附加表示上述新登录字词读音假名及词类的信息,制作上述识别词典。
据此,通过登录所输入的数据中不包括的行动履历字词,而可以制作对语音识别的误识别加以抑制的识别词典。
另外,上述语音识别词典制作装置进一步具备:识别字词取得装置,用来取得过去识别字词,该过去识别字词是通过语音识别所识别出的字词;过去识别字词储存装置,用来储存上述过去识别字词,上述词典制作装置也可以通过上述新识别用字词、上述固定字词、上述行动履历字词及上述过去识别字词来决定新登录字词,该新登录字词是向上述识别词典登录的字词,向上述新登录字词附加表示上述新登录字词读音假名及词类的信息,制作上述识别词典。
据此,通过登录所输入的数据中不包括的过去识别字词,而可以制作对语音识别的误识别加以抑制的识别词典。
这样,因为并不是除去最新的字词之外将在过去一定期间内所存在的全部字词都作为识别对象进行登录,而只是登录有作为行动履历字词或过去识别字词的字词,所以也按照最低限度抑制识别对象字词的增加,并且不只是识别率的下降不多,还可以通过更少的硬资源加以实现。
另外,上述词典制作装置也可以根据是否是上述行动履历字词中含有的字词来实行上述新登录字词的加权,附加与上述加权有关的信息,制作上述识别词典。
据此,根据是否是行动履历字词中含有的字词来实行新登录字词的加权,以此可以制作使语音识别的识别率得到提高的识别词典。
另外,上述词典制作装置也可以根据是否是上述过去识别字词中含有的字词来实行上述新登录字词的加权,附加与上述加权有关的信息制作上述识别词典。
据此,根据是否是过去识别字词中含有的字词来实行新登录字词的加权,以此可以制作使语音识别的识别率得到提高的识别词典。
另外,上述所输出的数据是结构化后的数据,上述字词提取装置与上述新识别用字词一起提取上述新识别用字词的属性,上述词典制作装置也可以基于上述新识别用字词的属性来实行上述新登录字词的加权并附加与上述加权有关的信息,制作上述识别词典。
据此,根据新识别用字词的属性来实行新登录字词的加权,以此可以制作使语音识别的识别率得到提高的识别词典。
另外,上述语音识别词典制作装置进一步具备利用者信息取得装置,用来取得对上述利用者加以辨别的利用者识别信息,上述词典制作装置也可以对每个上述利用者识别信息制作上述识别词典。
另外,上述语音识别词典制作装置进一步具备利用者信息取得装置,用来取得对利用者加以辨别的利用者识别信息,上述词典制作装置也可以对每个上述利用者识别信息分别实行上述新登录字词的加权,来制作上述识别词典。
据此,能够制作适合于多名利用者的识别词典。
另外,上述行动履历字词取得装置与上述行动履历字词一起将行动日期时间记录到上述行动履历字词储存装置中,上述词典制作装置给上述新登录字词之中的上述行动履历字词进一步附加上述行动日期时间来制作上述识别词典,上述语音识别词典制作装置也可以进一步具备字词删除装置,用来从上述识别词典删除上述登录字词,该登录字词已由上述登录字词的上述行动日期时间经过指定的期间。
据此,通过采用这种识别词典,该识别词典具有未被所输入的数据所包含的字词,来对语音识别的误识别加以抑制,并且在登录字词经过预先所设定的期间之后被从识别词典删除,因此可以减少语音识别词典制作装置的硬资源。
另外,本发明所涉及的信息检索装置,用来制作语音识别所使用的识别词典,与此同时通过由利用者发音而产生语音信号来检索信息,其特征为具备:词典制作装置,用于根据利用者经验的有无来制作多个内容不同的上述识别词典;语音识别装置,用于通过参照上述识别词典从上述语音信号识别出特定的字词;数据储存装置,用来储存所输入的数据;控制装置,用于从上述数据来检索由上述语音识别装置所识别出的字词,输出相应的信息。
另外,上述信息检索装置进一步具备:行动履历字词取得装置,用于根据利用者的行动来取得行动履历字词,该行动履历字词是作为识别对象的字词;行动履历字词储存装置,用来储存所取得的上述行动履历字词;固定字词储存装置,储存有预先设定的指定的固定字词;字词提取装置,用来从所输入的数据提取新识别用字词,该新识别用字词是作为识别对象的字词;词典储存装置,用来储存所制作出的上述识别词典,上述词典制作装置也可以通过上述新识别用字词、上述固定字词及上述行动履历字词来决定新登录字词,该新登录字词是向上述识别词典登录的字词,给上述新登录字词附加表示上述新登录字词读音假名及词类的信息,制作上述识别词典。
据此,通过采用这种识别词典,该识别词典具有未被所输入的数据所包含的字词,而可以抑制语音识别的误识别,辨别语音识别的错误和检索数据的有无。
例如,若以信息检索装置作为电视播送节目的节目指南装置加以使用,则即使是有关未被最新EPG数据所包含的过去视听的节目而发出语音的情形,字词也被正确识别。据此,在实行节目检索的场合下,可以做出「演员C演出的节目目前及在1周之内不予播送」、「电影K目前不予播送」的这种回答,并可以根据利用者的不同来实现使用方便的良好语音接口。
另外,上述所输入的数据是结构化后的数据,上述字词提取装置与上述新识别用字词一起提取上述新识别用字词的属性,上述词典制作装置基于上述新识别用字词的属性来实行上述新登录字词的加权,附加与上述加权有关的信息制作上述识别词典,与此同时按照目的制作基于上述新识别用字词的属性并且上述新登录字词的加权不同的多个上述识别词典,上述信息检索装置进一步具备词典选择受理装置,用来受理由利用者从上述词典储存装置中所储存的多个上述识别词典所选择的词典,上述语音识别装置也可以通过参照由上述词典选择受理装置所受理的识别词典,从语音信号识别出特定的字词,该语音信号是由利用者发音而产生的。
据此,通过认为语音识别的识别率低的利用者从多个词典选择被认为最合适的词典,而可以提高语音识别的识别率,实现易于使用的接口。
再者,本发明不只可以作为这种装置来实现,而也可以作为下述方法来实现或者作为使计算机实行那些步骤的程序来实现,上述方法是以这种语音识别词典制作装置所含有的特征性装置作为步骤而包括的方法。而且,不言而喻,这种程序可以通过CD-ROM等记录媒体和因特网等传送媒体加以传输。
如上所述,根据本发明所涉及的语音识别词典制作装置,可以将未被最新的EPG数据所包含的字词作为识别对象字词进行处理,在实行节目检索的场合下能够对语音识别的错误和检索数据的有无进行辨别,并可以针对利用者的不同来实现使用方便的良好语音接口。
再者,因为制作多个识别词典以利用者的指定进行转换,所以通过认为识别率低的利用者从多个词典选择被认为最合适的词典,而可以提高识别率,实现易于使用的接口。
具体实施方式
下面,有关本发明的实施方式,采用附加予以说明。
(实施方式1)
在本实施方式1中,主要有关制作利用者以今后播送的节目为对象进行检索所用的识别词典并实行检索的情形,予以说明。
图2是表示包含本发明实施方式1所涉及语音识别词典制作装置的节目指南装置结构的框图。
节目指南装置具备EPG接收部101、字词提取部102、词典制作部103、固定字词储存部104、识别字词储存部105、视听履历字词储存部106、词典储存部107、词典选择部108、语音识别部109、EPG储存部110、时钟111及控制部112。
EPG接收部101用来从所输入的电视信号分离出EPG数据。字词提取部102用来从EPG数据提取新识别用字词,该新识别用字词是「节目名称」、「演员」、「类型」等作为识别对象的字词。固定字词储存部104储存有表明时间、播送台的字词和一般的语音识别所需要的字词,例如「早晨」、「6点」、「的」、「新闻」、「想看」等的固定字词。
识别字词储存部105用来存储过去识别字词,该过去识别字词是过去通过语音识别所识别出的字词。在此,例如如图3所示记录有:「记述」,表示被语音识别后的字词记述;「读音」,表示该字词的读音假名;「种类」,表示该字词例如相当于节目名、类型及演员等的任一个;「语音识别日期时间」,表示被语音识别的日期时间;「频率」,表示被语音识别的次数。还有,在识别出相同记述的字词的场合下,按照最新的日期时间对「语音识别日期时间」加以更新,使「频率」增加1。
视听履历字词储存部106用来存储作为所视听的节目信息的视听履历字词。在此,作为所视听的节目信息记录有节目名及演员,例如如图4所示记录有:「记述」;「视听日期时间」,表示该节目被视听的日期时间;「种类」;「频率」。还有,在记录相同记述的字词的场合下,按照最新的日期时间对「视听日期时间」加以更新,使「频率」增加1。
词典制作部103用来在通过字词提取部102所提取的新识别用字词及固定字词储存部104中所存储的固定字词中,添加语音识别所需要的读音假名、词类等的信息,与以往的语音识别词典相同地制作如图5所示的那种基本识别词典。另外,词典制作部103对识别字词储存部105中所存储的过去识别字词及视听履历字词储存部106中所存储的视听履历字词进行参照,如果存在基本识别词典中所登录的字词之外的字词,就对登录于基本识别中的字词追加该字词,制作如图6所示的那种利用者自适应式识别词典。
利用者为了使用节目指南装置进行检索而发出的字词种类(属性),利用者以今后播送的节目为对象进行检索的情形(发音条件1),及以从前观看或录制的节目为对象进行检索的情形(发音条件2),在发声的频率上有所不同。
图7表示的是对在各自的发音条件中字词种类被发出的频率进行调查的结果。如图7所示,若除去「日期时间」的字词,则在发音条件1的场合下,「类型」(44.8%)最多,接着是「节目内容」(9.5%)较多,与此相对在发音条件2的场合下,「节目名」(26.7%)最多,接着则变成「类型」(23.3%)的顺序。
由此,词典制作部103根据字词的种类来实行加权,以决定「对象权重系数」。
再者,词典制作部103根据是在识别字词储存部105中作为过去识别字词被存储,还是在视听履历字词储存部106中作为视听履历字词被存储,来实行加权,以决定「履历权重系数」。随后,词典制作部103例如如图8所示制作加权利用者自适应式识别词典,该识别词典除去「记述」、「读音」及「种类」之外还存储有「对象权重系数」及「履历权重系数」。
在此,作为「对象权重系数」,对「种类」是节目名的字词赋予[1.11 」,对「种类」是日期时间的字词赋予[1.27」,对「种类」是播送台·频道的字词赋予[1.06」,对「种类」是类型的字词赋予「1.49」,对「种类」是演员的字词赋予[1.07」。
另外,作为「履历权重系数」,对在识别字词储存部105中作为过去识别字词所存储的字词赋予「1.2」,对在视听履历字词储存部106中作为视听履历字词所存储的字词赋予[1.1」,对在识别字词储存部105及视听履历字词储存部106的双方中都存储的字词赋予[1.3」。
词典储存部107用来存储由词典制作部103所制作出的语音识别所使用的多个词典。词典选择部108用来受理由利用者认为最合适而从多个词典所选择出的词典。语音识别部109通过参照由词典选择部108所受理的词典,从语音信号识别出特定的字词,该语音信号是由利用者发音而产生的。时钟111用来向控制部112输出当前的日期时间。EPG储存部110用来存储EPG数据。
控制部112通过由语音识别部109所识别出的字词对EPG储存部110中所储存的EPG数据进行检索,输出与相应的节目有关的信息。另外,控制部112还向识别字词储存部105输出与通过语音识别部109所识别出的字词有关的信息及语音识别日期时间等。再者,控制部112在由利用者视听节目达到预先所设定的时间以上时,取得作为该节目信息的视听履历字词,输出到视听履历字词储存部106中。另外,控制部112在识别字词储存部105内所存储的过去识别字词之中,删除从语音识别日期时间经过了指定时间的过去识别字词。同样地,控制部112在视听履历字词储存部106内所存储的视听履历字词之中,删除从视听日期时间经过指定时间的视听履历字词。
如上所构成的节目指南装置的动作可以大致分成制作词典的脱机处理过程,以及采用所制作出的词典来识别所输入的语音以对节目进行指南的联机处理过程。
首先,有关脱机处理过程的动作予以说明。图9是表示在节目指南装置中脱机处理过程动作的流程图。
输入电视信号的EPG接收部101从电视信号取出EPG数据,输出到字词提取部102及EPG储存部110中(步骤S101)。
接着,字词提取部102从EPG数据作为新识别用字词而提取「节目名」、「演员」及「类型」(步骤S102),该新识别用字词为语音识别的关键字。
图10表示的是EPG数据的一个示例。在EPG数据中对每1个节目分类成下述项目,该项目包括:「服务ID」,用来辨别播送台;「事件ID」,用来辨别各节目;「开始日」,表示节目开始的年月日;「开始时间」,表示节目开始的时间;「持续时间」,表示节目的播送时间;「事件名」,表示节目名;「正文」,表示演员及节目内容;「类型」,表示节目的类型。
另外,与「服务ID」、「事件ID」、「开始日」、「开始时间」及「持续时间」的项目有关的固定字词,预先存储于固定字词储存部104中。
接着,词典制作部103采用从字词提取部102所输入的新识别字词、固定字词储存部104所储存的固定字词及固定字词储存部104所储存的语音识别需要的读音假名和词类等的信息,与以往的识别词典相同地制作基本识别词典(步骤S103)。
接着,词典制作部103参照从视听履历字词储存部106所输入的视听履历字词以及从识别字词储存部105所输入的过去识别字词,如果存在基本识别词典中所登录的字词以外的字词,则对登录于基本识别词典中的字词追加该字词,制作如图6所示的那种利用者自适应式识别词典。再者,词典制作部103实行加权,该加权包括与字词种类相应的加权、以及对应于是在识别字词储存部105中作为过去识别字词被存储、还是在视听履历字词储存部106中作为视听履历字词被存储的加权,例如如图8所示制作加权利用者自适应式识别词典(步骤S104),该识别词典除去「记述」、「读音」及「种类」之外还存储有「对象权重系数」及「履历权重系数」。
接着,词典制作部103将所制作出的基本识别词典、利用者自适应式识别词典及加权利用者自适应式识别词典存储在词典储存部107中(步骤S105)。此时,词典制作部103通过与词典储存部107中所存储的以前制作出的各个识别词典进行更换,予以更新。
还有,在本实施方式中虽然作为加权利用者自适应式识别词典制作出存储有「对象权重系数」及「履历权重系数」的词典,但是并不限定于此。例如,也可以是只附加「对象权重系数」或「履历权重系数」任一方的词典。另外,「对象权重系数」及「履历权重系数」的值并不限定于上述示例,而也可以是其他的值。
另外,有关「履历权重系数」虽然是根据过去识别字词及视听履历字词来实行加权的,但是也可以根据任一方来实行加权。再者,也可以对词典附加对于过去识别字词及视听履历字词各自的「权重系数」。另外,也可以根据识别次数或视听次数和时刻等来变更「权重系数」。
另外,利用者自适应式识别词典即使采用视听履历字词、过去识别字词的任一方进行制作,也可以得到相同的效果。
另外,在硬资源缺乏的场合下,也可以取代实行加权,例如删除利用者使用频率低的节目被分类的类型的新识别用字词。
另外,在利用者以今后播送的节目为对象进行检索时,也可以假定关于节目名不发音的状况,例如如图14所示不登录「种类」是节目名的字词。
另外,加权利用者自适应式识别词典也可以制作成多个加权不同的词典,该加权与字词种类相应。另外,也可以通过向词典制作部103输入对利用者加以识别的利用者识别信号,对不同利用者制作识别词典,制作出多个利用者自适应式识别词典。
在此,例如在制作易于识别「演员」字词的利用者自适应式识别词典的场合下,可以使语音识别中的优先次序比「类型」、「节目名」的字词更高,以此实行加权。
另外,即使在「演员」的字词中,也可以对视听履历字词、过去识别字词的使用频率进行参照,使之与利用者的喜好相适来决定语音识别中的优先次序。
另外,在视听履历字词、过去识别字词之中对于基本识别词典中已包含的字词,因为由利用者再次使用的可能性较高,所以通过设定使语音识别中的优先次序提高的权重系数,也可以制作与利用者的使用状况相适的加权利用者自适应式识别词典。
另外,在本实施方式中虽然词典制作部103制作出基本识别词典、利用者自适应式识别词典及加权利用者自适应式识别词典的3种识别词典,但是并不限定于此。例如,也可以制作2种识别词典,这2种识别词典一是基本识别词典,二是利用者自适应式识别词典或者加权利用者自适应式识别词典的任1种识别词典。另外,也可以分别制作多个利用者自适应式识别词典及加权利用者自适应式识别词典,制作出4种以上的识别词典。
另外,虽然制作词典的脱机处理过程的动作例如按照1天1次的方式在每个指定期间予以实行,但是也可以根据视听履历来决定该实行的时间。
下面,有关联机处理过程的动作予以说明。图11是表示在节目指南装置中联机处理过程动作的流程图。
词典选择部108例如依照图12所示的那种画面,对词典储存部107中所存储的多个识别词典加以显示,受理由利用者做出的识别词典选择(步骤S201)。
接着,词典选择部108将由利用者所选择的识别词典输出到语音识别部109(步骤S202)。还有,作为初始设定也可以将基本识别词典输出到语音识别部109。
在此,也可以通过将利用者所选择的识别词典的种类显示于电视画面的一部分上,促进利用者输入与识别词典内容相应的语音内容。
接着,语音识别部109参照由利用者所选择的识别词典,从所输入的语音识别出特定的字词(步骤S203)。在此,将有关在下述状态下利用者发出「想观看体育」时的识别结果予以说明,该状态是由利用者选择出图8所示的那种加权利用者自适应式识别词典的状态。图13(a)是从图8所示的加权利用者自适应式识别词典摘录出一部分的附图,图13(b)表示的是识别结果的示例。语音识别部109首先与一般的语音识别同样地计算出分数。在此,分数如图13(b)所示设为,「体育乐园」是500,「体育」是300,「体育大全」是200。语音识别部109将加权利用者自适应式识别词典中所登录的「对象权重系数」及「履历权重系数」与计算出的分数进行乘法运算,计算出最终分数。其结果,语音识别部109根据最终分数作为最终识别结果而识别出「体育」。
接着,控制部112对由语音识别部109所识别出的字词(下面,称为识别字词)和EPG储存部110中所储存的EPG数据进行参照,来检索节目(步骤S204)。也就是说,控制部112通过识别字词对EPG储存部110中所储存的EPG数据进行检索。随后,控制部112判定在EPG数据中是否存在识别字词(步骤S205)。
该结果为,在EPG数据中包含识别字词的场合(在步骤S205中为YES)下,控制部112对相应的节目进行指南(步骤S206)。
另一方面,在EPG数据中未包含识别字词的场合(在步骤S205中为NO)下,控制部112因不存在相应的节目,而做出例如「演员C演出的节目目前及在1周之内不予播送」、「电影K目前不予播送」之类的回答(步骤S207)。
在此,因为已采用利用者的视听履历和识别履历制作出识别词典,所以被语音识别出的字词包含在识别词典中,但是在未被EPG数据所包含的场合下,控制部112判断出不是语音识别的错误,可以回答有无相应的节目。
根据上面的结构,通过对EPG数据、利用者的视听履历及语音识别履历进行参照来制作识别词典,而可以将未被最新的EPG数据所包含的字词作为识别对象字词加以处理,在实行节目检索的场合下,能够对语音识别的错误和检索数据的有无加以识别,可以根据利用者的不同来实现使用方便的良好语音接口。
另外,由于对登录字词实行加权并附加「对象权重系数」和「履历权重系数」等制作出识别词典,因而可以提高语音识别的识别率。
再者,由于制作多个识别词典并从利用者接受所使用识别词典的选择,因而通过由认为语音识别部109识别率低的利用者从多个词典选择被认为最合适的词典,而能够提高识别率,可以实现易于使用的接口。
(实施方式2)
在本实施方式2中,将有关下述情形予以说明,即除去在实施方式1中所说明的利用者以今后播送的节目为对象进行检索所用的识别词典之外,还制作以从前录制(或观看)的节目为对象进行检索所用的识别词典,并且按照目的实行检索。
图15是表示包含本发明实施方式2所涉及语音识别词典制作装置的节目指南装置结构的框图。还有,对于与实施方式1相同的部分附加同样的符号,以省略详细的说明。
该节目指南装置如图15所示,代替实施方式1的EPG接收部101及EPG储存部110,而具备节目·EPG接收部201、节目·EPG储存部202及录制信息储存部203。另外,词典制作部204、词典选择部205及控制部206的动作与实施方式1有所差异。
节目·EPG接收部201用来从所输入的电视信号分离出EPG数据及节目数据。节目·EPG储存部202用来存储EPG数据及节目数据。录制信息储存部203用来存储与正被录制的节目有关的信息。在此,例如如图16所示记录有:「记述」,表示正被录制的节目;「视听日期时间」,表示该节目被录制的日期时间;「种类」,表示该节目的类型;「预约·储存」,表示利用者进行了或者系统进行了该节目的录制预约。还有,系统实行录制预约指的是,例如对所有包括关键字的节目进行录制的情形等,该关键字是由利用者所指定的。
控制部206将与进行录制的节目有关的信息输出到录制信息储存部203中。
词典制作部204制作如图17所示的那种加权利用者自适应式识别词典,该识别词典作为以从前录制(或观看)的节目为对象进行检索所用的识别词典,例如根据图7所示的发音频率调查结果等,对已在实施方式1中所说明的加权利用者自适应式识别词典的「对象权重系数」进行变更。在此,作为「对象权重系数」,对「种类」是节目名(未视听节目)的字词赋予「1.11」,对「种类」是节目名(已视听节目)的字词赋予「1.30」,对「种类」是日期时间的字词赋予「1.30」,对「种类」是播送台·频道的字词赋予「1.03」,对「种类」是类型的字词赋予「1.49 」,对「种类」是演员的字词赋予「1.07」。此时,词典制作部204对于有关节目名是未视听节目还是已视听节目,是根据录制信息储存部203中所存储的「预约·储存」信息进行判定的。也就是说,在系统进行了节目的录制预约的场合下,判定出是未视听节目,在利用者进行了节目的录制预约的场合下,判定出是已视听节目。
词典选择部205从利用者接受检索对象是今后播送的节目还是从前录制(或观看)的节目的指令,按照检索对象来选择识别词典。也就是说,在检索对象是今后播送的节目的场合下,选择实施方式1中所说明的如图8所示的那种类型加权大的加权利用者自适应式识别词典,在检索对象是从前观看或录制的节目的场合下,选择如图7所示的那种节目名加权大的加权利用者自适应式识别词典。
下面,有关如上所构成的节目指南装置的联机处理过程的动作,予以说明。图18是表示在节目指南装置中联机处理过程动作的流程图。还有,有关脱机处理过程的动作因与实施方式1相同,而省略说明。
词典选择部205从利用者接受检索对象是今后播送的节目还是从前观看或录制的节目的指令(步骤S301)。在此,在检索对象是今后播送的节目的场合下,将类型加权大的加权利用者自适应式识别词典作为由语音识别部109所使用的识别词典进行选择(步骤S302)。另一方面,在检索对象是从前观看或录制的节目的场合下,将节目名加权大的加权利用者自适应式识别词典作为由语音识别部109所使用的识别词典进行选择(步骤S303)。
此后的动作(步骤S203~步骤S207)与实施方式1相同。
如上所述,由于按照检索对象是今后播送的节目还是从前录制(或观看)的节目,来制作多个识别词典并选择出由语音识别部109所使用的识别词典,因而能够提高识别率,可以实现易于使用的接口。
还有,在本实施方式中虽然作为在录制信息储存部203中所存储的录制信息而记录有表示利用者进行了或者系统进行了该节目录制预约的「预约·储存」,但是并不限定于此。例如,也可以是表示已预约节目实行录制或者利用者直接进行了录制操作的信息、表示实际上利用者已进行视听或未进行视听的信息以及表示已利用EPG进行节目录制预约或者已指定日期时间予以实行的信息等。另外,也可以使用多个那些信息。
(实施方式3)
在实施方式1中,在识别词典进行更新时对新制作出的识别词典和旧的识别词典进行更换,而在本实施方式3中,将说明在对识别词典进行部分更新的同时,删除识别词典内所登录的字词之中于指定期间之前登录的字词的情况。
图19是表示包含本发明实施方式3所涉及语音识别词典制作装置的节目指南装置结构的框图。还有,对于与实施方式1相同的部分附加同样的符号,以省略详细说明。
该节目指南装置如图15所示,除实施方式1的结构之外还具备字词删除部301。另外,词典制作部303及控制部302的动作与实施方式1有所差异。
词典制作部303与实施方式1相同,在制作出基本识别词典、利用者自适应式识别词典及加权利用者自适应式识别词典之后,对与词典储存部107内所储存的基本识别词典、利用者自适应式识别词典及加权利用者自适应式识别词典的不同的部分加以部分更新。
字词删除部503对时钟111的日期时间、从控制部112所输出的节目内容及从识别字词储存部105所输出的过去识别字词进行参照,删除识别词典内所登录的字词之中于指定期间(例如一星期)之前登录的字词。
下面,有关如上所构成的节目指南装置脱机处理过程的动作,予以说明。图20是表示在节目指南装置中联机处理过程动作的流程图。还有,有关联机处理过程的动作因与实施方式1相同,而省略说明。
输入电视信号的EPG接收部101从电视信号取出EPG数据,输出到字词提取部102及EPG储存部110(步骤S401)。
接着,字词提取部102从EPG数据作为新识别用字词提取「节目名」、「演员」及「类型」(步骤S402),该新识别用字词为语音识别的关键字。
接着,词典制作部103采用从字词提取部102所输入的新识别字词、固定字词储存部104所储存的固定字词及固定字词储存部104所储存的语音识别所需要的读音假名和词类等的信息,与以往的识别词典同样制作基本识别词典(步骤S403)。
接着,词典制作部103参照从视听履历字词储存部106所输入的视听履历字词及从识别字词储存部105所输入的过去识别字词,如果存在基本识别词典中所登录的字词以外的字词,则对登录于基本识别词典中的字词追加该字词,制作如图6所示的那种利用者自适应式识别词典。再者,词典制作部103实行加权,该加权包括与字词种类相应的加权、以及与是在识别字词储存部105中作为过去识别字词被存储还是在视听履历字词储存部106中作为视听履历字词被存储相应的加权,例如如图8所示制作加权利用者自适应式识别词典(步骤S404),该识别词典除去「记述」、「读音」及「种类」之外还存储有「对象权重系数」及「履历权重系数」。
接着,词典制作部103求出词典储存部502中所储存的识别词典(基本识别词典、利用者自适应式识别词典及加权利用者自适应式识别词典)和新制作出的识别词典之间的差分,根据新制作出的识别词典将未被已储存的识别词典所包含的字词登录于词典储存部107中,以此对识别词典进行部分更换予以更新(步骤S405)。
接着,字词删除部301采用时钟111的日期时间和给识别词典的字词所添加的日期时间,从识别词典删除在指定期间(例如一星期)之前所更新的字词。但是,实行删除的期间也可以由利用者加以设定。另外,利用者自适应式识别词典中所包含的字词与基本识别词典相比可以进一步延长实行删除的期间,进而采用利用者的视听履历,也可以将与过去观看的节目有关的字词设为不在删除对象内。再者,也可以按照字词的种类或类型等对实行删除的期间加以变更。
还有,在硬资源缺乏的场合下,也可以取代实行加权,例如删除利用者使用频率低的节目已被分类的类型的新识别用字词。
另外,利用者自适应式识别词典即使采用视听履历字词、过去识别字词的任一方进行制作,也可以得到相同的效果。
另外,在给更新后的字词添加更新日期时间并且旧的识别词典中存在相同字词的场合下,再次添加更新时的日期时间。
根据上面的结构,通过对EPG数据、利用者的视听履历及语音识别履历进行参照来新制作识别词典并对上次制作出的识别词典进行部分更换,而可以将未被最新的EPG数据所包含的字词作为识别对象字词进行处理,在实行节目检索的场合下,能够对语音识别的错误和检索数据的有无进行识别,可以根据利用者的不同来实现使用方便的良好语音接口。
再者,由于制作多个识别词典并从利用者接受所使用识别词典的选择,因而通过认为语音识别部109识别率低的利用者从多个词典选择被认为最合适的词典,而能够提高识别率,可以实现易于使用的接口。
(实施方式4)
在实施方式1~3中,有关检索电视播送节目的情形已做出说明,而在本实施方式4中将有关对音乐内容进行检索的情形予以说明。
图21是表示包含本发明实施方式4所涉及语音识别词典制作装置的音乐指南装置结构的框图。还有,对于与实施方式1相同的部分附加同样的符号,以省略详细说明。
该音乐指南装置如图21所示,代替实施方式1的EPG接收部101、视听履历字词储存部106及EPG储存部110,而具备音乐数据.音乐信息·视听履历储存部401。另外,字词提取部402、词典制作部403及控制部404的动作与实施方式1有所差异。
音乐数据·音乐信息·视听履历储存部401用来存储音乐数据、音乐信息及视听履历。在此,作为音乐信息如图22所示记录有:「音乐名称」,表示音乐的名称;「艺术家」,表示该音乐的演奏者;「唱片集」,表示已收录该音乐的唱片集名;「类型」,表示该音乐的类型;「详细」,表示该音乐的演奏时间和发售日等。
另外,作为视听履历如图23所示记录有:「音乐名称」,是音乐的名称;「视听期间」,表示视听该音乐的期间;「视听次数」,表示视听该音乐的次数;「储存源」,表示是从何处储存该音乐的。
字词提取部402用来从音乐信息提取新识别用字词,该新识别用字词是「音乐名称」、「艺术家」、「唱片集」及「类型」等作为识别对象的字词。
词典制作部403用来给通过字词提取部402所提取的新识别用字词及在固定字词储存部104中所存储的固定字词,添加语音识别所需要的读音假名、词类等的信息,并与上述实施方式1相同制作基本识别词典。另外,词典制作部403参照识别字词储存部105中所存储的过去识别字词,如果存在基本识别词典中所登录的字词之外的字词,则对登录于基本识别词典中的字词追加该字词,来制作利用者自适应式识别词典。
另外,词典制作部403根据字词是「音乐名称」、「艺术家」、「唱片集」及「类型」等的哪种来实行加权,决定「对象权重系数」。此时,词典制作部403根据该音乐是未视听还是已视听,使对各种种类的加权产生差异,来决定「对象权重系数」。
再者,词典制作部403根据字词是否在识别字词储存部105中作为过去识别字词被存储、是否是与具有视听履历的音乐有关的字词以及储存该音乐的是利用者还是系统,来实行加权并决定「履历权重系数」。随后,词典制作部403制作加权利用者自适应式识别词典,该识别词典除去「记述」、「读音」及「种类」之外还存储有「对象权重系数」及「履历权重系数」。
在此,在该音乐是未视听的场合下,作为「对象权重系数」如图24所示,对「种类」是音乐名称的字词赋予「1.1 」,对「种类」是艺术家的字词赋予「1.2 」,对「种类」是唱片集的字词赋予「1.1」,对「种类」是类型的字词赋予「1.3」。另一方面,在该音乐是未视听的场合下作为「对象权重系数」,对「种类」是音乐名称的字词赋予「1.3」,对「种类」是艺术家的字词赋予「1.3」,对「种类」是唱片集的字词赋予「1.2」,对「种类」是类型的字词赋予「1.3」。
另外,作为「履历权重系数」,对在识别字词储存部105中作为过去识别字词所存储的字词赋予「1.2」,对与具有视听履历的音乐有关的字词赋予「1.1」,对与储存的是利用者的音乐有关的字词赋予「1.2」。此时,在相应有多个的场合下,添加系数设为「履历权重系数」。
还有,有关在如上所构成的音乐指南装置中制作词典的联机处理过程以及采用所制作出的词典来识别所输入的语音并检索音乐的脱机处理过程的动作,因与实施方式1相同,而省略说明。
根据上面的结构,通过对音乐信息、利用者的视听履历及语音识别履历进行参照来制作识别词典,而可以将未被最新的音乐信息所包含的字词作为识别对象字词加以处理,在实行节目检索的场合下,能够对声音识别的错误和检索数据的有无进行识别,可以根据利用者的不同来实现使用方便的良好声音接口。
另外,由于对登录字词实行加权并附加「对象权重系数」和「履历权重系数」等制作出识别词典,因而可以提高语音识别的识别率。
再者,由于制作多个识别词典并从利用者接受所使用识别词典的选择,因而通过由认为语音识别部109识别率低的利用者从多个词典选择被认为最合适的词典,而能够提高识别率,可以实现易于使用的接口。
还有,在本实施方式中虽然有关「履历权重系数」是根据字词是否在识别字词储存部105中作为过去识别字词被存储、是否是与具有视听履历的音乐有关的字词以及储存该音乐的是利用者还是系统来实行加权的,但是也可以只根据任1个来实行加权。另外,也可以分别给词典各自添加「权重系数」。另外,也可以按照视听次数和时刻等来变更「权重系数」。
另外,在本实施方式中虽然假定不将检索对象分成未视听还是已视听进行检索,但是并不限定于此。例如,在将检索对象分成未视听或者已视听进行检索的场合下,也可以按照分开检索对象进行检索的情形和不分开检索对象进行检索的情形,采用不同的「对象权重系数」。
(实施方式5)
在实施方式4中有关检索音乐内容的情形已做出说明,而在本实施方式5中将有关对商店(餐厅)数据进行检索的情形予以说明。
图25是表示包含本发明实施方式5所涉及语音识别词典制作装置的信息检索装置结构的框图。还有,对于与实施方式1相同的部分附加同样的符号,以省略详细说明。
该信息查询装置如图21所示,代替实施方式1的EPG接收部101、视听履历字词储存部106及EPG储存部110,而具备餐厅数据储存部501及利用信息保存部504。另外,字词提取部502、词典制作部503及控制部505的动作与实施方式1有所差异。
餐厅数据储存部501用来存储餐厅数据。在此,例如如图26所示记录有:「店名」,表示餐厅的名称;「类型1」,表示该餐厅的大致类型;「类型2」,表示该餐厅的详细类型;「主菜单」,表示该餐厅经营中的菜单;「营业时间」,表示该餐厅的营业时间。
利用信息保存部504用来存储利用者所利用的餐厅利用信息。在此,例如如图27所示记录有:「店名」,是餐厅的名称;「利用期间」,表示利用者利用该餐厅的期间、「利用次数」,表示利用者利用该餐厅的次数;「利用时间段」,表示利用者利用该餐厅的时间段。
字词提取部502用来从餐厅数据提取新识别用字词,该新识别用字词是「店名」、「类型1」、「类型2」及「主菜单」等作为识别对象的字词。
词典制作部503用来向通过字词提取部502所提取的新识别用字词及在固定字词储存部104中所存储的固定字词,添加语音识别所需要的读音假名、词类等的信息,与上述实施方式1相同制作基本识别词典。另外,词典制作部503对识别字词储存部105中所存储的过去识别字词进行参照,如果存在基本识别词典中所登录的字词之外的字词,则对登录于基本识别词典中的字词追加该字词,制作利用者自适应式识别词典。
另外,词典制作部503根据字词是「店名」、「类型1」、「类型2」及「主菜单」等的哪种来实行加权,决定「对象权重系数」。此时,词典制作部503根据利用者是否利用过该餐厅,使对各个种类的加权产生差异来决定「对象权重系数」。
再者,词典制作部503根据字词是否在识别字词储存部105中作为过去识别字词被存储,来实行加权并决定「履历权重系数」。随后,词典制作部503制作加权利用者自适应式识别词典,该识别词典除去「记述」、「读音」及「种类」之外还存储有「对象权重系数」及「履历权重系数」。
在此,在该餐厅未被利用者加以利用的场合下,作为「对象权重系数」如图28所示,对「种类」是店名的字词赋予「1.1 」,对「种类」是类型1的字词赋予「1.4」,对「种类」是类型2的字词赋予[1.3」,对「种类」是主菜单的字词赋予「1.3」。另一方面,在该餐厅被利用者利用过的场合下,作为「对象权重系数」,对「种类」是店名的字词赋予「1.4」,对「种类」是类型1的字词赋予「1.3 」,对「种类」是类型2的字词赋予「1.4」,对「种类」是主菜单的字词赋予「1.2」。
另外,作为「履历权重系数」,对在识别字词储存部105中作为过去识别字词所存储的字词赋予「1.5」。
还有,有关在如上所构成的信息查询装置中制作词典的联机处理过程以及采用所制作出的词典来识别所输入的语音并检索餐厅的脱机处理过程的动作,因与实施方式1相同,而省略说明。
根据上面的结构,通过对利用者的利用信息及语音识别履历进行参照来制作识别词典,而可以将未被最新的餐厅数据所包含的字词作为识别对象字词加以处理,在实行餐厅检索的场合下,能够对语音识别的错误和检索数据的有无加以识别,可以根据利用者的不同来实现使用方便的良好语音接口。
另外,由于对登录字词实行加权并附加「对象权重系数」和「履历权重系数」等来制作出识别词典,因而可以提高语音识别的识别率。
再者,由于制作多个识别词典并从利用者接受所使用识别词典的选择,因而通过由认为语音识别部109识别率低的利用者从多个词典选择被认为最合适的词典,而可以提高识别率,能够实现易于使用的接口。
还有,在本实施方式中虽然有关「履历权重系数」是根据字词是否在识别字词储存部105中作为过去识别字词被存储来实行加权的,但是例如也可以按照识别次数或利用次数和利用时间段等予以变更。
另外,在本实施方式中虽然假定不分利用经验的有无对检索对象进行检索,但是并不限定于此。例如,在分成利用经验的有无而对检索对象进行检索的场合下,也可以按照分开检索对象进行检索的情形和不分开检索对象进行检索的情形,采用不同的「对象权重系数」。