JP2002297177A

JP2002297177A - 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体

Info

Publication number: JP2002297177A
Application number: JP2001096169A
Authority: JP
Inventors: Hiroyuki Kanza; 浩幸勘座; Keiko Fukita; 慶子吹田
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2001-03-29
Filing date: 2001-03-29
Publication date: 2002-10-11

Abstract

(57)【要約】【課題】リンク先を２つ先以上辿って音声認識用辞書
を作成する。【解決手段】テキスト解析部２は、ハイパーテキスト
文書に対して形態素解析処理を行い入力文字列から単語
を分割し、各単語がリンク情報であるか否かを判別す
る。リンク先文字列抽出部７は、リンク情報に基づいて
リンク先の文字列を抽出してテキスト解析部２に返す。
その結果、読み付与部３および語彙作成部５は、リンク
先のファイルの文字列に対しても読み付与および音声認
識用辞書作成を行うことになる。すなわち、ハイパーテ
キスト文書による一つのファイルを指定するだけで、そ
のファイル上の文字列は元より、当該ファイルから張ら
れているリンク先のファイルの文字列をも音声認識用辞
書作成の対象とする。したがって、関連する語彙を一度
に沢山音声認識用辞書に登録することができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、音声認識時に用
いられる辞書を作成する音声認識用辞書作成装置および
音声認識用辞書作成方法、作成された辞書を用いた音声
認識装置、この音声認識装置を搭載した携帯端末器、並
びに、辞書作成処理プログラムを記録したプログラム記
録媒体に関する。

【０００２】

【従来の技術】インターネットの普及に伴って、ＷＷＷ
(Ｗorld Ｗide Ｗeb)ブラウザを用いてＨＴＭＬ(ハイパ
ーテキスト・マークアップ言語)のようなハイパーテキス
トを表示する技術が進展してきている。一方、音声認識
技術が、統計処理技術の確立や、演算速度の高速化およ
び記憶装置の低価格化等のハードウェアの進展によっ
て、実用的なレベルになりつつある。このような状況の
下で、ハイパーテキストと音声認識とを融合した技術が
出現してきている。

【０００３】上記ハイパーテキストから音声認識辞書を
作成する技術として、特開２０００‐２１５０２３号公
報に開示された「ページ記述言語表示装置」がある。この
公報によれば、音声認識処理手段による音声認識結果に
基づいて、ＨＴＭＬ等で記述された文字列の中からリン
ク文字列とリンク先情報とで成るリンク情報を取得す
る。そして、リンク文字列解析手段によって、上記リン
ク文字列を解析して発音情報を生成し、上記リンク文字
列と発音情報とリンク先情報とを対応付けて記憶手段に
記憶する。こうして、音声認識辞書を生成するようにし
ている。

【０００４】すなわち、上記リンク文字列の部分の選択
やページ記述言語データの切り換えを音声操作によって
行うことができ、利用者がＷＷＷブラウザによって表示
されているリンク文字列を発声すれば、音声認識の結果
得られたリンク文字列に対応するリンク情報を表示する
ことができるのである。

【０００５】

【発明が解決しようとする課題】しかしながら、上記特
開２０００‐２１５０２３号公報に開示された「ページ
記述言語表示装置」には、以下のような問題がある。す
なわち、辞書作成の対象が、ＨＴＭＬ等で記述された文
字列の中に出現するリンク文字列そのものに限定されて
しまい、リンク先にある文字列や、そのリンク先から更
に辿ることができるリンク先にある文字列は辞書作成の
対象とはならない。したがって、ＷＷＷブラウザによっ
て表示されている文字列は音声認識語彙に成り得るが、
ＷＷＷブラウザによって表示されていないリンク先にあ
る文字列は音声認識語彙にならないことになる。そのた
めに、上記「ページ記述言語表示装置」では、小規模な音
声認識用辞書しか作成することができない。

【０００６】すなわち、上記ＷＷＷブラウザ上におい
て、リンク文字列をクリックする代りにリンク文字列を
発声してリンク先を表示するという用途に対してはこれ
で十分であるが、リンク先に書かれている内容を発声し
てリンク先の情報を直接呼び出すという用途には使用で
きないという問題がある。

【０００７】以上の問題点を、図１５に示すようなＨＴ
ＭＬで記述されたハイパーテキストを例に説明する。こ
の例においては、都道府県‐市‐区町村の階層構造をＨ
ＴＭＬで記述している。ＷＷＷブラウザによって最初の
ファイル１３１が表示されている際に文字列「大阪府」を
選択すると、ファイル１３２に表示内容が切り換る。さ
らに、ファイル１３２から「大阪市」を選択すると、ファ
イル１３３に表示内容が切り換る。

【０００８】その場合、上記特開２０００‐２１５０２
３号公報に開示された「ページ記述言語表示装置」によれ
ば、ファイル１３１が表示されている場合に、「大阪
府」，「奈良県」等のファイル１３１中のリンク文字列が
音声認識語彙になっているので、「大阪府」や「奈良県」と
発声することによって、表示内容をファイル１３２やフ
ァイル１３４に切り換えることができる。

【０００９】しかしながら、上述のごとく、上記ＷＷＷ
ブラウザによって表示されている文字列しか認識できな
いため、ファイル１３１の内容が表示されている場合に
「大阪市」や「阿倍野区」と発声しても認識することができ
ず、ファイル１３３に表示内容を切り換えることはでき
ないのである。

【００１０】そこで、この発明の目的は、ハイパーテキ
ストにおける文字列からリンク先を２つ先以上辿って音
声認識用辞書を作成できる音声認識用辞書作成装置およ
び音声認識用辞書作成方法、作成された辞書を用いた音
声認識装置、この音声認識装置を搭載した携帯端末器、
並びに、辞書作成処理プログラムを記録したプログラム
記録媒体を提供することにある。

【００１１】

【課題を解決するための手段】上記目的を達成するた
め、第１の発明は、テキスト解析手段によって文字列情
報を解析して構成単語に分割し,この分割された各構成
単語に読み付与手段によって読みを付与し,上記解析手
段および読み付与手段による処理結果に基づいて語彙作
成手段によって音声認識語彙を生成し,この生成された
音声認識語彙を音声認識用辞書として語彙記憶手段に記
憶する音声認識用辞書作成装置において、上記テキスト
解析手段による解析の結果リンク情報であると判定され
た構成単語におけるリンク先の文字列を抽出し,上記テ
キスト解析手段に送出するリンク先文字列抽出手段を備
えたことを特徴としている。

【００１２】上記構成によれば、ハイパーテキスト文書
におけるファイル中の文字列情報がテキスト解析手段に
よって解析されて構成単語に分割される。その際に、リ
ンク情報であると判定された構成単語のリンク先の文字
列が、リンク先文字列抽出手段によって抽出されて上記
テキスト解析手段に送出される。そして、上記抽出され
たリンク先文字列が解析されて構成単語に分割される。
さらに、読み付与手段によって読みが付与され、上記構
成単語と読みとに基づいて語彙作成手段によって音声認
識語彙が生成されて音声認識用辞書として語彙記憶手段
に記憶される。こうして、上記ハイパーテキスト文書に
おける表層ファイルの単語みならず、表層ファイルの単
語にリンクされたリンク先ファイル中の単語にも基づい
て音声認識用辞書が作成されるのである。

【００１３】また、１実施例では、上記第１の発明の音
声認識用辞書作成装置において、上記リンク先文字列抽
出手段が上記リンク情報に基づいて辿ったリンクのリン
ク元情報を管理して、上記リンク先文字列抽出手段が次
に辿るリンク先を制御するリンク制御手段を備えたこと
を特徴としている。

【００１４】この実施例によれば、上記リンク先文字列
抽出手段が辿ったリンクのリンク元情報がリンク制御手
段によって管理されている。したがって、リンク先ファ
イルの文字列に対する上記テキスト解析手段,読み付与
手段,語彙作成手段および語彙記憶手段による処理が終
了すると、リンク制御手段による制御の下に、上記テキ
スト解析手段による抽出処理が、リンク元ファイルの未
処理文字列に戻される。こうして、上記ハイパーテキス
ト文書における総てのファイル中の総ての文字列に基づ
いて音声認識用辞書が作成される。

【００１５】また、１実施例では、上記第１の発明の音
声認識用辞書作成装置において、上記リンク先文字列抽
出手段が辿るリンク先文字列の階層数の上限値を記憶す
るリンク上限記憶部を備えて、上記リンク制御手段は、
上記上限値を越えないように上記リンク先文字列抽出手
段が辿るリンク先を制御することを特徴としている。

【００１６】この実施例によれば、上記リンク先文字列
抽出手段がリンク先を辿ろうとすると、上記リンク制御
手段によってリンク上限記憶部に記憶されたリンク先文
字列の階層数の上限値が参照される。そして、上記リン
ク先文字列抽出手段が辿るリンク先文字列の階層数が、
上記上限値を越えないように制御される。こうして、次
々とリンク先を辿って処理が終了しなくなったり、不必
要なリンクまで辿ることが防止される。さらに、ある階
層レベルまでのリンク先ファイルを対象とした音声認識
用辞書を作成することが可能になる。

【００１７】また、１実施例では、第１の発明の音声認
識用辞書作成装置において、リンク先のファイルの記憶
場所がリンク元のファイルの記憶場所と同一か否かを判
定するファイル記憶場所判定手段を備えて、上記リンク
制御手段は、上記ファイル記憶場所判定手段による判定
結果に基づいて、リンク先ファイルの記憶場所とリンク
元ファイルの記憶場所とが異ならないように上記リンク
先文字列抽出手段が辿るリンク先を制御することを特徴
としている。

【００１８】この実施例によれば、上記リンク先文字列
抽出手段がリンク先を辿ろうとすると、上記リンク制御
手段によってファイル記憶場所判定手段による判定結果
が参照される。そして、リンク先ファイルの記憶場所が
リンク元ファイルの記憶場所と異ならないように、上記
リンク先文字列抽出手段が辿るリンク先ファイルが制御
される。こうして、次々とリンク先を辿って処理が終了
しなくなったり、不必要なリンクまで辿ることが防止さ
れる。さらに、ある階層レベルまでのリンク先ファイル
を対象とした音声認識用辞書を作成することが可能にな
る。

【００１９】また、第２の発明は、入力された音声を,
辞書に登録されている認識語彙との照合を行って認識す
る音声認識装置であって、上記辞書として、上記第１の
発明の音声認識用辞書作成装置によって作成された音声
認識用辞書を搭載していることを特徴としている。

【００２０】上記構成によれば、搭載している音声認識
用辞書を作成した際に用いたハイパーテキスト文書の表
層ファイルに記述された単語の発声は元より、上記表層
ファイルの単語にリンクされたリンク先ファイルに記述
された単語が発声されても、高い認識率で認識される。

【００２１】また、１実施例では、上記第２の発明の音
声認識装置において、識別子が含まれた上記文字列情報
から生成された音声認識語彙と上記識別子とを対応付け
て記憶する識別子記憶手段と、音声認識の結果得られた
語彙に基づいて上記識別子記憶手段を参照し,上記語彙
と同一の音声認識語彙に対応付けられた識別子を出力す
る識別子出力手段を備えたことを特徴としている。

【００２２】この実施例によれば、ハイパーテキスト文
書のリンク先ファイルに記述された単語が発声されると
高い認識率で認識され、認識語彙が識別子出力手段に送
出される。そして、識別子出力手段によって識別子記憶
手段が参照され、上記語彙と同一の音声認識語彙に対応
付けられた識別子が出力される。こうして、音声認識結
果として、認識語彙に代ってこの認識語彙対応付けられ
ている識別子が出力される。

【００２３】また、１実施例では、上記第２の発明の音
声認識装置において、識別子に対応した機器の操作手順
を記憶する操作手順記憶手段と、上記識別子出力手段か
らの識別子に基づいて上記操作手順記憶手段を参照し,
当該識別子に対応した機器の操作手順に従って上記機器
の操作を実行する操作手順実行手段を備えたことを特徴
としている。

【００２４】この実施例によれば、ハイパーテキスト文
書のリンク先ファイルに記述された単語が発声されると
高い認識率で認識され、認識語彙に対応する識別子が出
力される。そうすると、操作手順実行手段によって操作
手順記憶手段が参照されて、当該識別子に対応した機器
の操作手順に従って機器の操作が実行される。こうし
て、ハイパーテキスト文書の下層ファイルに記述された
単語の発声によって、上記機器の操作が簡単に指示可能
となる。

【００２５】また、１実施例では、上記第２の発明の音
声認識装置において、上記操作手順実行手段による操作
実行の対象となる機器はテレビジョン装置であり、上記
識別子はテレビ番組のインデックスであり、上記識別子
に対応した機器の操作手順は,上記インデックスに対応
するテレビ番組の上記テレビジョン装置による表示手順
であることを特徴としている。

【００２６】この実施例によれば、ハイパーテキスト文
書のリンク先ファイルに記述された単語が発声されると
高い認識率で認識され、認識語彙に対応するテレビ番組
のインデックスが出力される。そうすると、操作手順実
行手段によって、当該インデックスに対応したテレビジ
ョン装置の操作手順に従って、当該インデックスに対応
するテレビ番組が自動的に表示される。

【００２７】また、１実施例では、上記第２の発明の音
声認識装置において、上記操作手順実行手段による操作
実行の対象となる機器はビデオ装置であり、上記識別子
はテレビ番組のインデックスであり、上記識別子に対応
した機器の操作手順は,上記インデックスに対応するテ
レビ番組の上記ビデオ装置への録画予約手順であること
を特徴としている。

【００２８】この実施例によれば、ハイパーテキスト文
書のリンク先ファイルに記述された単語が発声されると
高い認識率で認識され、認識語彙に対応するテレビ番組
のインデックスが出力される。そうすると、操作手順実
行手段によって、当該インデックスに対応したビデオ装
置の操作手順に従って、当該インデックスに対応するテ
レビ番組の録画予約が自動的に行われる。

【００２９】また、第３の発明の携帯端末器は、上記第
１の発明の音声認識用辞書作成装置と、上記音声認識用
辞書作成装置で作成された音声認識用辞書を用いる音声
認識装置を搭載したことを特徴としている。

【００３０】上記構成によれば、上記音声認識用辞書作
成装置によって、ハイパーテキスト文書を用いて音声認
識用辞書が作成されると、本形態端末器に向って発声さ
れた上記ハイパーテキスト文書のリンク先ファイルに記
述された単語が高い認識率で認識される。

【００３１】また、第４の発明の携帯端末器は、上記第
２の発明の音声認識装置を搭載したことを特徴としてい
る。

【００３２】上記構成によれば、本形態端末器に向って
発声されたハイパーテキスト文書のリンク先ファイルに
記述された単語が、上記音声認識用辞書作成装置によっ
て上記ハイパーテキスト文書を用いて作成された音声認
識用辞書が用いられて、高い認識率で認識される。

【００３３】また、第５の発明は、文字列情報を解析し
て構成単語に分割し,上記分割された各構成単語に読み
を付与し,上記解析処理および読み付与処理の結果に基
づいて音声認識語彙を生成し,この生成された音声認識
語彙を音声認識用辞書として記憶する音声認識用辞書作
成方法において、上記解析処理の結果リンク情報である
と判定された構成単語におけるリンク先の文字列を抽出
し、上記抽出されたリンク先の文字列情報に対しても上
記解析,単語分割,読み付与,音声認識語彙生成および音
声認識語彙記憶を行うことを特徴としている。

【００３４】上記構成によれば、上記第１の発明の場合
と同様に、ハイパーテキスト文書におけるファイルに記
述された文字列情報が解析された際に、リンク情報であ
ると判定されると、その構成単語のリンク先の文字列が
抽出される。そして、抽出された上記リンク先文字列が
解析されて構成単語に分割され、読みが付与され、上記
構成単語と読みとに基づいて音声認識語彙が生成され、
音声認識用辞書として記憶される。こうして、上記ハイ
パーテキスト文書における表層ファイルの単語みなら
ず、表層ファイルの単語にリンクされたリンク先ファイ
ル中の単語にも基づいて音声認識用辞書が作成されるの
である。

【００３５】また、第６の発明のプログラム記録媒体
は、コンピュータを、上記第１の発明におけるテキスト
解析手段,読み付与手段,語彙作成手段およびリンク先文
字列抽出手段として機能させる辞書作成処理プログラム
が記録されていることを特徴としている。

【００３６】上記構成によれば、上記第１の発明の場合
と同様に、ハイパーテキスト文書におけるファイルに記
述された文字列情報が解析された際に、リンク情報であ
ると判定されると、その構成単語のリンク先の文字列が
抽出される。こうして、上記ハイパーテキスト文書にお
ける表層ファイルの単語みならず、表層ファイルの単語
にリンクされたリンク先ファイル中の単語にも基づいて
音声認識用辞書が作成されるのである。

【００３７】

【発明の実施の形態】以下、この発明を図示の実施の形
態により詳細に説明する。

【００３８】＜第１実施の形態＞図１は、本実施の形態
の音声認識用辞書作成装置におけるブロック図である。
解析処理部１に文字列情報が入力されると、テキスト解
析部２によって入力文字列の言語が解析されて形態素に
分割される。その際に、複数の分割候補がある場合に
は、夫々の分割候補にはその分割候補の可能性の度合い
を表す尤度が付与されて総ての分割候補が出力される。

【００３９】読み付与部３は、上記テキスト解析部２に
よって分割された形態素に読み方を付与する。複数の読
み方が存在する場合には、夫々の読み方にはその読み方
の可能性の度合いを表す尤度が付与されて総ての読み方
が出力される。解析辞書メモリ４には、テキスト解析部
２がテキスト解析を行う際に必要な単語表記,読み,品詞
等の言語データが格納されている。

【００４０】語彙作成部５は、上記テキスト解析部２に
よるテキスト解析結果と読み付与部３による読み付与結
果を元に、音声認識を行うために必要な音声認識用辞書
を作成する。語彙記憶部６は、語彙作成部５によって作
成された音声認識用辞書を記憶する。そして、この音声
認識用辞書は音声認識時に使用される。

【００４１】リンク先文字列抽出部７は、入力文字列中
に存在するリンク情報で指定されているリンク先の文字
列を抽出し、抽出結果をテキスト解析部２に送出するよ
うになっている。したがって、テキスト解析部２では、
上記入力文字列中に存在するリンク情報で指定されたリ
ンク先の文字列をもテキスト解析の対象とするのであ
る。

【００４２】ここで、上記ＨＴＭＬに代表されるページ
記述言語を例に、リンク先文字抽出部７の機能について
説明する。上記リンク情報とは、図２に例示するような
記述をさし、リンク先８とリンク文字列９とで構成され
ている。リンク先８には、ＵＲＬ(ユニフォーム・リソー
ス・ロケーション)に代表されるアドレス情報が記載され
ている。このアドレスにあるファイルに、リンク先文字
抽出部７が抽出する文字列が含まれているのである。図
２においては、１０,１１がリンク先のファイルであ
る。また、リンク文字列９は上記ＷＷＷブラウザによっ
て表示されている文字列である。

【００４３】ＨＴＭＬ文書をＷＷＷブラウザによって表
示し、リンク文字列９をクリックすることによって、リ
ンク先に記述されているＨＴＭＬ文書を表示することが
できるのであるが、本実施の形態においては、上記ＷＷ
Ｗブラウザとは無関係に、リンクで関連づけられたハイ
パーテキスト文書(例えばＨＴＭＬ文書)から音声認識用
辞書を作成するのである。尚、リンク先文字列抽出部７
によって行われるリンク情報で指定されているＵＲＬの
情報を取得する方法については、上記ＷＷＷブラウザが
取得する方法と同じであるため、ここでは述べない。

【００４４】次に、上記構成を有する音声認識用辞書作
成装置による音声認識用辞書作成処理動作について、図
３のフローチャートに従って説明する。ハイパーテキス
ト文書の最初のファイルに記述されている文字列情報が
テキスト解析部２およびリンク先文字列抽出部７に取り
込まれる。そうすると、ステップＳ1で、テキスト解析
部２によって、入力された文字列情報に対して形態素解
析処理が行われ、予め解析辞書メモリ４に格納されてい
る単語辞書との照合によって単語単位に分割される。
尚、上記単語辞書には、単語表記,読み,品詞等の情報が
記憶されている。ステップＳ2で、上記分割された単語
がリンク情報を表す単語であるか否かが判別される。こ
のリンク情報であるか否かは、例えばＨＴＭＬであれば
「＜」,「Ａ」,「ＨＲＥＦ」,「＞」という文字列で構成される
か否かで判定できる。尚、図１５に示すファイル１３１
の場合には、「＜A HREF＝"oosakafu,htm"＞」の部分がリ
ンク情報と判定されることになる。その結果、上記リン
ク情報を表す単語であればステップＳ3に進み、そうで
なければステップＳ5に進む。

【００４５】次に、ステップＳ3で、上記リンク先文字
列抽出部７によって、上記リンク情報に基づいてリンク
先の文字列が抽出される。図１５に示すファイル１３１
の場合には、「oosakafu.htm」がリンク先を示しているた
め、このリンク先のファイルの文字列「大阪市」(ファイ
ル１３２参照)が抽出されるのである。こうして抽出さ
れた文字列は、テキスト解析部２に送出される。ステッ
プＳ4で、テキスト解析部２によって、上記リンク先の
ファイルから抽出された文字列に関して、ステップＳ1
と同様にして形態素解析処理が行われて単語単位に分割
される。

【００４６】ステップＳ5で、上記読み付与部３によっ
て、上記テキスト解析部２によって分割された単語の夫
々に読みが付与される。尚、上記読みは、上記単語辞書
に登録されている読みが用いられる。その際に、読み方
の可能性が複数ある場合には複数付与される。図１５に
示すファイル１３１の場合には、リンク情報ではない
「都道府県」,「リスト」等の単語に「とどうふけん」,「りす
と」の読みが付与される。さらに、本実施の形態におい
ては、上記リンク先の文字列で成る単語「大阪市」,「堺
市」等にも「おおさかし」,「さかいし」の読みが付与される
のである。

【００４７】次に、ステップＳ6で、上記語彙作成部５
によって、上記読み付与部３によって付与された読みに
基づいて音声認識用辞書が作成される。すなわち、「都
道府県」の読み情報「とどうふけん」に基づいて、「t o d
o o f u k e ng」と言う音声認識処理時に認識可能な音
素表記が生成されるのである。さらに、本実施の形態に
おいては、上記リンク情報に基づくリンク先の単語「大
阪市」,「堺市」の読み「おおさかし」,「さかいし」に基づい
て、音素表記「o o s a k a sh i」,「s a k a i shi」が生
成されるのである。

【００４８】次に、ステップＳ7で、上記語彙作成部５
によって、上記形態素解析処理の結果得られた単語表記
「都道府県」と上記ステップＳ6において生成された音素
表記「t o d o o f u k e ng」との対「都道府県：t o d
o o f u k e ng」が、語彙記憶部６に記憶された音声認
識用辞書に追加登録される。さらに、本実施の形態にお
いては、上記リンク先の単語についても「大阪市：o o s
a k a sh i」,「堺市：s a k a i sh i」のごとく追加登
録される。尚、語彙記憶部６としては、フラッシュメモ
リやハードディスク等の一般的に広く使用されている記
憶装置が用いられる。ステップＳ8で、テキスト解析部
２に対する入力文字列が終りか否かが判別される。その
結果、終りでなければ上記ステップＳ1に戻って次の文
字列の解析に移行し、終りであれば音声認識用辞書作成
処理動作を終了する。

【００４９】上述したように、本実施の形態における音
声認識用辞書作成装置は、リンク先文字列抽出部７を有
している。そして、ＨＴＭＬ文書等のハイパーテキスト
文書に対するテキスト解析部２による形態素解析処理の
結果入力文字列から分割された単語がリンク情報である
場合には、リンク先文字列抽出部７によって、上記リン
ク情報に基づいてリンク先の文字列を抽出し、テキスト
解析部２に返すようになっている。したがって、以後、
読み付与部３および語彙作成部５によって、ハイパーテ
キスト文書における最初のファイルの文字列と同様に、
上記リンク先のファイルの文字列に対しても読み付与お
よび音声認識用辞書の作成(音素表記の生成)が行われる
のである。

【００５０】すなわち、本実施の形態によれば、ハイパ
ーテキスト文書による一つのファイルを指定するだけ
で、そのファイル上の文字列は元より、当該ファイルか
ら張られているリンク先のファイルの文字列をも音声認
識用辞書作成の対象とすることができる。したがって、
関連する語彙を一度に沢山音声認識用辞書に登録するこ
とができるのである。

【００５１】＜第２実施の形態＞本実施の形態は、ハイ
パーテキスト文書によるファイルから張られているリン
クリンクを順次辿る際に、その辿るリンクの制御を行う
ものに関する。

【００５２】図４は、本実施の形態の音声認識用辞書作
成装置におけるブロック図である。図４において、テキ
スト解析部２２,読み付与部２３,解析辞書メモリ２４,
語彙作成部２５,語彙記憶部２６およびリンク先文字列
抽出部２７は、上記第１実施の形態において図１に示す
テキスト解析部２,読み付与部３,解析辞書メモリ４,語
彙作成部５,語彙記憶部６およびリンク先文字列抽出部
７と同様である。

【００５３】本実施の形態においては、リンク制御部２
８を有している。このリンク制御部２８は、リンク先文
字列抽出部２７が上記リンク先の文字列を抽出するため
にリンクを順次辿る際に、リンク先文字列抽出部２７が
辿るリンク先を制御するのである。

【００５４】以下、上記構成を有する音声認識用辞書作
成装置による音声認識用辞書作成処理動作について、図
５のフローチャートに従って説明する。

【００５５】ステップＳ11〜ステップＳ13で、図３に示
す上記第１実施の形態の音声認識用辞書作成処理動作に
おけるステップＳ1〜ステップＳ3の場合と同様にして、
入力された文字列情報の単語分割、上記分割単語がリン
ク情報であるか否かの判別、リンク情報である場合のリ
ンク先文字列の抽出が行われる。その場合、リンク元の
ファイルの未処理の文字列は、ＲＡＭ(ランダム・アクセ
ス・メモリ)(図示せず)等に設定された作業領域に待避さ
れる。そうした後に、上記ステップＳ11に戻って、上記
抽出されたリンク先文字列に対する形態素解析処理に移
行する。その際に、上記リンク先文字列にリンク情報が
ある場合には、さらにそのリンク文字列に張られたリン
ク先の文字列が抽出されて、形態素解析処理が行われ
る。こうして、ステップＳ12においてリンク情報である
と判別される毎に、リンク制御部２８の制御の下にリン
クを辿って行くのである。その際に、リンク制御部２８
は、リンク元を記憶/管理するようになっている。した
がって、リンク先文字列抽出部２７を制御して、繰り返
してリンクを辿ったり遡ったりすることができるのであ
る。そして、ステップＳ12においてリンク情報は無いと
判別されるとステップＳ14に進む。

【００５６】ステップＳ14〜ステップＳ16で、図３に示
す音声認識用辞書作成処理動作におけるステップＳ5〜
ステップＳ7の場合と同様にして、読みの付与、読みに
基づく音声認識用辞書の作成(音素表記の生成)、音声認
識用辞書の語彙記憶部２６への格納が行われる。

【００５７】ステップＳ17で、現在のファイルに関して
入力文字列が終りであるか否かが判別される。その結
果、終りでなければ上記ステップＳ11に戻って、当該フ
ァイルにおける次の文字列の解析に移行し、終りであれ
ばステップＳ18に進む。ステップＳ18で、リンク制御部
２８によって、リンク元の記憶内容に基づいて当該ファ
イルのリンク元があるか否かが判別される。その結果、
リンク元があればステップＳ19に進み、無ければ音声認
識用辞書作成処理動作を終了する。

【００５８】ステップＳ19で、上記リンク制御部２８に
よって、リンク先文字列抽出部２７が制御されてリンク
元に遡り、上記待避されているリンク元ファイルの未処
理の文字列が読み出される。そうした後、上記ステップ
Ｓ11に戻って、読み出されたリンク元の文字列の解析に
移行する。こうして、ハイパーテキスト文書における最
初のファイルに出現する総ての文字列と総てのリンク情
報に基づく総てのリンクファイルに関する総ての文字列
との処理が終了するまでステップＳ11〜ステップＳ19の
処理が繰り返される。そして、上記ステップＳ17におい
て入力文字列は終りであると判別され、且つ、ステップ
Ｓ18においてリンク元が無いと判別されると、最初のフ
ァイルの最後の文字列に対する処理が終了したことにな
る、すなわち、辿れるリンクを総て辿って総てのファイ
ルの総ての文字列を用いて音声認識用辞書が作成された
ことになる。したがって、音声認識用辞書作成処理動作
を終了するのである。

【００５９】以上の処理について、図１５に示すファイ
ル１３１の場合を例に説明すると、先ずファイル１３１
に関する文字列が解析される。ここで、単語「大阪府」は
リンク文字列であるのでファイル１３２に文字列解析が
移行する。さらに、ファイル１３２の中における単語
「大阪市」はリンク文字列であるのでファイル１３３に文
字列解析が移行する。そして、ファイル１３３に関する
総ての文字列の解析が終了すれば、リンク元のファイル
であるファイル１３２に関する文字列の解析に戻って、
単語「大阪市」の続きの文字列の解析に移行する。そし
て、ファイル１３２に関する総ての文字列の解析が終了
すれば、リンク元のファイルであるファイル１３１に関
する文字列の解析に戻って、単語「大阪府」の続きの文字
列の解析に移行する。そして、ファイル１３１に関する
文字列の解析が終了すれば、文字列もリンク元も無いの
で、音声認識用辞書作成処理を終了するのである。尚、
ファイル１３２に戻って単語「大阪市」の続きの文字列解
析を行う際に単語「堺市」はリンク情報であるので、その
場合には単語「堺市」のリンク先のファイルに移行するこ
とになる。

【００６０】以上のように、本実施の形態においては、
上記リンク先文字列抽出部２７におけるリンクの辿り方
を制御するリンク制御部２８を設けている。したがっ
て、ハイパーテキスト文書による最初のファイルに張ら
れたリンクを順次辿って、総てのリンク先のファイルに
記述されている総ての文字列から自動的に音声認識用辞
書を作成することができるのである。

【００６１】＜第３実施の形態＞上記第２実施の形態に
おいては、上記リンク制御部２８による制御の下に、リ
ンク先文字列抽出部２７は、ハイパーテキスト文書によ
る最初のファイルに張られたリンクを総て辿って、総て
のリンク先のファイルに記述されている文字列に関して
形態素解析処理を行うようにしている。したがって、大
規模なハイパーテキスト文書の場合には不必要なリンク
まで辿ることになり、音声認識処理用辞書の作成に無駄
な時間が浪費されたり、作成された音声認識処理用辞書
に無意味な語彙が登録される場合が生ずる。本実施の形
態は、不必要なリンクまで辿ることを防止するものに関
する。

【００６２】図６は、本実施の形態の音声認識用辞書作
成装置におけるブロック図である。図６において、テキ
スト解析部３２,読み付与部３３,解析辞書メモリ３４,
語彙作成部３５,語彙記憶部３６およびリンク先文字列
抽出部３７は、上記第１実施の形態において図１に示す
テキスト解析部２,読み付与部３,解析辞書メモリ４,語
彙作成部５,語彙記憶部６およびリンク先文字列抽出部
７と同様である。

【００６３】本実施の形態においては、リンク上限記憶
部３９を有している。このリンク上限記憶部３９には、
リンク先文字列抽出部３７がリンクを辿る際におけるフ
ァイル階層の上限値が記憶されている。そして、リンク
制御部３８は、リンク上限記憶部３９に記憶されたファ
イル階層の上限値を越えないようにリンク先文字列抽出
部３７の動作を制御するのである。

【００６４】以下、上記構成を有する音声認識用辞書作
成装置による音声認識用辞書作成処理動作について、図
７のフローチャートに従って説明する。ここで、リンク
上限記憶部３９にはファイル階層の上限値「Ｍ」が記憶さ
れているものとする。

【００６５】ステップＳ21で、上記リンク制御部３８に
よって、リンク先のファイル階層を数えるために上記Ｒ
ＡＭ等に設定された変数記憶領域の変数Ｎが「１」に初期
化される。

【００６６】ステップＳ22,ステップＳ23で、図５に示
す上記第２実施の形態の音声認識用辞書作成処理動作に
おけるステップＳ11,ステップＳ12の場合と同様にし
て、入力された文字列情報の単語分割、上記分割単語が
リンク情報であるか否かの判別が行われる。そして、上
記リンク情報であればステップＳ24に進み、そうでなけ
ればステップＳ27に進む。

【００６７】ステップＳ24で、上記リンク制御部３８に
よって、辿るリンクの階層が一つ増えるのでＮの値がイ
ンクリメントされる。ステップＳ25で、リンク制御部３
８によって、Ｎの値が上記上限値Ｍよりも大きいか否か
が判別される。その結果、Ｎ＞ＭであればステップＳ32
に進み、Ｎ≦ＭであればステップＳ26に進む。ステップ
Ｓ26で、図５に示す音声認識用辞書作成処理動作におけ
るステップＳ13の場合と同様にして、リンク先文字列の
抽出が行われる。そうした後に、上記ステップＳ22に戻
って、上記抽出されたリンク先文字列に対する形態素解
析処理に移行する。

【００６８】ステップＳ27〜ステップＳ31で、図５に示
す音声認識用辞書作成処理動作におけるステップＳ14〜
ステップＳ18の場合と同様にして、読みの付与、読みに
基づく音声認識用辞書の作成(音素表記の生成)、音声認
識用辞書の語彙記憶部３６への格納、入力文字列が終り
であるか否かの判別、終りの場合のリンク元有無の判別
が行われる。その結果、リンク元があればステップＳ32
に進み、無ければ音声認識用辞書作成処理動作を終了す
る。

【００６９】ステップＳ32で、上記リンク制御部３８に
よって、リンク元の階層に戻るためＮの値がデクリメン
トされる。ステップＳ33で、上記待避されているＮ階層
のファイルにおける未処理の文字列が読み出される。そ
うした後、上記ステップＳ22に戻って、読み出されたリ
ンク元の文字列の解析に移行する。こうして、最初のフ
ァイルに出現する総ての文字列とＭ階層までのリンクフ
ァイルに関する総ての文字列との処理が終了するまでス
テップＳ22〜ステップＳ33の処理が繰り返される。そし
て、上記ステップＳ30において入力文字列は終りである
と判別され、且つ、ステップＳ31においてリンク元が無
いと判別されると、音声認識用辞書作成処理動作を終了
するのである。

【００７０】以上の処理について、図１５に示すファイ
ル１３１の場合を例に説明する。ここで、リンク上限記
憶部３９に格納されるファイル階層の上限値は「２」であ
るとする。これは、リンクを３階層以上辿らないことを
意味する。先ず、ファイル１３１に関する文字列が解析
される。この場合、変数Ｎは「１」である。そして、ファ
イル１３２の文字列解析に移行すると変数Ｎは「２」とな
る。さらに、ファイル１３２の中におけるリンク文字列
「大阪市」のリンク先の文字列を抽出しようとすると、変
数Ｎは「３」となって上記上限値を越えるので変数Ｎの値
は「２」に戻される。そして、ファイル１３２に関する文
字列の解析処理が続行されるのである。尚、ファイル１
３２中のリンク文字列「堺市」のリンク先の文字列を抽出
しようとする場合も同様である。

【００７１】以上のように、本実施の形態においては、
リンクを辿る際におけるファイル階層の上限値を記憶す
るリンク上限記憶部３９を設けている。そして、リンク
制御部３８がリンク先文字列抽出部３７の動作を制御す
る際には、リンク上限記憶部３９に記憶された上記上限
値を越えないようにしている。したがって、大規模なハ
イパーテキスト文書の場合に、リンク先を次々と辿って
行くことで処理が終了しなくなることを防止できる。

【００７２】また、不必要なリンクまで辿ることを防止
すると共に、ある階層レベルまでのリンク先のファイル
を対象とした音声認識用辞書を作成することができる。
したがって、例えば、図１５に例示するＨＴＭＬ文書に
基づいて、「都道府県」と「市」との名称のみの音声認識用
辞書や、「都道府県」と「市」と「町」との名称を含む音声認
識用辞書等を作成することができるのである。

【００７３】＜第４実施の形態＞上記第３実施の形態に
おいては、リンクを辿る際におけるファイル階層の上限
値を定めて、処理が終了しなくなったり、不必要なリン
クまで辿ることを防止している。本実施の形態は、リン
ク先ファイルがリンク元ファイルと同一の場所に格納さ
れていない場合には、リンクを辿らないようにするもの
に関する。

【００７４】図８は、本実施の形態の音声認識用辞書作
成装置におけるブロック図である。図８において、テキ
スト解析部４２,読み付与部４３,解析辞書メモリ４４,
語彙作成部４５,語彙記憶部４６およびリンク先文字列
抽出部４７は、上記第１実施の形態において図１に示す
テキスト解析部２,読み付与部３,解析辞書メモリ４,語
彙作成部５,語彙記憶部６およびリンク先文字列抽出部
７と同様である。

【００７５】本実施の形態においては、ファイル記憶場
所判定部４９を有している。このファイル記憶場所判定
部４９は、リンク先ファイルとリンク元ファイルとが同
一の場所に格納されている否かを判定する。ここで、上
記同一の場所とは、例えば同一のマシンや同一のディレ
クトリ等を意味する。そして、リンク制御部４８は、フ
ァイル記憶場所判定部４９による判定結果に応じて、リ
ンク先を辿るか否かを判定するのである。したがって、
リンク元ファイルとリンク先ファイルとが異なるマシン
や異なるディレクトリにある場合は、リンク先を辿らな
いようにリンク先文字列抽出部４７を制御できるのであ
る。

【００７６】以下、上記構成を有する音声認識用辞書作
成装置による音声認識用辞書作成処理動作について、図
９のフローチャートに従って説明する。ここで、上記Ｒ
ＡＭ等には、文字列解析の対象となるファイルが記憶さ
れているマシンやディレクトリ等の場所を登録するファ
イル記憶場所登録領域が設定されている。

【００７７】ステップＳ41,ステップＳ42で、図５に示
す上記第２実施の形態の音声認識用辞書作成処理動作に
おけるステップＳ11,ステップＳ12の場合と同様にし
て、入力された文字列情報の単語分割、上記分割単語が
リンク情報であるか否かの判別が行われる。そして、上
記リンク情報であればステップＳ43に進み、そうでなけ
ればステップＳ45に進む。

【００７８】ステップＳ43で、上記リンク制御部４８に
よって、リンク元のファイル(現在のファイル)の記憶場
所がファイル記憶場所判定部４９に送出される。そし
て、ファイル記憶場所判定部４９によって、上記ファイ
ル記憶場所登録領域が参照されて、リンク先ファイルの
記憶場所とリンク元ファイルの記憶場所とが同一である
か否かが判定される。その結果、同一であればステップ
Ｓ44に進み、異なればステップＳ50に進む。ステップＳ
44で、図５に示す音声認識用辞書作成処理動作における
ステップＳ13の場合と同様にして、リンク先文字列の抽
出が行われる。そうした後に、上記ステップＳ41に戻っ
て、上記抽出されたリンク先文字列に対する形態素解析
処理に移行する。

【００７９】ステップＳ45〜ステップＳ50で、図５に示
す音声認識用辞書作成処理動作におけるステップＳ14〜
ステップＳ19の場合と同様にして、読みの付与、読みに
基づく音声認識用辞書の作成(音素表記の生成)、音声認
識用辞書の語彙記憶部４６への格納、入力文字列が終り
であるか否かの判別、終りである場合のリンク元有無の
判別、リンク元ファイルの未処理文字列の読み出されが
行われる。そうした後に、上記ステップＳ41に戻って、
読み出されたリンク元の文字列の解析に移行する。こう
して、最初のファイルに出現する総ての文字列と最初の
ファイルと同じ場所に記憶された総てのリンクファイル
に関する総ての文字列との処理が終了するまで、ステッ
プＳ41〜ステップＳ50の処理が繰り返される。そして、
上記ステップＳ48において入力文字列は終りであると判
別され、且つ、ステップＳ49においてリンク元が無いと
判別されると、音声認識用辞書作成処理動作を終了する
のである。

【００８０】以上の処理について、図１５に示すファイ
ル１３１を例に説明する。尚、ファイルの記憶場所とし
て、市レベル以上のファイルを「high_level」、区町村レ
ベル以下のファイルを「low_level」なる２つのディレク
トリに分けて記憶しているものとする。

【００８１】上記最初のファイル１３１とリンク文字列
「大阪府」のリンク先ファイル１３２とは、「high_level」
という共通の場所に記憶されている。そのため、リンク
先ファイル１３２に関する文字列の抽出が行われる。次
に、ファイル１３２とリンク文字列「大阪市」のリンク先
ファイル１３３とは、「high_leve1」と「1ow_leve1」との
異なる場所に記憶されている。そのために、リンク先フ
ァイル１３３に関する文字列の抽出は行わないのであ
る。

【００８２】以上のように、本実施の形態においては、
リンク先ファイルとリンク元ファイルとが同一の場所に
格納されている否かを判定するファイル記憶場所判定部
４９を設けている。そして、リンク制御部４８がリンク
先文字列抽出部４７の動作を制御する際には、ファイル
記憶場所判定部４９の判定結果に基づいて、リンク元フ
ァイルとリンク先ファイルとが異なる場所に記憶されて
いる場合にはリンク先を辿らないようにしている。した
がって、リンク先を次々と辿って行くことで処理が終了
しなくなることを防止できる。

【００８３】また、不必要なリンクまで辿ることを防止
すると共に、ある階層レベルまでのリンク先のファイル
を対象とした音声認識用辞書を作成することができる。
したがって、例えば、図１５に例示するＨＴＭＬ文書に
基づいて、「都道府県」と「市」との名称のみの音声認識用
辞書や、「都道府県」と「市」と「町」との名称を含む音声認
識用辞書等を作成することができるるのである。

【００８４】＜第５実施の形態＞本実施の形態は、上記
第１実施の形態における音声認識用辞書作成装置によっ
て作成された音声認識用辞書を搭載した音声認識装置に
関するものである。図１０は、図１に示す音声認識用辞
書作成装置を搭載した音声認識装置のブロック図であ
る。音声認識用辞書作成装置５１を構成するテキスト解
析部５３,読み付与部５４,解析辞書メモリ５５,語彙作
成部５６,語彙記憶部５７およびリンク先文字列抽出部
５８は、図１に示す上記第１の実施の形態におけるテキ
スト解析部２,読み付与部３,解析辞書メモリ４,語彙作
成部５,語彙記憶部６およびリンク先文字列抽出部７と
同様である。

【００８５】一方、音声認識装置５２は、音響分析部５
９,尤度計算部６０,音響モデル格納部６１および照合部
６２で構成される。そして、第１の実施の形態で述べた
方法によって予め作成されて語彙記憶部５７に記憶され
た音声認識用辞書(認識語彙情報)を用いて、マイクに入
力された音声を認識するのである。

【００８６】上記音響分析部５９は、マイクから入力さ
れた音声のアナログ波形をディジタル波形に変換し、例
えば２０msec〜４０msec程度の短い時間間隔(フレーム)
毎に周波数分析し、スペクトルを表すパラメータのベク
トル系列に変換する。周波数分析にはＬＰＣ(線形予測
分析)メルケプストラム等が用いられる。

【００８７】上記尤度計算部６０は、音響分析部５９か
らの入力音声のパラメータベクトルを用いて、音響モデ
ル格納部６１に格納されたＨＭＭ(隠れマルコフモデル)
等の音韻毎の音響モデルの尤度を計算する。こうして、
各音韻の尤度を求めるのである。照合部６２は、求めら
れた各音韻の尤度と語彙記憶部５７に登録されている総
ての認識語彙(単語)との照合を行ない、全認識語彙のス
コアを算出する。そして、上位所定値以上のスコアを呈
する認識語彙でなる認識候補を認識結果として出力する
のである。

【００８８】以上のように、本実施の形態においては、
音声認識装置５２は、上記第１実施の形態の音声認識用
辞書作成装置によって作成された音声認識用辞書が格納
された語彙記憶部５７を有している。そして、照合部６
２によって、尤度計算部６０で求められた各音韻の尤度
と語彙記憶部５７に登録されている総ての認識語彙の音
韻系列との照合を行ない、全認識語彙のスコアを算出す
るようにしている。

【００８９】したがって、本実施の形態によれば、上記
音声認識用辞書作成装置５１による音声認識用辞書作成
時に用いたハイパーテキスト文書上の単語を発声して音
声認識装置５２で音声認識する場合に、最初のファイル
上の単語は元より、リンク先ファイル上の単語に対して
も、高い認識率を得ることができるのである。

【００９０】尚、本実施の形態における音声認識装置に
おいては、上記第１実施の形態における音声認識用辞書
作成装置を搭載するようにしている。しかしながら、こ
の発明の音声認識装置は、少なくとも上記音声認識用辞
書作成装置によって作成された音声認識用辞書(音声認
識語彙)が搭載されていればよく、テキスト解析部５３,
読み付与部５４,解析辞書メモリ５５,語彙作成部２６お
よびリンク先文字列抽出部５８は、音声認識装置５２と
は独立して設けても差し支えない。

【００９１】＜第６実施の形態＞本実施の形態は、上記
第１実施の形態における音声認識用辞書作成装置によっ
て作成された音声認識用辞書を搭載した音声認識装置の
他の例に関するものであり、上記音声認識装置による認
識結果に応じた識別子を出力するものである。

【００９２】図１１は、図１に示す音声認識用辞書作成
装置を搭載した音声認識装置のブロック図である。音声
認識用辞書作成装置７１を構成するテキスト解析部７
３,読み付与部７４,解析辞書メモリ７５,語彙作成部７
６,語彙記憶部７７およびリンク先文字列抽出部７８、
音声認識装置７２を構成する音響分析部７９,尤度計算
部８０,音響モデル格納部８１および照合部８２は、上
記第５の実施の形態におけるテキスト解析部５３,読み
付与部５４,解析辞書メモリ５５,語彙作成部５６,語彙
記憶部５７,リンク先文字列抽出部５８,音響分析部５
９,尤度計算部６０,音響モデル格納部６１および照合部
６２と同様である。

【００９３】識別子記憶部８３は、上記語彙記憶部７７
に記憶された音声認識語彙に関連付けられた識別子を記
憶している。識別子出力部８４は、音声認識装置７２の
認識結果に基づいて識別子記憶部８３に記憶された識別
子から一つを選択して出力する。以下、この識別子につ
いて、図１２に示すハイパーテキスト文書を用いて音声
認識用辞書を作成する場合を例に説明する。

【００９４】図１２は、電子番組データが記述された文
字列ファイルを示す。電子番組表本体(最初のファイル)
８５には、番組タイトル,放送日時,放送局,番組内容に
関するホームページのＵＲＬが記載されている。ある番
組のホームページ８６には、その番組に関する詳細な情
報が記載されている。

【００９５】本実施の形態の音声認識用辞書作成装置７
１は、上記第５の実施の形態における音声認識用辞書作
成装置の場合と同様にして、電子番組表本体８５に記述
された文字列を解析して音声認識用辞書を作成して語彙
記憶部５７に記憶する。その結果、電子番組表本体８５
に記述された「朝」,「ニュース」,「洋画」,「劇場」等の単語
が音声認識用辞書に登録される。また、リンク先の番組
ホームページ５６に記述されている文字列から「ゴール
デン」,「ＧＴＯ」等の単語が音声認識用辞書に登録され
る。

【００９６】このようにして作成された音声認識用辞書
を用いてテレビ番組を指定したり予約したりする場合に
は、音声認識結果としての単語と番組との対応をとる必
要がある。そのために利用するのが識別子(図１２に示
す例の場合では番組ＩＤ番号)である。つまり、識別子
記憶部８３には、番組ＩＤ「００１」が音声認識用辞書に
登録された音声認識語彙「朝」,「ニュース」等に対応付け
られ、番組ＩＤ「００２」が音声認識語彙「洋画」,「劇場」,
「ゴールデン」,「ＧＴＯ」等に対応付けられて記憶される
のである。

【００９７】ここで、重要なのは、上記リンク先の文字
列にはリンク元のリンク文字列の場合と同じ識別子を対
応付ける点である。例えば、番組ＩＤが記述されたファ
イルのリンク先にある単語「ゴールデン」,「ＧＴＯ」に対
しては、リンク元の番組ＩＤ「００２」が対応付けるの
である。このような対応付けは、音声認識用辞書作成装
置７１のリンク先文字列抽出部７８の機能により、リン
ク先の番組ホームページ５６に記述されている単語が音
声認識用辞書に登録されることによって、始めて実現可
能になるのである。

【００９８】上記構成の音声認識用辞書作成装置を搭載
した音声認識装置では、「朝のニュース」と発声した場合
に、音声認識装置７２によって「朝」,「ニュース」等の単
語が認識され、認識結果が識別子出力部８４に送出され
る。そうすると、識別子出力部８４は、識別子記憶部８
３から、認識結果「朝」,「ニュース」等に対応付けられて
いる識別子番組ＩＤ「００１」を出力する。同様に、リン
ク先のファイルに記述されている文字列「ゴールデン洋
画劇場」,「ＧＴＯ」を発声した場合にも、音声認識結果
「ゴールデン」,「洋画劇場」,「ＧＴＯ」等が得られ、識別子
出力部８４によって、認識結果「ゴールデン」,「洋画劇
場」,「ＧＴＯ」等に対応付けられている識別子番組ＩＤ
「００２」を出力するのである。

【００９９】このように、本実施の形態においては、上
記第５の実施の形態における構成に加えて、語彙記憶部
５７に記憶された音声認識語彙に関連付けられた識別子
を記憶する識別子記憶部８３と、音声認識装置７２の認
識結果に基づいて識別子記憶部８３に記憶された識別子
を選択して出力する識別子出力部８４を備えている。し
たがって、あるハイパーテキスト文書を用いて作成した
音声認識用辞書を語彙記憶部７７に記憶し、上記音声認
識用辞書の音声認識語彙に関連付けた識別子を識別子記
憶部８３に記憶しておくことによって、ユーザが当該ハ
イパーテキスト文書における下層ファイルに記述された
単語を発声しても、その単語に対応付けられた識別子を
出力することができる。

【０１００】すなわち、本実施の形態によれば、ハイパ
ーテキスト文書に記述された単語を発声して情報処理の
指示を行う場合に、単語の発声に自由度を持たせてより
使い易い情報処理装置を構築可能するのである。

【０１０１】尚、上述においては、電子テレビ番組デー
タから番組選択する場合を例に説明したが、リンク情報
を含む文字列情報であれば何にでも適用できる。特に、
テレビ番組のように定期的に更新されるディジタル情報
の場合には、その都度更新後の電子テレビ番組データか
ら自動的に音声認識用辞書を作成できるため、手間を掛
けずに一定の認識率を確保でき、且つ、ユーザの自由な
発声にも対応できるため有効である。新聞記事やロード
ショーの情報等を音声で呼び出す用途にも、本音声認識
装置は適用可能である。

【０１０２】＜第７実施の形態＞本実施の形態は、上記
第１実施の形態における音声認識用辞書作成装置によっ
て作成された音声認識用辞書を搭載した音声認識装置の
他の例に関するものであり、上記出力された識別子に応
じた操作手順を実行するものである。

【０１０３】図１３は、図１に示す音声認識用辞書作成
装置を搭載した音声認識装置のブロック図である。音声
認識用辞書作成装置９１を構成するテキスト解析部９
３,読み付与部９４,解析辞書メモリ９５,語彙作成部９
６,語彙記憶部９７およびリンク先文字列抽出部９８、
音声認識装置９２を構成する音響分析部９９,尤度計算
部１００,音響モデル格納部１０１および照合部１０２
は、上記第５の実施の形態におけるテキスト解析部５
３,読み付与部５４,解析辞書メモリ５５,語彙作成部５
６,語彙記憶部５７,リンク先文字列抽出部５８,音響分
析部５９,尤度計算部６０,音響モデル格納部６１および
照合部６２と同様である。また、識別子記憶部１０３お
よび識別子出力部１０４は、上記第６の実施の形態にお
ける識別子記憶部８３および識別子出力部８４と同様で
ある。

【０１０４】操作手順記憶部１０５には、装置の操作手
順が、上記識別子記憶部１０３に記憶された識別子に対
応付けられて記憶されている。操作手順実行部１０６
は、識別子出力部１０４から受け取った識別子に基づい
て、操作手順記憶部１０５を参照して装置の操作手順を
得、上記装置の操作を実行する。

【０１０５】上記操作手順記憶部１０５および操作手順
実行部１０６の動作に付いて、図１２に示す電子番組デ
ータが記述された文字列ファイルを用いて音声認識用辞
書を作成した場合を例に説明する。

【０１０６】上記操作手順記憶部１０５には、例えば、
番組ＩＤに対応付けられて、その番組が既に録画されて
いる場合にはビデオレコーダを操作して当該番組を再生
する手順、当該番組が未録画であって放送日時以前であ
る場合にはビデオレコーダを操作して当該番組を録画す
る手順、当該番組が未録画であって放送日時以後である
場合にはその旨を表示あるいは音声出力する手順、当該
番組が未録画であって放送日時以前である場合には放送
日時にテレビジョンをオンして選局する手順等を記憶し
ておく。

【０１０７】そして、ユーザが「洋画劇場」と発声する
と、識別子出力部１０４から音声認識結果「洋画劇場」に
応じた識別子として番組ＩＤ「００２」が操作手順実行部
１０６に送出される。そうすると、操作手順実行部１０
６は、操作手順記憶部１０３を参照し、ビデオレコーダ
やテレビジョンを操作して、番組ＩＤ「００２」に対応す
る１２月２３日２１:００時にフジテレビで放送の「洋画
劇場」の録画再生や録画や放映等を実行するのである。

【０１０８】以上のごとく、本実施の形態によれば、音
声を発声することによって機器の操作を自動的に実行す
るに際してユーザの発声に自由度を与え、使い易い情報
処理装置を提供することができるのである。

【０１０９】＜第８実施の形態＞本実施の形態は、上記
第１実施の形態における音声認識用辞書作成装置によっ
て作成された音声認識用辞書を搭載した音声認識装置の
他の例に関するものであり、上記出力された識別子に応
じた操作手順を実行するものである。

【０１１０】図１４は、図１に示す音声認識用辞書作成
装置を搭載した音声認識装置のブロック図である。音声
認識用辞書作成装置１１１を構成するテキスト解析部１
１３,読み付与部１１４,解析辞書メモリ１１５,語彙作
成部１１６,語彙記憶部１１７およびリンク先文字列抽
出部１１８、音声認識装置１１２を構成する音響分析部
１１９,尤度計算部１２０,音響モデル格納部１２１およ
び照合部１２２は、上記第５の実施の形態におけるテキ
スト解析部５３,読み付与部５４,解析辞書メモリ５５,
語彙作成部５６,語彙記憶部５７,リンク先文字列抽出部
５８,音響分析部５９,尤度計算部６０,音響モデル格納
部６１及び照合部６２と同様である。また、識別子記憶
部１２３,識別子出力部１２４,操作手順記憶部１２５お
よび操作手順実行部１２６は、上記第７の実施の形態に
おける識別子記憶部１０３,識別子出力部１０４,操作手
順記憶部１０５および操作手順実行部１０６と同様であ
る。

【０１１１】テレビ表示部１２７は、テレビ放送を受信
するチューナーを備えており、上記操作手順実行部１２
６の指示に従ってＣＲＴ(陰極線管)や液晶等のディスプ
レイに指定されたチャンネルの映像を表示する。録画部
１２８は、操作手順実行部１２６の指示に従って、テレ
ビ表示部１２７で受信したテレビ番組をビデオテープや
ハードディスク等の記録媒体に録画する。再生部１２９
は、操作手順実行部１２６の指示に従って、録画部１２
８で録画されたテレビ番組を再生してテレビ表示部１２
７等のディスプレイに表示する。

【０１１２】すなわち、本実施の形態によれば、上記構
成を備えることによって、ハイパーテキスト文書でなる
電子番組表に記述された番組名やその内容に拘る単語を
発声することによって、テレビ番組の表示や録画の設定
や録画映像の再生を自動的に行うことができる。その際
に、ユーザは、番組名を正確に発声しなくとも、リンク
先ファイルに記述してある「出演者名」や「料理名」等の番
組の内容を表す単語を発声しても上記操作を行うことが
できるのである。

【０１１３】尚、上記第５実施の形態〜第８実施の形態
における音声認識装置は、上記第１実施の形態における
音声認識用辞書作成装置あるいはこの音声認識用辞書作
成装置によって作成された音声認識用辞書を搭載してい
るが、上記第２実施の形態〜第４実施の形態における音
声認識用辞書作成装置あるいはこの音声認識用辞書作成
装置によって作成された音声認識用辞書を搭載しても差
し支えない。

【０１１４】上記各実施の形態における音声認識用辞書
作成装置で作成された音声認識用辞書を用いる音声認識
装置は、携帯電話や電子手帳等の携帯端末器に搭載する
ことが有効である。すなわち、このような携帯端末器に
おいては、操作指示を行う場合にはキー操作よりも発声
による方が操作性がよい。ところが、出先等においては
操作指示を行うための文言を予め決められている通りに
正確に発声するのは困難であり、そのような場合に対処
するための音声認識用辞書を利用者が作成するのは更に
困難である。

【０１１５】上記各実施の形態における音声認識用辞書
作成装置によれば、例えば、ハイパーテキスト文書化さ
れた電子テレビ番組表に基づいて音声認識用辞書を作成
し、音声によって録画予約を指示する場合を想定する
と、上記電子テレビ番組表の表層ファイルにリンクされ
た「番組ホームページ」のファイルに記述された単語をも
音声認識用辞書に登録することができる。したがって、
操作者が「放送日」を忘れてしまっても、上記「番組ホー
ムページ」のファイルに記述された「ゲスト名」等を発声
することによって、所望のテレビ番組を自動的に録画予
約することができるのである。したがって、このような
音声認識用辞書を用いる音声認識装置を搭載すること
は、携帯端末器用の音声合成装置として非常に有効なの
である。

【０１１６】ところで、上記各実施の形態における上記
テキスト解析部,読み付与部,語彙作成部,語彙記憶部,リ
ンク先文字列抽出部,リンク制御部およびファイル記憶
場所判定部による上記解析手段,読み付与手段,語彙作成
手段,語彙記憶手段,リンク先文字列抽出手段,リンク制
御手段およびファイル記憶場所判定手段としての機能
は、プログラム記録媒体に記録された辞書作成処理プロ
グラムによって実現される。上記実施の形態における上
記プログラム記録媒体は、ＲＯＭ(リード・オンリ・メモ
リ)でなるプログラムメディアである。あるいは、外部
補助記憶装置に装着されて読み出されるプログラムメデ
ィアであってもよい。尚、何れの場合においても、上記
プログラムメディアから辞書作成処理プログラムを読み
出すプログラム読み出し手段は、上記プログラムメディ
アに直接アクセスして読み出す構成を有していてもよい
し、ＲＡＭに設けられたプログラム記憶エリア(図示せ
ず)にダウンロードし、上記プログラム記憶エリアにア
クセスして読み出す構成を有していてもよい。尚、上記
プログラムメディアからＲＡＭの上記プログラム記憶エ
リアにダウンロードするためのダウンロードプログラム
は、予め本体装置に格納されているものとする。

【０１１７】ここで、上記プログラムメディアとは、本
体側と分離可能に構成され、磁気テープやカセットテー
プ等のテープ系、フロッピー（登録商標）ディスク,ハ
ードディスク等の磁気ディスクやＣＤ(コンパクトディ
スク)‐ＲＯＭ,ＭＯ(光磁気)ディスク,ＭＤ(ミニディス
ク),ＤＶＤ(ディジタルビデオディスク)等の光ディスク
のディスク系、ＩＣ(集積回路)カードや光カード等のカ
ード系、マスクＲＯＭ,ＥＰＲＯＭ（紫外線消去型ＲＯ
Ｍ),ＥＥＰＲＯＭ(電気的消去型ＲＯＭ),フラッシュＲ
ＯＭ等の半導体メモリ系を含めた、固定的にプログラム
を坦持する媒体である。

【０１１８】また、上記各実施の形態における音声認識
用辞書作成装置は、モデムを備えてインターネットを含
む通信ネットワークと接続可能な構成を有していれば、
上記プログラムメディアは、通信ネットワークからのダ
ウンロード等によって流動的にプログラムを坦持する媒
体であっても差し支えない。尚、その場合における上記
通信ネットワークからダウンロードするためのダウンロ
ードプログラムは、予め本体装置に格納されているもの
とする。あるいは、別の記録媒体からインストールされ
るものとする。

【０１１９】尚、上記記録媒体に記録されるものはプロ
グラムのみに限定されるものではなく、データも記録す
ることが可能である。

【０１２０】

【発明の効果】以上より明らかなように、第１の発明の
音声認識用辞書作成装置は、テキスト解析手段,読み付
与手段,語彙作成手段および語彙記憶手段を有すると共
に、上記テキスト解析手段によってリンク情報であると
判定された構成単語におけるリンク先の文字列を抽出し
て、上記テキスト解析手段に送出するリンク先文字列抽
出手段を有するので、ハイパーテキスト文書における表
層ファイルに記述された単語は元より、表層ファイルの
単語にリンクされたリンク先ファイルに記述された単語
をも用いて音声認識用辞書を作成することができる。

【０１２１】すなわち、ハイパーテキスト文書における
一つのファイルを指定するだけで、そのファイルから張
られているリンク先のファイルの文字列も音声認識辞書
作成の対象とすることができるのである。

【０１２２】また、１実施例の音声認識用辞書作成装置
は、リンク制御手段によって、リンク元情報を管理し
て、上記リンク先文字列抽出手段が次に辿るリンク先を
制御するので、リンク先ファイルの文字列に対する上記
テキスト解析手段,読み付与手段,語彙作成手段および語
彙記憶手段による処理が終了すると、リンク元ファイル
の未処理文字列に対する処理に戻ることができる。した
がって、上記ハイパーテキスト文書における総てのファ
イルに記述された総ての文字列に基づいて音声認識用辞
書を作成することができる。

【０１２３】また、１実施例の音声認識用辞書作成装置
は、上記リンク制御手段によって、リンク上限記憶部に
記憶されたリンク先文字列の階層数の上限値を越えない
ように上記リンク先文字列抽出手段が辿るリンク先を制
御するので、次々とリンク先を辿って処理が終了しなく
なったり、不必要なリンクまで辿ることを防止すること
ができる。さらに、ある階層レベルまでのリンク先ファ
イルを対象とした音声認識用辞書を作成することができ
る。

【０１２４】また、１実施例の音声認識用辞書作成装置
は、上記リンク制御手段によって、ファイル記憶場所判
定手段による判定結果に基づいて、リンク先ファイルの
記憶場所がリンク元ファイルの記憶場所と同一になるよ
うに上記リンク先文字列抽出手段が辿るリンク先を制御
するので、次々とリンク先を辿って処理が終了しなくな
ったり、不必要なリンクまで辿ることを防止することが
できる。さらに、ある階層レベルまでのリンク先ファイ
ルを対象とした音声認識用辞書を作成することができ
る。

【０１２５】また、第２の発明の音声認識装置は、入力
された音声を、上記第１の発明の音声認識用辞書作成装
置によって作成された音声認識用辞書との照合を行って
認識するので、搭載している音声認識用辞書を作成した
際に用いたハイパーテキスト文書の表層ファイルに記述
された単語の発声は元より、上記表層ファイルの単語に
リンクされたリンク先ファイルに記述された単語が発声
された場合にも、高い認識率で入力音声を認識すること
ができる。

【０１２６】また、１実施例の音声認識装置は、識別子
出力手段によって、認識語彙に基づいて識別子記憶手段
を参照して、上記認識語彙と同一の音声認識語彙に対応
付けられた識別子を出力するので、音声認識結果とし
て、認識語彙に代って上記識別子を出力することができ
る。したがって、この識別子に対応付けられた処理を、
ハイパーテキスト文書のリンク先ファイルに記述された
単語を発声して実行させることが可能になる。

【０１２７】また、１実施例の音声認識装置は、操作手
順実行手段によって、上記識別子出力手段からの識別子
に基づいて操作手順記憶手段を参照して、当該識別子に
対応した機器の操作手順に従って上記機器の操作を実行
するので、ハイパーテキスト文書の下層ファイルに記述
された単語の発声によって、上記機器の操作を簡単に指
示することができる。

【０１２８】また、１実施例の音声認識装置は、上記識
別子をテレビ番組の「インデックス」とし、上記識別子に
対応した機器の操作手順を「上記インデックスに対応す
るテレビ番組のテレビジョン装置による表示手順」とし
たので、ハイパーテキスト文書の下層ファイルに記述さ
れた単語の発声によって、自動的に当該テレビ番組の映
像を表示することができる。

【０１２９】つまり、予めハイパーテキスト文書化され
た電子テレビ番組表に基づいて、音声認識用辞書を作成
しておくことによって、上記電子テレビ番組表の表層フ
ァイルに記述された「番組名」,「放送局名」および「放送日
時情報」等を発声することによって、所望のテレビ番組
を自動的に表示することができる。さらに、この実施例
によれば、操作者が「放送日」を忘れてしまっても、上記
表層ファイルにリンクされた「番組ホームページ」のファ
イルに記述された「ゲスト名」等を発声することによっ
て、所望のテレビ番組を自動的に表示することができる
のである。

【０１３０】また、１実施例の音声認識装置は、上記識
別子をテレビ番組の「インデックス」とし、上記識別子に
対応した機器の操作手順を「上記インデックスに対応す
るテレビ番組のビデオ装置への録画予約手順」としたの
で、ハイパーテキスト文書の下層ファイルに記述された
単語の発声によって、自動的に当該テレビ番組の録画予
約を行うことができる。

【０１３１】つまり、予めハイパーテキスト文書化され
た電子テレビ番組表に基づいて、音声認識用辞書を作成
しておくことによって、操作者が「放送日」を忘れてしま
っても、上記電子テレビ番組表の表層ファイルにリンク
された「番組ホームページ」のファイルに記述された「料
理名」等を発声することによって、所望のテレビ番組を
自動的に録画予約することができるのである。

【０１３２】また、第３の発明の携帯端末器は、上記第
１の発明の音声認識用辞書作成装置と、上記音声認識用
辞書作成装置で作成された音声認識用辞書を用いる音声
認識装置を搭載したので、予め上記音声認識用辞書作成
装置によってハイパーテキスト文書を用いて音声認識用
辞書を作成しておけば、本形態端末器に向って上記ハイ
パーテキスト文書のリンク先ファイルに記述された単語
を発声しても高い認識率で認識することができる。

【０１３３】また、第４の発明の携帯端末器は、上記第
２の発明の音声認識装置を搭載したので、本形態端末器
に向ってハイパーテキスト文書のリンク先ファイルに記
述された単語を発声しても、高い認識率で認識すること
ができる。

【０１３４】また、第５の発明音声の認識用辞書作成方
法は、文字列情報を解析し、構成単語に分割し、読みを
付与し、音声認識語彙を作成し、音声認識語彙を記憶す
ると共に、上記文字列情報の解析によってリンク情報で
あると判定された構成単語におけるリンク先の文字列を
抽出し、上記抽出されたリンク先の文字列情報に対して
も上記解析,単語分割,読み付与,音声認識語彙生成およ
び音声認識語彙記憶を行うので、ハイパーテキスト文書
における表層ファイルに記述された単語は元より、表層
ファイルの単語にリンクされたリンク先ファイルに記述
された単語をも用いて音声認識用辞書を作成することが
できる。

【０１３５】また、第６の発明のプログラム記録媒体
は、コンピュータを、上記第１の発明におけるテキスト
解析手段,読み付与手段,語彙作成手段およびリンク先文
字列抽出手段として機能させる辞書作成処理プログラム
が記録されているので、上記第１の発明の場合と同様
に、ハイパーテキスト文書における表層ファイルに記述
された単語は元より、表層ファイルの単語にリンクされ
たリンク先ファイルに記述された単語をも用いて音声認
識用辞書を作成することができる。

【図面の簡単な説明】

【図１】この発明の音声認識用辞書作成装置における
ブロック図である。

【図２】リンク情報の説明図である。

【図３】図１に示す音声認識用辞書作成装置による音
声認識用辞書作成処理動作のフローチャートである。

【図４】図１とは異なる音声認識用辞書作成装置のブ
ロック図である。

【図５】図４に示す音声認識用辞書作成装置による音
声認識用辞書作成処理動作のフローチャートである。

【図６】図１および図４とは異なる音声認識用辞書作
成装置のブロック図である。

【図７】図６に示す音声認識用辞書作成装置による音
声認識用辞書作成処理動作のフローチャートである。

【図８】図１,図４および図６とは異なる音声認識用
辞書作成装置のブロック図である。

【図９】図８に示す音声認識用辞書作成装置による音
声認識用辞書作成処理動作のフローチャートである。

【図１０】図１に示す音声認識用辞書作成装置を搭載
した音声認識装置のブロック図である。

【図１１】図１０とは異なる音声認識装置のブロック
図である。

【図１２】電子番組データが記述された文字列ファイ
ルの一例を示す図である。

【図１３】図１０および図１１とは異なる音声認識装
置のブロック図である。

【図１４】図１０,図１１および図１３とは異なる音
声認識装置のブロック図である。

【図１５】ＨＴＭＬで記述されたハイパーテキスト文
書の一例を示す図である。

【符号の説明】

１,２１,３１,４１…解析処理部、２,２２,３２,４２,５３,７３,９３,１１３…テキスト
解析部、３,２３,３３,４３,５４,７４,９４,１１４…読み付与
部、４,２４,３４,４４,５５,７５,９５,１１５…解析辞書
メモリ、５,２５,３５,４５,５６,７６,９６,１１６…語彙作成
部、６,２６,３６,４６,５７,７７,９７,１１７…語彙記憶
部、７,２７,３７,４７,５８,７８,９８,１１８…リンク先
文字列抽出部、８…リンク先、９…リンク文字列、１０,１１…リンク先ファイル、２８,３８,４８…リンク制御部、３９…リンク上限記憶部、４９…ファイル記憶場所判定部、５１,７１,９１,１１１…音声認識用辞書作成装置、５２,７２,９２,１１２…音声認識装置、５９,７９,９９,１１９…音響分析部、６０,８０,１００,１２０…尤度計算部、６１,８１,１０１,１２１…音響モデル格納部、６２,８２,１０２,１２２…照合部、８３,１０３,１２３…識別子記憶部、８４,１０４,１２４…識別子出力部、８５…電子番組表本体、８６…ホームページ、１０５,１２５…操作手順記憶部、１０６,１２６…操作手順実行部、１２７…テレビ表示部、１２８…録画部、１２９…再生部。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 15/22 Ｇ１０Ｌ 3/00 ５７１ＶＦターム(参考） 5B075 ND03 ND23 ND36 NK24 NK44 PP07 PQ02 PQ42 UU40 5D015 GG01 HH23 KK02

Claims

【特許請求の範囲】

【請求項１】テキスト解析手段によって文字列情報を
解析して構成単語に分割し、この分割された各構成単語
に読み付与手段によって読みを付与し、上記解析手段お
よび読み付与手段による処理結果に基づいて語彙作成手
段によって音声認識語彙を生成し、この生成された音声
認識語彙を音声認識用辞書として語彙記憶手段に記憶す
る音声認識用辞書作成装置において、上記テキスト解析手段による解析の結果リンク情報であ
ると判定された構成単語におけるリンク先の文字列を抽
出し、上記テキスト解析手段に送出するリンク先文字列
抽出手段を備えたことを特徴とする音声認識用辞書作成
装置。
【請求項２】請求項１記載の音声認識用辞書作成装置
において、上記リンク先文字列抽出手段が上記リンク情報に基づい
て辿ったリンクのリンク元情報を管理して、上記リンク
先文字列抽出手段が次に辿るリンク先を制御するリンク
制御手段を備えたことを特徴とする音声認識用辞書作成
装置。
【請求項３】請求項２に記載の音声認識用辞書作成装
置において、上記リンク先文字列抽出手段が辿るリンク先文字列の階
層数の上限値を記憶するリンク上限記憶部を備えて、上記リンク制御手段は、上記上限値を越えないように上
記リンク先文字列抽出手段が辿るリンク先を制御するこ
とを特徴とする音声認識用辞書作成装置。
【請求項４】請求項２に記載の音声認識用辞書作成装
置において、リンク先のファイルの記憶場所がリンク元のファイルの
記憶場所と同一か否かを判定するファイル記憶場所判定
手段を備えて、上記リンク制御手段は、上記ファイル記憶場所判定手段
による判定結果に基づいて、リンク先ファイルの記憶場
所とリンク元ファイルの記憶場所とが異ならないように
上記リンク先文字列抽出手段が辿るリンク先を制御する
ことを特徴とする音声認識用辞書作成装置。
【請求項５】入力された音声を、辞書に登録されてい
る認識語彙との照合を行って認識する音声認識装置であ
って、上記辞書として、請求項１乃至請求項４の何れか一つに
記載の音声認識用辞書作成装置によって作成された音声
認識用辞書を搭載していることを特徴とする音声認識装
置。
【請求項６】請求項５に記載の音声認識装置におい
て、識別子が含まれた上記文字列情報から生成された音声認
識語彙と上記識別子とを対応付けて記憶する識別子記憶
手段と、音声認識の結果得られた語彙に基づいて上記識別子記憶
手段を参照し、上記語彙と同一の音声認識語彙に対応付
けられた識別子を出力する識別子出力手段を備えたこと
を特徴とする音声認識装置。
【請求項７】請求項６に記載の音声認識装置におい
て、識別子に対応した機器の操作手順を記憶する操作手順記
憶手段と、上記識別子出力手段からの識別子に基づいて上記操作手
順記憶手段を参照し、当該識別子に対応した機器の操作
手順に従って上記機器の操作を実行する操作手順実行手
段を備えたことを特徴とする音声認識装置。
【請求項８】請求項７に記載の音声認識装置におい
て、上記操作手順実行手段による操作実行の対象となる機器
はテレビジョン装置であり、上記識別子は、テレビ番組のインデックスであり、上記識別子に対応した機器の操作手順は、上記インデッ
クスに対応するテレビ番組の上記テレビジョン装置によ
る表示手順であることを特徴とする音声認識装置。
【請求項９】請求項７に記載の音声認識装置におい
て、上記操作手順実行手段による操作実行の対象となる機器
はビデオ装置であり、上記識別子は、テレビ番組のインデックスであり、上記識別子に対応した機器の操作手順は、上記インデッ
クスに対応するテレビ番組の上記ビデオ装置への録画予
約手順であることを特徴とする音声認識装置。
【請求項１０】請求項１乃至請求項４の何れか一つに
記載の音声認識用辞書作成装置と、上記音声認識用辞書作成装置で作成された音声認識用辞
書を用いる音声認識装置を搭載したことを特徴とする携
帯端末器。
【請求項１１】請求項５乃至請求項９の何れか一つに
記載の音声認識装置を搭載したことを特徴とする携帯端
末器。
【請求項１２】文字列情報を解析して構成単語に分割
し、上記分割された各構成単語に読みを付与し、上記解
析処理および読み付与処理の結果に基づいて音声認識語
彙を生成し、この生成された音声認識語彙を音声認識用
辞書として記憶する音声認識用辞書作成方法において、上記解析処理の結果リンク情報であると判定された構成
単語におけるリンク先の文字列を抽出し、上記抽出されたリンク先の文字列情報に対しても上記解
析,単語分割,読み付与,音声認識語彙生成および音声認
識語彙記憶を行うことを特徴とする音声認識用辞書作成
方法。
【請求項１３】コンピュータを、請求項１におけるテキスト解析手段,読み付与手段,語彙
作成手段およびリンク先文字列抽出手段として機能させ
る辞書作成処理プログラムが記録されたことを特徴とす
るコンピュータ読出し可能なプログラム記録媒体。