JPH04289899A - 口語音声認識装置及び方法 - Google Patents
口語音声認識装置及び方法Info
- Publication number
- JPH04289899A JPH04289899A JP3054319A JP5431991A JPH04289899A JP H04289899 A JPH04289899 A JP H04289899A JP 3054319 A JP3054319 A JP 3054319A JP 5431991 A JP5431991 A JP 5431991A JP H04289899 A JPH04289899 A JP H04289899A
- Authority
- JP
- Japan
- Prior art keywords
- word
- sentence
- colloquial
- grammar
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 13
- 230000014509 gene expression Effects 0.000 abstract description 4
- 230000002776 aggregation Effects 0.000 abstract 1
- 238000004220 aggregation Methods 0.000 abstract 1
- 239000002245 particle Substances 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 6
- 230000010365 information processing Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 241000566113 Branta sandvicensis Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- QEVHRUUCFGRFIF-MDEJGZGSSA-N reserpine Chemical compound O([C@H]1[C@@H]([C@H]([C@H]2C[C@@H]3C4=C(C5=CC=C(OC)C=C5N4)CCN3C[C@H]2C1)C(=O)OC)OC)C(=O)C1=CC(OC)=C(OC)C(OC)=C1 QEVHRUUCFGRFIF-MDEJGZGSSA-N 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は、口語文音声を入力する
ことによって、その意図を理解し、意図に応じた諸動作
を行う音声入力情報処理装置及び方法、特に口語音声認
識装置及び方法に関する。
ことによって、その意図を理解し、意図に応じた諸動作
を行う音声入力情報処理装置及び方法、特に口語音声認
識装置及び方法に関する。
【0002】
【従来の技術】従来の音声入力による情報処理装置にお
ける音声認識方式では、例えば、宮武他「ニューラルネ
ットを用いた単語音声認識」(音響講論、1−3−17
、平成2−3)に記載されているように、単語音声を入
力し認識する単語音声入力方式や、例えば、松永「係り
受け規則と遷移規則を融合した規則により候補を限定し
た文節音声の認識」(信学論、V0l.J72−D−I
I、No.8、平成1−8)に記載されているように、
文節単位で音声を入力し、特徴パラメータを抽出した後
、単語辞書と文節内の構文規則により文節候補のマトリ
クスを構成し、文節間の係り受け情報により最適候補を
選択する文音声認識方式などが知られている。
ける音声認識方式では、例えば、宮武他「ニューラルネ
ットを用いた単語音声認識」(音響講論、1−3−17
、平成2−3)に記載されているように、単語音声を入
力し認識する単語音声入力方式や、例えば、松永「係り
受け規則と遷移規則を融合した規則により候補を限定し
た文節音声の認識」(信学論、V0l.J72−D−I
I、No.8、平成1−8)に記載されているように、
文節単位で音声を入力し、特徴パラメータを抽出した後
、単語辞書と文節内の構文規則により文節候補のマトリ
クスを構成し、文節間の係り受け情報により最適候補を
選択する文音声認識方式などが知られている。
【0003】
【発明が解決しようとする課題】上記従来技術では、単
語入力方式の装置においては、入力音声が予め登録され
た単語に限られており、また、係り受け解析による文音
声認識方式では、処理に多くの時間を要するという問題
があった。
語入力方式の装置においては、入力音声が予め登録され
た単語に限られており、また、係り受け解析による文音
声認識方式では、処理に多くの時間を要するという問題
があった。
【0004】
【課題を解決するための手段】上記問題点を解決するた
めに、本発明では、口語文の特性をルール化した口語文
生成ルールにより生成された文パタンの集合を文法とし
て保持し、更に、その文パタンを概念語の列で構成し、
各概念語に相互に意味の近い類義語集合を割り当て、入
力音声と照合することによって、柔軟な表現形態を持つ
口語文を受理できるようにする。また、概念語列中に少
なくとも1個以上の注目概念語を持たせ、注目概念語に
は互いに音響的距離が大である単語集合を割り当て入力
音声と照合することによって、口語文の意図を理解でき
るようにする。
めに、本発明では、口語文の特性をルール化した口語文
生成ルールにより生成された文パタンの集合を文法とし
て保持し、更に、その文パタンを概念語の列で構成し、
各概念語に相互に意味の近い類義語集合を割り当て、入
力音声と照合することによって、柔軟な表現形態を持つ
口語文を受理できるようにする。また、概念語列中に少
なくとも1個以上の注目概念語を持たせ、注目概念語に
は互いに音響的距離が大である単語集合を割り当て入力
音声と照合することによって、口語文の意図を理解でき
るようにする。
【0005】
【作用】本発明においては、入力音声を特徴ベクトルの
時系列に変換し、口語の特性に基づいた書き換えルール
により生成された口語文文法中の概念語を類義語の集合
である非注目概念辞書及び相互に意味的かつ音響的に距
離の大きい単語集合である注目概念辞書に登録された単
語で置換し、単語列に展開し、単語列に付加された特徴
ベクトルの時系列との間で距離を算出し、尤度の最も高
い単語列を認識結果とし、注目概念である単語を決定す
るため、柔軟な表現の音声で、ユーザの意図を一意に認
識することができる。
時系列に変換し、口語の特性に基づいた書き換えルール
により生成された口語文文法中の概念語を類義語の集合
である非注目概念辞書及び相互に意味的かつ音響的に距
離の大きい単語集合である注目概念辞書に登録された単
語で置換し、単語列に展開し、単語列に付加された特徴
ベクトルの時系列との間で距離を算出し、尤度の最も高
い単語列を認識結果とし、注目概念である単語を決定す
るため、柔軟な表現の音声で、ユーザの意図を一意に認
識することができる。
【0006】
【実施例】以下、本発明の実施例を図を用いて説明する
。図1は、本発明の一実施例を示すブロック図である。 ここでは、不動産情報検索システム用の音声入力を想定
して説明を行なう。検索システムが検索という動作を行
なうためには、ユーザが“自分の希望する建物の条件”
として、用途,素材等の建物の属性に関する条件を入力
する必要がある。検索システムにおける本発明の動作を
図6及び図7に示すPADにより説明を進める。
。図1は、本発明の一実施例を示すブロック図である。 ここでは、不動産情報検索システム用の音声入力を想定
して説明を行なう。検索システムが検索という動作を行
なうためには、ユーザが“自分の希望する建物の条件”
として、用途,素材等の建物の属性に関する条件を入力
する必要がある。検索システムにおける本発明の動作を
図6及び図7に示すPADにより説明を進める。
【0007】ユーザは、自分の希望する建物の属性であ
る用途として、例えば、“レストラン”を意図して、「
レストランを建てたい」という形の口語文を発話、入力
する(ステップs1)。入力された口語文音声は、A/
D変換手段1に取り込まれ、ディジタル信号に変換され
た後、特徴抽出手段2に送られる(ステップs2)。 特徴抽出手段2では、ディジタル信号を10msのフレ
ーム周期で、特徴ベクトルとして、例えば、斉藤、中田
「音声情報処理の基礎」(オーム社、昭56)記載のL
PCケプストラム係数{C1,C2,…,Cn}の時系
列{C1,C2,…,Cn}Tに変換され、文法照合手
段3に送出される(ステップs3)。ここで、フレーム
周期は10msに限定されることなく、20ms,30
ms等任意に設定することができる。また、特徴ベクト
ルも、LPCケプストラム係数のみに限定されず、バン
ドパスフィルタの出力等を使用することも可能である。 nは分析次数であり、正の整数の範囲内で任意に設定す
ることができる。文法照合手段3は、文法記憶手段15
,標準音響パラメータ記憶手段14,非注目概念辞書1
0及び注目概念辞書11を持つ。非注目概念辞書10は
、図2に示すように、非注目概念語300と、概念に属
する互いに意味の近い類義語の集合301よりなる。ま
た、注目概念辞書11は、図3に示すように、システム
が検索等の動作を行なうために最も必要としユーザの意
図でもある注目概念語400と、注目概念語に属する互
いに音響的距離の大きい単語の集合400よりなる。音
響的距離の算出法としては、例えば、特願平1−124
319 号「音声認識単語セットの評価システム」に記
載された方法を用いることができる。
る用途として、例えば、“レストラン”を意図して、「
レストランを建てたい」という形の口語文を発話、入力
する(ステップs1)。入力された口語文音声は、A/
D変換手段1に取り込まれ、ディジタル信号に変換され
た後、特徴抽出手段2に送られる(ステップs2)。 特徴抽出手段2では、ディジタル信号を10msのフレ
ーム周期で、特徴ベクトルとして、例えば、斉藤、中田
「音声情報処理の基礎」(オーム社、昭56)記載のL
PCケプストラム係数{C1,C2,…,Cn}の時系
列{C1,C2,…,Cn}Tに変換され、文法照合手
段3に送出される(ステップs3)。ここで、フレーム
周期は10msに限定されることなく、20ms,30
ms等任意に設定することができる。また、特徴ベクト
ルも、LPCケプストラム係数のみに限定されず、バン
ドパスフィルタの出力等を使用することも可能である。 nは分析次数であり、正の整数の範囲内で任意に設定す
ることができる。文法照合手段3は、文法記憶手段15
,標準音響パラメータ記憶手段14,非注目概念辞書1
0及び注目概念辞書11を持つ。非注目概念辞書10は
、図2に示すように、非注目概念語300と、概念に属
する互いに意味の近い類義語の集合301よりなる。ま
た、注目概念辞書11は、図3に示すように、システム
が検索等の動作を行なうために最も必要としユーザの意
図でもある注目概念語400と、注目概念語に属する互
いに音響的距離の大きい単語の集合400よりなる。音
響的距離の算出法としては、例えば、特願平1−124
319 号「音声認識単語セットの評価システム」に記
載された方法を用いることができる。
【0008】文法記憶手段15は、口語文生成手段7に
より認識対象とする文の基本型を表すテンプレート文1
2を口語文生成ルール13を用いて書き換え、記憶した
ファイルである。例えば、テンプレート文12を(/一
人称/ 名詞) (/は/ 格助詞主格) (/建物/ 名詞) (/を/ 格助詞対象格) (/建設する/ 動詞終止 /建設し/ 動
詞未然/建設し/ 動詞連用 /建設する/
動詞連体/建設すれ/ 動詞仮定 /建設せ
よ/ 動詞命令 )という5個の形態素の列として
設定する。ここで、各形態素は (m1 g1 m2 g2 … mkg
k)の形を持っており、miは概念語、giは文法情報
を表わし、形態素が活用しない場合にはk=1である。 また、口語文生成ルール13は、第1段階として、
<動詞終止形> ⇒ <動詞未然
形><たい> …■
<動詞終止形> ⇒ <動詞連体形
><つもり> …■′等の“意
図移入”のための書き換えルール、及び、第2段階であ
る“文型変形”のための以下に挙げるような書き換えル
ールとから構成される。ここで、A⇒Bは、文字列Aを
文字列Bで置換する操作を表す。
より認識対象とする文の基本型を表すテンプレート文1
2を口語文生成ルール13を用いて書き換え、記憶した
ファイルである。例えば、テンプレート文12を(/一
人称/ 名詞) (/は/ 格助詞主格) (/建物/ 名詞) (/を/ 格助詞対象格) (/建設する/ 動詞終止 /建設し/ 動
詞未然/建設し/ 動詞連用 /建設する/
動詞連体/建設すれ/ 動詞仮定 /建設せ
よ/ 動詞命令 )という5個の形態素の列として
設定する。ここで、各形態素は (m1 g1 m2 g2 … mkg
k)の形を持っており、miは概念語、giは文法情報
を表わし、形態素が活用しない場合にはk=1である。 また、口語文生成ルール13は、第1段階として、
<動詞終止形> ⇒ <動詞未然
形><たい> …■
<動詞終止形> ⇒ <動詞連体形
><つもり> …■′等の“意
図移入”のための書き換えルール、及び、第2段階であ
る“文型変形”のための以下に挙げるような書き換えル
ールとから構成される。ここで、A⇒Bは、文字列Aを
文字列Bで置換する操作を表す。
【0009】
語の付加(複合辞,不要語等):
<たい>⇒<たい><と><思う>
…■ <たい>⇒<たい><と><思う
><ん><です> …■
<たい>⇒<たい><と><思う><ん><
です><けれども>…■ <たい>⇒<
たい><と><思う><ん><です><けれども><ね
> <たい>⇒<たい><ん><です>
…■ <たい>⇒<たい><ん><で
す><けれども> …■
<たい>⇒<たい><ん><です><け
れども><ね> <たい>⇒<たい><
です><ね> <つもり>⇒<つもり>
<です> <つもり>⇒<つもり><で
す><けれども> ...語順入替え:<名詞><格
助詞,場所格><名詞><格助詞,対象格>
⇒<名詞><格助詞,対象
格><名詞><格助詞,場所格>語の省略: 主語 <名詞><格助詞,主格>
…■もちろん、ここに挙げたルールはあくまでも一例で
あり、口語文の特性を考慮した書き換えルールであれば
使用することができる。口語文生成手段7における動作
を図8に示すPADにより説明する。口語文生成手段7
は、まず、テンプレート文12を取り込み、バッファメ
モリM6に格納する(ステップs101)。続いて、バ
ッファメモリM6より生成文を取り出し(ステップs1
02)、口語文ルール13中の意図移入のルールすべて
について、ルールの左辺と該テンプレート文の各形態素
若しくは形態素の列とを照合し(ステップs103)、
概念語文字列若しくは文法情報が一致すればルールの右
辺の形態素列で置き換え、バッファメモリM6に格納す
る(ステップs104)。前記テンプレート文の例では
、そのテンプレート文にルール■が適用されて、「建築
する」(動詞終止)を 「/建築し/(動詞未然)/たい/」で置換し(/一人
称/ 名詞) (/は/ 格助詞主格) (/建物/ 名詞) (/を/ 格助詞目的格) (/建設し/ 動詞未然 /建設する/ 動
詞終止/建設し/ 動詞連用 /建設する/
動詞連体/建設すれ/ 動詞仮定 /建設せ
よ/ 動詞命令 )(/たい/) という意図の移入された文を生成する。また、そのテン
プレート文にルール■′も適用されて別の文が生成され
るが、ここでは説明を省く。
…■ <たい>⇒<たい><と><思う
><ん><です> …■
<たい>⇒<たい><と><思う><ん><
です><けれども>…■ <たい>⇒<
たい><と><思う><ん><です><けれども><ね
> <たい>⇒<たい><ん><です>
…■ <たい>⇒<たい><ん><で
す><けれども> …■
<たい>⇒<たい><ん><です><け
れども><ね> <たい>⇒<たい><
です><ね> <つもり>⇒<つもり>
<です> <つもり>⇒<つもり><で
す><けれども> ...語順入替え:<名詞><格
助詞,場所格><名詞><格助詞,対象格>
⇒<名詞><格助詞,対象
格><名詞><格助詞,場所格>語の省略: 主語 <名詞><格助詞,主格>
…■もちろん、ここに挙げたルールはあくまでも一例で
あり、口語文の特性を考慮した書き換えルールであれば
使用することができる。口語文生成手段7における動作
を図8に示すPADにより説明する。口語文生成手段7
は、まず、テンプレート文12を取り込み、バッファメ
モリM6に格納する(ステップs101)。続いて、バ
ッファメモリM6より生成文を取り出し(ステップs1
02)、口語文ルール13中の意図移入のルールすべて
について、ルールの左辺と該テンプレート文の各形態素
若しくは形態素の列とを照合し(ステップs103)、
概念語文字列若しくは文法情報が一致すればルールの右
辺の形態素列で置き換え、バッファメモリM6に格納す
る(ステップs104)。前記テンプレート文の例では
、そのテンプレート文にルール■が適用されて、「建築
する」(動詞終止)を 「/建築し/(動詞未然)/たい/」で置換し(/一人
称/ 名詞) (/は/ 格助詞主格) (/建物/ 名詞) (/を/ 格助詞目的格) (/建設し/ 動詞未然 /建設する/ 動
詞終止/建設し/ 動詞連用 /建設する/
動詞連体/建設すれ/ 動詞仮定 /建設せ
よ/ 動詞命令 )(/たい/) という意図の移入された文を生成する。また、そのテン
プレート文にルール■′も適用されて別の文が生成され
るが、ここでは説明を省く。
【0010】次に、語の省略ルールについて、ステップ
s101からステップs103の動作を繰り返す。すな
わち、バッファメモリM6より生成文を取り出し、その
生成文に対して、口語文ルール13中の文型変形のルー
ルのうち、省略に関するルールすべてについて、ルール
の左辺と該テンプレート文の各形態素若しくは形態素の
列とを照合し、文法情報も含めて一致すればルールの右
辺の形態素列で置き換え、バッファメモリM6に追加格
納する。前記テンプレート文の例では、ルール■の適用
がなされることによって(/建物/ 名詞)(/を/
格助詞目的格) (/建設し/ 動詞未然 /建設する/ 動
詞終止/建設し/ 動詞連用 /建設する/
動詞連体/建設すれ/ 動詞仮定 /建設せ
よ/ 動詞命令 )(/たい/) が生成され、バッファメモリM6に追加格納される。
s101からステップs103の動作を繰り返す。すな
わち、バッファメモリM6より生成文を取り出し、その
生成文に対して、口語文ルール13中の文型変形のルー
ルのうち、省略に関するルールすべてについて、ルール
の左辺と該テンプレート文の各形態素若しくは形態素の
列とを照合し、文法情報も含めて一致すればルールの右
辺の形態素列で置き換え、バッファメモリM6に追加格
納する。前記テンプレート文の例では、ルール■の適用
がなされることによって(/建物/ 名詞)(/を/
格助詞目的格) (/建設し/ 動詞未然 /建設する/ 動
詞終止/建設し/ 動詞連用 /建設する/
動詞連体/建設すれ/ 動詞仮定 /建設せ
よ/ 動詞命令 )(/たい/) が生成され、バッファメモリM6に追加格納される。
【0011】次に、語順入替えルールについて、ステッ
プs101からステップs103の動作を繰り返す。す
なわち、バッファメモリM6より生成文を取り出し、そ
の生成文に対して、口語文ルール13中の文型変形のル
ールのうち、語順入替えに関するルールすべてについて
、ルールの左辺と該テンプレート文の各形態素若しくは
形態素の列とを照合し、文法情報も含めて一致すればル
ールの右辺の形態素列で置き換え、バッファメモリM6
に追加格納する。
プs101からステップs103の動作を繰り返す。す
なわち、バッファメモリM6より生成文を取り出し、そ
の生成文に対して、口語文ルール13中の文型変形のル
ールのうち、語順入替えに関するルールすべてについて
、ルールの左辺と該テンプレート文の各形態素若しくは
形態素の列とを照合し、文法情報も含めて一致すればル
ールの右辺の形態素列で置き換え、バッファメモリM6
に追加格納する。
【0012】続いて、語の付加ルールについて、ステッ
プs101からステップs103の動作を繰り返す。す
なわち、バッファメモリM6より生成文を取り出し、そ
の生成文に対して、口語文ルール13中の文型変形のル
ールのうち、付加に関するルールすべてについて、ルー
ルの左辺とテンプレート文の各形態素若しくは形態素の
列とを照合し、文法情報も含めて一致すればルールの右
辺の形態素列で置き換え、バッファメモリM6に追加格
納する。前記テンプレート文の例では、ルール■をはじ
めとする適用がなされることによって 一人称 は 建物 を 建築し たい と
思う建物 を 建築し たい と 思う
等の変形文を順次生成し、該変形文の集合をバッファメ
モリM6に追加格納する。
プs101からステップs103の動作を繰り返す。す
なわち、バッファメモリM6より生成文を取り出し、そ
の生成文に対して、口語文ルール13中の文型変形のル
ールのうち、付加に関するルールすべてについて、ルー
ルの左辺とテンプレート文の各形態素若しくは形態素の
列とを照合し、文法情報も含めて一致すればルールの右
辺の形態素列で置き換え、バッファメモリM6に追加格
納する。前記テンプレート文の例では、ルール■をはじ
めとする適用がなされることによって 一人称 は 建物 を 建築し たい と
思う建物 を 建築し たい と 思う
等の変形文を順次生成し、該変形文の集合をバッファメ
モリM6に追加格納する。
【0013】次に、バッファメモリM6の内容を文法記
憶手段15に例えば図4のような有限オートマトンの形
で書き込む(ステップs105)。同図における状態の
中で、二重丸を施してあるものは最終状態を表わす。同
図の文法例では、 100−101−102−103−104−105
−106−107−108 100−101−102
−103−104−105−106 100−101
−102−103−109−106−107−108
100−101−102−103−109−106
100−103−104−105−106−107−
108 100−103−104−105−106
100−103−109−106−107−108
100−103−109−106 の8通りの文が表現されていることになる。
憶手段15に例えば図4のような有限オートマトンの形
で書き込む(ステップs105)。同図における状態の
中で、二重丸を施してあるものは最終状態を表わす。同
図の文法例では、 100−101−102−103−104−105
−106−107−108 100−101−102
−103−104−105−106 100−101
−102−103−109−106−107−108
100−101−102−103−109−106
100−103−104−105−106−107−
108 100−103−104−105−106
100−103−109−106−107−108
100−103−109−106 の8通りの文が表現されていることになる。
【0014】文法照合手段3は、文法記憶手段15より
文法を読み込み(ステップs4)、バッファメモリM0
をゼロリセットした(ステップs4′)後、文法中のす
べての文について以下のステップs5からステップs1
5までの動作手続きを繰り返す。
文法を読み込み(ステップs4)、バッファメモリM0
をゼロリセットした(ステップs4′)後、文法中のす
べての文について以下のステップs5からステップs1
5までの動作手続きを繰り返す。
【0015】初期状態100から順次状態遷移をしてい
き、非注目概念辞書10中の非注目概念語300及び注
目概念辞書11中の注目概念語400を用いて、各アー
ク上の概念語を単語で置換して単語系列を生成する。す
なわち、まず、図4において、初期状態100から状態
103,104,105、最終状態106と順次遷移し
、アーク100−103に対応する概念語である「建物
」からアーク105−106に対応する概念語である「
たい」までの系列を作り、図5に示すようにその系列を
項目とするラティスを生成する(ステップs5)。次に
、前記各項目について、非注目概念辞書10中の非注目
概念語300及び注目概念辞書11中の注目概念語40
0との照合を順次行なう。すなわち、まず、第1項目「
建物」について、非注目概念辞書10中の非注目概念語
300及び注目概念辞書11中の注目概念語400との
文字列照合を順次行ない(ステップs6)、注目概念辞
書11中の注目概念語「建物」との文字列完全一致をみ
る。そこで、第1項目「建物」の列に注目概念辞書11
中の注目概念語「建物」に登録されている単語401の
各々、すなわち、「れすとらん」,「ぶてぃっく」,「
きっさてん」を設定する(ステップs7)。この際、前
記一致した概念語が注目概念語であれば、バッファメモ
リM1に前記一致した注目概念語を書き込み(ステップ
s8)、さらに、バッファメモリM2に該項目の番号を
書き込む(ステップs9)。図5のラティスの例ではバ
ッファメモリM1に注目概念語/建物/が書き込まれ、
バッファメモリM2には注目概念語/建物/がラティス
上の第1項目であるので「1」が書き込まれる。以下、
第2項目「を」、第3項目「建築し」、第4項目「たい
」について、非注目概念辞書10中の非注目概念語30
0及び注目概念辞書11中の注目概念語400との文字
列照合を順次行ない、非注目概念辞書10中の単語30
1若しくは注目概念辞書11中の単語401を設定する
。
き、非注目概念辞書10中の非注目概念語300及び注
目概念辞書11中の注目概念語400を用いて、各アー
ク上の概念語を単語で置換して単語系列を生成する。す
なわち、まず、図4において、初期状態100から状態
103,104,105、最終状態106と順次遷移し
、アーク100−103に対応する概念語である「建物
」からアーク105−106に対応する概念語である「
たい」までの系列を作り、図5に示すようにその系列を
項目とするラティスを生成する(ステップs5)。次に
、前記各項目について、非注目概念辞書10中の非注目
概念語300及び注目概念辞書11中の注目概念語40
0との照合を順次行なう。すなわち、まず、第1項目「
建物」について、非注目概念辞書10中の非注目概念語
300及び注目概念辞書11中の注目概念語400との
文字列照合を順次行ない(ステップs6)、注目概念辞
書11中の注目概念語「建物」との文字列完全一致をみ
る。そこで、第1項目「建物」の列に注目概念辞書11
中の注目概念語「建物」に登録されている単語401の
各々、すなわち、「れすとらん」,「ぶてぃっく」,「
きっさてん」を設定する(ステップs7)。この際、前
記一致した概念語が注目概念語であれば、バッファメモ
リM1に前記一致した注目概念語を書き込み(ステップ
s8)、さらに、バッファメモリM2に該項目の番号を
書き込む(ステップs9)。図5のラティスの例ではバ
ッファメモリM1に注目概念語/建物/が書き込まれ、
バッファメモリM2には注目概念語/建物/がラティス
上の第1項目であるので「1」が書き込まれる。以下、
第2項目「を」、第3項目「建築し」、第4項目「たい
」について、非注目概念辞書10中の非注目概念語30
0及び注目概念辞書11中の注目概念語400との文字
列照合を順次行ない、非注目概念辞書10中の単語30
1若しくは注目概念辞書11中の単語401を設定する
。
【0016】次に、ラティス上の各単語について、標準
音響パラメータ記憶手段14を用いて音響パラメータを
付加する。標準音響パラメータ記憶手段14には、予め
、音節単位で、LPCケプストラム係数の時系列の集合
、例えば、音節「あ」については{c11,c12,…
,c1n}tア 、音節「い」については{c21,c
22,…,c2n}tイ を記憶しておき、前記生成さ
れた文の単語毎の読み列にしたがって配列する(ステッ
プs10)。例えば、単語が「れすとらん」であると {c31,c32,…,c3n}tレ {c41,c42,…,c4n}tス {c51,c52,…,c5n}tト {c61,c62,…,c6n}tラ {c71,c72,…,c7n}tン が、この順に配列される。標準音響パラメータの単位は
音節のみに限らず、音韻,音韻連鎖,単語,文節等を使
用することもできる。以下前記ラティス上の各項目につ
いて、ステップs6からステップs10までの動作を繰
り返す。
音響パラメータ記憶手段14を用いて音響パラメータを
付加する。標準音響パラメータ記憶手段14には、予め
、音節単位で、LPCケプストラム係数の時系列の集合
、例えば、音節「あ」については{c11,c12,…
,c1n}tア 、音節「い」については{c21,c
22,…,c2n}tイ を記憶しておき、前記生成さ
れた文の単語毎の読み列にしたがって配列する(ステッ
プs10)。例えば、単語が「れすとらん」であると {c31,c32,…,c3n}tレ {c41,c42,…,c4n}tス {c51,c52,…,c5n}tト {c61,c62,…,c6n}tラ {c71,c72,…,c7n}tン が、この順に配列される。標準音響パラメータの単位は
音節のみに限らず、音韻,音韻連鎖,単語,文節等を使
用することもできる。以下前記ラティス上の各項目につ
いて、ステップs6からステップs10までの動作を繰
り返す。
【0017】次に、バッファメモリM0の値をインクリ
メントし(ステップs11)、そのラティス上の音響パ
ラメータの付加された単語の行方向の行方向の組み合わ
せにより単語系列 1.れすとらん を けんちくし たい2.れす
とらん を たて たい3.れすとらん を
つくり たい4.れすとらん を かまえ
たい5.れすとらん が けんちくし たい6.
れすとらん が たて たい7.れすとらん
が つくり たい8.れすとらん が かまえ
たい9.ぶてぃっく を けんちくし たい
10.ぶてぃっく を たて たい: を生成し(ステップs12)、特徴抽出手段2より送出
された入力音声のLPCケプストラム係数の時系列{C
1,C2,…,Cn}Tと照合し、両系列間の距離Dを
算出しバッファメモリM0を要素とする配列バッファメ
モリM5に書き込む(ステップs13)。ここで、LP
Cケプストラム係数間の距離dは、次式で示すようなL
PCケプストラム係数のユークリッド距離を用い、時系
列間の距離Dは、例えば、小池他「音声情報工学」((
株)NTT技術移転発行、昭和62−8)に記載されて
いるような動的計画法等の手法によって非線形に両系列
を伸縮照合しながら距離を算出することができる。
メントし(ステップs11)、そのラティス上の音響パ
ラメータの付加された単語の行方向の行方向の組み合わ
せにより単語系列 1.れすとらん を けんちくし たい2.れす
とらん を たて たい3.れすとらん を
つくり たい4.れすとらん を かまえ
たい5.れすとらん が けんちくし たい6.
れすとらん が たて たい7.れすとらん
が つくり たい8.れすとらん が かまえ
たい9.ぶてぃっく を けんちくし たい
10.ぶてぃっく を たて たい: を生成し(ステップs12)、特徴抽出手段2より送出
された入力音声のLPCケプストラム係数の時系列{C
1,C2,…,Cn}Tと照合し、両系列間の距離Dを
算出しバッファメモリM0を要素とする配列バッファメ
モリM5に書き込む(ステップs13)。ここで、LP
Cケプストラム係数間の距離dは、次式で示すようなL
PCケプストラム係数のユークリッド距離を用い、時系
列間の距離Dは、例えば、小池他「音声情報工学」((
株)NTT技術移転発行、昭和62−8)に記載されて
いるような動的計画法等の手法によって非線形に両系列
を伸縮照合しながら距離を算出することができる。
【0018】
【数1】
【0019】次に、前記単語系列において、バッファメ
モリM2に書き込まれている項目番号に対応する単語を
バッファメモリM0の値を要素とする配列バッファメモ
リM3に書き込み(ステップs14)、さらに、バッフ
ァメモリM1の内容をバッファメモリM0の値を要素と
する配列バッファメモリM4に書き込む(ステップs1
5)。前記の例では、バッファメモリM2に書き込まれ
ている項目番号「1」に対応する単語「れすとらん」を
バッファメモリM0の値「1」を要素とする配列バッフ
ァメモリM3に書き込み、さらに、バッファメモリM1
の内容「建物」をバッファメモリM0の値「1」を要素
とする配列バッファメモリM4に書き込む。以上ステッ
プs11からステップs15の動作を、前記ラティス上
の行方向のすべての単語の組合せについて繰り返す。
モリM2に書き込まれている項目番号に対応する単語を
バッファメモリM0の値を要素とする配列バッファメモ
リM3に書き込み(ステップs14)、さらに、バッフ
ァメモリM1の内容をバッファメモリM0の値を要素と
する配列バッファメモリM4に書き込む(ステップs1
5)。前記の例では、バッファメモリM2に書き込まれ
ている項目番号「1」に対応する単語「れすとらん」を
バッファメモリM0の値「1」を要素とする配列バッフ
ァメモリM3に書き込み、さらに、バッファメモリM1
の内容「建物」をバッファメモリM0の値「1」を要素
とする配列バッファメモリM4に書き込む。以上ステッ
プs11からステップs15の動作を、前記ラティス上
の行方向のすべての単語の組合せについて繰り返す。
【0020】文法中の全文について、前記手続きにより
算出された配列バッファメモリM5に格納されている入
力音声の特徴ベクトルの時系列との距離のうち値が最小
であるものを検出し、該要素番号をiとする(ステップ
s16)。例えば、前記の例で、6番目のれすとらん
が たて たい の系列が入力音声の特徴ベクトルの時系列との距離のう
ち値が最小であったとするとi=6となる。該系列は、
情報検索手段4に送出される。
算出された配列バッファメモリM5に格納されている入
力音声の特徴ベクトルの時系列との距離のうち値が最小
であるものを検出し、該要素番号をiとする(ステップ
s16)。例えば、前記の例で、6番目のれすとらん
が たて たい の系列が入力音声の特徴ベクトルの時系列との距離のう
ち値が最小であったとするとi=6となる。該系列は、
情報検索手段4に送出される。
【0021】情報検索手段4では、予め図9に示すよう
な物件番号500及び建物501等の属性及びその値が
登録された検索用テーブルに基づいて、検索を行なう。 すなわち、配列バッファメモリM4の第i番目、すなわ
ち6番目の値である概念語/建物/と同一の属性501
の列に関して、登録された物件データすべてについて属
性値が配列バッファメモリM3の第i番目、すなわち6
番目の値である/れすとらん/であるものの物件番号1
及び3が検索結果となり検索結果表示手段5により表示
される(ステップs17)。
な物件番号500及び建物501等の属性及びその値が
登録された検索用テーブルに基づいて、検索を行なう。 すなわち、配列バッファメモリM4の第i番目、すなわ
ち6番目の値である概念語/建物/と同一の属性501
の列に関して、登録された物件データすべてについて属
性値が配列バッファメモリM3の第i番目、すなわち6
番目の値である/れすとらん/であるものの物件番号1
及び3が検索結果となり検索結果表示手段5により表示
される(ステップs17)。
【0022】ここで、ステップs1からステップs16
までの手続きを繰り返すことによって、例えば、属性/
建物/については/れすとらん/,属性/雰囲気/につ
いては/ちちゅうかい/,…,属性/素材/については
/だいりせき/のように複数の属性に対する値を求め、
ステップs17において、該複数の属性に対する値のA
ND条件により、物件番号を決定するようにしてもよい
。
までの手続きを繰り返すことによって、例えば、属性/
建物/については/れすとらん/,属性/雰囲気/につ
いては/ちちゅうかい/,…,属性/素材/については
/だいりせき/のように複数の属性に対する値を求め、
ステップs17において、該複数の属性に対する値のA
ND条件により、物件番号を決定するようにしてもよい
。
【0023】
【発明の効果】以上説明したように、本発明によれば、
システムに入力すべきコマンドや項目を、単語や定型の
文ではなく、柔軟な表現を用いて入力することができる
ので、ユーザは、予め、登録された単語や文を覚えてお
く必要がなく、使いやすいシステムを構成することがで
きる。
システムに入力すべきコマンドや項目を、単語や定型の
文ではなく、柔軟な表現を用いて入力することができる
ので、ユーザは、予め、登録された単語や文を覚えてお
く必要がなく、使いやすいシステムを構成することがで
きる。
【図1】本発明の一実施例の構成を示すブロック図であ
る。
る。
【図2】非注目概念辞書10のデータ構造を示す図であ
る。
る。
【図3】注目概念辞書11のデータ構造を示す図である
。
。
【図4】文法記憶手段15に書き込まれる有限オートマ
トンの一例を示す図である。
トンの一例を示す図である。
【図5】概念語列を項目とするラティスの一例を示す図
である。
である。
【図6】不動産情報検索システムにおける処理の流れを
示すPADである。
示すPADである。
【図7】単語置換処理の流れを示すPADである。
【図8】口語文生成手段7の動作を説明するためのPA
Dである。
Dである。
【図9】不動産情報検索システムにおける検索用テーブ
ルの一例を示す図である。
ルの一例を示す図である。
0…入力音声、1…A/D変換手段、2…特徴抽出手段
、3…文法照合手段、4…情報検索手段、5…検索結果
表示手段、7…口語文生成手段、10…非注目概念辞書
、11…注目概念辞書、12…テンプレート文、13…
口語文生成ルール、14…標準音響パラメータ記憶手段
、15…文法記憶手段。
、3…文法照合手段、4…情報検索手段、5…検索結果
表示手段、7…口語文生成手段、10…非注目概念辞書
、11…注目概念辞書、12…テンプレート文、13…
口語文生成ルール、14…標準音響パラメータ記憶手段
、15…文法記憶手段。
Claims (5)
- 【請求項1】口語文生成ルールにより生成された概念語
列の集合を文法として保持する文法記憶手段と、前記概
念語に属する単語の集合よりなる単語辞書を保持する手
段と、入力された単語列を前記文法記憶手段に保持され
た文法より生成される文と順次照合して尤度を算出し、
該算出された尤度のうち最大値を持つ文を入力候補文と
する文法照合手段を有する口語音声認識装置。 - 【請求項2】請求項1に記載された口語音声認識装置に
おける口語文生成ルールが、語の付加,語の省略,語順
入替えのうち、一つ以上の操作をもってなる口語音声認
識装置。 - 【請求項3】請求項1または請求項2に記載された口語
音声認識装置における文法より生成される文が非注目概
念語及び少なくとも一つの注目概念語より構成され、非
注目概念語には類義語をグループ化した単語辞書内の単
語を対応させ、注目概念語には互いに音響的距離の大で
ある単語辞書内の単語を対応させる口語音声認識装置。 - 【請求項4】請求項3に記載された口語音声認識装置に
おける入力候補文に含まれる注目概念語に対応する単語
をもって入力口語文の意図とする口語音声認識装置。 - 【請求項5】口語文生成ルールにより生成された概念語
列の集合を文法として保持し、前記概念語に属する単語
の集合よりなる単語辞書を保持し、入力された単語列を
前記保持された文法より生成される文を順次照合して尤
度を算出し、算出された尤度のうち最大値の持つ文を入
力候補文とする口語音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3054319A JPH04289899A (ja) | 1991-03-19 | 1991-03-19 | 口語音声認識装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3054319A JPH04289899A (ja) | 1991-03-19 | 1991-03-19 | 口語音声認識装置及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04289899A true JPH04289899A (ja) | 1992-10-14 |
Family
ID=12967267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3054319A Pending JPH04289899A (ja) | 1991-03-19 | 1991-03-19 | 口語音声認識装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04289899A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0844384A (ja) * | 1994-07-26 | 1996-02-16 | Nec Corp | 連続単語音声認識装置 |
US7409342B2 (en) | 2003-06-30 | 2008-08-05 | International Business Machines Corporation | Speech recognition device using statistical language model |
-
1991
- 1991-03-19 JP JP3054319A patent/JPH04289899A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0844384A (ja) * | 1994-07-26 | 1996-02-16 | Nec Corp | 連続単語音声認識装置 |
US7409342B2 (en) | 2003-06-30 | 2008-08-05 | International Business Machines Corporation | Speech recognition device using statistical language model |
US7603277B2 (en) | 2003-06-30 | 2009-10-13 | Nuance Communications, Inc. | Speech recognition device using statistical language model |
US7698137B2 (en) | 2003-06-30 | 2010-04-13 | Nuance Communications, Inc. | Speech recognition device using statistical language model |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0984428B1 (en) | Method and system for automatically determining phonetic transcriptions associated with spelled words | |
US6182039B1 (en) | Method and apparatus using probabilistic language model based on confusable sets for speech recognition | |
US5212730A (en) | Voice recognition of proper names using text-derived recognition models | |
US6501833B2 (en) | Method and apparatus for dynamic adaptation of a large vocabulary speech recognition system and for use of constraints from a database in a large vocabulary speech recognition system | |
KR100441181B1 (ko) | 음성인식방법및장치 | |
JP3481497B2 (ja) | 綴り言葉に対する複数発音を生成し評価する判断ツリーを利用する方法及び装置 | |
CN107705787A (zh) | 一种语音识别方法及装置 | |
Watts | Unsupervised learning for text-to-speech synthesis | |
Kadyan et al. | Refinement of HMM model parameters for Punjabi automatic speech recognition (PASR) system | |
JPH02273795A (ja) | 連続音声認識方法 | |
KR101424193B1 (ko) | 타 언어권 화자음성에 대한 음성인식 시스템의 성능 향상을위한 비직접적 데이터 기반 발음변이 모델링 시스템 및방법 | |
BRPI0613699A2 (pt) | busca de dicionário para dispositivos móveis que usa reconhecimento de escrita | |
Thomas et al. | RNN transducer models for spoken language understanding | |
US20020087317A1 (en) | Computer-implemented dynamic pronunciation method and system | |
Meng | Phonological parsing for bi-directional letter-to-sound/sound-to-letter generation | |
JP4600706B2 (ja) | 音声認識装置および音声認識方法、並びに記録媒体 | |
Ström | Continuous speech recognition in the WAXHOLM dialogue system | |
JPH10247194A (ja) | 自動通訳装置 | |
KR100484493B1 (ko) | 다중 발음사전을 이용한 대화체 연속 음성인식 시스템 및방법 | |
KR100259777B1 (ko) | 텍스트/음성변환기에서의최적합성단위열선정방법 | |
JPH04289899A (ja) | 口語音声認識装置及び方法 | |
CN111429886B (zh) | 一种语音识别方法及系统 | |
JP3576066B2 (ja) | 音声合成システム、および音声合成方法 | |
Pearson et al. | Automatic methods for lexical stress assignment and syllabification. | |
KR100736496B1 (ko) | 연속 음성인식기의 성능 개선 방법 |