JPS6057899A

JPS6057899A - 日本語音声入力装置

Info

Publication number: JPS6057899A
Application number: JP58167308A
Authority: JP
Inventors: 外川　文雄; 充宏斗谷; 西岡　芳樹
Original assignee: Computer Basic Technology Research Association Corp
Current assignee: Computer Basic Technology Research Association Corp
Priority date: 1983-09-09
Filing date: 1983-09-09
Publication date: 1985-04-03
Also published as: JPH0229230B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〈発明の技術分野〉本発明は入力された音声を音節毎に認識する日本語音声
入力装置の改良に関し、更に詳細には音節等のより細分
化された単Ｗの特徴を装置に登録するとき、語句を発声
することによシ音声中に含まれる特定の音節の特徴を抽
出して装置に登録する音声登録方式の改良に関するもの
である。

〈発明の技術的背景とその問題点〉一般に音鮨を単位に入力音声を認識する方式の日本語音
声入力装置においては、入力音声を音節単位にセグメン
ト化して音節のセグメンテーションを行ない、次に各音
節から抽出した特徴パターンを予め登録している音節標
準パターンと比較照合（パターンマツチング）して最も
類似した標準パターンが属する音節を識別結果とするよ
うに成されている。また、このような装置において、従
来は孤立で発声した単音節、或いは母音と単音節を組み
にして発声した音声から抽出した単音節から抽出した特
徴パターンを標準パターンとして予め登録していた。

このような方法で登録された標準パターンを用いた音声
入力装置にあっては、入力する音声が離散的な発声であ
る場合には充分な音節識別確度を得ることが出来るが、
より連続的な発声である場合には満足な音節識別確度を
得ることが出来ないという問題点があった。

即ち、入力する音声がよシ連続的な発声である場合、調
音結合と呼ばれる前後の音節の影響を受けて音節の特徴
パターンが変形し、音節識別確度が低下することになる
。

したがって、入力する音声が連続的になれば、変形した
より入力音声に近い特徴パターンを登録する方が音節識
別確度を向上させる上で、よシ有利であると考えられる
。

〈発明の目的〉本発明は上記諸点に鑑みて成されたものであシ、連続音
声の認識に適した音節標準パターンを作成することが出
来る音声登録方式を提供することを目的とし、この目的
を達成するため、本発明の音声登録方式は、語句を発声
することにより音声中に含まれる特定の音節の特徴を抽
出して音節等のよシ細分化された単位の特徴を装置に登
録するに際し、登録すべき音節を他の音節と区別するよ
う明示した音節系列を表示して発声語句を発声者（オペ
レータ）に視覚的に指示し、発声された音声中から登録
を指示した音節の特徴パターンを登録せしめるように構
成されている。

〈発明の実施例〉以下・本発明の一実施例を図面を参照して詳細に説明す
る。

第１図は本発明の音声登録方式を実施した日本語音声入
力装置の構成を示すブロック図である。

第１図において、１は登録すべき入力音声及び認識すべ
き入力音声をピックアップして電気信号に変換するマイ
クであシ、このマイク１の出力はアンプ２で増幅された
後、アナログ・ディジクル変換手段３によってＡ−Ｄ変
換し、とのＡ−Ｄ変換された信号は音響処理部４に入力
されて、この音響処理部４で分析されて音節のセグメン
テーションが行なわれて音節が抽出され、また韻律情報
及び各音節の特徴パターンｌＰｉが検出される。

５は発声すべき語句群を語句とその語句に含まれる音節
のうち登録する音節を指示して記憶した語句集メモリ、
６けこの語句集メモリ５から読出された一つの語句デー
タを記憶する語句バッフ７．７は音節番号と文字コード
との対応関係を記憶した音節テーブルメモリ、８は標準
パターンテーブルメモリ、９は音節標準パターンメモリ
、１ｏは音ｔｆＪ特徴バッファ、１１け音声信号波形バ
ッファ、１２／／′ｉ中央処理装置（ＣＰＵ）、１３／
／ｉキーボード、１４は周波数発止器、１５はディジタ
ル・アナログ変換手段、１６はアンプ、１７はスピーカ
、１８はディスプレイである。

次に上記の様に構成された装置の動作を説明する０第２図は本発明の音声登録方式の処理動作を示すフロー
図である。

装置の語句集メモリ５には上記したように予め語句とそ
の語句に含まれる音節のうち登録する音節を指示した形
で記憶している。

今、装置に音節標準パターンを登録するため、キーボー
ド１３を操作して装置を登録モードにすると、ステップ
ｎｌ（第２図）においてＣＰＵ１２は語句集メモリ５よ
り発声語句を読み出して登録＋／−”−４７ｆｙ−Ｒ８
櫓１イギ、ツブｌ／　ｌ　Ｉ　Ｑ　Ｉ−Ｉｒａ　千１て
発声する語句をオペレータに指示する。

例えば読み出された発声語句Ｗｉが「山脈」で／さ／、
／みゃ／、　／＜／の３音節を登録する場合について説
明する。

第３図は上記第２図に示したステップｎ１の発声語句の
指示の動作を詳ａＫ示した処理フローであり、ステップ
ｎ１０１においてまず発声語句Ｗｉが語句集メモリ５か
ら語句バッファ６に読み出される。語句集メモＩＪ５に
は第４図（ａ）に示すように複数の語句Ｗｉ（ｉ＝ｔ〜
ｎ）が記憶されており、この語句の内部７オーマソトは
第４図（ｂ）に示すように音節数領域Ａ、登録音節明示
領域Ｂ、音節番号領域Ｃｉ構成されておシ、発声語句ｗ
ｊ「山脈」で／さ／、／みゃ／、／＜／の３音節を登録
する場合には音節数Ａが「４コ、登録音節は第１゜第３
．第４音節であることをビットの１で表わしたデータＢ
　−（１０１１００００）及び語句を音節番号で表現し
たデータＣ−ｒｌｌ、６８，８３，８゜０、・・・」が
続いて記憶されている。

語句バッファ６に記憶された発声語句の藷句内部コード
Ｗｉがロードされ（ｎ１０２．ｎ１０３）、その内容が
ＣＰＵＩ　２において判別される。まずステップｎ１０
４においてＪ＝１にセントされ、次ニステップｎ１０５
においてデータＢの第Ｊビットが１であるか否かが判定
され、判定結果が１であればシンボル記号、例えば括孤
（１）が附加され（ステップｎｌ　０６　）、次傾ステ
ップｎ１０７に移行して音節番号データＣ（Ｊ）の音節
文字変換が実行される。このステップｎ１０７の動作は
第５図に示す如き音節テーブルメモリ７に記憶された音
節番号と文字コードの対応データにもとすいて音節番号
を文字コードに変換する。次にステップ“ｎ１０８にお
いてＪの値が＋１され、ステップ。

ｎ１０９においてＪの値が音節数Ａの値を越えたか否か
が判定され、Ｊ）Ａになるまでｎ１０５〜ｎ１０９のス
テップが繰返され、上記した一連の動作によって登録す
る音節を明示するシンボル記号を附加したかな文字コー
ド列が作成され、そのかな文字コード列が出力されて（
ｎｌｌｏ、１１１）ディスプレイ１８に表示されること
になる。このようにして語句集メモリ５から読み出され
た発声語句の内部情報Ｗｉに従って音節テーブルメモリ
７を使って音節番号を文字コードに変換し、またデータ
Ｂにしたがって登録する音節を記号（１）でくくって第
６図に示すようにディスプレイ１８上に表示する。

なお、上記の例では登録する音節を明示する記号りは括
孤としているが、これに限定されるものではなく、鍵括
孤、アンダーライン等の他の記号、または登録音節をグ
イレ表示または異在るカラーで表示する更には点滅表示
等、登録する音節を他の音節と区別して明示し得るもの
であれば良い１Ｊ次にオペレータ（発声者）はディスプ
レイ１８上の表示を見て／さんみゃく／と発声する（ｎ
２）。

この音声はマイク１によって電気信号に変換され（第７
図（ａ）参照）、アンプ２で増幅された後、アナログ・
ディジタル変換手段３でＡ−Ｄ変換されて音響処理部４
に入力される。

音響処理部４は公知のものよく、ディジタル変換された
音声入力を分析してステップｎ３において音節のセグメ
ンテーションによって音節を抽出口（８７図（ｂ）参照
）、また各音節の特徴パターンｌＰｉ及び音節数１発声
速度、音程等の韻律情報を検出しくｎ４，５）、それら
の特徴量を音節特徴バッフｙ　１０　ｆｃ一時記憶す、
る。同時に各音節の信号波形を音声信号波形バッフ７１
１に一時記憶する０次にステップｎ６に移行して正しい韻律であるか否かを
判定する。即ち上記ステップｎ５において検出したモー
ラ数（音節数）、テンポ（発声速度）についてモーラ数
は正しいか、テンポは規定範囲かを判定して、もし、規
定範囲外の音声であれば、その語句（山脈）の正しい韻
律情報（正しいモーラ数、標準のテンポ）をＤ７．変換
手段１５でＤ／Ａ変換してスピーカ１７等によりブザー
音で出力する（ｎ７）。これによって、オペレータ如普
告すると同時に正しい発声方法を報知して言い直しを指
示することになる。

語句の韻律情報は例えば上記語句集メモリ５に音節番号
列と共に記憶されており、発声語句Ｗｉが「山脈」の場
合、第４図（ｂ）に示したようにＡ領域にモーラ数Ｍ＝
４が記憶されており、音節番号列Ｃに続いてテンポ情報
５ｉ（０，３，０，３，０，３，０，３）が記憶されて
いる。一方オペレータの廃声入カに対してステップｎ５
において韻律情報モーラ数Ｍ及びテンポ数Ｓｉが検出さ
れ、この検出内容と語句集メモリ５に記憶された標準韻
律情報を比較して、発声した音声入力が正しい韻律であ
ったが否かを判定する。

この判定の結果、規定範囲内の音声であれば、登録する
音節／さ／、／みゃ／、／＜／の音声信号を音声信号波
形バッフ７１１から読み出してＤ／Ａ変換手段１５によ
ってＤ／、変換して出力する（ｎ８）。オペレータは、
このエコーバック音を聴いて音節の音韻情報の良否を判
定して音節特徴パラン７１０に記憶している良質音節の
特徴パターン（ｌＰｒ　、ＩＦ３　、　ＩＦ５　）を音
節標準パターンメモリ９に登録する（ｎｌｏ）。この時
標準パターンテーブルメモリ８には第９図に示すように
語句番号Ｗｉの第ｊ音節の音節であること（第４音節の
／＜／、第１音節の／さン、第３音節の／みゃ／）を音
節標準パターンと対応して記述する。

なお、ステップｎ９においてオペレータが不良音声であ
ると判定したときにはキーボード１３上の特定のキーを
操作してステップｎ２に戻らせ、再び言い直すことにな
る。

また上記音節特徴パターンの登録（ｎｌＯ）が終了すれ
ばステップｎ１に戻り、装置は次の発声語句を上記した
同じ動作ステップでディスプレイ１０上に表示する。

第８図は上記第２図に示したステップ１１８のエコーバ
ックによる音節波形出力の動作及びステップｎｌｏの音
節特徴パターンの登録の動作を詳細に示した動作フロー
であシ、ステップｎ６において正しい韻律と判定される
と、まずステップｎ８１においてＪ＝１にセットされ、
次にステップｎ８２においてデータＢの第Ｊビットが１
であるか否かが判定され、判定結果が１であれば音声信
号波形バッファ１１よシ第Ｊ音節の音節波形が出力され
（ｎ８３　）、該音節波形出力はシリ、変換手段１５に
よって音声アナログ信号に変換されてスピーカ１７等よ
シ出力される。次にステップｎ８４においてＪの値が＋
１され、ステップｎ８５においてＪの値が音節数Ａを越
えたか否かが判定され、Ｊ〉Ａになるまでｎ８２〜８５
のステップが繰返され、この一連した動作によって登録
する音節を明示した／さ／、／みゃ／、　／＜／のみが
第７図（ｃ）に示すようにエコーバックされる。

オペレータは、このエコーバノ、り音を聴いて音節の音
韻情報の良否を判定し、ステップｎ９において良質音節
と判断した場合には、次のステップｎ９１においてＪ＝
１にセントされ、次にステップ９２においてデータＢの
第Ｊビットが１であるか否かが判定され、判定結果が１
であれば音節特徴バッファ１０よシ第Ｊ音節の音節特徴
パターンを読み出して音節標準パターンメモリ９へ登録
し、次にステップｎ９４に移行してＣ（Ｊ）　＋　ｉ＋
　Ｊ　ｆベアーとして音節標準パターンの番地と対応し
た標準パターンテーブルメモリ８の番地に書込む。

次にステップｎ９５に移行してＪの値が＋１され、ステ
ップｎ９６においてＪの値が音節数Ａを越えたか否かが
判定され、Ｊ）Ａになるまでｎ９２〜、ｎ９６のステッ
プが繰返され、この一連した動作によって登録する音節
を明示した／さ／、／みや／。

／＜／に対する音節特徴パターン（ＩＲ＋　、　ｌＰ３
　。

！Ｐ４）が第７図（ｄ）に示すように音節特徴バッファ
１０よシ読み出されて音節標準・、（ターンメモリ９に
登録される。

以上のようにして登録すべき音節が他の音節と区別して
明示され、また発声された音声中よシ登録の予め明示さ
れた音節の特徴パターンが音節標準パターンとして登録
されるＯなお、上記した実施例においては、語句集メモリ５に予
め記憶した語句を表示して発声を指示するようにしたが
、本発明はこれに限定されるものではなく、例えば第３
図のステップｎ１１２゜ｎ１１３に示すように、発声し
たい語句を登録すべき音節を記号（１）等２′区別して
キーボード１３上よりかガ文字コード列で入力し、この
データをかな文字コード／語句内部コード変換して語句
ノくッファ６に入力し、以下上記したステップｎ２以後
を実行せしめるように成してもよい。

また装置が入力した音声を認識するモードであるとき、
入力し麹い音節を表示上で指示して、その音節の特徴パ
ターンを標準パターンとして登録してもよい。即ち例え
ば「文脈」と発声したときの識別結果が／ふんみゃく／
とディスプレイに出力されたとき、キーボードから表示
上の／ふ／を／ぶ／に変更してカーソル等で指示し、第
１音節の音節パターンをカテゴリー／ぶ／の標準パター
ンとして登録するように成してもよい。

〈発明の効果〉以上の様に本発明によれば語句を発声することにより音
声中に含まれる特定の音節の特徴を抽出して音節等のよ
シ細分化された単位の特徴を音節毎に認識する日本語音
声入力装置に登録するに際し、登録すべき音節を他の音
節と区別するように明示した音節系列を表示して発声語
句を指示し、発声された音声中から予め登録の明示され
た音節の特徴パターンを登録せしめるように成している
ため、連続音声の認識に適した音節標準パターンを確度
高く効率的に作成することが出来る。

【図面の簡単な説明】

第１図は本発明を実施した日本語音声入力装置の構成を
示すブロック図、第２図は本発明の音声登録方式の処理
動作を示す動作フロー図、第３図は発声語句の指示の動
作を詳ａ１ｃ示す処理ンロー図、第４図（ａ）は語句集
メモリの記憶状ｆＡ’ｃ示す図、第４図（ｂ）は発声語
句Ｗｉの内部フ」−マントを示す図、第５図は音節テー
ブルメモリの記憶状態を示す図、第６図は発声語句の表
示例を示す図、第７図は各信号の出力状態を示す図、第
８図はエコーバンクによる音節波形出力及び音勅″ｉ特
徴パターンの登録の動作を詳細に示す動作ンロー図、第
９図は標準パターンテーブルメモリ及び音節標準パター
ンメモリの記憶状態を示す図である。１・・・マイク、　４・・・音響処理部、５・・・語句
集メモリ、　６・・・語句バッファ、８・・・標準パタ
ーンテーブルメモリ、９・・・音節標準パターンメモリ
、１０・・音節特徴バッファ、　１８・・・ディスプレイ
、Ｄ・・・登録する音節を明示する記号。

Claims

【特許請求の範囲】１、入力された音声を音節毎に認識する日本語音声入力
装置において、語句を発声することによシ音声中に含まれる特定の音節
の特徴を抽出して音節等のよシ細分化された単位の特徴
を装置に登録するに際し、登録すべき音節を他の音節と
区別するよう明示した音節系列を表示して発声語句を指
示し、発声された音声中から登録を指示した音節の特徴
パターンを登録せしめるように成したことを特徴とする
音声登録方式。