JPS6057899A - 日本語音声入力装置 - Google Patents

日本語音声入力装置

Info

Publication number
JPS6057899A
JPS6057899A JP58167308A JP16730883A JPS6057899A JP S6057899 A JPS6057899 A JP S6057899A JP 58167308 A JP58167308 A JP 58167308A JP 16730883 A JP16730883 A JP 16730883A JP S6057899 A JPS6057899 A JP S6057899A
Authority
JP
Japan
Prior art keywords
syllable
syllables
registered
voice
uttered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58167308A
Other languages
English (en)
Other versions
JPH0229230B2 (ja
Inventor
外川 文雄
充宏 斗谷
西岡 芳樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP58167308A priority Critical patent/JPS6057899A/ja
Publication of JPS6057899A publication Critical patent/JPS6057899A/ja
Publication of JPH0229230B2 publication Critical patent/JPH0229230B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈発明の技術分野〉 本発明は入力された音声を音節毎に認識する日本語音声
入力装置の改良に関し、更に詳細には音節等のより細分
化された単Wの特徴を装置に登録するとき、語句を発声
することによシ音声中に含まれる特定の音節の特徴を抽
出して装置に登録する音声登録方式の改良に関するもの
である。
〈発明の技術的背景とその問題点〉 一般に音鮨を単位に入力音声を認識する方式の日本語音
声入力装置においては、入力音声を音節単位にセグメン
ト化して音節のセグメンテーションを行ない、次に各音
節から抽出した特徴パターンを予め登録している音節標
準パターンと比較照合(パターンマツチング)して最も
類似した標準パターンが属する音節を識別結果とするよ
うに成されている。また、このような装置において、従
来は孤立で発声した単音節、或いは母音と単音節を組み
にして発声した音声から抽出した単音節から抽出した特
徴パターンを標準パターンとして予め登録していた。
このような方法で登録された標準パターンを用いた音声
入力装置にあっては、入力する音声が離散的な発声であ
る場合には充分な音節識別確度を得ることが出来るが、
より連続的な発声である場合には満足な音節識別確度を
得ることが出来ないという問題点があった。
即ち、入力する音声がよシ連続的な発声である場合、調
音結合と呼ばれる前後の音節の影響を受けて音節の特徴
パターンが変形し、音節識別確度が低下することになる
したがって、入力する音声が連続的になれば、変形した
より入力音声に近い特徴パターンを登録する方が音節識
別確度を向上させる上で、よシ有利であると考えられる
〈発明の目的〉 本発明は上記諸点に鑑みて成されたものであシ、連続音
声の認識に適した音節標準パターンを作成することが出
来る音声登録方式を提供することを目的とし、この目的
を達成するため、本発明の音声登録方式は、語句を発声
することにより音声中に含まれる特定の音節の特徴を抽
出して音節等のよシ細分化された単位の特徴を装置に登
録するに際し、登録すべき音節を他の音節と区別するよ
う明示した音節系列を表示して発声語句を発声者(オペ
レータ)に視覚的に指示し、発声された音声中から登録
を指示した音節の特徴パターンを登録せしめるように構
成されている。
〈発明の実施例〉 以下・本発明の一実施例を図面を参照して詳細に説明す
る。
第1図は本発明の音声登録方式を実施した日本語音声入
力装置の構成を示すブロック図である。
第1図において、1は登録すべき入力音声及び認識すべ
き入力音声をピックアップして電気信号に変換するマイ
クであシ、このマイク1の出力はアンプ2で増幅された
後、アナログ・ディジクル変換手段3によってA−D変
換し、とのA−D変換された信号は音響処理部4に入力
されて、この音響処理部4で分析されて音節のセグメン
テーションが行なわれて音節が抽出され、また韻律情報
及び各音節の特徴パターンlPiが検出される。
5は発声すべき語句群を語句とその語句に含まれる音節
のうち登録する音節を指示して記憶した語句集メモリ、
6けこの語句集メモリ5から読出された一つの語句デー
タを記憶する語句バッフ7.7は音節番号と文字コード
との対応関係を記憶した音節テーブルメモリ、8は標準
パターンテーブルメモリ、9は音節標準パターンメモリ
、1oは音tfJ特徴バッファ、11け音声信号波形バ
ッファ、12//′i中央処理装置(CPU)、13/
/iキーボード、14は周波数発止器、15はディジタ
ル・アナログ変換手段、16はアンプ、17はスピーカ
、18はディスプレイである。
次に上記の様に構成された装置の動作を説明する0 第2図は本発明の音声登録方式の処理動作を示すフロー
図である。
装置の語句集メモリ5には上記したように予め語句とそ
の語句に含まれる音節のうち登録する音節を指示した形
で記憶している。
今、装置に音節標準パターンを登録するため、キーボー
ド13を操作して装置を登録モードにすると、ステップ
nl(第2図)においてCPU12は語句集メモリ5よ
り発声語句を読み出して登録+/−”−47fy−R8
櫓1イギ、ツブl/ l I Q I−Ira 千1て
発声する語句をオペレータに指示する。
例えば読み出された発声語句Wiが「山脈」で/さ/、
/みゃ/、 /</の3音節を登録する場合について説
明する。
第3図は上記第2図に示したステップn1の発声語句の
指示の動作を詳aK示した処理フローであり、ステップ
n101においてまず発声語句Wiが語句集メモリ5か
ら語句バッファ6に読み出される。語句集メモIJ5に
は第4図(a)に示すように複数の語句Wi(i=t〜
n)が記憶されており、この語句の内部7オーマソトは
第4図(b)に示すように音節数領域A、登録音節明示
領域B、音節番号領域Ci構成されておシ、発声語句w
j「山脈」で/さ/、/みゃ/、/</の3音節を登録
する場合には音節数Aが「4コ、登録音節は第1゜第3
.第4音節であることをビットの1で表わしたデータB
 −(10110000)及び語句を音節番号で表現し
たデータC−rll、68,83,8゜0、・・・」が
続いて記憶されている。
語句バッファ6に記憶された発声語句の藷句内部コード
Wiがロードされ(n102.n103)、その内容が
CPUI 2において判別される。まずステップn10
4においてJ=1にセントされ、次ニステップn105
においてデータBの第Jビットが1であるか否かが判定
され、判定結果が1であればシンボル記号、例えば括孤
(1)が附加され(ステップnl 06 )、次傾ステ
ップn107に移行して音節番号データC(J)の音節
文字変換が実行される。このステップn107の動作は
第5図に示す如き音節テーブルメモリ7に記憶された音
節番号と文字コードの対応データにもとすいて音節番号
を文字コードに変換する。次にステップ“n108にお
いてJの値が+1され、ステップ。
n109においてJの値が音節数Aの値を越えたか否か
が判定され、J)Aになるまでn105〜n109のス
テップが繰返され、上記した一連の動作によって登録す
る音節を明示するシンボル記号を附加したかな文字コー
ド列が作成され、そのかな文字コード列が出力されて(
nllo、111)ディスプレイ18に表示されること
になる。このようにして語句集メモリ5から読み出され
た発声語句の内部情報Wiに従って音節テーブルメモリ
7を使って音節番号を文字コードに変換し、またデータ
Bにしたがって登録する音節を記号(1)でくくって第
6図に示すようにディスプレイ18上に表示する。
なお、上記の例では登録する音節を明示する記号りは括
孤としているが、これに限定されるものではなく、鍵括
孤、アンダーライン等の他の記号、または登録音節をグ
イレ表示または異在るカラーで表示する更には点滅表示
等、登録する音節を他の音節と区別して明示し得るもの
であれば良い1J次にオペレータ(発声者)はディスプ
レイ18上の表示を見て/さんみゃく/と発声する(n
2)。
この音声はマイク1によって電気信号に変換され(第7
図(a)参照)、アンプ2で増幅された後、アナログ・
ディジタル変換手段3でA−D変換されて音響処理部4
に入力される。
音響処理部4は公知のものよく、ディジタル変換された
音声入力を分析してステップn3において音節のセグメ
ンテーションによって音節を抽出口(87図(b)参照
)、また各音節の特徴パターンlPi及び音節数1発声
速度、音程等の韻律情報を検出しくn4,5)、それら
の特徴量を音節特徴バッフy 10 fc一時記憶す、
る。同時に各音節の信号波形を音声信号波形バッフ71
1に一時記憶する0 次にステップn6に移行して正しい韻律であるか否かを
判定する。即ち上記ステップn5において検出したモー
ラ数(音節数)、テンポ(発声速度)についてモーラ数
は正しいか、テンポは規定範囲かを判定して、もし、規
定範囲外の音声であれば、その語句(山脈)の正しい韻
律情報(正しいモーラ数、標準のテンポ)をD7.変換
手段15でD/A変換してスピーカ17等によりブザー
音で出力する(n7)。これによって、オペレータ如普
告すると同時に正しい発声方法を報知して言い直しを指
示することになる。
語句の韻律情報は例えば上記語句集メモリ5に音節番号
列と共に記憶されており、発声語句Wiが「山脈」の場
合、第4図(b)に示したようにA領域にモーラ数M=
4が記憶されており、音節番号列Cに続いてテンポ情報
5i(0,3,0,3,0,3,0,3)が記憶されて
いる。一方オペレータの廃声入カに対してステップn5
において韻律情報モーラ数M及びテンポ数Siが検出さ
れ、この検出内容と語句集メモリ5に記憶された標準韻
律情報を比較して、発声した音声入力が正しい韻律であ
ったが否かを判定する。
この判定の結果、規定範囲内の音声であれば、登録する
音節/さ/、/みゃ/、/</の音声信号を音声信号波
形バッフ711から読み出してD/A変換手段15によ
ってD/、変換して出力する(n8)。オペレータは、
このエコーバック音を聴いて音節の音韻情報の良否を判
定して音節特徴パラン710に記憶している良質音節の
特徴パターン(lPr 、IF3 、 IF5 )を音
節標準パターンメモリ9に登録する(nlo)。この時
標準パターンテーブルメモリ8には第9図に示すように
語句番号Wiの第j音節の音節であること(第4音節の
/</、第1音節の/さン、第3音節の/みゃ/)を音
節標準パターンと対応して記述する。
なお、ステップn9においてオペレータが不良音声であ
ると判定したときにはキーボード13上の特定のキーを
操作してステップn2に戻らせ、再び言い直すことにな
る。
また上記音節特徴パターンの登録(nlO)が終了すれ
ばステップn1に戻り、装置は次の発声語句を上記した
同じ動作ステップでディスプレイ10上に表示する。
第8図は上記第2図に示したステップ118のエコーバ
ックによる音節波形出力の動作及びステップnloの音
節特徴パターンの登録の動作を詳細に示した動作フロー
であシ、ステップn6において正しい韻律と判定される
と、まずステップn81においてJ=1にセットされ、
次にステップn82においてデータBの第Jビットが1
であるか否かが判定され、判定結果が1であれば音声信
号波形バッファ11よシ第J音節の音節波形が出力され
(n83 )、該音節波形出力はシリ、変換手段15に
よって音声アナログ信号に変換されてスピーカ17等よ
シ出力される。次にステップn84においてJの値が+
1され、ステップn85においてJの値が音節数Aを越
えたか否かが判定され、J〉Aになるまでn82〜85
のステップが繰返され、この一連した動作によって登録
する音節を明示した/さ/、/みゃ/、 /</のみが
第7図(c)に示すようにエコーバックされる。
オペレータは、このエコーバノ、り音を聴いて音節の音
韻情報の良否を判定し、ステップn9において良質音節
と判断した場合には、次のステップn91においてJ=
1にセントされ、次にステップ92においてデータBの
第Jビットが1であるか否かが判定され、判定結果が1
であれば音節特徴バッファ10よシ第J音節の音節特徴
パターンを読み出して音節標準パターンメモリ9へ登録
し、次にステップn94に移行してC(J) + i+
 J fベアーとして音節標準パターンの番地と対応し
た標準パターンテーブルメモリ8の番地に書込む。
次にステップn95に移行してJの値が+1され、ステ
ップn96においてJの値が音節数Aを越えたか否かが
判定され、J)Aになるまでn92〜、n96のステッ
プが繰返され、この一連した動作によって登録する音節
を明示した/さ/、/みや/。
/</に対する音節特徴パターン(IR+ 、 lP3
 。
!P4)が第7図(d)に示すように音節特徴バッファ
10よシ読み出されて音節標準・、(ターンメモリ9に
登録される。
以上のようにして登録すべき音節が他の音節と区別して
明示され、また発声された音声中よシ登録の予め明示さ
れた音節の特徴パターンが音節標準パターンとして登録
されるO なお、上記した実施例においては、語句集メモリ5に予
め記憶した語句を表示して発声を指示するようにしたが
、本発明はこれに限定されるものではなく、例えば第3
図のステップn112゜n113に示すように、発声し
たい語句を登録すべき音節を記号(1)等2′区別して
キーボード13上よりかガ文字コード列で入力し、この
データをかな文字コード/語句内部コード変換して語句
ノくッファ6に入力し、以下上記したステップn2以後
を実行せしめるように成してもよい。
また装置が入力した音声を認識するモードであるとき、
入力し麹い音節を表示上で指示して、その音節の特徴パ
ターンを標準パターンとして登録してもよい。即ち例え
ば「文脈」と発声したときの識別結果が/ふんみゃく/
とディスプレイに出力されたとき、キーボードから表示
上の/ふ/を/ぶ/に変更してカーソル等で指示し、第
1音節の音節パターンをカテゴリー/ぶ/の標準パター
ンとして登録するように成してもよい。
〈発明の効果〉 以上の様に本発明によれば語句を発声することにより音
声中に含まれる特定の音節の特徴を抽出して音節等のよ
シ細分化された単位の特徴を音節毎に認識する日本語音
声入力装置に登録するに際し、登録すべき音節を他の音
節と区別するように明示した音節系列を表示して発声語
句を指示し、発声された音声中から予め登録の明示され
た音節の特徴パターンを登録せしめるように成している
ため、連続音声の認識に適した音節標準パターンを確度
高く効率的に作成することが出来る。
【図面の簡単な説明】
第1図は本発明を実施した日本語音声入力装置の構成を
示すブロック図、第2図は本発明の音声登録方式の処理
動作を示す動作フロー図、第3図は発声語句の指示の動
作を詳a1c示す処理ンロー図、第4図(a)は語句集
メモリの記憶状fA’c示す図、第4図(b)は発声語
句Wiの内部フ」−マントを示す図、第5図は音節テー
ブルメモリの記憶状態を示す図、第6図は発声語句の表
示例を示す図、第7図は各信号の出力状態を示す図、第
8図はエコーバンクによる音節波形出力及び音勅″i特
徴パターンの登録の動作を詳細に示す動作ンロー図、第
9図は標準パターンテーブルメモリ及び音節標準パター
ンメモリの記憶状態を示す図である。 1・・・マイク、 4・・・音響処理部、5・・・語句
集メモリ、 6・・・語句バッファ、8・・・標準パタ
ーンテーブルメモリ、9・・・音節標準パターンメモリ
、 10・・音節特徴バッファ、 18・・・ディスプレイ
、D・・・登録する音節を明示する記号。

Claims (1)

  1. 【特許請求の範囲】 1、入力された音声を音節毎に認識する日本語音声入力
    装置において、 語句を発声することによシ音声中に含まれる特定の音節
    の特徴を抽出して音節等のよシ細分化された単位の特徴
    を装置に登録するに際し、登録すべき音節を他の音節と
    区別するよう明示した音節系列を表示して発声語句を指
    示し、発声された音声中から登録を指示した音節の特徴
    パターンを登録せしめるように成したことを特徴とする
    音声登録方式。
JP58167308A 1983-09-09 1983-09-09 日本語音声入力装置 Granted JPS6057899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58167308A JPS6057899A (ja) 1983-09-09 1983-09-09 日本語音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58167308A JPS6057899A (ja) 1983-09-09 1983-09-09 日本語音声入力装置

Publications (2)

Publication Number Publication Date
JPS6057899A true JPS6057899A (ja) 1985-04-03
JPH0229230B2 JPH0229230B2 (ja) 1990-06-28

Family

ID=15847335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58167308A Granted JPS6057899A (ja) 1983-09-09 1983-09-09 日本語音声入力装置

Country Status (1)

Country Link
JP (1) JPS6057899A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61296396A (ja) * 1985-06-25 1986-12-27 松下電工株式会社 音声コ−ド作成方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61296396A (ja) * 1985-06-25 1986-12-27 松下電工株式会社 音声コ−ド作成方法
JPH0632019B2 (ja) * 1985-06-25 1994-04-27 松下電工株式会社 音声コ−ド作成方法

Also Published As

Publication number Publication date
JPH0229230B2 (ja) 1990-06-28

Similar Documents

Publication Publication Date Title
WO2007055233A1 (ja) 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム
MXPA06003431A (es) Metodo para sintetizar voz.
US6546369B1 (en) Text-based speech synthesis method containing synthetic speech comparisons and updates
JP3518898B2 (ja) 音声合成装置
JPH08335096A (ja) テキスト音声合成装置
JPS6057899A (ja) 日本語音声入力装置
JPH06337876A (ja) 文章読み上げ装置
JP2004021207A (ja) 音素認識方法、音素認識装置および音素認識プログラム
JPH0546557B2 (ja)
JPH09179578A (ja) 単音節認識装置
JPH07200554A (ja) 文章読み上げ装置
JP2001067096A (ja) 音声認識結果評価装置および記録媒体
JP3522005B2 (ja) 音声合成装置
JPH0634175B2 (ja) 文章読上げ装置
JPH02238494A (ja) 音声合成装置
Dersch A decision logic for speech recognition
JPH08110790A (ja) 音声認識装置
KR100317215B1 (ko) Plu를 이용한 화자독립/어휘독립 음성모델 등록장치 및그 방법
Kirvan Conversing with computers
De Wet et al. Towards speech technology for South African languages: automatic speech recognition in Xhosa
JPH0285899A (ja) 音声合成装置
JPH07140999A (ja) 音声合成装置及び音声合成方法
JPH08160990A (ja) 音声合成装置
JPH01119822A (ja) 文章読み上げ装置
JP2002268671A (ja) 音声認識方法及び装置及び記憶媒体