JPH0229230B2 - - Google Patents

Info

Publication number
JPH0229230B2
JPH0229230B2 JP58167308A JP16730883A JPH0229230B2 JP H0229230 B2 JPH0229230 B2 JP H0229230B2 JP 58167308 A JP58167308 A JP 58167308A JP 16730883 A JP16730883 A JP 16730883A JP H0229230 B2 JPH0229230 B2 JP H0229230B2
Authority
JP
Japan
Prior art keywords
syllable
word
syllables
registered
uttered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58167308A
Other languages
English (en)
Other versions
JPS6057899A (ja
Inventor
Fumio Togawa
Mitsuhiro Toya
Yoshiki Nishioka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP58167308A priority Critical patent/JPS6057899A/ja
Publication of JPS6057899A publication Critical patent/JPS6057899A/ja
Publication of JPH0229230B2 publication Critical patent/JPH0229230B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 <発明の技術分野> 本発明は入力された音声を音節毎に認識する日
本語音声入力装置の改良に関し、更に詳細には音
節等により細分化された単位の特徴を装置に登録
するとき、語句を発声することにより音声中に含
まれる特定の音節の特徴を抽出して装置に登録す
る音声登録方式の改良に関するものである。
<発明の技術的背景とその問題点> 一般に音節を単位に入力音声を認識する方式の
日本語音声入力装置においては、入力音声を音節
単位にセグメント化して音節のセグメンテーシヨ
ンを行ない、次に各音節から抽出した特徴パター
ンを予め登録している音節標準パターンと比較照
合(パターンマツチング)して最も類似した標準
パターンが属する音節を識別結果とするように成
されている。また、このような装置において、従
来は弧立で発声した単音節、或いは母音と単音節
を組みにして発声した音声から抽出した単音節か
ら抽出した特徴パターンを標準パターンとして予
め登録していた。
このような方法で登録された標準パターンを用
いた音声入力装置にあつては、入力する音声が離
散的な発声である場合には充分な音節識別確度を
得ることが出来るが、より連続的な発声である場
合には満足な音節識別確度を得ることが出来ない
という問題点があつた。
即ち、入力する音声がより連続的な発声である
場合、調音結合と呼ばれる前後の音節の影響を受
けて音節の特徴パターンが変形し、音節識別確度
が低下することになる。
したがつて、入力する音声が連続的になれば、
変形したより入力音声に近い特徴パターンを登録
する方が音節識別確度を向上させる上で、より有
利であると考えられる。
<発明の目的> 本発明は上記諸点に鑑みて成されたものであ
り、連続音声の認識に適した音節標準パターンを
作成することが出来る日本語音声入力装置を提供
することを目的とし、この目的を達成するため、
本発明の日本語音声入力装置は、語句を発声する
ことにより音声中に含まれる特定の音節の特徴を
抽出して音節等のより細分化された単位の特徴を
装置に登録するに際し、登録すべき音節を他の音
節と区別するよう明示した音節系列を表示して発
声語句を発声者(オペレータ)に視覚的に指示
し、発声された音声中から登録を指示した音節の
特徴パターンを登録せしめるように構成されてい
る。
<発明の実施例> 以下、本発明の一実施例を図面を参照して詳細
に説明する。
第1図は本発明の日本語音声入力装置の構成を
示すブロツク図である。
第1図において、1は登録すべき入力音声及び
認識すべき入力音声をピツクアツプして電気信号
に変換するマイクであり、このマイク1の出力は
アンプ2で増幅された後、アナログ・デイジタル
変換手段3によつてA−D変換し、このA−D変
換された信号は音響処理部4に入力されて、この
音響処理部4で分析されて音節のセグメンテーシ
ヨンが行なわれて音節が抽出され、また韻律情報
及び各音節の特徴パターン|Piが検出される。
5は発声すべき語句群を語句とその語句に含ま
れる音節のうち登録する音節を指示して記憶した
語句集メモリ、6はこの語句集メモリ5から読出
された一つの語句データを記憶する語句バツフ
ア、7は音節番号と文字コードとの対応関係を記
憶した音節テーブルメモリ、8は標準パターンテ
ーブルメモリ、9は音節標準パターンメモリ、1
0は音節特徴バツフア、11は音声信号波形バツ
フア、12は中央処理装置(CPU)、13はキー
ボード、14は周波数発生器、15はデイジタ
ル・アナログ変換手段、16はアンプ、17はス
ピーカ、18はデイスプレイである。
次に上記の様に構成された装置の動作を説明す
る。
第2図は本発明日本語音声入力装置の音声登録
方式の処理動作を示すフロー図である。
装置の語句集メモリ5には上記したように予め
語句とその語句に含まれる音節のうち登録する音
節を指示した形で記憶している。
今、装置に音節標準パターンを登録するため、
キーボード13を操作して装置を登録モードにす
ると、ステツプn1(第2図)においてCPU12は
語句集メモリ5より発声語句を読み出して登録す
る音節を明示してデイスプレイ18上に表示して
発声する語句をオペレータに指示する。
例えば読み出された発声語句Wiが「山脈」
で/さ/、/みや/、/く/の3音節を登録する
場合について説明する。
第3図は上記第2図に示したステツプn1の発
声語句の指示の動作を詳細に示した処理フローで
あり、ステツプn101においてまず発声語句Wiが
語句集メモリ5から語句バツフア6に読み出され
る。語句集メモリ5には第4図aに示すように複
数の語句Wi(i=1〜n)が記憶されており、こ
の語句の内部フオーマツトは第4図bに示すよう
に音節数領域A、登録音節明示領域B、音節番号
領域Cより構成されており、発声語句Wi「山脈」
で/さ/、/みや/、/く/の3音節を登録する
場合には音節数Aが「4」、登録音節は第1、第
3、第4音節であることをビツトの1で表わした
データB=<10110000>及び語句を音節番号で表
現したデータC=「11、68、83、8、0、…」が
続いて記憶されている。
語句バツフア6に記憶された発声語句の語句内
部コードWiがロードされ(n102,n103)、その内
容がCPU12において判別される。まずステツ
プn104においてJ=1にセツトされ、次にステ
ツプn105においてデータBの第Jビツトが1で
あるか否かが判定され、判定結果が1であればシ
ンボル記号、例えば括弧(,)が附加され(ステ
ツプn106)、次にステツプn107に移行して音節番
号データC(J)の音節文字変換が実行される。
このステツプn107の動作は第5図に示す如き音
節テーブルメモリ7に記憶された音節番号と文字
コードの対応データにもとずいて音節番号を文字
コードに変換する。次にステツプn108において
Jの値が+1され、ステツプn109においてJの
値が音節数Aの値を越えたか否かが判定され、J
>Aになるまでn105〜n109のステツプが繰返さ
れ、上記した一連の動作によつて登録する音節を
明示するシンボル記号を附加したかな文字コード
列が作成され、そのかな文字コード列が出力され
て(n110,111)デイスプレイ18に表示される
ことになる。このようにして語句集メモリ5から
読み出された発声語句の内部情報Wiに従つて音
節テーブルメモリ7を使つて音節番号を文字コー
ドに変換し、またデータBにしたがつて登録する
音節を記号(,)でくくつて第6図に示すように
デイスプレイ18上に表示する。
なお、上記の例では登録する音節を明示する記
号Dは括弧としているが、これに限定されるもの
ではなく、鍵括弧、アンダーライン等の他の記
号、または登録音節をグレイ表示または異なるカ
ラーで表示する更には点滅表示等、登録する音節
を他の音節と区別して明示し得るものであれば良
い。
次にオペレータ(発声者)はデイスプレイ18
上の表示を見て/さんみやく/と発声する
(n2)。この音声はマイク1によつて電気信号に
変換され(第7図a参照)、アンプ2で増幅され
た後、アナログ・デイジタル変換手段3でA・D
変換されて音響処理部4に入力される。
音響処理部4は公知のものよく、デイジタル変
換された音声入力を分析してステツプn3におい
て音節のセグメンテーシヨンによつて音節を抽出
し(第7図b参照)、また各音節の特徴パターン
|Pi及び音節数、発声速度、音程等の韻律情報を
検出し(n4,5)、それらの特徴量を音節特徴バ
ツフア10に一時記憶する。同時に各音節の信号
波形を音声信号波形バツフア11に一時記憶す
る。
次にステツプn6に移行して正しい韻律である
か否かを判定する。即ち上記ステツプn5におい
て検出したモーラ数(音節数)、テンポ(発声速
度)についてモーラ数は正しいか、テンポは規定
範囲かを判定して、もし、規定範囲外の音声であ
れば、その語句(山脈)の正しい韻律情報(正し
いモーラ数、標準のテンポ)をD/A変換手段1
5でD/A変換してスピーカ17等によりブザー
音で出力する(n7)。これによつて、オペレータ
に警告すると同時に正しい発声方法を報知して言
い直しを指示することになる。
語句の韻律情報は例えば上記語句集メモリ5に
音節番号列と共に記憶されており、発声語句Wi
が「山脈」の場合、第4図bに示したようにA領
域にモーラ数M=4が記憶されており、音節番号
列Cにおいてテンポ情報Si(0.3,0.3,0.3,0.3)
が記憶されている。一方オペレータの発声入力に
対してステツプn5において韻律情報モーラ数M
及びテンポ数Siが検出され、この検出内容と語句
集メモリ5に記憶された標準韻律情報を比較し
て、発声した音声入力が正しい韻律であつたか否
かを判定する。
この判定の結果、規定範囲内の音声であれば、
登録する音節/さ/、/みや/、/く/の音声信
号を音声信号波形バツフア11から読み出して
D/A変換手段15によつてD/A変換して出力
する(n8)。オペレータは、このエコーバツク音
を聴いて音節の音韻情報の良否を判定して音節特
徴バツフア10に記憶している良質音節の特徴パ
ターン(|P1,|P3,|P4)を音節標準パターン
メモリ9に登録する(n10)。この時標準パター
ンテーブルメモリ8には第9図に示すように語句
番号Wiの第j音節の音節であること(第4音節
の/く/、第1音節の/さ/、第3音節の/み
や/)を音節標準パターンと対応して記述する。
なお、ステツプn9においてオペレータが不良
音声であると判定したときにはキーボード13上
の特定のキーを操作してステツプn2に戻らせ、
再び言い直すことになる。
また上記音節特徴パターンの登録(n10)が終
了すればステツプn1に戻り、装置は次の発声語
句を上記した同じ動作ステツプでデイスプレイ1
0上に表示する。
第8図は上記第2図に示したステツプn8のエ
コーバツクによる音節波形出力の動作及びステツ
プn10の音節特徴パターンの登録の動作を詳細に
示した動作フローであり、ステツプn6において
正しい韻律と判定されると、まずステツプn81に
おいてJ=1にセツトされ、次にステツプn82に
おいてデータBの第Jビツトが1であるか否かが
判定され、判定結果が1であれば音声信号波形バ
ツフア11より第J音節の音節波形が出力され
(n83)、該音節波形出力はD/A変換手段15に
よつて音声アナログ信号に変換されてスピーカ1
7等により出力される。次にステツプn84にお
いてJの値が+1され、ステツプn85においてJ
の値が音節数Aを越えたか否かが判定され、J>
Aになるまでn82〜85のステツプが繰返され、こ
の一連した動作によつて登録する音節を明示し
た/さ/、/みや/、/く/のみが第7図cに示
すようにエコーバツクされる。
オペレータは、このエコーバツク音を聴いて音
節の音韻情報の良否を判定し、ステツプn9にお
いて良質音節と判断した場合には、次のステツプ
n91においてJ=1にセツトされ、次にステツプ
92においてデータBの第Jビツトが1であるか否
かが判定され、判定結果が1であれば音節特徴バ
ツフア10より第J音節の音節特徴パターンを読
み出して音節標準パターンメモリ9へ登録し、次
にステツプn94に移行してC(J),i,Jをペア
ーとして音節標準パターンの番地と対応した標準
パターンテーブルメモリ8の番地に書き込む。次
にステツプn95に移行してJの値が+1され、ス
テツプn96においてJの値が音節数Aを越えたか
否かが判定され、J>Aになるまでn92〜n96の
ステツプが繰返され、この一連した動作によつて
登録する音節を明示した/さ/、/みや/、/
く/に対する音節特徴パターン(|P1,|P3,|
P4)が第7図dに示すように音節特徴バツフア
10より読み出されて音節標準パターンメモリ9
に登録される。
以上のようにして登録すべき音節が他の音節と
区別して明示され、また発声された音声中より登
録の予め明示された音節の特徴パターンが音節標
準パターンとして登録される。
なお、上記した実施例においては、語句集メモ
リ5に予め記憶した語句を表示して発声を指示す
るようにしたが、本発明はこれに限定されるもの
ではなく、例えば第3図のステツプn112,n113
に示すように、発声したい語句を登録すべき音節
を記号(,)等で区別してキーボード13上より
かな文字コード列で入力し、このデータをかな文
字コード/語句内部コード変換して語句バツフア
6に入力し、以下上記したステツプn2以後を実
行せしめるように成してもよい。
また装置が入力した音声を認識するモードであ
るとき、入力し難い音節を表示上で指示して、そ
の音節の特徴パターンを標準パターンとして登録
してもよい。即ち例えば「文脈」と発声したとき
の識別結果が/ふんみやく/とデイスプレイに出
力されたとき、キーボードから表示上の/ふ/
を/ぶ/に変更してカーソル等で指示し、第1音
節の音節パターンをカテゴリー/ぶ/の標準パタ
ーンとして登録するように成してもよい。
<発明の効果> 以上の様に本発明によれば、連続音声の認識に
適した音節標準パターンを作成するため、語句を
発声することにより音声中に含まれる特定の音節
の特徴を装置に登録する日本語音声入力装置であ
つて、発声すべき語句を、語句とその語句に含ま
れる音節のうち登録する音節を指示した形態で記
憶保持するメモリ手段と、発声する語句を明示す
るため、前記メモリ手段より発声語句を読み出し
て登録すべき音節を他の音節と区別して該語句の
音節系列をデイスプレイにて表示する表示制御手
段と、前記デイスプレイで表示指示された語句の
発声に基づき、この発声された連続音声中から前
記登録指示された音節の特徴パターンの登録を実
行する登録手段とを備え、連続音声の中の登録が
指示された音節の特徴パターンの登録ができるよ
うに成した日本語音声入力装置としているため、
連続音声の認識に適した音節標準パターンを確度
高く効率的に作成することが出来る。
また、登録指示された所定語句の中の特定音節
の特徴パターンを登録する場合にも、オペレータ
はその語句の音節系列と共に登録すべき音節が他
の音節と区別してデイスプレイで明示され、その
登録指示音節を確認したうえで指示された語句の
音声入力ができ、オペレータにとつてこの音声入
力からこの登録処理が容易となる。
【図面の簡単な説明】
第1図は本発明を実施した日本語音声入力装置
の構成を示すブロツク図、第2図は本発明日本語
音声入力装置の音声登録方式の処理動作を示す動
作フロー図、第3図は発声語句の指示の動作を詳
細に示す処理フロー図、第4図aは語句集メモリ
の記憶状態を示す図、第4図bは発声語句Wiの
内部フオーマツトを示す図、第5図は音節テーブ
ルメモリの記憶状態を示す図、第6図は発声語句
の表示例を示す図、第7図は各信号の出力状態を
示す図、第8図はエコーバツクによる音節波形出
力及び音節特徴パターンの登録の動作を詳細に示
す動作フロー図、第9図は標準パターンテーブル
メモリ及び音節標準パターンメモリの記憶状態を
示す図である。 1…マイク、4…音響処理部、5…語句集メモ
リ、6…語句バツフア、8…標準パターンテーブ
ルメモリ、9…音節標準パターンメモリ、10…
音節特徴バツフア、18…デイスプレイ、D…登
録する音節を明示する記号。

Claims (1)

  1. 【特許請求の範囲】 1 連続音声の認識に適した音節標準パターンを
    作成するため、語句を発声することにより音声中
    に含まれる特定の音節の特徴を装置に登録する日
    本語音声入力装置であつて、 発声すべき語句を、語句とその語句に含まれる
    音節のうち登録する音節を指示した形態で記憶保
    持するメモリ手段と、 発声する語句を明示するため、前記メモリ手段
    より発声語句を読み出して登録すべき音節を他の
    音節と区別して該語句の音節系列をデイスプレイ
    にて表示させる表示制御手段と、 前記デイスプレイで表示指示された語句の発声
    に基づき、この発声された連続音声中から前記登
    録指示された音節の特徴パターンの登録を実行す
    る登録手段とを備え、連続音声の中の登録が指示
    された音節の特徴パターンの登録ができるように
    成した日本語音声入力装置。
JP58167308A 1983-09-09 1983-09-09 日本語音声入力装置 Granted JPS6057899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58167308A JPS6057899A (ja) 1983-09-09 1983-09-09 日本語音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58167308A JPS6057899A (ja) 1983-09-09 1983-09-09 日本語音声入力装置

Publications (2)

Publication Number Publication Date
JPS6057899A JPS6057899A (ja) 1985-04-03
JPH0229230B2 true JPH0229230B2 (ja) 1990-06-28

Family

ID=15847335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58167308A Granted JPS6057899A (ja) 1983-09-09 1983-09-09 日本語音声入力装置

Country Status (1)

Country Link
JP (1) JPS6057899A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0632019B2 (ja) * 1985-06-25 1994-04-27 松下電工株式会社 音声コ−ド作成方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置

Also Published As

Publication number Publication date
JPS6057899A (ja) 1985-04-03

Similar Documents

Publication Publication Date Title
JPH1091183A (ja) 言語合成のためのランタイムアコースティックユニット選択方法及び装置
US6212501B1 (en) Speech synthesis apparatus and method
JPH0713594A (ja) 音声合成において音声の質を評価するための方法
US6601030B2 (en) Method and system for recorded word concatenation
JPH0229230B2 (ja)
JPH08335096A (ja) テキスト音声合成装置
JPH06337876A (ja) 文章読み上げ装置
JPH0546557B2 (ja)
JP2820093B2 (ja) 単音節認識装置
KR100759729B1 (ko) 발화 파형 코퍼스에 대한 개선들
JPH09152884A (ja) 音声合成装置
JPH064090A (ja) テキスト音声変換方法および装置
JP3522005B2 (ja) 音声合成装置
KR100237288B1 (ko) 음성 인식/합성 방법 및 이를 이용한 완구
Matoušek Building a new Czech text-to-speech system using triphone-based speech units
JPH07140999A (ja) 音声合成装置及び音声合成方法
JPH11344997A (ja) 音声合成方法
JPH06337691A (ja) 音声規則合成装置
JPH0229799A (ja) 音素を単位とした音声認識装置
JPH02238494A (ja) 音声合成装置
JPH08160990A (ja) 音声合成装置
JPH0756589A (ja) 音声合成方法
JPH06138894A (ja) 音声合成装置及び音声合成方法
JPH08110797A (ja) パターンマッチング装置
JPH04243299A (ja) 音声出力装置