JPS58223194A - 日本語音声入力方式 - Google Patents
日本語音声入力方式Info
- Publication number
- JPS58223194A JPS58223194A JP57105888A JP10588882A JPS58223194A JP S58223194 A JPS58223194 A JP S58223194A JP 57105888 A JP57105888 A JP 57105888A JP 10588882 A JP10588882 A JP 10588882A JP S58223194 A JPS58223194 A JP S58223194A
- Authority
- JP
- Japan
- Prior art keywords
- input
- utterance
- stem
- standard pattern
- voice input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(1)発明の技術分野
本発明は/l!足話者による発声登録を単語単位で格納
しておき、Mtg時人力発声を文節単位で行なうように
して照会する日本晴音声入力方式に関するものでめる。
しておき、Mtg時人力発声を文節単位で行なうように
して照会する日本晴音声入力方式に関するものでめる。
(2)従来技術と+tt1m点
従来の音声入力装置のとくに日本晴音声入力という分野
では、一般に単音節単位の入力方式が多く研究され、一
部試作模も開発されている。九とえば「私は山が好きで
す」というInを「わ、た。
では、一般に単音節単位の入力方式が多く研究され、一
部試作模も開発されている。九とえば「私は山が好きで
す」というInを「わ、た。
し、は、・・・、で、す」のように単音netに区切っ
て発声する方式で必るが、この方式にも次のような問題
点がめる。
て発声する方式で必るが、この方式にも次のような問題
点がめる。
第1にはdg率が低いという点である。これは子音部の
識別が技術的に大変国−でめplなかなか実用的な−m
*′まで向上させることは容易でないからで必る。!2
には単音節に区切って発声するのは人間にとって苦痛で
るシ、シかも入力速度が遅いという欠点が必る。
識別が技術的に大変国−でめplなかなか実用的な−m
*′まで向上させることは容易でないからで必る。!2
には単音節に区切って発声するのは人間にとって苦痛で
るシ、シかも入力速度が遅いという欠点が必る。
そこで、発声−よび入力単位として前例の「わたしは」
、「山が」 「好きです」のように文節単位とすること
によシ、入閣にとっては発声が楽になり、また発声長が
長いということから単it節のように細かな7#黴をと
らえる必要はかならずしもなく、全体的なml!の中で
特w1t−とらえることが=iT能となるので、ag繊
織率向上することが期待される。しかし、文節は饋袢(
わたし)十藷尾(は)のように、同じ名詞でも語尾の変
化に応じて多くの文節が存在することになシ、これらの
文It−すべて発声して標準パター/とじて登録してお
かねば認識できないという欠点がめる。
、「山が」 「好きです」のように文節単位とすること
によシ、入閣にとっては発声が楽になり、また発声長が
長いということから単it節のように細かな7#黴をと
らえる必要はかならずしもなく、全体的なml!の中で
特w1t−とらえることが=iT能となるので、ag繊
織率向上することが期待される。しかし、文節は饋袢(
わたし)十藷尾(は)のように、同じ名詞でも語尾の変
化に応じて多くの文節が存在することになシ、これらの
文It−すべて発声して標準パター/とじて登録してお
かねば認識できないという欠点がめる。
(3)発明の目的
本発明の目的は特定話者により発声登録を単一単位で格
納しておき、gIilli1時入力発声を大入力発声行
なうようにして照合する日本語音声入力方式を提供する
ことである。
納しておき、gIilli1時入力発声を大入力発声行
なうようにして照合する日本語音声入力方式を提供する
ことである。
(4)発明の構成
前ddl的t−達成するため、本発明の日本語音声入力
方式は特定話者により発声登録す4儂準パターンを単語
単位で錯袢、崎尾の指定とともに格納しておき、4織時
入力発声金文節率位で行ない、該発声され九音声の特徴
情報から母音数を判定する手段によりf4数を求め、前
記登録され九単饋ρm幹、餠尾の組合せのうち前記脅顧
故に等しいものt−選択して+jlA準パターンを構成
し照合を行なわせることt−特数とするものでめる。
方式は特定話者により発声登録す4儂準パターンを単語
単位で錯袢、崎尾の指定とともに格納しておき、4織時
入力発声金文節率位で行ない、該発声され九音声の特徴
情報から母音数を判定する手段によりf4数を求め、前
記登録され九単饋ρm幹、餠尾の組合せのうち前記脅顧
故に等しいものt−選択して+jlA準パターンを構成
し照合を行なわせることt−特数とするものでめる。
(5)発明の実施丙
本発明の原理は、日本語の音声入力の1方法として、文
節単位で発声された音声を、その発声音中の母音数(音
KJ数)を推定することによシ、あらかじめ特定話者が
語幹、饋尾を指定して単一単位に発声し登録した標準パ
ターン群中から、そのf4数に合致するような標準バタ
ー/の語幹、語尾の組合せt−選択し、それらを入力発
声の%徴バター/と照合することによp1発声された文
節を識別しようとするものでるる。
節単位で発声された音声を、その発声音中の母音数(音
KJ数)を推定することによシ、あらかじめ特定話者が
語幹、饋尾を指定して単一単位に発声し登録した標準パ
ターン群中から、そのf4数に合致するような標準バタ
ー/の語幹、語尾の組合せt−選択し、それらを入力発
声の%徴バター/と照合することによp1発声された文
節を識別しようとするものでるる。
いま、ここでは−幹に1つの語尾変化(たとえば助詞)
が付/jilt L丸形の文jlit−仮定することに
する。
が付/jilt L丸形の文jlit−仮定することに
する。
また、入力発声の文節およびIIIlターンの丸めの単
鎖単位たとえば名詞、助詞尋の発声に2いて、母音数は
一般的に用いられているフォルマント抽出操作により推
定することにより、f#鋏を求めることとする。
鎖単位たとえば名詞、助詞尋の発声に2いて、母音数は
一般的に用いられているフォルマント抽出操作により推
定することにより、f#鋏を求めることとする。
発声されfc蓄声を!#分析した後得られる時系列を次
のtPFP黴ベクトルで表わす。
のtPFP黴ベクトルで表わす。
ここでR((xlsn)は周波数次元の特徴ベクトルで
るる。
るる。
時系列特徴ベクトルPt一時間軸につき正規化したもの
をP とすれば 7=宕p二itl・・・ j章° (η$≦7! )
(2)ここでPt (t =1
* m)は谷周波数について時間方向に平均化したもの
でるる。
をP とすれば 7=宕p二itl・・・ j章° (η$≦7! )
(2)ここでPt (t =1
* m)は谷周波数について時間方向に平均化したもの
でるる。
あらかじめ登録される標準パターン用の単一単位の発声
は式(IL (z)に従って音響分析され、母音数を推
定することにより、flfJ故毎に時系列Sすなわち標
準パターンの時系列を分層し、語幹。
は式(IL (z)に従って音響分析され、母音数を推
定することにより、flfJ故毎に時系列Sすなわち標
準パターンの時系列を分層し、語幹。
WIi尾別に次弐の例のように格納する。
語幹 tI尾
ま九、文節単位で発声された入力音声はIWJ様に音響
分析され、!f数進足が行なわれ、音節数が求められる
。
分析され、!f数進足が行なわれ、音節数が求められる
。
この音4数をMとする。その%微パターンの時系→藝
列を工とする。
次に入力音声の時系列工と標準パターンの時系→を
列S間での照合tt鼻を次のように行なう。
すなわち、入力音声の音節数Mの情報より、標準パター
ンで語幹の音jl数と語尾の音節数の相がMになるよう
なすべての組合せを考える。この各々の戚曾せについて
、まず、語幹の標準パターン時系列と、入力発声の時系
列とを、始点をIl−1n始点として距−計算(テエビ
クエ7距廟)を行ない、その距4をdgtc4;組合せ
のfji順序番号)とする。
ンで語幹の音jl数と語尾の音節数の相がMになるよう
なすべての組合せを考える。この各々の戚曾せについて
、まず、語幹の標準パターン時系列と、入力発声の時系
列とを、始点をIl−1n始点として距−計算(テエビ
クエ7距廟)を行ない、その距4をdgtc4;組合せ
のfji順序番号)とする。
次iC!尾の標準パターン時系列と入力発声の時系列と
t−終点t−欽させるようにして距−計算を行ない、こ
の距4 t dh4とする。
t−終点t−欽させるようにして距−計算を行ない、こ
の距4 t dh4とする。
上日己ti其をナベての組合せにつき行ないdg4+d
h4が賊小距141itもつ語幹十−尾が入力発声の文
節の4威結果とする。
h4が賊小距141itもつ語幹十−尾が入力発声の文
節の4威結果とする。
このような処理に19、発声f録には単一単位で、入力
発声には文節単位で行なうことが可能となシ、前述した
欠点を尿去することができる。
発声には文節単位で行なうことが可能となシ、前述した
欠点を尿去することができる。
図は上記原理に従う本発明の実施例の構成説明図である
。
。
同図において、発声された音声は入力装fi111から
取込まれ、A/D変換′a2でA /p変洪される。次
に分析部5で音響分析され、音1iB畝判定s4で音4
数を判定し、41&l嶺抽出部5で特徴パラメータを抽
出し前述したように時間軸方向の正規化を行ない、時系
列の形の籍微ベクトルパターン&作る。
取込まれ、A/D変換′a2でA /p変洪される。次
に分析部5で音響分析され、音1iB畝判定s4で音4
数を判定し、41&l嶺抽出部5で特徴パラメータを抽
出し前述したように時間軸方向の正規化を行ない、時系
列の形の籍微ベクトルパターン&作る。
′wJ偶s6で登録、4鐵時の切換えを行なう。
まず、標準バター7に作成するため、特定話者の発声t
−盆録する礪貧には、切換部6をα閾に切換え、指示入
力部8で話者が語幹、語尾の指定を手動で入カレ、アド
レス指示部(A)9とアドレス指示部(B)11によ如
それぞれ飴幹、lfi尾の指定、f4赦のId定をアド
レス賀洪し、辞書メモリ部12の44パターン浴納アド
レスを指示し、パターンを格納する。
−盆録する礪貧には、切換部6をα閾に切換え、指示入
力部8で話者が語幹、語尾の指定を手動で入カレ、アド
レス指示部(A)9とアドレス指示部(B)11によ如
それぞれ飴幹、lfi尾の指定、f4赦のId定をアド
レス賀洪し、辞書メモリ部12の44パターン浴納アド
レスを指示し、パターンを格納する。
次に、−織の)m盆には、切換部6をb閾に切快え、ア
ドレス指示部10で入力発声から得られる音4故11v
罐から、語幹、暗尾の組を1−示して辞簀メそり部12
からそれぞれの標準パターンを選び、照合部7で語幹、
tlJ4mに距離計算を行ない、その和を距離とし、
各組すべてについても同様に計算し、最小絶線をもつ組
を入力発声の文節の職別結果として出力する。
ドレス指示部10で入力発声から得られる音4故11v
罐から、語幹、暗尾の組を1−示して辞簀メそり部12
からそれぞれの標準パターンを選び、照合部7で語幹、
tlJ4mに距離計算を行ない、その和を距離とし、
各組すべてについても同様に計算し、最小絶線をもつ組
を入力発声の文節の職別結果として出力する。
(6)発明の詳細
な説明したように、本発明によれば、単鎖単位で発声f
祿された標準パターンを用いて、文節単位の入力発声の
音声を認識するもので、を4故を推定することで、入力
発声に対する照合′X1破を少なi組合せにでき、ti
算量も削減することができる。しかも文節すべてを標準
パター/とじてf録するのに比べて辞1iF容量を大幅
に減少でさるという効果がある。
祿された標準パターンを用いて、文節単位の入力発声の
音声を認識するもので、を4故を推定することで、入力
発声に対する照合′X1破を少なi組合せにでき、ti
算量も削減することができる。しかも文節すべてを標準
パター/とじてf録するのに比べて辞1iF容量を大幅
に減少でさるという効果がある。
図は本発明の実施例の構成説明図でろ91図中、1は入
力装置、2はi10変換婚、5は分析部、4は音節数判
定部、5は特wIt拙出部、6は切換部、7は照−&都
、8は指示入力部、9.10.11はアドレス指示部、
12は静★メモリ部r示す。
力装置、2はi10変換婚、5は分析部、4は音節数判
定部、5は特wIt拙出部、6は切換部、7は照−&都
、8は指示入力部、9.10.11はアドレス指示部、
12は静★メモリ部r示す。
Claims (1)
- 特定t&者により発声登録する標準パターンを単語単位
で語幹、m尾の指定とともに格納しておaS−織時入力
発声を文節単位で行ない、該発声された音声の%黴情擢
から母f数金判定する手段によ如音節畝を求め、前記f
録された率讃の語幹1語尾の組合せのうち前β己f節a
に等しいものを通訳して標準パターンt−構成し照会を
行なわせることt−%黴とする日本晴音声入力方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57105888A JPS58223194A (ja) | 1982-06-19 | 1982-06-19 | 日本語音声入力方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57105888A JPS58223194A (ja) | 1982-06-19 | 1982-06-19 | 日本語音声入力方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS58223194A true JPS58223194A (ja) | 1983-12-24 |
JPH0445840B2 JPH0445840B2 (ja) | 1992-07-28 |
Family
ID=14419452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57105888A Granted JPS58223194A (ja) | 1982-06-19 | 1982-06-19 | 日本語音声入力方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58223194A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5958491A (ja) * | 1982-09-28 | 1984-04-04 | 富士通株式会社 | 音声認識装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5786899A (en) * | 1980-11-18 | 1982-05-31 | Mitsubishi Electric Corp | Voice recognition apparatus |
-
1982
- 1982-06-19 JP JP57105888A patent/JPS58223194A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5786899A (en) * | 1980-11-18 | 1982-05-31 | Mitsubishi Electric Corp | Voice recognition apparatus |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5958491A (ja) * | 1982-09-28 | 1984-04-04 | 富士通株式会社 | 音声認識装置 |
JPH0444280B2 (ja) * | 1982-09-28 | 1992-07-21 | Fujitsu Ltd |
Also Published As
Publication number | Publication date |
---|---|
JPH0445840B2 (ja) | 1992-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jelinek | Continuous speech recognition by statistical methods | |
US8321218B2 (en) | Searching in audio speech | |
JP3814459B2 (ja) | 音声認識方法及び装置と記憶媒体 | |
JPS58102299A (ja) | 部分単位音声パタン発生装置 | |
JP2017167188A (ja) | 情報処理装置、情報処理方法、プログラムおよび認識システム | |
US5764851A (en) | Fast speech recognition method for mandarin words | |
JPS58223194A (ja) | 日本語音声入力方式 | |
JP2001312293A (ja) | 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体 | |
Tunalı | A speaker dependent, large vocabulary, isolated word speech recognition system for turkish | |
JP3440840B2 (ja) | 音声認識方法及びその装置 | |
Chang et al. | Chinese dialect identification using segmental and prosodic features | |
JP3299170B2 (ja) | 音声登録認識装置 | |
JP2603920B2 (ja) | 音声認識装置 | |
JPS60164800A (ja) | 音声認識装置 | |
JP2000172286A (ja) | 中国語音声合成のための同時調音処理装置 | |
Nair et al. | A Study on Automatic Speech Recognition | |
JP2685429B2 (ja) | 音声認識装置 | |
JP2862306B2 (ja) | 音声認識装置 | |
JPH05303391A (ja) | 音声認識装置 | |
JPS60150098A (ja) | 音声認識装置 | |
JPS6011898A (ja) | 音声認識装置 | |
JPS607492A (ja) | 単音節音声認識方式 | |
JPH0527794A (ja) | 音声認識方式 | |
JPH0695684A (ja) | 音声認識システム | |
JPS6312000A (ja) | 音声認識装置 |