JPS58223194A

JPS58223194A - 日本語音声入力方式

Info

Publication number: JPS58223194A
Application number: JP57105888A
Authority: JP
Inventors: 小林　敦仁; 奈良　泰弘; 晋太木村; 繁佐々木
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1982-06-19
Filing date: 1982-06-19
Publication date: 1983-12-24
Also published as: JPH0445840B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（１）発明の技術分野本発明は／ｌ！足話者による発声登録を単語単位で格納
しておき、Ｍｔｇ時人力発声を文節単位で行なうように
して照会する日本晴音声入力方式に関するものでめる。

（２）従来技術と＋ｔｔ１ｍ点従来の音声入力装置のとくに日本晴音声入力という分野
では、一般に単音節単位の入力方式が多く研究され、一
部試作模も開発されている。九とえば「私は山が好きで
す」というＩｎを「わ、た。

し、は、・・・、で、す」のように単音ｎｅｔに区切っ
て発声する方式で必るが、この方式にも次のような問題
点がめる。

第１にはｄｇ率が低いという点である。これは子音部の
識別が技術的に大変国−でめｐｌなかなか実用的な−ｍ
＊′まで向上させることは容易でないからで必る。！２
には単音節に区切って発声するのは人間にとって苦痛で
るシ、シかも入力速度が遅いという欠点が必る。

そこで、発声−よび入力単位として前例の「わたしは」
、「山が」　「好きです」のように文節単位とすること
によシ、入閣にとっては発声が楽になり、また発声長が
長いということから単ｉｔ節のように細かな７＃黴をと
らえる必要はかならずしもなく、全体的なｍｌ！の中で
特ｗ１ｔ−とらえることが＝ｉＴ能となるので、ａｇ繊
織率向上することが期待される。しかし、文節は饋袢（
わたし）十藷尾（は）のように、同じ名詞でも語尾の変
化に応じて多くの文節が存在することになシ、これらの
文Ｉｔ−すべて発声して標準パター／とじて登録してお
かねば認識できないという欠点がめる。

（３）発明の目的本発明の目的は特定話者により発声登録を単一単位で格
納しておき、ｇＩｉｌｌｉ１時入力発声を大入力発声行
なうようにして照合する日本語音声入力方式を提供する
ことである。

（４）発明の構成前ｄｄｌ的ｔ−達成するため、本発明の日本語音声入力
方式は特定話者により発声登録す４儂準パターンを単語
単位で錯袢、崎尾の指定とともに格納しておき、４織時
入力発声金文節率位で行ない、該発声され九音声の特徴
情報から母音数を判定する手段によりｆ４数を求め、前
記登録され九単饋ρｍ幹、餠尾の組合せのうち前記脅顧
故に等しいものｔ−選択して＋ｊｌＡ準パターンを構成
し照合を行なわせることｔ−特数とするものでめる。

（５）発明の実施丙本発明の原理は、日本語の音声入力の１方法として、文
節単位で発声された音声を、その発声音中の母音数（音
ＫＪ数）を推定することによシ、あらかじめ特定話者が
語幹、饋尾を指定して単一単位に発声し登録した標準パ
ターン群中から、そのｆ４数に合致するような標準バタ
ー／の語幹、語尾の組合せｔ−選択し、それらを入力発
声の％徴バター／と照合することによｐ１発声された文
節を識別しようとするものでるる。

いま、ここでは−幹に１つの語尾変化（たとえば助詞）
が付／ｊｉｌｔ　Ｌ丸形の文ｊｌｉｔ−仮定することに
する。

また、入力発声の文節およびＩＩＩｌターンの丸めの単
鎖単位たとえば名詞、助詞尋の発声に２いて、母音数は
一般的に用いられているフォルマント抽出操作により推
定することにより、ｆ＃鋏を求めることとする。

発声されｆｃ蓄声を！＃分析した後得られる時系列を次
のｔＰＦＰ黴ベクトルで表わす。

ここでＲ（（ｘｌｓｎ）は周波数次元の特徴ベクトルで
るる。

時系列特徴ベクトルＰｔ一時間軸につき正規化したもの
をＰ　とすれば７＝宕ｐ二ｉｔｌ・・・　ｊ章°　　（η＄≦７！　）
　　　　　　　　　　（２）ここでＰｔ　（ｔ　＝１　
＊　ｍ）は谷周波数について時間方向に平均化したもの
でるる。

あらかじめ登録される標準パターン用の単一単位の発声
は式（ＩＬ　（ｚ）に従って音響分析され、母音数を推
定することにより、ｆｌｆＪ故毎に時系列Ｓすなわち標
準パターンの時系列を分層し、語幹。

ＷＩｉ尾別に次弐の例のように格納する。

語幹　　　　　　　　　ｔＩ尾ま九、文節単位で発声された入力音声はＩＷＪ様に音響
分析され、！ｆ数進足が行なわれ、音節数が求められる
。

この音４数をＭとする。その％微パターンの時系→藝列を工とする。

次に入力音声の時系列工と標準パターンの時系→を列Ｓ間での照合ｔｔ鼻を次のように行なう。

すなわち、入力音声の音節数Ｍの情報より、標準パター
ンで語幹の音ｊｌ数と語尾の音節数の相がＭになるよう
なすべての組合せを考える。この各々の戚曾せについて
、まず、語幹の標準パターン時系列と、入力発声の時系
列とを、始点をＩｌ−１ｎ始点として距−計算（テエビ
クエ７距廟）を行ない、その距４をｄｇｔｃ４；組合せ
のｆｊｉ順序番号）とする。

次ｉＣ！尾の標準パターン時系列と入力発声の時系列と
ｔ−終点ｔ−欽させるようにして距−計算を行ない、こ
の距４　ｔ　ｄｈ４とする。

上日己ｔｉ其をナベての組合せにつき行ないｄｇ４＋ｄ
ｈ４が賊小距１４１ｉｔもつ語幹十−尾が入力発声の文
節の４威結果とする。

このような処理に１９、発声ｆ録には単一単位で、入力
発声には文節単位で行なうことが可能となシ、前述した
欠点を尿去することができる。

図は上記原理に従う本発明の実施例の構成説明図である
。

同図において、発声された音声は入力装ｆｉ１１１から
取込まれ、Ａ／Ｄ変換′ａ２でＡ　／ｐ変洪される。次
に分析部５で音響分析され、音１ｉＢ畝判定ｓ４で音４
数を判定し、４１＆ｌ嶺抽出部５で特徴パラメータを抽
出し前述したように時間軸方向の正規化を行ない、時系
列の形の籍微ベクトルパターン＆作る。

′ｗＪ偶ｓ６で登録、４鐵時の切換えを行なう。

まず、標準バター７に作成するため、特定話者の発声ｔ
−盆録する礪貧には、切換部６をα閾に切換え、指示入
力部８で話者が語幹、語尾の指定を手動で入カレ、アド
レス指示部（Ａ）９とアドレス指示部（Ｂ）１１によ如
それぞれ飴幹、ｌｆｉ尾の指定、ｆ４赦のＩｄ定をアド
レス賀洪し、辞書メモリ部１２の４４パターン浴納アド
レスを指示し、パターンを格納する。

次に、−織の）ｍ盆には、切換部６をｂ閾に切快え、ア
ドレス指示部１０で入力発声から得られる音４故１１ｖ
罐から、語幹、暗尾の組を１−示して辞簀メそり部１２
からそれぞれの標準パターンを選び、照合部７で語幹、
　ｔｌＪ４ｍに距離計算を行ない、その和を距離とし、
各組すべてについても同様に計算し、最小絶線をもつ組
を入力発声の文節の職別結果として出力する。

（６）発明の詳細な説明したように、本発明によれば、単鎖単位で発声ｆ
祿された標準パターンを用いて、文節単位の入力発声の
音声を認識するもので、を４故を推定することで、入力
発声に対する照合′Ｘ１破を少なｉ組合せにでき、ｔｉ
算量も削減することができる。しかも文節すべてを標準
パター／とじてｆ録するのに比べて辞１ｉＦ容量を大幅
に減少でさるという効果がある。

【図面の簡単な説明】

図は本発明の実施例の構成説明図でろ９１図中、１は入
力装置、２はｉ１０変換婚、５は分析部、４は音節数判
定部、５は特ｗＩｔ拙出部、６は切換部、７は照−＆都
、８は指示入力部、９．１０．１１はアドレス指示部、
１２は静★メモリ部ｒ示す。

Claims

【特許請求の範囲】

特定ｔ＆者により発声登録する標準パターンを単語単位
で語幹、ｍ尾の指定とともに格納しておａＳ−織時入力
発声を文節単位で行ない、該発声された音声の％黴情擢
から母ｆ数金判定する手段によ如音節畝を求め、前記ｆ
録された率讃の語幹１語尾の組合せのうち前β己ｆ節ａ
に等しいものを通訳して標準パターンｔ−構成し照会を
行なわせることｔ−％黴とする日本晴音声入力方式。