JPS6283796A - 音声入力装置 - Google Patents

音声入力装置

Info

Publication number
JPS6283796A
JPS6283796A JP60224550A JP22455085A JPS6283796A JP S6283796 A JPS6283796 A JP S6283796A JP 60224550 A JP60224550 A JP 60224550A JP 22455085 A JP22455085 A JP 22455085A JP S6283796 A JPS6283796 A JP S6283796A
Authority
JP
Japan
Prior art keywords
syllable
information
section
candidates
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60224550A
Other languages
English (en)
Inventor
樺澤 哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60224550A priority Critical patent/JPS6283796A/ja
Publication of JPS6283796A publication Critical patent/JPS6283796A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声により文章をコンピュータ等に入力する
だめの音声入力装置に関するものである。
従来の技術 ]ンピュータ等の情報処理装置による文書の処理が盛ん
な昨今、人間にとって最も自然な情報発生手段である音
声が、人間−機械系の情報入力手段として使用できれば
その効果は非常に大きく、音声認識装置を用いて文章を
入力しようという試みも行なわれている。しかしながら
、音声認識装置のもつ認識率が必ずしも100%ではな
いので、発声された文章が必ずしも正確に音節列に変換
されるとは限らず、使用者に認識結果の確認や訂正など
余分な負担をかけ、音声による文章入力の利点を大きく
損うこととなっている。そこで、例えば特開昭59−6
8492号公報で示されているように、音声認識装置の
出力から認識単位(例えば音節)列の候補を生成するに
際して、予め記憶されている認識単位間の連接情報に基
づいて、認識単位の遷移が存在しない認識単位部分列を
含む認識単位列候補を除外することによって、認識単位
列候補の確度を高めて、認識単位列候補と辞書の照合等
の処理量を削減すると共に使用者の負担を軽減しようと
する提案がなされている。
第2図は、前記従来例(特開昭69−58492号公報
)の構成図である。同図において、21は音声入力部、
22は音響処理・比較部、23は音節標準バタン記憶部
、24は候補音節ラティス記憶部、26は候補列作成部
、26は遷移行列記憶部、27は候補列出力部、28は
辞書記憶部、29は辞書参照部である。
以上のように構成された音声入力装置において、音声に
より入力された文章は21で示された音声入力部で電気
信号に変換された後、22で示された音響処理・比較部
で単音節毎に特徴抽出処理が行われて各単音節毎の入力
特徴バタンか前記音響処理・比較部22内のバッファに
一時的に記憶される。一方、23で示される音節標準バ
タン記憶部には各音節毎の標準バタンか記憶されており
、この標準バタンか順次読出されて前記音響処理・比較
部22において前記音響処理・比較部22内のバッファ
に一時的に記憶されている前記入力特徴バタンとのマツ
チング計算が行われ、尤度の高いものから順に、第1候
補、第2候補・・・・・・・・・として選出され、その
結果が24で示された候補音節ラティス記憶部に記憶さ
れる。前記候補音節ラティス記憶部24に記憶された複
数個の候補音節の時系列は、25で示された候補列作成
部及び26で示された遷移行列記憶部を備えた27で示
された候補列出力部に入力され、前記候補列出力部27
において、前記遷移行列記憶部26の内容を参照して遷
移不可能な音節列を含む候補列は除外して、遷移可能な
候補列のみ、尤度の高い組合せ順に作成され、この候補
列と28で示された辞書記憶部の内容とが29で示され
た辞書照合部において照合され、一致すればその結果が
出力される。
発明が解決しようとする問題点 しかしながら、上記のような構成では、例えば特殊な人
名や地名、あるいは特殊な外来語や専門用語など、前記
遷移行列記憶部26において遷移不可とされているよう
な音節列を入力することは不可能であるという問題点を
有していた。
本発明はかかる点に鑑み、音節連接情報の参照の可/否
を決定する切換え手段を設けることにより、通常の文章
の入力に際しては、前記切換え手段のスイッチを閉じて
、前記音節連接情報の参照を可能ならしめ、一方前記音
節連接情報において非連接となることが予想されるよう
な音節列の入力に際しては、前記切換え手段のスイッチ
を開いて、前記音節連接情報の参照を禁じることにより
、前記音節連接情報に記されていないような音節列の入
力をも可能ならしめ、連接情報を利用することによる音
節列候補生成の効率を高く保ちつつ、自由な文章を作成
できる音声入力装置を提供することを目的とする。
問題点を解決するための手段 本発明は、音節候補の系列と付随する尤度を得るための
音声認識手段と、音節間の連接情報を記憶する連接情報
記憶手段と、前記連接情報の参照を可否ならしめる切換
え手段と、前記連接情報が参照できる場合には、前記連
接情報と音節候補とそれらに付随する尤度から、また前
記連接情報が参照できない場合には、音節候補とそれら
に付随する尤度のみから、音節列の候補を生成して尤度
の高いものから順に出力する音節列生成手段を備えた音
声入力装置である。
作  用 本発明は前記した構成により、通常の文章の入力に際し
ては、切換え手段のスイッチが閉じて、音節生成手段に
おける連接情報の参照を可能ならしめ、一方連接情報に
おいて非連接となることが予想されそうな音節列の入力
に際しては、切換え手段のスイッチを開いて、音節生成
手段における連接情報の参照を禁じることにより連接情
報において非連接となることが予想されそうな音節列の
入力も可能ならしめることにより、自由な文章を効率良
く入力する手段を実現する。
実施例 第1図は本発明の実施例における音声入力装置の構成図
である。同図において、11は音声入力部、12は音声
認識部、121は特徴抽出部、122は特徴バタンバッ
ファ、123は標準バタン記憶部、124はバタン比較
部、13は音節ラティス記憶部、14は連接情報記憶部
、16は切換え部、16は音節列生成部、17は出力端
子である。
以上のように構成された実施例の音声入力装置について
、以下その動作を説明する。
音声により入力された文章は11で示された音声入力部
で電気信号に変換された後、12で示された音声認識部
で音節候補に変換されて複数個の音節候補と付随する尤
度が出力される。ここで、番号3−1−5及び3−1−
6で示されているように、第1図の121で示される特
徴抽出部と、122で示される特徴バタンバッファと、
123で示される標準バタン記憶部と、124で示され
るバタン比較部とで構成される。前記音声入力部11の
出力は特徴抽出部121で特徴ベクトルの時系列に変換
され、得られた入力特徴ノくタンは特徴バタンバッファ
122に一時的に記憶される。
標準バタン記憶部123には、予め各音節毎の特徴バタ
ンか登録されている。バタン比較部124において、前
記特徴バタンバッファ122で一時的に記憶されている
入力特徴バタンと前記標準バタン記憶部123に記憶さ
れている各音節毎の標準特徴バタンか順次読み出されて
比較され、入力特徴バタンとの距離の近い標準特徴バタ
ンに対応した音節とその距離あるいは尤度(以下、尤度
と呼ぶ)が、尤度の高いものから順に、第1候補。
第2候補、・・・・・・、とじて候補音節と付随する尤
度を出力される。このようにして得られた音声認識部1
2の出力は13で示された音節ラティス記憶部に一時的
に記憶される。14で示された連接情報記憶部では、音
節間の連接に関する情報が記憶されている。ところで、
音節間の連接に関する情報とは、第3図に示すように、
例えば、日本語においては、「音節「あJから「<」へ
の連接は存在するが、音節「あ」から「きゃ」への連接
は存在しない」とか「音節「ず」から音節「ん」への連
接は存在するが、音節「づ」から音節「ん」への連接は
存在しない」などの音節間の連接情報を、連接が存在す
る場合は「1」、連接が存在しない場合は「o」で表わ
された行列として表現されている。この連接情報は、例
えば、カナ漢字変換用辞書(自立語辞書や付属語辞書な
どの単語辞書、ならびに付属語間接続行列などの文法辞
書)を用いて生成しうるすべての文章に関して連接情報
を求めることによって与えられる。16で示された切換
え部は、スイッチを開/閉することにより、16で示さ
れた音節列生成部が前記連接情報記憶部14の内容を参
照することの可/否を決定する。
すなわち、スイッチが閉じられている場合には、音節列
生成部16の前記連接情報記憶部14の内容参照を可能
ならしめ、スイッチが開いている場合には、音節列生成
部16の前記連接情報記憶部14の内容参照を禁止する
。音節列生成部16では、前記音節ラティス記憶部13
に記憶されている前記音節候補と付随する尤度を読み出
して、音節列候補を生成して、音節候補列を尤度の高い
順に、17で示される出力端子から出力される。ここで
、音節列候補の生成に際して、前記切換え部15のスイ
ッチが閉じられているときは前記連接情報記憶部14の
内容を参照するが、前記切換え部15のスイッチが開い
ているときは前記連接情報記憶部14の内容は参照しな
い。
さて、文節入力「うんどうが(運動が)」を例として、
前記音節列生成部16の動作を以下に詳細に述べる。い
ま、第4図に示されている内容が、前記音節列ラティス
記憶部13に記憶されている。
第4図において、尤度は千分率で表わされている。
先ず、前記音節ラティス記憶部13で記憶されている内
容のうち第1音節目の音節候補と付随する尤度が読み出
され、付随する尤度の順に音節列生成部16の内部バッ
ファに音節候補と付随する尤度が記憶される。すなわち
、第5図体)で示される内容が記憶される。次に、前記
音節ラティス記憶部13で記憶されている内容のうち第
2音節目の音節候補と付随する尤度が読み出され、前記
音節列生成部16の内部バッファに記憶されている内容
に関して、尤度の高いものから順に、前記第2音節目の
音節候補を第1候補から順次付加し、第2音節目の音節
候補に付随する尤度をそれぞれ加えて、得られた音節列
候補を再び付随する尤度の順に並び換えて前記内部バッ
ファに記憶される。
すなわち、第5図中)で示される内容が記憶される。
ただし、第6図(b)は、前記切換え部15のスイッチ
が開かれていて、前記連接情報記憶部14の内容の参照
が禁止されている場合の内容となっている。一方、前記
切換え部15のスイッチが閉じられていて、前記連接情
報記憶部14の内容の参照が可能な場合には、第6図(
c)に示したようK、連接の欄に「0」印が付されてい
る音節列のみが選択され、連接の欄に「×」印が付され
ている音節列は棄却されて、第6図(d)で示された内
容が前記内部バッファに記憶されることになる。以下、
同様に、前記内部バッファの内容と前記音節ラティス記
憶部13の内容を順次組合わせて、尤度の高い音節列候
補が順次、前記出力端子17から出力する。
用語など、前記連接情報で非連接となることが予想され
る音節列を含む文章、あるいは文節等を入力するに際し
、使用者が前記切換え部1了のスイッチを開けて、前記
連接情報記憶部14の内容の参照を禁じることにより、
前記特殊な人名や地名あるいは特殊な専門用語などの入
力を可能ならしめ、かつ、前記音節情報を利用して音節
列候補の生成効率を高める効果を保持できるのである。
なお、本実施例では、認識の単位や「音節」としたが、
それ以外に、認識の単位を「音素」や「音韻」など、一
般に音声認識で使用されている認識単位のどれを用いて
もよい。また、本実施例では、連接情報は2音節間の情
報のみを用いたが、3音節間の情報など、各音節間の情
報を用いることも可能であり、更には、各音節位置をも
考慮して、第1音節目と第2音節目の連接情報、第2音
節目と第3音節目の連接情報・・・・・・・・・を用い
ることも可能である。
発明の効果 以上述べたように、本発明によれば、音節候補と尤度か
ら音節列候補を生成するに際し、音節の連接情報を参照
することにより、音節列候補生成の効率を高く保ちつつ
、連接情報で非連接とされているような音節連接を含な
音節列の入力も可能にすることができ、その実用的価値
には犬なるものがある。
【図面の簡単な説明】
第1図は本発明における一実施例の構成図、第2図は従
来例の構成図、第3図は2音接間の連接行列の例の説明
図、第4図は音節候補ラティスの例の説明図、第5図は
音節列候補生成の動作の説明図である。 11・・・・・・音声入力部、12・・・・・・音声認
識部、121・・・・・・特徴抽出部、122・・・・
・・特徴バタンバッファ、123・・・・・・標準バタ
ン記憶部、124・・・・・・バタン比較部、13・・
・・・・音節ラティス記憶部、14・・・・・連接情報
記憶部、15・・・・・・切換え部、16・・・・・・
音節列生口部、17・・・・・・出力端子。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 ボを乳艮力 第3図 第5図 (久) 第5図 第5図 第5図 (C)

Claims (1)

    【特許請求の範囲】
  1. 音声により入力された文章から複数個の音節候補の系列
    とそれぞれの候補の確からしさを示す尤度を得るための
    音声認識手段と、音接間の連接に関する情報を記憶する
    ための連接情報記憶手段と、前記連接情報の参照を可/
    否ならしめる切換え手段と、前記切換動作に対応して、
    前記音節候補系列と付随する尤度のみから、または前記
    音節候補系列と付随する尤度ならびに前記連接情報から
    音節列の候補を生成して音節列の尤度の高いものから順
    に出力する音節列生成手段を備えたことを特徴とする音
    声入力装置。
JP60224550A 1985-10-08 1985-10-08 音声入力装置 Pending JPS6283796A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60224550A JPS6283796A (ja) 1985-10-08 1985-10-08 音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60224550A JPS6283796A (ja) 1985-10-08 1985-10-08 音声入力装置

Publications (1)

Publication Number Publication Date
JPS6283796A true JPS6283796A (ja) 1987-04-17

Family

ID=16815544

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60224550A Pending JPS6283796A (ja) 1985-10-08 1985-10-08 音声入力装置

Country Status (1)

Country Link
JP (1) JPS6283796A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7299889B2 (en) 2002-06-10 2007-11-27 Yamaha Hatsudoki Kabushiki Kaisha Seat supporting structure in motorcycle
JP2010132285A (ja) * 2010-02-12 2010-06-17 Yamaha Motor Co Ltd 車両用鞍乗り型シート

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7299889B2 (en) 2002-06-10 2007-11-27 Yamaha Hatsudoki Kabushiki Kaisha Seat supporting structure in motorcycle
JP2010132285A (ja) * 2010-02-12 2010-06-17 Yamaha Motor Co Ltd 車両用鞍乗り型シート

Similar Documents

Publication Publication Date Title
Lee Voice dictation of mandarin chinese
US6823309B1 (en) Speech synthesizing system and method for modifying prosody based on match to database
TW546631B (en) Disambiguation language model
WO2005034082A1 (en) Method for synthesizing speech
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
JP5198046B2 (ja) 音声処理装置及びそのプログラム
JPS6283796A (ja) 音声入力装置
JP3576066B2 (ja) 音声合成システム、および音声合成方法
JP3029403B2 (ja) 文章データ音声変換システム
JP2980382B2 (ja) 話者適応音声認識方法および装置
Lyu et al. A bi-lingual Mandarin/Taiwanese (Min-nan), Large Vocabulary, Continuous speech recognition system based on the Tong-yong phonetic alphabet (TYPA)
JPS62119591A (ja) 文章読上げ装置
JPH11250063A (ja) 検索装置及び検索方法
JPS6219899A (ja) 文章音声認識装置
JP2001272992A (ja) 音声処理システムおよびテキスト読上げシステムおよび音声認識システムおよび辞書獲得方法および辞書登録方法および端末装置および辞書サーバーおよび記録媒体
JPS61177575A (ja) 日本語文章作成装置
JP2001051992A (ja) 日本語統計データ作成装置および方法、並びにディクテーションシステム
JPS61177573A (ja) 日本語文章作成装置
JPH0552506B2 (ja)
JP3048793B2 (ja) 文字変換装置
JPS6211898A (ja) 音声認識装置
JPH0916575A (ja) 発音辞書装置
JPS6283797A (ja) 認識装置
JPH11231888A (ja) 音声モデル生成装置
JPH08314915A (ja) 情報の表現態様変換装置