JPH03221999A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH03221999A
JPH03221999A JP2018139A JP1813990A JPH03221999A JP H03221999 A JPH03221999 A JP H03221999A JP 2018139 A JP2018139 A JP 2018139A JP 1813990 A JP1813990 A JP 1813990A JP H03221999 A JPH03221999 A JP H03221999A
Authority
JP
Japan
Prior art keywords
candidate
displayed
menu
syllable
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018139A
Other languages
English (en)
Inventor
Akira Tsuruta
彰 鶴田
Shigeyoshi Ono
小野 茂良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2018139A priority Critical patent/JPH03221999A/ja
Publication of JPH03221999A publication Critical patent/JPH03221999A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、入力された音声に対(7て文法的に正I7
いと思われる語句の候補列を作成し、この候補列の中か
ら正12い候補を選択して出力する音声認識装置に関す
る。
〈従来の技術〉 音声によって文章等の入力を行う装置(例えば、ワード
プロセッサおよびパソコン等)における音声入力に際し
ては、キーボード入力等とは異なって入力データに入力
音声の誤認識等による“確からしさ″が含まれる。そこ
で、文法的に正しいと思われる複数の候補から成る候補
列を認識結果より作威し、確からしい”候補から順に画
面等に表示してその中から正しい入力データを選択する
必要がある。
従来、このような音声認識装置として次のようなものが
ある。ずなわら、文節単位で入力された音声を音節単位
で認識して音節ラティスを作威し、この音節ラティスに
従って音節候補を順次糺み合わせて文節候補を生成する
。次に、上述のようにして生成された文節候補と言語処
理用辞書の内容との照合を順次行う。その結果、i語処
理用辞書にない文節候補を棄却1.て、文法的に正しい
ど思われる文節候補のみを選択する。以下、このような
文節候補作酸処理を言語処理と言う。この選択された文
節候補は、音節認識時におt′Jる音節の特徴パターン
と音節標準パターンとの距離の文節候補毎の合計値(以
下、このような“確からしざ″を表す数値をスコアと言
う)の順にメモリに記憶される。そして、メモリに記憶
されノこ複数の文節候補の中から、所定数の文節候補を
ウィンドウ表示技術によってメニュー表示ずろようにし
ている。
こうして、メニュー表示された複数の文節候補の中から
正しい文節候補を選択する際には、オペレータがキーボ
ードを操作して所望の文節候補を指定して選出するよう
にしている。
〈発明が解決しようとする課題〉 」二連のように、上記従来の音声認識装置では、言語処
理によって選択された文節候補列の中から正しい文節候
補を選択する場合には、文節候補列をスコアの順にメニ
ュー表示し、オペレータがキーボードを操作してこのメ
ニュー表示された複数の文節候補の中から所望の文節候
補を捜し出して指定し、選出するようにしている。した
がって、文節候補列の中から正しい文節候補を選択する
際の操作が非常に煩わしいという問題がある。
そこで、この発明の目的は、非常に簡単な操作によって
、メニュー表示された入力音声の候補列の中から正しい
候補を選出できる音声認識装置を提供することにある。
〈課題を解決するための手段〉 」1記目的を達成するため、この発明は、音声分析部か
らの入力音声の特徴パラメータに基づいて上記入力音声
を認識部によって音韻または音節単(立で認識し、この
認識結果に基づく入力音声の複数の候補から成る候補列
の中から正しい候補を選択して出力する音声認識装置に
おいて、上記認識部からの認識結果を用いて言語処理を
行って単語単位または文節単位に確からしさ”を表すス
コアを付加した候補列を生成する言語処理部と、上記言
語処理部によって上記スコアが付加されて生成された候
補列を]1記スコアに基づく所定の順序に配列してメニ
ュー表示する表示部と、所定の時間が経過する毎に、上
記表示部によってメニュー表示された候補列の中から一
つの候hl)を所定の現IIIに従って自動的に選出す
る候補選出部を備えたことを特徴としている。
また、上記音声認識装置において、上記候補選出部は、
上記表示部にメニュー表示された候補列の中から選出さ
れる一つの候補を指定するノこめのカーソルの位置を所
定の時間が経過する毎に上記候補列の配列順序に従って
自動的に移動するように成したことを特徴としている。
さらに、この音声認識装置にお(′)る上記カーソルの
位置は、上記表示部にメニュー表示された候補クリの範
囲内で循環して移動するように成したことを特徴と(7
ている。
また、上記音声認識装置に、15いて、上記候補選出部
は、−上記表示部に候補列をメニュー表示した際に所定
表示位置に表示されたーっの候補を選出すると共に、−
に記表示部にメニュー表示された候補列を所定の時間が
経過する毎に」1記候補列の配列順序に従って自動的に
スクロールするように成したことを特徴としている。
さらに、この音声認識装置における上記候補列のスクロ
ールは、上記表示部にメニュー表示された候補列の範囲
内で循環して実行するように戊し)こことを特徴として
いる。
〈作用〉 音声が入力されると音声分析部によって入力音声の特徴
パラメータが生成される。そして、この生成された特徴
パラメータに基づいて、認識部によって入力音声が音韻
または音節単位で認識される。そうすると、上記認識部
からの認識結果を用いて言語処理部によって言語処理が
行われて、単語単位または文節単位に“確からしさ′を
表すスコアが句加された入力音声の複数の候補から成る
候補列が生成される。そして、この生成された條袖に付
加されたスコアに基づく所定の順序に配列された候補列
がメニュ一方式で表示部によって表示される。その後、
所定の時間が経過する毎に、」1記表示部によってメニ
ュー表示された候補列の中から一つの候補が所定の規則
に従って自動的に候補選出部によって選出される。
すなわち、上記言語処理部によって生成された候補列の
中から正(、い候補を選択する際に、上記表示部にメニ
ュー表示された候補列の中から一つの候補が候補選出部
によって順次自動的に選出されるのである。したがって
、上記候補選出部によって自動的に選出された候補が所
望する候補である場合にこの候補を正しい候補であると
確定すれば、上記言語処理部によって生成された候補列
の中から正しい候補を容易に選択できる。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明の音声認識装置のブロック図である。
音声分析部2はマイクロホンIより入力された音声の音
響分析を行って特徴パラメータを出力する。音節区間検
出部3は音声分析部2からの特徴パラメータに基づいて
音節区間の検出を行う。音節認識部4は音節区間検出部
3によって検出された音節区間で切り出された音節の特
徴パターンと音節標準パターンとの類似度を用いて音節
の認識を行って音節ラティスを生成する。言語処理部5
は音節認識部4からの音節認識結果(すなわち、音節ラ
ティス)を用いて文法的に正しい複数の文節候補から成
る文節候補列を作成する。制御部6は音声分析部2.音
節区間検出部3.音節認識部4および言語処理部5を制
御して上記文節候補列を得、この得られた文節候補列を
表示部7によってメニュー表示する。こうしてメニュー
表示された文節候補列の中から一つの文節候補が制御部
6の制御の下に候補選出部8によって選出され、その選
出された結果が表示部7に表示される。
以下、」1記構成の音声認識装置の動作を、語句「音素
」を表す音声/おんそ/が入力された場合を例に具体的
に説明する。
オペレータがマイクロホンlに向かって/おんそ/と発
声し始めるど、音声分析部2によって入力音声/おんそ
/の音響分析が行われて特徴パラメータが順次出力され
る。そうすると、音節区間検出部3によって音声分析部
2からの特徴パラメータに基づいて音節区間の検出が行
われ′て音節の切り出しが行われる。そして、音節区間
検出部3によって切り出された音節の特徴パターンと音
節標準パターンとの類似度を用いて音節の認識が音節認
識部4によって行われ、第2図に示すような認識結果が
得られる。ここで、第2図においては入力音声/おんそ
/に対する認識結果のみが記載されているが、音節認識
部4からは入力音声の認識結果が連続して順次出力され
るのである。その際に、音声の認識には音節区間の誤検
出や音節の誤認識等によって曖昧さが含まれるので、認
識結果は音節候補列(音節ラティス)として出力されて
記憶部(図示せず)に格納されるのである。
一方、音声/おんそ/の入ツノが終了しノこ段階で、例
えばキーボード等から言語処理部5による言語処理の実
行が指示されたとする。
そうすると、言語処理部5において、まず音節認識部4
によって生成された第2図に示す音節ラティスを参照し
て、音節ラティスの中から類似度が最大の音節候補/お
/、/ん/、/シゃ/のみから戊るスコアが1位の文節
候補/おんしゃ/を作成して出力する。以−ト、文節候
補/おんしゃ/を構成する音節候補を、所定の規則に従
って音節ラティスから読み出した音節候補と順次入れ換
えて文節候補を作威し、類似度の合計の大きい(すなわ
ち、スコアの順位の高い)文節候補の順に出力するので
ある。その結果、第3図に示すような文節候補列が生成
される。次に、言語処理部5は一ヒ述のように1、て生
成された文節候補列と辞書の内容との照合を行って、辞
書部(こはない文法的に正しくない文節候補を棄却する
そうすると、制御部6の制御に従って、表示部7は公知
技術である例えばウィンドウ表示技術によって、第4図
に示ケように、飄語処理部5によって生成された複数の
文節候補から成る文節候補列を、スコア順位の高い順に
所定数(本実施例の場合には4文節候補)づつ表示画面
のメニュー表示領域1】にメニュー表示する。その際に
、メニュー表示領域11の上部の表示領域12には、既
に認識された文節「一つの」と、現在認識処理が実行さ
れている入力文節/おんそ/に対する文節候補列のうち
カーソルによって指定された文節候補「おんしゃjとか
ら成る文章「一つの」5んしゃ−jが同時に表示されて
いる。まノこ、正しい文節候補「おんそ」はメニュー表
示領域11の上から3段目に表示されている。
ここで、◇印は、候補選出部8によって自動的に上下に
移動され、メニュー表示領域11にメニコー表示されて
いる文節候補列の中から選出して表示領域12に表示す
る文節候補を指定するための上記カーソルを示す。また
、回申は、表示領域12における次に表示される文節候
補の表示位置を指定するカーソルである。
第4図の状態で所定時間が経過すると、制御部6の制御
に基づく候補選出部8の制御に従って、第5図に示すよ
うにカーソル◇の位置が1段下に移動する。そうすると
、移動後におけるカーソル◇の位置によって指定された
文節候補「はん(、や」が選出されて表示領域12の表
示内容が「一つの(まんl、や]に変化して、文節候補
「はんしゃjが選出されたことを確認できる。第5図の
状態でさらに所定時間が経過すると、カーソル◇の位置
がさらに1段下に移動して文節候補「おんそ」が選出さ
れる。以下同様にして文節候補列中の−・つの文節候補
が順次自動的に選出されるのである。すなわち、文節候
補「おんそ」を選出したい場合には、所定時間が経過し
て上記カーソル◇の位置が第4図の状態から自動的に2
段下に移動して、表示領域12の表示内容が「一つのお
んそ」に変化するのを待てばよいのである。
こうして文節候補「おんそ」が選出された状態において
、例えば仮名漢字変換キーを操作すると、メニュー表示
領域11にメニコー表示された文節候補列の中から文節
候補「おんそ」が選択されて入力音声/おんそ/に対す
る認識文節であるど確定される。そして、認識文節「お
んそ」が仮名漢字変換されて表示領域12に「一つの音
素」と表示されるのである。
このように、本実施例においては、言語処理部5によっ
て、音節認識部4からの音節認識結果(すなわち、音節
ラティス)を用いてスコアの順位に配列された文節候補
列を生成する。そして、この生成された文節候補列を表
示部7によってメニュー表示領域11にメニュー表示す
る。さらに、所定時間が経過する毎に、このメニコー表
示された文節候補列におけるスコア順位に従って候補選
出部8によってカーソル◇を移動し、カーソル◇の移動
に伴って文節候補を切り替え選出する。そして、この選
出した文節候補を表示領域12に表示するようにしてい
る。
したがって、オペレータは、正1.い文節候補の選択に
際(2て、所望の文節候補列が自動的に選出されて表示
領域12に表示されるまで表示領域12を監視している
だけで良いのである。すなわち、オペレータは、メニュ
ー表示された文節候補列の中から所望の文節候補を捜し
出し、キーボードを操作してその所望の文節候補列を指
定する必要がなく、非常に簡単な操作によって正しい文
節候補を選択できるのである。
第6図は上記実施例とは異なる実施例におけるメニュー
表示領域IIにおけるメニュー表示例を示す。この実施
例の場合には、表示部7によってメニュー表示されノコ
文節候補列を、上記候補選出部8によって所定時間毎に
スクロールするようにしている。
すなわち、第4図の状態から所定時間が経過すると、ス
コア順位が第1位である文節候補列「おん(、や」がメ
ニュー表示領域11から消去され、スコア順位第2位の
文節候補「はんしゃ」がメニュー表示領域11の最上段
に表示され、以下残りの各文節候補の表示位置が順に一
段づつ繰り上がる。
そして、空欄となるべき4段目にスコア順位5位の文節
候補「おみそ」が新たに表示されるのである。
その際に、カーソル◇の位置はメニュー表示された文節
候補列の最上段に位置したままである。
したがって、メニュー表示領域11に表示された文節候
補列中の最」二段の文節候補、すなわち、メニュー表示
領域11に表示された文節候補列中においてスコア順位
が最上位の文節候補が自動的に指定されて選出されるの
である。
また、l1記候補選出部8によってカーソル◇の移動を
行う場合あるいは文節候補列のスクロールを行う場合に
、第5図におけるカーソル◇の移動範囲あるいは第6図
にお(′)る文節候補列のスクロール範囲を、メニュー
表示された文節候補列内に限定することも可能である。
第7図は上述のスクロール範囲を限定1.た場合のメニ
ュー表示領域11の表示例である。この実施例における
文節候補列のスクロールは次のようにして行われる。す
なわち、第7図(a)におけるスコア順位第1位の文節
候補「おんしゃ」がメニュー表示領域11から消去され
て残りの文節候補の表示位置が第7図(b)に示すよう
に1段づつ」二段に移動した後、空欄となるへき4段目
には、」二連のようにメニュー表示領域11から消去さ
れた文節候補「おん(7や」が再度表示されるのである
。こうすることによって、所望する文節候補が自動的に
選出されて表示領域12に表示されたことをオペレータ
の不注意によって見逃してしまった場合でも、所望する
文節候補が再度自動的に選出されて表示されるので、正
しい文節候補を確実に選択できるのである。
その際に、最初に表示されたスコア順位第1位から第4
位までの4つの文節候補中に所望する文節候補列が無い
場合には、例えば”次候補”キー等の抑圧によってスコ
ア順位第5位から第8位までの文節候補が表示されるよ
うにすることによって、スコア順位第5位以降の文節候
補列をも選出できる。
上述の場合と同様にして、第5図におけるカーソル◇を
メニュー表示領域11に表示された文節候補列内を循環
して移動するようにすることができる。
上記実施例においては、入ツノ音声を音節認識部4で音
節単位で認識(7、その認識結果に基づいて言語処理を
実行するようにしている。しかしながら、この発明はこ
れに限定されるものではなく、入力音声を音韻単位で認
識して言語処理を実行するようにしてもよい。
上記各実施例におけるメニュー表示領域11と表示領域
12との位置関係は、上述の例に限定されるものではな
いことは言うまでもない。
〈発明の効果〉 以上より明らかなように、この発明の音声認識装置は、
言語処理部2表示部および候補選出部を備えて、上記言
語処理部によって、単語単位または文節単位に確からし
さ”を表すスコアをイ」加した入力音声の複数の候補か
ら成る候補列を生t+、、この生成された候補列を上記
表示部によって上記スコアに基づく所定の順序に配列(
、てメニュー表示し、所定時間が経過する毎に、このメ
ニュー表示された候補列の中から一つの候補を所定の規
間に従って上記候補選出部によって自動的に選出するよ
うにしたので、上記表示部にメニュー表示された候補列
の中から正しい候補を選出する際に、オペレータの手を
煩わせることなく、非常に簡単な操作によって選出する
ことができる。
【図面の簡単な説明】
第1図はこの発明の音声認識装置における一実施例のブ
ロック図、第2図は第1図におl)]る音節認識部によ
って生成される音節ラティスの一例を示す図、第3図は
第1図における言語処理部によって生成される文節候補
列の一例を示す図、第4図は第1図における表示部によ
ってメニュー表示される入力音声/おんそ/に対する文
節候補列の一例を示ず図、第5図は第4図のメニュー表
示例においてカーソルを移動する場合の移動例を示す図
、第6図は第4図のメニュー表示例において文節候補列
をスクロールする場合のスクロール例を示す図、第7図
は第6図とは異なるスクロール例を示す図である。 トマイクロホン、   2・・音声分析部、3・音節区
間検出部、 4 ・音節認識部、5 ・言語処理部、 
  6・・・制御部、7・・・表示部、      8
・・候補選出部、1トメニコ一表示領域 12・・・表
示領域。

Claims (5)

    【特許請求の範囲】
  1. (1)音声分析部からの入力音声の特徴パラメータに基
    づいて上記入力音声を認識部によって音韻または音節単
    位で認識し、この認識結果に基づく入力音声の複数の候
    補から成る候補列の中から正しい候補を選択して出力す
    る音声認識装置において、 上記認識部からの認識結果を用いて言語処理を行って単
    語単位または文節単位に“確からしさ”を表すスコアを
    付加した候補列を生成する言語処理部と、 上記言語処理部によって上記スコアが付加されて生成さ
    れた候補列を上記スコアに基づく所定の順序に配列して
    メニュー表示する表示部と、所定の時間が経過する毎に
    、上記表示部によってメニュー表示された候補列の中か
    ら一つの候補を所定の規則に従って自動的に選出する候
    補選出部を備えたことを特徴とする音声認識装置。
  2. (2)請求項1に記載の音声認識装置において、上記候
    補選出部は、上記表示部にメニュー表示された候補列の
    中から選出される一つの候補を指定するためのカーソル
    の位置を所定の時間が経過する毎に上記候補列の配列順
    序に従って自動的に移動するように成したことを特徴と
    する音声認識装置。
  3. (3)請求項2に記載の音声認識装置において、上記カ
    ーソルの位置は、上記表示部にメニュー表示された候補
    列の範囲内で循環して移動するように成したことを特徴
    とする音声認識装置。
  4. (4)請求項1に記載の音声認識装置において、上記候
    補選出部は、上記表示部に候補列をメニュー表示した際
    に所定表示位置に表示された一つの候補を選出すると共
    に、上記表示部にメニュー表示された候補列を所定の時
    間が経過する毎に上記候補列の配列順序に従って自動的
    にスクロールするように成したことを特徴とする音声認
    識装置。
  5. (5)請求項4に記載の音声認識装置において、上記候
    補列のスクロールは、上記表示部にメニュー表示された
    候補列の範囲内で循環して実行するように成したことを
    特徴とする音声認識装置。
JP2018139A 1990-01-29 1990-01-29 音声認識装置 Pending JPH03221999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018139A JPH03221999A (ja) 1990-01-29 1990-01-29 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018139A JPH03221999A (ja) 1990-01-29 1990-01-29 音声認識装置

Publications (1)

Publication Number Publication Date
JPH03221999A true JPH03221999A (ja) 1991-09-30

Family

ID=11963271

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018139A Pending JPH03221999A (ja) 1990-01-29 1990-01-29 音声認識装置

Country Status (1)

Country Link
JP (1) JPH03221999A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001099096A1 (fr) * 2000-06-20 2001-12-27 Sharp Kabushiki Kaisha Systeme de communication a entree vocale, terminal d'utilisateur et systeme central
JP2011150740A (ja) * 2000-05-03 2011-08-04 Nokia Corp 少なくとも1つのアプリケーションデバイスを有する電気/電子システムを制御する方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011150740A (ja) * 2000-05-03 2011-08-04 Nokia Corp 少なくとも1つのアプリケーションデバイスを有する電気/電子システムを制御する方法
US9772739B2 (en) 2000-05-03 2017-09-26 Nokia Technologies Oy Method for controlling a system, especially an electrical and/or electronic system comprising at least one application device
WO2001099096A1 (fr) * 2000-06-20 2001-12-27 Sharp Kabushiki Kaisha Systeme de communication a entree vocale, terminal d'utilisateur et systeme central
US7225134B2 (en) 2000-06-20 2007-05-29 Sharp Kabushiki Kaisha Speech input communication system, user terminal and center system

Similar Documents

Publication Publication Date Title
JP4829901B2 (ja) マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置
JP3962763B2 (ja) 対話支援装置
US20010044724A1 (en) Proofreading with text to speech feedback
US20050131686A1 (en) Information processing apparatus and data input method
KR20060037228A (ko) 음성인식을 위한 방법, 시스템 및 프로그램
JP2004046807A (ja) 表意文字言語のマルチモーダル入力
JP2006146008A (ja) 音声認識装置及び方法ならびにプログラム
JP2002116796A (ja) 音声処理装置、音声処理方法及び記憶媒体
JPH09265299A (ja) テキスト読み上げ装置
JPH03221999A (ja) 音声認識装置
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JP2000056795A (ja) 音声認識装置
JP4702081B2 (ja) 文字入力装置
JPH04232997A (ja) 音声認識装置における認識結果表示方式
JPS6211731B2 (ja)
JPH0679234B2 (ja) 音声認識装置
JP2015227915A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP2000047683A (ja) セグメンテーション補助装置及び媒体
JP4797307B2 (ja) 音声認識装置及び音声認識方法
JP2647234B2 (ja) 音声認識装置
JP2010002830A (ja) 音声認識装置
JPH0630052B2 (ja) 音声認識表示装置
JP2000056796A (ja) 音声入力装置および方法
Abdeen et al. An architecture for multi-lingual hands-free desktop control system for PC windows
JPS6211732B2 (ja)