JPS62166399A - 音声認識方法 - Google Patents
音声認識方法Info
- Publication number
- JPS62166399A JPS62166399A JP61009336A JP933686A JPS62166399A JP S62166399 A JPS62166399 A JP S62166399A JP 61009336 A JP61009336 A JP 61009336A JP 933686 A JP933686 A JP 933686A JP S62166399 A JPS62166399 A JP S62166399A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- input
- voice
- kanji
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 description 21
- 240000000220 Panda oleosa Species 0.000 description 20
- 235000016496 Panda oleosa Nutrition 0.000 description 20
- 150000001875 compounds Chemical class 0.000 description 5
- 238000012937 correction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000000276 sedentary effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
け〕 座業上の2ζり用分野
本発明は1文書作成のための音声認識方法に関するもの
である。
である。
(ロ)従来の技術
音声により任意の文章を入力し、文書fv、取を行っに
は%音素あるいに背面を単位として認識を行vh、音声
をかな文字列に変換する認識処理が必要である。このよ
うな音声認識処理として単音節MR装瀘がある。これに
よると日本語の68あるいに101櫨の離散発声された
単音節音声を認識し、かな文字出力を得ることができる
。
は%音素あるいに背面を単位として認識を行vh、音声
をかな文字列に変換する認識処理が必要である。このよ
うな音声認識処理として単音節MR装瀘がある。これに
よると日本語の68あるいに101櫨の離散発声された
単音節音声を認識し、かな文字出力を得ることができる
。
単f節認識処理により文章を入力する方法としてに、欠
のような方法がある。
のような方法がある。
■ 1音節入力し、七のかな文字の認識結果が正しく認
識されているかどうかを確認し、誤っていれば発声しな
3丁か%補助キーなどで修正すもこれを繰返し、1文節
の入力が正しく終了した時点でかな漢字変換を行う。
識されているかどうかを確認し、誤っていれば発声しな
3丁か%補助キーなどで修正すもこれを繰返し、1文節
の入力が正しく終了した時点でかな漢字変換を行う。
■ 1文節程度を続Cすて入力する。入力終了後。
誤っているかな文字に対し、CRT上のカーソルを移切
し、発声しなおすか、補助キーなどで15正する。修正
終了後、かな漢字変換を行う。
し、発声しなおすか、補助キーなどで15正する。修正
終了後、かな漢字変換を行う。
■ 1文節程度をd(すて入力する。1文字毎の修正に
行わず、辞薔等により文頭単位に1G正全行いながらか
な漢字変換を行つ。
行わず、辞薔等により文頭単位に1G正全行いながらか
な漢字変換を行つ。
しかしながら、これら等の従来処理にに下記の如き欠点
がある。
がある。
■の方法は、1音節発声する毎にCRT表示等を見て確
認をしなければならず、入力速度が遅いりえ1発声がし
にくく実用的でない。
認をしなければならず、入力速度が遅いりえ1発声がし
にくく実用的でない。
■の方法に、1〜数文節の入力が1度の発声でできる几
め1発声がしf丁い利点がある。しかし。
め1発声がしf丁い利点がある。しかし。
誤って認識したかな文字t−1文字ずつ修正するため、
操作性が悪い。ただし、全かな文字の修正が終ってから
かな漢字変換を行うため、複文節の変換を可能であると
いう長所もある。
操作性が悪い。ただし、全かな文字の修正が終ってから
かな漢字変換を行うため、複文節の変換を可能であると
いう長所もある。
■の方法に、1文節程度の入力を行い、認RWi来であ
る各かな文字に対する次候補等を参照しながら、辞書と
の照合を行りて、誤認taM果を修正し、かつ、かな漢
字変換を行う必換がある。上記■に比らペカーソル移1
1FI等の回数が減る几め、操作HL−?すいが、誤認
識が多いと1回の修正・変換でa正しいかな漢字となら
ないりえ、複文節を変換しよプとすると誤認識文字の影
響で文節区切り1で誤ってしまうことがある。
る各かな文字に対する次候補等を参照しながら、辞書と
の照合を行りて、誤認taM果を修正し、かつ、かな漢
字変換を行う必換がある。上記■に比らペカーソル移1
1FI等の回数が減る几め、操作HL−?すいが、誤認
識が多いと1回の修正・変換でa正しいかな漢字となら
ないりえ、複文節を変換しよプとすると誤認識文字の影
響で文節区切り1で誤ってしまうことがある。
(ハ)発明が解決しようとしている問題点本発明は、音
声の発声がしやすく、かつ、音声の入力後のかな漢字変
換処理を容易に行える音声認繊万汰を提供することを目
的とする。
声の発声がしやすく、かつ、音声の入力後のかな漢字変
換処理を容易に行える音声認繊万汰を提供することを目
的とする。
四 問題点を解決するための手段
本発明の音P認識方法μ1文節等のかな漢字変換を行う
ときの区切りを指示するための入力手段(例えばキー)
t−備え%音Pを入力しながら区切りとすべさところで
この手段により区切り指示しておき、全音声入力終了後
に順に区切られたかl又字列をかな漢字変換していく。
ときの区切りを指示するための入力手段(例えばキー)
t−備え%音Pを入力しながら区切りとすべさところで
この手段により区切り指示しておき、全音声入力終了後
に順に区切られたかl又字列をかな漢字変換していく。
(ホ)作 用
一般Vc晋戸認R処理による文章人力においてに、その
認識結果であるかな文字列の中にはほとんどの場合誤っ
た文字が入力される。これば、音声認識そのものの認識
率が100%ではなく、その出力結果に框数%〜10数
%の誤りが含−すれているからである。そのため、入力
さn7’3かな文字列をかな漢字変換しようとした場合
、先の従来例で示した工うな方法によりかな又字列を1
−正し、変換しなければならない。
認識結果であるかな文字列の中にはほとんどの場合誤っ
た文字が入力される。これば、音声認識そのものの認識
率が100%ではなく、その出力結果に框数%〜10数
%の誤りが含−すれているからである。そのため、入力
さn7’3かな文字列をかな漢字変換しようとした場合
、先の従来例で示した工うな方法によりかな又字列を1
−正し、変換しなければならない。
ここで従来例■で示した方法により、複文節からなる文
筆を音声で入力し、複文節のかな漢字変換を行りた場合
の例を次に示す。
筆を音声で入力し、複文節のかな漢字変換を行りた場合
の例を次に示す。
(入力する文〕 公園に行り几
(音 声) こうえんにいりた
(認識結果) こりえんみいった
(変 換 後〕 公園児入り九
このように1にI→1み“の誤認識により1文節の区切
りを1ちがえ、入力しようとする文とちがりた変換が行
われる。音声入力では、このよりに認hi2!結果が正
しいかな文字列とに限らないので。
りを1ちがえ、入力しようとする文とちがりた変換が行
われる。音声入力では、このよりに認hi2!結果が正
しいかな文字列とに限らないので。
区切りの誤りが生じやすくなる。
本発明でに、音声入力時に変換の区切りとなるべき御所
に対し、キーなどにエリ指示しておき、全人力後に各区
切り単位に変換を行う。
に対し、キーなどにエリ指示しておき、全人力後に各区
切り単位に変換を行う。
(音 声) こうぇんに いりた
(区切り指示) スM回
(認識結果] こりたλmいつ友
(修正変換後) 公園に行った
1こりえんみ“→1公園に“への修正及びがな涙字変侯
a、音節間の頬似注の清報を参照しながら行われる。す
なわち、′こつぇんみ“という単語が辞書中に存在しな
いので、こnをS成する5晋節の各々の類似K及び誌1
11久疾稲音順等を参照し。
a、音節間の頬似注の清報を参照しながら行われる。す
なわち、′こつぇんみ“という単語が辞書中に存在しな
いので、こnをS成する5晋節の各々の類似K及び誌1
11久疾稲音順等を参照し。
かl又字列の16正とかl伏字変換が行われる。認RW
i来のべ洟備の例七示す。
i来のべ洟備の例七示す。
文節の総合類似度が1こうえんみ“圓、′こつぇんに“
143.’とうえんみ“(Q、・・・のよつに得られ、
総合類似度の高いかな文字列エリ、選択され、かな漢字
変換される。
143.’とうえんみ“(Q、・・・のよつに得られ、
総合類似度の高いかな文字列エリ、選択され、かな漢字
変換される。
(へ)実 施 例
第1図に、本発明の音声認識方法の一実施例で、区切り
の人力手段として、−v−−’6用いたものである。マ
イク(1)に入力された音声に、分析部(2)でスペク
トル分析等の特徴抽出が行れ、一定時間間隔のパラメー
タ列となってパラメータバッファ(31K格納される。
の人力手段として、−v−−’6用いたものである。マ
イク(1)に入力された音声に、分析部(2)でスペク
トル分析等の特徴抽出が行れ、一定時間間隔のパラメー
タ列となってパラメータバッファ(31K格納される。
音声入力時と同時に 区9Jリキ−(6)の情報も取込
1れており、パラメータの収込みと同期してこのキー(
6)の状態が区切リキーバ(ワ) ソファ格納されている。パラメータバッファ(3)の内
容rc%識別部(4)にて順次、晋WJ標準パターンメ
モリ(5Jの音節標準パターンと比較され、かな文字列
になる。識別部(4〕の出力は1区切り キーバッファ
(7)の出力と切替器(8)で切替えられながら。
1れており、パラメータの収込みと同期してこのキー(
6)の状態が区切リキーバ(ワ) ソファ格納されている。パラメータバッファ(3)の内
容rc%識別部(4)にて順次、晋WJ標準パターンメ
モリ(5Jの音節標準パターンと比較され、かな文字列
になる。識別部(4〕の出力は1区切り キーバッファ
(7)の出力と切替器(8)で切替えられながら。
かな文字バッファ(9)VC格納される。かな文字バッ
ファ(9)に第2図のようなメモリ構成Vcなりており
。
ファ(9)に第2図のようなメモリ構成Vcなりており
。
各音りに対する認識結呆と類似度を1位から順に格納し
、また1区切り キー(6)が押された時点にに′″K
“が格納されている。か1文字月評価部(1(11は、
かな文字バッファ内の1K“で区切られ友かな文字列を
2位以下の候補かなと類似度t−参照しながら%類似度
合計の高い順にかな漢字変換部へ出力する。かな漢字変
換部は一般的なワードプロセッサの機能であり、詳述に
しないが内蔵の辞書によりかな文字列をかな漢字列に変
換するものである。
、また1区切り キー(6)が押された時点にに′″K
“が格納されている。か1文字月評価部(1(11は、
かな文字バッファ内の1K“で区切られ友かな文字列を
2位以下の候補かなと類似度t−参照しながら%類似度
合計の高い順にかな漢字変換部へ出力する。かな漢字変
換部は一般的なワードプロセッサの機能であり、詳述に
しないが内蔵の辞書によりかな文字列をかな漢字列に変
換するものである。
第3図に本発明方法の他の実施例を示す。同図の場合、
第1図の区切りキー(6)の代わりに無音検出部(L″
lJを備え、入力音声中に一定時間以上の無音区間が検
出されれば1区切り無音バッファ(7)に区切り情報が
格納される。そしてこの方法に於いてもパラメータバッ
ファ(3)への格納と同期し以降の処理に第1図の例と
同様である。
第1図の区切りキー(6)の代わりに無音検出部(L″
lJを備え、入力音声中に一定時間以上の無音区間が検
出されれば1区切り無音バッファ(7)に区切り情報が
格納される。そしてこの方法に於いてもパラメータバッ
ファ(3)への格納と同期し以降の処理に第1図の例と
同様である。
以上のよ5ic、本発明方法でに、音声入力しながら過
当な区切りをキーを押すか、またa、無音区間を設ける
ことにより設足し、後のかな漢字変換を効率よく行わせ
ている。
当な区切りをキーを押すか、またa、無音区間を設ける
ことにより設足し、後のかな漢字変換を効率よく行わせ
ている。
(ト)効 果
音声認識により文章を入力する場合、各音節ごとの認識
率は100鴫であるとぼ百い難く、誤りを含んだかな文
字列が得られるとして後の処理を行わなければならない
。ところで、音声で入力され友かな文字列をかな漢字変
換する場合、それが複合時や複文節である場合は特に誤
1り几か1文字のために単語や文節の区切り方が多数存
在してし1い効率のよい変換が行えない。
率は100鴫であるとぼ百い難く、誤りを含んだかな文
字列が得られるとして後の処理を行わなければならない
。ところで、音声で入力され友かな文字列をかな漢字変
換する場合、それが複合時や複文節である場合は特に誤
1り几か1文字のために単語や文節の区切り方が多数存
在してし1い効率のよい変換が行えない。
本発明の音声認識方法によれば、このような場合に待に
効果があり1区切り箇所を指定しながら入力されるので
入力終了後のかな漢字変換に、文節単位程反の機能で十
分高速に複文節の変換が行える。
効果があり1区切り箇所を指定しながら入力されるので
入力終了後のかな漢字変換に、文節単位程反の機能で十
分高速に複文節の変換が行える。
lた、全入力が終了後、変換を行うので、同音意義語が
存在するよつな変換も、谷又願間の情報を参照し、蚊も
適切なる変換を行わせることも可能となり、エリ高い截
能全も実現できる。
存在するよつな変換も、谷又願間の情報を参照し、蚊も
適切なる変換を行わせることも可能となり、エリ高い截
能全も実現できる。
第1図a本発明の音声認識方法を実現する一実施例の構
成を示すブロック図、第2図はメモリ構成図、第3図に
本発明方法の他の実施例構成の要部を示すブロック図。 (1)・・・マイク、(2)・・・分析部、(3)・・
・パラメータバッファ、(4)・・・識別部、(5)・
・・音節標準パターンメモリ。 (6)・・・区切りキー、(7)・・・区切りΦ−バッ
ファ、(8)・・・切替器、(9)・・・かな文字バッ
ファ、 UO+・・・かな文字列評価部、ttU・・・
かな漢字変換部、1.121・・・無音検出部。
成を示すブロック図、第2図はメモリ構成図、第3図に
本発明方法の他の実施例構成の要部を示すブロック図。 (1)・・・マイク、(2)・・・分析部、(3)・・
・パラメータバッファ、(4)・・・識別部、(5)・
・・音節標準パターンメモリ。 (6)・・・区切りキー、(7)・・・区切りΦ−バッ
ファ、(8)・・・切替器、(9)・・・かな文字バッ
ファ、 UO+・・・かな文字列評価部、ttU・・・
かな漢字変換部、1.121・・・無音検出部。
Claims (1)
- 1)音声入力手段に加えて音声の文節等の文章中の区切
りを指示するための操作入力手段を備え、音声入力手段
への音声入力を行ないつつ操作入力手段の操作により入
力音声の区切り信号の入力を行ない、この区切り信号に
よって区切られた音声の区間毎に音声認識処理を行なう
事を特徴とした音声認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61009336A JPS62166399A (ja) | 1986-01-20 | 1986-01-20 | 音声認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61009336A JPS62166399A (ja) | 1986-01-20 | 1986-01-20 | 音声認識方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS62166399A true JPS62166399A (ja) | 1987-07-22 |
Family
ID=11717627
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61009336A Pending JPS62166399A (ja) | 1986-01-20 | 1986-01-20 | 音声認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS62166399A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2025505455A (ja) * | 2022-02-02 | 2025-02-26 | グーグル エルエルシー | ユーザ入力に基づく単語または音素の時間マーカを使用する音声認識 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60209798A (ja) * | 1984-04-03 | 1985-10-22 | 株式会社リコー | 音声認識方式 |
-
1986
- 1986-01-20 JP JP61009336A patent/JPS62166399A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60209798A (ja) * | 1984-04-03 | 1985-10-22 | 株式会社リコー | 音声認識方式 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2025505455A (ja) * | 2022-02-02 | 2025-02-26 | グーグル エルエルシー | ユーザ入力に基づく単語または音素の時間マーカを使用する音声認識 |
| US12494197B2 (en) | 2022-02-02 | 2025-12-09 | Google Llc | Speech recognition using word or phoneme time markers based on user input |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5220639A (en) | Mandarin speech input method for Chinese computers and a mandarin speech recognition machine | |
| TW546631B (en) | Disambiguation language model | |
| US5787230A (en) | System and method of intelligent Mandarin speech input for Chinese computers | |
| US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
| US4769844A (en) | Voice recognition system having a check scheme for registration of reference data | |
| JP2008209717A (ja) | 入力された音声を処理する装置、方法およびプログラム | |
| US5995934A (en) | Method for recognizing alpha-numeric strings in a Chinese speech recognition system | |
| CN101447187A (zh) | 语音识别装置及方法 | |
| JP4089861B2 (ja) | 音声認識文章入力装置 | |
| JPS6316766B2 (ja) | ||
| JPS62166399A (ja) | 音声認識方法 | |
| JPH09179578A (ja) | 単音節認識装置 | |
| JP2813209B2 (ja) | 大語彙音声認識装置 | |
| JP2002189490A (ja) | ピンイン音声入力の方法 | |
| KR100564742B1 (ko) | 문자의 음성변환장치 및 방법 | |
| JPS62119591A (ja) | 文章読上げ装置 | |
| JP3033132B2 (ja) | 言語処理装置 | |
| JPS58186836A (ja) | 音声入力デ−タ処理装置 | |
| JP2528105B2 (ja) | 音声認識装置 | |
| JPS60158496A (ja) | 音声認識装置 | |
| JPH0415960B2 (ja) | ||
| JPS63161498A (ja) | 音声情報入力装置 | |
| JPS63316899A (ja) | 音声認識システム | |
| JPS60150098A (ja) | 音声認識装置 | |
| JPH01106098A (ja) | 音声認識システム |