JPS6325366B2 - - Google Patents
Info
- Publication number
- JPS6325366B2 JPS6325366B2 JP58058513A JP5851383A JPS6325366B2 JP S6325366 B2 JPS6325366 B2 JP S6325366B2 JP 58058513 A JP58058513 A JP 58058513A JP 5851383 A JP5851383 A JP 5851383A JP S6325366 B2 JPS6325366 B2 JP S6325366B2
- Authority
- JP
- Japan
- Prior art keywords
- memory
- stored
- recognized
- candidate
- syllable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000011156 evaluation Methods 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 abstract description 8
- 230000015572 biosynthetic process Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 6
- 239000004816 latex Substances 0.000 description 4
- 229920000126 latex Polymers 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
<技術分野>
本発明は文節単位に発声された音声を音節単位
に認識し、この認識された音節候補の組合せによ
り複数の文節候補列を作成し、辞書照合を含む文
法処理を行なつて文節単位の認識結果を出力する
日本語音声入力装置の改良に関するものであり、
更に詳細には認識結果の複数の候補を音声認識結
果の確からしさ及び該確からしさ以外の条件にも
とずいて総合評価して認識結果の出力順序を変更
するようにした日本語音声入力装置に関するもの
である。 <従来技術> 従来の日本語音声入力装置において、例えば入
力音声を音節単位に認識し、この認識された文節
候補の組合せにより複数の文節候補列を作成し、
辞書照合を含む文法処理を行なつて文節単位の認
識結果を出力している。そしてこの時文節の長さ
と各音節毎の候補数を組合せた数の文節候補列が
作成され、また辞書照合の結合も複数の認識結果
が出力される。 この場合、音声認識結果の確からしさの順序で
複数の認識結果を順次出力している。 しかし、従来のこのような方法において、単音
節の認識結果がほとんど誤まりの無い場合、ある
いは対象とする語彙が少ない場合には特に問題は
生じないが、現在の音声認識の技術レベルでは充
分に区切つた音節でも識別しにくい音節があり、
また連続的に発声した音声では調音結合等の影響
により識別率が更に低下する。 また辞書に収納された語彙が多くなれば思つて
もみない語が最初に認識結果として出力されるこ
とがある。 本発明者等はこのような音響分析での音節認識
率(音節の正解率)が悪い場合に有効となる認識
結果の出力順序の決定方法を先に特願昭57−
232213号(特開昭59−116837号公報)「音声入力
式日本語文書処理装置」として提案した。 この方法は、音声認識結果の確からしさ以外の
自立語の長さ、頻度等の条件を考慮に入れて認識
結果の出力順序を決定するようにしたものであ
る。 しかし、本発明者等が先に提案した方法によれ
ば、音響分析技術の向上に従つて、音節認識率が
良くなつて来ると、認識結果の出力順序の決定に
際して、逆に悪い方向に働き、最終の文節認識結
果の正解率を平均的に落してしまうという問題点
が見出されるに至つた。 <目的> 本発明は上記の点に鑑みて成されたものであ
り、認識結果の複数の候補を音声認識結果の確か
らしさを示す確度情報と、音声認識結果の確から
しさ以外の自立語の長さ、頻度を含む条件にもと
ずく文法評価値情報とから得られる総合評価値情
報によつて評価して認識結果の出力順序を決定す
るようにした日本語音声入力装置を提供すること
を目的としている。 <実施例> 以下、本発明を一実施例を挙げて詳細に説明す
る。 第1図は本発明の音声入力式日本語文書処理装
置の一実施例の構成を示すブロツク図である。 第1図において、1は音声入力をピツクアツプ
するマイクロホンであり、このマイクロホン1に
より検出された音声は単音節認識部2に入力され
る。この単音節認識部2は従来公知のものであ
り、マイクロホン1を介して入力された文節単位
の音声が音節単位に区分されて単音節毎の特徴描
出が行なわれる。一方メモリ3には各単音節毎の
標準パターンが記憶されており、単音節認識部2
において入力音声の特徴パターンと標準パターン
とのマツチング計算処理が行なわれ、このマツチ
ング計算処理の結果、最も近似したものが第1候
補として、また順次近似したものが次候補として
選出され、その結果が近似度(確からしさ)を示
す距離差情報と共にメモリ4に音節ラテイスとし
て記憶される。 上記単音節認識部2において認識され、音節ラ
テイスとしてメモリ4に記憶された内容は候補列
作成部5に入力されて近似度(確からしさ)を示
す距離差情報を用いて確度の高い順い文節候補
(かな文字列)が作成されて文節候補メモリ6に
記憶される。なおメモリ6において領域6aは文
節候補の確からしさを示す確度情報の記憶領域、
領域6bは後述する評価内容を記憶する評価レジ
スタ領域である。 上記候補列作成部5において作成され、メモリ
6内に記憶された複数の候補列は順次文節分析部
7に入力されて文法的な分析が行なわれると共に
分析に必要な文法情報及び見出し語辞書、接辞語
辞書等を含む辞書メモリ8の内容と照合され、一
致したものが認識結果メモリ9に文節(単語)の
漢字候補情報として記憶される。更に文節分析部
7は後述するようにメモリ9に記憶される文節
(漢字)候補の構成要素を分析して文法評価値を
算出し、仮名漢字変換処理における同音語の最高
評価値を得た漢字候補が認識結果メモリ9に記憶
され、またメモリエリア9aにその候補に対する
文法評価値が記憶される。 また上記メモリ領域6aに記憶されている確度
情報Yとメモリエリア9aに記憶された文法評価
値情報Xにもとずいて算出された各候補の総合評
価値Zがメモリエリア9bに記憶され、この総合
評価値Zを用いて文節候補のソートが行なわれ
て、認識結果の出力順序が決定されるように構成
されている。 なお10は評価点算出のために用いられるバツ
フアであり、メモリ領域A,B,C,ST,SB,
X、を有している。また11は認識結果等を表示
する表示装置、12はかなキー、フアンクシヨン
キー等を有する入力装置、13は上記各装置を制
御するコントローラ(CPU)である。 次に上記の如く構成された装置の動作を第2図
に示す1文節の処理フローに従つて説明する。 文節単位に発声された音声はマイクロホン1に
よつて検出されて単音節認識部2により、音響分
析によつて単音節単位に認識され(n0〜n3)、そ
の認識結果が音節ラテイスメモリ4に入力記憶さ
れる。 例えば入力音声「/こ//く//み//ん//
の/」(「国民の」)に対する単音節認識結果とし
て第1表に示すような音節ラテイスが形成され
る。
に認識し、この認識された音節候補の組合せによ
り複数の文節候補列を作成し、辞書照合を含む文
法処理を行なつて文節単位の認識結果を出力する
日本語音声入力装置の改良に関するものであり、
更に詳細には認識結果の複数の候補を音声認識結
果の確からしさ及び該確からしさ以外の条件にも
とずいて総合評価して認識結果の出力順序を変更
するようにした日本語音声入力装置に関するもの
である。 <従来技術> 従来の日本語音声入力装置において、例えば入
力音声を音節単位に認識し、この認識された文節
候補の組合せにより複数の文節候補列を作成し、
辞書照合を含む文法処理を行なつて文節単位の認
識結果を出力している。そしてこの時文節の長さ
と各音節毎の候補数を組合せた数の文節候補列が
作成され、また辞書照合の結合も複数の認識結果
が出力される。 この場合、音声認識結果の確からしさの順序で
複数の認識結果を順次出力している。 しかし、従来のこのような方法において、単音
節の認識結果がほとんど誤まりの無い場合、ある
いは対象とする語彙が少ない場合には特に問題は
生じないが、現在の音声認識の技術レベルでは充
分に区切つた音節でも識別しにくい音節があり、
また連続的に発声した音声では調音結合等の影響
により識別率が更に低下する。 また辞書に収納された語彙が多くなれば思つて
もみない語が最初に認識結果として出力されるこ
とがある。 本発明者等はこのような音響分析での音節認識
率(音節の正解率)が悪い場合に有効となる認識
結果の出力順序の決定方法を先に特願昭57−
232213号(特開昭59−116837号公報)「音声入力
式日本語文書処理装置」として提案した。 この方法は、音声認識結果の確からしさ以外の
自立語の長さ、頻度等の条件を考慮に入れて認識
結果の出力順序を決定するようにしたものであ
る。 しかし、本発明者等が先に提案した方法によれ
ば、音響分析技術の向上に従つて、音節認識率が
良くなつて来ると、認識結果の出力順序の決定に
際して、逆に悪い方向に働き、最終の文節認識結
果の正解率を平均的に落してしまうという問題点
が見出されるに至つた。 <目的> 本発明は上記の点に鑑みて成されたものであ
り、認識結果の複数の候補を音声認識結果の確か
らしさを示す確度情報と、音声認識結果の確から
しさ以外の自立語の長さ、頻度を含む条件にもと
ずく文法評価値情報とから得られる総合評価値情
報によつて評価して認識結果の出力順序を決定す
るようにした日本語音声入力装置を提供すること
を目的としている。 <実施例> 以下、本発明を一実施例を挙げて詳細に説明す
る。 第1図は本発明の音声入力式日本語文書処理装
置の一実施例の構成を示すブロツク図である。 第1図において、1は音声入力をピツクアツプ
するマイクロホンであり、このマイクロホン1に
より検出された音声は単音節認識部2に入力され
る。この単音節認識部2は従来公知のものであ
り、マイクロホン1を介して入力された文節単位
の音声が音節単位に区分されて単音節毎の特徴描
出が行なわれる。一方メモリ3には各単音節毎の
標準パターンが記憶されており、単音節認識部2
において入力音声の特徴パターンと標準パターン
とのマツチング計算処理が行なわれ、このマツチ
ング計算処理の結果、最も近似したものが第1候
補として、また順次近似したものが次候補として
選出され、その結果が近似度(確からしさ)を示
す距離差情報と共にメモリ4に音節ラテイスとし
て記憶される。 上記単音節認識部2において認識され、音節ラ
テイスとしてメモリ4に記憶された内容は候補列
作成部5に入力されて近似度(確からしさ)を示
す距離差情報を用いて確度の高い順い文節候補
(かな文字列)が作成されて文節候補メモリ6に
記憶される。なおメモリ6において領域6aは文
節候補の確からしさを示す確度情報の記憶領域、
領域6bは後述する評価内容を記憶する評価レジ
スタ領域である。 上記候補列作成部5において作成され、メモリ
6内に記憶された複数の候補列は順次文節分析部
7に入力されて文法的な分析が行なわれると共に
分析に必要な文法情報及び見出し語辞書、接辞語
辞書等を含む辞書メモリ8の内容と照合され、一
致したものが認識結果メモリ9に文節(単語)の
漢字候補情報として記憶される。更に文節分析部
7は後述するようにメモリ9に記憶される文節
(漢字)候補の構成要素を分析して文法評価値を
算出し、仮名漢字変換処理における同音語の最高
評価値を得た漢字候補が認識結果メモリ9に記憶
され、またメモリエリア9aにその候補に対する
文法評価値が記憶される。 また上記メモリ領域6aに記憶されている確度
情報Yとメモリエリア9aに記憶された文法評価
値情報Xにもとずいて算出された各候補の総合評
価値Zがメモリエリア9bに記憶され、この総合
評価値Zを用いて文節候補のソートが行なわれ
て、認識結果の出力順序が決定されるように構成
されている。 なお10は評価点算出のために用いられるバツ
フアであり、メモリ領域A,B,C,ST,SB,
X、を有している。また11は認識結果等を表示
する表示装置、12はかなキー、フアンクシヨン
キー等を有する入力装置、13は上記各装置を制
御するコントローラ(CPU)である。 次に上記の如く構成された装置の動作を第2図
に示す1文節の処理フローに従つて説明する。 文節単位に発声された音声はマイクロホン1に
よつて検出されて単音節認識部2により、音響分
析によつて単音節単位に認識され(n0〜n3)、そ
の認識結果が音節ラテイスメモリ4に入力記憶さ
れる。 例えば入力音声「/こ//く//み//ん//
の/」(「国民の」)に対する単音節認識結果とし
て第1表に示すような音節ラテイスが形成され
る。
【表】
なお、上記第1表において音節ラテイスの
( )内に示した数字は第1位の認識結果を1.0と
した時の2位以下の確度を表わしている。 上記のように音節ラテイスには音節番号と音節
確度(確からしさ)情報が書かれることになる。
ここで音節の確からしさを表わす音節確度は次の
ようにして算出される。 即ち、単音節認識部2で入力音節の特徴パター
ンとメモリ3に記憶されている複数の標準パター
ンとの間でパターンマツチングが行なわれ、パタ
ーンマツチングの結果として、各標準パターンと
のマツチング距離を得る。このマツチング距離の
小さい順に並べて、上位数個を音節候補とする。 第2表に音節候補のマツチング距離を( )内
の数値で示す。第1表に示した音節確度は、第1
位のマツチング距離で各位のマツチング距離を除
して正規化したものである。
( )内に示した数字は第1位の認識結果を1.0と
した時の2位以下の確度を表わしている。 上記のように音節ラテイスには音節番号と音節
確度(確からしさ)情報が書かれることになる。
ここで音節の確からしさを表わす音節確度は次の
ようにして算出される。 即ち、単音節認識部2で入力音節の特徴パター
ンとメモリ3に記憶されている複数の標準パター
ンとの間でパターンマツチングが行なわれ、パタ
ーンマツチングの結果として、各標準パターンと
のマツチング距離を得る。このマツチング距離の
小さい順に並べて、上位数個を音節候補とする。 第2表に音節候補のマツチング距離を( )内
の数値で示す。第1表に示した音節確度は、第1
位のマツチング距離で各位のマツチング距離を除
して正規化したものである。
【表】
上記単音節認識部2において認識され、音節ラ
テイスとしてメモリ4に記憶された音節単位の各
候補は候補列作成部5に入力される。 候補列作成部5は音節ラテイスメモリ4に記憶
された音節単位の認識結果を用いて、最初に上記
メモリ4に記憶された1位の認識結果ばかりを並
べて候補列を作成して文節候補メモリ6に記憶
し、次に順次2位以下の認識結果を組合せて確度
の総和(候補列の確度)の小さい順に候補列(文
節候補)を作成してメモリ6に記憶する。またこ
の時各文節候補に対する確度情報Yがメモリエリ
ア6aに記憶される(n4)。上記第1表に示した
例では36個の候補列が第3表の如く作成されてメ
モリ6に記憶される。
テイスとしてメモリ4に記憶された音節単位の各
候補は候補列作成部5に入力される。 候補列作成部5は音節ラテイスメモリ4に記憶
された音節単位の認識結果を用いて、最初に上記
メモリ4に記憶された1位の認識結果ばかりを並
べて候補列を作成して文節候補メモリ6に記憶
し、次に順次2位以下の認識結果を組合せて確度
の総和(候補列の確度)の小さい順に候補列(文
節候補)を作成してメモリ6に記憶する。またこ
の時各文節候補に対する確度情報Yがメモリエリ
ア6aに記憶される(n4)。上記第1表に示した
例では36個の候補列が第3表の如く作成されてメ
モリ6に記憶される。
【表】
Claims (1)
- 【特許請求の範囲】 1 文節単位に発声された音声を音節単位に認識
し、該認識された音節候補の組合せにより複数の
文節候補列を作成し、辞書照合を含む文法処理を
行なつて文節単位の認識結果を出力する日本語音
声入力装置において、 認識結果の複数の候補を音声認識結果の確から
しさを示す確度情報と、音声認識結果の確からし
さ以外の自立語の長さ、頻度を含む条件にもとず
く文法評価値情報とから得られる総合評価値情報
により評価して認識結果の出力順序を決定する手
段を備えたことを特徴とする日本語音声入力装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58058513A JPS59180629A (ja) | 1983-03-30 | 1983-03-30 | 日本語音声入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58058513A JPS59180629A (ja) | 1983-03-30 | 1983-03-30 | 日本語音声入力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS59180629A JPS59180629A (ja) | 1984-10-13 |
JPS6325366B2 true JPS6325366B2 (ja) | 1988-05-25 |
Family
ID=13086505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58058513A Granted JPS59180629A (ja) | 1983-03-30 | 1983-03-30 | 日本語音声入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59180629A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61184683A (ja) * | 1985-02-12 | 1986-08-18 | Nec Corp | 認識結果選択方式 |
JPH0827639B2 (ja) * | 1985-07-03 | 1996-03-21 | 株式会社日立製作所 | 音声認識装置 |
JP2723214B2 (ja) * | 1985-11-12 | 1998-03-09 | 株式会社東芝 | 音声文書作成装置 |
JPS6470865A (en) * | 1987-09-11 | 1989-03-16 | Brother Ind Ltd | Language processor based upon voice input |
-
1983
- 1983-03-30 JP JP58058513A patent/JPS59180629A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS59180629A (ja) | 1984-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100277694B1 (ko) | 음성인식시스템에서의 발음사전 자동생성 방법 | |
US6553342B1 (en) | Tone based speech recognition | |
KR20010096490A (ko) | 이동통신을 위한 철자 음성인식장치 및 방법 | |
JPS61177493A (ja) | 音声認識方法 | |
JP2005084436A (ja) | 音声認識装置及びコンピュータプログラム | |
JPS6325366B2 (ja) | ||
JP3444108B2 (ja) | 音声認識装置 | |
JP2002278579A (ja) | 音声データ検索装置 | |
JPH049320B2 (ja) | ||
JP2000250593A (ja) | 話者認識装置及び方法 | |
JPH06266393A (ja) | 音声認識装置 | |
CN114566147A (zh) | 语音评测方法、计算机设备、存储介质和计算机程序产品 | |
JPH08248988A (ja) | 音声認識方法 | |
JPH11249688A (ja) | 音声認識装置およびその方法 | |
JPS6147999A (ja) | 音声認識装置 | |
JP2647234B2 (ja) | 音声認識装置 | |
KR20000025827A (ko) | 음성인식시스템에서의 반음소모델 구축방법및 그를 이용한 발화 검증방법 | |
JPS61122781A (ja) | 音声ワ−ドプロセツサ | |
JP2003263187A (ja) | 言語モデル学習方法、その装置、そのプログラムおよびそのプログラムの記録媒体ならびに言語モデル学習を用いた音声認識方法、その装置、そのプログラムおよびそのプログラムの記録媒体 | |
JPS615300A (ja) | 学習機能付音声入力装置 | |
KR100492089B1 (ko) | 반음소 모델을 이용한 발화검증시 계산량 감소 방법 | |
JPH0236960B2 (ja) | ||
JPH0682275B2 (ja) | 音声認識装置 | |
JPH0554678B2 (ja) | ||
JPH0651939A (ja) | 音声入力装置 |