JPS63155263A

JPS63155263A - 音声ワ−ドプロセツサ

Info

Publication number: JPS63155263A
Application number: JP61300022A
Authority: JP
Inventors: Haruki Matsui; 松井　春樹; Yasuo Sato; 佐藤　泰雄
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1986-12-18
Filing date: 1986-12-18
Publication date: 1988-06-28

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔概　　要〕本発明は子音と母音とからなる単音節を連続的に発声し
て文章データを音声で入力し、各単音節の系列に対し仮
名漢字変換処理によって文章入力を実現する音声ワード
プロセッサに関し、特に、文章データを人力した後、仮
名漢字変換する操作時に文章の文字の種類を指定するこ
とを特徴とする音声ワードプロセッサを提供する。

音声ワードプロセッサの中心部分は単音節を認識する音
声認識部と、認識結果から音節ラティスを作り、その音
節ラティスから仮名漢字変換によって仮名を漢字に変換
する処理を行う言語処理部から構成される。

本発明では、仮名漢字変換からの不適当な変換結果を棄
却し次の変換候補を要求するために、仮名漢字変換時に
おいて、指定された文字の種類のチェックと次候補要求
操作を行う字種判定処理部、及び仮名漢字変換の開始と
次候補の表示の要求との意味を合せ持つ字種指定部を備
える。

本発明の音声ワードプロセッサでは、音節による文章デ
ータを入力後、仮名漢字変換操作゛を行う変換操作が効
率の良いリズムで行うことができ、入力速度が速くなる
という効果がある。

〔産業上の利用分野〕

本発明は、日本語ワードプロセッサの入力方法として注
目されている単音節認識技術による音声ワードプロセッ
サに係り、特に音声で文章データを入力し、仮名漢字変
換する操作の変換操作時に目的とする文字の種類を指定
することを特徴とする音声ワードプロセッサに関する。

〔従　来　技　術〕

集積回路技術の発展に伴い、音声認識装置の開発が進み
、システムに音声で入力してり、内部に格納された文章
データを音声で出力するシステムなど、音節入出カシス
テムの研究も活発になっている。特に、音声認識装置は
音声処理用の専用ＬＳＩや汎用の高速ディジタル信号処
理プロセッサ、或いはマイクロプロセッサ、更に大規模
なメモリＩＣを用いて小型で高性能な装置が構成できる
ようになってきた。

認識処理は一般に音声の特徴抽出を行い、その後、時間
補正、類似度計算、そして入力音声の決定を行う必要が
ある。認識には、特定話者の認識と不特定話者の認識が
ある。特定話者用の認識装置では、使用者が予め自分が
使うすべての認識語量を登録しておく必要がある。一方
、不特定話者の認識装置では、認識語量を登録する必要
はないが、前もってなるべ（多くの人に適合するような
認識語量の登録パターンを辞書に用意しておく必要があ
る。

文章データを音声で読上げ認識する場合、連続発声の文
章を認識する技術が必要となるが、音声を構成する音韻
や、それらが連なった音韻群を認識する必要があり、連
続発声の文章を認識することは一般に難しい。従って、
現在では、子音と母音からなる発音の最小単位である単
音声をひとつ、ひとつ区切って発声する離散発声の方式
に基づく、単音節認識技術によりて音声ワードプロセッ
サを構成する方式が主流である。

この単音節をひとつ、ひとつ区切って発声する方式は、
入力速度を向上させることが重要である。

第４図は、従来の音声ワードプロセッサの構成図である
。マイク１から入力された文章データの音声は音声認識
部２に入力される。音声認識部２では、入力音声から確
からしさを付与した認識結果を複数個出力し、言語処理
部３に出力する。言語処理部３は、認識結果から音節ラ
ティスを作り、そこから複数個の仮名列を作成する。そ
して、仮名列から辞書部３０の仮名漢字テーブルを用い
て妥当な漢字仮名列を作り、確からしい順に並べて文章
表示部４に出力する０文章表示部４は仮名漢字変換結果
をディスプレイ装置７に表示すると共に、確定した仮名
漢字変換結果を文章記憶部４０に格納する為の処理を行
う。

このように、音声を認識し、処理し、表示するための制
御は、制御部５で行われる。制御部５には変換操作部６
が接続され、この変換操作部６から文章データの入力前
に、その文章の文字の種類を指定する。即ち、従来のワ
ードプロセッサでは、キー人力方式のワードプロセッサ
の延長として、第５図のフローチャートに示すように、
入力の文字種類を文章データの音声入力（ＳＴ２）を行
う前に指定する（ＳＴＩ）。その後、変換トリガ（ＳＴ
３）、記憶表示（ＳＴ４）する。

例えば、「あめりか」という言葉が文章中にあった場合
に、これを音声で入力する直前に変換操作部６から片仮
名指定を行う。即ち、従来のワードプロセッサでは、片
仮名指定を行った後に、「あめりか」と音声入力し、そ
の後仮名漢字変換の操作を行って、目的とする文章を表
示する。

〔発明が解決しようとする問題点〕

従来の音声ワードプロセッサでは、文字のｆ［を指定す
る動作が、文章データの音声入力前に行う為、音声人力
＋変換操作の動作以前に文字の種類の指定の動作がある
。そのため、入力動作のリズムが乱れるという問題があ
る。

更に、例えば文字の種類を指定しなかった場合など、音
節ラティス上の認識候補の組合せから生まれる不要な変
換結果がディスプレイ装置７に多数表示され、不要な仮
名漢字変換結果が表示されてしまうという欠点を有して
いる。

従って、従来の音声ワードプロセッサでは、入力速度が
低下し、効率が悪いという問題点がある。

〔問題点を解決するための手段〕

本発明の音声ワードプロセッサの構成を第１図に示す。

音声認識部２はマイク１から入力された文章データの入
力音声から確からしさを付与した認識結果を複数個出力
し、言語処理部３に与える。言語処理部３は辞書部３０
に接続され、仮名列作成部３２、仮名漢字変換部３３及
び本発明の特徴とする字種判定処理部３４から構成され
る。そして、前記音声認識部２から出力された認識結果
に基づいて音節ラティス３１を作成し、これを基に仮名
列作成部３２が複数個の仮名列を作成する。仮名漢字変
換部３３は前記仮名列作成部３２から仮名列の候補を入
力し、辞書部３０の仮名漢字テーブルを用いて、仮名漢
字変換の処理を行うと共に前記仮名列作成部３２に仮名
列の次候補を要求する。

本発明では、この仮名漢字変換操作時に目的とする日本
語文の文字の種類を保証する為に、字種判定処理部３４
と字種指定部８が付加されている。

この字種判定処理部３４では、仮名漢字変換部３３から
の不適当な仮名漢字変換結果を棄却し、次の変換候補を
要求する処理を行う。即ち、制御部５を介して与えられ
る字種の指示に従って、文字の種類のチェックを行うと
共に、次候補要求動作を仮名漢字変換部３３に要求する
。そして、指定された文字の種類以外の変換結果は削除
されて生成された文章データが文章表示部４に表示され
る。

字種指定部８は、字種を指定するだの複数個のキーを備
える。音声による文章データの入力後に、これらのキー
を押下することにより、上記の仮名漢字変換処理が行わ
れ、その結果が文章表示部４に表示される。この表示結
果が望ましくない場合には再びこれらのキーを押下する
ことにより、次候補が文章表示部４に表示される。

〔作　　　用〕

本発明の音声ワードプロセッサでは、字種判定処理部３
４が付加されている為、仮名漢字変換部３３からの不適
当な変換結果を棄却して文字の種類のチェックと次候補
要求操作が仮名漢字変換時に実行される。

〔実　　施　　例〕

次に、本発明の音声ワードプロセッサの動作を図面を参
照して説明する。

第１図は、本発明の音声ワードプロセッサの構成図であ
る。

音声認識部２はマイク１から入力された入力音声を認識
する部分である。認識処理は一般に音声の特徴抽出、時
間補正、類似度計算、認識単語の決定の４段階から構成
される。入力された音声信号はディジタル化され、相関
性が高いので線形予測符号化手法に基づいて、゛データ
量が圧縮され、メモリに蓄積される。音声認識技術には
様々な方法があるが、入カバターンと比較される参照パ
ターンを予め登録する必要がある。即ち、音声認識では
、一般に使用者が使うｉ！霊を予め参照パターンとして
登録し、蓄積する。そして、入力された音声信号の周波
数スペクトルをフレームごとに求め、参照パターンのス
ペクトルと比較し、その比較結果である残差信号が最小
である参照パターンが認識結果となるように処理が行わ
れる。この時、入力音声信号のパターンと参照パターン
との間の残差を最小化する手法として、動的計画法が一
般に使われる。そして、この動的計画法に基づいて、メ
モリに格納されている参照パターンと発声した入力音声
のパターンとの最小距離が計算され、通切な認識結果の
候補が捜し出され、更に、高度な決定論理で処理される
。この処理では、どの語いを選ぶべきかを決定するため
、閾値との比較試験や次候補との誤り闇値試験が行われ
る。ここでは、入カバターンと参照パターンの誤差が闇
値より小さくなった段階で更に最小の誤差を持つ参照パ
ターンに対して次に小さな誤差を持つ参照パターンとの
差が十分大きいかどうかのチェックも行われる。もし、
この差が非常に大きければ認識ができたという信号を出
力する。しかし、例えば誤差が非常に近い２つの参照パ
ターンがあった場合には、これらの２つを認識結果とし
て出力する。このように、音声認識部２では、入力音声
から確からしさを付与した認識結果を複数個出力し、言
語処理部３に認識結果を与える。

言語処理部３は辞書部３０に接続され、仮名列作成部３
２、仮名漢字変換部３３及び本発明の特徴とする字種判
定処理部３４から構成される。そして、前記音声認識部
２から出力された認識結果に基づいて音節ラティス３１
を作成し、これを基に仮名列作成部３２が複数個の仮名
列を作成する。

仮名漢字変換部３３は前記仮名列作成部３２から仮名列
の候補を入力し、辞書部３０の仮名漢字テーブルを用い
て、仮名漢字変換の処理を行うと共に前記仮名列作成部
３２に仮名列の次候補を要求する。

本発明では、この仮名漢字変換操作時に目的とする日本
語文の文字の種類を保証する為に、字種判定処理部３４
が付加されている。この字種判定処理部３４では、仮名
漢字変換部３３からの不適当な仮名漢字変換結果を棄却
し、次の変換候補を要求する処理を行う。即ち、字種判
定処理部は、制御部５を介して入力される字種の指示に
従って、文字の種類のチェックを行うと共に、次候補要
求動作を仮名漢字変換部３３に要求する。そして、字種
判定処理に基づき、指定された文字の種類以外の変換結
果は削除されて生成された文章データが文章表示部４に
表示される。

次に、制御部５から字種判定処理部３４に対して、字種
指示付き変換指示を与える場合の実施例を表１に基づい
て説明する。

本発明では、この字種の指示は文章データの入力前では
なく、仮名漢字変換時に行われる。字種の指示には表１
に示すように漢字、平仮名、片仮名、数詞、記号がある
。例えば、「音声入力による」という文章には「音声入
力」という漢字があるので、この部分を漢字にするため
、漢字の指示を与える。また、「ことだろうが」という
文はすべて平仮名であるので、文字の種類の指示は平仮
名である。次の「システムでは」という文では「システ
ム」が片仮名であるから、片仮名の指示で字種指示付き
変換処理を行う。また、「第３回目の」という文には「
３」という数詞があるので数詞の指示が与えられ、次の
「（」は記号であるから、記号の指示が与えられる。こ
のように、制御部５を介して字種の指示が与えられる。

この指示に基づいて字種判定処理部３４は、仮名漢字変
換部３３で出力される辞書照合結果のデータに対して不
適当な変換結果があった場合には、この結果を棄却する
。そして、次の変換候補を要求するように仮名漢字変換
部３３に次候補要求信号を与える。

本発明では、仮名漢字変換する場合制御部５から与えら
れる字種指示付き変換指示に基づいて字種判定処理部３
４が文字のｆｉｌのチェックを行い、その判定結果に基
づいて仮名漢字変換部３３に次候補要求を行うため、指
定された文字種類以外の変換結果は文章表示部４には与
えられない。従って、不要な変換結果がディスプレイ上
に表示されず、その分、不要な変換結果の表示が削減さ
れ、次候補要求操作も削減されることになる。

このように、本発明では、仮名漢字変換操作時に目的と
する文字の種類を指定することを特徴とし、その動作は
第２図（ａｌ、　（ｂｌに示すフローチャートに従う。

すなわち、第２図（ａｌのフローチャートは本発明の動
作の概要であり、第２図（ｂｌは本発明の言語処理部３
の各部の動作の詳細なフローチャートである。

第２図（ａｌに示すように、本発明では、文章データの
音声入力（ＳＴＩ）の動作後に字種指定を含む変換のト
リガ（Ｓｒ１）が与えられて、記憶表示（Ｓｒ１）する
。

第２図（ｂ）に示すように、本発明の言語処理部の動作
は次のように行われる。

言語処理部３では文節や文章単位の処理が実行され、Ｓ
ＴＩにおいて、仮名列作成のための初期設定がなされる
。Ｓｒ１で音節ラティスから最も確からしい仮名列を作
る。例えば音節ラティスにおいて、二・コ・ム・ワとな
っている場合には確からしい仮名列としてニコムワ、シ
コムワ、ニモムワ、ニコンワ等のような仮名列が作られ
る（第３図参照）。Ｓｒ１において、仮名列の存在の有
無を検査する。次候補の表示を繰り返して仮名列がなく
なった場合には、変換不能となる。仮名列がある場合に
は、これを仮名列候補として仮名漢字変換部３３に与え
る。そして、Ｓｒ１において仮名漢字変換の初期設定が
なされる。Ｓｒ１において、仮名列を単語列に分解する
。例えば、ニコムワに対応する仮名列は存在しても、単
語列がないためにＳｒ１において、処理フローは「無」
の方に移り音節ラティスから最も確からしいカナ列を作
るためのＳｒ１にもどる次候補要求を行う。

Ｓｒ１においてもし単語列が存在するならば、Ｓｒ７で
単語列を辞書部３０のバター・ンと照合する。

この場合文法的な接続の可否のテストも同時に行う。照
合した結果、もし、合格しなければ、Ｓｒ１において、
Ｎのフローに移り、Ｓｒ１に戻って再度仮名列を単語列
に分解する動作に入る。Ｓｒ１において、合格すればそ
の結果は辞書照合結果として字種判定処理部３４に入力
する。そして、Ｓｒ９において、指定された文字の種類
と一致するかどうかのテストが行われる。テストの結果
合格しなげれば、５ＴＩＯにおいてＮの方向に移り、再
びＳｒ１の仮名列を単語列に分解する処理に戻る。これ
が次候補要求となる。５ＴＩＯにおいて、もし合格した
場合は、その結果を文章表示部４に渡す（ＳＴＩＩ）。

〔発明の効果〕

本発明の音声ワードブロセ・ノサにおいては、音声によ
る文章データの入力操作と、字種指定を含む仮名漢字変
換操作の連続動作が効率よ（行われ、更に、ｌ′旨定さ
れた文字以外の変換結果はディスプレイ上に表示されな
いという効果がある。従って、入力速度が向上し、入力
動作の効率のよい音声ワードプロセッサが提供できると
いう効果がある。

【図面の簡単な説明】

第１図は、本発明の音声ワードプロセッサの構成図、第２図（ａｌ、　（ｂｌは、本発明のワードプロセッサ
の動作のフローチャート、第３図は、音声ラティスから仮名列の作成例の説明図、第４図は、従来の音声ワードプロセッサの構成図、第５図は、従来の音声ワードプロセッサの動作フローチ
ャートである。 ■・・・マイク、２・・・音声認識部、３・・・言語処理部、４・・・文章表示部、５・・・制御部、６・・・変換操作部、７・・・ディスプレイ装置。３０・・・辞書部、３１・・・音節ラティス、３２・・・仮名列作成部、３３・・・仮名漢字変換部、３４・・・字種判定処理部、４０・・・文章記憶部、

Claims

【特許請求の範囲】単音節を離散発声して音声入力し、連続発声の文章を認
識し記憶すると同時に表示する音声ワードプロセッサに
おいて、入力された音声のパターンと参照パターンとを比較し認
識する音声認識部（２）と、前記音声認識部（２）から出力される認識結果から複数
の仮名列を作り、前記仮名列から漢字仮名列を作成する
仮名漢字変換部（３３）と、前記仮名漢字変換部（３３
）に接続され与えられた字種指示付き変換指示信号に基
づき前記仮名漢字変換部から出力された変換結果のうち
不適当な変換結果を棄却し、次の変換候補を前記仮名漢
字変換部に要求する処理を行う字種判定処理部（３４）
と、仮名漢字変換の開始と次候補の表示の要求の意味を
合せ持つ字種指定部（８）と、前記仮名漢字変換部（３
３）と前記字種判定処理部（３４）の処理に基づいて生
成された文章を格納し表示する文章表示部（４）とから
なることを特徴とする音声ワードプロセッサ。