JPS63155263A - 音声ワ−ドプロセツサ - Google Patents

音声ワ−ドプロセツサ

Info

Publication number
JPS63155263A
JPS63155263A JP61300022A JP30002286A JPS63155263A JP S63155263 A JPS63155263 A JP S63155263A JP 61300022 A JP61300022 A JP 61300022A JP 30002286 A JP30002286 A JP 30002286A JP S63155263 A JPS63155263 A JP S63155263A
Authority
JP
Japan
Prior art keywords
kana
conversion
kanji
character type
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61300022A
Other languages
English (en)
Inventor
Haruki Matsui
松井 春樹
Yasuo Sato
佐藤 泰雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61300022A priority Critical patent/JPS63155263A/ja
Publication of JPS63155263A publication Critical patent/JPS63155263A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概  要〕 本発明は子音と母音とからなる単音節を連続的に発声し
て文章データを音声で入力し、各単音節の系列に対し仮
名漢字変換処理によって文章入力を実現する音声ワード
プロセッサに関し、特に、文章データを人力した後、仮
名漢字変換する操作時に文章の文字の種類を指定するこ
とを特徴とする音声ワードプロセッサを提供する。
音声ワードプロセッサの中心部分は単音節を認識する音
声認識部と、認識結果から音節ラティスを作り、その音
節ラティスから仮名漢字変換によって仮名を漢字に変換
する処理を行う言語処理部から構成される。
本発明では、仮名漢字変換からの不適当な変換結果を棄
却し次の変換候補を要求するために、仮名漢字変換時に
おいて、指定された文字の種類のチェックと次候補要求
操作を行う字種判定処理部、及び仮名漢字変換の開始と
次候補の表示の要求との意味を合せ持つ字種指定部を備
える。
本発明の音声ワードプロセッサでは、音節による文章デ
ータを入力後、仮名漢字変換操作゛を行う変換操作が効
率の良いリズムで行うことができ、入力速度が速くなる
という効果がある。
〔産業上の利用分野〕
本発明は、日本語ワードプロセッサの入力方法として注
目されている単音節認識技術による音声ワードプロセッ
サに係り、特に音声で文章データを入力し、仮名漢字変
換する操作の変換操作時に目的とする文字の種類を指定
することを特徴とする音声ワードプロセッサに関する。
〔従 来 技 術〕
集積回路技術の発展に伴い、音声認識装置の開発が進み
、システムに音声で入力してり、内部に格納された文章
データを音声で出力するシステムなど、音節入出カシス
テムの研究も活発になっている。特に、音声認識装置は
音声処理用の専用LSIや汎用の高速ディジタル信号処
理プロセッサ、或いはマイクロプロセッサ、更に大規模
なメモリICを用いて小型で高性能な装置が構成できる
ようになってきた。
認識処理は一般に音声の特徴抽出を行い、その後、時間
補正、類似度計算、そして入力音声の決定を行う必要が
ある。認識には、特定話者の認識と不特定話者の認識が
ある。特定話者用の認識装置では、使用者が予め自分が
使うすべての認識語量を登録しておく必要がある。一方
、不特定話者の認識装置では、認識語量を登録する必要
はないが、前もってなるべ(多くの人に適合するような
認識語量の登録パターンを辞書に用意しておく必要があ
る。
文章データを音声で読上げ認識する場合、連続発声の文
章を認識する技術が必要となるが、音声を構成する音韻
や、それらが連なった音韻群を認識する必要があり、連
続発声の文章を認識することは一般に難しい。従って、
現在では、子音と母音からなる発音の最小単位である単
音声をひとつ、ひとつ区切って発声する離散発声の方式
に基づく、単音節認識技術によりて音声ワードプロセッ
サを構成する方式が主流である。
この単音節をひとつ、ひとつ区切って発声する方式は、
入力速度を向上させることが重要である。
第4図は、従来の音声ワードプロセッサの構成図である
。マイク1から入力された文章データの音声は音声認識
部2に入力される。音声認識部2では、入力音声から確
からしさを付与した認識結果を複数個出力し、言語処理
部3に出力する。言語処理部3は、認識結果から音節ラ
ティスを作り、そこから複数個の仮名列を作成する。そ
して、仮名列から辞書部30の仮名漢字テーブルを用い
て妥当な漢字仮名列を作り、確からしい順に並べて文章
表示部4に出力する0文章表示部4は仮名漢字変換結果
をディスプレイ装置7に表示すると共に、確定した仮名
漢字変換結果を文章記憶部40に格納する為の処理を行
う。
このように、音声を認識し、処理し、表示するための制
御は、制御部5で行われる。制御部5には変換操作部6
が接続され、この変換操作部6から文章データの入力前
に、その文章の文字の種類を指定する。即ち、従来のワ
ードプロセッサでは、キー人力方式のワードプロセッサ
の延長として、第5図のフローチャートに示すように、
入力の文字種類を文章データの音声入力(ST2)を行
う前に指定する(STI)。その後、変換トリガ(ST
3)、記憶表示(ST4)する。
例えば、「あめりか」という言葉が文章中にあった場合
に、これを音声で入力する直前に変換操作部6から片仮
名指定を行う。即ち、従来のワードプロセッサでは、片
仮名指定を行った後に、「あめりか」と音声入力し、そ
の後仮名漢字変換の操作を行って、目的とする文章を表
示する。
〔発明が解決しようとする問題点〕
従来の音声ワードプロセッサでは、文字のf[を指定す
る動作が、文章データの音声入力前に行う為、音声人力
+変換操作の動作以前に文字の種類の指定の動作がある
。そのため、入力動作のリズムが乱れるという問題があ
る。
更に、例えば文字の種類を指定しなかった場合など、音
節ラティス上の認識候補の組合せから生まれる不要な変
換結果がディスプレイ装置7に多数表示され、不要な仮
名漢字変換結果が表示されてしまうという欠点を有して
いる。
従って、従来の音声ワードプロセッサでは、入力速度が
低下し、効率が悪いという問題点がある。
〔問題点を解決するための手段〕
本発明の音声ワードプロセッサの構成を第1図に示す。
音声認識部2はマイク1から入力された文章データの入
力音声から確からしさを付与した認識結果を複数個出力
し、言語処理部3に与える。言語処理部3は辞書部30
に接続され、仮名列作成部32、仮名漢字変換部33及
び本発明の特徴とする字種判定処理部34から構成され
る。そして、前記音声認識部2から出力された認識結果
に基づいて音節ラティス31を作成し、これを基に仮名
列作成部32が複数個の仮名列を作成する。仮名漢字変
換部33は前記仮名列作成部32から仮名列の候補を入
力し、辞書部30の仮名漢字テーブルを用いて、仮名漢
字変換の処理を行うと共に前記仮名列作成部32に仮名
列の次候補を要求する。
本発明では、この仮名漢字変換操作時に目的とする日本
語文の文字の種類を保証する為に、字種判定処理部34
と字種指定部8が付加されている。
この字種判定処理部34では、仮名漢字変換部33から
の不適当な仮名漢字変換結果を棄却し、次の変換候補を
要求する処理を行う。即ち、制御部5を介して与えられ
る字種の指示に従って、文字の種類のチェックを行うと
共に、次候補要求動作を仮名漢字変換部33に要求する
。そして、指定された文字の種類以外の変換結果は削除
されて生成された文章データが文章表示部4に表示され
る。
字種指定部8は、字種を指定するだの複数個のキーを備
える。音声による文章データの入力後に、これらのキー
を押下することにより、上記の仮名漢字変換処理が行わ
れ、その結果が文章表示部4に表示される。この表示結
果が望ましくない場合には再びこれらのキーを押下する
ことにより、次候補が文章表示部4に表示される。
〔作   用〕
本発明の音声ワードプロセッサでは、字種判定処理部3
4が付加されている為、仮名漢字変換部33からの不適
当な変換結果を棄却して文字の種類のチェックと次候補
要求操作が仮名漢字変換時に実行される。
〔実  施  例〕
次に、本発明の音声ワードプロセッサの動作を図面を参
照して説明する。
第1図は、本発明の音声ワードプロセッサの構成図であ
る。
音声認識部2はマイク1から入力された入力音声を認識
する部分である。認識処理は一般に音声の特徴抽出、時
間補正、類似度計算、認識単語の決定の4段階から構成
される。入力された音声信号はディジタル化され、相関
性が高いので線形予測符号化手法に基づいて、゛データ
量が圧縮され、メモリに蓄積される。音声認識技術には
様々な方法があるが、入カバターンと比較される参照パ
ターンを予め登録する必要がある。即ち、音声認識では
、一般に使用者が使うi!霊を予め参照パターンとして
登録し、蓄積する。そして、入力された音声信号の周波
数スペクトルをフレームごとに求め、参照パターンのス
ペクトルと比較し、その比較結果である残差信号が最小
である参照パターンが認識結果となるように処理が行わ
れる。この時、入力音声信号のパターンと参照パターン
との間の残差を最小化する手法として、動的計画法が一
般に使われる。そして、この動的計画法に基づいて、メ
モリに格納されている参照パターンと発声した入力音声
のパターンとの最小距離が計算され、通切な認識結果の
候補が捜し出され、更に、高度な決定論理で処理される
。この処理では、どの語いを選ぶべきかを決定するため
、閾値との比較試験や次候補との誤り闇値試験が行われ
る。ここでは、入カバターンと参照パターンの誤差が闇
値より小さくなった段階で更に最小の誤差を持つ参照パ
ターンに対して次に小さな誤差を持つ参照パターンとの
差が十分大きいかどうかのチェックも行われる。もし、
この差が非常に大きければ認識ができたという信号を出
力する。しかし、例えば誤差が非常に近い2つの参照パ
ターンがあった場合には、これらの2つを認識結果とし
て出力する。このように、音声認識部2では、入力音声
から確からしさを付与した認識結果を複数個出力し、言
語処理部3に認識結果を与える。
言語処理部3は辞書部30に接続され、仮名列作成部3
2、仮名漢字変換部33及び本発明の特徴とする字種判
定処理部34から構成される。そして、前記音声認識部
2から出力された認識結果に基づいて音節ラティス31
を作成し、これを基に仮名列作成部32が複数個の仮名
列を作成する。
仮名漢字変換部33は前記仮名列作成部32から仮名列
の候補を入力し、辞書部30の仮名漢字テーブルを用い
て、仮名漢字変換の処理を行うと共に前記仮名列作成部
32に仮名列の次候補を要求する。
本発明では、この仮名漢字変換操作時に目的とする日本
語文の文字の種類を保証する為に、字種判定処理部34
が付加されている。この字種判定処理部34では、仮名
漢字変換部33からの不適当な仮名漢字変換結果を棄却
し、次の変換候補を要求する処理を行う。即ち、字種判
定処理部は、制御部5を介して入力される字種の指示に
従って、文字の種類のチェックを行うと共に、次候補要
求動作を仮名漢字変換部33に要求する。そして、字種
判定処理に基づき、指定された文字の種類以外の変換結
果は削除されて生成された文章データが文章表示部4に
表示される。
次に、制御部5から字種判定処理部34に対して、字種
指示付き変換指示を与える場合の実施例を表1に基づい
て説明する。
本発明では、この字種の指示は文章データの入力前では
なく、仮名漢字変換時に行われる。字種の指示には表1
に示すように漢字、平仮名、片仮名、数詞、記号がある
。例えば、「音声入力による」という文章には「音声入
力」という漢字があるので、この部分を漢字にするため
、漢字の指示を与える。また、「ことだろうが」という
文はすべて平仮名であるので、文字の種類の指示は平仮
名である。次の「システムでは」という文では「システ
ム」が片仮名であるから、片仮名の指示で字種指示付き
変換処理を行う。また、「第3回目の」という文には「
3」という数詞があるので数詞の指示が与えられ、次の
「(」は記号であるから、記号の指示が与えられる。こ
のように、制御部5を介して字種の指示が与えられる。
この指示に基づいて字種判定処理部34は、仮名漢字変
換部33で出力される辞書照合結果のデータに対して不
適当な変換結果があった場合には、この結果を棄却する
。そして、次の変換候補を要求するように仮名漢字変換
部33に次候補要求信号を与える。
本発明では、仮名漢字変換する場合制御部5から与えら
れる字種指示付き変換指示に基づいて字種判定処理部3
4が文字のfilのチェックを行い、その判定結果に基
づいて仮名漢字変換部33に次候補要求を行うため、指
定された文字種類以外の変換結果は文章表示部4には与
えられない。従って、不要な変換結果がディスプレイ上
に表示されず、その分、不要な変換結果の表示が削減さ
れ、次候補要求操作も削減されることになる。
このように、本発明では、仮名漢字変換操作時に目的と
する文字の種類を指定することを特徴とし、その動作は
第2図(al、 (blに示すフローチャートに従う。
すなわち、第2図(alのフローチャートは本発明の動
作の概要であり、第2図(blは本発明の言語処理部3
の各部の動作の詳細なフローチャートである。
第2図(alに示すように、本発明では、文章データの
音声入力(STI)の動作後に字種指定を含む変換のト
リガ(Sr1)が与えられて、記憶表示(Sr1)する
第2図(b)に示すように、本発明の言語処理部の動作
は次のように行われる。
言語処理部3では文節や文章単位の処理が実行され、S
TIにおいて、仮名列作成のための初期設定がなされる
。Sr1で音節ラティスから最も確からしい仮名列を作
る。例えば音節ラティスにおいて、二・コ・ム・ワとな
っている場合には確からしい仮名列としてニコムワ、シ
コムワ、ニモムワ、ニコンワ等のような仮名列が作られ
る(第3図参照)。Sr1において、仮名列の存在の有
無を検査する。次候補の表示を繰り返して仮名列がなく
なった場合には、変換不能となる。仮名列がある場合に
は、これを仮名列候補として仮名漢字変換部33に与え
る。そして、Sr1において仮名漢字変換の初期設定が
なされる。Sr1において、仮名列を単語列に分解する
。例えば、ニコムワに対応する仮名列は存在しても、単
語列がないためにSr1において、処理フローは「無」
の方に移り音節ラティスから最も確からしいカナ列を作
るためのSr1にもどる次候補要求を行う。
Sr1においてもし単語列が存在するならば、Sr7で
単語列を辞書部30のバター・ンと照合する。
この場合文法的な接続の可否のテストも同時に行う。照
合した結果、もし、合格しなければ、Sr1において、
Nのフローに移り、Sr1に戻って再度仮名列を単語列
に分解する動作に入る。Sr1において、合格すればそ
の結果は辞書照合結果として字種判定処理部34に入力
する。そして、Sr9において、指定された文字の種類
と一致するかどうかのテストが行われる。テストの結果
合格しなげれば、5TIOにおいてNの方向に移り、再
びSr1の仮名列を単語列に分解する処理に戻る。これ
が次候補要求となる。5TIOにおいて、もし合格した
場合は、その結果を文章表示部4に渡す(STII)。
〔発明の効果〕
本発明の音声ワードブロセ・ノサにおいては、音声によ
る文章データの入力操作と、字種指定を含む仮名漢字変
換操作の連続動作が効率よ(行われ、更に、l′旨定さ
れた文字以外の変換結果はディスプレイ上に表示されな
いという効果がある。従って、入力速度が向上し、入力
動作の効率のよい音声ワードプロセッサが提供できると
いう効果がある。
【図面の簡単な説明】
第1図は、本発明の音声ワードプロセッサの構成図、 第2図(al、 (blは、本発明のワードプロセッサ
の動作のフローチャート、 第3図は、音声ラティスから仮名列の作成例の説明図、 第4図は、従来の音声ワードプロセッサの構成図、 第5図は、従来の音声ワードプロセッサの動作フローチ
ャートである。 ■・・・マイク、 2・・・音声認識部、 3・・・言語処理部、 4・・・文章表示部、 5・・・制御部、 6・・・変換操作部、 7・・・ディスプレイ装置。 30・・・辞書部、 31・・・音節ラティス、 32・・・仮名列作成部、 33・・・仮名漢字変換部、 34・・・字種判定処理部、 40・・・文章記憶部、

Claims (1)

  1. 【特許請求の範囲】 単音節を離散発声して音声入力し、連続発声の文章を認
    識し記憶すると同時に表示する音声ワードプロセッサに
    おいて、 入力された音声のパターンと参照パターンとを比較し認
    識する音声認識部(2)と、 前記音声認識部(2)から出力される認識結果から複数
    の仮名列を作り、前記仮名列から漢字仮名列を作成する
    仮名漢字変換部(33)と、前記仮名漢字変換部(33
    )に接続され与えられた字種指示付き変換指示信号に基
    づき前記仮名漢字変換部から出力された変換結果のうち
    不適当な変換結果を棄却し、次の変換候補を前記仮名漢
    字変換部に要求する処理を行う字種判定処理部(34)
    と、仮名漢字変換の開始と次候補の表示の要求の意味を
    合せ持つ字種指定部(8)と、前記仮名漢字変換部(3
    3)と前記字種判定処理部(34)の処理に基づいて生
    成された文章を格納し表示する文章表示部(4)とから
    なることを特徴とする音声ワードプロセッサ。
JP61300022A 1986-12-18 1986-12-18 音声ワ−ドプロセツサ Pending JPS63155263A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61300022A JPS63155263A (ja) 1986-12-18 1986-12-18 音声ワ−ドプロセツサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61300022A JPS63155263A (ja) 1986-12-18 1986-12-18 音声ワ−ドプロセツサ

Publications (1)

Publication Number Publication Date
JPS63155263A true JPS63155263A (ja) 1988-06-28

Family

ID=17879764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61300022A Pending JPS63155263A (ja) 1986-12-18 1986-12-18 音声ワ−ドプロセツサ

Country Status (1)

Country Link
JP (1) JPS63155263A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009518677A (ja) * 2005-12-08 2009-05-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 莫大な語彙を有する音声認識システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009518677A (ja) * 2005-12-08 2009-05-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 莫大な語彙を有する音声認識システム
US8140336B2 (en) 2005-12-08 2012-03-20 Nuance Communications Austria Gmbh Speech recognition system with huge vocabulary
US8417528B2 (en) 2005-12-08 2013-04-09 Nuance Communications Austria Gmbh Speech recognition system with huge vocabulary
JP2013068970A (ja) * 2005-12-08 2013-04-18 Nuance Communications Austria Gmbh 単語識別方法、単語識別装置、及びコンピュータ可読コード
US8666745B2 (en) 2005-12-08 2014-03-04 Nuance Communications, Inc. Speech recognition system with huge vocabulary

Similar Documents

Publication Publication Date Title
US6067520A (en) System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
US8185376B2 (en) Identifying language origin of words
US6490563B2 (en) Proofreading with text to speech feedback
US7174288B2 (en) Multi-modal entry of ideogrammatic languages
US5995934A (en) Method for recognizing alpha-numeric strings in a Chinese speech recognition system
JP2002268680A (ja) 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術
JP2000056795A (ja) 音声認識装置
JPS63155263A (ja) 音声ワ−ドプロセツサ
JP3378547B2 (ja) 音声認識方法及び装置
Dawa et al. Multilingual Text–Speech Corpus of Mongolian
JPS6229796B2 (ja)
JPS58186836A (ja) 音声入力デ−タ処理装置
JPH01290032A (ja) 音声認識表示装置
JPH05119793A (ja) 音声認識方法及び装置
JPH0627985A (ja) 音声認識方法
JPH0573039B2 (ja)
JP2001324995A (ja) 音声認識方法
JPH0222730A (ja) 音声入力による文書作成装置
JPS62117060A (ja) 文字・音声入力変換方式
JP3430265B2 (ja) 日本語音声認識方法
JPS59218547A (ja) 音声認識を用いた漢字入力装置
JPS61139828A (ja) 言語入力装置
JPS63153596A (ja) 音声文章入力装置
JPS6024630A (ja) 制御情報付きカナ文字列形成方式