JPH02289026A

JPH02289026A - 音声ワードプロセッサ

Info

Publication number: JPH02289026A
Application number: JP1068410A
Authority: JP
Inventors: Tatsuro Matsumoto; 達郎松本
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1989-03-20
Filing date: 1989-03-20
Publication date: 1990-11-29

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔概要〕１１語中位又は文節単位の発声によって文章入力を行な
い、入力文章の確認を行なうために入力された文章を音
声によって再生する機能を備えた音声ワードブＯｔ？ツ
リに関し、装ｄ規模を大形化することなく、明瞭な音声出力で入力
文章の確認を確実に行ない得ることを目的とし、入力音声を認識する音声認識部と、入力音声を情報圧縮
し、ｆ８報圧縮された入力音声データを音声Ｗｌ；１部
での認識結果と対応付けて格納する音声格納部と、音声
認識部での認識結果を受取って文章として編集を行なう
文章編集部と、文章編集部で編集された文章を受取って
８声格納部から対応する音声データを取出して再生する
音声出力部と、前記各処理の制御を行なう制御部とにて
構成する。

（産業上の利用分野〕本発明は、単語単位又は文節単位の発声によって文章入
力を行ない、入力文章の確認を１１なうために入力され
た文章を音声によって再生する機能を備えた音声ワード
プロセッサに関する。

ワードプロセッサに文章を入力する場合にユーザがキー
ボードを操作して入力するのではなく、ユーザが文章を
読上げることにより、単語単位又は文節単位で８声認識
を行なって文章入力を行なう音声ワードプロセッサがあ
る。この場合、入力された文章が正しい文字で入力され
ているかを校正する場合、例えばユーザはＣＲＴに表示
される文章と入力文章から作られる８声とを比較して入
力文章の誤りを見つけ出す必ａがある。

〔従来の技術〕

第５図は従来の一例のブロック図を示す。同図において
、マイクロホン１から入力された音声は音声認識部２に
てＡＤ変換されてディジタルデータとされ、更に、ＦＦ
Ｔヤケプストラム等の特徴量が抽出されてこれを用いて
音声認識が行なわれる。この場合、音声の人力単位とし
ては、現在の技術レベルからは単＆節、ψ語、文面等の
ａｉｉｌ！ｌ！発声が考えられる１、音声認識の技術と
しては、ＤＰ（ダイナミックプログラミング）マツチン
グや１４ＭＭ等の技術が考えられ、上記の単位で発声さ
れた個々の音声を、単語辞衾を参照したり、言語処理を
用いたりして最終的にはｌｔ１語又は文章として出力す
る。

音声認識部２からの出力は文章編集部３に供給され、例
えばキーボード４からの編集コマンド又は音声入力によ
る編集コマンドによって文章（単語列）の削除や移動等
の編集作業が行なわれる。

この編集操作はＣＲＴ５に表示される文章を見ながら行
なう。文集編集部３の出力は音声合成部６に供給され、
音声規則合成によって音声信号に変換され、スピーカ７
より出力される。音声規則合成は、予め記憶されている
音の最小単位（音節）の組合せで文章から８声に変換す
る。この名声合成部６は、一般には音声認識部２２文章
編集部３とは独立しており、音声再生による入力文章確
認を必要とする場合、一般のワードプロセッサに補助的
な装置として取付けられる。

上述のような各部の制御は制御部８にて行なわれる。即
ち、−ＪＩ１１部８は、音声入力を受付ける指示を音声
認識部２に与えたり、文章編集のための各種コマンドを
文章編集部３に送ったり、音声合成の開始や終了の指示
を音声合成部６に送ったりする。

〔発明が解決しようとする課題〕

従来のものは、Ｂ声再生による入力文章確認を必ａとす
る場合、音声合成部６を特別に取付ける必要があるため
、装置規模が大形化し、コスト高になる問題点があった
。又、現在の音声合成技術にはある程度限度があり、出
力される合成音声は不明瞭で、聞きとりにくい場合もあ
り、入力文章の確認がしにくい問題点があった。又、一
般に音声認識部２における音声Ｗ＆識は完全とはいえな
いので、ユーザの発声した語句と異なる語句が文章入力
されることがある。この場合、音声認識後の文章編集ｉ
３から音声合成をしているので、ＣＲＴ５に表示されて
いる文章（実際には音声認識誤りによって入力されてい
る文章）とスピーカ８からの発音されている文章とを比
較していても文章入力誤りを確認できない問題点があっ
た。

本発明は、装置規模を人形化することなく、明瞭な音声
出力で入力文章の確認を確実に行ない得る音声のワード
プロセッサを提供することを目的とする。

（２題を解決するための手段）第１図は本発明の原理ブロック図を示す。同図中、２０
は音声認ｉ１１部で、入力音声を認識する。

２１はａ声格納部で、入力音声を情報圧縮し、情報圧縮
された入力音声データを音声認識部２０での認識結果と
対応付けて格納する。、２２は文章編集部で、音声認Ｉ
ｔ部２０での認識結果を受取って文章として編集を行な
う。２３は音声出力部で、文章編集部２２で編集された
文章を受取って音声格納部２１から対応する音声データ
を取出して再生する。２４はυＩｔ［１部で、ｇ再認識
部２０．音声格納部２１２文章編集部２２．音声出力部
２３での各処理の制御を（１なう。

〔作用〕

音声格納部２０において、入力音声を情報圧縮してこの
８声データを音声認識部２０での認識結果と対応付けて
格納する。音声出力部２３では文章編集部２２で編集さ
れた文章を受取り、音声格納８Ｂ２１から対応する音声
データを取出して再生を行なう。この場合、自ら発声し
た音声を再生するので音声合成部を用いるよりも明瞭な
音声で入力文章の確認ができ、又、８再認識部２０で音
声量；ＩＩ誤りがあって入力された文章を自ら発声した
音声と比較することによって文章入力誤りを確実に発見
できる。又、音声合成部のような特別の装置を用いる必
要はなく、小形化できる。

〔実施例〕

第２図は本発明の一実施例のブロック図を示し、同図中
、第５図と同一構成部分には同一番号を付す。第２図中
、１０は音声格納部で、入力音声情報を圧縮し、音声認
識部２の結果と対応付けて格納しておく。１１は音声出
力部で、文章編集部３からの内容を受取ってその内容と
対応する音声格納部１０に格納されたデータを取出して
音声を再生する。１２は制御部で、各部の制御を行なう
もので、音声入力を受付ける指示を音声認識部２に与え
たり、文ｅ１ｉｇｓのための各種コマンドを文章編集部
３に対して送ったり、音声出力の開始や終了の指示を音
声出力部１１に送ったりする。

次に、本発明の動作について説明する１゜第２図におい
て、マイクロホン１から入力された音声は音声認識部２
のＡＤ変！ＩＩＩ器２１でＡＤ変換され、８再認識回路
２２で前述のような周知の技術を用いて音声認識が行な
われる。、ＡＤ変換器２１からの音声データは、原波形
のままではデータ量が多いので、音声格納部１０の波形
符号化回路１０＋に供給されてここで従来周知のＡＤＰ
ＣＭやＰＡＲＣＯＲ，ＬＰＧ等の情報圧縮技術によって
情報圧縮が行なわれる。又は、ＡＤ変！Ｉｋ器２Ｉの出
力の代りに音声認識回路２２で用いられた特徴量を情報
圧縮してもよい。波形符号化回路１０１で情報圧縮され
た音声データは波形メモリ１０２に供給され、音声認識
回路２２の認識結果と対応付けて格納される。

音声認識部２で音声認識された文章は文章編集部３の文
章メモリ３１に格納され、更に文章編集回路３２におい
てｔ−ボード４からの編集コマンドによって削除や移動
等の編集操作が加えられる。

この場合、文章メモリ３Ｉには文章編集前には、入力さ
れた順番で波形メモリ１０２のポインタが格納される。

即ち、例えば第３図に示す如く、文章メモリ３１の７ド
レス（１）には、単語■とそれに対応する音声波形■′
が格納されている波形メモリ１０２を指すポインタ（波
形メモリ１０２のアドレス）が格納される。一方、文章
編集時には、文章メモリ３１に格納されているポインタ
だけの移動が行われる。即ち、例えば、第４図に示す如
く、文章メモリ３Ｉ中の単語■と単語■とが入れ換えら
れた場合は、文章メモリ３Ｉ中のアドレス（２）の内容
とアドレス（３）の内容とが交換され、アドレス（２）
は単語■とそれに対応する音声波形■′を、アドレス（
３）は単語■とそれに対応する音声波形■′とを指すよ
うになる。

編集作業の途中或いは終了した文章の確認を音声で行な
う場合、文章メモリ３１の内容は音声出力部１１の音声
出力回路１１＋に供給され、文章メモリ３■の内容と対
応する波形メモリ１０２内の音声データが取出されて波
形復号化回路１１２に供給されてここで情報伸張が行な
われ、音声出力回路１１１に供給されて音声ディジタル
信号とされる。音声出力回路１１＋の出力はＤＡ’６換
器１１３にてＤＡ変換されてアナログ信号とされ、スピ
ーカ７によって発ａされる。この場合、文章編集部３の
出力を用いて音声合成するのではなく、自ら発声したき
声を出力するため、従来のように音声合成部を用いるよ
りも明瞭な音声で入力文章の確認ができ、しかも、音声
認識部２で音声認識に誤りがあって誤った文章が入力さ
れてしまった場合でも自ら発声した音声と比較するので
文章入力誤り（ａ声認ａ誤り）を確実に発見できる。

【図面の簡単な説明】

第１図は本発明の原理ブロック図、第２図は本発明の一実施例のブロック図、第３図は音声
入力終了時の文章と音声波形との関係を示す図、第４図は文章編集終了時の文章と音声波形との関係を示
す図、第５図は従来の一例のブロック図である。図において、１はマイクロホン、２．２０は音声認識部、２ＩはＡＤ変換器、２２は音声認識回路、３．２２は文章編集部、３Ｉは文章メモリ、３２は文章編集回路、４はキーボード、５はＣＲＴ、７はスピーカ、１０．２１は音声格納部、１０１は波形符号化回路、１０２は波形メモリ、１１．２３は８再出力部、１１１は音声出力θ路、１１２は波形符号化回路、１１３はＤＡ変換器、１２．２４はυ制御部を示す。

Claims

【特許請求の範囲】単語単位又は文節単位の発声によって文章入力を行なう
音声ワードプロセッサにおいて、入力音声を認識する音声認識部（２０）と、該入力音声
を情報圧縮し、該情報圧縮された入力音声データを上記
音声認識部（２０）での認識結果と対応付けて格納する
音声格納部（２１）と、上記音声認識部（２０）での認
識結果を受取って文章として編集を行なう文章編集部（
２２）と、該文章編集部（２２）で編集された文章を受
取って上記音声格納部（２１）から対応する音声データ
を取出して再生する音声出力部（２３）と、上記音声認
識部（２０）、音声格納部（２１）、文章編集部（２２
）、音声出力部（２３）での各処理の制御を行なう制御
部（２４）とから成ることを特徴とする音声ワードプロ
セッサ。