JPH02289026A - 音声ワードプロセッサ - Google Patents

音声ワードプロセッサ

Info

Publication number
JPH02289026A
JPH02289026A JP1068410A JP6841089A JPH02289026A JP H02289026 A JPH02289026 A JP H02289026A JP 1068410 A JP1068410 A JP 1068410A JP 6841089 A JP6841089 A JP 6841089A JP H02289026 A JPH02289026 A JP H02289026A
Authority
JP
Japan
Prior art keywords
voice
input
text
recognition
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1068410A
Other languages
English (en)
Inventor
Tatsuro Matsumoto
達郎 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1068410A priority Critical patent/JPH02289026A/ja
Publication of JPH02289026A publication Critical patent/JPH02289026A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 11語中位又は文節単位の発声によって文章入力を行な
い、入力文章の確認を行なうために入力された文章を音
声によって再生する機能を備えた音声ワードブOt?ツ
リに関し、 装d規模を大形化することなく、明瞭な音声出力で入力
文章の確認を確実に行ない得ることを目的とし、 入力音声を認識する音声認識部と、入力音声を情報圧縮
し、f8報圧縮された入力音声データを音声Wl;1部
での認識結果と対応付けて格納する音声格納部と、音声
認識部での認識結果を受取って文章として編集を行なう
文章編集部と、文章編集部で編集された文章を受取って
8声格納部から対応する音声データを取出して再生する
音声出力部と、前記各処理の制御を行なう制御部とにて
構成する。
(産業上の利用分野〕 本発明は、単語単位又は文節単位の発声によって文章入
力を行ない、入力文章の確認を11なうために入力され
た文章を音声によって再生する機能を備えた音声ワード
プロセッサに関する。
ワードプロセッサに文章を入力する場合にユーザがキー
ボードを操作して入力するのではなく、ユーザが文章を
読上げることにより、単語単位又は文節単位で8声認識
を行なって文章入力を行なう音声ワードプロセッサがあ
る。この場合、入力された文章が正しい文字で入力され
ているかを校正する場合、例えばユーザはCRTに表示
される文章と入力文章から作られる8声とを比較して入
力文章の誤りを見つけ出す必aがある。
〔従来の技術〕
第5図は従来の一例のブロック図を示す。同図において
、マイクロホン1から入力された音声は音声認識部2に
てAD変換されてディジタルデータとされ、更に、FF
Tヤケプストラム等の特徴量が抽出されてこれを用いて
音声認識が行なわれる。この場合、音声の人力単位とし
ては、現在の技術レベルからは単&節、ψ語、文面等の
aiil!l!発声が考えられる1、音声認識の技術と
しては、DP(ダイナミックプログラミング)マツチン
グや14MM等の技術が考えられ、上記の単位で発声さ
れた個々の音声を、単語辞衾を参照したり、言語処理を
用いたりして最終的にはlt1語又は文章として出力す
る。
音声認識部2からの出力は文章編集部3に供給され、例
えばキーボード4からの編集コマンド又は音声入力によ
る編集コマンドによって文章(単語列)の削除や移動等
の編集作業が行なわれる。
この編集操作はCRT5に表示される文章を見ながら行
なう。文集編集部3の出力は音声合成部6に供給され、
音声規則合成によって音声信号に変換され、スピーカ7
より出力される。音声規則合成は、予め記憶されている
音の最小単位(音節)の組合せで文章から8声に変換す
る。この名声合成部6は、一般には音声認識部22文章
編集部3とは独立しており、音声再生による入力文章確
認を必要とする場合、一般のワードプロセッサに補助的
な装置として取付けられる。
上述のような各部の制御は制御部8にて行なわれる。即
ち、−JI11部8は、音声入力を受付ける指示を音声
認識部2に与えたり、文章編集のための各種コマンドを
文章編集部3に送ったり、音声合成の開始や終了の指示
を音声合成部6に送ったりする。
〔発明が解決しようとする課題〕
従来のものは、B声再生による入力文章確認を必aとす
る場合、音声合成部6を特別に取付ける必要があるため
、装置規模が大形化し、コスト高になる問題点があった
。又、現在の音声合成技術にはある程度限度があり、出
力される合成音声は不明瞭で、聞きとりにくい場合もあ
り、入力文章の確認がしにくい問題点があった。又、一
般に音声認識部2における音声W&識は完全とはいえな
いので、ユーザの発声した語句と異なる語句が文章入力
されることがある。この場合、音声認識後の文章編集i
3から音声合成をしているので、CRT5に表示されて
いる文章(実際には音声認識誤りによって入力されてい
る文章)とスピーカ8からの発音されている文章とを比
較していても文章入力誤りを確認できない問題点があっ
た。
本発明は、装置規模を人形化することなく、明瞭な音声
出力で入力文章の確認を確実に行ない得る音声のワード
プロセッサを提供することを目的とする。
(2題を解決するための手段) 第1図は本発明の原理ブロック図を示す。同図中、20
は音声認i11部で、入力音声を認識する。
21はa声格納部で、入力音声を情報圧縮し、情報圧縮
された入力音声データを音声認識部20での認識結果と
対応付けて格納する。、22は文章編集部で、音声認I
t部20での認識結果を受取って文章として編集を行な
う。23は音声出力部で、文章編集部22で編集された
文章を受取って音声格納部21から対応する音声データ
を取出して再生する。24はυIt[1部で、g再認識
部20.音声格納部212文章編集部22.音声出力部
23での各処理の制御を(1なう。
〔作用〕
音声格納部20において、入力音声を情報圧縮してこの
8声データを音声認識部20での認識結果と対応付けて
格納する。音声出力部23では文章編集部22で編集さ
れた文章を受取り、音声格納8B21から対応する音声
データを取出して再生を行なう。この場合、自ら発声し
た音声を再生するので音声合成部を用いるよりも明瞭な
音声で入力文章の確認ができ、又、8再認識部20で音
声量;II誤りがあって入力された文章を自ら発声した
音声と比較することによって文章入力誤りを確実に発見
できる。又、音声合成部のような特別の装置を用いる必
要はなく、小形化できる。
〔実施例〕
第2図は本発明の一実施例のブロック図を示し、同図中
、第5図と同一構成部分には同一番号を付す。第2図中
、10は音声格納部で、入力音声情報を圧縮し、音声認
識部2の結果と対応付けて格納しておく。11は音声出
力部で、文章編集部3からの内容を受取ってその内容と
対応する音声格納部10に格納されたデータを取出して
音声を再生する。12は制御部で、各部の制御を行なう
もので、音声入力を受付ける指示を音声認識部2に与え
たり、文e1igsのための各種コマンドを文章編集部
3に対して送ったり、音声出力の開始や終了の指示を音
声出力部11に送ったりする。
次に、本発明の動作について説明する1゜第2図におい
て、マイクロホン1から入力された音声は音声認識部2
のAD変!III器21でAD変換され、8再認識回路
22で前述のような周知の技術を用いて音声認識が行な
われる。、AD変換器21からの音声データは、原波形
のままではデータ量が多いので、音声格納部10の波形
符号化回路10+に供給されてここで従来周知のADP
CMやPARCOR,LPG等の情報圧縮技術によって
情報圧縮が行なわれる。又は、AD変!Ik器2Iの出
力の代りに音声認識回路22で用いられた特徴量を情報
圧縮してもよい。波形符号化回路101で情報圧縮され
た音声データは波形メモリ102に供給され、音声認識
回路22の認識結果と対応付けて格納される。
音声認識部2で音声認識された文章は文章編集部3の文
章メモリ31に格納され、更に文章編集回路32におい
てt−ボード4からの編集コマンドによって削除や移動
等の編集操作が加えられる。
この場合、文章メモリ3Iには文章編集前には、入力さ
れた順番で波形メモリ102のポインタが格納される。
即ち、例えば第3図に示す如く、文章メモリ31の7ド
レス(1)には、単語■とそれに対応する音声波形■′
が格納されている波形メモリ102を指すポインタ(波
形メモリ102のアドレス)が格納される。一方、文章
編集時には、文章メモリ31に格納されているポインタ
だけの移動が行われる。即ち、例えば、第4図に示す如
く、文章メモリ3I中の単語■と単語■とが入れ換えら
れた場合は、文章メモリ3I中のアドレス(2)の内容
とアドレス(3)の内容とが交換され、アドレス(2)
は単語■とそれに対応する音声波形■′を、アドレス(
3)は単語■とそれに対応する音声波形■′とを指すよ
うになる。
編集作業の途中或いは終了した文章の確認を音声で行な
う場合、文章メモリ31の内容は音声出力部11の音声
出力回路11+に供給され、文章メモリ3■の内容と対
応する波形メモリ102内の音声データが取出されて波
形復号化回路112に供給されてここで情報伸張が行な
われ、音声出力回路111に供給されて音声ディジタル
信号とされる。音声出力回路11+の出力はDA’6換
器113にてDA変換されてアナログ信号とされ、スピ
ーカ7によって発aされる。この場合、文章編集部3の
出力を用いて音声合成するのではなく、自ら発声したき
声を出力するため、従来のように音声合成部を用いるよ
りも明瞭な音声で入力文章の確認ができ、しかも、音声
認識部2で音声認識に誤りがあって誤った文章が入力さ
れてしまった場合でも自ら発声した音声と比較するので
文章入力誤り(a声認a誤り)を確実に発見できる。
【図面の簡単な説明】
第1図は本発明の原理ブロック図、 第2図は本発明の一実施例のブロック図、第3図は音声
入力終了時の文章と音声波形との関係を示す図、 第4図は文章編集終了時の文章と音声波形との関係を示
す図、 第5図は従来の一例のブロック図である。 図において、 1はマイクロホン、 2.20は音声認識部、 2IはAD変換器、 22は音声認識回路、 3.22は文章編集部、 3Iは文章メモリ、 32は文章編集回路、 4はキーボード、 5はCRT、 7はスピーカ、 10.21は音声格納部、 101は波形符号化回路、 102は波形メモリ、 11.23は8再出力部、 111は音声出力θ路、 112は波形符号化回路、 113はDA変換器、 12.24はυ制御部 を示す。

Claims (1)

  1. 【特許請求の範囲】 単語単位又は文節単位の発声によって文章入力を行なう
    音声ワードプロセッサにおいて、 入力音声を認識する音声認識部(20)と、該入力音声
    を情報圧縮し、該情報圧縮された入力音声データを上記
    音声認識部(20)での認識結果と対応付けて格納する
    音声格納部(21)と、上記音声認識部(20)での認
    識結果を受取って文章として編集を行なう文章編集部(
    22)と、該文章編集部(22)で編集された文章を受
    取って上記音声格納部(21)から対応する音声データ
    を取出して再生する音声出力部(23)と、上記音声認
    識部(20)、音声格納部(21)、文章編集部(22
    )、音声出力部(23)での各処理の制御を行なう制御
    部(24)とから成ることを特徴とする音声ワードプロ
    セッサ。
JP1068410A 1989-03-20 1989-03-20 音声ワードプロセッサ Pending JPH02289026A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1068410A JPH02289026A (ja) 1989-03-20 1989-03-20 音声ワードプロセッサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1068410A JPH02289026A (ja) 1989-03-20 1989-03-20 音声ワードプロセッサ

Publications (1)

Publication Number Publication Date
JPH02289026A true JPH02289026A (ja) 1990-11-29

Family

ID=13372878

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1068410A Pending JPH02289026A (ja) 1989-03-20 1989-03-20 音声ワードプロセッサ

Country Status (1)

Country Link
JP (1) JPH02289026A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148179A (ja) * 1998-11-12 2000-05-26 Internatl Business Mach Corp <Ibm> サブ語彙を指定する方法及びプログラム記憶装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59180643A (ja) * 1983-03-31 1984-10-13 Fujitsu Ltd フアイル編集方式
JPS62113264A (ja) * 1985-11-12 1987-05-25 Toshiba Corp 音声文書作成装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59180643A (ja) * 1983-03-31 1984-10-13 Fujitsu Ltd フアイル編集方式
JPS62113264A (ja) * 1985-11-12 1987-05-25 Toshiba Corp 音声文書作成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148179A (ja) * 1998-11-12 2000-05-26 Internatl Business Mach Corp <Ibm> サブ語彙を指定する方法及びプログラム記憶装置

Similar Documents

Publication Publication Date Title
EP0140777B1 (en) Process for encoding speech and an apparatus for carrying out the process
JP2007133033A (ja) 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム
JP4714694B2 (ja) 音声−テキストトランスクリプションシステムの誤り検出
US6148285A (en) Allophonic text-to-speech generator
JPH11175082A (ja) 音声対話装置及び音声対話用音声合成方法
JP3936351B2 (ja) 音声応答サービス装置
JPH02289026A (ja) 音声ワードプロセッサ
JPH08335096A (ja) テキスト音声合成装置
JP3277579B2 (ja) 音声認識方法および装置
JPH07200554A (ja) 文章読み上げ装置
JPS6184771A (ja) 音声入力装置
JP3034554B2 (ja) 日本語文章読上げ装置及び方法
JPS6057898A (ja) 音声登録方式
JP2005157166A (ja) 音声認識装置、音声認識方法及びプログラム
JPS613241A (ja) 音声確認方式
JPS6315294A (ja) 音声分析装置
JPS5854400A (ja) 音声出力編集方式
JPS62119591A (ja) 文章読上げ装置
JP2001350490A (ja) テキスト音声変換装置及び方法
JPS60244989A (ja) 発音訓練機
JPH07210193A (ja) 音声対話装置
JPH054676B2 (ja)
JP2001134276A (ja) 音声文字化誤り検出装置および記録媒体
JPH0997093A (ja) 合成音のアクセント変更方法および旅客案内用自動放送装置
JPH08110790A (ja) 音声認識装置