JPH0554960B2 - - Google Patents

Info

Publication number
JPH0554960B2
JPH0554960B2 JP59206238A JP20623884A JPH0554960B2 JP H0554960 B2 JPH0554960 B2 JP H0554960B2 JP 59206238 A JP59206238 A JP 59206238A JP 20623884 A JP20623884 A JP 20623884A JP H0554960 B2 JPH0554960 B2 JP H0554960B2
Authority
JP
Japan
Prior art keywords
voice
input
input device
correction
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP59206238A
Other languages
English (en)
Other versions
JPS6184771A (ja
Inventor
Hiroshi Ichikawa
Yoshiaki Asakawa
Yoshinori Kitahara
Nobuo Hataoka
Shoichi Takeda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59206238A priority Critical patent/JPS6184771A/ja
Publication of JPS6184771A publication Critical patent/JPS6184771A/ja
Publication of JPH0554960B2 publication Critical patent/JPH0554960B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は音声入力装置に係り、特に音声タイプ
ライターにおける入力結果の認識方法に関する。
〔発明の背景〕
音声入力装置、特に入力音声を文字列に変換す
る、いわゆる音声タイプライタにおいては、入力
した音声が正しく文字列に変換されているかどう
かを確認することが重要である。従来の装置は、
たとえば実公昭44−5526号記載のように、音節を
入力毎に確認したり、特開昭54−136134号記載の
ように、入力音声と文字を再生と表示を時間的に
対応付けて読合せたり、変換された文字から規制
合成により音声を合成し、入力音声と交互に再生
し、つき合せたり、入力音声を文字字種指定入力
情報によりエコー等音声を変えて出力するなど勝
れた工夫がなされている。
仮名漢字変換や同音異字の文字列への変換を行
なうようなシステムでは、同音異字の変換があ
り、変換後の文字列から音声を規則合成で出力す
るよりも、入力の音声と変換後の文字列を照合し
た方が合理的である。しかしながら、たとえばテ
ープレコーダによる自分の声の再生音を聞くこと
は相当数の人が好まない。したがつて、音色の個
人的特徴を変形した音声で再生することが望まし
い。
また、読み合せ確認は、対象文章の完成度によ
り、最適な形態が異なるが、これらに対処できる
柔軟な構成を有する入力システムは実現されてな
い。
入力に際しても、入力しながら確認して行くと
思考が中断されるという問題が生じる。
〔発明の目的〕
本発明の目的は、以上の問題を解決し、その時
時の要求にそつた柔軟で使いやすい音声入力シス
テムに好適な入力結果確認手段を提供することに
ある。
〔発明の概要〕
上記目的を達成するために、本発明では、先ず
入力音声を音声の形式で再生可能な形態でまとめ
て記録する手段を設ける。この記録手段には、入
力と同時に外部より入力される信号、または認識
時または認識後の仮定漢字変換用日本語処理時に
自動的に判定・出力される単語又は文節の境界を
示す信号を音声と対応付けて記録する手段を持た
せる。さらに入力された音声は、外部から指定さ
れるモードに従い、入力しながら、又は入力後使
用者からの指定に従い、まとめて認識を行ない、
認識した結果を仮名・漢字変換等を行なつた後、
変換した結果に単語又は文節の境界を示す記号を
付して記録する手段を持たせる。
読合せ確認時に、入力音声を再生する際には、
使用者が外部から指示する指令に従い、音色を変
えて音声を再生しうる手段と、指定に従い、再生
の速度を変更しうる手段と、指令に従がい、単語
又は文節毎に再生するか、入力全体を別途指令の
ある時点まで連続的に再生する制御手段と、再生
中の単語又は文節に対応する文字又は文字列の位
置が一見してわかる表示補助手段(カーソルやブ
リンキング、色の変更等)等を持たせる。
これらの手段の有する機能を任意に組み合せて
実行するモードを設定し、使用者が自由にこれら
モードを選択できるよう構成することにより、そ
の時々の使用者の要求に合致した使いやすい状態
で入力結果確認を行なうことが可能となる。
〔発明の実施例〕
以下、本発明の一実施例を第1図により説明す
る。
入力音声1はA/D変換2によりデジタル信号
変換され、分析部3で分析後入力音声記録部4に
記録される。分析方法は認識部の認識方式と整合
の取れた方式であれば良い。また、読合せの合成
にも用いるため、合成にも適した方式が良いが両
者用に別々に処理を行なつてももちろん良い。両
者は同一の方が能率上望ましいが、多くの場合、
合成音の音源に関する分析は認識には用いないの
で、合成用にみに行なうことが必要になる。認識
部5は制御部6の認識指令信号7により入力音声
を要求8し、分析された入力音声を認識し、認識
結果を認識結果記録部9に書き込む。認識部5の
構成は多くの公知技術が知られており、どの方式
を採用してもその内容は本発明と本質的にかかわ
りないため、その説明は省略する。仮名−漢字変
換処理部10は制御部6からの仮名漢字変換処理
指令信号11により、認識結果要求信号12を出
し、認識結果を取り込み、形態素解析等の処理に
より単語又は文節境界を求めながら入力を漢字混
り文に変換し、その出力を仮名−漢字変換出力記
録部13に書き込むとともに、求められた単語あ
るいは文節等の境界の位置の記号14を入力音声
記録部4と仮名漢字変換出力記録部13の対応す
る所定の場所に記録して行く。仮名文字列から漢
字に変換する技術についても公知の技術を用いれ
ば良いので、ここでは説明は省略する。なお、単
語や文節の境界は音声入力時に、発声者により別
途スイツチ等で入力に同期させて入力しても、も
ちろんかまわない。
なお、音声を入力し、認識し、仮名−漢字等に
変換する各処理は、パイプライン的に並行して実
行しても、各部分毎にバツチ的に行なつても良
く、これらのモードの選択は使用者からの指令に
より制御部6からの各指令及び11の出力タイミ
ングを制御することにより容易に変えることがで
きることは明らかである。
次に読み合せ時の説明で行なう。制御部6から
の指令で、音声合成部6及び文字表示部19は各
各入力音声記録部4と仮名−漢字変換出力記録部
13に一単語又は1文節分の音声合成用及び文字
表示用データを要求し、音声を合成、D/A変換
し読合せ用音声として出力及び漢字−仮名等混合
文として表示する。この際制御部6は利用者から
の指令により、合成音声の音色を変えるために、
合成パラメータを修飾する修飾信号生成部16に
より、パラメータを変換する係数を出力する。た
とえば、音声合成部が当業者には良く知られてい
るLSP合成器の場合、各LSPパラメータに一定の
値を掛け、合成音声のホルマント位置を移動させ
たり、ピツチ周波数に一定値を掛け、声の高さを
変えたり、分析間隔とは異なつた間隔で合成パラ
メータを合成部に供給するよう制御することによ
り、音声や合成音の発声速度を変換すること可能
である。利用者は確認/修正情報21がキー入力
部22より入力する。確認情報が入力されると制
御部6は次の単語または文節の出力を行なう。修
正情報の場合は、仮名−漢字出力記録部13の対
応する部分の情報を修正し、次に進む。単語また
は文節境界の修正の場合は、入力音声記録部4の
対応する境界記号の位置も併せて修正し、読合せ
と文字表示の対応にずれが生じないようにする。
なお、利用者からの指示により、誤り修正の入
力21が入力されるまで、単語または文節境界に
かかわらず、連続的に音声の再生と文字の再生を
行ない、修正入力21があると、入力のあつた時
点での単語又は文節の終りで出力を停止し、修正
処理後再開するモード等の設定も容易に実現でき
る。また、文字の表示の方は文章や段落等の単位
で先に表示し、読合せ音声の出力に対応する単語
又は文節の位置をカーソルやブリレキング、カラ
ー表示等で示すように構成することも可能であ
る。漢字は同音異字が多く、このように文章全体
の中で表示する方が誤り発見は容易である。
なお、以上の実施例は日本語について説明した
が、発音が同じでツヅリの異なる言語等において
も同等に構成できることは言うまでもない。
〔発明の効果〕
以上説明したごとく、本発明によれば、同音異
字を含む文章を音声で入力する場合に、極めて容
易に入力音声と文章を対応して確認、修正するこ
とができる。
【図面の簡単な説明】
第1図は本発明の一実施例を説明するためのブ
ロツク図である。 1……入力音声、2……アナログ−デイジタル
変換器(A/D)、3……分析部、4……入力音
声記録部、5……認識部、6……制御部、7……
認識指令信号、8……入力音声要求信号、9……
認識結果記録部、10……仮名−漢字変換処理
部、11……仮名−漢字変換処理指令信号、12
……認識結果要求信号、13……仮名−漢字変換
出力記録部、14……単語/文節境界情報、15
……音声合成部、16……修飾信号生成部、17
……デイジタル−アナログ変換部(D/A)、1
8……読合せ出力音声、19……表示部、20…
…表示、21……確認/修正入力、22……キー
入力部。

Claims (1)

  1. 【特許請求の範囲】 1 入力された音声を記録する手段と、入力され
    た音声を認識する手段と、認識された結果を文字
    等に変換する手段と、文字等に変換された文字列
    を単語又は文節又はそれ以上の長い単体で表示す
    る文字表示手段と、前記文字表示手段による表示
    内容の確認及び訂正情報の入力する手段と、前記
    入力音声記録手段中の音声を単語又は文節単位毎
    に区切つて再生出力する手段とをそなえたことを
    特徴とする音声入力装置。 2 前記音声再生手段が入力音声とは異なつた音
    色の再生音となるような音色修飾手段を備えるこ
    とを特徴とする前記特許請求の範囲第1項記載の
    音声入力装置。 3 前記音声再生手段は前記確認及び訂正情報入
    力手段からの情報入力毎に単語又は文節の単位で
    順次出力するよう制御され、前記文字表示手段は
    前記音声再生手段から出力されている音声と対応
    する文字の位置が明らかにわかるような表示補助
    手段を有することを特徴とする前記特許請求の範
    囲第1項記載の音声入力装置。 4 前記音声再生手段が入力音声とは異なつた発
    声速度の再生音となるような速度変更手段を有す
    ることを特徴とする特許請求の範囲第1項記載の
    音声入力装置。 5 前記入力音声記録手段は十分な容量を有し、
    前記文字等変換手段の出力を記録しておく十分な
    容量を持つ記憶手段を有し、音声を入力する時点
    と認識動作を行なう時点及び認識修正する時点を
    切り離して別個に処理可能な形態を特徴とする前
    記特許請求の範囲第1項記載の音声入力装置。 6 前記確認及び訂正手段が、通常は確認情報が
    入力された状態となつており、訂正の必要な場合
    にのみ、要訂正情報入力を入力できるごときモー
    ドを併せ有することを特徴とする前記特許請求の
    範囲第1項記載の音声入力装置。
JP59206238A 1984-10-03 1984-10-03 音声入力装置 Granted JPS6184771A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59206238A JPS6184771A (ja) 1984-10-03 1984-10-03 音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59206238A JPS6184771A (ja) 1984-10-03 1984-10-03 音声入力装置

Publications (2)

Publication Number Publication Date
JPS6184771A JPS6184771A (ja) 1986-04-30
JPH0554960B2 true JPH0554960B2 (ja) 1993-08-13

Family

ID=16520030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59206238A Granted JPS6184771A (ja) 1984-10-03 1984-10-03 音声入力装置

Country Status (1)

Country Link
JP (1) JPS6184771A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6358283U (ja) * 1986-10-04 1988-04-18
EP1169678B1 (en) * 1999-12-20 2015-01-21 Nuance Communications Austria GmbH Audio playback for text edition in a speech recognition system
ATE286294T1 (de) 2001-03-29 2005-01-15 Koninkl Philips Electronics Nv Synchronisierung eines audio- und eines textcursors während der editierung
CN1215458C (zh) * 2001-03-29 2005-08-17 皇家菲利浦电子有限公司 在同步回放的过程中文本编辑所识别的语音
JP2004037998A (ja) 2002-07-05 2004-02-05 Denso Corp 音声制御装置
CN106251869B (zh) 2016-09-22 2020-07-24 浙江吉利控股集团有限公司 语音处理方法及装置

Also Published As

Publication number Publication date
JPS6184771A (ja) 1986-04-30

Similar Documents

Publication Publication Date Title
JP3142803B2 (ja) テキストを音声に変換するシンセサイザ
JP2007133033A (ja) 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム
JPH0554960B2 (ja)
JP2000250401A (ja) 言語学習方法、言語学習装置およびプログラムを記録した媒体
JP2580565B2 (ja) 音声情報辞書作成装置
JP3060276B2 (ja) 音声合成装置
JPH07160289A (ja) 音声認識方法及び装置
JPH0130167B2 (ja)
JPH0527787A (ja) 音楽再生装置
JPS5991497A (ja) 音声合成出力装置
JPH02251998A (ja) 音声合成装置
JP2000099308A (ja) 電子ブックプレーヤ
JP2570214B2 (ja) 演奏情報入力装置
JP2547612B2 (ja) 文章作成システム
JP2609874B2 (ja) 音声認識システム
JP2647873B2 (ja) 文章作成システム
JP2647872B2 (ja) 文章作成システム
JPH113096A (ja) 音声合成方法及び音声合成システム
JPH01161296A (ja) 音声認識システム
JPS6325762A (ja) 音声出力ワ−ドプロセツサ
JP2777366B2 (ja) 音声認識システム
JP2007225999A (ja) 電子辞書
JPS63316899A (ja) 音声認識システム
JPS6083135A (ja) プログラム読上方式
JPH09185393A (ja) 音声合成方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees