JP3263392B2 - テキスト処理装置 - Google Patents

テキスト処理装置

Info

Publication number
JP3263392B2
JP3263392B2 JP27619189A JP27619189A JP3263392B2 JP 3263392 B2 JP3263392 B2 JP 3263392B2 JP 27619189 A JP27619189 A JP 27619189A JP 27619189 A JP27619189 A JP 27619189A JP 3263392 B2 JP3263392 B2 JP 3263392B2
Authority
JP
Japan
Prior art keywords
speech
word
recognition device
detected
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP27619189A
Other languages
English (en)
Other versions
JPH02163819A (ja
Inventor
ヘーラーバウアー ヴェルナー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JPH02163819A publication Critical patent/JPH02163819A/ja
Application granted granted Critical
Publication of JP3263392B2 publication Critical patent/JP3263392B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Communication Control (AREA)
  • Feed For Specific Animals (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Devices For Executing Special Programs (AREA)
  • Saccharide Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は、テキストに対応する音声信号を音声認識装
置に供給し、この音声認識装置で音声信号中の言語すな
わちワードを検出し、検出したワードをデジタル信号の
形態でワードメモリに記憶すると共に、このワードメモ
リから別の処理手段に供給し、この処理手段において検
出したワードを表示装置によってテキストとして再生
し、必要に応じて訂正し、プリンタによって記録するこ
とができるテキスト処理装置に関するものである。
【0002】
【従来の技術】
このような型式のテキスト処理装置は米国特許第3,77
0,892号に記載されている。しかしこの公報には、音声
認識装置によって正しく認識されなかった言語すなわち
ワードをいかにして訂正するか開示されていない。
【0003】
【発明が解決しようとする課題】
この型式の従来のテキスト処理装置においてはワード
検出におけるエラーが比較的頻繁に発生していたので、
誤り訂正やテストを行なうことが極めて重要である。 従って、本発明の目的は、冒頭部で述べた型式のテキ
スト処理装置において、検出した言語をチェックでき、
誤って検出したワードを簡単に、短時間でしかも高い信
頼性を以て訂正することができるテキスト処理装置を提
供することにある。
【0004】
【課題を解決するための手段】
本発明によれば上記目的は、前記音声信号を第1のメ
モリに記憶し、キーボードと協働するコンピュータの制
御のもとで前記音声認識装置によって検出した言語にス
タートマーク及びエンドマークを割り当て、これらマー
クが第1メモリに記憶されている音声信号と時間的に関
連し、前記スタートマーク及びエンドマークを第2のメ
モリに記憶し、第2メモリに記憶されている検出したワ
ードのスタートマーク及びエンドマークにより前記コン
ピュータが、検出した言語に対応し第1メモリに記憶さ
れている音声信号と相関をとることができ、コンピュー
タの制御のもとで検出したワードを表示装置上に強調表
示できると共に同時に関連するオーディオ信号を音響的
に再生することができ、前記キーボードによってデータ
を前記コンピュータに入力でき、コンピュータによっ
て、必要な場合表示装置上に表示された検出した言語を
訂正できるように構成することにより達成される。テキ
ストに対応する音声信号が付加的に記憶されると共に、
これらの音声信号と相関し音声認識装置によって検出し
たテキストのワードと時間的に関連するスタートマーク
及びエンドマークも記憶されるので、各検出した言語に
関連する音声信号を割り当て、或は音声信号の各部分に
対応する検出言語を簡単に割り当てることができる。従
って、操作者は、例えばチェック又は訂正すべき言語と
関連しコンピュータによって表示装置上に強調表示され
たオリジナルの音声信号を音響的に監視することがで
る。この結果、操作者は関連する言語を正しく識別する
ことができ、必要な場合これらの言語をキーボードを介
して正しい形態で入力することができる。或は、表示装
置によって表示されたテキストの検出言語を連続してチ
ェックすることができ、すなわち第1のメモリに記憶さ
れている音声信号を連続して音響的に再生し、関連する
検出された言語をコンピュータによって表示装置上に同
時に強調表示することができ、この結果瞬時的に検出し
た言語は連続して強調表示され操作者はオリジナルの音
声信号を同時に聴取し、従って操作者は訂正が必要な言
語を簡単に正確に認識することができる。
【0005】 音声認識装置が学習装置と協働するテキスト処理装置
においては、特定の話者によって発音された言語の音声
信号の特徴を、前記音声認識装置によって音声信号から
抽出することができ、この特徴を、学習装置に供給した
音声関連パラメータと学習装置に供給されると共に話者
関連パラメータとして音声認識装置に記憶される関連す
る音声信号と対応する言語とを比較することによって学
習装置により解析し、前記特徴は音声認識処理において
音声認識装置によって利用できる。このテキスト処理装
置においては、表示装置上に強調表示されキーボードを
介して訂正された検出言語を学習装置に供給して、音声
認識装置によってオリジナル言語の音声信号から抽出し
た前記特徴と共に解析し、解析処理において新たに抽出
した話者関連パラメータも音声認識装置に記憶するよう
に構成することが有益である。このように、訂正された
言語も学習処理に含まれるので、本装置の使用中に正し
く識別されなかった言語の誤り率が連続的に減少し、従
ってテキスト処理装置全体が高い信頼性を以て作動す
る。
【0006】 音声認識装置が学習装置と協働するテキスト処理装置
においては、特定の話者によって発音された言語の音声
信号特有のものである特徴を、音声認識装置によって前
記音声信号から抽出し、この特徴を、前記学習装置によ
り学習装置に供給した話者関連パラメータと学習装置に
供給されると共に音声認識装置に話者関連パラメータと
して記憶した言語とを比較することによって解析し、こ
の特徴を音声認識処理において音声認識装置により利用
する。このテキスト処理装置では、音声認識装置により
誤って検出された全ての言語をキーボードを介して訂正
した後、完全なテキストを構成する言語を、音声認識装
置によりオリジナル言語の音声信号から抽出した特徴と
共に解析用の学習装置に供給し、解析処理において新た
に抽出した話者関連パラメータも前記音声認識装置に記
憶するように構成するのが有益である。このように、訂
正された言語だけでなくすでに訂正されたテキスト全体
について学習処理を施すことができ、本装置を使用して
いる間に誤って検出された言語の誤り率が常に減少する
だけでなく、テキスト処理装置が特定の話者の発音特性
や特定の話者によって頻繁に用いられる特有のテキスト
順序に直ちに適合される。
【0007】 以下図面に基づき本発明を詳細に説明する。
【0008】
【実施例】
図1に示すブロック線図において、音声認識装置を符
号1で示し、テキストに対応した音声信号を電気信号の
形態でテキスト処理装置の入力部から認識装置の入力部
2に供給する。この音声信号は、例えばマイクロフォン
から直接得られ、或いは一時記憶装置として用いられる
口述機によって再生される。これらの電気信号はアナロ
グ信号又はデジタル信号とすることができ、デジタル信
号は用いる音声認識装置の形態に対応する符号化形態の
ものとすることができ、本例で用いるのに好適な装置は
既知である。音声認識装置1はコンピュータ4によって
制御され、コンピュータ4はテキスト処理装置全体も制
御する。音声認識装置1の入力部2から電気信号を音響
アナライザ5に通常の方法で供給し、音響アナライザに
よりこの電気信号の特性である顕著な特徴を決定し、例
えば周波数スペクトラムのエネルギー集中を特徴部記憶
メモリ6に順次記憶する。特徴部記憶メモリ6は音声認
識装置1のワード認識装置7に入力信号を供給し、ワー
ド認識装置7は一連のメモリが接続され個別のワードを
識別することができる。一般的なシステムにおいて、こ
れらのメモリとして特定の話者又は数人の話者によって
発音される可能性の有るワード順序を記憶するスピーチ
モデルメモリ8と、音声認識装置によって認識され得る
ワードについて話者の音声構成を記憶する音声メモリ9
と、特定の話者又は数人の話者の特徴的な発音と関連す
るパラメータを記憶する発音特徴メモリ10とを具えてい
る。本例では、音声認識装置はさらに学習装置11を具
え、この学習装置はワード認識装置7及び特徴部記憶メ
モリ6と直接共働すると共に上述したメモリ8,9及び10
をアクセスする。学習処理を行なう場合、特定の話者に
よって発音された言語の音声信号から音声認識装置1に
よって取り出されメモリ6に記憶された特徴部は、学習
装置11において例えばメモリ8,9及び10に記憶され、学
習装置11に供給される音声と関連するパラメータ並びに
対応する音声信号と関連し例えばコンピュータ4により
学習装置に供給される言語と比較することにより解析さ
れ、これらの特徴部は音声認識装置のメモリ8,9及び10
に話者に関連するパラメータとして記憶する。この結
果、特徴部はワード認識装置7に対して将来有用なもの
となる。
【0009】 上記手段により、音声信号中に含まれる複雑なテキス
トの個々の言語を認識することができ、これらの言語を
ワードメモリ12にデジタル信号として順次記憶する。記
憶したワードは別の処理に有用なものとすると共に、コ
ンピュータ4を介して表示装置13又はプリンタ14に供給
する。このようにして、音声信号によって表されたテキ
ストは表示装置13上に個々のワードから成るテキストと
して直接表示することができ、表示装置において必要な
チェック又は訂正が行われる。けだし、この音声認識装
置は特有のエラーを生じ、個々の言語又は言語群が正し
く識別されず誤って表示さるおそれがあるためである。
【0010】 誤って検出された言語を訂正するため、本発明による
テキスト処理装置は、後述する別の工程を利用する。
【0011】 電気信号としてテキスト処理装置の入力部3に供給さ
れた音声信号を第1の別のメモリ15に記憶する。第1の
メモリ15に音声信号を記憶する場合、この第1メモリの
構成に応じて種々の方法を採用することができる。例え
ば、この第1のメモリがオーディオテープ装置の場合、
音声信号をアナログオーディオ信号として記憶する。一
方、第1のメモリがデジタルメモリの場合、音声信号を
デジタル化又は符号化した後デジタルメモリに供給す
る。このデジタルメモリはメモリ内容をより短時間でア
クセスできる利点がある。このデジタルメモリは、例え
ばディスク記憶素子又は固体集積化メモリとすることが
できる。さらに、集中指令システムのメモリも第1メモ
リとして利用することができる。或いは、認識装置1の
入力部2に供給すべき入力信号を、第1メモリの出力か
ら供給することもできる。
【0012】 さらに、音声認識装置によって検出されワードメモリ
12に記憶した個々の言語にスタートマーク及びエンドマ
ークを割り当てる。これらのマークは第1メモリ15に記
憶した音声信号と特定の時間関係にある。このように構
成することにより、検出された各言語はスタートマーク
及びエンドマークによって境界され、言語のエンドマー
クは同時に次の言語のスタートマークを構成する。この
点に関し、これらのマークを付する際、これらマークが
第1のメモリ15に記憶されている音声信号と特定の時間
関係にあるように設定する必要がある。このため、例え
ば音声認識処理中にコンピュータ4のクロック信号を用
いて時間係数処理を行い、個々の言語検出間で発生する
個々の時間期間を連続して規定することができる。個々
に検出され発生したスタートマーク及びエンドマークを
ワード認識装置7に接続されている第2のメモリ16に記
憶し、この第2メモリ16のアクセスはコンピュータ4に
よって行なう。コンピュータ4は第1のメモリ15もアク
セスし、この第1のメモリにオーディオ信号を記憶す
る。第2のメモリ16に記憶されている検出言語のスター
トマーク及びエンドマークにより、コンピュータ4は、
検出ワードと関連すると共に第1メモリ15に記憶されて
いる音声信号との相関をとることができ、表示装置13に
よって表示された検出言語を例えばカーソルで強調した
り或いはコンピュータ4の制御のもとで下側に線を引い
たりすることができ、しかも同時に対応するオーディオ
信号を音響的に再生することもできる。
【0013】 従って、表示装置13によって表示した言語によって形
成されるテキストを簡単に、迅速にしかも高い信頼性を
以てチェックし又は訂正することができる。必要な場
合、コンピュータ4と協働すると共に指令入力手段とし
て作用するキーボード17とデータとに基づいて表示装置
13上に表示した強調された言語を訂正することができ
る。例えば、表示装置上に表示された言語によって構成
されるテキスト全体のうち単一のワードをキーボード17
及びコンピュータ4の制御のもとで強調することもでき
る。その後コンピュータ4によって強調されたワードに
対応し第2メモリ16に記憶されているスタートマーク及
びエンドマークを検出し、検出したマークに基づいて第
1メモリ15に記憶されている対応するオーディオ信号を
ラウドスピーカ18により読出して音響的に再生すること
ができる。この再生は回帰的又は非回帰的なものとする
ことができる。このように構成すれば、操作者は強調さ
れたワードに対応するオーディオ信号を直接監視して音
声認識装置1により対応するワードが正しく検出された
か又は誤って検出されたかを確認することができる。言
語が誤って検出された場合、操作者はキーボード17を介
して誤ったワードを正しいワードで置き換えることがで
きる。一方、第1メモリ15に記憶されている音声信号を
音響的に連続して再生し同時にコンピュータ4により第
2メモリ16に記憶されている各検出ワードのスタートマ
ーク及びエンドマークと協働して対応する検出ワードを
表示装置13上に強調表示することにより、表示装置13に
よって表示したテキストを例えば連続してチェックする
ことも可能である。この結果、操作者は発音されたテキ
ストを連続して聴取すると共に、同時に音声認識装置に
よって検出され表示テキスト中に強調表示された言語に
注目することになる。上述したテキスト処理装置を用い
て種々の操作を行なうことにより、簡単で高い信頼性を
以てテキストをチェックし訂正することもでき、このチ
ェック訂正の後プリンタ14によって最終的に正しいテキ
ストをプリントすることができる。
【0014】 表示装置13上に強調表示されると共に、音声認識装置
1によってオリジナルの言語の音声信号から抽出され特
徴部記憶メモリ6に記憶されている特徴部と共にキーボ
ード17を介して訂正された事項を学習装置11に供給し、
分析で新たに抽出され音声認識装置1のメモリ8,9及び1
0にも記憶されている話者に関するパラメータを解析す
ることも有利である。本例では、音声認識装置によって
テキスト全体の音声信号から抽出した全ての特徴を特徴
部記憶メモリ6における学習処理に連続的に利用し、言
語の音声信号に対応する特徴を常時読み出すことができ
る。従って、特徴部記憶メモリ6は相当大きな記憶容量
が必要になる。さらに、第1メモリ15に記憶されている
音声信号を学習処理に利用し、音声認識装置1によって
関連する特徴を毎回再検出しこれらの特徴を特徴を特徴
部記憶メモリ6に再び記憶することも可能である。この
ように構成すれば、特徴部記憶メモリ6の記憶容量を一
層小さなものとすることができる。このため、例えば音
声認識装置1の入力部2を、スイッチ19によって入力部
3に接続する代わりに第1のメモリ15の出力部に接続す
ることができる。この場合、コンピュータ4が、第1の
メモリ15に記憶され音声認識装置によって検出された関
連する言語と対応する各音声信号部分がアクセスする。
このように、学習装置11は音声認識装置1のメモリ8,9
及び10に記憶されている話者に関するパラメータを適切
に変更或いは更新し、音声認識装置1は対応する話者に
関する別の学習処理を実行し、処理された言語に対応す
る音声信号が再度発生する場合音声認識装置によって正
しく検出された言語が直ちに発生させる機会を増大させ
る。この結果、テスト処理装置の誤り発生率が連続して
減少する。
【0015】 音声認識装置1によって誤って検出された全ての言語
がキーボード17によって訂正された後、音声認識装置に
よってオリジナルの言語の音声信号から抽出され特徴部
記憶メモリ6に記憶されている特徴と共に完全なテキス
トを形成するワードを解析するための学習装置11に供給
し、この解析において得た新たに抽出された話者に関す
るパラメータを音声認識装置のメモリ8,9及び10に記憶
することも有益である。このようにして、すでに訂正さ
れたテキスト全体を学習処理で利用すれば、誤って検出
された言語の誤り率が減少すると共に装置を特定の話者
の発音特性及びこの話者によって用いられる特定の周波
数域に適合させることができ、この結果音声認識の性能
が実質的に改善される。
【0016】 本発明は上述した実施例だけに限定されるもではなく
種々の変形が可能である。特に、音声信号を第1メモリ
に記憶する際種々の方法を採用でき、スタートマーク及
びエンドマーク発生させてどのマークが認識装置によっ
て検出された言語を規定するか判断することができる。
さらに、このような型式のテキスト処理装置は、例えば
テキスト併合のようなこの型式の音声認識装置で一般的
な他の機能を行なうことができることは明らかである。
【図面の簡単な説明】
図1は本発明によるテキスト処理装置の一例の構成を示
すブロック線図である。
【符号の説明】
1……音声認識装置 4……コンピュータ 5……音響アナライザ 6……特徴部記憶メモリ 7……ワード認識装置 8……スピーチモデルメモリ 9……音声メモリ 10……発音特徴メモリ 11……学習装置 12……ワードメモリ 15……第1メモリ 16……第2メモリ
フロントページの続き (73)特許権者 590000248 Groenewoudseweg 1, 5621 BA Eindhoven, T he Netherlands (72)発明者 ヴェルナー ヘーラーバウアー オーストリア国アー‐2344 マリア エ ンゼルドルフ ドブラシュトラーセ24 (56)参考文献 特開 昭62−113264(JP,A) 特開 昭58−217044(JP,A) 特開 昭63−85697(JP,A) 特開 昭63−220319(JP,A) 特開 昭61−180329(JP,A) 特開 昭57−62097(JP,A)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】テキストに対応する音声信号を音声認識装
    置に供給し、この音声認識装置は音声信号中のワードを
    検出し、検出したワードをデジタル信号の形態でワード
    メモリに記憶すると共に、このワードメモリから別の処
    理手段に供給し、この処理手段において検出したワード
    を表示装置によってテキストとして再生し、必要に応じ
    て訂正し、プリンタによって記録することができるテキ
    スト処理装置において、 前記音声信号を第1のメモリに記憶し、キーボードと協
    動するコンピュータの制御のもとで前記音声認識装置に
    よって検出したワードにスタートマーク及びエンドマー
    クを割り当て、これらマークが第1メモリに記憶されて
    いる音声信号と時間的に関連し、前記スタートマーク及
    びエンドマークを第2のメモリに記憶し、第2メモリに
    記憶されている検出したワードのスタートマーク及びエ
    ンドマークにより前記コンピュータが、検出したワード
    に対応した第1メモリに記憶されている音声信号と相関
    をとることができ、コンピュータの制御のもとで検出し
    たワードを表示装置上に強調表示できると共に同時に関
    連するオーディオ信号を音響的に再生することができ、
    前記キーボードによってデータを前記コンピュータに入
    力でき、コンピュータによって、必要な場合表示装置上
    に表示された検出したワードを訂正できるように構成し
    たことを特徴とするテキスト処置装置。
  2. 【請求項2】前記音声認識装置が学習装置と協働し、特
    定の話者によって発音された音声信号の特徴を前記音声
    認識装置によって音声信号から抽出することができ、こ
    の音声信号の特徴は、学習装置に供給した音声関連パラ
    メータ及び学習装置に供給される当該音声信号と対応す
    るワードと比較することによって学習装置により解析さ
    れると共に、音声認識装置の音声認識処理において利用
    できる話者関連パラメータとして音声認識装置に記憶さ
    れる請求項1に記載のテキスト処理装置において、 表示装置上に強調表示されキーボードを介して訂正され
    た検出ワードを学習装置に供給して、音声認識装置によ
    ってオリジナルワードの音声信号から抽出した前記特徴
    と共に解析し、解析処理において新たに抽出した話者関
    連パラメータも音声認識装置に記憶するように構成した
    ことを特徴とするテキスト処理装置。
  3. 【請求項3】前記音声認識装置が学習装置と協働し、特
    定の話者によって発音されたワードの音声信号特有のも
    のである特徴を、音声認識装置によって前記音声信号か
    ら抽出し、この特徴は、前記学習装置により、学習装置
    に供給される音声関連パラメータ及び学習装置に供給さ
    れる当該音声信号に対応するワードと比較することによ
    って解析されると共に、音声認識装置の音声認識処理に
    おいて利用することができる話者関連パラメータとして
    音声認識装置に記憶される請求項1に記載のテキスト処
    理装置において、 音声認識装置により誤って検出された全てのワードをキ
    ーボードを介して訂正した後、テキスト全体を構成する
    ワードを、音声認識装置により音声信号から抽出した特
    徴と共に解析用の学習装置に供給し、解析処理において
    新たに抽出した話者関連パラメータも前記音声認識装置
    に記憶するように構成したことを特徴とするテキスト処
    理装置。
JP27619189A 1988-10-25 1989-10-25 テキスト処理装置 Expired - Fee Related JP3263392B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AT2647/88 1988-10-25
AT0264788A AT390685B (de) 1988-10-25 1988-10-25 System zur textverarbeitung

Publications (2)

Publication Number Publication Date
JPH02163819A JPH02163819A (ja) 1990-06-25
JP3263392B2 true JP3263392B2 (ja) 2002-03-04

Family

ID=3538028

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27619189A Expired - Fee Related JP3263392B2 (ja) 1988-10-25 1989-10-25 テキスト処理装置

Country Status (10)

Country Link
US (1) US5031113A (ja)
EP (1) EP0366192B1 (ja)
JP (1) JP3263392B2 (ja)
KR (1) KR0135975B1 (ja)
AT (2) AT390685B (ja)
AU (1) AU616807B2 (ja)
CA (1) CA2001164C (ja)
DE (1) DE58909293D1 (ja)
ES (1) ES2075848T3 (ja)
HK (1) HK199496A (ja)

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02272495A (ja) * 1989-04-13 1990-11-07 Toshiba Corp 音声認識装置
US5329609A (en) * 1990-07-31 1994-07-12 Fujitsu Limited Recognition apparatus with function of displaying plural recognition candidates
US5530740A (en) * 1991-10-28 1996-06-25 Contigram Communications Corporation System and method for integrating voice, facsimile and electronic mail data through a personal computer
US5369704A (en) * 1993-03-24 1994-11-29 Engate Incorporated Down-line transcription system for manipulating real-time testimony
US7631343B1 (en) * 1993-03-24 2009-12-08 Endgate LLC Down-line transcription system using automatic tracking and revenue collection
US7249026B1 (en) * 1993-03-24 2007-07-24 Engate Llc Attorney terminal having outline preparation capabilities for managing trial proceedings
US5444615A (en) * 1993-03-24 1995-08-22 Engate Incorporated Attorney terminal having outline preparation capabilities for managing trial proceeding
JP3337798B2 (ja) * 1993-12-24 2002-10-21 キヤノン株式会社 画像データ及び音声データを処理する装置、データ処理装置並びにデータ処理方法
US5600756A (en) * 1994-05-11 1997-02-04 Sony Corporation Method of labelling takes in an audio editing system
US5477511A (en) * 1994-07-13 1995-12-19 Englehardt; C. Duane Portable documentation system
DE4434255A1 (de) * 1994-09-24 1996-03-28 Sel Alcatel Ag Vorrichtung zur Sprachaufzeichnung mit anschließender Texterstellung
US5745875A (en) * 1995-04-14 1998-04-28 Stenovations, Inc. Stenographic translation system automatic speech recognition
US5754978A (en) * 1995-10-27 1998-05-19 Speech Systems Of Colorado, Inc. Speech recognition system
US5960447A (en) * 1995-11-13 1999-09-28 Holt; Douglas Word tagging and editing system for speech recognition
US5960395A (en) * 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming
US6961700B2 (en) * 1996-09-24 2005-11-01 Allvoice Computing Plc Method and apparatus for processing the output of a speech recognition engine
US5857099A (en) * 1996-09-27 1999-01-05 Allvoice Computing Plc Speech-to-text dictation system with audio message capability
GB2303955B (en) * 1996-09-24 1997-05-14 Allvoice Computing Plc Data processing method and apparatus
KR100453021B1 (ko) * 1996-09-27 2005-04-08 코닌클리케 필립스 일렉트로닉스 엔.브이. 구두텍스트인식방법및시스템
US5774857A (en) * 1996-11-15 1998-06-30 Motorola, Inc. Conversion of communicated speech to text for tranmission as RF modulated base band video
US5909667A (en) * 1997-03-05 1999-06-01 International Business Machines Corporation Method and apparatus for fast voice selection of error words in dictated text
US6629074B1 (en) 1997-08-14 2003-09-30 International Business Machines Corporation Resource utilization indication and commit mechanism in a data processing system and method therefor
DE19740119A1 (de) * 1997-09-12 1999-03-18 Philips Patentverwaltung System zum Schneiden digitaler Video- und Audioinformationen
JP2000042782A (ja) * 1998-07-27 2000-02-15 Miyachi Technos Corp 溶接状況状態記録方法および溶接状況状態記録装置
US6151576A (en) * 1998-08-11 2000-11-21 Adobe Systems Incorporated Mixing digitized speech and text using reliability indices
GB2390930B (en) * 1999-02-05 2004-03-10 Custom Speech Usa Inc System and method for automating transcription services
US6385581B1 (en) 1999-05-05 2002-05-07 Stanley W. Stephenson System and method of providing emotive background sound to text
US7797730B2 (en) * 1999-06-24 2010-09-14 Engate Llc Downline transcription system using automatic tracking and revenue collection
ATE306116T1 (de) 1999-07-08 2005-10-15 Koninkl Philips Electronics Nv Spracherkennungseinrichtung mit transfermitteln
DE60020504T2 (de) 1999-07-08 2006-05-04 Koninklijke Philips Electronics N.V. Anpassung eines spracherkenners an korrigierte texte
US6434547B1 (en) 1999-10-28 2002-08-13 Qenm.Com Data capture and verification system
US6754619B1 (en) 1999-11-15 2004-06-22 Sony Corporation Digital recording and playback system with voice recognition capability for concurrent text generation
JP2003518266A (ja) 1999-12-20 2003-06-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識システムのテキスト編集用音声再生
US6513003B1 (en) 2000-02-03 2003-01-28 Fair Disclosure Financial Network, Inc. System and method for integrated delivery of media and synchronized transcription
US6778700B2 (en) * 2001-03-14 2004-08-17 Electronics For Imaging, Inc. Method and apparatus for text detection
DE60202453T2 (de) 2001-03-29 2006-01-19 Koninklijke Philips Electronics N.V. Synchronisierung eines audio- und eines text-cursors während der editierung
EP1374224B1 (en) * 2001-03-29 2006-02-08 Koninklijke Philips Electronics N.V. Text editing for recognized speech during synchronous playback
DE10126020A1 (de) * 2001-05-28 2003-01-09 Olaf Berberich Hybrides Diktier-/Dialogsystem für Spracheingabe und Tastaturbestätigung
US20030046071A1 (en) * 2001-09-06 2003-03-06 International Business Machines Corporation Voice recognition apparatus and method
US6708148B2 (en) * 2001-10-12 2004-03-16 Koninklijke Philips Electronics N.V. Correction device to mark parts of a recognized text
CN1312657C (zh) * 2001-10-12 2007-04-25 皇家飞利浦电子股份有限公司 用于标注所识别文本的部分的转录设备和方法
US8498871B2 (en) * 2001-11-27 2013-07-30 Advanced Voice Recognition Systems, Inc. Dynamic speech recognition and transcription among users having heterogeneous protocols
US20030101054A1 (en) * 2001-11-27 2003-05-29 Ncc, Llc Integrated system and method for electronic speech recognition and transcription
DE602004018290D1 (de) * 2003-03-26 2009-01-22 Philips Intellectual Property Spracherkennungs- und korrektursystem, korrekturvorrichtung und verfahren zur erstellung eines lexikons von alternativen
EP1611570B1 (en) * 2003-03-31 2017-06-28 Nuance Communications Austria GmbH System for correction of speech recognition results with confidence level indication
US7263483B2 (en) * 2003-04-28 2007-08-28 Dictaphone Corporation USB dictation device
US7346506B2 (en) * 2003-10-08 2008-03-18 Agfa Inc. System and method for synchronized text display and audio playback
WO2005052785A2 (en) * 2003-11-28 2005-06-09 Koninklijke Philips Electronics N.V. Method and device for transcribing an audio signal
US7590533B2 (en) * 2004-03-10 2009-09-15 Microsoft Corporation New-word pronunciation learning using a pronunciation graph
JP2005301953A (ja) * 2004-04-12 2005-10-27 Kenichi Asano 聞き手の側のペースで音声とそれに対応する文章を関連させる方法
FR2956515A1 (fr) * 2010-02-15 2011-08-19 France Telecom Procede de navigation dans un contenu sonore
US8392186B2 (en) * 2010-05-18 2013-03-05 K-Nfb Reading Technology, Inc. Audio synchronization for document narration with user-selected playback
US10032127B2 (en) 2011-02-18 2018-07-24 Nuance Communications, Inc. Methods and apparatus for determining a clinician's intent to order an item
US9904768B2 (en) 2011-02-18 2018-02-27 Nuance Communications, Inc. Methods and apparatus for presenting alternative hypotheses for medical facts
US10460288B2 (en) 2011-02-18 2019-10-29 Nuance Communications, Inc. Methods and apparatus for identifying unspecified diagnoses in clinical documentation
US8768723B2 (en) 2011-02-18 2014-07-01 Nuance Communications, Inc. Methods and apparatus for formatting text for clinical fact extraction
JP5404726B2 (ja) * 2011-09-26 2014-02-05 株式会社東芝 情報処理装置、情報処理方法およびプログラム
US9569594B2 (en) 2012-03-08 2017-02-14 Nuance Communications, Inc. Methods and apparatus for generating clinical reports
US9412372B2 (en) * 2012-05-08 2016-08-09 SpeakWrite, LLC Method and system for audio-video integration
US9064492B2 (en) 2012-07-09 2015-06-23 Nuance Communications, Inc. Detecting potential significant errors in speech recognition results
US10504622B2 (en) 2013-03-01 2019-12-10 Nuance Communications, Inc. Virtual medical assistant methods and apparatus
US11024406B2 (en) 2013-03-12 2021-06-01 Nuance Communications, Inc. Systems and methods for identifying errors and/or critical results in medical reports
US9292254B2 (en) * 2013-05-15 2016-03-22 Maluuba Inc. Interactive user interface for an intelligent assistant
US11183300B2 (en) 2013-06-05 2021-11-23 Nuance Communications, Inc. Methods and apparatus for providing guidance to medical professionals
US10496743B2 (en) 2013-06-26 2019-12-03 Nuance Communications, Inc. Methods and apparatus for extracting facts from a medical text
US10754925B2 (en) 2014-06-04 2020-08-25 Nuance Communications, Inc. NLU training with user corrections to engine annotations
US10373711B2 (en) 2014-06-04 2019-08-06 Nuance Communications, Inc. Medical coding system with CDI clarification request notification
US10331763B2 (en) 2014-06-04 2019-06-25 Nuance Communications, Inc. NLU training with merged engine and user annotations
US10319004B2 (en) 2014-06-04 2019-06-11 Nuance Communications, Inc. User and engine code handling in medical coding system
US10366424B2 (en) 2014-06-04 2019-07-30 Nuance Communications, Inc. Medical coding system with integrated codebook interface
US10366687B2 (en) 2015-12-10 2019-07-30 Nuance Communications, Inc. System and methods for adapting neural network acoustic models
US11152084B2 (en) 2016-01-13 2021-10-19 Nuance Communications, Inc. Medical report coding with acronym/abbreviation disambiguation
CN106409296A (zh) * 2016-09-14 2017-02-15 安徽声讯信息技术有限公司 基于分核处理技术的语音快速转写校正系统
US10949602B2 (en) 2016-09-20 2021-03-16 Nuance Communications, Inc. Sequencing medical codes methods and apparatus
US10503467B2 (en) 2017-07-13 2019-12-10 International Business Machines Corporation User interface sound emanation activity classification
US11133091B2 (en) 2017-07-21 2021-09-28 Nuance Communications, Inc. Automated analysis system and method
US11024424B2 (en) 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
JP7202938B2 (ja) * 2019-03-20 2023-01-12 Tvs Regza株式会社 番組名検索支援装置、及び、番組名検索支援方法
JP7169921B2 (ja) * 2019-03-27 2022-11-11 本田技研工業株式会社 エージェント装置、エージェントシステム、エージェント装置の制御方法、およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3676856A (en) * 1970-08-11 1972-07-11 Ron Manly Automatic editing system and method
US3770892A (en) * 1972-05-26 1973-11-06 Ibm Connected word recognition system
US4041467A (en) * 1975-11-28 1977-08-09 Xerox Corporation Transcriber system for the automatic generation and editing of text from shorthand machine outlines
JPS58189696A (ja) * 1982-04-30 1983-11-05 日産自動車株式会社 車両用音声認識装置
US4627001A (en) * 1982-11-03 1986-12-02 Wang Laboratories, Inc. Editing voice data

Also Published As

Publication number Publication date
AT390685B (de) 1990-06-11
CA2001164A1 (en) 1990-04-25
KR900006856A (ko) 1990-05-09
DE58909293D1 (de) 1995-07-20
CA2001164C (en) 2000-11-28
EP0366192B1 (de) 1995-06-14
KR0135975B1 (ko) 1998-05-15
EP0366192A3 (de) 1991-03-13
ATA264788A (de) 1989-11-15
ES2075848T3 (es) 1995-10-16
US5031113A (en) 1991-07-09
AU616807B2 (en) 1991-11-07
EP0366192A2 (de) 1990-05-02
JPH02163819A (ja) 1990-06-25
ATE123893T1 (de) 1995-06-15
HK199496A (en) 1996-11-08
AU4367289A (en) 1990-05-03

Similar Documents

Publication Publication Date Title
JP3263392B2 (ja) テキスト処理装置
US8311832B2 (en) Hybrid-captioning system
EP0077194B1 (en) Speech recognition system
US7617106B2 (en) Error detection for speech to text transcription systems
WO1998013822A1 (en) Method of and system for recognizing a spoken text
JP2008309856A (ja) 音声認識装置及び会議システム
EP2028646A1 (en) Device for modifying and improving the behaviour of speech recognition systems
JP2008275987A (ja) 音声認識装置および会議システム
JP2000206987A (ja) 音声認識装置
JP2686085B2 (ja) 音声認識システム
JPS645320B2 (ja)
JPS6126678B2 (ja)
JP2647873B2 (ja) 文章作成システム
JP2647872B2 (ja) 文章作成システム
JPH01106098A (ja) 音声認識システム
JPH01290000A (ja) 音声認識方式
JPH01106096A (ja) 音声認識システム
JPS63316899A (ja) 音声認識システム
JPH01106097A (ja) 音声認識システム
JPS6011897A (ja) 音声認識装置
JPH01106099A (ja) 音声認識システム
JPH0415960B2 (ja)
JPH01161296A (ja) 音声認識システム
JPS59176791A (ja) 音声登録方式
JPH11242492A (ja) 録音音声データベース検証方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees