JPH02163819A - テキスト処理装置 - Google Patents

テキスト処理装置

Info

Publication number
JPH02163819A
JPH02163819A JP1276191A JP27619189A JPH02163819A JP H02163819 A JPH02163819 A JP H02163819A JP 1276191 A JP1276191 A JP 1276191A JP 27619189 A JP27619189 A JP 27619189A JP H02163819 A JPH02163819 A JP H02163819A
Authority
JP
Japan
Prior art keywords
language
speech recognition
recognition device
detected
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1276191A
Other languages
English (en)
Other versions
JP3263392B2 (ja
Inventor
Werner Hoellerbauer
ヴェルナー ヘーラーバウアー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Gloeilampenfabrieken NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Gloeilampenfabrieken NV filed Critical Philips Gloeilampenfabrieken NV
Publication of JPH02163819A publication Critical patent/JPH02163819A/ja
Application granted granted Critical
Publication of JP3263392B2 publication Critical patent/JP3263392B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (技術分野) 本発明は、テキストに対応する音声信号を音声認識装置
に供給し、この音声認識装置で音声信号中の言語を検出
し、検出した言語をデジタル信号の形態でワードメモリ
に記憶すると共に、このワードメモリから別の処理手段
に供給し、この処理手段において検出した言語を表示装
置によってテキストとして再生し、必要に応じて訂正し
、プリンタによって記録することができるテキスト処理
装置に関するものである。
(従来の技術) このような型式のテキスト処理装置は米国特許第3,7
70,892号に記載されている。しかしこの公報には
、音声認識装置によって正しく認識されなかった言語を
いかにして訂正するか開示されていない。
(発明が解決しようとする課題) この型式の従来のテキスト処理装置においては言語検出
におけるエラーが比較的頻繁に発生していたので、誤り
訂正やテストを行なうことが極めて重要である。
従って、本発明の目的は、冒頭部で述べた型式のテキス
ト処理装置において、検出した言語をチエツクでき、誤
って検出した言語を簡単に、短時間でしかも高い信頬性
を以て訂正することができるテキスト処理装置を提供す
ることにある。
(発明の概要) 本発明によれば上記目的は、前記音声信号を第1のメモ
リに記憶し、キーボードと協働するコンピュータの制御
のもとで前記音声認識装置によって検出した言語にスタ
ートマーク及びエンドマークを割り当て、これらマーク
が第1メモリに記憶されている音声信号と時間的に関連
し、前記スタートマーク及びエンドマークを第2のメモ
リに記憶し、第2メモリに記憶されている検出した言語
のスタートマーク及びエンドマークにより前記コンピュ
ータが、検出した言語に対応し第1メモリに記憶されて
いる音声信号と相関をとることができ、コンピュータの
制御のもとで検出した言語を表示装置上に強調表示でき
ると共に同時に関連するオーディオ信号を音響的に再生
することができ、前記キーボードによってデータを前記
コンピュータに入力でき、コンピュータによって、必要
な場合表示装置上に表示された検出した言語を訂正でき
るように構成することにより達成される。テキストに対
応する音声信号が付加的に記憶されると共に、これらの
音声信号と相関し音声認識装置によって検出したテキス
トの言語と時間的に関連するスタートマーク及びエンド
マークも記憶されるので、各検出した言語に関連する音
声信号を割り当て、或は音声信号の各部分に対応する検
出言語を簡単に割り当てることができる。従って、操作
者は、例えばチエツク又は訂正すべき言語と関連しコン
ピュータによって表示装置上に強調表示されたオリジナ
ルの音声信号を音響的に監視することがでる。この結果
、操作者は関連する言語を正しく識別することができ、
必要な場合これらの言語をキーボードを介して正しい形
態で入力することができる。或は、表示装置によって表
示されたテキストの検出言語を連続してチエツクするこ
とができ、すなわち第1のメモリに記憶されている音声
信号を連続して音響的に再生し、関連する検出された言
語をコンピュータによって表示装置上に同時に強調表示
することができ、この結果瞬時的に検出した言語は連続
して強調表示され操作者はオリジナルの音声信号を同時
に聴取し、従って操作者は訂正が必要な言語を而単に正
6育に認識することができる。
音声認識装置が学習装置と協働するテキスト処理装置に
おいては、特定の話者によって発音された言語の音声信
号の特徴を、前記音声認識装置によって音声信号から抽
出することができ、この特徴を、学習装置に供給した音
声関連パラメータと学習装置に供給されると共に話者関
連パラメータとして音声認識装置に記憶される関連する
音声信号と対応する言語とを比較することによって学習
装置により解析し、前記特徴は音声認識処理において音
声認識装置によって利用できる。このテキスト処理装置
においては、表示装置上に強調表示されキーボードを介
して訂正された検出言語を学習装置に供給して、音声認
識装置によってオリジナル言語の音声信号から抽出した
前記特徴と共に解析し、解析処理において新たに抽出し
た話者関連パラメータも音声認識装置に記憶するように
構成することが有益である。このように、訂正された言
語も学習処理に含まれるので、本装置の使用中に正しく
識別されなかった言語の誤り率が連続的に減少し、従っ
てテキスト処理装置全体が高い信顛性を以て作動する。
音声認識装置が学習装置と協働するテキスト処理装置に
おいては、特定の話者によって発音された言語の音声信
号特有のものである特徴を、音声認識装置によって前記
音声信号から抽出し、この特徴を、前記学習装置により
学習装置に供給した話者関連パラメータと学習装置に供
給されると共に音声認識装置に話者関連パラメータとし
て記憶した言語とを比較することによって解析し、この
特徴を音声認識処理において音声認識装置により利用す
る。このテキスト処理装置では、音声認識装置により誤
って検出された全ての言語をキーボードを介して訂正し
た後、完全なテキストを構成する言語を、音声認識装置
によりオリジナル言語の音声信号から抽出した特徴と共
に解析用の学習装置に供給し、解析処理において新たに
抽出した話者関連パラメータも前記音声認識装置に記憶
するように構成するのが有益である。このように、訂正
された言語だけでなくすでに訂正されたテキスト全体に
ついて学習処理を施すことができ、本装置を使用してい
る間に誤って検出された言語の誤り率が常に減少するだ
けでなく、テキスト処理装置が特定の話者の発音特性や
特定の話者によって頻繁に用いられる特有のテキスト順
序に直ちに適合される。
以下図面に基づき本発明の詳細な説明する。
(実施例) 第1図に示すブロック線図において、音声認識装置を符
号1で示し、テキストに対応した音声信号を電気信号の
形態でテキスト処理装置の入力部から認識装置の入力部
2に供給する。この音声信号は、例えばマイクロフォン
から直接得られ、或いは一時記憶装置として用いられる
口述機によって再生される。これらの電気信号はアナロ
グ信号又はデジタル信号とすることができ、デジタル信
号は用いる音声認識装置の形態に対応する符号化形態の
ものとすることができ、本例で用いるのに好適な装置は
既知である。音声認識装置7はコンピュータ4によって
制御され、コンピュータ4はテキスト処理装置全体も制
御する。音声認識装置1の人力部2から電気信号を音響
アナライザ5に通常の方法で供給し、音響アナライザに
よりこの電気信号の特性である顕著な特徴を決定し、例
えば周波数スペクトラムのエネルギー集中を特徴部記憶
メモリ6に順次記憶する。特徴部記憶メモリ6は肝斑認
識装置1のワード認識装置7に入力信号を供給し、ワー
ド認識装置7は一連のメモリが接続され個別のワードを
識別することができる。
−a的なシステムにおいて、これらのメモリとして特定
の話者又は数人の話者によって発音される可能性の有る
ワード順序を記憶するスピーチモデルメモリ8と、音声
認識装置によって認識され得るワードについて話者の音
声構成を記憶する音声メモリ9と、特定の話者又は数人
の話者の特徴的な発音と関連するパラメータを記憶する
発音特徴メモリ10とを具えている。本例では、音声認
識装置はさらに学習装置11を具え、この学習装置はワ
ード認識装置7及び特徴部記憶メモリ6と直接共働する
と共に上述したメモリ8.9及び10をアクセスする。
学習処理を行なう場合、特定の話者によって発声された
言語の音声信号から音声認識装置1によって取り出され
メモリ6に記憶された特徴部は、学習装置11において
例えばメモリ8,9及びIOに記憶され、学習装置11
に供給される音声と関連するパラメータ並びに対応する
音声信号と関連し例えばコンピュータ4により学習装置
に供給される言語と比較することにより解析され、これ
らの特徴部は音声認識装置のメモリ8,9及び10に話
者に関連するパラメータとして記憶する。
この結果、特徴部はワード認識装置7に対して将来有用
なものとなる。
上記手段により、音声信号中に含まれる?jb’[#な
テキストの個々の言語を認識することができ、これらの
言語をワードメモリ12にデジタル信号として順次記憶
する。記憶したワードは別の処理に有用なものとすると
共に、コンピュータ4を介して表示装置13又はプリン
タ14に供給する。このようにして、音声信号にって表
されたテキストは表示装置13上に個々のワードから成
るテキストとして直接表示することができ、表示装置に
おいて必要なチェンジ又は訂正が行われる。けだし、こ
の音声認識装置は特有のエラーを生じ、個々の言語又は
言語群が正しく識別されず誤って表示さるおそれがある
ためである。
誤って検出された言語を訂正するため、本発明によるテ
キスト処理装置は、後述する別の工程を利用する。
電気信号としてテキスト処理装置の入力部3に供給され
た音声信号を第1の別のメモ1月5に記憶する。第1の
メモ1月5に音声信号を記憶する場合、この第1メモリ
の構成に応して種々の方法を採用することができる。例
えば、この第1のメモリがオーディオテープ装置の場合
、音声信号をアナログオーディオ信号として記憶する。
一方、第1のメモリがデジタルメモリの場合、音声信号
をデジタル化又は符号化した後デジタルメモリに供給す
る。このデジタルメモリはメモリ内容をより短時間でア
クセスできる利点がある。このデジタルメモリは、例え
ばディスク記憶素子又は固体集積化メモリとすることが
できる。さらに、集中指令システムのメモリも第1メモ
リとして利用することができる。或いは、認識装置1の
入力部2に供給すべき入力信号を、第1メモリの出力か
ら供給することもできる。
さらに、音声認識装置によって検出されワードメモ1月
2に記憶した個々の言語にスタートマーク及びエンドマ
ークを割り当てる。これらのマークは第1メモリ15に
記憶した音声信号と特定の時間関係にある。このように
構成することにより、検出された各言語はスタートマー
ク及びエンドマークによって境界され、言語のエンドマ
ークは同時に次の言語のスタートマークを構成する。こ
の点に関し、これらのマークを付する際、これらマーク
が第1のメモ1月5に記憶されている音声信号と特定の
時間関係にあるように設定する必要がある。
このため、例えば音声認識処理中にコンピュータ4のク
ロック信号を用いて時間計数処理を行い、個々の言語検
出間で発生する個々の時間期間を連続して規定すること
ができる。個々に検出され発生したスタートマーク及び
エンドマークをワード認識装置7に接続されている第2
のメモリ16に記憶し、この第2メモリ16のアクセス
はコンピュータ4によって行なう。コンピュータ4は第
1のメモリ15もアクセスし、この第1のメモリにオー
ディオ信号を記憶する。第2のメモリ16に記憶されて
いる検出言語のスタートマーク及びエンドマークにより
、コンピュータ4は、検出ワードと関連すると共に第1
メモリ15に記憶されている音声信号との相関をとるこ
とができ、表示装置13によって表示された検出言語を
例えばカーソルで強調したり或いはコンピュータ4の制
御のもとで下側に線を引いたりすることができ、しかも
同時に対応するオーディオ信号を音響的に再生すること
もできる。
従って、表示装置13によって表示した言語によって形
成されるテキストを簡単に、迅速にしかも高い信頼性を
以てチエツクし又は訂正することができる。必要な場合
、コンピュータ4と協働すると共に指令入力手段として
作用するキーボード17とデータとに基づいて表示装置
13上に表示した強調された言語を訂正することができ
る。例えば、表示装置上に表示された言語によって構成
されるテキスト全体のうち単一のワードをキーボード1
7及びコンピュータ4の制御のもとで強調することもで
きる。その後コンピュータ4によって強調されたワード
に対応し第2メモリ16に記憶されているスタートマー
ク及びエンドマークを検出し、検出したマークに基づい
て第1メモリ15に記憶されている対応するオーディオ
信号をラウドスピーカ18により読出して音響的に再生
することができる。
この再生は回帰的又は非回帰的なものとすることができ
る。このように構成すれば、操作者は強調されたワード
に対応するオーディオ信号を直接監視して音声認識装置
lにより対応するワードが正しく検出されたか又は誤っ
て検出されたかを6i E’2することができる。言語
が誤って検出された場合、操作者はキーボード17を介
して誤ったワードを正しいワードで置き換えることがで
きる。一方、第1メモ1月5に記憶されている音声信号
を音響的に連続して再生し同時にコンピュータ4により
第2メモ1月6に記憶されている各検出ワードのスター
トマーク及びエンドマークと協働して対応する検出ワー
ドを表示装置13上に強調表示することにより、表示装
置13によって表示したテキストを例えば連続してチエ
ツクすることも可能である。この結果、操作者は発音さ
れたテキストを連続して聴取すると共に、同時に音声認
識装置によって検出され表示テキスト中に強調表示さた
言語に注目することになる。上述したテキスト処理装置
を用いて種々の操作を行なうことにより、簡単で高い信
頼性を以てテキストをチエツクし訂正することもでき、
このチエツク訂正の後プリンタ14によって最終的に正
しいテキストをプリントすることができる。
表示装置13上に強調表示されると共に、音声認識装置
lによってオリジナルの言語の音声信号から抽出され特
徴部記憶メモリ6に記憶されている特徴部と共にキーボ
ード17を介して訂正された事項を学習装置11に供給
し、分析で新たに抽出され音声認識装置1のメモリ8.
9及び10にも記憶されている話者に関するパラメータ
を解析することも有利である。本例では、音声認識装置
によってテキスト全体の音声信号から抽出した全ての特
徴を特徴部記憶メモリ6における学習処理に連続的に利
用し、言語の音声信号に対応する特徴を常時読み出すこ
とができる。従って、特徴部記憶メモリ6は相当大きな
記憶容量が必要になる。さらに、第1メモ1月5に記憶
されている音声信号を学習処理に利用し、音声認識装置
1によって関連する特徴を毎回再検出しこれらの特徴を
特徴を特徴部記憶メモリ6に再び記憶することも可能で
ある。このように構成すれば、特徴部記憶メモリ6の記
憶容量を一層小さなものとすることができる。このため
、例えば音声認識装置lの入力部2を、スイシチェ9に
よって入力部3に接続する代わりに第1のメモ1月5の
出力部に接続することができる。この場合、コンピュー
タ4が、第1のメモ1月5に記憶され音声認識装置によ
って検出された関連する言語と対応する各音声信号部分
をアクセスする。
このように、学習装置11は音声認識装置lのメモリ8
,9及び10に記憶さている話者に関するパラメータを
適切に変更或いは更新し、音声認識装置1は対応する話
者に関する別の学習処理を実行し、処理された言語に対
応する音声信号が再度発生する場合音声認識装置によっ
て正しく検出された言語が直ちに発生させる機会を増大
させる。この結果、テキスト処理装置の誤り発生率が連
続して減少する。
音声認識装置lによって誤って検出された全ての言語が
キーボード17によって訂正された後、音声認識装置に
よってオリジナルの言語の音声信号から抽出され特徴部
記憶メモリ6に記憶されている特徴と共に完全なテキス
トを形成するワードを解析するための学習装置11に供
給し、この解析において得た新たに抽出された話者に関
するパラメータを音声認識装置のメモリ8,9及び10
に記憶することも有益である。このようにして、すでに
訂正されたテキスト全体を学習処理で利用すれば、誤っ
て検出された言語の誤り率が減少すると共に装置を特定
の話者の発音特性及びこの話者によって用いられる特定
の周波数域に適合させることができ、この結果音声認識
の性能が実質的に改善される。
本発明は上述した実施例だけに限定されるもではなく種
々の変形が可能である。特に、音声信号を第1メモリに
記憶する際種々の方法を採用でき、スタートマーク及び
エンドマーク発生させてどのマークが認識装置によって
検出された言語を規定するか判断することができる。さ
らに、このような型式のテキスト処理装置は、例えはテ
キスト併合のようなこの型式の音声認識装置で一般的な
他の機能を行なうこ゛とができることは明らかである。
【図面の簡単な説明】
第1図は本発明によるテキスト処理装置の一例の構成を
示すブロック線図である。 1・・・音声認識装置   4・・・コンピュータ5・
・・音響アナライザ  6・・・特徴部記憶メモリ7・
・・ワード認識装置 8・・・スピーチモデルメモリ

Claims (1)

  1. 【特許請求の範囲】 1、テキストに対応する音声信号を音声認識装置に供給
    し、この音声認識装置で音声信号中の言語を検出し、検
    出した言語をデジタル信号の形態でワードメモリに記憶
    すると共に、このワードメモリから別の処理手段に供給
    し、この処理手段において検出した言語を表示装置によ
    ってテキストとして再生し、必要に応じて訂正し、プリ
    ンタによって記録することができるテキスト処理装置に
    おいて、 前記音声信号を第1のメモリに記憶し、キ ーボードと協働するコンピュータの制御のもとで前記音
    声認識装置によって検出した言語にスタートマーク及び
    エンドマークを割り当て、これらマークが第1メモリに
    記憶されている音声信号と時間的に関連し、前記スター
    トマーク及びエンドマークを第2のメモリに記憶し、第
    2メモリに記憶されている検出した言語のスタートマー
    ク及びエンドマークにより前記コンピュータが、検出し
    た言語に対応し第1メモリに記憶されている音声信号と
    相関をとることができ、コンピュータの制御のもとで検
    出した言語を表示装置上に強調表示できると共に同時に
    関連するオーディオ信号を音響的に再生することができ
    、前記キーボードによってデータを前記コンピュータに
    入力でき、コンピュータによって、必要な場合表示装置
    上に表示された検出した言語を訂正できるように構成し
    たことを特徴とするテキスト処理装置。 2、前記音声認識装置が学習装置と協働し、特定の話者
    によって発音された言語の音声信号の特徴を前記音声認
    識装置によって音声信号から抽出することができ、この
    特徴を、学習装置に供給した音声関連パラメータと学習
    装置に供給されると共に話者関連パラメータとして音声
    認識装置に記憶される関連する音声信号と対応する言語
    とを比較することによって学習装置により解析し、前記
    特徴が音声認識処理において音声認識装置によって利用
    できる請求項1に記載のテキスト処理装置において、 表示装置上に強調表示されキーボードを介 して訂正された検出言語を学習装置に供給して、音声認
    識装置によってオリジナル言語の音声信号から抽出した
    前記特徴と共に解析し、解析処理において新たに抽出し
    た話者関連パラメータも音声認識装置に記憶するように
    構成したことを特徴とするテキスト処理装置。 3、前記音声認識装置が学習装置と協働し、特定の話者
    によって発音された言語の音声信号特有のものである特
    徴を、音声認識装置によって前記音声信号から抽出し、
    この特徴を、前記学習装置により、学習装置に供給した
    話者関連パラメータと学習装置に供給されると共に音声
    認識装置に話者関連パラメータとして記憶した言語とを
    比較することによって解析し、この特徴を音声認識処理
    において音声認識装置により利用する請求項1に記載の
    テキスト処理装置において、 音声認識装置により誤って検出された全て の言語をキーボードを介して訂正した後、完全なテキス
    トを構成する言語を、音声認識装置によりオリジナル言
    語の音声信号から抽出した特徴と共に解析用の学習装置
    に供給し、解析処理において新たに抽出した話者関連パ
    ラメータも前記音声認識装置に記憶するように構成した
    ことを特徴とするテキスト処理装置。
JP27619189A 1988-10-25 1989-10-25 テキスト処理装置 Expired - Fee Related JP3263392B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AT0264788A AT390685B (de) 1988-10-25 1988-10-25 System zur textverarbeitung
AT2647/88 1988-10-25

Publications (2)

Publication Number Publication Date
JPH02163819A true JPH02163819A (ja) 1990-06-25
JP3263392B2 JP3263392B2 (ja) 2002-03-04

Family

ID=3538028

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27619189A Expired - Fee Related JP3263392B2 (ja) 1988-10-25 1989-10-25 テキスト処理装置

Country Status (10)

Country Link
US (1) US5031113A (ja)
EP (1) EP0366192B1 (ja)
JP (1) JP3263392B2 (ja)
KR (1) KR0135975B1 (ja)
AT (2) AT390685B (ja)
AU (1) AU616807B2 (ja)
CA (1) CA2001164C (ja)
DE (1) DE58909293D1 (ja)
ES (1) ES2075848T3 (ja)
HK (1) HK199496A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005301953A (ja) * 2004-04-12 2005-10-27 Kenichi Asano 聞き手の側のペースで音声とそれに対応する文章を関連させる方法
US8117034B2 (en) 2001-03-29 2012-02-14 Nuance Communications Austria Gmbh Synchronise an audio cursor and a text cursor during editing

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02272495A (ja) * 1989-04-13 1990-11-07 Toshiba Corp 音声認識装置
US5329609A (en) * 1990-07-31 1994-07-12 Fujitsu Limited Recognition apparatus with function of displaying plural recognition candidates
US5530740A (en) * 1991-10-28 1996-06-25 Contigram Communications Corporation System and method for integrating voice, facsimile and electronic mail data through a personal computer
US5369704A (en) * 1993-03-24 1994-11-29 Engate Incorporated Down-line transcription system for manipulating real-time testimony
US5444615A (en) * 1993-03-24 1995-08-22 Engate Incorporated Attorney terminal having outline preparation capabilities for managing trial proceeding
US7631343B1 (en) 1993-03-24 2009-12-08 Endgate LLC Down-line transcription system using automatic tracking and revenue collection
US7249026B1 (en) * 1993-03-24 2007-07-24 Engate Llc Attorney terminal having outline preparation capabilities for managing trial proceedings
JP3337798B2 (ja) * 1993-12-24 2002-10-21 キヤノン株式会社 画像データ及び音声データを処理する装置、データ処理装置並びにデータ処理方法
US5600756A (en) * 1994-05-11 1997-02-04 Sony Corporation Method of labelling takes in an audio editing system
US5477511A (en) * 1994-07-13 1995-12-19 Englehardt; C. Duane Portable documentation system
DE4434255A1 (de) * 1994-09-24 1996-03-28 Sel Alcatel Ag Vorrichtung zur Sprachaufzeichnung mit anschließender Texterstellung
US5745875A (en) * 1995-04-14 1998-04-28 Stenovations, Inc. Stenographic translation system automatic speech recognition
US5754978A (en) * 1995-10-27 1998-05-19 Speech Systems Of Colorado, Inc. Speech recognition system
US5960447A (en) * 1995-11-13 1999-09-28 Holt; Douglas Word tagging and editing system for speech recognition
US5960395A (en) * 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming
US5857099A (en) * 1996-09-27 1999-01-05 Allvoice Computing Plc Speech-to-text dictation system with audio message capability
GB2303955B (en) * 1996-09-24 1997-05-14 Allvoice Computing Plc Data processing method and apparatus
US6961700B2 (en) * 1996-09-24 2005-11-01 Allvoice Computing Plc Method and apparatus for processing the output of a speech recognition engine
WO1998013822A1 (en) * 1996-09-27 1998-04-02 Philips Electronics N.V. Method of and system for recognizing a spoken text
US5774857A (en) * 1996-11-15 1998-06-30 Motorola, Inc. Conversion of communicated speech to text for tranmission as RF modulated base band video
US5909667A (en) * 1997-03-05 1999-06-01 International Business Machines Corporation Method and apparatus for fast voice selection of error words in dictated text
US6629074B1 (en) 1997-08-14 2003-09-30 International Business Machines Corporation Resource utilization indication and commit mechanism in a data processing system and method therefor
DE19740119A1 (de) * 1997-09-12 1999-03-18 Philips Patentverwaltung System zum Schneiden digitaler Video- und Audioinformationen
JP2000042782A (ja) * 1998-07-27 2000-02-15 Miyachi Technos Corp 溶接状況状態記録方法および溶接状況状態記録装置
US6151576A (en) * 1998-08-11 2000-11-21 Adobe Systems Incorporated Mixing digitized speech and text using reliability indices
GB2391100B (en) * 1999-02-05 2004-03-17 Custom Speech Usa Inc System and method for automating transcription services
US6385581B1 (en) 1999-05-05 2002-05-07 Stanley W. Stephenson System and method of providing emotive background sound to text
US7797730B2 (en) * 1999-06-24 2010-09-14 Engate Llc Downline transcription system using automatic tracking and revenue collection
WO2001004874A1 (en) 1999-07-08 2001-01-18 Koninklijke Philips Electronics N.V. Adaptation of a speech recognizer from corrected text
DE60022976T2 (de) * 1999-07-08 2006-07-06 Koninklijke Philips Electronics N.V. Spracherkennungseinrichtung mit transfermitteln
US6434547B1 (en) 1999-10-28 2002-08-13 Qenm.Com Data capture and verification system
US6754619B1 (en) 1999-11-15 2004-06-22 Sony Corporation Digital recording and playback system with voice recognition capability for concurrent text generation
JP2003518266A (ja) 1999-12-20 2003-06-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識システムのテキスト編集用音声再生
US6513003B1 (en) 2000-02-03 2003-01-28 Fair Disclosure Financial Network, Inc. System and method for integrated delivery of media and synchronized transcription
US6778700B2 (en) 2001-03-14 2004-08-17 Electronics For Imaging, Inc. Method and apparatus for text detection
ATE317583T1 (de) * 2001-03-29 2006-02-15 Koninkl Philips Electronics Nv Texteditierung von erkannter sprache bei gleichzeitiger wiedergabe
DE10126020A1 (de) * 2001-05-28 2003-01-09 Olaf Berberich Hybrides Diktier-/Dialogsystem für Spracheingabe und Tastaturbestätigung
US20030046071A1 (en) * 2001-09-06 2003-03-06 International Business Machines Corporation Voice recognition apparatus and method
US6708148B2 (en) * 2001-10-12 2004-03-16 Koninklijke Philips Electronics N.V. Correction device to mark parts of a recognized text
EP1438710B1 (en) * 2001-10-12 2011-01-19 Nuance Communications Austria GmbH Speech recognition device to mark parts of a recognized text
US8498871B2 (en) * 2001-11-27 2013-07-30 Advanced Voice Recognition Systems, Inc. Dynamic speech recognition and transcription among users having heterogeneous protocols
US20030101054A1 (en) * 2001-11-27 2003-05-29 Ncc, Llc Integrated system and method for electronic speech recognition and transcription
WO2004086359A2 (en) * 2003-03-26 2004-10-07 Philips Intellectual Property & Standards Gmbh System for speech recognition and correction, correction device and method for creating a lexicon of alternatives
WO2004088635A1 (en) * 2003-03-31 2004-10-14 Koninklijke Philips Electronics N.V. System for correction of speech recognition results with confidence level indication
US7263483B2 (en) * 2003-04-28 2007-08-28 Dictaphone Corporation USB dictation device
US7346506B2 (en) * 2003-10-08 2008-03-18 Agfa Inc. System and method for synchronized text display and audio playback
WO2005052785A2 (en) * 2003-11-28 2005-06-09 Koninklijke Philips Electronics N.V. Method and device for transcribing an audio signal
US7590533B2 (en) * 2004-03-10 2009-09-15 Microsoft Corporation New-word pronunciation learning using a pronunciation graph
FR2956515A1 (fr) 2010-02-15 2011-08-19 France Telecom Procede de navigation dans un contenu sonore
US8392186B2 (en) * 2010-05-18 2013-03-05 K-Nfb Reading Technology, Inc. Audio synchronization for document narration with user-selected playback
US10460288B2 (en) 2011-02-18 2019-10-29 Nuance Communications, Inc. Methods and apparatus for identifying unspecified diagnoses in clinical documentation
US10032127B2 (en) 2011-02-18 2018-07-24 Nuance Communications, Inc. Methods and apparatus for determining a clinician's intent to order an item
US9904768B2 (en) 2011-02-18 2018-02-27 Nuance Communications, Inc. Methods and apparatus for presenting alternative hypotheses for medical facts
US8768723B2 (en) 2011-02-18 2014-07-01 Nuance Communications, Inc. Methods and apparatus for formatting text for clinical fact extraction
JP5404726B2 (ja) * 2011-09-26 2014-02-05 株式会社東芝 情報処理装置、情報処理方法およびプログラム
US9569594B2 (en) 2012-03-08 2017-02-14 Nuance Communications, Inc. Methods and apparatus for generating clinical reports
US9412372B2 (en) * 2012-05-08 2016-08-09 SpeakWrite, LLC Method and system for audio-video integration
US9064492B2 (en) 2012-07-09 2015-06-23 Nuance Communications, Inc. Detecting potential significant errors in speech recognition results
US10504622B2 (en) 2013-03-01 2019-12-10 Nuance Communications, Inc. Virtual medical assistant methods and apparatus
US11024406B2 (en) 2013-03-12 2021-06-01 Nuance Communications, Inc. Systems and methods for identifying errors and/or critical results in medical reports
US9292254B2 (en) * 2013-05-15 2016-03-22 Maluuba Inc. Interactive user interface for an intelligent assistant
US11183300B2 (en) 2013-06-05 2021-11-23 Nuance Communications, Inc. Methods and apparatus for providing guidance to medical professionals
US10496743B2 (en) 2013-06-26 2019-12-03 Nuance Communications, Inc. Methods and apparatus for extracting facts from a medical text
US10331763B2 (en) 2014-06-04 2019-06-25 Nuance Communications, Inc. NLU training with merged engine and user annotations
US10373711B2 (en) 2014-06-04 2019-08-06 Nuance Communications, Inc. Medical coding system with CDI clarification request notification
US10366424B2 (en) 2014-06-04 2019-07-30 Nuance Communications, Inc. Medical coding system with integrated codebook interface
US10754925B2 (en) 2014-06-04 2020-08-25 Nuance Communications, Inc. NLU training with user corrections to engine annotations
US10319004B2 (en) 2014-06-04 2019-06-11 Nuance Communications, Inc. User and engine code handling in medical coding system
US10366687B2 (en) 2015-12-10 2019-07-30 Nuance Communications, Inc. System and methods for adapting neural network acoustic models
US11152084B2 (en) 2016-01-13 2021-10-19 Nuance Communications, Inc. Medical report coding with acronym/abbreviation disambiguation
CN106409296A (zh) * 2016-09-14 2017-02-15 安徽声讯信息技术有限公司 基于分核处理技术的语音快速转写校正系统
US10949602B2 (en) 2016-09-20 2021-03-16 Nuance Communications, Inc. Sequencing medical codes methods and apparatus
US10503467B2 (en) 2017-07-13 2019-12-10 International Business Machines Corporation User interface sound emanation activity classification
US11133091B2 (en) 2017-07-21 2021-09-28 Nuance Communications, Inc. Automated analysis system and method
US11024424B2 (en) 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
JP7202938B2 (ja) * 2019-03-20 2023-01-12 Tvs Regza株式会社 番組名検索支援装置、及び、番組名検索支援方法
JP7169921B2 (ja) * 2019-03-27 2022-11-11 本田技研工業株式会社 エージェント装置、エージェントシステム、エージェント装置の制御方法、およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3676856A (en) * 1970-08-11 1972-07-11 Ron Manly Automatic editing system and method
US3770892A (en) * 1972-05-26 1973-11-06 Ibm Connected word recognition system
US4041467A (en) * 1975-11-28 1977-08-09 Xerox Corporation Transcriber system for the automatic generation and editing of text from shorthand machine outlines
JPS58189696A (ja) * 1982-04-30 1983-11-05 日産自動車株式会社 車両用音声認識装置
US4627001A (en) * 1982-11-03 1986-12-02 Wang Laboratories, Inc. Editing voice data

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8117034B2 (en) 2001-03-29 2012-02-14 Nuance Communications Austria Gmbh Synchronise an audio cursor and a text cursor during editing
US8380509B2 (en) 2001-03-29 2013-02-19 Nuance Communications Austria Gmbh Synchronise an audio cursor and a text cursor during editing
US8706495B2 (en) 2001-03-29 2014-04-22 Nuance Communications, Inc. Synchronise an audio cursor and a text cursor during editing
JP2005301953A (ja) * 2004-04-12 2005-10-27 Kenichi Asano 聞き手の側のペースで音声とそれに対応する文章を関連させる方法

Also Published As

Publication number Publication date
ATE123893T1 (de) 1995-06-15
AT390685B (de) 1990-06-11
CA2001164C (en) 2000-11-28
EP0366192B1 (de) 1995-06-14
HK199496A (en) 1996-11-08
KR0135975B1 (ko) 1998-05-15
ES2075848T3 (es) 1995-10-16
DE58909293D1 (de) 1995-07-20
KR900006856A (ko) 1990-05-09
ATA264788A (de) 1989-11-15
AU616807B2 (en) 1991-11-07
CA2001164A1 (en) 1990-04-25
US5031113A (en) 1991-07-09
EP0366192A3 (de) 1991-03-13
AU4367289A (en) 1990-05-03
JP3263392B2 (ja) 2002-03-04
EP0366192A2 (de) 1990-05-02

Similar Documents

Publication Publication Date Title
JPH02163819A (ja) テキスト処理装置
EP1702319B1 (en) Error detection for speech to text transcription systems
JPS5862699A (ja) 音声認識装置
JP2002132287A (ja) 音声収録方法および音声収録装置および記憶媒体
EP0472193A2 (en) Translation device based on voice recognition and voice synthesis
JPH0554960B2 (ja)
JP2686085B2 (ja) 音声認識システム
JPS6226049B2 (ja)
JPH01106098A (ja) 音声認識システム
JPS63316899A (ja) 音声認識システム
JPH01106099A (ja) 音声認識システム
JPH10207349A (ja) カード式語学学習機および音声比較システム
JPH01290000A (ja) 音声認識方式
JPH0652479B2 (ja) 音声分析方式
JPH01106096A (ja) 音声認識システム
JPH01106097A (ja) 音声認識システム
JPH0465391B2 (ja)
JPH01293429A (ja) 文章作成システム
JPS6038745B2 (ja) 音声情報入力装置
JPS60185999A (ja) 日本語音声入力装置
JPS6011897A (ja) 音声認識装置
JPH01293428A (ja) 文章作成システム
JPS6070497A (ja) 音声認識装置
JPH01293430A (ja) 文章作成システム
JPS59176791A (ja) 音声登録方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees