CN1238489A - 显示从语言信号得出的字的方法 - Google Patents

显示从语言信号得出的字的方法 Download PDF

Info

Publication number
CN1238489A
CN1238489A CN99106731A CN99106731A CN1238489A CN 1238489 A CN1238489 A CN 1238489A CN 99106731 A CN99106731 A CN 99106731A CN 99106731 A CN99106731 A CN 99106731A CN 1238489 A CN1238489 A CN 1238489A
Authority
CN
China
Prior art keywords
word
reliability value
shows
words
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN99106731A
Other languages
English (en)
Inventor
V·斯坦比斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1238489A publication Critical patent/CN1238489A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Machine Translation (AREA)

Abstract

在从有声电文分辨电文的各个字并显示出来的电话录音系统中,有些分辨出来的字往往出错,这些差错得由操作人员根据显示出来的电文加以校正。为更快地确定需要校正的可能性最大的一些字,本发明提出了确定各字的可靠性值、并据此显示各字的方法。显示的方式可包括以不同的灰色调、颜色、字体或以字底划线的方式显示各字的方式。实际做法是将各可靠性值与各阈值相比较,并根据剩余的电文以不同方式只显示那些可靠性值低于所述阈值或某些阈值的字。

Description

显示从语言信号得出的字的方法
本发明涉及在显示器上显示从输入的语言信号得出的字的一种方法,求出各字的可靠性值。
这类方法在所谓电话录音系统中是大家值得熟悉的。在这种系统中,从语言信号得出的字显示在屏幕上。这里,直接打印出从电话录音得出的电文通常是不切实际的,因为按目前的水平来说,系统中出现的差错太多,这些差错必须要先根据屏幕上显示的电文校正才行。为达到此目的,操作人员为确定或校正系统分辨得不好的任何字可能必须在编排记录下来的话音电文的同时小心翼翼地通读显示出来的电文。这需要花大量的时间,从而抵消了有声电文自动转换成显示出来的电文在时间上取得的效益。
本发明的目的是提供本说明书开端所述的那一种能简化显示出来的字组成的电文的校正过程并能提高校正速度的方法。
按照本发明,这个目的是通过根据可靠性值以不同方式显示每一个字达到的。
从1995年第一卷的ICASSP学报第297-300页上可以知道确定从语言信号得出的每一个字的可靠性值的方法。这种方法有多种用途,例如确定从语言信号得出的字是否能为特别是在进行对话的信息系统所接受或遭排斥。实际上,可靠性值表示分辨字时的确实程度,具体地说,所分辨的字与系统中存储的声音模式的对应程度,若采用语言模式则为这个字可能出现在所分辨的字串中所述位置的概率有多大。按照本发明,现在是利用可靠性值来显示电文中以话音形式出现的字错误分辨出的概率。用光的形式着重突出校正处理过程中可靠性低的每一个字,可以使操作人员很快确定哪一些字可能分辨错了,从而可以提高校正的速度。
根据可靠性值显示每一个字,可以按各种不同的方式进行。一种可行的方法是用与可靠性值有关的灰色调显示每一个字。另一种方法是根据可靠性值改变所显示的字的颜色。此外,还可以根据可靠性值衬以不同的背景显示每一个字,以不同的字体或以划底线的方式显示每一个字。这里“字体”一词通常包括不同的字体:黑体字、斜体字或任何其它不同的字形。这些方式也可以组合起来使用,例如,不仅可用不同的灰色调显示可靠性值极低的每一个字,而且还可以同时给字划底线。
举例说,显示效果与可靠性值成比例时可以取得极其卓越的显示效果,而这在特别是给可靠性值设起码一个阈值且显示是根据是否在向下的方向超过阈值或其中一个阈值进行时用不同的字体或划底线形式的情况下更是可行。接着,以正常方式显示出以相当高、高于(最高)阈值的可靠性值确定下来的每一个字,只有那些可靠性值低于所述阈值或某阈值的字才以不同的方式显示出来。于是,这类字甚至可以更快地分辨出来,从而需要校正这类字时甚至可以更轻易地进行校正。
可以改变一个或多个阈值这一点是有用的。改变阈值的这项操作可以在例如操作人员发现以不同的方式显示出来、正确分辨出来的字多到超出需要的程度时由操作人员进行。
校正显示出来的电文通常是使光标自动显示在电文的一连串字上,可能的话同时再显示出所存储的作为这些字的来源的语言信号。光标可以在特别是某一个字以不同的形式显示时通过操动按键使其停下来,从而使操作人员在发现该字不对时校正这个字。此外,有的系统不仅从各说出的字确定某一个字、将其显示出来,而且还给各单字提供可供选择的一些字或可供选择的完整句子,欧洲专利EP0614172A2介绍了这种系统。在这种情况下,有用的一点是,这些可供选择的字自动毗邻光标停下来所在的各字、最好按可靠性值的顺序显示出来的时候,就可以更快地进行校正。
本发明还涉及一种在显示器上显示从输入的有声语言信号得出的每一个字的装置。该显示装置有一个处理器和一个控制器。处理器接收有声语言信号并提供表示从所述信号得出的字和有关可靠性值的数据。控制器将所述数据转换成控制显示器的控制信号。
本发明,其目的在于在这种方案中更快地从显示器上显示的许多字中分辨出可能分辨错的字,还有这样的特点:表示可靠性值的数据都提供给控制器,以便改变传送给显示器给有关字产生的控制信号。
表示分辨出的字各字母的数据通常是8位数据字。这些数据提供给控制器,由控制器转换成例如显像管的控制信号,从而以一目了然的电文的形式显示这些字。这种用途的控制器还接收其它表示电文拟采用的显示方式(例如字形的大小、字体类型、颜色等)的控制指令。接着,提供给控制器的可靠性值或从可靠性值得出的数据提供给控制器,作为另外确定诸字拟如何显示的控制指令。
下面参看附图更详细地说明本发明实施方案的一个实例。附图中,有声提供的语言信号由传声器10转换成电信号,然后加到处理部分12,由处理部分12将电信号转换成一系列作为语言信号的特征测试信号。这些测试信号提供给处理器14,处理器14也接收来自存储存储器16的基准信号,从而将各测试信号与一系列基准信号相比较。各个字根据某一系列基准信号与该一系列测试信号之间的相似性确定,这个确定通常使用来自另一存储器18的语言模式值进行,所述诸字由存储器16中的一系列基准信号确定。
这些字或这些字的字母依次在线路15上提供给控制器20。控制器20借助于控制指令调节,控制指令则最好事先以图中没有示出的方式提供给控制器,使控制器将线路15上的数据信号转换成最好是显像管22的控制信号。
此外,通过来自存储器16的基准信号与处理器14中测试信号的比较,可能的话也使用来自存储器18的语言模式信号,产生各个字的可靠性值,经线路17提供给控制器。这里,所述可靠性值的作用也和上述控制指令类似,即影响控制部分20产生显像管22的控制信号的过程,从而使各字根据其可靠性值显示出来。这时,可靠性值也可以例如与处理器14中的一个或几个阈值相比较,从而使只有那些表示某些阈值以上或以下有关字可靠性值的信号才经线路17传送。指令可经输入装置24(例如键盘)传送给处理器14,这些指令能改变阈值。此外,那些非妥善从语言信号得出的字的校正值也借助于这个输入装置24输入。控制指令也可以经此输入装置24传送,由输入装置24消除某指示显示字可供选择字的显示,和选择这些可供选择的其中一个字。

Claims (10)

1.一种在显示器上显示从输入的语言信号得出的字的方法,求出各字的可靠性值,其特征在于,各字根据其各自的可靠性值以不同的方式显示出来。
2.如权利要求1所述的方法,其特征在于,各字以与可靠性值有关的灰色调显示出来。
3.如权利要求1所述的方法,其特征在于,各字以与可靠性值有关的颜色显示出来。
4.如权利要求1所述的方法,其特征在于,各字以与可靠性值有关的字体显示出来。
5.如权利要求1所述的方法,其特征在于,各字根据可靠性值以底下划线的形式显示出来。
6.如权利要求1所述的方法,其特征在于,各字根据可靠性值配衬以不同的背景显示出来。
7.如权利要求1至6中任一权利要求所述的方法,其特征在于,给可靠性值规定了起码一个或多个阈值,显示就根据是否在向下的方向超过一个或多个阈值进行的。
8.如权利要求7所述的方法,其特征在于,所述一个或多个阈值可加以改变。
9.如权利要求7或8所述的方法,其中给起码一些字产生了可靠性值较低的一些可供选择的字,其特征在于,在输入指令时显示可靠性值低于起码一个阈值的字的起码一个可供选择的字,在输入另一指令时插入所述起码一个可供选择的字,使其取代原来显示的字。
10.一种在显示器上显示从有声语言信号得出的字的装置,配备有:
一个处理装置(12,14,16,18),供接收有声语言信号并提供表示从所述信号得出且与可靠性值有关的数据;
一个控制器(20),供将数据转换成显示器(22)的控制信号;
其特征在于,表示可靠性值的数据提供给控制器(20),其目的在于改变对应于显示器(22)各有关字的控制信号。
CN99106731A 1998-05-13 1999-05-10 显示从语言信号得出的字的方法 Pending CN1238489A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19821422A DE19821422A1 (de) 1998-05-13 1998-05-13 Verfahren zum Darstellen von aus einem Sprachsignal ermittelten Wörtern
DE19821422.7 1998-05-13

Publications (1)

Publication Number Publication Date
CN1238489A true CN1238489A (zh) 1999-12-15

Family

ID=7867631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN99106731A Pending CN1238489A (zh) 1998-05-13 1999-05-10 显示从语言信号得出的字的方法

Country Status (6)

Country Link
US (1) US20020128833A1 (zh)
EP (1) EP0957470A3 (zh)
JP (1) JPH11352992A (zh)
KR (1) KR19990088216A (zh)
CN (1) CN1238489A (zh)
DE (1) DE19821422A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100508894C (zh) * 2002-12-27 2009-07-08 株式会社东芝 以与其它信息可区别的方式显示预定信息的医学成像装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006183A (en) * 1997-12-16 1999-12-21 International Business Machines Corp. Speech recognition confidence level display
WO2002009093A1 (en) * 2000-07-20 2002-01-31 Koninklijke Philips Electronics N.V. Feedback of recognized command confidence level
US6785650B2 (en) * 2001-03-16 2004-08-31 International Business Machines Corporation Hierarchical transcription and display of input speech
DE10138408A1 (de) * 2001-08-04 2003-02-20 Philips Corp Intellectual Pty Verfahren zur Unterstützung des Korrekturlesens eines spracherkannten Textes mit an die Erkennungszuverlässigkeit angepasstem Wiedergabegeschwindigkeitsverlauf
EP1442451B1 (en) * 2001-10-31 2006-05-03 Koninklijke Philips Electronics N.V. Method of and system for transcribing dictations in text files and for revising the texts
DE10220521B4 (de) * 2002-05-08 2005-11-24 Sap Ag Verfahren und System zur Verarbeitung von Sprachdaten und Klassifizierung von Gesprächen
EP1363271A1 (de) * 2002-05-08 2003-11-19 Sap Ag Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs
EP1361740A1 (de) * 2002-05-08 2003-11-12 Sap Ag Verfahren und System zur Verarbeitung von Sprachinformationen eines Dialogs
US6993482B2 (en) * 2002-12-18 2006-01-31 Motorola, Inc. Method and apparatus for displaying speech recognition results
EP1611570B1 (en) * 2003-03-31 2017-06-28 Nuance Communications Austria GmbH System for correction of speech recognition results with confidence level indication
KR101462932B1 (ko) 2008-05-28 2014-12-04 엘지전자 주식회사 이동 단말기 및 그의 텍스트 수정방법
KR101233561B1 (ko) * 2011-05-12 2013-02-14 엔에이치엔(주) 단어 수준의 후보 생성에 기초한 음성 인식 시스템 및 방법
JP5799733B2 (ja) * 2011-10-12 2015-10-28 富士通株式会社 認識装置、認識プログラムおよび認識方法
US9558747B2 (en) * 2014-12-10 2017-01-31 Honeywell International Inc. High intelligibility voice announcement system
US20220013119A1 (en) * 2019-02-13 2022-01-13 Sony Group Corporation Information processing device and information processing method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5884258A (en) * 1996-10-31 1999-03-16 Microsoft Corporation Method and system for editing phrases during continuous speech recognition
US6006183A (en) * 1997-12-16 1999-12-21 International Business Machines Corp. Speech recognition confidence level display

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100508894C (zh) * 2002-12-27 2009-07-08 株式会社东芝 以与其它信息可区别的方式显示预定信息的医学成像装置

Also Published As

Publication number Publication date
EP0957470A3 (de) 1999-12-15
JPH11352992A (ja) 1999-12-24
EP0957470A2 (de) 1999-11-17
US20020128833A1 (en) 2002-09-12
DE19821422A1 (de) 1999-11-18
KR19990088216A (ko) 1999-12-27

Similar Documents

Publication Publication Date Title
CN1238489A (zh) 显示从语言信号得出的字的方法
EP1368808B1 (en) Transcription and display of input speech
US7401018B2 (en) Foreign language learning apparatus, foreign language learning method, and medium
CN101253549B (zh) 将声音和人工转录文本进行同步的系统和方法
US4769845A (en) Method of recognizing speech using a lip image
US8200487B2 (en) Text segmentation and label assignment with user interaction by means of topic specific language models and topic-specific label statistics
US4891786A (en) Stroke typing system
JP4446312B2 (ja) 音声認識中に可変数の代替ワードを表示する方法及びシステム
EP0752129B1 (en) A method and apparatus for providing a human-machine dialog supportable by operator intervention
KR19990062566A (ko) 음성 인식 신뢰도 레벨 디스플레이
US20030028375A1 (en) Method of supporting the proof-reading of speech-recognized text with a replay speed adapted to the recognition reliability
EP0087199B1 (en) Device for generating audio information of individual characters
US8364489B2 (en) Method and system for speech based document history tracking
EP0956552A1 (en) Method and apparatus for combined information from speech signals for adaptive interaction in teaching and testing
CN101266792A (zh) 语音识别系统和语音识别方法
JPH06110494A (ja) 発音学習装置
KR930010909B1 (ko) 한글자모열로부터의 한글문자 인식방법
EP1475776B1 (en) Dynamic pronunciation support for speech recognition training
JP4296290B2 (ja) 音声認識装置、音声認識方法及びプログラム
CN112634862B (zh) 一种信息交互方法、装置、可读存储介质和电子设备
JPH06348297A (ja) 発音練習装置
JP2001092493A (ja) 音声認識修正方式
JP6790003B2 (ja) 編集支援装置、編集支援方法及びプログラム
KR20010085219A (ko) 서브단어 메모리를 포함하는 음성인식 장치
JPS6211732B2 (zh)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication