KR0135975B1 - 텍스트 처리 시스템 - Google Patents

텍스트 처리 시스템

Info

Publication number
KR0135975B1
KR0135975B1 KR1019890015239A KR890015239A KR0135975B1 KR 0135975 B1 KR0135975 B1 KR 0135975B1 KR 1019890015239 A KR1019890015239 A KR 1019890015239A KR 890015239 A KR890015239 A KR 890015239A KR 0135975 B1 KR0135975 B1 KR 0135975B1
Authority
KR
South Korea
Prior art keywords
speech recognition
word
detected
memory
stored
Prior art date
Application number
KR1019890015239A
Other languages
English (en)
Other versions
KR900006856A (ko
Inventor
횔레르바우어 베르너
Original Assignee
에프.제이.스미트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에프.제이.스미트 filed Critical 에프.제이.스미트
Publication of KR900006856A publication Critical patent/KR900006856A/ko
Application granted granted Critical
Publication of KR0135975B1 publication Critical patent/KR0135975B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Communication Control (AREA)
  • Feed For Specific Animals (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Devices For Executing Special Programs (AREA)
  • Saccharide Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

내용 없음

Description

텍스트 처리 시스템
제1도는 텍스트 처리 시스템의 블럭선도이다.
* 도면의 주요부분에 대한 부호의 설명
1 : 음성 인식 장치4 : 컴퓨터
5 : 음성 분석기6 : 특징부 기억 메모리
7 : 워드 인식 장치8 : 음성 모델 메모리
9 : 음성 메모리11 : 학습 장치
12 : 워드 메모리13 : 표시 장치
14 : 프린터15 : 제 1 메모리
16 : 제 2 메모리17 : 키보드
기술분야
본 발명은 텍스트(text)처리 시스템에 관한 것이며, 여기서 텍스트에 대응하는 음성 신호는 음성신호에서 워드를 검출하는 음성 인식 장치에 인가되고, 그 후 상기의 워드는 디지탈 신호의 형태로 워드 메모리에 저장되며, 상기 메모리로부터 다른 처리 수단에 인가되고, 이러한 검출된 워드는 표시 장치에 의해 텍스트로서 제공될 수 있으며, 필요할 때 교정될 수도 있고, 프린터에 의해 프린트될 수 있다.
종래기술
그러한 텍스트 처리 시스템은 미국특허 제3,770,892호에 기술되어 있지만, 이 공보는 음성인식 장치에 의해 올바르게 검출되지 않은 워드를 교정하는 방법을 설명하고 있지 않다.
워드검출에서 에러가 비교적 이러한 형태의 현존하는 텍스트 처리시스템에서 종종 발생하기 때문에, 그러한 텍스트나 교정 시설은 매우 중요하다.
본 발명의 목적은 검출된 워드가 검색될 수 있고, 틀리게 검출된 워드는 간단하고 빠르며 확실하게 교정될 수 있는 방법으로 서두에서 한정된 형태의 텍스트 처리 시스템을 구성하는 것이다.
발명의 개요
본 발명에 따라, 이러한 것은 음성 신호가 제1메모리에 저장되고, 개시 표시와 종료 표시는 키보드와 협동하는 컴퓨터의 제어하에 음성 인식장치에 의해 검출된 워드에 할당되며, 이러한 표시는 제1메모리에 저장된 음성 신호에 알맞게 연결되고, 상기의 개시 표시와 종료 표시는 제2 메모리에 저장되며, 제2 메모리에 저장된 바와 같은 검출된 워드의 개시 표시와 종료 표시에 의해서 상기의 컴퓨터는 제1 메모리에 저장되고 검출된 워드와 일치하는 음성 신호와의 상관 관계를 확립할 수 있으며, 컴퓨터의 제어하에서 검출된 워드는 표시 장치상에서 눈에 띄게 될 수 있으며, 동시에 관련 오디오 신호는 청각적으로 재생될 수 있고, 키보드에 의해 데이타는 컴퓨터에 적재될 수 있으며, 검출된 워드에 의해 표시 장치상에는 눈에 띄게 되고, 필요할 때 교정될 수 있게 되어 성취된다. 텍스트와 일치하는 오디오 신호는 추가적으로 저장되고, 더우기 이러한 저장된 음성 신호의 상관 관계에서, 음성 인식 장치에 의해 검출된 텍스트의 워드와 적절히 연결된 개시 표시와 종료 표시 또한 저장되어 있기 때문에, 어느때라도 각각의 검출된 워드에 관련 음성 신호를 간단하게 할당시키거나 또는 역으로, 음성 신호의 각 부분에 일치하는 검출된 워드를 할당시키는 것이 가능하다. 그래서, 시스템의 사용자는 컴퓨터에 의해 표시 장치에 나타나고, 검색되거나 또는 교정될 워드와 관련된 본래의 음성 신호를 청각적으로 모니터할 수 있게 되어, 사용자는 올바르게 대응하는 워드를 식별할 수 있고, 필요하면, 키보드를 통하여 시스템으로 교정된 형태의 상기 워드를 입력시킬 수 있다. 다른 방법은 제1 메모리에 저장된 음성 신호가 계속해서 청각적으로 재생되고, 관련된 검출 워드는 동시에 컴퓨터에 의해 표시 장치상에서 나타난다는 점에서 표시 장치에 의해 표시된 바와 같은 텍스트의 검출된 워드의 계속적인 검색을 실시하는 것이며, 순간적으로 검출된 워드는 계속적으로 나타나게 되고, 동시에 시스템의 사용자는 관련된 본래의 음성 신호를 듣게 되고, 그럼으로써 필요로 하는 워드 교정이 사용자에 의해 간단하고 정확하게 인식되도록 해준다.
시스템에서, 음성 인식 장치는 학습 장치와 협동하고, 워드의 특정 스피커에 의해 발음된 음성 신호의 현상 특성은 음성 인식 장치에 의해 상기의 음성 신호로부터 유도되고, 그러한 현상은 상기의 학습 장치에 인가된 대응하는 음성 신호와 일치하는 워드 및 상기의 학습 장치에 인가된 음성 관련 파라미터와의 비교에 의해 학습 장치에 의해서 분석되고, 음성 인식의 처리중에 음성 인식 장치에 의해서 이용될 수 있는 스피커 관련 파라미터와 같은 음성 인식 장치에 저장되며, 표시 장치상에 나타나고 키보드에 의해 교정된 검출되어진 워드가 음성 인식 장치에 의해 본래 워드의 음성 신호로부터 유도된 특성을 함께 분석시키기 위해 학습 장치에 인가되는 것이 유익하다는 사실이 발견되었으며, 상기 분석의 처리중에 새롭게 유도된 스피커 관련 파라미터 역시 음성 인식 장치에 저장된다. 이러한 방식에서, 시스템의 학습 처리는 이미 교정된 전체 텍스트 뿐만아니라 교정된 워드에 대해서도 허용되어, 시스템의 사용 동안에 정확히 검출된 워드의 에러 비율이 일정하게 감소되고, 이러한 시스템은 또한 빠르게 특정한 스피커에 의해서 자주 사용된 특정 텍스트 시퀀스 또는 특정한 스피커의 특징적인 발음을 조정하게 된다.
본 발명의 실시예는 첨부한 도면을 참고로 한 비제한적 예를 사용하여 상세히 설명될 것이다. 도면의 제1도는 텍스트 처리 시스템의 블럭도를 도시한 것이다.
실시예
제1도에 도시된 블럭도에서 음성 인식 장치는 참조번호(1)로 표기되고 텍스트와 일치하는 음성 신호는 텍스트 처리 시스템의 입력(3)으로부터 상기 장치의 입력까지 전기 신호의 형태로 인가되며, 상기의 음성 신호는 마이크로폰으로부터 직접 얻어지거나 또는 임시 저장으로서 이용된 구술 기계에 의해 재생된다. 이러한 전기 신호는 아날로그 신호 또는 디지탈 신호가 될 수도 있고, 디지탈 신호는 사용된 음성 인식 장치의 형태에 의존하는 엔코드된 형태로 될 수 있으며, 현재의 경우에서 사용하기에 적절한 다양한 그러한 장치는 공지되어 있다. 음성인식장치(1)는 전체 텍스트 처리 시스템을 제어하는 컴퓨터(4)에 의해 제어된다. 음성 인식 장치(1)의 입력(2)으로부터, 전기 신호는 특징 메모리(6)에 연속적으로 저장된 주파수 스펙트럼내에서 에너지 집속 막대와 같이 이러한 신호의 특성인 묵음 특징을 결정하는 음성분석기(5)에 일반적인 방법으로 인가된다. 이러한 특징 메모리(6)는 음성 인식 장치(1)의 실제 워드 인식 장치(7)에 입력을 제공하며, 또한 장치에 의해서 식별될 개별 워드를 인에블시키는 메모리에 직렬로 접속된다. 통상적인 방법에서, 이러한 메모리는 특정한 스피커 또는 몇몇 스피커에 의해 발음된 예상 워드 시퀀스의 저장을 위한 음성 모델 메모리(8)를 포함하고, 음성 인식 시스템에 의해서 인식될 수 있는 워드에 대해 스피커와 관련된 음성 합성의 저장을 위한 음성학 메모리(9)를 포함하며, 특정한 스피커 또는 몇몇 스피커의 특징적인 발음과 관련있는 파라미터의 저장을 위한 발음 특징 메모리(10)를 포함하고 있다. 현재의 경우에서, 음성 인식 장치(1)는 또한 상술된 메모리(8,9,10)에 대한 액세스를 가지고 있고, 특징 메모리(6) 및 워드 인식장치(7)와 직접 협동하는 학습장치(11)를 포함하고 있다. 학습 처리 과정중에, 특징 메모리(6)에 저장되고, 음성 인식 장치(1)에 의해 워드의 특정한 스피커에 의해서 발음된 음성 신호로부터 유도되어진 특징은 예를들면 컴퓨터(4)에 의해 학습 장치에 인가되고, 대응하는 음성 신호와 연관되어 있는 워드 및 학습 장치에 인가된 메모리(8,9,10)에 저장된 음성 관련 파라미터와 비교하여 학습 장치(11)에 의해 분석되며, 그러한 특징은 스피커 관련 파라미터와 같은 음성 인식 장치의 메모리(8,9,10)에 저장되어, 그러한 것은 워드 인식 장치(7)에서 이용할 수 있게 된다.
상기 수단은 인식될 음성 신호에 내재된 완전한 텍스트의 개별 워드를 인에이블시키며, 그러한 워드는 디지탈 신호와 같이 워드 메모리(12)에 연속적으로 저장되며, 상기 메모리에서 다른 처리를 이용할 수 있으며, 컴퓨터(4)를 경유하여 프린터(14) 또는 표시 장치(13)에 인가될 수 있다. 이러한 방법으로, 음성 신호에 의해 표시된 텍스트는 개별 워드로 구성된 텍스트로서 표시 장치(13)위에 직접 표시될 수 있고, 검색 또는 교정을 할 수 있으며, 이러한 것은 그러한 음성 인식장치가 일반적으로 특정한 에러비율을 나타내기 때문에 필요하며, 그러한 것은 개별 워드 또는 워드 그룹이 올바르게 식별되지 않아서 표시 장치상에 올바르게 나타나지 않는다는 것을 의미하는 것이다.
잘못되어 검출된 워드의 교정을 용이하게 하기 위해서, 현재의 텍스트 처리 시스템은 후에 설명될 단계를 이용한다.
특히, 전기 신호와 같이 텍스트 처리 시스템의 입력(3)에 인가된 음성 신호는 제1메모리(15)에 저장된다. 제1메모리(15)에서 음성 신호를 저장하기 위해 다양한 방법이 이러한 메모리의 구성에 의존하여 이용될 수 있다. 예를들면, 그러한 제1메모리는 오디오 테이프 기구일 수도 있으며, 오디오 신호는 아날로그 신호와 같이 저장된다. 그러나, 제1메모리는 디지탈 메모리가 될 수도 있으며, 오디오 신호는 숫자화 또는 엔코딩 후에 인가되고, 그러한 메모리는 메모리 내용에 대한 더 빠른 액세스의 잇점을 가지고 있다. 상기 메모리는 예를들면 디스크 저장 또는 고상 메모리가 될 수 있다. 더우기, 중앙 표시 시스템의 메모리는 또한 그러한 제1메모리로서 사용될 수 있다. 선택적으로, 음성 인식 장치(1)의 입력(2)에 인가될 입력 신호는 그러한 제1메모리의 출력에 의해서 제공될 수 있다.
더우기, 개시 표시 및 종료 표시는 음성 인식 장치에 의해서 검출된 개별 워드에 할당되고 워드 메모리(12)에 저장되며, 이러한 표시는 제1메모리(15)에 저장된 음성 신호와 특정한 시간 관계에 있다. 이러한 방법에서, 모든 검출된 워드는 시 표시 및 종료 표시에 의해 제한되며, 워드의 종료 표시는 다음 워드의 개시 표시에 동시에 구성할 수 있다. 이러한 관점에서, 이러한 표시를 발생시킬 때 제1메모리(15)에 저장된 음성 신호와의 특정한 시간 관계가 보장되는 것은 필수적인 것이다. 이러한 목적을 위해, 시간 계산 처리가 수행될 수 있으며, 예를 들면 컴퓨터(4)의 클럭 신호에 의해, 개별 시간 간격을 연속적으로 한정하는 음성 인식 처리 동안에 개별 워드 검출 사이에서 발생하게 된다. 그래서 발생된 개별 검출 워드의 개시 및 종료 표시는 제2메모리(16)에 저장되고, 이러한 것은 워드 인식 장치(7)에 접속되며, 이러한 제2메모리(16)에 대한 액세스는 컴퓨터(4)를 경유하여 제공된다. 컴퓨터(4)는 또한 제1메모리에 대한 액세스를 가지고 있으며, 여기서 오디오 신호가 저장된다. 제2메모리(16)에 저장된 검출되어진 워드의 개시 및 종료 표시에 의해, 컴퓨터(4)는 음성적으로 재생될 일치하는 오디오 신호와 컴퓨터(4)의 제어하에서, 예를들면 커서(cursor) 또는 밑줄로 표시 장치(13)에 의해 표시된 검출 워드가 눈에 띄게 해주며, 제1메모리에 저장되고 검출된 워드와 관련된 음성 신호의 상관 관계를 확립시킬 수 있다.
그래서, 표시 장치(13)에 의해 표시된 워드로 구성되어진 텍스트는 간단하고 빠르며 확실하게 검색되거나 또는 교정될 수 있다. 명령 및 데이타의 엔트리로 이용되고 컴퓨터(4)와 협동하는 키보드(17)에 의해, 표시 장치(13)상에 표시된 눈에 띄는 워드는 필요할 때 교정될 수 있다. 예를들면, 표시 장치상에 표시된 워드로 구성되어진 완전한 텍스트내에서, 이러한 텍스트의 단일 워드는 키보드(17)와 컴퓨터(4)의 제어하에서 눈에 띄게 될 수 있으며, 그후 컴퓨터에 의해서 제2 메모리(16)에 저장되고 눈에 띄는 워드와 일치하는 개시 표시 및 종료 표시는 검출되고, 상기 표시에 의존하여 제1메모리(15)에 저장된 일치하는 오디오 신호는 예를들면 확성기(18)에 의해 음성적으로 재생될 수 있고 판독될 수 있으며, 그러한 재생은 재발될 수도 있고 재발되지 않을 수도 있다. 이러한 방식에서, 시스템의 사용자는 대응하는 워드가 음성 인식장치(1)에 의해서 적절히 또는 부적절하게 검출되어 왔는지의 여부를 입증하기 위해 대응하는 눈에 띄어진 워드와 일치하는 오디오 신호의 모니터를 하는 직접적인 방법을 가지고 있다. 비적절하게 검출된 워드의 경우에서, 시스템의 사용자는 키보드(17)에 의해 교정 워드와 비적절하게 검출된 워드를 대체시킬 수 있다. 그러나, 제1메모리(15)에 저장된 음성 신호가 제2메모리(16)에 저장된 것과 같은 모든 검출된 워드의 개시 및 종료 표시와 함께 컴퓨터(4)에 의해 일치하는 검출된 워드가 동시에 눈에 띄게 되는 동안에, 음성적으로 계속해서 재생되는 그러한 방법으로 표시 장치(13)에 의해 표시된 텍스트의 연속적인 검색을 수행하는 것도 가능하다. 그래서, 시스템의 사용자는 연속적으로 구두(spoken)텍스트를 청취하고, 동시에 표시된 텍스트로 눈에 띄게 된 음성 인식 장치에 의해서 검출된 워드에 관심이 끌리게 된다. 상술된 텍스트 처리 시스템을 사용한 이러한 다른 방법의 결과로서 텍스트가 간단하고 확실하게 교정되고 검색되는 것은 명백하며, 그 후 완료된 교정 텍스트는 프린터(14)에 의해 프린트될 수 있다.
특징 메모리(6)에 저장된 특징과 함께 키보드(17)에 의해 교정되고 표시 장치(13)상에서 눈에 띄게 되어온 검출된 워드의 교정된 번역과, 음성 인식 장치(1)에 의해 본래 워드의 음성 신호로부터 유도되어온 특징이 분석을 위한 학습 장치(11)에 인가되면, 이러한 분석 과정에서 새롭게 유도된 스피커 관련 파라미터는 음성 인식 장치(1)의 메모리(8,9,10)에 또한 저장된다. 현재의 경우에서, 음성 인식 장치(1)에 의해 전체 텍스트의 음성 신호로부터 유도된 모든 특징은 계속해서 특징 메모리(6)내의 그러한 학습 처리에 이용될 수 있고, 워드의 음성 신호와 일치하는 특징은 항상 판독될 수 있으며, 이러한 것은 비교적 큰 저장용량을 가지고 있는 특징 메모리(6)를 필요로 한다. 다른 방법은 그러한 학습 처리를 위해 제1메모리(15)에 저장된 음성 신호를 이용하는 것이고, 특징 메모리(6)에 음성 신호를 다시 저장시키고, 음성 인식 장치(1)에 의해 매번 대응하는 특징을 재검출하는 것이며, 이러한 특징메모리(6)의 저장 용량은 더 작아질 수 있게 된다. 이러한 목적을 위해, 예를 들면 스위치(19)에 의해 시스템의 입력(3)대신에 제1메모리(15)의 출력에 음성 인식 장치(1)의 입력(2)을 접속시키는 것도 가능하다. 그뒤, 컴퓨터(4)는 음성 인식장치에 의해 검출된 대응하는 워드와 일치하고, 제1메모리(15)에 저장된 모든 음성 신호 부분에 대한 액세스를 다시 제공한다. 이러한 방법에서, 학습 장치(11)는 음성 인식 장치(1)가 다른 학습 처리를 수행하는 그러한 방법으로 음성 인식 장치(1)의 메모리(8,9,10)에 저장된 스피커 관련 파라미터를 변조시키거나 또는 갱신시키며, 미래에 그러한 워드와 일치하는 음성 신호가 다시 발생하면 일단 음성 인식 장치(1)에 의해서 올바르게 검출된 상기 워드의 확률이 증가하도록 해주는 대응하는 스피커와 관련되어 수행되므로, 그러한 텍스트 처리 시스템의 에러 비율은 계속해서 감소된다.
음성 인식 장치(1)에 의해 잘못 검출되어온 모든 워드가 키보드(17)에 의해 교정된 후 특징 메모리(6)에 저장되고 음성 인식 장치에 의해 본래 워드의 음성 신호로부터 유도된 특징과 함께 완전한 텍스트를 구성하는 워드가 분석용 학습 장치(11)에 응용되면, 이러한 분석 과정에서 얻어진 새롭게 유도된 스피커 관련 파라미터가 음성 인식 장치의 메모리(8,9,10)에 또한 저장되는 것이 이롭다는 것을 발견하게 되었다. 이러한 방법으로, 이미 교정된 전체 텍스트는 시스템의 학습 처리에서 이용되어, 잘못 검출된 워드의 에러 비율은 감소되고 특정한 스피커의 특징적인 발음과 대응하는 스피커에 의해 사용된 특정한 표현(phrases)에 대한 시스템의 신속한 조정이 성취되어, 결과적으로 그러한 시스템 수행의 실질적인 향상을 가져오게 된다.
이전의 설명으로부터 명백하게 된 바와같이, 기술된 실시예의 다양한 변경은 본 발명의 범위내에서 가능하다. 이것은 특히 음성 신호가 제1메모리에 저장되는 방법과, 개시 표시 및 종료 표시가 발생되고 분석되는 방법에 포함되며, 이러한 표시는 음성 인식 장치에 의해서 검출된 워드를 한정하며, 실제의 음성 인식 장치의 동작을 한정한다. 그리고, 그러한 텍스트 처리 시스템이, 예를들면 텍스트 합병과 같은, 그러한 시스템에서 통상적인 다른 기능을 또한 수행할 수 있음은 명백한 것이다.

Claims (3)

  1. (정정) 텍스트에 대응하는 음성 신호를 음성 인식 장치에 공급하고, 이 음성 인식 장치로 음성 신호중의 워드를 검출하고, 검출한 워드를 디지탈 신호의 형태로 워드 메모리에 저장함과 동시에, 이 워드 메모리로부터 다른 처리 수단에 공급하고, 이 처리 수단에서 검출한 워드를 표시 장치에 의해 텍스트로서 재생하고, 필요할 때 정정하고 프린터에 의해 프린트할 수 있는 텍스트 처리 시스템에 있어서,
    상기 음성 신호를 제1메모리에 저장하고, 키보드와 협동하는 컴퓨터의 제어하에서 상기 음성 인식 장치에 의해 검출한 워드에 개시 표시 및 종료 표시를 할당하고, 이러한 표시는 제1메모리에 저장된 음성 신호와 시간적으로 관련되며, 상기 개시 표시 및 종료 표시를 제2메모리에 저장하고, 제2메모리에 저장되어 있는 검출된 워드의 개시 및 종료 표시에 의해 상기 컴퓨터는 검출된 워드에 대응하여 제1메모리에 저장되어 있는 음성 신호와의 상관관계를 확립할 수 있으며, 컴퓨터의 제어하에서 검출한 워드를 표시 장치상에서 강조 표시할 수 있음과 동시에 관련된 오디오 신호를 음향적으로 재생할 수 있으며, 상기 키보드에 의해 데이타를 상기 컴퓨터에 입력할 수 있으며, 필요한 경우 표시 장치상에 표시된 검출 워드를 정정할 수 있도록 구성한 것을 특징으로 하는 텍스트 처리 시스템.
  2. (정정) 제1항에 있어서,
    상기 음성 인식 장치는 학습 장치와 협동하고, 특정의 화자에 의해 발음된 워드의 음성 신호의 특징을 상기 음성 인식 장치에 의해 음성 신호로부터 추출할 수 있으며, 이러한 특징은 상기의 학습 장치에 공급한 음성 관련 파라미터와 학습 장치에 공급됨과 아울러 화자 관련 파라미터로서 음성 인식 장치에 기억되는 관련 음성 신호와 대응하는 워드와를 비교함으로써 학습장치에 의해 분석되고, 상기 특징이 음성 인식 처리에서 음성 인식 장치에 의해 이용될 수 있는 텍스트 처리시스템에 있어서,
    표시 장치상에 강조 표시되어 키보드를 거쳐 정정된 검출 워드를 학습 장치에 공급하고, 음성 인식 장치에 의해 원래 워드의 음향 신호로부터 추출한 상기 특징과 함께 분석하고, 상기 분석처리에서 새롭게 추출한 화자 관련 파라미터도 음성 인식 장치에 저장하도록 구성한 것을 특징으로 하는 텍스트 처리 시스템.
  3. (정정) 제1항에 있어서,
    상기 음성 인식 장치는 학습 장치와 협동하고, 특정의 화자에 의해 발음된 워드의 음성 신호 특유의 특징은 음성 인식 장치에 의해 상기 음성 신호로부터 추출되고, 이러한 특징은 상기 학습 장치에 의해, 학습 장치에 공급한 화자 관련 파라미터와 학습 장치에 공급됨과 아울러 음성 인식 장치에 화자 관련 파라미터로서 저장한 워드와를 비교함으로써 분석되고, 음성 인식 처리에서 음성 인식 장치에 의해서 이용되는 텍스트 처리 시스템에 있어서,
    음성 인식 장치에 의해 잘못 검출된 모든 워드를 키보드에 의해 정정한 후, 음성 인식 장치에 의해 원래 워드의 음성 신호로부터 추출한 특징과 함께 완전한 텍스트를 구성하는 워드를 분석용 학습 장치에 공급하고, 상기 분석 처리에서 새롭게 추출한 화자 관련 파라미터도 상기 음성 인식 장치에 저장하도록 구성한 것을 특징으로 하는 텍스트 처리 시스템.
KR1019890015239A 1988-10-25 1989-10-24 텍스트 처리 시스템 KR0135975B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AT0264788A AT390685B (de) 1988-10-25 1988-10-25 System zur textverarbeitung
ATA2647/88 1988-10-25

Publications (2)

Publication Number Publication Date
KR900006856A KR900006856A (ko) 1990-05-09
KR0135975B1 true KR0135975B1 (ko) 1998-05-15

Family

ID=3538028

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019890015239A KR0135975B1 (ko) 1988-10-25 1989-10-24 텍스트 처리 시스템

Country Status (10)

Country Link
US (1) US5031113A (ko)
EP (1) EP0366192B1 (ko)
JP (1) JP3263392B2 (ko)
KR (1) KR0135975B1 (ko)
AT (2) AT390685B (ko)
AU (1) AU616807B2 (ko)
CA (1) CA2001164C (ko)
DE (1) DE58909293D1 (ko)
ES (1) ES2075848T3 (ko)
HK (1) HK199496A (ko)

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02272495A (ja) * 1989-04-13 1990-11-07 Toshiba Corp 音声認識装置
US5329609A (en) * 1990-07-31 1994-07-12 Fujitsu Limited Recognition apparatus with function of displaying plural recognition candidates
US5530740A (en) * 1991-10-28 1996-06-25 Contigram Communications Corporation System and method for integrating voice, facsimile and electronic mail data through a personal computer
US7249026B1 (en) 1993-03-24 2007-07-24 Engate Llc Attorney terminal having outline preparation capabilities for managing trial proceedings
US5444615A (en) * 1993-03-24 1995-08-22 Engate Incorporated Attorney terminal having outline preparation capabilities for managing trial proceeding
US5369704A (en) * 1993-03-24 1994-11-29 Engate Incorporated Down-line transcription system for manipulating real-time testimony
US7631343B1 (en) 1993-03-24 2009-12-08 Endgate LLC Down-line transcription system using automatic tracking and revenue collection
JP3337798B2 (ja) * 1993-12-24 2002-10-21 キヤノン株式会社 画像データ及び音声データを処理する装置、データ処理装置並びにデータ処理方法
US5600756A (en) * 1994-05-11 1997-02-04 Sony Corporation Method of labelling takes in an audio editing system
US5477511A (en) * 1994-07-13 1995-12-19 Englehardt; C. Duane Portable documentation system
DE4434255A1 (de) * 1994-09-24 1996-03-28 Sel Alcatel Ag Vorrichtung zur Sprachaufzeichnung mit anschließender Texterstellung
US5745875A (en) * 1995-04-14 1998-04-28 Stenovations, Inc. Stenographic translation system automatic speech recognition
US5754978A (en) * 1995-10-27 1998-05-19 Speech Systems Of Colorado, Inc. Speech recognition system
US5960447A (en) * 1995-11-13 1999-09-28 Holt; Douglas Word tagging and editing system for speech recognition
US5960395A (en) * 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming
US5857099A (en) * 1996-09-27 1999-01-05 Allvoice Computing Plc Speech-to-text dictation system with audio message capability
GB2303955B (en) * 1996-09-24 1997-05-14 Allvoice Computing Plc Data processing method and apparatus
US6961700B2 (en) * 1996-09-24 2005-11-01 Allvoice Computing Plc Method and apparatus for processing the output of a speech recognition engine
KR100453021B1 (ko) * 1996-09-27 2005-04-08 코닌클리케 필립스 일렉트로닉스 엔.브이. 구두텍스트인식방법및시스템
US5774857A (en) * 1996-11-15 1998-06-30 Motorola, Inc. Conversion of communicated speech to text for tranmission as RF modulated base band video
US5909667A (en) * 1997-03-05 1999-06-01 International Business Machines Corporation Method and apparatus for fast voice selection of error words in dictated text
US6629074B1 (en) 1997-08-14 2003-09-30 International Business Machines Corporation Resource utilization indication and commit mechanism in a data processing system and method therefor
DE19740119A1 (de) * 1997-09-12 1999-03-18 Philips Patentverwaltung System zum Schneiden digitaler Video- und Audioinformationen
JP2000042782A (ja) * 1998-07-27 2000-02-15 Miyachi Technos Corp 溶接状況状態記録方法および溶接状況状態記録装置
US6151576A (en) * 1998-08-11 2000-11-21 Adobe Systems Incorporated Mixing digitized speech and text using reliability indices
GB2390930B (en) * 1999-02-05 2004-03-10 Custom Speech Usa Inc System and method for automating transcription services
US6385581B1 (en) 1999-05-05 2002-05-07 Stanley W. Stephenson System and method of providing emotive background sound to text
US7797730B2 (en) * 1999-06-24 2010-09-14 Engate Llc Downline transcription system using automatic tracking and revenue collection
EP1110204B1 (en) 1999-07-08 2005-06-01 Koninklijke Philips Electronics N.V. Adaptation of a speech recognizer from corrected text
DE60022976T2 (de) 1999-07-08 2006-07-06 Koninklijke Philips Electronics N.V. Spracherkennungseinrichtung mit transfermitteln
US6434547B1 (en) 1999-10-28 2002-08-13 Qenm.Com Data capture and verification system
US6754619B1 (en) 1999-11-15 2004-06-22 Sony Corporation Digital recording and playback system with voice recognition capability for concurrent text generation
EP1169678B1 (en) 1999-12-20 2015-01-21 Nuance Communications Austria GmbH Audio playback for text edition in a speech recognition system
US6513003B1 (en) 2000-02-03 2003-01-28 Fair Disclosure Financial Network, Inc. System and method for integrated delivery of media and synchronized transcription
US6778700B2 (en) 2001-03-14 2004-08-17 Electronics For Imaging, Inc. Method and apparatus for text detection
ATE286294T1 (de) 2001-03-29 2005-01-15 Koninkl Philips Electronics Nv Synchronisierung eines audio- und eines textcursors während der editierung
ATE317583T1 (de) * 2001-03-29 2006-02-15 Koninkl Philips Electronics Nv Texteditierung von erkannter sprache bei gleichzeitiger wiedergabe
DE10126020A1 (de) * 2001-05-28 2003-01-09 Olaf Berberich Hybrides Diktier-/Dialogsystem für Spracheingabe und Tastaturbestätigung
US20030046071A1 (en) * 2001-09-06 2003-03-06 International Business Machines Corporation Voice recognition apparatus and method
CN1312657C (zh) * 2001-10-12 2007-04-25 皇家飞利浦电子股份有限公司 用于标注所识别文本的部分的转录设备和方法
US6708148B2 (en) * 2001-10-12 2004-03-16 Koninklijke Philips Electronics N.V. Correction device to mark parts of a recognized text
US20030101054A1 (en) * 2001-11-27 2003-05-29 Ncc, Llc Integrated system and method for electronic speech recognition and transcription
US8498871B2 (en) 2001-11-27 2013-07-30 Advanced Voice Recognition Systems, Inc. Dynamic speech recognition and transcription among users having heterogeneous protocols
ATE417346T1 (de) * 2003-03-26 2008-12-15 Koninkl Philips Electronics Nv Spracherkennungs- und korrektursystem, korrekturvorrichtung und verfahren zur erstellung eines lexikons von alternativen
JP5025261B2 (ja) * 2003-03-31 2012-09-12 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 信頼水準の指示により音声認識の結果を訂正するためのシステム
US7263483B2 (en) * 2003-04-28 2007-08-28 Dictaphone Corporation USB dictation device
US7346506B2 (en) * 2003-10-08 2008-03-18 Agfa Inc. System and method for synchronized text display and audio playback
US20070067168A1 (en) * 2003-11-28 2007-03-22 Koninklijke Philips Electronics N.V. Method and device for transcribing an audio signal
US7590533B2 (en) * 2004-03-10 2009-09-15 Microsoft Corporation New-word pronunciation learning using a pronunciation graph
JP2005301953A (ja) * 2004-04-12 2005-10-27 Kenichi Asano 聞き手の側のペースで音声とそれに対応する文章を関連させる方法
FR2956515A1 (fr) 2010-02-15 2011-08-19 France Telecom Procede de navigation dans un contenu sonore
US8392186B2 (en) * 2010-05-18 2013-03-05 K-Nfb Reading Technology, Inc. Audio synchronization for document narration with user-selected playback
US9904768B2 (en) 2011-02-18 2018-02-27 Nuance Communications, Inc. Methods and apparatus for presenting alternative hypotheses for medical facts
US8768723B2 (en) 2011-02-18 2014-07-01 Nuance Communications, Inc. Methods and apparatus for formatting text for clinical fact extraction
US10460288B2 (en) 2011-02-18 2019-10-29 Nuance Communications, Inc. Methods and apparatus for identifying unspecified diagnoses in clinical documentation
US10032127B2 (en) 2011-02-18 2018-07-24 Nuance Communications, Inc. Methods and apparatus for determining a clinician's intent to order an item
JP5404726B2 (ja) * 2011-09-26 2014-02-05 株式会社東芝 情報処理装置、情報処理方法およびプログラム
US9569594B2 (en) 2012-03-08 2017-02-14 Nuance Communications, Inc. Methods and apparatus for generating clinical reports
US9412372B2 (en) * 2012-05-08 2016-08-09 SpeakWrite, LLC Method and system for audio-video integration
US9064492B2 (en) 2012-07-09 2015-06-23 Nuance Communications, Inc. Detecting potential significant errors in speech recognition results
US10504622B2 (en) 2013-03-01 2019-12-10 Nuance Communications, Inc. Virtual medical assistant methods and apparatus
US11024406B2 (en) 2013-03-12 2021-06-01 Nuance Communications, Inc. Systems and methods for identifying errors and/or critical results in medical reports
US9292254B2 (en) * 2013-05-15 2016-03-22 Maluuba Inc. Interactive user interface for an intelligent assistant
US11183300B2 (en) 2013-06-05 2021-11-23 Nuance Communications, Inc. Methods and apparatus for providing guidance to medical professionals
US10496743B2 (en) 2013-06-26 2019-12-03 Nuance Communications, Inc. Methods and apparatus for extracting facts from a medical text
US10373711B2 (en) 2014-06-04 2019-08-06 Nuance Communications, Inc. Medical coding system with CDI clarification request notification
US10319004B2 (en) 2014-06-04 2019-06-11 Nuance Communications, Inc. User and engine code handling in medical coding system
US10366424B2 (en) 2014-06-04 2019-07-30 Nuance Communications, Inc. Medical coding system with integrated codebook interface
US10331763B2 (en) 2014-06-04 2019-06-25 Nuance Communications, Inc. NLU training with merged engine and user annotations
US10754925B2 (en) 2014-06-04 2020-08-25 Nuance Communications, Inc. NLU training with user corrections to engine annotations
US10366687B2 (en) 2015-12-10 2019-07-30 Nuance Communications, Inc. System and methods for adapting neural network acoustic models
US11152084B2 (en) 2016-01-13 2021-10-19 Nuance Communications, Inc. Medical report coding with acronym/abbreviation disambiguation
CN106409296A (zh) * 2016-09-14 2017-02-15 安徽声讯信息技术有限公司 基于分核处理技术的语音快速转写校正系统
US10949602B2 (en) 2016-09-20 2021-03-16 Nuance Communications, Inc. Sequencing medical codes methods and apparatus
US10503467B2 (en) 2017-07-13 2019-12-10 International Business Machines Corporation User interface sound emanation activity classification
US11133091B2 (en) 2017-07-21 2021-09-28 Nuance Communications, Inc. Automated analysis system and method
US11024424B2 (en) 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
JP7202938B2 (ja) * 2019-03-20 2023-01-12 Tvs Regza株式会社 番組名検索支援装置、及び、番組名検索支援方法
JP7169921B2 (ja) * 2019-03-27 2022-11-11 本田技研工業株式会社 エージェント装置、エージェントシステム、エージェント装置の制御方法、およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3676856A (en) * 1970-08-11 1972-07-11 Ron Manly Automatic editing system and method
US3770892A (en) * 1972-05-26 1973-11-06 Ibm Connected word recognition system
US4041467A (en) * 1975-11-28 1977-08-09 Xerox Corporation Transcriber system for the automatic generation and editing of text from shorthand machine outlines
JPS58189696A (ja) * 1982-04-30 1983-11-05 日産自動車株式会社 車両用音声認識装置
US4627001A (en) * 1982-11-03 1986-12-02 Wang Laboratories, Inc. Editing voice data

Also Published As

Publication number Publication date
ES2075848T3 (es) 1995-10-16
HK199496A (en) 1996-11-08
DE58909293D1 (de) 1995-07-20
ATA264788A (de) 1989-11-15
ATE123893T1 (de) 1995-06-15
JPH02163819A (ja) 1990-06-25
AU616807B2 (en) 1991-11-07
AU4367289A (en) 1990-05-03
CA2001164A1 (en) 1990-04-25
CA2001164C (en) 2000-11-28
AT390685B (de) 1990-06-11
EP0366192A2 (de) 1990-05-02
EP0366192B1 (de) 1995-06-14
EP0366192A3 (de) 1991-03-13
US5031113A (en) 1991-07-09
KR900006856A (ko) 1990-05-09
JP3263392B2 (ja) 2002-03-04

Similar Documents

Publication Publication Date Title
KR0135975B1 (ko) 텍스트 처리 시스템
EP0865651B1 (en) Method of and system for recognizing a spoken text
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
US7143033B2 (en) Automatic multi-language phonetic transcribing system
EP0140777B1 (en) Process for encoding speech and an apparatus for carrying out the process
JPH0423799B2 (ko)
JP2008309856A (ja) 音声認識装置及び会議システム
JPH11505037A (ja) 言語認識装置の信頼性向上方法
JP2007510943A (ja) 音声−テキストトランスクリプションシステムの誤り検出
JPH0713594A (ja) 音声合成において音声の質を評価するための方法
JPH06110494A (ja) 発音学習装置
JPH0252279B2 (ko)
JP2000206987A (ja) 音声認識装置
US4783808A (en) Connected word recognition enrollment method
JP3277579B2 (ja) 音声認識方法および装置
JPS61179499A (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
JP2686085B2 (ja) 音声認識システム
JPS645320B2 (ko)
Scharenborg et al. Modelling human speech recognition using automatic speech recognition paradigms in SpeM
JPS6126678B2 (ko)
JP2008107641A (ja) 音声データ検索装置
JPH01290000A (ja) 音声認識方式
JPS60244989A (ja) 発音訓練機
JPH04238396A (ja) 音声合成用音声持続期間処理装置
JPS6011897A (ja) 音声認識装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20061221

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee