KR0135975B1 - 텍스트 처리 시스템 - Google Patents
텍스트 처리 시스템Info
- Publication number
- KR0135975B1 KR0135975B1 KR1019890015239A KR890015239A KR0135975B1 KR 0135975 B1 KR0135975 B1 KR 0135975B1 KR 1019890015239 A KR1019890015239 A KR 1019890015239A KR 890015239 A KR890015239 A KR 890015239A KR 0135975 B1 KR0135975 B1 KR 0135975B1
- Authority
- KR
- South Korea
- Prior art keywords
- speech recognition
- word
- detected
- memory
- stored
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 27
- 230000015654 memory Effects 0.000 claims abstract description 77
- 230000005236 sound signal Effects 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims 1
- 238000001514 detection method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Communication Control (AREA)
- Feed For Specific Animals (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Devices For Executing Special Programs (AREA)
- Saccharide Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
내용 없음
Description
제1도는 텍스트 처리 시스템의 블럭선도이다.
* 도면의 주요부분에 대한 부호의 설명
1 : 음성 인식 장치4 : 컴퓨터
5 : 음성 분석기6 : 특징부 기억 메모리
7 : 워드 인식 장치8 : 음성 모델 메모리
9 : 음성 메모리11 : 학습 장치
12 : 워드 메모리13 : 표시 장치
14 : 프린터15 : 제 1 메모리
16 : 제 2 메모리17 : 키보드
기술분야
본 발명은 텍스트(text)처리 시스템에 관한 것이며, 여기서 텍스트에 대응하는 음성 신호는 음성신호에서 워드를 검출하는 음성 인식 장치에 인가되고, 그 후 상기의 워드는 디지탈 신호의 형태로 워드 메모리에 저장되며, 상기 메모리로부터 다른 처리 수단에 인가되고, 이러한 검출된 워드는 표시 장치에 의해 텍스트로서 제공될 수 있으며, 필요할 때 교정될 수도 있고, 프린터에 의해 프린트될 수 있다.
종래기술
그러한 텍스트 처리 시스템은 미국특허 제3,770,892호에 기술되어 있지만, 이 공보는 음성인식 장치에 의해 올바르게 검출되지 않은 워드를 교정하는 방법을 설명하고 있지 않다.
워드검출에서 에러가 비교적 이러한 형태의 현존하는 텍스트 처리시스템에서 종종 발생하기 때문에, 그러한 텍스트나 교정 시설은 매우 중요하다.
본 발명의 목적은 검출된 워드가 검색될 수 있고, 틀리게 검출된 워드는 간단하고 빠르며 확실하게 교정될 수 있는 방법으로 서두에서 한정된 형태의 텍스트 처리 시스템을 구성하는 것이다.
발명의 개요
본 발명에 따라, 이러한 것은 음성 신호가 제1메모리에 저장되고, 개시 표시와 종료 표시는 키보드와 협동하는 컴퓨터의 제어하에 음성 인식장치에 의해 검출된 워드에 할당되며, 이러한 표시는 제1메모리에 저장된 음성 신호에 알맞게 연결되고, 상기의 개시 표시와 종료 표시는 제2 메모리에 저장되며, 제2 메모리에 저장된 바와 같은 검출된 워드의 개시 표시와 종료 표시에 의해서 상기의 컴퓨터는 제1 메모리에 저장되고 검출된 워드와 일치하는 음성 신호와의 상관 관계를 확립할 수 있으며, 컴퓨터의 제어하에서 검출된 워드는 표시 장치상에서 눈에 띄게 될 수 있으며, 동시에 관련 오디오 신호는 청각적으로 재생될 수 있고, 키보드에 의해 데이타는 컴퓨터에 적재될 수 있으며, 검출된 워드에 의해 표시 장치상에는 눈에 띄게 되고, 필요할 때 교정될 수 있게 되어 성취된다. 텍스트와 일치하는 오디오 신호는 추가적으로 저장되고, 더우기 이러한 저장된 음성 신호의 상관 관계에서, 음성 인식 장치에 의해 검출된 텍스트의 워드와 적절히 연결된 개시 표시와 종료 표시 또한 저장되어 있기 때문에, 어느때라도 각각의 검출된 워드에 관련 음성 신호를 간단하게 할당시키거나 또는 역으로, 음성 신호의 각 부분에 일치하는 검출된 워드를 할당시키는 것이 가능하다. 그래서, 시스템의 사용자는 컴퓨터에 의해 표시 장치에 나타나고, 검색되거나 또는 교정될 워드와 관련된 본래의 음성 신호를 청각적으로 모니터할 수 있게 되어, 사용자는 올바르게 대응하는 워드를 식별할 수 있고, 필요하면, 키보드를 통하여 시스템으로 교정된 형태의 상기 워드를 입력시킬 수 있다. 다른 방법은 제1 메모리에 저장된 음성 신호가 계속해서 청각적으로 재생되고, 관련된 검출 워드는 동시에 컴퓨터에 의해 표시 장치상에서 나타난다는 점에서 표시 장치에 의해 표시된 바와 같은 텍스트의 검출된 워드의 계속적인 검색을 실시하는 것이며, 순간적으로 검출된 워드는 계속적으로 나타나게 되고, 동시에 시스템의 사용자는 관련된 본래의 음성 신호를 듣게 되고, 그럼으로써 필요로 하는 워드 교정이 사용자에 의해 간단하고 정확하게 인식되도록 해준다.
시스템에서, 음성 인식 장치는 학습 장치와 협동하고, 워드의 특정 스피커에 의해 발음된 음성 신호의 현상 특성은 음성 인식 장치에 의해 상기의 음성 신호로부터 유도되고, 그러한 현상은 상기의 학습 장치에 인가된 대응하는 음성 신호와 일치하는 워드 및 상기의 학습 장치에 인가된 음성 관련 파라미터와의 비교에 의해 학습 장치에 의해서 분석되고, 음성 인식의 처리중에 음성 인식 장치에 의해서 이용될 수 있는 스피커 관련 파라미터와 같은 음성 인식 장치에 저장되며, 표시 장치상에 나타나고 키보드에 의해 교정된 검출되어진 워드가 음성 인식 장치에 의해 본래 워드의 음성 신호로부터 유도된 특성을 함께 분석시키기 위해 학습 장치에 인가되는 것이 유익하다는 사실이 발견되었으며, 상기 분석의 처리중에 새롭게 유도된 스피커 관련 파라미터 역시 음성 인식 장치에 저장된다. 이러한 방식에서, 시스템의 학습 처리는 이미 교정된 전체 텍스트 뿐만아니라 교정된 워드에 대해서도 허용되어, 시스템의 사용 동안에 정확히 검출된 워드의 에러 비율이 일정하게 감소되고, 이러한 시스템은 또한 빠르게 특정한 스피커에 의해서 자주 사용된 특정 텍스트 시퀀스 또는 특정한 스피커의 특징적인 발음을 조정하게 된다.
본 발명의 실시예는 첨부한 도면을 참고로 한 비제한적 예를 사용하여 상세히 설명될 것이다. 도면의 제1도는 텍스트 처리 시스템의 블럭도를 도시한 것이다.
실시예
제1도에 도시된 블럭도에서 음성 인식 장치는 참조번호(1)로 표기되고 텍스트와 일치하는 음성 신호는 텍스트 처리 시스템의 입력(3)으로부터 상기 장치의 입력까지 전기 신호의 형태로 인가되며, 상기의 음성 신호는 마이크로폰으로부터 직접 얻어지거나 또는 임시 저장으로서 이용된 구술 기계에 의해 재생된다. 이러한 전기 신호는 아날로그 신호 또는 디지탈 신호가 될 수도 있고, 디지탈 신호는 사용된 음성 인식 장치의 형태에 의존하는 엔코드된 형태로 될 수 있으며, 현재의 경우에서 사용하기에 적절한 다양한 그러한 장치는 공지되어 있다. 음성인식장치(1)는 전체 텍스트 처리 시스템을 제어하는 컴퓨터(4)에 의해 제어된다. 음성 인식 장치(1)의 입력(2)으로부터, 전기 신호는 특징 메모리(6)에 연속적으로 저장된 주파수 스펙트럼내에서 에너지 집속 막대와 같이 이러한 신호의 특성인 묵음 특징을 결정하는 음성분석기(5)에 일반적인 방법으로 인가된다. 이러한 특징 메모리(6)는 음성 인식 장치(1)의 실제 워드 인식 장치(7)에 입력을 제공하며, 또한 장치에 의해서 식별될 개별 워드를 인에블시키는 메모리에 직렬로 접속된다. 통상적인 방법에서, 이러한 메모리는 특정한 스피커 또는 몇몇 스피커에 의해 발음된 예상 워드 시퀀스의 저장을 위한 음성 모델 메모리(8)를 포함하고, 음성 인식 시스템에 의해서 인식될 수 있는 워드에 대해 스피커와 관련된 음성 합성의 저장을 위한 음성학 메모리(9)를 포함하며, 특정한 스피커 또는 몇몇 스피커의 특징적인 발음과 관련있는 파라미터의 저장을 위한 발음 특징 메모리(10)를 포함하고 있다. 현재의 경우에서, 음성 인식 장치(1)는 또한 상술된 메모리(8,9,10)에 대한 액세스를 가지고 있고, 특징 메모리(6) 및 워드 인식장치(7)와 직접 협동하는 학습장치(11)를 포함하고 있다. 학습 처리 과정중에, 특징 메모리(6)에 저장되고, 음성 인식 장치(1)에 의해 워드의 특정한 스피커에 의해서 발음된 음성 신호로부터 유도되어진 특징은 예를들면 컴퓨터(4)에 의해 학습 장치에 인가되고, 대응하는 음성 신호와 연관되어 있는 워드 및 학습 장치에 인가된 메모리(8,9,10)에 저장된 음성 관련 파라미터와 비교하여 학습 장치(11)에 의해 분석되며, 그러한 특징은 스피커 관련 파라미터와 같은 음성 인식 장치의 메모리(8,9,10)에 저장되어, 그러한 것은 워드 인식 장치(7)에서 이용할 수 있게 된다.
상기 수단은 인식될 음성 신호에 내재된 완전한 텍스트의 개별 워드를 인에이블시키며, 그러한 워드는 디지탈 신호와 같이 워드 메모리(12)에 연속적으로 저장되며, 상기 메모리에서 다른 처리를 이용할 수 있으며, 컴퓨터(4)를 경유하여 프린터(14) 또는 표시 장치(13)에 인가될 수 있다. 이러한 방법으로, 음성 신호에 의해 표시된 텍스트는 개별 워드로 구성된 텍스트로서 표시 장치(13)위에 직접 표시될 수 있고, 검색 또는 교정을 할 수 있으며, 이러한 것은 그러한 음성 인식장치가 일반적으로 특정한 에러비율을 나타내기 때문에 필요하며, 그러한 것은 개별 워드 또는 워드 그룹이 올바르게 식별되지 않아서 표시 장치상에 올바르게 나타나지 않는다는 것을 의미하는 것이다.
잘못되어 검출된 워드의 교정을 용이하게 하기 위해서, 현재의 텍스트 처리 시스템은 후에 설명될 단계를 이용한다.
특히, 전기 신호와 같이 텍스트 처리 시스템의 입력(3)에 인가된 음성 신호는 제1메모리(15)에 저장된다. 제1메모리(15)에서 음성 신호를 저장하기 위해 다양한 방법이 이러한 메모리의 구성에 의존하여 이용될 수 있다. 예를들면, 그러한 제1메모리는 오디오 테이프 기구일 수도 있으며, 오디오 신호는 아날로그 신호와 같이 저장된다. 그러나, 제1메모리는 디지탈 메모리가 될 수도 있으며, 오디오 신호는 숫자화 또는 엔코딩 후에 인가되고, 그러한 메모리는 메모리 내용에 대한 더 빠른 액세스의 잇점을 가지고 있다. 상기 메모리는 예를들면 디스크 저장 또는 고상 메모리가 될 수 있다. 더우기, 중앙 표시 시스템의 메모리는 또한 그러한 제1메모리로서 사용될 수 있다. 선택적으로, 음성 인식 장치(1)의 입력(2)에 인가될 입력 신호는 그러한 제1메모리의 출력에 의해서 제공될 수 있다.
더우기, 개시 표시 및 종료 표시는 음성 인식 장치에 의해서 검출된 개별 워드에 할당되고 워드 메모리(12)에 저장되며, 이러한 표시는 제1메모리(15)에 저장된 음성 신호와 특정한 시간 관계에 있다. 이러한 방법에서, 모든 검출된 워드는 시 표시 및 종료 표시에 의해 제한되며, 워드의 종료 표시는 다음 워드의 개시 표시에 동시에 구성할 수 있다. 이러한 관점에서, 이러한 표시를 발생시킬 때 제1메모리(15)에 저장된 음성 신호와의 특정한 시간 관계가 보장되는 것은 필수적인 것이다. 이러한 목적을 위해, 시간 계산 처리가 수행될 수 있으며, 예를 들면 컴퓨터(4)의 클럭 신호에 의해, 개별 시간 간격을 연속적으로 한정하는 음성 인식 처리 동안에 개별 워드 검출 사이에서 발생하게 된다. 그래서 발생된 개별 검출 워드의 개시 및 종료 표시는 제2메모리(16)에 저장되고, 이러한 것은 워드 인식 장치(7)에 접속되며, 이러한 제2메모리(16)에 대한 액세스는 컴퓨터(4)를 경유하여 제공된다. 컴퓨터(4)는 또한 제1메모리에 대한 액세스를 가지고 있으며, 여기서 오디오 신호가 저장된다. 제2메모리(16)에 저장된 검출되어진 워드의 개시 및 종료 표시에 의해, 컴퓨터(4)는 음성적으로 재생될 일치하는 오디오 신호와 컴퓨터(4)의 제어하에서, 예를들면 커서(cursor) 또는 밑줄로 표시 장치(13)에 의해 표시된 검출 워드가 눈에 띄게 해주며, 제1메모리에 저장되고 검출된 워드와 관련된 음성 신호의 상관 관계를 확립시킬 수 있다.
그래서, 표시 장치(13)에 의해 표시된 워드로 구성되어진 텍스트는 간단하고 빠르며 확실하게 검색되거나 또는 교정될 수 있다. 명령 및 데이타의 엔트리로 이용되고 컴퓨터(4)와 협동하는 키보드(17)에 의해, 표시 장치(13)상에 표시된 눈에 띄는 워드는 필요할 때 교정될 수 있다. 예를들면, 표시 장치상에 표시된 워드로 구성되어진 완전한 텍스트내에서, 이러한 텍스트의 단일 워드는 키보드(17)와 컴퓨터(4)의 제어하에서 눈에 띄게 될 수 있으며, 그후 컴퓨터에 의해서 제2 메모리(16)에 저장되고 눈에 띄는 워드와 일치하는 개시 표시 및 종료 표시는 검출되고, 상기 표시에 의존하여 제1메모리(15)에 저장된 일치하는 오디오 신호는 예를들면 확성기(18)에 의해 음성적으로 재생될 수 있고 판독될 수 있으며, 그러한 재생은 재발될 수도 있고 재발되지 않을 수도 있다. 이러한 방식에서, 시스템의 사용자는 대응하는 워드가 음성 인식장치(1)에 의해서 적절히 또는 부적절하게 검출되어 왔는지의 여부를 입증하기 위해 대응하는 눈에 띄어진 워드와 일치하는 오디오 신호의 모니터를 하는 직접적인 방법을 가지고 있다. 비적절하게 검출된 워드의 경우에서, 시스템의 사용자는 키보드(17)에 의해 교정 워드와 비적절하게 검출된 워드를 대체시킬 수 있다. 그러나, 제1메모리(15)에 저장된 음성 신호가 제2메모리(16)에 저장된 것과 같은 모든 검출된 워드의 개시 및 종료 표시와 함께 컴퓨터(4)에 의해 일치하는 검출된 워드가 동시에 눈에 띄게 되는 동안에, 음성적으로 계속해서 재생되는 그러한 방법으로 표시 장치(13)에 의해 표시된 텍스트의 연속적인 검색을 수행하는 것도 가능하다. 그래서, 시스템의 사용자는 연속적으로 구두(spoken)텍스트를 청취하고, 동시에 표시된 텍스트로 눈에 띄게 된 음성 인식 장치에 의해서 검출된 워드에 관심이 끌리게 된다. 상술된 텍스트 처리 시스템을 사용한 이러한 다른 방법의 결과로서 텍스트가 간단하고 확실하게 교정되고 검색되는 것은 명백하며, 그 후 완료된 교정 텍스트는 프린터(14)에 의해 프린트될 수 있다.
특징 메모리(6)에 저장된 특징과 함께 키보드(17)에 의해 교정되고 표시 장치(13)상에서 눈에 띄게 되어온 검출된 워드의 교정된 번역과, 음성 인식 장치(1)에 의해 본래 워드의 음성 신호로부터 유도되어온 특징이 분석을 위한 학습 장치(11)에 인가되면, 이러한 분석 과정에서 새롭게 유도된 스피커 관련 파라미터는 음성 인식 장치(1)의 메모리(8,9,10)에 또한 저장된다. 현재의 경우에서, 음성 인식 장치(1)에 의해 전체 텍스트의 음성 신호로부터 유도된 모든 특징은 계속해서 특징 메모리(6)내의 그러한 학습 처리에 이용될 수 있고, 워드의 음성 신호와 일치하는 특징은 항상 판독될 수 있으며, 이러한 것은 비교적 큰 저장용량을 가지고 있는 특징 메모리(6)를 필요로 한다. 다른 방법은 그러한 학습 처리를 위해 제1메모리(15)에 저장된 음성 신호를 이용하는 것이고, 특징 메모리(6)에 음성 신호를 다시 저장시키고, 음성 인식 장치(1)에 의해 매번 대응하는 특징을 재검출하는 것이며, 이러한 특징메모리(6)의 저장 용량은 더 작아질 수 있게 된다. 이러한 목적을 위해, 예를 들면 스위치(19)에 의해 시스템의 입력(3)대신에 제1메모리(15)의 출력에 음성 인식 장치(1)의 입력(2)을 접속시키는 것도 가능하다. 그뒤, 컴퓨터(4)는 음성 인식장치에 의해 검출된 대응하는 워드와 일치하고, 제1메모리(15)에 저장된 모든 음성 신호 부분에 대한 액세스를 다시 제공한다. 이러한 방법에서, 학습 장치(11)는 음성 인식 장치(1)가 다른 학습 처리를 수행하는 그러한 방법으로 음성 인식 장치(1)의 메모리(8,9,10)에 저장된 스피커 관련 파라미터를 변조시키거나 또는 갱신시키며, 미래에 그러한 워드와 일치하는 음성 신호가 다시 발생하면 일단 음성 인식 장치(1)에 의해서 올바르게 검출된 상기 워드의 확률이 증가하도록 해주는 대응하는 스피커와 관련되어 수행되므로, 그러한 텍스트 처리 시스템의 에러 비율은 계속해서 감소된다.
음성 인식 장치(1)에 의해 잘못 검출되어온 모든 워드가 키보드(17)에 의해 교정된 후 특징 메모리(6)에 저장되고 음성 인식 장치에 의해 본래 워드의 음성 신호로부터 유도된 특징과 함께 완전한 텍스트를 구성하는 워드가 분석용 학습 장치(11)에 응용되면, 이러한 분석 과정에서 얻어진 새롭게 유도된 스피커 관련 파라미터가 음성 인식 장치의 메모리(8,9,10)에 또한 저장되는 것이 이롭다는 것을 발견하게 되었다. 이러한 방법으로, 이미 교정된 전체 텍스트는 시스템의 학습 처리에서 이용되어, 잘못 검출된 워드의 에러 비율은 감소되고 특정한 스피커의 특징적인 발음과 대응하는 스피커에 의해 사용된 특정한 표현(phrases)에 대한 시스템의 신속한 조정이 성취되어, 결과적으로 그러한 시스템 수행의 실질적인 향상을 가져오게 된다.
이전의 설명으로부터 명백하게 된 바와같이, 기술된 실시예의 다양한 변경은 본 발명의 범위내에서 가능하다. 이것은 특히 음성 신호가 제1메모리에 저장되는 방법과, 개시 표시 및 종료 표시가 발생되고 분석되는 방법에 포함되며, 이러한 표시는 음성 인식 장치에 의해서 검출된 워드를 한정하며, 실제의 음성 인식 장치의 동작을 한정한다. 그리고, 그러한 텍스트 처리 시스템이, 예를들면 텍스트 합병과 같은, 그러한 시스템에서 통상적인 다른 기능을 또한 수행할 수 있음은 명백한 것이다.
Claims (3)
- (정정) 텍스트에 대응하는 음성 신호를 음성 인식 장치에 공급하고, 이 음성 인식 장치로 음성 신호중의 워드를 검출하고, 검출한 워드를 디지탈 신호의 형태로 워드 메모리에 저장함과 동시에, 이 워드 메모리로부터 다른 처리 수단에 공급하고, 이 처리 수단에서 검출한 워드를 표시 장치에 의해 텍스트로서 재생하고, 필요할 때 정정하고 프린터에 의해 프린트할 수 있는 텍스트 처리 시스템에 있어서,상기 음성 신호를 제1메모리에 저장하고, 키보드와 협동하는 컴퓨터의 제어하에서 상기 음성 인식 장치에 의해 검출한 워드에 개시 표시 및 종료 표시를 할당하고, 이러한 표시는 제1메모리에 저장된 음성 신호와 시간적으로 관련되며, 상기 개시 표시 및 종료 표시를 제2메모리에 저장하고, 제2메모리에 저장되어 있는 검출된 워드의 개시 및 종료 표시에 의해 상기 컴퓨터는 검출된 워드에 대응하여 제1메모리에 저장되어 있는 음성 신호와의 상관관계를 확립할 수 있으며, 컴퓨터의 제어하에서 검출한 워드를 표시 장치상에서 강조 표시할 수 있음과 동시에 관련된 오디오 신호를 음향적으로 재생할 수 있으며, 상기 키보드에 의해 데이타를 상기 컴퓨터에 입력할 수 있으며, 필요한 경우 표시 장치상에 표시된 검출 워드를 정정할 수 있도록 구성한 것을 특징으로 하는 텍스트 처리 시스템.
- (정정) 제1항에 있어서,상기 음성 인식 장치는 학습 장치와 협동하고, 특정의 화자에 의해 발음된 워드의 음성 신호의 특징을 상기 음성 인식 장치에 의해 음성 신호로부터 추출할 수 있으며, 이러한 특징은 상기의 학습 장치에 공급한 음성 관련 파라미터와 학습 장치에 공급됨과 아울러 화자 관련 파라미터로서 음성 인식 장치에 기억되는 관련 음성 신호와 대응하는 워드와를 비교함으로써 학습장치에 의해 분석되고, 상기 특징이 음성 인식 처리에서 음성 인식 장치에 의해 이용될 수 있는 텍스트 처리시스템에 있어서,표시 장치상에 강조 표시되어 키보드를 거쳐 정정된 검출 워드를 학습 장치에 공급하고, 음성 인식 장치에 의해 원래 워드의 음향 신호로부터 추출한 상기 특징과 함께 분석하고, 상기 분석처리에서 새롭게 추출한 화자 관련 파라미터도 음성 인식 장치에 저장하도록 구성한 것을 특징으로 하는 텍스트 처리 시스템.
- (정정) 제1항에 있어서,상기 음성 인식 장치는 학습 장치와 협동하고, 특정의 화자에 의해 발음된 워드의 음성 신호 특유의 특징은 음성 인식 장치에 의해 상기 음성 신호로부터 추출되고, 이러한 특징은 상기 학습 장치에 의해, 학습 장치에 공급한 화자 관련 파라미터와 학습 장치에 공급됨과 아울러 음성 인식 장치에 화자 관련 파라미터로서 저장한 워드와를 비교함으로써 분석되고, 음성 인식 처리에서 음성 인식 장치에 의해서 이용되는 텍스트 처리 시스템에 있어서,음성 인식 장치에 의해 잘못 검출된 모든 워드를 키보드에 의해 정정한 후, 음성 인식 장치에 의해 원래 워드의 음성 신호로부터 추출한 특징과 함께 완전한 텍스트를 구성하는 워드를 분석용 학습 장치에 공급하고, 상기 분석 처리에서 새롭게 추출한 화자 관련 파라미터도 상기 음성 인식 장치에 저장하도록 구성한 것을 특징으로 하는 텍스트 처리 시스템.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AT0264788A AT390685B (de) | 1988-10-25 | 1988-10-25 | System zur textverarbeitung |
ATA2647/88 | 1988-10-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR900006856A KR900006856A (ko) | 1990-05-09 |
KR0135975B1 true KR0135975B1 (ko) | 1998-05-15 |
Family
ID=3538028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019890015239A KR0135975B1 (ko) | 1988-10-25 | 1989-10-24 | 텍스트 처리 시스템 |
Country Status (10)
Country | Link |
---|---|
US (1) | US5031113A (ko) |
EP (1) | EP0366192B1 (ko) |
JP (1) | JP3263392B2 (ko) |
KR (1) | KR0135975B1 (ko) |
AT (2) | AT390685B (ko) |
AU (1) | AU616807B2 (ko) |
CA (1) | CA2001164C (ko) |
DE (1) | DE58909293D1 (ko) |
ES (1) | ES2075848T3 (ko) |
HK (1) | HK199496A (ko) |
Families Citing this family (79)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02272495A (ja) * | 1989-04-13 | 1990-11-07 | Toshiba Corp | 音声認識装置 |
US5329609A (en) * | 1990-07-31 | 1994-07-12 | Fujitsu Limited | Recognition apparatus with function of displaying plural recognition candidates |
US5530740A (en) * | 1991-10-28 | 1996-06-25 | Contigram Communications Corporation | System and method for integrating voice, facsimile and electronic mail data through a personal computer |
US7249026B1 (en) | 1993-03-24 | 2007-07-24 | Engate Llc | Attorney terminal having outline preparation capabilities for managing trial proceedings |
US5444615A (en) * | 1993-03-24 | 1995-08-22 | Engate Incorporated | Attorney terminal having outline preparation capabilities for managing trial proceeding |
US5369704A (en) * | 1993-03-24 | 1994-11-29 | Engate Incorporated | Down-line transcription system for manipulating real-time testimony |
US7631343B1 (en) | 1993-03-24 | 2009-12-08 | Endgate LLC | Down-line transcription system using automatic tracking and revenue collection |
JP3337798B2 (ja) * | 1993-12-24 | 2002-10-21 | キヤノン株式会社 | 画像データ及び音声データを処理する装置、データ処理装置並びにデータ処理方法 |
US5600756A (en) * | 1994-05-11 | 1997-02-04 | Sony Corporation | Method of labelling takes in an audio editing system |
US5477511A (en) * | 1994-07-13 | 1995-12-19 | Englehardt; C. Duane | Portable documentation system |
DE4434255A1 (de) * | 1994-09-24 | 1996-03-28 | Sel Alcatel Ag | Vorrichtung zur Sprachaufzeichnung mit anschließender Texterstellung |
US5745875A (en) * | 1995-04-14 | 1998-04-28 | Stenovations, Inc. | Stenographic translation system automatic speech recognition |
US5754978A (en) * | 1995-10-27 | 1998-05-19 | Speech Systems Of Colorado, Inc. | Speech recognition system |
US5960447A (en) * | 1995-11-13 | 1999-09-28 | Holt; Douglas | Word tagging and editing system for speech recognition |
US5960395A (en) * | 1996-02-09 | 1999-09-28 | Canon Kabushiki Kaisha | Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming |
US5857099A (en) * | 1996-09-27 | 1999-01-05 | Allvoice Computing Plc | Speech-to-text dictation system with audio message capability |
GB2303955B (en) * | 1996-09-24 | 1997-05-14 | Allvoice Computing Plc | Data processing method and apparatus |
US6961700B2 (en) * | 1996-09-24 | 2005-11-01 | Allvoice Computing Plc | Method and apparatus for processing the output of a speech recognition engine |
KR100453021B1 (ko) * | 1996-09-27 | 2005-04-08 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 구두텍스트인식방법및시스템 |
US5774857A (en) * | 1996-11-15 | 1998-06-30 | Motorola, Inc. | Conversion of communicated speech to text for tranmission as RF modulated base band video |
US5909667A (en) * | 1997-03-05 | 1999-06-01 | International Business Machines Corporation | Method and apparatus for fast voice selection of error words in dictated text |
US6629074B1 (en) | 1997-08-14 | 2003-09-30 | International Business Machines Corporation | Resource utilization indication and commit mechanism in a data processing system and method therefor |
DE19740119A1 (de) * | 1997-09-12 | 1999-03-18 | Philips Patentverwaltung | System zum Schneiden digitaler Video- und Audioinformationen |
JP2000042782A (ja) * | 1998-07-27 | 2000-02-15 | Miyachi Technos Corp | 溶接状況状態記録方法および溶接状況状態記録装置 |
US6151576A (en) * | 1998-08-11 | 2000-11-21 | Adobe Systems Incorporated | Mixing digitized speech and text using reliability indices |
GB2390930B (en) * | 1999-02-05 | 2004-03-10 | Custom Speech Usa Inc | System and method for automating transcription services |
US6385581B1 (en) | 1999-05-05 | 2002-05-07 | Stanley W. Stephenson | System and method of providing emotive background sound to text |
US7797730B2 (en) * | 1999-06-24 | 2010-09-14 | Engate Llc | Downline transcription system using automatic tracking and revenue collection |
EP1110204B1 (en) | 1999-07-08 | 2005-06-01 | Koninklijke Philips Electronics N.V. | Adaptation of a speech recognizer from corrected text |
DE60022976T2 (de) | 1999-07-08 | 2006-07-06 | Koninklijke Philips Electronics N.V. | Spracherkennungseinrichtung mit transfermitteln |
US6434547B1 (en) | 1999-10-28 | 2002-08-13 | Qenm.Com | Data capture and verification system |
US6754619B1 (en) | 1999-11-15 | 2004-06-22 | Sony Corporation | Digital recording and playback system with voice recognition capability for concurrent text generation |
EP1169678B1 (en) | 1999-12-20 | 2015-01-21 | Nuance Communications Austria GmbH | Audio playback for text edition in a speech recognition system |
US6513003B1 (en) | 2000-02-03 | 2003-01-28 | Fair Disclosure Financial Network, Inc. | System and method for integrated delivery of media and synchronized transcription |
US6778700B2 (en) | 2001-03-14 | 2004-08-17 | Electronics For Imaging, Inc. | Method and apparatus for text detection |
ATE286294T1 (de) | 2001-03-29 | 2005-01-15 | Koninkl Philips Electronics Nv | Synchronisierung eines audio- und eines textcursors während der editierung |
ATE317583T1 (de) * | 2001-03-29 | 2006-02-15 | Koninkl Philips Electronics Nv | Texteditierung von erkannter sprache bei gleichzeitiger wiedergabe |
DE10126020A1 (de) * | 2001-05-28 | 2003-01-09 | Olaf Berberich | Hybrides Diktier-/Dialogsystem für Spracheingabe und Tastaturbestätigung |
US20030046071A1 (en) * | 2001-09-06 | 2003-03-06 | International Business Machines Corporation | Voice recognition apparatus and method |
CN1312657C (zh) * | 2001-10-12 | 2007-04-25 | 皇家飞利浦电子股份有限公司 | 用于标注所识别文本的部分的转录设备和方法 |
US6708148B2 (en) * | 2001-10-12 | 2004-03-16 | Koninklijke Philips Electronics N.V. | Correction device to mark parts of a recognized text |
US20030101054A1 (en) * | 2001-11-27 | 2003-05-29 | Ncc, Llc | Integrated system and method for electronic speech recognition and transcription |
US8498871B2 (en) | 2001-11-27 | 2013-07-30 | Advanced Voice Recognition Systems, Inc. | Dynamic speech recognition and transcription among users having heterogeneous protocols |
ATE417346T1 (de) * | 2003-03-26 | 2008-12-15 | Koninkl Philips Electronics Nv | Spracherkennungs- und korrektursystem, korrekturvorrichtung und verfahren zur erstellung eines lexikons von alternativen |
JP5025261B2 (ja) * | 2003-03-31 | 2012-09-12 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | 信頼水準の指示により音声認識の結果を訂正するためのシステム |
US7263483B2 (en) * | 2003-04-28 | 2007-08-28 | Dictaphone Corporation | USB dictation device |
US7346506B2 (en) * | 2003-10-08 | 2008-03-18 | Agfa Inc. | System and method for synchronized text display and audio playback |
US20070067168A1 (en) * | 2003-11-28 | 2007-03-22 | Koninklijke Philips Electronics N.V. | Method and device for transcribing an audio signal |
US7590533B2 (en) * | 2004-03-10 | 2009-09-15 | Microsoft Corporation | New-word pronunciation learning using a pronunciation graph |
JP2005301953A (ja) * | 2004-04-12 | 2005-10-27 | Kenichi Asano | 聞き手の側のペースで音声とそれに対応する文章を関連させる方法 |
FR2956515A1 (fr) | 2010-02-15 | 2011-08-19 | France Telecom | Procede de navigation dans un contenu sonore |
US8392186B2 (en) * | 2010-05-18 | 2013-03-05 | K-Nfb Reading Technology, Inc. | Audio synchronization for document narration with user-selected playback |
US9904768B2 (en) | 2011-02-18 | 2018-02-27 | Nuance Communications, Inc. | Methods and apparatus for presenting alternative hypotheses for medical facts |
US8768723B2 (en) | 2011-02-18 | 2014-07-01 | Nuance Communications, Inc. | Methods and apparatus for formatting text for clinical fact extraction |
US10460288B2 (en) | 2011-02-18 | 2019-10-29 | Nuance Communications, Inc. | Methods and apparatus for identifying unspecified diagnoses in clinical documentation |
US10032127B2 (en) | 2011-02-18 | 2018-07-24 | Nuance Communications, Inc. | Methods and apparatus for determining a clinician's intent to order an item |
JP5404726B2 (ja) * | 2011-09-26 | 2014-02-05 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
US9569594B2 (en) | 2012-03-08 | 2017-02-14 | Nuance Communications, Inc. | Methods and apparatus for generating clinical reports |
US9412372B2 (en) * | 2012-05-08 | 2016-08-09 | SpeakWrite, LLC | Method and system for audio-video integration |
US9064492B2 (en) | 2012-07-09 | 2015-06-23 | Nuance Communications, Inc. | Detecting potential significant errors in speech recognition results |
US10504622B2 (en) | 2013-03-01 | 2019-12-10 | Nuance Communications, Inc. | Virtual medical assistant methods and apparatus |
US11024406B2 (en) | 2013-03-12 | 2021-06-01 | Nuance Communications, Inc. | Systems and methods for identifying errors and/or critical results in medical reports |
US9292254B2 (en) * | 2013-05-15 | 2016-03-22 | Maluuba Inc. | Interactive user interface for an intelligent assistant |
US11183300B2 (en) | 2013-06-05 | 2021-11-23 | Nuance Communications, Inc. | Methods and apparatus for providing guidance to medical professionals |
US10496743B2 (en) | 2013-06-26 | 2019-12-03 | Nuance Communications, Inc. | Methods and apparatus for extracting facts from a medical text |
US10373711B2 (en) | 2014-06-04 | 2019-08-06 | Nuance Communications, Inc. | Medical coding system with CDI clarification request notification |
US10319004B2 (en) | 2014-06-04 | 2019-06-11 | Nuance Communications, Inc. | User and engine code handling in medical coding system |
US10366424B2 (en) | 2014-06-04 | 2019-07-30 | Nuance Communications, Inc. | Medical coding system with integrated codebook interface |
US10331763B2 (en) | 2014-06-04 | 2019-06-25 | Nuance Communications, Inc. | NLU training with merged engine and user annotations |
US10754925B2 (en) | 2014-06-04 | 2020-08-25 | Nuance Communications, Inc. | NLU training with user corrections to engine annotations |
US10366687B2 (en) | 2015-12-10 | 2019-07-30 | Nuance Communications, Inc. | System and methods for adapting neural network acoustic models |
US11152084B2 (en) | 2016-01-13 | 2021-10-19 | Nuance Communications, Inc. | Medical report coding with acronym/abbreviation disambiguation |
CN106409296A (zh) * | 2016-09-14 | 2017-02-15 | 安徽声讯信息技术有限公司 | 基于分核处理技术的语音快速转写校正系统 |
US10949602B2 (en) | 2016-09-20 | 2021-03-16 | Nuance Communications, Inc. | Sequencing medical codes methods and apparatus |
US10503467B2 (en) | 2017-07-13 | 2019-12-10 | International Business Machines Corporation | User interface sound emanation activity classification |
US11133091B2 (en) | 2017-07-21 | 2021-09-28 | Nuance Communications, Inc. | Automated analysis system and method |
US11024424B2 (en) | 2017-10-27 | 2021-06-01 | Nuance Communications, Inc. | Computer assisted coding systems and methods |
JP7202938B2 (ja) * | 2019-03-20 | 2023-01-12 | Tvs Regza株式会社 | 番組名検索支援装置、及び、番組名検索支援方法 |
JP7169921B2 (ja) * | 2019-03-27 | 2022-11-11 | 本田技研工業株式会社 | エージェント装置、エージェントシステム、エージェント装置の制御方法、およびプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3676856A (en) * | 1970-08-11 | 1972-07-11 | Ron Manly | Automatic editing system and method |
US3770892A (en) * | 1972-05-26 | 1973-11-06 | Ibm | Connected word recognition system |
US4041467A (en) * | 1975-11-28 | 1977-08-09 | Xerox Corporation | Transcriber system for the automatic generation and editing of text from shorthand machine outlines |
JPS58189696A (ja) * | 1982-04-30 | 1983-11-05 | 日産自動車株式会社 | 車両用音声認識装置 |
US4627001A (en) * | 1982-11-03 | 1986-12-02 | Wang Laboratories, Inc. | Editing voice data |
-
1988
- 1988-10-25 AT AT0264788A patent/AT390685B/de not_active IP Right Cessation
-
1989
- 1989-10-17 US US07/422,474 patent/US5031113A/en not_active Expired - Lifetime
- 1989-10-19 DE DE58909293T patent/DE58909293D1/de not_active Expired - Fee Related
- 1989-10-19 EP EP89202644A patent/EP0366192B1/de not_active Expired - Lifetime
- 1989-10-19 AT AT89202644T patent/ATE123893T1/de not_active IP Right Cessation
- 1989-10-19 ES ES89202644T patent/ES2075848T3/es not_active Expired - Lifetime
- 1989-10-20 CA CA002001164A patent/CA2001164C/en not_active Expired - Fee Related
- 1989-10-23 AU AU43672/89A patent/AU616807B2/en not_active Ceased
- 1989-10-24 KR KR1019890015239A patent/KR0135975B1/ko not_active IP Right Cessation
- 1989-10-25 JP JP27619189A patent/JP3263392B2/ja not_active Expired - Fee Related
-
1996
- 1996-10-31 HK HK199496A patent/HK199496A/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
ES2075848T3 (es) | 1995-10-16 |
HK199496A (en) | 1996-11-08 |
DE58909293D1 (de) | 1995-07-20 |
ATA264788A (de) | 1989-11-15 |
ATE123893T1 (de) | 1995-06-15 |
JPH02163819A (ja) | 1990-06-25 |
AU616807B2 (en) | 1991-11-07 |
AU4367289A (en) | 1990-05-03 |
CA2001164A1 (en) | 1990-04-25 |
CA2001164C (en) | 2000-11-28 |
AT390685B (de) | 1990-06-11 |
EP0366192A2 (de) | 1990-05-02 |
EP0366192B1 (de) | 1995-06-14 |
EP0366192A3 (de) | 1991-03-13 |
US5031113A (en) | 1991-07-09 |
KR900006856A (ko) | 1990-05-09 |
JP3263392B2 (ja) | 2002-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR0135975B1 (ko) | 텍스트 처리 시스템 | |
EP0865651B1 (en) | Method of and system for recognizing a spoken text | |
US5787230A (en) | System and method of intelligent Mandarin speech input for Chinese computers | |
US7143033B2 (en) | Automatic multi-language phonetic transcribing system | |
EP0140777B1 (en) | Process for encoding speech and an apparatus for carrying out the process | |
JPH0423799B2 (ko) | ||
JP2008309856A (ja) | 音声認識装置及び会議システム | |
JPH11505037A (ja) | 言語認識装置の信頼性向上方法 | |
JP2007510943A (ja) | 音声−テキストトランスクリプションシステムの誤り検出 | |
JPH0713594A (ja) | 音声合成において音声の質を評価するための方法 | |
JPH06110494A (ja) | 発音学習装置 | |
JPH0252279B2 (ko) | ||
JP2000206987A (ja) | 音声認識装置 | |
US4783808A (en) | Connected word recognition enrollment method | |
JP3277579B2 (ja) | 音声認識方法および装置 | |
JPS61179499A (ja) | テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム | |
JP2686085B2 (ja) | 音声認識システム | |
JPS645320B2 (ko) | ||
Scharenborg et al. | Modelling human speech recognition using automatic speech recognition paradigms in SpeM | |
JPS6126678B2 (ko) | ||
JP2008107641A (ja) | 音声データ検索装置 | |
JPH01290000A (ja) | 音声認識方式 | |
JPS60244989A (ja) | 発音訓練機 | |
JPH04238396A (ja) | 音声合成用音声持続期間処理装置 | |
JPS6011897A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20061221 Year of fee payment: 10 |
|
LAPS | Lapse due to unpaid annual fee |