KR0135975B1

KR0135975B1 - 텍스트 처리 시스템

Info

Publication number: KR0135975B1
Application number: KR1019890015239A
Authority: KR
Inventors: 횔레르바우어 베르너
Original assignee: 에프.제이.스미트
Priority date: 1988-10-25
Filing date: 1989-10-24
Publication date: 1998-05-15
Also published as: ES2075848T3; HK199496A; DE58909293D1; ATA264788A; ATE123893T1; JPH02163819A; AU616807B2; AU4367289A; CA2001164A1; CA2001164C; AT390685B; EP0366192A2; EP0366192B1; EP0366192A3; US5031113A; KR900006856A; JP3263392B2

Abstract

내용 없음

Description

텍스트 처리 시스템

제1도는 텍스트 처리 시스템의 블럭선도이다.

* 도면의 주요부분에 대한 부호의 설명

1 : 음성 인식 장치4 : 컴퓨터

5 : 음성 분석기6 : 특징부 기억 메모리

7 : 워드 인식 장치8 : 음성 모델 메모리

9 : 음성 메모리11 : 학습 장치

12 : 워드 메모리13 : 표시 장치

14 : 프린터15 : 제 1 메모리

16 : 제 2 메모리17 : 키보드

기술분야

본 발명은 텍스트(text)처리 시스템에 관한 것이며, 여기서 텍스트에 대응하는 음성 신호는 음성신호에서 워드를 검출하는 음성 인식 장치에 인가되고, 그 후 상기의 워드는 디지탈 신호의 형태로 워드 메모리에 저장되며, 상기 메모리로부터 다른 처리 수단에 인가되고, 이러한 검출된 워드는 표시 장치에 의해 텍스트로서 제공될 수 있으며, 필요할 때 교정될 수도 있고, 프린터에 의해 프린트될 수 있다.

종래기술

그러한 텍스트 처리 시스템은 미국특허 제3,770,892호에 기술되어 있지만, 이 공보는 음성인식 장치에 의해 올바르게 검출되지 않은 워드를 교정하는 방법을 설명하고 있지 않다.

워드검출에서 에러가 비교적 이러한 형태의 현존하는 텍스트 처리시스템에서 종종 발생하기 때문에, 그러한 텍스트나 교정 시설은 매우 중요하다.

본 발명의 목적은 검출된 워드가 검색될 수 있고, 틀리게 검출된 워드는 간단하고 빠르며 확실하게 교정될 수 있는 방법으로 서두에서 한정된 형태의 텍스트 처리 시스템을 구성하는 것이다.

발명의 개요

본 발명에 따라, 이러한 것은 음성 신호가 제1메모리에 저장되고, 개시 표시와 종료 표시는 키보드와 협동하는 컴퓨터의 제어하에 음성 인식장치에 의해 검출된 워드에 할당되며, 이러한 표시는 제1메모리에 저장된 음성 신호에 알맞게 연결되고, 상기의 개시 표시와 종료 표시는 제2 메모리에 저장되며, 제2 메모리에 저장된 바와 같은 검출된 워드의 개시 표시와 종료 표시에 의해서 상기의 컴퓨터는 제1 메모리에 저장되고 검출된 워드와 일치하는 음성 신호와의 상관 관계를 확립할 수 있으며, 컴퓨터의 제어하에서 검출된 워드는 표시 장치상에서 눈에 띄게 될 수 있으며, 동시에 관련 오디오 신호는 청각적으로 재생될 수 있고, 키보드에 의해 데이타는 컴퓨터에 적재될 수 있으며, 검출된 워드에 의해 표시 장치상에는 눈에 띄게 되고, 필요할 때 교정될 수 있게 되어 성취된다. 텍스트와 일치하는 오디오 신호는 추가적으로 저장되고, 더우기 이러한 저장된 음성 신호의 상관 관계에서, 음성 인식 장치에 의해 검출된 텍스트의 워드와 적절히 연결된 개시 표시와 종료 표시 또한 저장되어 있기 때문에, 어느때라도 각각의 검출된 워드에 관련 음성 신호를 간단하게 할당시키거나 또는 역으로, 음성 신호의 각 부분에 일치하는 검출된 워드를 할당시키는 것이 가능하다. 그래서, 시스템의 사용자는 컴퓨터에 의해 표시 장치에 나타나고, 검색되거나 또는 교정될 워드와 관련된 본래의 음성 신호를 청각적으로 모니터할 수 있게 되어, 사용자는 올바르게 대응하는 워드를 식별할 수 있고, 필요하면, 키보드를 통하여 시스템으로 교정된 형태의 상기 워드를 입력시킬 수 있다. 다른 방법은 제1 메모리에 저장된 음성 신호가 계속해서 청각적으로 재생되고, 관련된 검출 워드는 동시에 컴퓨터에 의해 표시 장치상에서 나타난다는 점에서 표시 장치에 의해 표시된 바와 같은 텍스트의 검출된 워드의 계속적인 검색을 실시하는 것이며, 순간적으로 검출된 워드는 계속적으로 나타나게 되고, 동시에 시스템의 사용자는 관련된 본래의 음성 신호를 듣게 되고, 그럼으로써 필요로 하는 워드 교정이 사용자에 의해 간단하고 정확하게 인식되도록 해준다.

시스템에서, 음성 인식 장치는 학습 장치와 협동하고, 워드의 특정 스피커에 의해 발음된 음성 신호의 현상 특성은 음성 인식 장치에 의해 상기의 음성 신호로부터 유도되고, 그러한 현상은 상기의 학습 장치에 인가된 대응하는 음성 신호와 일치하는 워드 및 상기의 학습 장치에 인가된 음성 관련 파라미터와의 비교에 의해 학습 장치에 의해서 분석되고, 음성 인식의 처리중에 음성 인식 장치에 의해서 이용될 수 있는 스피커 관련 파라미터와 같은 음성 인식 장치에 저장되며, 표시 장치상에 나타나고 키보드에 의해 교정된 검출되어진 워드가 음성 인식 장치에 의해 본래 워드의 음성 신호로부터 유도된 특성을 함께 분석시키기 위해 학습 장치에 인가되는 것이 유익하다는 사실이 발견되었으며, 상기 분석의 처리중에 새롭게 유도된 스피커 관련 파라미터 역시 음성 인식 장치에 저장된다. 이러한 방식에서, 시스템의 학습 처리는 이미 교정된 전체 텍스트 뿐만아니라 교정된 워드에 대해서도 허용되어, 시스템의 사용 동안에 정확히 검출된 워드의 에러 비율이 일정하게 감소되고, 이러한 시스템은 또한 빠르게 특정한 스피커에 의해서 자주 사용된 특정 텍스트 시퀀스 또는 특정한 스피커의 특징적인 발음을 조정하게 된다.

본 발명의 실시예는 첨부한 도면을 참고로 한 비제한적 예를 사용하여 상세히 설명될 것이다. 도면의 제1도는 텍스트 처리 시스템의 블럭도를 도시한 것이다.

실시예

제1도에 도시된 블럭도에서 음성 인식 장치는 참조번호(1)로 표기되고 텍스트와 일치하는 음성 신호는 텍스트 처리 시스템의 입력(3)으로부터 상기 장치의 입력까지 전기 신호의 형태로 인가되며, 상기의 음성 신호는 마이크로폰으로부터 직접 얻어지거나 또는 임시 저장으로서 이용된 구술 기계에 의해 재생된다. 이러한 전기 신호는 아날로그 신호 또는 디지탈 신호가 될 수도 있고, 디지탈 신호는 사용된 음성 인식 장치의 형태에 의존하는 엔코드된 형태로 될 수 있으며, 현재의 경우에서 사용하기에 적절한 다양한 그러한 장치는 공지되어 있다. 음성인식장치(1)는 전체 텍스트 처리 시스템을 제어하는 컴퓨터(4)에 의해 제어된다. 음성 인식 장치(1)의 입력(2)으로부터, 전기 신호는 특징 메모리(6)에 연속적으로 저장된 주파수 스펙트럼내에서 에너지 집속 막대와 같이 이러한 신호의 특성인 묵음 특징을 결정하는 음성분석기(5)에 일반적인 방법으로 인가된다. 이러한 특징 메모리(6)는 음성 인식 장치(1)의 실제 워드 인식 장치(7)에 입력을 제공하며, 또한 장치에 의해서 식별될 개별 워드를 인에블시키는 메모리에 직렬로 접속된다. 통상적인 방법에서, 이러한 메모리는 특정한 스피커 또는 몇몇 스피커에 의해 발음된 예상 워드 시퀀스의 저장을 위한 음성 모델 메모리(8)를 포함하고, 음성 인식 시스템에 의해서 인식될 수 있는 워드에 대해 스피커와 관련된 음성 합성의 저장을 위한 음성학 메모리(9)를 포함하며, 특정한 스피커 또는 몇몇 스피커의 특징적인 발음과 관련있는 파라미터의 저장을 위한 발음 특징 메모리(10)를 포함하고 있다. 현재의 경우에서, 음성 인식 장치(1)는 또한 상술된 메모리(8,9,10)에 대한 액세스를 가지고 있고, 특징 메모리(6) 및 워드 인식장치(7)와 직접 협동하는 학습장치(11)를 포함하고 있다. 학습 처리 과정중에, 특징 메모리(6)에 저장되고, 음성 인식 장치(1)에 의해 워드의 특정한 스피커에 의해서 발음된 음성 신호로부터 유도되어진 특징은 예를들면 컴퓨터(4)에 의해 학습 장치에 인가되고, 대응하는 음성 신호와 연관되어 있는 워드 및 학습 장치에 인가된 메모리(8,9,10)에 저장된 음성 관련 파라미터와 비교하여 학습 장치(11)에 의해 분석되며, 그러한 특징은 스피커 관련 파라미터와 같은 음성 인식 장치의 메모리(8,9,10)에 저장되어, 그러한 것은 워드 인식 장치(7)에서 이용할 수 있게 된다.

상기 수단은 인식될 음성 신호에 내재된 완전한 텍스트의 개별 워드를 인에이블시키며, 그러한 워드는 디지탈 신호와 같이 워드 메모리(12)에 연속적으로 저장되며, 상기 메모리에서 다른 처리를 이용할 수 있으며, 컴퓨터(4)를 경유하여 프린터(14) 또는 표시 장치(13)에 인가될 수 있다. 이러한 방법으로, 음성 신호에 의해 표시된 텍스트는 개별 워드로 구성된 텍스트로서 표시 장치(13)위에 직접 표시될 수 있고, 검색 또는 교정을 할 수 있으며, 이러한 것은 그러한 음성 인식장치가 일반적으로 특정한 에러비율을 나타내기 때문에 필요하며, 그러한 것은 개별 워드 또는 워드 그룹이 올바르게 식별되지 않아서 표시 장치상에 올바르게 나타나지 않는다는 것을 의미하는 것이다.

잘못되어 검출된 워드의 교정을 용이하게 하기 위해서, 현재의 텍스트 처리 시스템은 후에 설명될 단계를 이용한다.

특히, 전기 신호와 같이 텍스트 처리 시스템의 입력(3)에 인가된 음성 신호는 제1메모리(15)에 저장된다. 제1메모리(15)에서 음성 신호를 저장하기 위해 다양한 방법이 이러한 메모리의 구성에 의존하여 이용될 수 있다. 예를들면, 그러한 제1메모리는 오디오 테이프 기구일 수도 있으며, 오디오 신호는 아날로그 신호와 같이 저장된다. 그러나, 제1메모리는 디지탈 메모리가 될 수도 있으며, 오디오 신호는 숫자화 또는 엔코딩 후에 인가되고, 그러한 메모리는 메모리 내용에 대한 더 빠른 액세스의 잇점을 가지고 있다. 상기 메모리는 예를들면 디스크 저장 또는 고상 메모리가 될 수 있다. 더우기, 중앙 표시 시스템의 메모리는 또한 그러한 제1메모리로서 사용될 수 있다. 선택적으로, 음성 인식 장치(1)의 입력(2)에 인가될 입력 신호는 그러한 제1메모리의 출력에 의해서 제공될 수 있다.

더우기, 개시 표시 및 종료 표시는 음성 인식 장치에 의해서 검출된 개별 워드에 할당되고 워드 메모리(12)에 저장되며, 이러한 표시는 제1메모리(15)에 저장된 음성 신호와 특정한 시간 관계에 있다. 이러한 방법에서, 모든 검출된 워드는 시 표시 및 종료 표시에 의해 제한되며, 워드의 종료 표시는 다음 워드의 개시 표시에 동시에 구성할 수 있다. 이러한 관점에서, 이러한 표시를 발생시킬 때 제1메모리(15)에 저장된 음성 신호와의 특정한 시간 관계가 보장되는 것은 필수적인 것이다. 이러한 목적을 위해, 시간 계산 처리가 수행될 수 있으며, 예를 들면 컴퓨터(4)의 클럭 신호에 의해, 개별 시간 간격을 연속적으로 한정하는 음성 인식 처리 동안에 개별 워드 검출 사이에서 발생하게 된다. 그래서 발생된 개별 검출 워드의 개시 및 종료 표시는 제2메모리(16)에 저장되고, 이러한 것은 워드 인식 장치(7)에 접속되며, 이러한 제2메모리(16)에 대한 액세스는 컴퓨터(4)를 경유하여 제공된다. 컴퓨터(4)는 또한 제1메모리에 대한 액세스를 가지고 있으며, 여기서 오디오 신호가 저장된다. 제2메모리(16)에 저장된 검출되어진 워드의 개시 및 종료 표시에 의해, 컴퓨터(4)는 음성적으로 재생될 일치하는 오디오 신호와 컴퓨터(4)의 제어하에서, 예를들면 커서(cursor) 또는 밑줄로 표시 장치(13)에 의해 표시된 검출 워드가 눈에 띄게 해주며, 제1메모리에 저장되고 검출된 워드와 관련된 음성 신호의 상관 관계를 확립시킬 수 있다.

그래서, 표시 장치(13)에 의해 표시된 워드로 구성되어진 텍스트는 간단하고 빠르며 확실하게 검색되거나 또는 교정될 수 있다. 명령 및 데이타의 엔트리로 이용되고 컴퓨터(4)와 협동하는 키보드(17)에 의해, 표시 장치(13)상에 표시된 눈에 띄는 워드는 필요할 때 교정될 수 있다. 예를들면, 표시 장치상에 표시된 워드로 구성되어진 완전한 텍스트내에서, 이러한 텍스트의 단일 워드는 키보드(17)와 컴퓨터(4)의 제어하에서 눈에 띄게 될 수 있으며, 그후 컴퓨터에 의해서 제2 메모리(16)에 저장되고 눈에 띄는 워드와 일치하는 개시 표시 및 종료 표시는 검출되고, 상기 표시에 의존하여 제1메모리(15)에 저장된 일치하는 오디오 신호는 예를들면 확성기(18)에 의해 음성적으로 재생될 수 있고 판독될 수 있으며, 그러한 재생은 재발될 수도 있고 재발되지 않을 수도 있다. 이러한 방식에서, 시스템의 사용자는 대응하는 워드가 음성 인식장치(1)에 의해서 적절히 또는 부적절하게 검출되어 왔는지의 여부를 입증하기 위해 대응하는 눈에 띄어진 워드와 일치하는 오디오 신호의 모니터를 하는 직접적인 방법을 가지고 있다. 비적절하게 검출된 워드의 경우에서, 시스템의 사용자는 키보드(17)에 의해 교정 워드와 비적절하게 검출된 워드를 대체시킬 수 있다. 그러나, 제1메모리(15)에 저장된 음성 신호가 제2메모리(16)에 저장된 것과 같은 모든 검출된 워드의 개시 및 종료 표시와 함께 컴퓨터(4)에 의해 일치하는 검출된 워드가 동시에 눈에 띄게 되는 동안에, 음성적으로 계속해서 재생되는 그러한 방법으로 표시 장치(13)에 의해 표시된 텍스트의 연속적인 검색을 수행하는 것도 가능하다. 그래서, 시스템의 사용자는 연속적으로 구두(spoken)텍스트를 청취하고, 동시에 표시된 텍스트로 눈에 띄게 된 음성 인식 장치에 의해서 검출된 워드에 관심이 끌리게 된다. 상술된 텍스트 처리 시스템을 사용한 이러한 다른 방법의 결과로서 텍스트가 간단하고 확실하게 교정되고 검색되는 것은 명백하며, 그 후 완료된 교정 텍스트는 프린터(14)에 의해 프린트될 수 있다.

특징 메모리(6)에 저장된 특징과 함께 키보드(17)에 의해 교정되고 표시 장치(13)상에서 눈에 띄게 되어온 검출된 워드의 교정된 번역과, 음성 인식 장치(1)에 의해 본래 워드의 음성 신호로부터 유도되어온 특징이 분석을 위한 학습 장치(11)에 인가되면, 이러한 분석 과정에서 새롭게 유도된 스피커 관련 파라미터는 음성 인식 장치(1)의 메모리(8,9,10)에 또한 저장된다. 현재의 경우에서, 음성 인식 장치(1)에 의해 전체 텍스트의 음성 신호로부터 유도된 모든 특징은 계속해서 특징 메모리(6)내의 그러한 학습 처리에 이용될 수 있고, 워드의 음성 신호와 일치하는 특징은 항상 판독될 수 있으며, 이러한 것은 비교적 큰 저장용량을 가지고 있는 특징 메모리(6)를 필요로 한다. 다른 방법은 그러한 학습 처리를 위해 제1메모리(15)에 저장된 음성 신호를 이용하는 것이고, 특징 메모리(6)에 음성 신호를 다시 저장시키고, 음성 인식 장치(1)에 의해 매번 대응하는 특징을 재검출하는 것이며, 이러한 특징메모리(6)의 저장 용량은 더 작아질 수 있게 된다. 이러한 목적을 위해, 예를 들면 스위치(19)에 의해 시스템의 입력(3)대신에 제1메모리(15)의 출력에 음성 인식 장치(1)의 입력(2)을 접속시키는 것도 가능하다. 그뒤, 컴퓨터(4)는 음성 인식장치에 의해 검출된 대응하는 워드와 일치하고, 제1메모리(15)에 저장된 모든 음성 신호 부분에 대한 액세스를 다시 제공한다. 이러한 방법에서, 학습 장치(11)는 음성 인식 장치(1)가 다른 학습 처리를 수행하는 그러한 방법으로 음성 인식 장치(1)의 메모리(8,9,10)에 저장된 스피커 관련 파라미터를 변조시키거나 또는 갱신시키며, 미래에 그러한 워드와 일치하는 음성 신호가 다시 발생하면 일단 음성 인식 장치(1)에 의해서 올바르게 검출된 상기 워드의 확률이 증가하도록 해주는 대응하는 스피커와 관련되어 수행되므로, 그러한 텍스트 처리 시스템의 에러 비율은 계속해서 감소된다.

음성 인식 장치(1)에 의해 잘못 검출되어온 모든 워드가 키보드(17)에 의해 교정된 후 특징 메모리(6)에 저장되고 음성 인식 장치에 의해 본래 워드의 음성 신호로부터 유도된 특징과 함께 완전한 텍스트를 구성하는 워드가 분석용 학습 장치(11)에 응용되면, 이러한 분석 과정에서 얻어진 새롭게 유도된 스피커 관련 파라미터가 음성 인식 장치의 메모리(8,9,10)에 또한 저장되는 것이 이롭다는 것을 발견하게 되었다. 이러한 방법으로, 이미 교정된 전체 텍스트는 시스템의 학습 처리에서 이용되어, 잘못 검출된 워드의 에러 비율은 감소되고 특정한 스피커의 특징적인 발음과 대응하는 스피커에 의해 사용된 특정한 표현(phrases)에 대한 시스템의 신속한 조정이 성취되어, 결과적으로 그러한 시스템 수행의 실질적인 향상을 가져오게 된다.

이전의 설명으로부터 명백하게 된 바와같이, 기술된 실시예의 다양한 변경은 본 발명의 범위내에서 가능하다. 이것은 특히 음성 신호가 제1메모리에 저장되는 방법과, 개시 표시 및 종료 표시가 발생되고 분석되는 방법에 포함되며, 이러한 표시는 음성 인식 장치에 의해서 검출된 워드를 한정하며, 실제의 음성 인식 장치의 동작을 한정한다. 그리고, 그러한 텍스트 처리 시스템이, 예를들면 텍스트 합병과 같은, 그러한 시스템에서 통상적인 다른 기능을 또한 수행할 수 있음은 명백한 것이다.

Claims

(정정) 텍스트에 대응하는 음성 신호를 음성 인식 장치에 공급하고, 이 음성 인식 장치로 음성 신호중의 워드를 검출하고, 검출한 워드를 디지탈 신호의 형태로 워드 메모리에 저장함과 동시에, 이 워드 메모리로부터 다른 처리 수단에 공급하고, 이 처리 수단에서 검출한 워드를 표시 장치에 의해 텍스트로서 재생하고, 필요할 때 정정하고 프린터에 의해 프린트할 수 있는 텍스트 처리 시스템에 있어서,

상기 음성 신호를 제1메모리에 저장하고, 키보드와 협동하는 컴퓨터의 제어하에서 상기 음성 인식 장치에 의해 검출한 워드에 개시 표시 및 종료 표시를 할당하고, 이러한 표시는 제1메모리에 저장된 음성 신호와 시간적으로 관련되며, 상기 개시 표시 및 종료 표시를 제2메모리에 저장하고, 제2메모리에 저장되어 있는 검출된 워드의 개시 및 종료 표시에 의해 상기 컴퓨터는 검출된 워드에 대응하여 제1메모리에 저장되어 있는 음성 신호와의 상관관계를 확립할 수 있으며, 컴퓨터의 제어하에서 검출한 워드를 표시 장치상에서 강조 표시할 수 있음과 동시에 관련된 오디오 신호를 음향적으로 재생할 수 있으며, 상기 키보드에 의해 데이타를 상기 컴퓨터에 입력할 수 있으며, 필요한 경우 표시 장치상에 표시된 검출 워드를 정정할 수 있도록 구성한 것을 특징으로 하는 텍스트 처리 시스템.
(정정) 제1항에 있어서,

상기 음성 인식 장치는 학습 장치와 협동하고, 특정의 화자에 의해 발음된 워드의 음성 신호의 특징을 상기 음성 인식 장치에 의해 음성 신호로부터 추출할 수 있으며, 이러한 특징은 상기의 학습 장치에 공급한 음성 관련 파라미터와 학습 장치에 공급됨과 아울러 화자 관련 파라미터로서 음성 인식 장치에 기억되는 관련 음성 신호와 대응하는 워드와를 비교함으로써 학습장치에 의해 분석되고, 상기 특징이 음성 인식 처리에서 음성 인식 장치에 의해 이용될 수 있는 텍스트 처리시스템에 있어서,

표시 장치상에 강조 표시되어 키보드를 거쳐 정정된 검출 워드를 학습 장치에 공급하고, 음성 인식 장치에 의해 원래 워드의 음향 신호로부터 추출한 상기 특징과 함께 분석하고, 상기 분석처리에서 새롭게 추출한 화자 관련 파라미터도 음성 인식 장치에 저장하도록 구성한 것을 특징으로 하는 텍스트 처리 시스템.
(정정) 제1항에 있어서,

상기 음성 인식 장치는 학습 장치와 협동하고, 특정의 화자에 의해 발음된 워드의 음성 신호 특유의 특징은 음성 인식 장치에 의해 상기 음성 신호로부터 추출되고, 이러한 특징은 상기 학습 장치에 의해, 학습 장치에 공급한 화자 관련 파라미터와 학습 장치에 공급됨과 아울러 음성 인식 장치에 화자 관련 파라미터로서 저장한 워드와를 비교함으로써 분석되고, 음성 인식 처리에서 음성 인식 장치에 의해서 이용되는 텍스트 처리 시스템에 있어서,

음성 인식 장치에 의해 잘못 검출된 모든 워드를 키보드에 의해 정정한 후, 음성 인식 장치에 의해 원래 워드의 음성 신호로부터 추출한 특징과 함께 완전한 텍스트를 구성하는 워드를 분석용 학습 장치에 공급하고, 상기 분석 처리에서 새롭게 추출한 화자 관련 파라미터도 상기 음성 인식 장치에 저장하도록 구성한 것을 특징으로 하는 텍스트 처리 시스템.