KR930000809B1 - 언어번역 시스템 - Google Patents

언어번역 시스템 Download PDF

Info

Publication number
KR930000809B1
KR930000809B1 KR1019880700643A KR880700643A KR930000809B1 KR 930000809 B1 KR930000809 B1 KR 930000809B1 KR 1019880700643 A KR1019880700643 A KR 1019880700643A KR 880700643 A KR880700643 A KR 880700643A KR 930000809 B1 KR930000809 B1 KR 930000809B1
Authority
KR
South Korea
Prior art keywords
phrase
input
language
phrases
keyword
Prior art date
Application number
KR1019880700643A
Other languages
English (en)
Other versions
KR880701920A (ko
Inventor
와윅크 마이클 스텐티포드 프레드릭
죠지 스티어 마틴
Original Assignee
브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니
프레드릭 제임스 비스코
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니, 프레드릭 제임스 비스코 filed Critical 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니
Priority claimed from PCT/GB1987/000683 external-priority patent/WO1988002516A1/en
Publication of KR880701920A publication Critical patent/KR880701920A/ko
Application granted granted Critical
Publication of KR930000809B1 publication Critical patent/KR930000809B1/ko

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

내용 없음.

Description

언어번역 시스템
본 발명은 제1언어로된 구를 제2언어로된 구로 번역하는 시스템에 관한 것으로서, 특히 제1언어로 된 스피치(speech)를 제2언어로된 스피치로 번역하는 시스템에 관한 것이다.
언어 특히 스피치를 신속하게 자동으로 번역할 수 있는 기계를 수년동안 연구해오고 있지만, 현재로서는 계산하고, 스피치를 인식하며 스피치를 합성시키는 과정이 거대한 그러한 가계도 꿈의 일부로서 존재할 뿐이다.
원문을 자동번역할 수 있는 컴퓨터 시스템에 관한 연구가 많이 행해지고 있지만, 매우 많이 제한된 적용(예로서, 일기예보의 번역)의 경우를 제외하고는 정확하게 자동으로 번역할 수 있는 기계가 없기 때문에 사람이 번역을 하고 있다.
스피치를 번역할 경우 스피치의 인식잘못, 억양의 부가적인 정보, 음의 강약 그리고 스피치 그 자체의 부정확성 등에 기인하는 문제점이 많이 내재하고 있다. 현존하는 원문 언어번역 패키지에는 많은 결함이 있기때문에 그것을 스피치를 스피치로 번역시키는 시스템용으로 사용할 수가 없다.
상기한 패키지의 대부분은 전문 번역가의 보조용으로 설계되어 있어 그리고 그들이 발생시키는 출력은 재편집되어져야 한다.
대부분의 패키지는, 메뉴식으로 구동되어 상호 작동되든지 또는 배치처리모드로 작동되게 되어 있으므로 실제 시간 스피치 작동용으로 적합하지 않다. 그리고 또 번역 패키지는 신빙성이 약하므로 출력이 정확하게 번역되었는지의 여부를 보증할 수가 없다. 현존하는 시스템은 매우 집약적인 CPU이기 때문에 작동시키는데 비용이 많이 들게 되므로 부적합한 경우가 많게 된다.
본 발명에 따른 제1언어로된 구를 제2언어로된 구로 번역하는 시스템은 제2언어로된 일군의 구들중 어느 하나로 구성된 구를 제2언어로 출력시키는 출력장치, 일군의 구들중 어느 것이 상기 입력된 구에 대응하는지를 판별하는 특성표시장치, 출력장치를 제어하고 그리고 입력된 구에 대응하는 상기 일군의 구로부터나온 구를 출력시키기 위해 특성표시장치에 응답하는 장치로 구성되어 있다.
이러한 시스템은 번역을 매우 빨리하며, 여기서 요구되는 시간은 입력된 구를 감정하고/특성을 표시하는데 소요되는 시간과 제2언어로된 응답을 찾는데 소요되는 시간이다. 이 시스템을 사용하여 사용자는, 스피치 번역 시스템에서 매우 중요한 입력확인을 할 수 있다.
메시지의 특성 설명이 정확하게 되었다는 것이 사용자에 의해 확인되면 기억된 일군의 구가 미리 만들어진 정확한 번역으로 구성되어 있기 때문에 번역의 정확성이 보증된다. 이 시스템으로 동시에 다수의 제2언어로 빨리 번역할 수도 있는데, 이 경우에는 부수적인 제2언어로된 여러군의 구를 기억하는 기억장치가 필요하게 된다.
이하 첨부 도면을 참조하면서 본 발명을 상세히 설명 하기로 한다.
제1도는 본 발명에 따른 시스템의 중요한 부분을 나타내는 블럭도이다.
본 발명은 매우 많이 작은 수의 키워드를 사용하여 많은 수의 분명한 구의 어휘에 관한 내용을 파악할 수 있다는 개념에 근거를 둔 것이다.
키워드를 적절히 선택하면 유용한 큰 세트의 구에 함유되어 있는 것보다 상당히 작은 단어만을 인지할 수 있는 현존하고 상업적으로 구입가능한 스피치 인지기를 사용하여 큰 세트의 구의 특성을 표시하고 구별하는 것이 가능하다. 그러므로 전체적으로 번역시스템의 수행을 구들은 정확하게 구별시키는 키워드의 능력에 의존한다. 구를 크게 분리시키면 시킬수록 시스템에서의 인지에 대한 오차가 더 커지게 되고 그리고 연사에 의한 불일치가 생기게 된다.
키워드의 선택
적당한 조사과정은 다음과 같다.
1. 구에서의 단어의 출현빈도수에 따라 관련되는 N개의 구에 있는 K개의 단어들 각각을 순서되로 배치시킨다.
2. 처음의 키워드 리스트로 M개의 가장 빈번하게 발생되는 단어를 선택한다.
상기에서 M은 스피치 인지기의 어휘에 있는 단어의 수이다.
3, 각각의 구에서 키워드의 존재여부가 이때 판별된다.
키워드에 의해 구별되지 않은 구의 수(E)가 계산되어 진다.
4. i=1이라고 한다.
5. 키워드가 리스트로 부터 순간적으로 삭제 되어지고 그리고 E의 새로운 값(E′)이 계산되어 진다.
6. E′-E 의 값이 순간적으로 삭제된 키워드에 할당되어 진다.
이것은 키워드가 갱신된후 수행에 대한 그것의 기여도에 관한 측정의 표준이다.
[실제상에 있어서, 이러한 측정의 표준은 각각의 키워드가 가능한 많은 구의 분리에 기여하고 다른 기능에 단순히 중복되지 않게 하는 것을 보증한다.]
7. 순간적으로 삭제된 키워드는 대치되어지고 그리고 처리 과정은 M개의 키워드의 각각에 대해 반복되어진다.
8. 가장 낮은 스코어로된 단어는 현존하는 키워드 리스트로 부터 제거되어 진다.
9. 이때 M+1 번째로 가장 빈번한 단어가 제거된 단어 대신에 사용되고, 그리고 또 새로운 E가 계산되어 진다.
10. 새로운 E가 이전의 E보다 개선된 수행을 가르킬 경우 i는 중분되어지고 그리고 처리과정은 M+i〉K가 아닌한 단계 5부터 반복되어진다.(M+i〉K이면 처리과정은 정지하게 된다), M+i 번째 단어가 거절되지 않으면 i는 증분되고 그리고 처리과정은 M+i〉K가 아닌한 단계 9부터 반복되어진다(M+i〉K이면 단계 8에서 제거된 마지막 단어는 대치되어 갖고 그리고 처리과정은 정지하게 된다).
최종 키워드 리스트는 구의 동일 증명용의 최적세트의 M개의 단일 키워드를 포함한다. 이전 반복에서 부터 최적의 M개 단어를 갖고 시작하는 반복을 계속시켜 구의 분리를 더 개선시킬 수 있다.
단계 1에서 후보 단어를 나열시키기 위해 특히 종래의 언어 정보가 유용할 경우에는 빈도수의 순서법 대신 발견적 교수법을 이용할 수도 있다. 부가적으로 발생 리스트의 바닥쪽을 향하는 단어가 구의 분리를 현저하게 도우지 못하기 쉬우므로 발생리스트의 상단 1/3이나 상단 1/2 이외의 부분을 조사하지 않아도 된다.
대부분의 구가 구별되고 그리고 E가 조사의 초기 단계에 제로에 가깝게 되는 경우가 가끔 있다. 하나 이상의 키워드가 다른 경우 구가 구별된다는 것에 근거로 E를 계산하여 개선시킬 수도 있다. 이러한 것은 대부분의 구가 최소수 이상의 키워드에 대해 분리되어지는 것을 보증하고 그리고 스피치 인지 에러에다 약간의 면역을 제공한다. 조사하는 동안 여러등급의 구는 키워드 어휘가 확정되지 않는 한 결코 분리되지 않게 된다.
이러한 그룹의 구는 단일의 단어나 종속적인 단어줄(예로서 상업 편지에서의 날자)에 의해 다르게 되는 경향이 있고, 그리고 키워드 보조 어휘의 준비용으로 사용될 자동적으로 유도되는 후보들이다. 단일 키워드의 인지는 단어순서와 그것이 함유할 수 있는 부가적인 의미를 고려하지 않는다. 단어들이 여러가지로 분류되어 있는 단어의 키쌍의 존재여부는 단일 키워드 세트의 효과를 개선시키는데 사용될 수 있다. 이러한 것은 수행이 인지 어휘를 증가시키지 않고 개선될 수 있다는 스피치 인지에서 잇점을 가진다.
원문 적용에 있어서, 구두점, 단어의 부분, 단어의 결합을 포함하는 키워드를 일반화시켜 개선시킬 수도 있다.
상기의 예로서는 “-ing *bed”(여기서 *도 단어가 될 수 있음)가 “selling the bed”를 나타낼 수도 있다.
키워드 쌍(예로서 we * * to)의 사용은 구의 혼돈이 해결되면 구성 단일 단어의 값어치를 향상시킨다. 반드시 연속적이지 않고 다른수의 다른 단어에 의해 분리되어 있는 단어쌍의 조사는 다시 빈도수의 준비와 함께 시작된다.
M개의 키워드에 있는 양쪽 구성 단어를 가진 단어쌍은 그들이 잔존하는 구의 혼란을 해결하면 순서 리스트로 부터 만들어진다. 단일 키워드와 쌍으로된 키워드의 최종 리스트는 전과 같이기록 되어지고 전체적인 구의 혼돈 스코어 E가 계산되어진다. 조사는 단어쌍의 더 잘 수행시키기 위해 시작되고, 여기서 구성 키워드의 하나 또는 양쪽은 현재의 키워드 리스트에 있지 않다.
다음 단어쌍 후보는 빈도수의 상단에서 부터 취해지고 키워드 리스트에 덧붙여진다. 이러한 것은 구성 단어가 더 이상 존재하지 않을때 다른 단어쌍이 제거되어지게 한다.
E의 새로운 값(E′)이 계산되어진다. 어떤 한 개선이 얻어지고 E'〈E이면 키워드 리스트의 최종적인 변형이 보류되어 지고, 그렇지 않으면 리스트는 그 이전의 상태로 다시 기억되어 진다. 단어쌍은 빈도순서로 부터 처리되지만, 단일 키워드 조사와 함께 후보 단어쌍을 제공하기 위해 다른 발견적 교수법이 사용될 수 있다.
일부의 키워드는 그 자신이 행하는 것이외에 다른 단어 그룹에 가입하여 전체 수행에 많은 기여를 한다는 것을 관측할 가치가 있다. 그 방법은 더 큰 키워드 그룹(〉2단어)까지 확장하지만 출현 빈도수는 감소되기 때문에 구의 혼돈의 해결에 대한 기여는 구의 매우 큰 전집에서만 단지 중요하다.
키워드용 조사에서 함유된 계산의 양은 키워드의 수 및 구의 수와 함께 증가한다. 이러한 것은 혼돈되든지 혼돈될 염려가 있는 보조세트의 구에다 먼저 특정연상을 하여 감소시킬 수 있다. 키워드 그리고 이와 같이 해서 얻어진 그들의 스코어는 후보 키워드의 순서를 정하여 주연산이 더 많이 완전한 세트의 구와 함께 작동되게 한다.
스피치 인지 적용에서, 키워드 세트에 없는, 어떤 단어들은 많은 유사한 키워드 인지, 예로서 단어“I”가 키워드 “bY”로 인지되는 것과 같은 것이 발생될 수 있다. 그러나 키워드용 조사가 시작되기 전에 혼돈된 단어의 그룹이 유사한 것으로 고려되어지면 뒤 이온 구의 동일확인 단계에서 실제의 구 분리는 이 문제에 의해 영향을 받지 않게 된다.
이와 함께 취해진 유사한 단어의 빈도수가 분리된 단어의 빈도수 보다 반드시 더 높기 때문에 구의 정보의 더 큰 양이 정상적으로 그들의 검출과 함께 연관되어 진다. 키워드를 더 놓은 빈도수로 다시 발생하고 전체 단어보다 더 많은 구의 구별정보를 갖고 있는 키워드부분(예로서 음운)에 까지 확장하여 사용할 수도 있다.
또한 연속적이 스피치에 있는 어떤 단어부분의 동일 증명은 가끔 완전한 단어보다 더 쉽고 연속적인 스피치 입력을 수락하는 번역시스템에서 더 선호된다. 이 명세서를 통해 단어 “키워드”는 간 결성을 위해 전체 키워드와 키워드의 부분에 대해 다 사용된다.
여러분류의 구는 날짜, 시간, 간격, 항목, 이름들의 세부사항 또는 다른 그룹의 단어들을 포함하는 절과 보조구에서 서로 다르다.
스피치 인지기의 어휘는 구를 특별한 그룹의 구로 할당시키기에는 충분하지만 종속적인 구조를 분리시킬수 있을 정도의 충분한 키워드를 유지시킬만큼 충분히 크지는 않다. 구의 등급과 종속적인 구조를 분리시키기 위해 요구되는 전체어휘는 쉽게 혼돈될 더 많은 단어를 포함할 가능성이 있다. 이러한 것은 인지기의 용량이 전체어휘를 감당할만큼 충분하여도 신뢰성이 있는 구와 종속적인 구의 동일성을 확인하기가 어렵다는 것을 의미한다.
본 발명에 따른 방법의 잇점은 정통발음이나 정통발음의 어떤 변형이 버퍼메모리에 기억되고 구의 분류가 정해지면 인지과정이 그 구의 분류에 특징적인 종속단어줄에서 기대되는 키워드의 세트를 사용하여 반복되어 진다는 것이다. 이런식으로 인지장치는 당장에 많은 잠재적인 단어혼돈을 갖고서 전체 어휘에 대처하지는 못하지만 사용자가 그렇게 하게 한다.
제2인지처리의 스피치는 정통발음의 스피치에 의해 제한되지 않고 실제의 시간보자 훨씬 더 빨리 수행될수 있으므로 반드시 현저한 지연을 초래하지는 않는다.
인지의 반복은 요구되는 구와 그것의 보조구조의 동일성을 판별하기 위해 필요로 하는 만큼 여러번 행해질 수 있다. 인지처리를 차례로 수행하는 것이 가능하게 되고, 그는 다수의 별도로 된 단계에서 특성이 설명되며, 각 단계에서 인지기는 키워드의 다른 어휘를 작성하게 된다. 비록 전부는 아니지만 많은 종속적인 단어 소스 언어와는 무관한 별도의 문맥으로 될 수도 있다. 이러한 것은 종속적인 단어줄을 위한 위치가 여러개의 대안이 그들의 어느것에 대해 꽉짜인 문맥상의 종속성이 작게 만들 가능성이 있는 것처럼 지정되어지기 때문이다.
부가적으로, 문맥상의 중요성은 잠재적인 종속줄의 내부와 외부에 있는 단어사에 종속성이 있으므로 줄의 내부에 있는 단어를 사용하지 않고서 키워드가 전체구를 구별할 수 있게 하는 것을 암시한다. 이러한 것은 날짜 그 자체이외의 어떤 단어들도 거의 변화하지 않는 날짜 변경을 포함하는 구에서 입증되어진다. (이러한 문맥상의 독립은 언어들 사이에서 일반적으로 불변이고 구의 번역을 무한히 확장시키기 위해 그것을 사용하는 것이 판독을 입증하기 위한 장래의 조사 대상이다)
이러한 관점에서, 본 발명의 시스템을 원문의 번역용으로 사용할 때 현저한 잇점을 얻을 수가 있다. 즉, 상기에서 큰 사전을 조사하는데 소요되는 계산비용은 작은 사전이나 구문책의 유사한 체계를 사용하는 것에 의해 현저하게 감소 될수 있다.
약간의 종속적인 구는 번역될 필요가 없고 그리고 가끔 이런 경우에 이런 구에 있는 단어를 자동으로 인지하는 것이 일반적으로 불가능하다. 이런 것의 가장 평범한 경우는 예로서 “Can I speak to Mr. Smith, please? ”의 Smith와 같은 그러한 적당한 명사의 호칭에 관해 언급하는 발음에서 발생한다. 전과 같이 시스템으로 호칭의 기준에 대응하는 버퍼에 있는 단어의 위치와 함게 구의 등급을 판별할 수 있다. 번역되는 동안 이러한 호칭기준 단어의 처리는 최종목적언어발음내의 적당한 위치에 최초 음향 신호의 전달을 간단하게 하는 것이다.
합성된 목적언어음성은 최초 연사의 음성과 정합 되어져야 하고 그리고 어떤 스피치 변수가 세트되어 상기 정합이 가능한 한 성취되게 하는 것이 원문을 스피치로 합성시키는 요구 조건이다. 그 결과 사용자는 정확한 구가 목적언어로 출력되는지를 확인 할 수 있고, 시스템은 그것이 입력언어로 된 어떤 구를 번역하고 있는지를 나타내게 된다. 이것을 행할 수 있게 하기 위해 시스템에는 입력언어로 된 구의 전체 레퍼토리를 기억하는 기억장치가 설치되어 있다.
종래의 컴팬드된 또는 컴팬드 되지 않은 스피치용으로 요구되는 것과 비교하면 기억용량의 요구조건이 상당히 감소되기 때문에 시스템에서 구가 원문으로 예로서 ASCII 코드 형으로 기억되어 있는 것이 좋다.
스피치 출력이 요구될 경우 원문은 기억장치로 부터 회수되고 원문을 스피치로 변화시키는 변환기와 스피치 합성장치로 통과되어 진다.
ASCII 코드로된 원문 기억장치와 함께 문자당 1바이트가 요구되고, 이러한 것은 약 10,000개의 구가 0.5메가바이트 용량의 기억장치에 기억될 수 있다는 것을 의미한다. 약 10,000구의 번역을 제공하는 시스템이 약 1메가바이트의 기억장치를 요구하므로 하드 디스크에 쉽게 제공되어 진다.
두개의 번역시스템을 대칭형으로 설치하여 쌍방향 통신을 수행할 수 있다. 이것은 각각의 장치가 그 장치를 작동시키는 사람의 언어에 있는 단어를 합성시키는 데만 관련된다는 잇점이 있다.
제2의 장치에서의 통신은 구와 어떤 종석적인 구의 내용을 세분화 시키는 프로토콜에 의해 행해진다. 프로토콜은 언어에 독립적으로 되어 있으므로 목적언어를 감정할 필요없이 메시지가 전달되게 한다.
부가적으로 그것은 많은 다른 언어를 사용하는 사람이 단일 장치의 출력으로 부터 동시에 번역문을 받아볼 수 있게 한다.
전화회로망에 연결되어 있는 입증 시스템은, 구문책 접근의 가능성을 입증하기 위해 작동되어 진다.
입증 시스템은 보탄(Votan) 스피치 인지기, 인포복스(Infovox) 스피치 합성기 및 아이비엠 피씨 액쓰티(IBM PC XT) 컴퓨터를 사용한다. 보탄 스피치 인지기는 전화회로망을 통해 연속적으로 얘기되는 단어를 최고 64개 까지 인지할 수 있다. yes, no, guit 및 enter와 같은 시스템 제어단어를 제외하면 최고 60단어가 키워드 인것으로 선택될 수 있다. 시스템 제어단어들은 입력구에 나타나지 않게 되므로 말로써 명령하는 것보다 제어버턴이나 키를 사용하는 것이 더 양호하게 되도록 할 수 있다.
구의 기억장치는 400개의 영어로 된 구와 그와 동등한 불어로된 구를 구성하고 있고, 그리고 영어로 되 구는 약 1100개의 각기 다른 단어를 포함하고 있다.
상기한 숫자의 단어로 문장을 만들면 상기한 숫자의 구로 상업용 표면의 구문책을 만들 수 있다.
상기한 원리에 근거하여 키워드 발췌소프트 웨어를 작동시킨후 60개의 키워드가 선택되어져서 모든 구를 연속적으로 분리시킨다.
400구 중에서 단지 32개만이 단일 워드에 의해 구별되었다. (이런 32개의 구는 16쌍으로 되어 있다).
키워드를 인지할때 입증 시스템은 적당한 구에 접근하여 그것을 사용자와 함께 확인하고 그리고 원문을 스피치로 합성시키는 합성 장치를 경유하여 동동한 불어를 출력시킨다.
원문-스피치 합성이 본 발명에 대해 필수적인 것은 아니다. 이전에 기록 또는 코드화된 단어와 구로부터 목적언어 스피치를 합성시키는 것은 실행 가능하고 정말로 유익하다. 이런것은 스피치가 사용자에 의해 기록될 수 있고, 이에 의해 어떤 간직된 스피치를 음향상으로 정합시킬 수 있으며, 그리고 미리 더 많은 스피치 합성을 해야할 필요성을 제거시키는 잇점을 가지고 있다. 이러한 접근은 언어에서의 원문-스피치 합성의 필요성을 제거한다.
본 발명의 구성상태를 보다 더 명료하게 하기 위해 상기한 실시예에 대해 좀 더 구체적으로 설명하기로 한다.
입력장치는 스피치 인지기와 제어기로 들어가는 화살표로 표시되어 있다. 실제상에 있어서, 입력장치는 외부로 부터 들어오은 스피치용의 전화선과 같은 입력라인이나 마이크로 폰 또는 원문 입력을 받는 데이터 라인 커넉션이나 키보드등과 같은 입력 수단으로 구성되어 있다.
제2언어로 된 구를 기억하고 있는 기억장치인 메모리는 IBM 컴퓨터와 연관되어 있는 메모리로 되어 있다. 수집된 제2언어로된 구는 전형적으로 ASC II 코드형으로 기억되어 진다. 기억된 구를 선정하는 것은 사용자에 의해 정해진다.
특성표시장치는 제어기와 스피치 인지기로 구성되어 있고, 그리고 상기 제어기는 적당한 소프트 웨어가 내장된 IBM 컴퓨터의 마이크로 프로세서로 되어 있다. 스피치 인지기능은 IBM PC의 제어에 따라 작동되는 보탄 인지기에 의해 행해진다. 특성표시장치는 개개의 입력된 구와 기억된 구 사이의 일치여부를 판별한다. 실시예에서, 기억되어 있는 구는 400개이며, 이러한 것들은 P.1~P.400으로 세분화 될 수 있다.
상기한 60개의 단어들을 각각 K1~K60으로 명령하고, 그리고 제1의 언어는 영어로 되어 있는 것으로 가정한다.
상기한 바와 같은 키워드 선택 연산방식은 P1~P400의 400개의 구를 가장 잘 식별하는 K1~K60의 60개로된 키워드의 최적의 세트를 설정하는데 사용되어 진다.
상기한 연산방식을 사용하면 60개의 키워드를 갖게 되고 그리고 또 각각의 구는 상기 워드의 유일한 선택 및 시퀀에 의해 감정되게 된다.
상기와 같이 하여 다음과 같은 표를 얻을 수도 있다.
Figure kpo00001
Figure kpo00002
구의 번역은 컴퓨터에다 자기의 의도를 나타내는 사용자와 함께 시작된다. 컴퓨터는 합성된 스피치를 사용하여 또는 화면상에 나타나는 원문을 통해 번역되어 져야할 구를 사용자에게 알려준다. 음성으로된 입력은 입력장치를 통해 스피치 인지기로 들어가고 그리고 동시에 버퍼에 기억되게 된다. 구가 입력되면 스피치 인지기는 입력에 노출되어져서 스피치에 존재하는 키워드(K1~K60)를 인지하게 된다. 인지기는 인지된 어느 키워드의 동일성과 상응하는 위치를 컴퓨터에다 플래그시킨다. 그러므로 사용자의 발음이 끝날때 컴퓨터는 키워드 동일성의 시퀀스 예로서 K1, K10, K36, K40을 받게 된다.
컴퓨터는 P1~P400용으로 기억된 400개의 시퀀스에서 그 스퀸스를 찾는 매우 단순한 형태의 정합임무를 가진다.
상기표에 의하면 입력 발음이 상기에 즉 키워드 동일성의 시퀀가 K1, K10, K36, K40일 경우 컴퓨터가 이것의 구번호는 P3이라고 판별한다는 것을 알 수 있다. 이 단계에서, 컴퓨터는 사용자와 함께 구번호 P3이 발음된 것임을 확인한다. 이러한 확인 작업은 컴퓨터가 영어로만 구번호 P3을 표시하는 것도 포함한다. 만약 이러한 설비가 제공되면 400개의 구(P1~P400)도 역시 기억장치로 부터 유용하게 되게 된다. 사용자가 컴퓨터에다 P3이 관련되는 구라는 것을 확인시켜 주면 그 컴퓨터는 제2의 언어 즉 불어용의 기억장치에 있는 기억장치 P3에 억세스하게 되고 그리고 그 구의 ASC II 역문은 스피치나 원문으로 출력되게 된다.
상기의 스피치는 원문-스피치 박스를 경유하여 형성되고 그리고 전화기의 수신장치나 화면상에 나타나는 원문과 같은 그러한 출력변환기를 통과하게 된다.
본 발명은 스피치를 스피치로 번역하는 것외에, 원문을 원문으로, 원문을 스피치로 또는 스피치를 원문으로 번역하는 것에도 적용가능하다. 특히 본 발명은 스피치가 활성화된 외국언더 원문 발생기계가 쉽게 갖추어질 수 있는 사무자동화의 분야에서 특히 유용하다. 기본적으로 상기의 기계는 상기한 스피치 인지기, 소프트 웨어 및 제어시스템을 사용할 수 있고, 제2의 언어를 프린터, 텔렉스 또는 다른 통신장치에 출력시킬수 있다.
본 발명에 따른 시스템으로 여러 언어로된 일상 통신의 표준구를 쉽게 제공할 수도 있다.

Claims (16)

  1. 제1언어로된 입력구를 받는 입력 입력장치, 제2언어로된 일군의 구를 기억하는 기억장치, 상기 일군의 구들중 어느것이 상기 입력구에 대응하는 지를 판별하는 입력장치에 연결된 특성표시장치, 그리고 제2언어로 된 정해진 구를 출력시키는 특성표시장치, 그리고 제2언어로 된 정해진 구를 출력시키는 특성표시장치에 응답하는 출력장치로 구성되어 있는 제1언어로 된 구를 제2언어로 된 구로 번역하는 언어번역 시스템에 있어서, 특성표시장치는 하나의 키워드나 선정된 세트의 키워드중의 키워드 부분의 존재를 입력구에 인지시키고 그리고 인지된 키워드나 키워드 부분에 따라 일군의 구들로 부터 기억된 구를 선택하는 장치를 구성하고 있는 것을 특징으로 하는 언어번벽 시스템.
  2. 제1항에 있어서, 데이타 링크를 경유하여 작동 가능하게 연결된 제1 및 제2터미날을 구성하고 있고, 제1터미날이 입력장치와 특성표시장치로 구성되어 있으며, 제2터미날이 기억장치와 출력장치로 구성되어 있고, 제1터미날이 데이타 링크를 경유하여 제2터미날에다 전송시킬 메시지를 발생시키는 장치를 포함하고 있으나, 상기 메시지는 상기 일군의 구들중 어느것이 입력구에 대응하는지를 가르키는 것인 것을 특징으로 하는 시스템.
  3. 제1항에 있어서, 특성표시장치는 입력구가 일군의 구들중 어느구에 대응하는지를 판별하기 위해 첫번째 세트의 키워드를 적용시키고, 그리고 입력구가 정해지지 않은 구에 대응하는 것이 발견될 경우에는 입력구가 어느 그룹의 구에 대응하는지를 판별하기 위해 두번째 세트의 키워드를 적용시키는 것으로 되어 있는 것을 특징으로 하는 시스템.
  4. 제1항 내지 제3항중 어느 한항에 있어서, 특성표시장치가 스피치 인지기를 구성하고 있는것을 특징으로 하는 시스템.
  5. 제1항 또는 제2항중 어느 한항에 있어서, 입력장치가 이야기로된 입력을 수락할 수 있고, 그리고 출력장치가 음성으로된 출력을 제공하는 것을 특징으로 하는 시스템.
  6. 제1항에 있어서, 입력구의 일부분의 제2언어로된 구의 부분으로 출력되도록 하기 위해 상기 입력구의 일부분이 번역되지 않은채로 출력장치를 통해 출력되게 하는 장치가 설비되어 있는것을 특징으로 하는 시스템.
  7. 제1항에 있어서, 입력장치에다 입력메시지를 제공하는 키보드를 구성하고 그리고 제2언어로 된 원문 출력을 제공하는 장치를 구성하고 있는것을 특징으로 하는 시스템.
  8. 제1항에 있어서, 제1언어를 다수의 제2언어중 어느 하나로 번역하기 위해 상기 다수개의 제2언어의 각각에 대한 구가 각각의 기억장치에 기억되어 있는 것을 특징으로 하는 시스템.
  9. 제1항에 있어서, 기억되어 있는 각각의 구가 하나이상의 키워드나 키워드 부분을 포함하고 있고 그리고 정해진 키워드, 키워드 부분 또는 그들이 결합된 것을 포함하고 있는 것을 특징으로 하는 시스템.
  10. 제1항에 있어서, 특성표시장치가 검지된 키워드와 제1언어로 된 구를 비교하는 일 없이 대응하는 구를 판별하도록 작동되게 되어 있는 것을 특징으로 하는 시스템.
  11. 제1항에 있어서, 키워드인지기가 다수개의 구로된 요구되는 세트를 인지하기 위해 선택된 한세트의 키워드를 포함하고 그리고 입력구와 입력구내의 키워드의 검출된 것에 응답하여 기억되어 있는 구내의 구사이의 동일성을 판별하게 되어 있는 것을 특징으로 하는 시스템.
  12. 제11항에 있어서, 키워드 인지기가 인지될 구에 있는 보조세트의 단어를 키워드로 기억시키는 키워드메모리 장치를 포함하고 있고, 그리고 상기 보조세트가 인지될 다수개의 요구되는 구내에 있는 구들을 식별하는데 가장 유용한 것으로 미리 정해지는 것을 특징으로 하는 시스템.
  13. 제12항에 있어서, 키워드 인지기는 다수개(K)의 키워드를 포함하고, 그리고 인지될 입력구가 다수개(N)의 입력구로 구성되어 있으며, N〉K인 것으로 되어 있는 것을 특징으로 하는 시스템.
  14. 제2언어로 된 일군의 구를 기억하는 기억장치, 제1언어로 된 구를 받는 입력장치로, 상기 일군의 구들중 어느것이 상기 입력구에 대응하는지를 판별하기 위해 상기 입력장치에 연결되어 있고 상기 일군의 구에 대응하는 제1언어로 된 구에 있는 단어의 전체수보다 더 작은 제1언어로된 선정된 세트의 키워드가 입력구에 존재하는 지의 여부를 검지하는 키워드 검지장치를 구성하고 있는 특성표시장치, 입력구에 있는 특성표시장치에 의해 검지된 키워드에 따라 입력구에 대응하는 구를 어드레스 시키기 위해 기억장치에 억세스되게 배치되어 있는 검색장치, 그리고 검색장치에 응답하여 제2언어로된 구를 출력시키는 출력장치로 구성되어 있는 것을 특징으로 하는 제1언어로된 구를 제2언어로된 구로 번역하는 언어번역 시스템.
  15. 제14항에 있어서, 인지될 입력구와 키워드 사이에 1대 1의 상응관계가 존재하지 않는 것을 특징으로 하는 시스템.
  16. 제13항 또는 제14항중 어느 한항에 있어서, 입력장치가 음성으로 된 입력을 받고, 특성표시장치가 스피치 인지기를 포함하고 있는 것을 특징으로 하는 시스템.
KR1019880700643A 1986-10-03 1987-09-29 언어번역 시스템 KR930000809B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB8623839 1986-10-03
GB868623839A GB8623839D0 (en) 1986-10-03 1986-10-03 Language translsation system
GB878710376A GB8710376D0 (en) 1986-10-03 1987-05-01 Language translation system
GB8710376 1987-05-01
PCT/GB1987/000683 WO1988002516A1 (en) 1986-10-03 1987-09-29 Language translation system

Publications (2)

Publication Number Publication Date
KR880701920A KR880701920A (ko) 1988-11-07
KR930000809B1 true KR930000809B1 (ko) 1993-02-05

Family

ID=10605246

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019880700643A KR930000809B1 (ko) 1986-10-03 1987-09-29 언어번역 시스템

Country Status (3)

Country Link
KR (1) KR930000809B1 (ko)
GB (2) GB8623839D0 (ko)
IN (1) IN170322B (ko)

Also Published As

Publication number Publication date
GB8623839D0 (en) 1986-11-05
KR880701920A (ko) 1988-11-07
IN170322B (ko) 1992-03-14
GB8710376D0 (en) 1987-06-03

Similar Documents

Publication Publication Date Title
US5384701A (en) Language translation system
EP0262938B1 (en) Language translation system
US8055495B2 (en) Apparatus and method for translating input speech sentences in accordance with information obtained from a pointing device
US7047195B2 (en) Speech translation device and computer readable medium
US7937262B2 (en) Method, apparatus, and computer program product for machine translation
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
JP4791984B2 (ja) 入力された音声を処理する装置、方法およびプログラム
JPH0916602A (ja) 翻訳装置および翻訳方法
KR19990008459A (ko) 개선된 신뢰도의 단어 인식방법 및 단어 인식기
US20220180864A1 (en) Dialogue system, dialogue processing method, translating apparatus, and method of translation
JP2001505322A (ja) 曖昧さを残さないブライユ点字入力及び変換のための方法とシステム
US4455615A (en) Intonation-varying audio output device in electronic translator
US5918206A (en) Audibly outputting multi-byte characters to a visually-impaired user
JP3911178B2 (ja) 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体
KR930000809B1 (ko) 언어번역 시스템
JPS634206B2 (ko)
KR101553469B1 (ko) 다언어 어휘 음성 인식 장치 및 방법
NO318112B1 (no) System og fremgangsmate for tale-til-taleomforming
JPS5941226B2 (ja) 音声翻訳装置
JPH03217900A (ja) テキスト音声合成装置
JPH02308194A (ja) 外国語学習装置
CN115904172A (zh) 电子设备、学习辅助系统、学习处理方法以及程序
JPH09258776A (ja) 音声認識方法および音声認識装置、並びに翻訳方法および翻訳装置
JP2002116789A (ja) データ変換システム、データ認識システム、データ加工システム、およびプログラムを記憶した記憶媒体
JPH01300334A (ja) 文章読み上げ装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20020126

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee