KR20100134618A - 정보 처리 장치, 방법 및 기록 매체 - Google Patents

정보 처리 장치, 방법 및 기록 매체 Download PDF

Info

Publication number
KR20100134618A
KR20100134618A KR1020107021608A KR20107021608A KR20100134618A KR 20100134618 A KR20100134618 A KR 20100134618A KR 1020107021608 A KR1020107021608 A KR 1020107021608A KR 20107021608 A KR20107021608 A KR 20107021608A KR 20100134618 A KR20100134618 A KR 20100134618A
Authority
KR
South Korea
Prior art keywords
template
phrase
language
variable
air
Prior art date
Application number
KR1020107021608A
Other languages
English (en)
Inventor
이찌꼬 사따
마사또 이이다
Original Assignee
샤프 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 샤프 가부시키가이샤 filed Critical 샤프 가부시키가이샤
Publication of KR20100134618A publication Critical patent/KR20100134618A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Abstract

입력된 문장에 대한 최적의 번역문을 얻는 것이 가능한 번역 장치를 제공한다. 번역 장치(1)는, 제1 언어에 의한 템플릿과 제2 언어에 의한 템플릿은, 소정의 어구로 구성된 고정부와 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부를 각각 대응하는 위치에 포함하고 있고, 제1 언어의 복수의 템플릿에 대하여, 제1 언어로 입력된 문장에 포함되는 어구가, 소정의 어구 및 미리 정한 복수의 어구 중 어느 것과 일치하는지를 판정하는 판정부(22)와, 판정 결과에 기초하여 복수의 템플릿 중에서 적어도 하나의 템플릿을 선택하는 선택부(23)와, 일치한 어구로 치환 가능한 가변부를 포함하는 템플릿이 선택된 경우, 선택된 템플릿과 대응 관계에 있는 제2 언어의 템플릿에 대하여, 일치한 어구로 치환 가능한 가변부에 대응한 가변부를, 일치한 어구에 대응하는 제2 언어에 의한 어구로 치환하는 치환부(24)를 구비한다.

Description

정보 처리 장치, 방법, 및 프로그램{INFORMATION PROCESSING DEVICE, METHOD, AND PROGRAM}
본 발명은, 입력한 문장에 대한 번역문을 취득 가능한 정보 처리 장치, 정보 처리 방법, 프로그램, 및 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 관한 것이다.
종래부터, 유저에 의해 입력된 문장을 다른 언어로 기계 번역하는 번역 장치가 알려져 있다.
기계 번역의 주요한 방식으로서는, 규칙 주도형 방식과 용례 주도형 방식이 있다. 여기서, 간단하게 양 방식의 개요를 설명한다.
규칙 주도형 방식이라 함은, 단어 사전과, 문법 규칙, 의미 처리, 생성 규칙 등의 규칙이나 처리를 사용하여 번역하는 방식이다.
이 규칙 주도형 방식에서는, 단어 사전이 충분히 수많은 단어를 기억하고 있으면, 원리적으로, 어떤 문장이라도 번역 대상으로 할 수 있다. 또한, 단어 사전에 없는 단어(미지어)가 입력문에 있어도, 이와 같은 미지어에의 대처 방법은, 일반적으로 상기 방식이 적용되는 시스템마다 확립하고 있다.
그 반면, 이 규칙 주도형 방식에서는, 해석을 잘못할 가능성이 있고, 그 해석을 잘못한 경우에는 정확한 번역 결과는 얻을 수 없다. 또한, 해석 결과가 정확한 경우라도, 생성되는 번역문은 사전과 규칙으로부터 합성되는 것이기 때문에, 유저에 있어서, 어색함이 발생하는 경우가 있다.
한편, 용례 주도형 방식이라 함은, 대역 예문, 및 입력문과 대역 예문의 매칭 수단 등을 사용하여 번역하는 방식이다. 또한, 대역 예문에는, 품사의 종류 등을 나타내는 문법 정보 등의 약간의 보조 정보가 포함되어 있는 경우도 있다.
이 용례 주도형 방식에서는, 문장으로서, 정확하고 또한 자연스러운 표현인 것이 확정되어 있으므로, 입력문이 대역 예문과 합치하면, 정확하고 또한 자연스러운 표현이 되는 번역 결과를 얻을 수 있다.
그 반면, 대역 예문의 수는 유한하므로, 입력문에 대응하는 예문이 발견되지 않는 경우가 있다. 이 경우에는, 상기 방식만으로는 번역을 행할 수 없다. 따라서, 입력문에 완전 일치하는 대역 예문이 존재하지 않는 경우에는, 입력문과 완전하게는 일치하지 않지만 유사한 대역 예문을 찾아, 그 대역 예문과 입력문의 차이점에 관하여 어떠한 수단을 사용하여 대응하는 처리가 필요하게 된다. 그러나, 이와 같은 처리를 행하면, 번역의 정밀도가 떨어질 우려가 있다.
이하, 용례 주도형 방식의 번역 장치에 있어서의 처리에 대하여, 보다 자세하게 설명한다.
용례 주도형 방식의 번역 장치에는, 예를 들어 복수의 일본어의 문례(이하, 일본어 문례라 함)와 각 일본어 문례를 번역한 영어의 문례(이하, 영어 문례라고 함)가 서로 대응되어 기억되어 있다.
그리고, 이와 같은 번역 장치에서는, 예를 들어 일본어에 의한 문장을 영어에 의한 문장으로 번역할 때에, 그 일본어에 의한 문장과 일본어 문례의 매칭 처리가 행해져, 복수의 일본어 문례 중에서 예를 들어 하나의 일본어 문례가 선택된다. 그 후, 상기 번역 장치에서는, 선택된 일본어 문례에 대응된 영어 문례가 기억부로부터 판독된다.
그러나, 유저가 입력한 일본어에 의한 문장과 상기 선택된 일본어 문례는, 반드시 완전히 일치한다고는 할 수 없다.
이로 인해, 상기 번역 장치에서는, 선택된 일본어 문례와 그 일본 문례에 대응된 영어 문례를, 상기 입력된 문장을 번역할 때의 베이스가 되는 문례(이하, 베이스 문례라고 함)로서 사용함과 함께, 상기 일치하지 않는 부분에 관해서는, 각 장치에 고유한 처리를 실시함으로써 대응하고 있다.
일본 특허 공개 제2006-012168호 공보(특허문헌 1)에는, 상기 고유의 처리가 개시되어 있다.
상기 문헌에 개시된 방법에서는, 입력된 문장의 일부분이 그 일부분에 대응하는 일본어 문례의 부분과 상이한 것이 식별되면, 우선, 그 입력된 문장의 일부분이 입력 불일치 부분으로서, 그 일본어 문례의 부분이 베이스 문례 불일치 부분으로서 지정된다.
그 후, 상기 방법에서는, 입력 불일치 부분을 이용하여 다른 문례의 세트(일본어 문례와 영어 문례와의 세트)가 선택됨과 함께, 그 입력 불일치 부분에 대응할 가능성이 있는 번역의 후보가 그 한 세트의 문례로부터 결정된다. 그리고, 상기 방법에서는, 소정의 선택 알고리즘에 기초하여, 상기 후보 중에서 하나의 후보가 선택된다. 이 선택된 후보를 사용하여, 번역문의 베이스 문례에 있어서의 상기 베이스 문례 불일치 부분에 대응하는 부분의 치환이 이루어진다.
일본 특허 공개 제2002-278964호 공보(특허문헌 2)에는, 기계 번역 장치(규칙 주도형), 번역 메모리 장치(용례 주도형), 및 유사문 번역부 등을 구비한 번역 지원 장치가 개시되어 있다.
이 번역 지원 장치에서는, 번역 메모리 장치에 번역을 요구하였을 때에, 유사문 번역부가, 입력문에 기초하여 대역 데이터베이스를 검색하여 유사문을 취득한다. 또한, 유사문 번역부는 상기 입력문을 기계 번역 장치로 보낸다. 그리고, 유사문 번역부는 기계 번역 장치로부터 상기 입력문의 해석 결과를 취득하여, 그 입력문의 해석 결과와 상기 유사문을 비교한다.
그 후, 유사문 번역부는, 상기 비교 결과에 기초하여, 유사문과 상이한 입력문의 어구를 기계 번역 장치로 보내고, 기계 번역 장치로부터 그 상이한 어구의 대역 어구를 취득한다. 그리고, 유사문 번역부는, 유사문의 대역문에 있어서 상기 입력문과 상이한 어구를, 취득한 대역 어구에 의해 치환한다. 이에 의해, 상기 번역 지원 장치에서는, 기계 번역 장치와의 연계에 의해 대역 결과 중 상이한 부분이 자동적으로 수정되므로, 유저에 의한 수정 작업이 필요없어진다.
일본 특허 공개 제2006-012168호 공보 일본 특허 공개 제2002-278964호 공보
그러나, 특허문헌 1에서는, 상기 매칭 처리를 행할 때, n그램 혹은 형태소 레벨로 비교한 문자열 자체의 일치도가 중요한 결정적 수단으로 되어 있어, 이하의 문제를 해소하는 것이 어렵다.
도 78은 입력문 0을 나타낸 도면이다. 도 79는 입력문 0의 형태소를 나타낸 도면이다. 도 80은 문례 1을 나타낸 도면이다. 도 81은 문례 1의 형태를 나타낸 도면이다. 도 82는 문례 2를 나타낸 도면이다. 도 83은 문례 2의 형태소를 나타낸 도면이다.
예를 들어, 입력문이 상기 입력문 0이었다로 하자. 이에 대해, 대역 데이터베이스에 문례 1 및 문례 2의 일본어 문례가 저장되고 있었다고 하자.
여기서, 입력문 0과, 문례 1 또는 문례 2의 유사도를 비교한다. 우선, 구문적ㆍ의미적으로는, 명확하게 문례 1과의 유사도가 높다고 할 수 있다. 그러나, 주요한 형태소(문장 중에서 의미를 갖는다고 생각되는 것)로 비교하면, 어구 W91(postpositional word functioning as an auxiliary to a main word)과 어구 W92(동사)만 일치하고 있는 문례 1보다, 어구 W93(명사)과 어구 W91과 어구 W92가 일치하고 있는 문례 2의 유사도가 높은 것으로 된다(도 79, 도 81, 및 도 83 참조).
또한, n그램(n=1)이면, 문례 1의 유사도가 77.8%(7/{(9+9)/2}×100)이고, 문례 2의 유사도가 84.2%(8/{(9+10)/2}×100)이므로, 문례 1보다 문례 2와의 유사도가 높다고 할 수 있다. 그러나, 일본어 등의 단어와 단어 사이에 스페이스가 없는 언어에서는, 의미가 없는 문자 단위에서의 비교로 되므로, 유사도 산정에 있어서의 신뢰성은 낮다. 이로 인해, 상기 유사도는 그다지 참고가 되지는 않는다.
도 81에 나타내는 어구 W94(명사)와 어구 W93은 모두 지명이기 때문에, 양자는 개념적으로는 서로 유사한 단어라고 할 수 있다. 특허문헌 1에서는, 통상의 용례 주도형 번역 방식과 마찬가지로, 이 개념적 유사도도 고려한 매칭 처리를 행하고 있지만, 형태소 레벨에서의 일치도 쪽이 확실하기 때문에, 잘못해서 문례 2를 선택하게 되는 결과가 된다.
가령, 개념적 유사도의 비중을 높이도록 미세 조정하였다고 해도, 일정한 스코어링 알고리즘에 기초하여 종합적인 유사도 판정을 행하는 한, 항상 최적의 베이스 문례가 선택된다고는 할 수 없다.
또한, 입력문과 대역 데이터베이스 중의 문례와의 문자열 자체의 일치도가 낮은 경우에는, 베이스 문례가 전혀 선택되지 않는 경우도 있다.
최적의 베이스 문례가 선택되지 않으면, 당연히 최적의 번역문을 생성할 수도 없다.
또한, 특허문례 2의 방식은, 입력문과 문례(유사문)의 구문 해석 결과를 매칭에 이용하므로, 이와 같은 구문 해석을 행하는 기계 번역 장치(규칙 주도형)가 필요해지므로, 구문 해석을 잘못할 가능성은 피할 수 없다.
가령, 대역 데이터베이스에는, 수작업으로 구문 해석 오류를 수정한 정보를 저장할 수 있었다고 해도, 적어도 입력문은 번역 실행시에 구문 해석을 행할 필요가 있기 때문에 오류가 발생할 가능성이 있다.
즉, 특허문헌 2의 방식은, 배경기술에서 설명한 규칙 주도형 방식을 병용하고 있기 때문에, 그 단점도 갖고 있게 된다.
또한, 특허문헌 1이나 특허문헌 2의 방식을 사용하여, 매치하고 있지 않은 부분(비매치부)을 번역할 때에는, 대역 문례 데이터베이스 중의 대역 빈도 정보, 사전, 규칙 등에 기초하여 처리를 행하게 되지만, 이와 같은 처리에도 과제가 있다.
예를 들어 일본어를 영어로 번역할 때, 비매치부만의 국소적인 번역으로는, 매치하고 있는 부분(매치부)과의 공기(共起) 관계를 고려할 수 없어, 의미적으로 적절한 번역어의 선택을 할 수 없는 경우가 있다.
또한, 어떠한 경우도, 사전이나 규칙에 기초하는 국소적인 번역의 경우, 수 정보나, 조수사, 관사 정보 등을 잘못하여, 100% 정확한 영어를 생성할 수 없는 것이 있다.
본원 발명은, 상기 문제점을 해결하기 위하여 이루어진 것이며, 그 목적은, 장치에 입력된 문장에 대하여 최적의 번역문을 얻는 데 있다.
본 발명의 어느 국면에 따르면, 정보 처리 장치는, 제1 언어에 의한 템플릿과 그 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿을 기억한 기억 장치로부터, 상기 제1 언어에 의한 템플릿과 상기 제2 언어에 의한 템플릿을 판독하는 판독부를 구비하고, 상기 제1 언어에 의한 템플릿과 상기 제2 언어에 의한 템플릿은, 소정의 어구로 구성된 고정부와 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부를 각각 대응하는 위치에 포함하고, 판독부에 의해 판독된 제1 언어에 의한 복수의 템플릿에 대하여, 입력 장치를 통하여 제1 언어로 입력된 문장에 포함되는 어구가, 소정의 어구 및 미리 정한 복수의 어구 중 어느 것과 일치하는지를 판정하는 판정부와, 판정의 결과에 기초하여, 복수의 템플릿 중에서, 적어도 하나의 템플릿을 선택하는 선택부와, 선택부에 의해 상기 일치한 어구로 치환 가능한 가변부를 포함하는 템플릿이 선택된 경우, 판독부에 의해 판독된, 상기 선택된 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿에 대하여, 상기 일치한 어구로 치환 가능한 가변부에 대응한 가변부를, 상기 일치한 어구에 대응하는 제2 언어에 의한 어구로 치환하는 치환부를 더 구비한다.
또한, 적어도, 치환부에 의한 치환을 행한 후의 상기 제2 언어에 의한 템플릿에 기초한, 제1 언어로 입력된 문장의 번역 결과를 표시 장치에 표시시키는 표시 제어부를 구비하는 것이 바람직하다.
또한, 치환부는, 선택부에 의해 제1 언어에 의한 템플릿이 선택된 경우, 상기 일치한 어구로 치환 가능한 가변부를 상기 일치한 어구로 치환하고, 표시 제어부는, 또한 치환부에 의한 치환을 행한 후의 제1 언어에 의한 템플릿에 기초하는 화상을 표시 장치에 표시시키는 것이 바람직하다.
또한, 가변부에는, 소정의 식별 표식이 대응되어 있고, 미리 정해진 복수의 어구는 소정의 식별 표식에 의해 특정되는 어구인 것이 바람직하다.
또한, 기억 장치에는, 제1 언어의 사전 데이터와 제2 언어의 사전 데이터가 기억되어 있음과 함께, 제1 언어의 사전 데이터에서는, 그 사전 데이터에 포함되는 어구 중 전부 또는 일부의 어구가, 각각 적어도 하나의 그룹에 속하도록 분류되어 있고, 소정의 식별 표식은 복수의 그룹 중 소정의 그룹을 나타내는 표식인 것이 바람직하다.
또한, 상기 기억 장치에 기억된 사전 데이터는 시소러스(thesaurus)에 관한 데이터를 포함하고, 분류는 상기 시소러스에 관한 데이터에 기초하여 행해지고 있고, 소정의 그룹은 시소러스에 관한 데이터에 있어서 정의된 소정의 구분에 포함되는 어구인 것이 바람직하다.
또한, 기억 장치에는, 제1 언어에 의한 템플릿의 가변부에 있어서의 미리 정한 복수의 어구 각각에 대하여, 제2 언어로 번역한 어구가 하나 대응되어 기억되어 있고, 치환부는, 제2 언어에 의한 템플릿의 가변부를, 기억 장치에 있어서 대응시켜서 기억된 제2 언어로 번역한 어구로 치환하는 것이 바람직하다.
또한, 제1 언어에 의한 템플릿의 가변부와, 그 가변부에 대응한 제2 언어에 의한 템플릿의 가변부에는, 어구의 활용형에 관한 정보가 대응되어 있고, 치환부는, 활용형에 관한 정보에 기초하여, 치환한 어구에 대하여 어형을 변화시키는 것이 바람직하다.
또한, 제2 언어에 의한 템플릿에는 가변부로서, 제1 가변부와 제2 가변부가 포함되어 있고, 치환부는 제1 가변부를 제2 언어에 의한 어구로 치환함과 함께, 상기 치환 후의 어구에 따라서 제2 가변부의 어구를 결정하는 것이 바람직하다.
또한, 제1 가변부는 제2 가변부와의 관련성을 나타내는 부호를 포함하는 것이 가능하고, 치환부는 제1 가변부에 상기 부호가 포함되어 있는 경우, 상기 부호로 특정되는 제2 가변부에 대하여, 치환 후의 어구에 따라서 제2 가변부의 어구를 결정하는 것이 바람직하다.
또한, 선택된 제1 언어에 의한 템플릿과, 그 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿의 각각에 복수의 가변부가 포함되어 있는 경우, 판정부는, 제1 언어에 의한 템플릿을 선택할 때, 각 가변부에 관하여 추출된 어구가 미리 정해진 복수의 어구 중 어느 것과 일치하는지를 판정하는 것이 바람직하다.
또한, 기억 장치에는, 제1 언어에 의한 템플릿을 생성하기 위한 제1 템플릿과, 상기 제1 언어에 의한 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿을 생성하기 위한 제2 템플릿이 기억되고, 판독부는, 기억 장치로부터 제1 템플릿과 제2 템플릿을 판독하고, 정보 처리 장치는 판독된 제1 템플릿과 제2 템플릿에 기초하여, 제1 언어에 의한 템플릿과 그 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿을 각각 복수 생성하고, 그 생성한 제1 언어에 의한 템플릿과 제2 언어에 의한 템플릿을 기억 장치에 기억시키는 생성부를 더 구비하는 것이 바람직하다.
또한, 제1 템플릿과 제2 템플릿은, 소정의 어구로 구성된 제1 부와 미리 정해진 복수의 요소 중 어떠한 요소를 선택 가능한 제2 부를 각각 대응하는 위치에 포함하고, 생성부는 제1 템플릿 및 제2 템플릿에 있어서 서로 대응하는 위치의 요소를, 제1 템플릿 및 제2 템플릿에 있어서 순서대로 선택함으로써, 제1 언어에 의한 템플릿과 그 템플릿에 대응하는 제2 언어에 의한 템플릿을 각각 복수 생성하는 것이 바람직하다.
또한, 요소는 가변부인 것이 바람직하다.
본 발명의 다른 국면에 따르면, 정보 처리 방법은, 제1 언어에 의한 템플릿과 그 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿을 기억한 기억 장치로부터, 제1 언어에 의한 템플릿과 제2 언어에 의한 템플릿을 판독하는 스텝을 포함하고, 제1 언어에 의한 템플릿과 제2 언어에 의한 템플릿은, 소정의 어구로 구성된 고정부와 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부를 각각 대응하는 위치에 포함하고 있고, 판독된 제1 언어에 의한 복수의 템플릿에 대하여, 입력 장치를 통하여 제1 언어로 입력된 문장에 포함되는 어구가, 소정의 어구 및 미리 정한 복수의 어구 중 어느 것과 일치하는지를 판정하는 스텝과, 판정의 결과에 기초하여, 복수의 템플릿 중에서, 적어도 하나의 템플릿을 선택하는 스텝과, 일치한 어구로 치환 가능한 가변부를 포함하는 템플릿이 선택된 경우, 판독된, 선택된 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿에 대하여, 일치한 어구로 치환 가능한 가변부에 대응한 가변부를, 일치한 어구에 대응하는 제2 언어에 의한 어구로 치환하는 스텝을 더 포함한다.
본 발명의 또 다른 국면에 따르면, 프로그램은, 정보 처리 방법을 컴퓨터에 실행시키기 위한 프로그램이며, 정보 처리 방법은, 제1 언어에 의한 템플릿과 그 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿을 기억한 기억 장치로부터, 제1 언어에 의한 템플릿과 제2 언어에 의한 템플릿을 판독하는 스텝을 포함하고, 제1 언어에 의한 템플릿과 제2 언어에 의한 템플릿은, 소정의 어구로 구성된 고정부와 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부를 각각 대응하는 위치에 포함하고 있고, 판독된 제1 언어에 의한 복수의 템플릿에 대하여, 입력 장치를 통하여 제1 언어로 입력된 문장에 포함되는 어구가 소정의 어구 및 미리 정한 복수의 어구 중 어느 것과 일치하는지를 판정하는 스텝과, 판정의 결과에 기초하여, 복수의 템플릿 중에서, 적어도 하나의 템플릿을 선택하는 스텝과, 일치한 어구로 치환 가능한 가변부를 포함하는 템플릿이 선택된 경우, 판독된, 선택된 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿에 대하여, 일치한 어구로 치환 가능한 가변부에 대응한 가변부를, 일치한 어구에 대응하는 제2 언어에 의한 어구로 치환하는 스텝을 더 포함한다.
본 발명의 또 다른 국면에 따르면, 기록 매체는, 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체이며, 프로그램은, 정보 처리 방법을 컴퓨터에 실행시키고, 정보 처리 방법은, 제1 언어에 의한 템플릿과 그 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿을 기억한 기억 장치로부터, 제1 언어에 의한 템플릿과 제2 언어에 의한 템플릿을 판독하는 스텝을 포함하고, 제1 언어에 의한 템플릿과 제2 언어에 의한 템플릿은, 소정의 어구로 구성된 고정부와 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부를 각각 대응하는 위치에 포함하고 있고, 판독된 제1 언어에 의한 복수의 템플릿에 대하여, 입력 장치를 통하여 제1 언어로 입력된 문장에 포함되는 어구가, 소정의 어구 및 미리 정한 복수의 어구 중 어느 것과 일치하는지를 판정하는 스텝과, 판정의 결과에 기초하여, 복수의 템플릿 중에서, 적어도 하나의 템플릿을 선택하는 스텝과, 일치한 어구로 치환 가능한 가변부를 포함하는 템플릿이 선택된 경우, 판독된, 선택된 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿에 대하여, 일치한 어구로 치환 가능한 가변부에 대응한 가변부를, 일치한 어구에 대응하는 제2 언어에 의한 어구로 치환하는 스텝을 더 포함한다.
본 발명에 의해, 장치에 입력된 문장에 대하여 최적의 번역문을 얻을 수 있다는 효과를 발휘한다.
도 1은 본 발명의 실시 형태에 관한 번역 장치의 개략 구성을 도시한 도면이다.
도 2는 상기 번역 장치의 기억 장치에 기억되어 있는 데이터를 나타낸 도면이다.
도 3은 상기 기억 장치에 기억된 템플릿 데이터베이스에 포함되는 템플릿 데이터의 구성을 나타낸 도면이다.
도 4는 상기 기억 장치에 기억된 사전 데이터베이스에 포함되는 사전 데이터의 구성을 나타낸 도면이다.
도 5는 상기 기억 장치에 기억된 일본어 활용형 테이블을 나타낸 도면이다.
도 6은 상기 기억 장치에 기억된 카테고리 데이터베이스에 포함되는 카테고리 데이터의 구성을 나타낸 도면이다
도 7은 상기 기억 장치에 기억된 시소러스 데이터의 계층 구조의 일부를 나타낸 도면이다.
도 8은 상기 카테고리 데이터베이스에 포함되는 다른 카테고리 데이터의 구성을 나타낸 도면이다.
도 9a는 상기 기억 장치에 기억된 공기 관계 데이터베이스에 포함되는 공기 관계 데이터의 구성을 나타낸 도면이다.
도 9b는 상기 기억 장치에 기억된 공기 관계 데이터베이스에 포함되는 다른 공기 관계 데이터의 구성을 나타낸 도면이다.
도 10은 번역 장치의 메모리 내의 각 버퍼를 나타낸 도면이다.
도 11은 상기 번역 장치의 구체적 구성의 일 형태를 나타낸 도면이다.
도 12는 상기 번역 장치에 있어서의 처리의 개략을 나타낸 흐름도이다.
도 13은 템플릿 검색에 있어서의 처리의 흐름을 나타낸 흐름도이다.
도 14는 추출 어구 버퍼에 기억되는 데이터의 구성을 나타낸 도면이다.
도 15는 문례 작성 처리에 있어서의 처리의 흐름을 나타낸 흐름도이다.
도 16은 템포러리 템플릿 데이터 버퍼에 기억된 템포러리 템플릿 데이터의 구성을 나타낸 도면이다.
도 17은 처리문 저장 버퍼에 기억된 템플릿 데이터를 나타낸 도면이다.
도 18은 슬롯부용 버퍼에 기억된 데이터를 나타낸 도면이다.
도 19는 공기부용 버퍼에 기억된 데이터를 나타낸 도면이다.
도 20a는 템플릿 데이터의 슬롯부의 처리 플로우에 있어서의 전반의 처리 플로우를 나타낸 흐름도이다.
도 20b는 템플릿 데이터의 슬롯부의 처리 플로우에 있어서의 후반의 처리 플로우를 나타낸 흐름도이다.
도 21은 템포러리 슬롯 버퍼에 기억된 슬롯 정보의 구성을 나타낸 도면이다.
도 22는 템포러리 사전 버퍼에 기억된 사전 데이터를 나타낸 도면이다.
도 23은 템포러리 어구 버퍼에 기억된 데이터를 나타낸 도면이다.
도 24는 상기 템포러리 어구 버퍼에 기억된, 어형 변화를 행한 후의 데이터를 나타낸 도면이다.
도 25는 상기 처리문 저장 버퍼에 기억된, 슬롯부에 있어서의 치환 처리의 도중 상태의 템플릿 데이터를 나타낸 도면이다.
도 26은 상기 슬롯부용 버퍼에 기억된, 슬롯부에 있어서의 치환 처리의 도중 상태의 슬롯 정보를 나타낸 도면이다.
도 27은 상기 처리문 저장 버퍼에 기억된, 슬롯부의 치환 처리가 완료된 상태에 있어서의 템플릿 데이터를 나타낸 도면이다.
도 28은 상기 슬롯부용 버퍼에 기억된, 슬롯부의 치환 처리가 완료된 상태에 있어서의 슬롯 정보를 나타낸 도면이다.
도 29a는 템플릿 데이터의 공기부의 처리 플로우에 있어서의 전반의 처리 플로우를 나타낸 흐름도이다.
도 29b는 템플릿 데이터의 공기부의 처리 플로우에 있어서의 후반의 처리 플로우를 나타낸 흐름도이다.
도 30은 템포러리 제1 공기 버퍼(81)에 기억된 공기 정보를 나타낸 도면이다.
도 31은 템포러리 제1 공기 버퍼(81)에 기억된 다른 공기 정보의 구성을 나타낸 도면이다.
도 32는 상기 템포러리 슬롯 버퍼에 기억된 슬롯 정보의 구성을 나타낸 도면이다.
도 33은 상기 템포러리 어구 버퍼에 기억된 데이터를 나타낸 도면이다.
도 34는 상기 처리문 저장 버퍼에 기억된, 공기부에 있어서의 치환 처리의 도중 상태의 템플릿 데이터를 나타낸 도면이다.
도 35는 우선 공기 버퍼에 기억된 공기 정보를 나타낸 도면이다.
도 36은 상기 템포러리 슬롯 버퍼에 기억된 슬롯 정보를 나타낸 도면이다.
도 37은 템포러리 제2 공기 버퍼에 기억된 공기 정보를 나타낸 도면이다.
도 38은 상기 템포러리 어구 버퍼에 기억된 어구를 나타낸 도면이다.
도 39는 상기 처리문 저장 버퍼에 기억된, 공기부의 치환 처리가 완료된 상태에 있어서의 템플릿 데이터를 나타낸 도면이다.
도 40은 상기 처리문 저장 버퍼에 기억된 문례 데이터를 나타낸 도면이다.
도 41은 템플릿 데이터베이스에 기억되어 있는 템플릿 데이터의 구성을 나타낸 도면이다.
도 42는 도 41의 템플릿 데이터에 있어서의 일본어 템플릿의 슬롯부에 있어서 치환되는 어구의 예를 나타낸 도면이다.
도 43은 사전 데이터베이스에 기억되어 있는 사전 데이터를 나타낸 도면이다.
도 44는 영어의 문례를 작성할 때의 플로우를 나타낸 흐름도이다.
도 45는 생성된 영어 템플릿의 구성을 나타낸 도면이다.
도 46은 템플릿 데이터베이스에 기억되어 있는 템플릿 데이터의 구성을 나타낸 도면이다.
도 47은 도 46에 나타낸 템플릿 데이터에 있어서의 일본어 템플릿의 슬롯부에 있어서 치환된 어구의 예를 나타낸 도면이다.
도 48은 사전 데이터베이스에 기억되어 있는 사전 데이터를 나타낸 도면이다.
도 49는 영어의 문례를 작성할 때의 플로우를 나타낸 흐름도이다.
도 50은 생성된 영어 템플릿의 구성을 나타낸 도면이다.
도 51은 템플릿 데이터베이스(60)에 기억되어 있는 템플릿 데이터의 구성을 나타낸 도면이다.
도 52는 도 51에 나타낸 템플릿 데이터에 있어서의 일본어 템플릿의 슬롯부에 있어서 치환되는 어구의 예를 나타낸 도면이다.
도 53은 사전 데이터베이스에 기억되어 있는 사전 데이터를 나타낸 도면이다.
도 54는 영어의 문례를 작성할 때의 플로우를 나타낸 흐름도이다.
도 55는 생성된 영어 템플릿의 구성을 나타낸 도면이다.
도 56은 다른 번역 장치의 개략 구성을 나타낸 도면이다.
도 57은 다른 템플릿 데이터베이스에 포함되는 하나의 템플릿 데이터의 구성을 나타낸 도면이다.
도 58은 템플릿 검색에 있어서의 전반의 처리의 흐름을 나타낸 흐름도이다.
도 59는 템플릿 검색에 있어서의 후반의 처리의 흐름을 나타낸 흐름도이다.
도 60은 도 58에 있어서의 스텝 S2001의 상세의 일부를 나타낸 흐름도이다.
도 61은 도 58에 있어서의 스텝 S2001의 상세의 나머지의 부분을 나타낸 흐름도이다.
도 62는 1번째의 스텝 S2113의 처리에 있어서, 요소가 기입된 후의 요소 버퍼의 상태를 나타낸 도면이다.
도 63은 처리 대기 버퍼에 저장한 후의 하나의 템플릿 데이터를 나타낸 도면이다.
도 64는 처리 대기 버퍼에 저장한 후의 다른 템플릿 데이터를 나타낸 도면이다.
도 65는 처리 대기 버퍼에 저장한 후의 또 다른 템플릿 데이터를 나타낸 도면이다.
도 66은 2번째의 스텝 S2113의 처리에 있어서, 요소가 기입된 후의 요소 버퍼의 상태를 나타낸 도면이다.
도 67은 1번째의 스텝 S2117의 처리를 행한 후의, 요소 버퍼의 상태를 나타낸 도면이다.
도 68은 도 63의 템플릿 데이터를, 도 67에 나타내는 요소 1을 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다.
도 69는 도 63의 템플릿 데이터를, 도 67에 나타내는 요소 2를 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다.
도 70은 도 63의 템플릿 데이터를, 도 67에 나타내는 요소 3을 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다.
도 71은 도 64의 템플릿 데이터를, 도 67에 나타내는 요소 1을 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다.
도 72는 도 64의 템플릿 데이터를, 도 67에 나타내는 요소 2를 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다.
도 73은 도 64의 템플릿 데이터를, 도 67에 나타내는 요소 3을 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다.
도 74는 도 65의 템플릿 데이터를, 도 67에 나타내는 요소 1을 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다.
도 75는 도 65의 템플릿 데이터를, 도 67에 나타내는 요소 2를 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다.
도 76은 도 65의 템플릿 데이터를, 도 67에 나타내는 요소 3을 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다.
도 77은 일본어 문장, 일본어의 어구 또는 중국어의 어구를 나타낸 도면이다.
도 78은 입력문 0을 나타낸 도면이다.
도 79는 입력문 0의 형태소를 나타낸 도면이다.
도 80은 문례 1을 나타낸 도면이다.
도 81은 문례 1의 형태를 나타낸 도면이다.
도 82는 문례 2를 나타낸 도면이다.
도 83은 문례 2의 형태소를 나타낸 도면이다.
본 실시 형태에서는, 일본어로 입력된 문장을 영어 및 중국어로 번역하는 경우를 예로 들어 설명한다. 또한, 본 발명은, 이에 한정되지 않고, 어느 언어로 입력된 문장을 다른 언어로 번역하는 구성이면, 적용 가능하다.
일본어로는「활용」이라는 개념이 있다. 「활용」이라 함은, 단어가 문장 중에서 그 단어의 문법적 기능이나 다른 단어로의 이어지는 방법에 따라서, 어형을 변화시키는 것을 말한다. 또한, 활용하는 단어의 변화형을「활용형」이라 한다. 또한, 용어가 활용할 때에 변화하는 어미의 부분(즉 어간 이외의 부분)을「활용 어미」(inflected suffix)라고 한다.
본 발명에 관한 번역 장치의 일 실시 형태에 대하여, 도 1 내지 도 77에 기초하여 설명하면, 이하와 같다.
도 1은, 본 발명의 실시 형태에 관한 번역 장치(1)의 개략 구성을 나타낸 도면이다.
번역 장치(1)는, 도 1에 나타내는 바와 같이, 입력부(10)와, 출력부(11)와, 제어부(12)와, 기억 장치(13)와, 메모리(14)를 구비하고 있다.
입력부(10)는 유저로부터의 입력을 접수하기 위한 입력 디바이스이다. 입력부(10)를 통하여 유저가 문장의 입력을 행함으로써, 메모리(14)에 그 입력된 문장이 기억된다.
출력부(11)는, 제어부(12)로부터의 지시에 기초하여, 입력부(10)를 통하여 입력된 데이터, 및 제어부(12)에 있어서의 각종 처리의 결과를 표시하기 위한 디바이스이다.
제어부(12)는, 도 1에 나타내는 바와 같이, 추출부(20)와, 데이터 판독부(21)와, 판정부(22)와, 선택부(23)와, 치환부(24)와, 표시 제어부(25)와, 출력문 정형부(26)를 구비하고 있다. 또한, 치환부(24)는, 사전 검색부(40)와, 슬롯 치환부(41)와, 공기 치환부(42)와, 변화형 탐색부(43)와, 미입력 개소 치환부(44)를 구비하고 있다.
또한, 제어부(12) 및 제어부(12) 내의 각 부는 기능 블록이며, 이들 블록에 있어서의 처리는, 후술하는 CPU(Central Processing Unit)에 의해 실행되는 소프트웨어에 의해 실현된다.
추출부(20)는, 입력부(10)를 통하여 일본어(제1 언어)로 입력된 문장으로부터, 소정의 규칙에 따라서 어구를 추출한다. 예를 들어, 일본어에 의한 문장 W11(도 77 참조)이 입력부(10)를 통하여 입력된 경우, 추출부(20)는, 예를 들어 형태소 해석을 행함으로써, 어구 W12(명사), 어구 W13(명사), 및 어구 W14(동사)의 3개의 어구(형태소)를 추출한다. 또한, 도 77은, 일본어 문장, 일본어의 어구 또는 중국어의 어구를 나타낸 도면이다.
여기서, 어구라 함은 단어나 구를 의미하고, 어구 중에는 단어(일반적으로 문장을 구성하는 최소 단위로, 특정한 의미나 문법상의 직능을 갖는 것으로 정의되어 있는 것)나 복합어(일반적으로 2개 이상의 단어가 결부되어 하나의 의미를 나타내는 것으로 정의되어 있는 것) 등도 포함된다.
데이터 판독부(21)는 소정의 지시를 받은 경우, 기억 장치(13)에 기억된 각종 데이터를 판독한다. 예를 들어, 데이터 판독부(21)는, 후술하는 템플릿 데이터를 기억 장치(13)로부터 판독한다.
판정부(22)는 입력부(10)를 통하여 일본어로 입력된 문장에 포함되는 어구가, 후술하는 어구와 일치하는지를 판정한다. 또한, 판정부(22)에 있어서의 판정 방법의 상세에 대해서는 후술한다.
선택부(23)는, 판정부(22)의 판정 결과에 기초하여, 기억 장치(13)에 기억된 일본어에 의한 복수의 템플릿 중에서, 적어도 하나의 템플릿을 선택한다.
치환부(24)는, 후술하는 치환 처리를 행함으로써, 상기 선택된 템플릿을 사용하여 일본어에 의한 문례를 작성한다. 또한, 치환부(24)는, 기억 장치(13)에 기억된, 상기 선택된 템플릿과 대응 관계에 있는 영어(제2 언어) 및 중국어(제2 언어)에 의한 템플릿을 사용하여, 영어 및 중국어에 의한 문례를 작성한다. 또한, 치환부(24)가 행하는 처리의 상세와, 치환부(24)에 포함되는 각 부(40 내지 43)가 행하는 처리에 대해서는 후술한다. 또한, 문례라 함은, 후술하는 템플릿 데이터의 가변부를 어구로 치환하여 마침으로써, 얻어지는 문장을 말한다.
표시 제어부(25)는, 출력부(11)에 대하여, 입력부(10)를 통하여 입력된 데이터, 및 번역 장치(1)에 있어서의 각종 처리의 결과를 표시시킨다. 또한, 출력문 정형부(26)에 대해서는, 후술한다.
도 2는, 기억 장치(13)에 기억되어 있는 데이터를 나타낸 도면이다.
기억 장치(13)는, 도 2에 나타내는 바와 같이, 템플릿 데이터베이스(60)와, 사전 데이터베이스(61)와, 일본어 활용형 테이블(62)과, 카테고리 데이터베이스(63)와, 시소러스 데이터(64)와, 공기 관계 데이터베이스(65)를 기억하고 있다.
템플릿 데이터베이스(60)는, 후술하는 템플릿 데이터를 하나 이상 포함하고 있다. 또한, 사전 데이터베이스(61)는, 후술하는 사전 데이터를 포함하고 있다. 또한, 카테고리 데이터베이스(63)는, 후술하는 카테고리 데이터를 하나 이상 포함하고 있다. 공기 관계 데이터베이스(65)는, 후술하는 공기 관계 데이터를 하나 이상 포함하고 있다.
도 3은, 상기 템플릿 데이터베이스(60)에 포함되는 하나의 템플릿 데이터의 구성을 나타낸 도면이다. 도 3에 나타내는 바와 같이, 템플릿 데이터는 템플릿 ID와, 일본어에 의한 템플릿(이하, 일본어 템플릿)과, 영어에 의한 템플릿(이하, 영어 템플릿)과, 중국어에 의한 템플릿(이하, 중국어 템플릿)을 포함하고 있다.
상기 템플릿 ID는 템플릿 데이터를 다른 템플릿 데이터와 식별하는 식별자이다. 또한, 템플릿 ID는 템플릿 데이터마다 고유의 번호가 부여되어 있다.
상기 일본어 템플릿은, 소정의 어구로 구성된 고정부와, 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부를 포함하고 있다. 도 3에 있어서는, 어구 W15(postpositional word functioning as an auxiliary to a main word)와, 문장 W16이 고정부에 해당하고, {1:&HUMAN-SUBJ}와 {2:&VB_EAT+v.ren1}이 가변부에 해당한다.
상기 영어 템플릿은, 일본어 템플릿과 마찬가지로, 고정부와 가변부를 포함하고 있다. 도 3에 있어서는,「What」과「?」가 고정부에 해당하고, {-i:be_AUX+pres}와 {-i:#DET_MY-NULL}과 {1-i:&HUMAN-SUBJ}와 {2:&VB_EAT+ing}가 가변부에 해당한다.
또한, 가변부의 종류로서, 제1 가변부와 제2 가변부가 있다. 도 3에 있어서는, 영어 템플릿 중「1」이나「2」와 같은 숫자로 시작되는 {1-i:&HUMAN-SUBJ}와 {2:&VB_EAT+ing}가 제1 가변부에 해당하고,「-i」로 시작되는 {-i:be_AUX+pres}와 {-i:#DET_MY-NULL}이 제2 가변부에 해당한다. 또한, 이하에서는, 설명의 편의상, 제1 가변부를 슬롯부라고 칭하고, 제2 가변부를 공기부라고 칭한다.
또한, 각 언어의 템플릿에 있어서,「-i」가 포함되어 있는 가변부는, 그 가변부끼리의 사이에 있어서 공기 관계가 있는 것을 나타내고 있다. 여기서, 공기 관계라 함은, 한쪽이 결정하면 다른 쪽이 결정하는 관계, 혹은 한쪽을 임시로 결정해도 다른 쪽과의 관계에서 상기 결정 내용을 변경해야만 하는, 말하자면 양쪽을 함께 결정해 가는 관계를 말한다.
상기 중국어 템플릿에 대해서도, 도 3에 나타내는 바와 같이, 일본어 템플릿과 영어 템플릿과 마찬가지로, 고정부와 가변부를 포함하고 있다.
이상과 같이, 일본어 템플릿과 영어 템플릿(혹은 중국어 템플릿)은, 대응하는 위치에, 각각, 소정의 어구로 구성된 고정부와, 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부를 포함한 구성이다.
또한, 이하에서는, 가변부의「1」이나「2」와 같은 선두의 숫자를 슬롯 번호라고 칭한다. 또한, 각 가변부에 있어서,「:」보다 앞의 문자와「+」보다 뒤의 문자를 제외한 부분(도 3의 경우에는,「be_AUX」와「#DET_MY-NULL」과「&HUMAN-SUBJ」와「&VB_EAT」)을 라벨(소정의 식별 표식)이라고 칭한다. 또한, 상기 라벨 중 슬롯부에 관한 각 라벨(「&」로 시작되는 라벨)을 각각 하나의 카테고리라고 한다.
또한, 상기 슬롯부와 공기부의 상세에 대해서는, 후술한다.
도 4는, 사전 데이터베이스(61)에 포함되는 하나의 사전 데이터의 구성을 나타낸 도면이다. 도 4에 나타내는 바와 같이, 사전 데이터에 있어서는, 사전 ID와, 표제어와, 품사와, 활용과, 조수사 코드와, 의미 코드가 대응되어 있다.
상기 사전 ID의 란에는, 사전 데이터를 다른 사전 데이터와 구별하기 위한 식별자(ID)가 기재되어 있다. 또한, 상기 표제어의 란에는, 일본어의 어구인 어구 W14(동사)와, 그 어구에 대응하는 영어의 어구「drink」와 중국어의 어구인 어구 W17(동사)이 적혀 있다. 또한, 상기 품사의 란에는, 표제어의 품사가 기재되어 있다. 또한, 상기 활용의 란에는, 상기 각 언어에 대하여 상기 어구의 활용형에 관한 정보가 기재되어 있다. 어구 W18의 의미는, 어구 W14가, 어구 W19(도 77 참조)가 나타내는 활용(five-tire conjugation in the "ma" column of the kana syllabary)인 것을 나타내고 있다. 의미 코드에 대해서는, 후술한다.
또한, 도 4에 나타내는 바와 같이, 일본어의 어구에 대하여, 영어의 어구와 중국어의 어구가 각각 하나만 대응되어 있다.
도 5는, 상기 일본어 활용형 테이블(62)을 나타낸 도면이다. 일본어 활용형 테이블(62)에는, 활용의 종류[예를 들어, 어구 W20(도 77 참조)이 나타내는 활용(five-tire conjugation of a Japanese consonant-stem verb), 어구 W21이 나타내는 활용(conjugation of a vowel-stem verb ending in "-eru")]와, 그 활용에 있어서의 각 활용형[예를 들어, 어구 W22로서 나타낸 활용형(form of a verb preceding "nai"), 어구 W23으로서 나타낸 활용형(attributive form of a verb)]으로 사용되는 어구[예를 들어, 어구 W24(inflected suffix), 어구 W25(inflected suffix)]가 기재되어 있다. 또한, 도 5에는, 일례로서, 어구 W19가 나타내는 활용[즉 어구 W18(도 4 참조)]에 있어서의 각 활용의 어구를 기재하고 있다. 또한, 예를 들어 어구 W26으로서 나타낸 활용형(continuative form of a verb)의 어구에는,「ren1」과 같은 생략형의 기호를 대응시키고 있다.
도 6은, 상기 카테고리 데이터베이스에 포함되는 하나의 카테고리 데이터의 구성을 나타낸 도면이다. 도 6에 나타내는 바와 같이, 카테고리 데이터에 있어서는, 카테고리 ID와 라벨명과 의미 코드와 대표값이 대응되어 있다.
상기 카테고리 ID의 란에는, 카테고리 데이터를 다른 카테고리 데이터와 구별하기 위한 식별자가 기재되어 있다. 라벨명의 란에는, 템플릿 데이터(예를 들어, 도 3의 템플릿 데이터)의 가변부에 포함되는 라벨이 적혀 있다. 또한, 대표값에 대해서는 후술한다.
도 7은, 시소러스 데이터의 계층 구조의 일부를 나타낸 도면이다. 여기서, 시소러스라 함은, 단어의 상위/하위 관계, 부분/전체 관계, 동의 관계, 유의 관계 등에 의해 단어를 분류하여, 체계화한 사전(어휘집)을 말한다.
우선, 상기 의미 코드는 상기 라벨에 대응되어 있다. 예를 들어, 도 7에 있어서는,「120201」이라는 의미 코드는,「&HUMAN-PRON_SUBJ」라는 라벨에 대응되어 있다.
여기서, 라벨명으로서「&HUMAN-PRON_SUBJ」가 부여되고, 또한 의미 코드로서「120201」이 부여된 카테고리 데이터에 관해서는, 도 7에 있어서의「&HUMAN-PRON_SUBJ(120201)」라는 구분(소정의 구분)에 포함되는 어구가 상기 카테고리 데이터에 포함되는 어구로서 특정된다. 예를 들어, 일본어의 어구에 대해서는, 어구 W27(명사), 어구 W28(명사), 및 어구 W12가 특정된다.
여기서, 도 6으로 복귀하여, 대표값에 대하여 설명한다. 도 6에 나타낸 바와 같이, 라벨「&VB_EAT」와 의미 코드「52500」이 부여된 카테고리 데이터에는, 일본어와 영어와 중국어의 세트가 복수 세트 포함되어 있다. 그리고, 이들 복수 세트 중 소정의 세트의 각 어구가 대표값으로서 설정되어 있다. 예를 들어, 도 6에서는, 어구 W29(동사),「eat」, 어구 W14,「drink」, 어구 W17 등의 어구가 대표값으로서 적혀 있다.
그런데, 도 3에 나타낸 템플릿 데이터에는, 가변부로서, 예를 들어 {2:&VB_EAT+v.ren1}이나 {2:&VB_EAT+ing}가 포함되어 있다. 이 경우, {2:&VB_EAT+v.ren1} 및 {2:&VB_EAT+ing}에 대해서는, 상기 시소러스 데이터에 있어서「&VB_EAT(52500)」라는 구분에 포함되는 어구가, 치환 가능한 어구로서 특정된다. 또한, 다른 가변부에 대해서도 마찬가지이다.
도 8은, 상기 카테고리 데이터베이스에 포함되는 다른 카테고리 데이터의 구성을 나타낸 도면이다. 이 경우, 번역 장치(1)는, 도 7에 나타낸 시소러스 데이터에 있어서,「&HUMAN-SUBJ」라는 구분에 포함되는 어구를 치환 가능한 어구로서 특정한다. 도 8에 나타내는 경우에는, 번역 장치(1)는, 예를 들어 일본어에 관해서는, 어구 W27, 어구 W28, 어구 W12, 어구 W30(명사) 등을 치환 가능한 어구로서 특정한다.
이상과 같이, 가변부는 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 구성으로 되고 있다. 또한, 이하에서는, 치환 가능한 어구의 집합을 후보라고도 칭한다.
도 9a는, 상기 공기 관계 데이터베이스에 포함되는 공기 관계 데이터의 구성을 나타낸 도면이다. 도 9b는, 상기 공기 관계 데이터베이스에 포함되는 다른 공기 관계 데이터의 구성을 나타낸 도면이다. 도 9a 및 도 9b에 나타내는 바와 같이, 공기 관계 데이터에 있어서는, 언어와 라벨명과 공기 조건이 대응되어 있다. 언어의 란에는, 일본어, 영어 또는 중국어 등의 종별이 적힌다. 또한, 라벨명의 란에는, 상술한 공기부에 적히는 라벨이 적힌다.
또한, 도 9a의 공기 조건의 란에는, 상술한 슬롯부에 사용되는 어구(예를 들어,「I」)와, 그 어구가 사용된 경우에 있어서의 공기부에 사용하는 문자(예를 들어,「am」)의 대응 관계가 적혀 있다. 한편, 도 9b의 공기 조건의 란에는, 상술한 슬롯부의 라벨(예를 들어,「&HUMAN-MY」)과, 그 라벨이 조건으로서 지정된 경우에 있어서의 공기부에 사용하는 문자(예를 들어,「my」)의 대응 관계가 적혀 있다.
도 10은, 상기 메모리(14) 내의 각 버퍼를 나타낸 도면이다.
메모리(14)는, 도 10에 나타내는 바와 같이, 추출 어구 버퍼(70)와, 검색 결과 템플릿 버퍼(71)와, 슬롯부용 버퍼(72)와, 공기부용 버퍼(73)와, 우선 공기 버퍼(74)와, 처리문 저장 버퍼(75)와, 번역 결과 버퍼(76)와, 템포러리 템플릿 버퍼(77)와, 템포러리 사전 버퍼(78)와, 템포러리 어구 버퍼(79)와, 템포러리 슬롯 버퍼(80)와, 템포러리 제1 공기 버퍼(81)와, 템포러리 제2 공기 버퍼(82)와, 입력문 버퍼(83)를 구비하고 있다. 이들 각 버퍼가 기억하는 데이터에 대해서는, 후술한다.
또한, 메모리(14) 내에는, 상기의 각 버퍼 전용의 영역이 항상 준비되어 있을 필요는 없고, 처리에 필요해지는 버퍼의 영역이 메모리(14) 내에서 순차 확보되는 구성이면 된다.
여기서, 도 11을 참조하여, 본 실시 형태에 관한 번역 장치(1)의 구체적 구성의 일 형태에 대하여 설명한다. 도 11은, 번역 장치(1)로서 기능하는 컴퓨터 시스템(100)의 하드웨어 구성을 나타내는 블록도이다.
컴퓨터 시스템(100)은, 주된 구성 요소로서, 프로그램을 실행하는 CPU(110)와, 컴퓨터 시스템(100)의 사용자에 의한 지시의 입력을 받는 마우스(120) 및 키보드(130)와, CPU(110)에 의한 프로그램의 실행에 의해 생성된 데이터, 또는 마우스(120) 혹은 키보드(130)를 통하여 입력된 데이터를 휘발적으로 저장하는 RAM(140)과, 데이터를 불휘발적으로 저장하는 하드 디스크(150)와, CD-ROM(Compact Disk-Read Only Memory) 구동 장치(160)와, 모니터(170)와, 통신IF(Interface)(180)를 포함한다. 각 구성 요소는, 서로 데이터 버스에 의해 접속되어 있다. CD-ROM 구동 장치(160)에는 CD-ROM(161)이 장착된다.
또한, 번역 장치(1)에 있어서의 입력부(10)가 키보드(130) 및 마우스(120)에 해당하고, 출력부(11)가 모니터(170)에 해당하고, 기억 장치(13)가 하드 디스크(150)에 해당하고, 메모리(14)가 RAM(140)에 해당한다.
컴퓨터 시스템(100)에 있어서의 처리는, 각 하드웨어 및 CPU(110)에 의해 실행되는 소프트웨어에 의해 실현된다. 이와 같은 소프트웨어는, 하드 디스크(150)에 미리 기억되어 있는 경우가 있다. 또한, 소프트웨어는, CD-ROM(161) 그 밖의 기억 매체에 저장되어, 프로그램 프로덕트로서 유통되고 있는 경우도 있다. 혹은, 소프트웨어는, 소위 인터넷에 접속되어 있는 정보 제공 사업자에 의해 다운로드 가능한 프로그램 프로덕트로서 제공되는 경우도 있다. 이와 같은 소프트웨어는, CD-ROM 구동 장치(160) 그 밖의 판독 장치에 의해 그 기억 매체로부터 판독되거나, 혹은 통신 IF(180)를 통하여 다운로드된 후, 하드 디스크(150)에 일단 저장된다. 그 소프트웨어는, CPU(110)에 의해 하드 디스크(150)로부터 판독되고, RAM(140)에 실행 가능한 프로그램의 형식으로 저장된다. CPU(110)는 그 프로그램을 실행한다.
도 11에 나타내어지는 컴퓨터 시스템(100)을 구성하는 각 구성 요소는, 일반적인 것이다. 따라서, 번역 장치(1)의 본질적인 부분은, RAM(140), 하드 디스크(150), CD-ROM(161) 그 밖의 기억 매체에 저장된 소프트웨어, 혹은 네트워크를 통하여 다운로드 가능한 소프트웨어라고도 할 수 있다. 또한, 컴퓨터 시스템(100)의 각 하드웨어의 동작은 주지이므로, 상세한 설명은 반복하지 않는다.
또한, 기록 매체로서는, CD-ROM, FD(Flexible Disk), 하드 디스크에 한정되지 않고, 자기 테이프, 카세트 테이프, 광 디스크[MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc)], IC(Integrated Circuit) 카드(메모리 카드를 포함함), 광 카드, 마스크 ROM, EPROM(Electronically Programmable Read-Only Memory), EEPROM(Electronically Erasable Programmable Read-Only Memory), 플래시 ROM 등의 반도체 메모리 등의 고정적으로 프로그램을 담지하는 매체이어도 된다.
여기서 말하는 프로그램이라 함은, CPU에 의해 직접 실행 가능한 프로그램뿐만 아니라, 소스 프로그램 형식의 프로그램, 압축 처리된 프로그램, 암호화된 프로그램 등을 포함한다.
그런데, 상기 구성은, 어디까지나 구체적 구성의 일 형태에 지나지 않고, 상기 마우스를 구비하지 않고, 또한 키보드와 모니터와 하드 디스크가 번역 장치(1) 내에 구비되어 있는 구성이어도 된다. 상기 번역 장치(1)는 전자 사전이나 휴대 전화 등의 포터블형의 휴대 정보 단말기로서도 구성할 수 있다.
이와 같은 휴대 정보 단말기로서 번역 장치(1)를 구성하는 경우에는, 하드 디스크(150) 대신에 예를 들어 플래시 메모리를 사용할 수 있다. 또한, 입력부로서, 터치 펜식의 입력 장치를 구비하는 구성으로 해도 된다. 또한, 소형화의 관점에서, 모니터(170)로서는, 액정 모니터나 유기 EL 모니터 등의 박형의 모니터를 사용하는 것이 적합하다. 또한, 소형화의 관점에서, CD-ROM 구동 장치 대신에 메모리 카드를 판독하는 장치를 설치해 두고, 기록 매체로서 CD-ROM 대신에 상기 메모리 카드를 사용하는 것이 적합하다.
여기서, 번역 장치(1)에 있어서의 처리의 구체적인 흐름에 대하여, 도 12 내지 도 40에 기초하여 설명한다. 또한, 이하에서는, 처리 플로우의 각 스텝에 있어서 행해지는 처리의 결과, 어떤 데이터가 작성되는지를, 적절히 구체예를 들어 설명한다.
도 12는 번역 장치(1)에 있어서의 처리의 개략을 나타낸 흐름도이다.
우선, 입력부(11)를 통하여 일본어에 의한 문장이 번역 장치(1)에 입력된다(S1). 또한, 상기 입력된 문장은 메모리(14)의 입력문 버퍼(83)에 일시적으로 기억된다. 스텝 S1 후에는, 제어부(12)가 템플릿 데이터베이스(60)에 있어서, 소정의 조건을 만족하는 템플릿 데이터를 검색한다(S2).
스텝 S2 후에는, 상기 소정의 조건을 만족하는 템플릿 데이터가 존재하였는지 여부를 제어부(12)가 판단한다(S3). 스텝 S3에 있어서 상기 템플릿 데이터가 존재하였다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S4의 문례 작성 처리로 진행시킨다. 한편, 스텝 S3에 있어서 상기 템플릿 데이터가 존재하지 않는다고 판단된 경우, 제어부(12)는 처리를 종료한다.
스텝 S4에 있어서는, 치환부(24)는 상기 템플릿 데이터를 사용하여, 일본어의 문례와, 그 문례에 대응하는 영어의 문례 및 중국어의 문례를 작성한다. 스텝 S4 후에는, 표시 제어부(25)는 각 언어에 의한 문례를 출력부(11)에 표시시킨다(S5).
또한, 상기에 있어서는, 템플릿 데이터가 일본어 템플릿과 영어 템플릿과 중국어 템플릿을 포함하고 있고, 각 언어에 의한 템플릿을 사용하여 각 언어에 의한 문례를 작성하는 구성을 나타냈지만, 이에 한정되는 것은 아니다.
예를 들어, 유저가 일본어 문장을 영어로 번역한 결과를 알고자 하는 경우에는, 유저가 입력부(10)를 통하여 번역 장치(1)에 소정의 지시를 보냄으로써, 중국어의 문례를 표시하지 않고, 일본어의 문례와 영어의 문례를 번역 장치(1)가 표시하는 구성으로 해도 된다. 즉, 번역 장치(1)는, 유저가 번역이 불필요하다고 생각하는 언어에 대해서는, 출력부(11)에서 출력시킬 필요는 없다. 또한, 이때, 불필요한 언어에 대해서는, 문례를 작성하는 처리를 번역 장치(1)가 행하지 않는 구성으로 해도 된다.
다음에, 상기 스텝 S2에 있어서의 템플릿의 검색의 상세에 대하여, 도 13 및 도 14에 기초하여 설명한다.
도 13은, 템플릿 검색에 있어서의 처리의 흐름을 나타낸 흐름도이다. 또한, 도 14는 추출 어구 버퍼(70)에 기억되는 데이터의 구성을 도시한 도면이다.
우선, 추출부(20)가 입력된 일본어 문장으로부터 상기 소정의 규칙에 따라서 어구를 추출하고, 그 추출한 어구를 추출 어구 버퍼(70)에 기억시킨다(S201). 예를 들어, 문장 W11(도 77 참조)을 입력한 경우, 추출 어구 버퍼(70)에는, 도 14에 나타내는 바와 같이, 추출된 각 어구(어구 W14, 어구 W12, 어구 W13)가 어구(일본어)의 란에 어구 번호와 대응된 형태로 기억된다. 또한, 어구 번호는 추출한 어구를 서로 식별하기 위한 번호이다. 또한, 이하에서는, 설명의 편의상, 추출한 어구를, 어구(WX)로서 표기한다.
스텝 S201 후에는, 데이터 판독부(21)가 템플릿 데이터베이스(60)로부터 템플릿 데이터를 하나 판독한다(S202). 그리고, 스텝 S202 후에는, 제어부(12)가 추출 어구 버퍼(70)로부터 어구(WX)를 하나 판독한다(S203).
스텝 S203 후에는, 판정부(22)가 판독한 템플릿 데이터에 있어서의 일본어 템플릿의 고정부에, 상기 판독한 어구(WX) 또는 그 어구(WX)의 활용형을 나타낸 어구(WX′)가 존재하는지 여부를 판단한다(S204). 또한, 어구(WX′)가 존재하는지 여부의 판단시에는, 상술한, 사전 데이터의 활용의 란에 있어서의 정보와 일본어 활용형 테이블을 사용한다.
스텝 S204에 있어서, 존재한다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S206으로 진행시킨다. 한편, 스텝 S204에 있어서, 존재하지 않는다고 판단된 경우에는, 판정부(22)가 상기 일본어 템플릿의 가변부에 치환 가능한 어구(즉, 상기 후보)에, 상기 판독한 어구(WX) 또는 상기 어구(WX′)가 포함되어 있는지 여부를 판단한다(S205).
스텝 S205에 있어서, 존재한다고 판정된 경우에는, 제어부(12)는 처리를 스텝 S206으로 진행시킨다. 한편, 스텝 S205에 있어서, 존재하지 않는다고 판정된 경우에는, 제어부(12)는 처리를 스텝 S208로 진행시킨다.
스텝 S206에 있어서는, 제어부(12)가 아직 판독하고 있지 않은 어구가 추출 어구 버퍼(70)에 존재하는지 여부를 판정한다. 스텝 S206에 있어서 존재한다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S203으로 복귀시킨다. 한편, S206에 있어서 존재하지 않는다고 판단된 경우에는, 선택부(23)가 상기 템플릿 데이터를 검색 결과 템플릿 버퍼(71)에 기억시킨다(S207). 이와 같이, 선택부(23)에 의해, 복수의 템플릿 데이터 중에서 일정한 조건을 만족한 템플릿 데이터가 선택되어, 검색 결과 템플릿 버퍼(71)에 기억되게 된다. 또한, 스텝 S207 후에는, 제어부(12)는 처리를 스텝 S208로 진행시킨다.
스텝 S208에 있어서는, 제어부(12)가 템플릿 데이터베이스(60) 내에 아직 판독하고 있지 않은 템플릿 데이터가 존재하는지 여부를 판단한다. 스텝 S208에 있어서 존재한다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S202로 복귀시킨다. 한편, 스텝 S208에 있어서 존재하지 않는다고 판단된 경우에는, 제어부(12)는 처리를 도 12의 스텝 S13으로 진행시킨다.
다음에, 상기 스텝 S4에 있어서의 문례 작성 처리의 상세에 대하여, 도 15 내지 도 19에 기초하여 설명한다.
도 15는, 문례 작성 처리에 있어서의 처리의 흐름을 나타낸 흐름도이다.
우선, 제어부(12)가 검색 결과 템플릿 버퍼(71)로부터 템플릿 데이터를 하나 판독하고, 그 판독한 템플릿 데이터를 템포러리 템플릿 버퍼(77)에 기억시킨다(S401). 예를 들어, 도 3에 나타낸 바와 같은 템플릿 데이터가 검색 결과 템플릿 버퍼(71)에 기억되어 있는 경우, 제어부(12)는, 도 16에 나타낸 바와 같이, 결과 번호가 부여된 형태로 템포러리 템플릿 버퍼(77)에 상기 템플릿 데이터를 기억시킨다. 또한, 결과 번호라 함은, 복수의 템플릿 데이터로부터 템플릿 데이터를 식별하기 위한 번호이며, 검색 결과 템플릿 버퍼(71)에 템플릿 데이터가 기억될 때에 부여되는 번호이다.
스텝 S401 후에는, 제어부(12)가 상기 판독한 템플릿 데이터를 처리문 저장 버퍼(75)에 저장한다(S402). 상기 스텝 S402에 의해, 예를 들어 제어부(12)는, 도 17에 나타내는 바와 같이, 도 16에서 나타낸 템플릿 데이터 중 상기 결과 번호와 템플릿 ID를 제외한 데이터가 처리문 저장 버퍼(75)에 기억시킨다. 또한, 도 16은, 템포러리 템플릿 데이터 버퍼(77)에 기억된 템포러리 템플릿 데이터의 구성을 나타낸 도면이다. 또한, 도 17은, 처리문 저장 버퍼(75)에 기억된 템플릿 데이터를 나타낸 도면이다.
스텝 S402 후에는, 제어부(12)가 처리문 저장 버퍼(75)로부터 슬롯부에 관한 정보를 상술한 카테고리(즉,「&」로 시작되는 라벨)마다 추출하고, 그 추출한 각 데이터를 소정 형식의 테이블의 소정 개소에 대입한다(S403).
이 스텝 S403의 처리에 의해, 도 17에 나타내는 데이터의 예에서는, 슬롯부용 버퍼(72)에, 도 18에 나타내는 바와 같이, 슬롯 번호와, 그 슬롯 번호에 대응하는 카테고리와, 각 언어의 정보(활용 정보 및 공기 플래그의 정보)가 대응되어 기억된다. 또한, 활용 정보의 란과, 공기 플래그의 란과, 치환 어구의 란에 있어서는, 언어별로 란(이하, 소란이라고 함)이 형성되어 있다. 또한, 도 18은 슬롯부용 버퍼(72)에 기억된 데이터를 나타낸 도면이다.
여기서, 제어부(12)는, 도 18의 활용 정보의 란에 언어마다 슬롯부의「+」보다 뒤의 문자열을 기입한다. 예를 들어, 제어부(12)는, 일본어 템플릿에서는, 활용 정보의 란에 {2:&VB_EAT+v.ren1}의「v.ren1」을 기입하고, 영어의 템플릿에서는, 활용 정보의 란에 {2:&VB_EAT+ing}의「ing」를 기입한다.
또한, 슬롯부에「-i」라는 부호가 부여되어 있는 경우, 제어부(12)는, 도 18의 공기 플래그의 란에는, 상기 슬롯부에 관련된 소란(도 18에서는, 영어의 소란)의 개소에「i」를 기입한다. 여기서, 상기 부호는, 다른 가변부와의 관련성을 나타내는 부호이다. 또한, 도 18에 있어서의 치환 어구의 란과, 처리 완료 플래그의 란에 대해서는, 후술한다.
또한, 이하에서는, 설명의 편의상, 하나의 카테고리와, 그 카테고리에 관한, 상기 활용 정보와 상기 공기 플래그의 정보와 치환 어구와의 언어마다의 정보로 이루어지는 정보를, 슬롯 정보라고 칭한다. 예를 들어, 도 18에 있어서는,「&HUMAN-SUBJ」에 관한 슬롯 정보와,「&VB_EAT」에 관한 슬롯 정보가 존재하고 있게 된다.
스텝 S403 후에는, 제어부(12)가 처리문 저장 버퍼(75)로부터 공기부에 관한 정보를 라벨(즉,「&」로 시작되는 라벨)마다 추출하고, 그 추출한 각 데이터를 소정 형식의 테이블의 소정 개소에 기입한다(S404).
이 스텝 S404의 처리에 의해, 도 17에 나타내는 데이터의 예에서는, 공기부용 버퍼(73)에, 도 19에 나타내는 바와 같이, 공기 번호와, 라벨과, 언어와, 우선 처리 플래그와, 치환 어구와, 공기 플래그가 대응되어 기억된다. 또한, 도 19는, 공기부용 버퍼(73)에 기억된 데이터를 나타낸 도면이다.
여기서, 상기 공기 번호라 함은, 공기부를 라벨마다 구별하기 위하여 부여된 번호이다. 또한, 상기 언어는, 라벨명으로 특정되는 공기부를 포함하는 템플릿이 어떠한 언어의 템플릿인지를 나타내고 있다. 바꾸어 말하면, 상기 언어는, 라벨명으로 특정되는 공기부에 어떠한 언어가 사용되는 것인지를 나타낸 정보라고 할 수 있다.
또한, 상기 우선 처리 플래그는, 후술하는 공기부의 작성시에 사용되는 플래그이다. 도 17의 영어 템플릿에 나타낸 바와 같이, 공기부의「:」의 뒤에「#」이 부여되어 있는 경우, 상기 공기부의 라벨에 관한 도 19의 우선 처리 플래그의 란에 플래그「1」을 세운다.
또한, 이하에서는, 설명의 편의상, 하나의 라벨과, 그 라벨에 관한, 상기 언어와 상기 우선 처리 플래그와 상기 치환 어구와 상기 공기 플래그의 정보로 이루어지는 정보를 공기 정보라고 칭한다. 예를 들어, 도 19에 있어서는,「be_AUX」에 관한 공기 정보와,「DET_MY-NULL」에 관한 공기 정보가 존재하고 있게 된다.
스텝 S404 후에는, 제어부(12)가 슬롯부용 버퍼(72)에 데이터가 기입되어 있는지 여부를 판단한다(S405). 스텝 S405에 있어서 데이터가 기입되어 있다고 판단된 경우에는, 치환부(24)가 슬롯부의 처리를 실행한다(S406). 그리고, 스텝 S406 후에는, 제어부(12)는 처리를 스텝 S407로 진행시킨다. 또한, 상기 스텝 S406의 상세에 대해서는 후술한다.
한편, 스텝 S405에 있어서 데이터가 기입되어 있지 않다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S407로 진행시킨다. 또한, 템플릿 데이터에 따라서는, 슬롯부가 존재하지 않는 것도 있기 때문에, 제어부(12)는, 스텝 S405에 있어서 데이터가 기입되어 있는지 여부를 판단하고 있다.
스텝 S407에 있어서는, 제어부(12)가 공기부용 버퍼(73)에 데이터가 기입되어 있는지 여부를 판단한다. 스텝 S407에 있어서 데이터가 기입되어 있다고 판단된 경우에는, 치환부(24)가 공기부의 처리를 실행한다(S408). 그리고, 스텝 S408 후에는, 제어부(12)는 처리를 스텝 S409로 진행시킨다. 또한, 상기 스텝 S408의 상세에 대해서는 후술한다.
한편, 스텝 S407에 있어서 데이터가 기입되어 있지 않다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S409로 진행시킨다. 또한, 템플릿 데이터에 따라서는, 공기부가 존재하지 않는 것도 있기 때문에, 제어부(12)는 스텝 S407에 있어서 데이터가 기입되어 있는지 여부를 판단하고 있다.
스텝 S409에 있어서는, 출력문 정형부(26)가 슬롯부와 공기부가 처리됨으로써 작성된 문례에 대하여, 후처리를 행한다. 또한, 상기 처리의 상세에 대해서는 후술한다. 상기 문례로서는, 일본어에 의한 문례와, 영어에 의한 문례와, 중국어에 의한 문례가 포함된다. 즉, 치환부(24)와 출력문 정형부(26)에 의해, 각 언어의 템플릿에 대응한 문례가 작성된다.
스텝 S409 후에는, 제어부(12)가 상기 후처리한 문례를 번역 결과 버퍼(76)에 기입한다(S410). 스텝 S410 후에는, 제어부(12)가 아직 판독되어 있지 않은 템플릿 데이터가 검색 결과 템플릿 버퍼(71)에 존재하고 있는지 여부를 판단한다(S411).
스텝 S411에 있어서 존재한다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S401로 복귀시킨다. 한편, 스텝 S411에 있어서 존재하지 않는다고 판단된 경우에는, 제어부(12)는 처리를 도 12의 스텝 S5로 진행시킨다.
다음에, 상기 스텝 S406에 있어서의 슬롯부의 처리의 상세에 대하여, 도 20a, 도 20b, 및 도 21 내지 도 28에 기초하여 설명한다.
도 20a는, 슬롯부의 처리 플로우에 있어서의 전반의 처리 플로우를 나타낸 흐름도이다. 도 20b는, 슬롯부의 처리 플로우에 있어서의 후반의 처리 플로우를 나타낸 흐름도이다.
우선, 슬롯 치환부(41)가 추출 어구 버퍼(70)로부터 어구(WX)를 하나 판독하고, 그 판독한 어구(WX)를 템포러리 어구 버퍼(79)에 기입한다(S601). 예를 들어, 도 14에 도시하는 바와 같이, 추출 어구 버퍼(70)에 어구 W14와 어구 W12와 어구 W13이 기억되어 있는 경우, 슬롯 치환부(41)는, 도 14에 나타내는 어구 번호의 순서대로 어구를 판독한다. 여기서는, 슬롯 치환부(41)는, 최초로 어구 W14를 판독한다. 또한, 템포러리 어구 버퍼의 구성에 대해서는 후술한다.
S601 후에는, 슬롯 치환부(41)가 슬롯부용 버퍼(72)로부터 상술한 슬롯 정보를 하나 추출하고, 템포러리 슬롯 버퍼(80)에 기입한다(S602). 예를 들어, 슬롯 치환부(41)는, 도 18에 나타내는 슬롯부용 버퍼(73)로부터, 최초로「&HUMAN-SUBJ」에 관한 슬롯 정보를 추출한다. 또한, 추출된 슬롯 정보에 대해서는, 제어부(12)는 슬롯 치환부(41)가 추출 완료인 것을 나타내는 플래그(도시하지 않음)를 세운다. 또한, 이하에서는, 설명의 편의상, 상기한 바와 같이 템포러리 슬롯 버퍼(80)에 기억된 슬롯 정보를 슬롯 정보(SX)로서 표기한다.
스텝 S602 후에는, 슬롯 치환부(41)가 템포러리 어구 버퍼(79)에 기입한 어구(WX)가 추출한 슬롯 정보(SX)에 관련된 어구인지 여부를 판단한다(S603).
스텝 S603에 대하여 구체적으로는, 이하와 같이 판단한다. 또한, 어구(WX)로서 어구 W14(도 14, 도 77 참조)가 판독되어 있고, 또한 슬롯 정보(SX)로서「&HUMAN-SUBJ」에 관한 슬롯 정보가 추출되어 있는 것으로 한다. 이 경우, 슬롯 치환부(41)가, 도 7에 나타낸 시소러스 데이터를 참조하여,「&HUMAN-SUBJ」라는 구분에 포함되는 어구에, 어구 W14와 같은 어구가 존재하는지 여부를 판단한다. 실제로,「&HUMAN-SUBJ」라는 구분에 포함되는 어구에 어구 W14는 존재하지 않으므로, 이 경우, 슬롯 치환부(41)는, 스텝 S603에 있어서, 템포러리 어구 버퍼(79)에 기입한 어구(WX)는 추출한 슬롯 정보(SX)에 관련된 어구가 아니라고 판단한다.
스텝 S603에 있어서 관련된 어구라고 판단된 경우에는, 제어부(12)는 처리를 스텝 S604로 진행시킨다. 한편, 스텝 S603에 있어서 관련된 어구가 아니라고 판단된 경우에는, 제어부(12)는 처리를 스텝 S610으로 진행시킨다.
여기서, 설명의 편의상, 스텝 S604 내지 스텝 S609의 설명 전에, 스텝 S610의 설명을 행한다.
스텝 S610에 있어서는, 슬롯 치환부(41)가 슬롯부용 버퍼(72)에, 아직 추출되어 있지 않은 슬롯 정보가 존재하는지 여부를 판단한다. 스텝 S610에 있어서 슬롯 정보가 존재한다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S602로 진행시킨다. 한편, 스텝 S610에 있어서 슬롯 정보가 존재하지 않는다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S611로 진행시킨다.
여기서, 상기의 예에서는,「&HUMAN-SUBJ」에 관한 슬롯 정보는 추출되어 있지만,「&VB_EAT」에 관한 슬롯 정보는 아직 추출되어 있지 않으므로, 슬롯 치환부(41)는, 스텝 S610에 있어서 슬롯 정보가 존재한다고 판단한다. 그리고, 스텝 S602에 있어서, 도 21에 나타내는 바와 같이, 슬롯 치환부(41)가「&VB_EAT」에 관한 슬롯 정보를 추출한다. 또한, 도 21은, 템포러리 슬롯 버퍼(80)에 기억된 슬롯 정보의 구성을 나타낸 도면이다.
또한, 이 경우, 슬롯 치환부(41)는, 템포러리 어구 버퍼(79)에 기입된 어구 W14(WX)가,「&VB_EAT」에 관한 슬롯 정보에 관련된 어구인지 여부를, 스텝 S603에 있어서 판단하게 된다. 여기서는, 상기와 마찬가지로, 슬롯 치환부(41)가, 도 7에 나타낸 시소러스 데이터를 참조하고,「&VB_EAT」라는 구분에 포함되는 어구에, 어구 W14가 존재하는지 여부를 판단한다. 실제로,「&VB_EAT」라는 구분에 포함되는 어구에 어구 W14는 존재하므로, 이 경우, 슬롯 치환부(41)는, 스텝 S603에 있어서, 템포러리 어구 버퍼(79)에 기입한 어구(WX)는 추출한 슬롯 정보(SX)에 관련된 어구라고 판단한다. 그 결과, 제어부(12)는 처리를 스텝 S604로 진행시킨다.
여기서, 스텝 S604로부터 스텝 S609에 대하여 설명한다. 또한, 스텝 S604로부터 스텝 S609의 설명에 있어서는, 어구(WX)로서 어구 W14가 판독되어 있고, 또한 슬롯 정보(SX)로서「&VB_EAT」에 관한 슬롯 정보가 추출되어 있는 예를 들어 설명한다.
스텝 S604에 있어서는, 사전 검색부(50)가 어구(WX)를 포함한 사전 데이터를 사전 데이터베이스(61)로부터 판독하고, 그 판독한 사전 데이터를 템포러리 사전 버퍼(78)에 기입한다. 또한, 스텝 S604 후에는, 슬롯 치환부(41)가 템포러리 사전 데이터에 있어서의 표제어의 란에 기입된 영어와 중국어와의 데이터를 사용하여, 템포러리 어구 버퍼(79)의 영어의 어구의 란과 중국어의 어구의 란의 기입을 행한다(S605). 또한, 스텝 S605 후에는, 제어부(12)는 처리를 스텝 S606으로 진행시킨다.
스텝 S604 및 스텝 S605에 대하여 구체예를 들어 설명하면, 이하와 같다. 우선, 스텝 S604에 있어서, 사전 검색부(50)는, 도 22에 나타내는 바와 같이, 어구 W14(WX)를 포함한 사전 데이터를 템포러리 사전 버퍼(78)에 기입한다. 또한, 도 22는, 템포러리 사전 버퍼(78)에 기억된 사전 데이터를 나타낸 도면이다. 여기서, 표제어의 란에 기입된 영어의 데이터가「drink」이며, 중국어의 데이터가 어구 W17이다. 따라서, 스텝 S605에 있어서, 슬롯 치환부(41)는,「drink」와 어구 W17을, 도 23에 나타내는 바와 같이, 각각, 템포러리 어구 버퍼(79)의 영어의 어구의 란과 중국어의 어구의 란에 기입한다. 또한, 도 23은, 템포러리 어구 버퍼(79)에 기억된 데이터를 나타낸 도면이다.
스텝 S606에 있어서는, 변화형 탐색부(43)가 템포러리 슬롯 버퍼(80)에 기입된 슬롯 정보(SX)에 있어서, 상기 활용 정보의 란에 데이터가 기입되어 있는지를 판단한다. 그리고, 스텝 S606에 있어서 데이터가 기입되어 있다고 판단된 경우에는, 슬롯 치환부(41)가, 상기 활용 정보와 템포러리 사전 버퍼(78)의 활용의 란의 데이터와 도 5에 나타낸 일본어 활용형 테이블(62)을 사용하여, 템포러리 어구 버퍼(79)에 있어서의 어구(WX)의 어형을 변화시킨다(S607). 또한, 스텝 S607에 있어서는, 슬롯 치환부(41)가, 상기 활용 정보를 사용하여, 템포러리 어구 버퍼(79)에 있어서의, 어구(WX)에 대응하는 영어의 어구와 중국어의 어구의 어형을 변화시킨다. 그리고, 스텝 S607 후에는 스텝 S608로 진행한다.
스텝 S606 및 스텝 S607에 대하여 구체예를 들어 설명하면, 이하와 같다. 우선, 템포러리 슬롯 버퍼(80)에, 도 21에 나타내는 바와 같이,「&VB_EAT」에 관한 슬롯 정보(SX)가 있으므로, 그 슬롯 정보의 활용 정보의 란을 슬롯 치환부(41)가 확인한다. 여기서, 활용 정보의 란에는, 일본어에 관해서는 동사의 연용형 1을 나타내는「v.ren1」이 기입되어 있고, 영어에 관해서는 진행형을 나타내는「ing」이 기입되어 있다.
그리고, 어구 W14(WX)에 대해서는, 도 22에 나타내는 템포러리 사전 데이터의 활용의 란에, 어구 W19(도 77 참조)이 나타내는 활용인 것을 나타내는 어구 W18이 기입되어 있다. 그로 인해, 슬롯 치환부(41)가, 상기 어구 W18이 나타내는 정보와「v.ren1」이라는 정보를 사용하여, 도 5에 나타낸 일본어 활용형 테이블(62)로부터 활용형으로 사용되는 어구[이 예에서는, 어구 W31(inflected suffix)]를 취득한다. 그리고, 슬롯 치환부(41)는, 템포러리 어구 버퍼(79)에 있어서의 어구 W14 중 어구 W32(inflected suffix)를, 상기 취득한 어구 W31로 치환한다(도 23, 77 참조).
또한,「drink」와 같은 어구에 대해서는, 슬롯 치환부(41)가 템포러리 슬롯 버퍼(80)의「ing」라는 정보에 기초하여, 템포러리 사전 버퍼(78)의 활용의 란으로부터「*ing」라는 정보를 얻는다. 이「*ing」라는 정보는,「*」의 부분에, 템포러리 사전 버퍼(78)의 표제어의 란의 어구「drink」를 삽입하면 되는 것을 나타낸 정보이다. 그로 인해, 슬롯 치환부(41)는 템포러리 어구 버퍼(79)의「drink」를,「*」의 부분에「drink」를 삽입하여 얻어진「drinking」으로 치환한다.
또한, 중국어인 어구 W17(도 22 참조)에 관해서는, 활용 정보가 기입되어 있지 않으므로, 슬롯 치환부(41)는 어형의 변화를 행하지 않는다.
이상의 결과, 템포러리 어구 버퍼(79)에는, 도 24에 나타내는 바와 같이, 어구 W33(동사)과「drinking」과 어구 W17이 각 언어의 란에 기입되게 된다. 또한, 도 24는, 템포러리 어구 버퍼(79)에 기억된, 어형 변화를 행한 후의 데이터를 나타낸 도면이다.
다음에, 스텝 S608에 있어서는, 슬롯 치환부(41)가 처리문 저장 버퍼(75)에 기억된 각 언어의 템플릿에 있어서의 상기 슬롯 정보에 관련된 슬롯부를, 템포러리 어구 버퍼(79)에 기억되어 있는 어구로 치환한다. 그리고, 스텝 S608 후에는, 제어부(12)는 처리를 스텝 S609로 진행시킨다.
스텝 S608에 대하여 구체예를 들어 설명하면, 이하와 같다.
우선, 처리문 저장 버퍼(75)에는, 도 17에 나타낸 템플릿 데이터가 기억되어 있다. 또한, 템포러리 어구 버퍼(79)(도 24 참조)에는, 일본어의 란에 어구 W33이, 영어의 란에「drinking」이, 중국어의 란에 어구 W17이 기입되어 있다.
따라서, 슬롯 치환부(41)는, 도 17에 나타낸 일본어 템플릿의 {2:&VB_EAT+v.ren1}을 어구 W33으로 치환한다. 또한, 슬롯 치환부(41)는, 도 17에 나타낸 영어 템플릿의 {2:&VB_EAT+ing}를 상기「drinking」으로 치환한다. 또한, 슬롯 치환부(41)는, 도 17에 나타낸 중국어 템플릿의 {2:&VB_EAT}를 어구 W17로 치환한다.
이상에 의해, 도 25에 나타내는 바와 같은 템플릿 데이터가 처리문 저장 버퍼(75)에 기억되게 된다. 또한, 도 25는, 처리문 저장 버퍼(75)에 기억된, 슬롯부에 있어서의 치환 처리의 도중 상태의 템플릿 데이터를 나타낸 도면이다.
그런데, 도 25에 있어서는, 가변부인 것을 판별하기 쉽게 하기 위하여, 편의상, 치환한 어구(어구 W33과「drinking」과 어구 W17)를, {}와 같은 괄호쓰기로 기재하고 있다. 실제로는, 번역 장치(1)에 있어서는, {}를 포함한 가변부 전체가 어구로 치환되게 된다. 즉, 치환된 가변부에는 {}와 같은 괄호는 존재하지 않게 된다. 후술하는, 도 27과 도 34와 도 39와 도 40과 도 45와 도 50과 도 55에 있어서도, 마찬가지이다.
스텝 S609에 있어서는, 제어부(12)는, 슬롯부용 버퍼(72)에 기억되어 있는 상기 슬롯 정보(SX)의 치환 어구의 란에, 각 언어의 템플릿의 치환에 사용한 어구를 기입함과 함께, 상기 처리 완료 플래그의 란에 치환 처리 완료인 것을 나타내는 플래그를 세운다.
이 처리에 의해, 예를 들어 도 18에서 나타내어진, 슬롯부용 버퍼(72)에 기억되어 있는 데이터가 갱신된다. 여기서는, 제어부(12)는, 도 26에 나타내는 바와 같이,「&VB_EAT」에 관한 슬롯 정보에 있어서의 치환 어구의 일본어의 란에 어구 W33을, 영어의 란에「drinking」이, 중국어의 란에 어구 W17을 기입한다. 또한, 제어부(12)는, 도 26에 나타내는 바와 같이,「&VB_EAT」에 관한 슬롯 정보에 있어서의 처리 완료 플래그의 란에「1」을 기입한다. 또한, 도 26은, 슬롯부용 버퍼(72)에 기억된, 슬롯부에 있어서의 치환 처리의 도중 상태의 슬롯 정보를 나타낸 도면이다.
스텝 S609 후에는 스텝 S610으로 진행한다. 또한, 스텝 S610에 대해서는 설명을 행하였으므로, 여기서의 설명은 생략한다.
스텝 S610 후에는, 슬롯 치환부(41)가 아직 판독되어 있지 않은 어구가 추출 어구 버퍼(70)에 존재하는지 여부를 판단한다(S611). 스텝 S611에 있어서 존재한다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S601로 복귀시킨다. 한편, 스텝 S611에 있어서 존재하지 않는다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S612로 진행시킨다.
또한, 스텝 S612로 진행할 때에는, 처리문 저장 버퍼(75)에 있어서, 각 언어의 템플릿의 슬롯부가, 예를 들어 도 27에 나타내는 바와 같이 어구로 치환되어 있다. 또한, 도 27은, 처리문 저장 버퍼(75)에 기억된, 슬롯부의 치환 처리가 완료된 상태에 있어서의 템플릿 데이터를 나타낸 도면이다.
또한, 슬롯부용 버퍼(72)는, 도 26에 나타낸 상태로부터 도 28에 나타낸 상태로 천이한다. 즉, 제어부(12)는,「&HUMAN_SUBJ」에 관한 슬롯 정보에 있어서의 치환 어구의 일본어의 란에 어구 W12를, 영어의 란에「he」를, 중국어의 란에 어구 W34(명사)를 기입한다. 또한, 상기 도면에 나타내는 바와 같이,「&HUMAN_SUBJ」에 관한 슬롯 정보에 있어서의 처리 완료 플래그의 란에, 제어부(12)는「1」을 기입한다. 또한, 도 28은, 슬롯부용 버퍼(72)에 기억된, 슬롯부의 치환 처리가 완료된 상태에 있어서의 슬롯 정보를 나타낸 도면이다.
이 경우, 이상의 처리에 의해 모든 슬롯 정보가 판독되어 있으므로, 모든 슬롯 정보에 대하여, 추출 완료 플래그(도시하지 않음)가 서 있다. 한편, 추출부(20)에서 추출한 어구가 n개(n: 자연수)이며, 일본어 템플릿에 있어서의 슬롯부의 개수가 n+1개 이상인 경우 등에는, 슬롯부에 어구가 치환되어 있지 않은 상황이 일어날 수 있다. 즉, 이 경우, 치환 처리 완료인 것을 나타내는 플래그가 서 있지 않은 슬롯 정보가 존재한다.
따라서, 스텝 S612에 있어서는, 슬롯 치환부(41)가 모든 슬롯 정보에 대하여, 추출 완료인 것을 나타내는 플래그를 소거한다. 그리고, 스텝 S612 후에는, 슬롯 치환부(41)가 다시 슬롯부용 버퍼(72)로부터 슬롯 정보를 하나 추출하고, 그 추출한 슬롯 정보를 템포러리 슬롯 버퍼(80)에 다시 기입한다(S613).
스텝 S613 후에는, 슬롯 치환부(41)가 추출한 슬롯 정보에 있어서, 치환 처리 완료인 것을 나타내는 플래그가 서 있는지 여부를 판단한다(S614). 스텝 S614에 있어서 플래그가 서 있다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S616으로 진행시킨다. 한편, 스텝 S614에 있어서 플래그가 서 있지 않다고 판단된 경우에는, 미입력 개소 치환부(44)가 상기 슬롯 정보에 대응하는 각 언어의 템플릿의 슬롯부를 소정의 어구로 치환한다(S615). 또한, 제어부(12)는, 상기 슬롯 정보의 치환 어구의 란에도, 상기 치환된 어구와 같은 어구를 기입한다. 또한, 스텝 S615 후에는, 제어부(12)는 처리를 스텝 S616으로 진행시킨다.
또한, 상기 어구의 치환의 방법으로서는, 예를 들어 유저가 입력부(10)를 통하여 입력하는 구성으로 할 수 있다. 또한, 미입력 개소 치환부(44)가, 도 7에 나타낸 시소러스 데이터를 참조하여, 상기 슬롯부의 라벨이 존재하는 계층의 어구 및 그 계층보다도 하층의 어구 중 어느 것을 사용하여, 어구의 치환을 행하는 구성으로 해도 된다. 이 경우, 치환하는 어구로서는, 예를 들어 상술한 대표값을 사용할 수 있다. 또한, 유저가 입력하는 경우라도, 미입력 개소 치환부(44)가 상기 슬롯부의 라벨로 나타내어지는 구분에 포함되는 어구를, 매립 대상 어구로서 출력부(11)에 표시함과 함께, 표시한 어구 중에서 하나의 어구를 유저에게 선택시키는 구성으로 해도 된다. 미입력 개소 치환부(44)에 있어서의 치환 방법은 특별히 한정되는 것은 아니다.
스텝 S616에 있어서는, 슬롯 치환부(41)가, 아직 판독되어 있지 않은 어구가 추출 어구 버퍼(70)에 존재하는지 여부를 판단한다. 스텝 S616에 있어서 존재한다고 판단된 경우에는, 제어부(12)는 처리를 다시 스텝 S613으로 진행시킨다. 한편, 스텝 S616에 있어서 존재하지 않는다고 판단된 경우에는, 제어부(12)는 처리를 도 15의 스텝 S407로 진행시킨다.
다음에, 상기 스텝 S408에 있어서의 공기부의 처리의 상세에 대하여, 도 29a, 도 29b, 및 도 30으로부터 도 40에 기초하여 설명한다.
도 29a는, 공기부의 처리 플로우에 있어서의 전반의 처리 플로우를 나타낸 흐름도이다. 도 29b는, 공기부의 처리 플로우에 있어서의 후반의 처리 플로우를 나타낸 흐름도이다.
우선, 공기 치환부(42)가 공기부용 버퍼(73)로부터 상술한 공기 정보를 하나 추출하고, 템포러리 제1 공기 버퍼(81)에 기입한다(S801). 공기 치환부(42)는, 예를 들어 도 19에 나타내는 공기부용 버퍼(73) 내의 데이터로부터, 최초로「be_AUX」에 관한 공기 정보를 추출하고, 그 공기 정보를, 도 30에 나타내는 바와 같이, 템포러리 제1 공기 버퍼(81)에 기입한다. 또한, 제어부(12)는, 추출된 공기 정보에 대해서는, 공기 치환부(42)가 추출 완료인 것을 나타내는 플래그(도시하지 않음)를 세운다. 또한, 도 30은, 템포러리 제1 공기 버퍼(81)에 기억된 공기 정보를 나타낸 도면이다. 또한, 이하에서는, 설명의 편의상, 상기한 바와 같이 템포러리 제1 공기 버퍼(81)에 기입된 정보를 공기 정보(CX)로서 표기한다.
스텝 S801 후에는, 제어부(12)는, 템포러리 제1 공기 버퍼(81)에 기입된 공기 정보에 있어서, 우선 처리 플래그가 서 있는지 여부를 판단한다(S802). 스텝 S802에 있어서 우선 처리 플래그가 서 있다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S803으로 진행시킨다. 한편, 스텝 S802에 있어서 우선 처리 플래그가 서 있지 않다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S807로 진행시킨다. 예를 들어,「be_AUX」에 관한 공기 정보에 대해서는, 도 30에 나타낸 바와 같이 우선 처리 플래그가 서 있지 않으므로, 이 경우에는, 제어부(12)는 처리를 스텝 S808로 진행시킨다.
여기서, 설명의 편의상, 스텝 S803으로부터 스텝 S807의 설명 전에, 스텝 S808의 설명을 행한다.
스텝 S808에 있어서는, 공기 치환부(42)가 아직 추출되어 있지 않은 공기 정보가 존재하는지 여부를 판단한다. 스텝 S808에 있어서 공기 정보가 존재한다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S801로 진행시킨다. 한편, 스텝 S808에 있어서 공기 정보가 존재하지 않는다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S809로 진행시킨다.
여기서, 상기의 예에서는,「be_AUX」에 관한 공기 정보는 추출되어 있지만,「DET_MY-NULL」에 관한 공기 정보는 아직 추출되어 있지 않으므로, 제어부(12)는 스텝 S808에 있어서 슬롯 정보가 존재한다고 판단한다. 그리고, 스텝 S801에 있어서, 도 31에 나타내는 바와 같이, 공기 치환부(42)가「DET_MY-NULL」에 관한 공기 정보를 추출한다. 또한, 도 31은, 템포러리 제1 공기 버퍼(81)에 기억된 공기 정보의 구성을 나타낸 도면이다.
또한, 도 31에 나타내는 바와 같이「DET_MY-NULL」에 관한 공기 정보는 우선 처리 플래그가 서 있기 때문에, 제어부(12)는, 스텝 S802에 있어서는 우선 처리 플래그가 있다고 판단하고, 그 결과, 처리를 스텝 S803으로 진행시킨다.
여기서, 스텝 S803으로부터 스텝 S807에 대하여 설명한다. 또한, 스텝 S803으로부터 스텝 S807의 설명에 있어서는, 공기 정보(CX)로서「DET_MY-NULL」에 관한 공기 정보가 추출되어 있는 예를 들어 설명한다.
스텝 S803에 있어서는, 공기 치환부(42)가 슬롯부용 버퍼(72)로부터 공기 정보(CX)에 포함되는 공기 플래그를 갖는 슬롯 정보를 판독하고, 그 판독한 슬롯 정보를 템포러리 슬롯 버퍼(80)에 기입한다.
여기서, 구체예를 들어 설명한다. 도 21에 나타내는「DET_MY-NULL」에 관한 공기 정보(CX)에는, 공기 플래그「i」가 서 있다. 한편, 슬롯부용 버퍼(72)에는, 도 28에 나타내는 바와 같이, 공기 플래그「i」를 포함한「&HUMAN-SUBJ」에 관한 슬롯 정보가 존재한다. 따라서, 공기 치환부(42)는 템포러리 슬롯 버퍼(80)에, 도 32에 나타내는「&HUMAN-SUBJ」에 관한 슬롯 정보를 기입한다. 또한, 도 32는, 템포러리 슬롯 버퍼(80)에 기억된 슬롯 정보의 구성을 나타낸 도면이다.
스텝 S803 후에는, 공기 치환부(42)가, 템포러리 제1 공기 버퍼(81)에 기입한 공기 정보에 기초하여, 공기 관계 대응 데이터베이스로부터 공기 관계 대응 데이터를 판독한다(S804). 그리고, 스텝 S804 후에는, 공기 치환부(42)가 템포러리 슬롯 버퍼(80)에 기입한 슬롯 정보와, 상기 판독한 공기 관계 대응 데이터에 기초하여, 템포러리 어구 버퍼(79)에 어구를 기입한다(S805). 또한, 스텝 S805 후에는, 제어부(12)는 처리를 스텝 S806으로 진행시킨다.
스텝 S804 및 스텝 S805에 대하여 구체예를 들어 설명하면, 이하와 같다.
우선, 스텝 S804에 있어서, 공기 치환부(42)는, 도 9b에 나타내는 공기 관계 데이터를 판독한다. 그리고, 스텝 S805에 있어서, 공기 치환부(42)는, 도 32에 나타내는 슬롯 정보와, 상기 판독한 공기 관계 데이터에 기초하여, 템포러리 어구 버퍼(79)에 어구를 기입한다. 이 예의 경우, 슬롯 정보에 치환되는 어구 W12(도 7 참조)가 속하는 카테고리(라벨의 일종)가「&HUMAN-PRON_SUBJ(&HUMAN-SUBJ)」이기 때문에 공기 치환부(42)는, 상기 라벨이 조건으로서 지정된 경우에 사용되는 문자를 기입한다.
도 9b에 따르면, 라벨이「&HUMAN-MY」에 속하는 경우에는「my」라는 문자가 기입되지만, 그 이외의 경우에는「(NULL)」이라는 문자가 기입된다. 따라서, 스텝 S805에 있어서, 공기 치환부(42)는, 도 33에 나타내는 바와 같이, 템포러리 어구 버퍼(79)에 있어서의 영어의 란에「(NULL)」을 기입한다. 또한, (NULL)에 대해서는, 후술한다. 또한, 도 33은, 템포러리 어구 버퍼(79)에 기억된 데이터를 나타낸 도면이다.
이와 같이, 공기부의 치환 후보를 결정하는 경우에는, 시소러스 데이터의 나무를 따라, 라벨의 포함 관계도 고려할 필요가 있다.
스텝 S806에 있어서는, 공기 치환부(42)가 처리문 저장 버퍼(75)에 기억된 각 언어의 템플릿에 있어서의 상기 공기 정보에 관련된 공기부를 템포러리 어구 버퍼(79)에 기억되어 있는 어구로 치환한다. 그리고, 스텝 S806 후에는 스텝 S807로 진행한다.
스텝 S806에 대하여 구체예를 들어 설명하면, 이하와 같다. 우선, 공기 치환부(42)는, 도 27에 나타낸 영어 템플릿의「{-i:#DET_MY-NULL}」과 같은 공기부의「-i:#DET_MY-NULL」을「(NULL)」으로 치환한다. 단,「(NULL)」이라 함은, 본 실시 형태에 있어서는 아무것도 적지 않는 것을 의미하는 기호이므로, 공기 치환부(42)는「-i:#DET_MY-NULL」을 소거한다. 이 결과, 상기 영어 템플릿은, 도 34에 나타낸 바와 같이,「{-i:be_AUX+pres}」와「{he}」사이의 공기부가, 간단히「{}」라는 기호로 나타내어지게 된다. 또한, 도 34는, 처리문 저장 버퍼(75)에 기억된, 공기부에 있어서의 치환 처리의 도중 상태의 템플릿 데이터를 나타낸 도면이다.
스텝 S807에 있어서는, 제어부(12)는, 도 35에 나타내는 바와 같이, 상기 공기 정보(CX)를 우선 공기 버퍼(74)에 기입한다. 또한, 도 35는, 우선 공기 버퍼에 기억된 공기 정보를 나타낸 도면이다.
그리고, S807 후에는, 제어부(12)는 처리를 스텝 S808로 진행시킨다. 또한, 스텝 S808에 대해서는 설명을 행하였으므로, 여기서의 설명은 생략한다.
스텝 S809에 있어서는, 공기 치환부(42)가 모든 공기 정보에 대하여 추출 완료인 것을 나타내는 플래그를 소거한다. 그리고, 스텝 S809 후에는, 공기 치환부(42)가 공기부용 버퍼(73)로부터 공기 정보를 하나 추출하고, 그 추출한 공기 정보를 템포러리 제1 공기 버퍼(80)에 기입한다(S810).
공기 치환부(42)는, 예를 들어 도 19에 나타내는 공기부용 버퍼(73)로부터, 최초로「be_AUX」에 관한 공기 정보를 추출한다. 또한, 제어부(12)는, 추출된 공기 정보에 대해서는, 추출 완료인 것을 나타내는 플래그(도시하지 않음)를 세운다.
스텝 S810 후에는, 템포러리 제1 공기 버퍼(80)에 기입된 상기 공기 정보에 있어서, 제어부(12)는, 우선 처리 플래그가 서 있는지 여부를 판단한다(S811). 그리고, 스텝 S811에 있어서 우선 처리 플래그가 서 있다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S817로 진행시킨다. 한편, 스텝 S811에 있어서 우선 처리 플래그가 서 있지 않다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S812로 진행시킨다.
상기의 예에서는, 공기 치환부(42)는, 도 19에 나타내는 공기부용 버퍼(73) 내의 데이터로부터, 최초로「be_AUX」에 관한 공기 정보를 다시 추출하고, 상기 공기 정보를, 도 30에 나타내는 바와 같이, 템포러리 제1 공기 버퍼(81)에 다시 기입한다. 예를 들어,「be_AUX」에 관한 공기 정보에 대해서는, 도 30에 나타낸 바와 같이 우선 처리 플래그가 서 있지 않으므로, 이 경우에는, 제어부(12)는 처리를 스텝 S812로 진행시킨다.
또한, 스텝 S811에 있어서 우선 처리 플래그의 유무를 판단하는 이유는,「{-i:#DET_MY-NULL}」이라는 공기부와 같이, 이제는 처리가 필요하지 않은 공기부를, 이후의 스텝 S812 내지 스텝 S816에 있어서의 처리가 대상 외로 하기 위해서이다.
여기서, 설명의 편의상, 스텝 S812로부터 스텝 S816의 설명 전에, 스텝 S817의 설명을 행한다.
스텝 S817에 있어서는, 공기 치환부(42)가 아직 추출되어 있지 않은 공기 정보가 존재하는지 여부를 판단한다. 스텝 S817에 있어서 공기 정보가 존재한다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S810으로 진행시킨다. 한편, 스텝 S817에 있어서 공기 정보가 존재하지 않는다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S409로 진행시킨다.
상기의 예에서는,「be_AUX」에 관한 공기 정보는 추출되어 있지만,「DET_MY-NULL」에 관한 공기 정보는 아직 추출되어 있지 않으므로, 공기 치환부(42)는, 스텝 S817에 있어서 공기 정보가 존재한다고 판단한다. 그리고, 스텝 S810에 있어서, 도 31에 나타내는 바와 같이, 공기 치환부(42)가「DET_MY-NULL」에 관한 공기 정보를 추출한다.
여기서, 스텝 S812로부터 스텝 S815에 대하여 설명한다. 또한, 스텝 S812 내지 스텝 S815의 설명에 있어서는, 공기 정보(CX)로서「be_AUX」에 관한 공기 정보가 추출되어 있는 예를 들어 설명한다.
스텝 S812에 있어서는, 공기 치환부(42)가, 슬롯부용 버퍼(72)로부터, 공기 정보(CX)에 포함되는 공기 플래그를 갖는 슬롯 정보를 판독하고, 그 판독한 슬롯 정보를 템포러리 슬롯 버퍼(80)에 기입한다.
예를 들어, 우선 처리 플래그가 없는 도 30에 나타내는 공기 정보(CX)에 포함되는 공기 플래그「i」를 갖는 슬롯 정보는,「&HUMAN-SUBJ」에 관한 슬롯 정보이다. 따라서, 공기 치환부(42)는「&HUMAN-SUBJ」에 관한 슬롯 정보를 슬롯부용 버퍼(72)로부터 판독하고, 도 36에 나타내는 바와 같이, 상기 판독한 슬롯 정보(SX)를 템포러리 슬롯 버퍼(80)에 기입한다. 또한, 도 36은, 템포러리 슬롯 버퍼(80)에 기억된 슬롯 정보를 나타낸 도면이다.
스텝 S812 후에는, 공기 치환부(42)는, 우선 공기 버퍼(74)로부터, 상기 공기 정보(CX)와 같은 공기 플래그를 갖는 공기 정보를 판독한다(S813). 예를 들어, 도 35에 나타내는 바와 같이,「be_AUX」에 관한 공기 정보(CX)와 같은 공기 플래그「i」를 갖는 공기 정보로서,「DET_MY-NULL」에 관한 공기 정보가 우선 공기 버퍼(74)에 존재한다. 이로 인해, 공기 치환부(42)는 상기「DET_MY-NULL」에 관한 공기 정보를 판독하고, 도 37에 나타내는 바와 같이, 그 판독한 공기 정보를 템포러리 제2 공기 버퍼(82)에 기입한다. 또한, 도 37은, 템포러리 제2 공기 버퍼에 기억된 공기 정보를 나타낸 도면이다. 또한, 이하에서는, 상기와 같이 템포러리 제2 공기 버퍼(82)에 기입된 공기 정보를 공기 정보(CHX)로 표기한다.
스텝 S813 후에는, 공기 치환부(42)가 템포러리 제1 공기 버퍼(81)에 기입한 공기 정보(CX)와, 템포러리 제2 공기 버퍼(82)에 기입한 공기 정보(CHX)에 기초하여, 공기 관계 대응 데이터베이스로부터 공기 관계 대응 데이터를 판독한다(S814). 그리고, 스텝 S814 후에는, 공기 치환부(42)가 상기 판독한 공기 관계 대응 데이터와, 템포러리 슬롯 버퍼(80)에 기입한 슬롯 정보(SX)에 기초하여, 템포러리 어구 버퍼(79)에 어구를 기입한다(S815). 또한, 스텝 S815 후에는, 제어부(12)는 처리를 스텝 S816으로 진행시킨다.
스텝 S814 및 스텝 S815에 대하여 구체예를 들어 설명하면, 이하와 같다. 또한, 이하의 예에서는, 공기 정보(CX)에 기초하여, 공기 관계 대응 데이터베이스로부터 공기 관계 대응 데이터를 판독하는 구성을 설명한다.
우선, 스텝 S814에 있어서, 공기 치환부(42)는, 도 30에 나타내는 공기 정보(CX)에 기초하여, 도 9a에 나타내는 공기 관계 대응 데이터를 판독한다. 구체적으로는, 공기 치환부(42)는, 도 30에 나타내어진 공기 정보의 라벨과 같은 라벨을 갖는 공기 관계 대응 데이터를 판독한다. 그리고, 스텝 S815에 있어서, 공기 치환부(42)는, 도 9a에 나타내는 공기 관계 대응 데이터와, 도 36에 나타내는 슬롯 정보(SX)에 기초하여, 템포러리 어구 버퍼(79)에 어구를 기입한다.
이 예의 경우, 슬롯 정보의 치환 어구가「he」이므로, 공기 치환부(42)는 그「he」가 사용된 경우에 있어서의 공기부에 사용하는 어구를 템포러리 어구 버퍼(79)에 기입한다. 도 9a에 따르면, 공기 치환부(42)는 치환 어구가「I」인 경우에는「am」이라는 어구를 템포러리 어구 버퍼(79)에 기입한다. 또한, 치환 어구가「you」 또는 복수형의 어구인 경우에는, 공기 치환부(42)는「are」이라는 어구를 템포러리 어구 버퍼(79)에 기입한다. 또한, 이들 이외의 치환 어구의 경우에는, 공기 치환부(42)는「is」라는 어구를 템포러리 어구 버퍼(79)에 기입한다. 따라서, 공기 치환부(42)는, 템포러리 어구 버퍼(79)의 영어의 란에, 도 38에 나타내는 바와 같이,「is」라는 어구를 기입한다. 또한, 도 38은, 템포러리 어구 버퍼(79)에 기억된 어구를 나타낸 도면이다.
스텝 S816에 있어서는, 공기 치환부(42)는 처리문 저장 버퍼(75)에 기억된 템플릿에 있어서의 상기 공기 정보에 관한 공기부를 템포러리 어구 버퍼(79)에 기억된 어구로 치환한다. 구체적으로는, 공기 치환부(42)는, 도 34에 나타낸 영어 템플릿의 {-i:be_AUX+pres}를 상기「is」로 치환한다. 이에 의해, 도 39에 나타내는 바와 같은 템플릿 데이터가 처리문 저장 버퍼(75)에 기억되게 된다. 또한, 도 39는, 처리문 저장 버퍼(75)에 기억된, 공기부의 치환 처리가 완료된 상태에 있어서의 템플릿 데이터를 나타낸 도면이다.
그리고, 스텝 S816 후에는 S817로 진행한다.
여기서, 도 15의 스텝 S409에 있어서의 처리를 설명한다.
스텝 S409에 있어서는, 출력문 정형부(26)가 처리문 저장 버퍼(75)에 기억된, 예를 들어 도 39에 나타내는 템플릿 데이터에 있어서의 일본어 템플릿의 어구 W35(음절)라는 어구를, 도 40에 나타내는 바와 같이 어구 W36[음절(어구 W35의 탁음)]으로 변경한다. 또한, 도 40은, 처리문 저장 버퍼(75)에 기억된 문례 데이터를 나타낸 도면이다.
번역 장치(1)에는, 이와 같이 문장을 정형하는 규칙이 기억되어 있고, 예를 들어 모든 가변부가 치환된 후에 상기 규칙에 따라서 문장을 정형한다. 이 규칙의 일례로서는, 어구 W19(도 77 참조)로 나타낸 활용의 동사의 활용형이 어구 W26으로 나타낸 활용형(즉, ren1)이며, 상기 동사의 직후가 어구 W35인 경우에는 어구 W36으로 변경하고, 상기 동사의 직후가 도 77에 나타내는 어구 W38(음절)인 경우에는 도 77에 나타내는 어구 W39[음절(어구 W38의 탁음)]로 변경하는 규칙을 들 수 있다.
이상의 결과, 번역 장치(1)에서는, 각 언어의 템플릿에 기초하여, 일본어의 문례가 얻어짐과 함께, 그 일본어의 문례를 번역한 영어의 문례와, 상기 일본어의 문례를 번역한 중국어의 문례가 얻어진다. 그리고, 이들 각 문례는 표시 제어부(25)에 의해 출력부에서 표시되므로, 유저는 적어도 자신이 입력한 문장과 같은 문례 혹은 가장 가까운 문례의 번역 결과를 확인할 수 있다.
이와 같이, 번역 장치(1)는, 소정의 어구로 구성된 고정부와 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부를 각각 대응하는 위치에 포함한, 제1 언어(예를 들어, 일본어)에 의한 템플릿과 그 템플릿과 대응 관계에 있는 제2 언어(예를 들어, 영어)에 의한 템플릿을 기억한 기억 장치(13)로부터, 제1 언어에 의한 템플릿과 제2 언어에 의한 템플릿을 판독하는 데이터 판독부(21)와, 데이터 판독부(21)에 의해 판독된 제1 언어에 의한 복수의 템플릿에 대하여, 입력부(10)를 통하여 제1 언어로 입력된 문장에 포함되는 어구가, 상기 소정의 어구 및 상기 미리 정한 복수의 어구 중 어느 것과 일치하는지를 판정하는 판정부(22)와, 그 판정의 결과에 기초하여, 상기 복수의 템플릿 중에서, 적어도 하나의 템플릿을 선택하는 선택부(23)와, 선택부(23)에 의해 상기 일치한 어구로 치환 가능한 가변부를 포함하는 템플릿이 선택된 경우, 데이터 판독부(21)에 의해 판독된, 상기 선택된 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿에 대하여, 상기 일치한 어구로 치환 가능한 가변부에 대응한 가변부를, 상기 일치한 어구에 대응하는 제2 언어에 의한 어구로 치환하는 치환부(24)를 구비하는 구성이라고 할 수 있다.
그로 인해, 이와 같은 구성에서는, 제1 언어에 의한 각 템플릿의 가변부에 있어서의 어구를 상기 복수의 어구로부터 선택할 수 있으므로, 상기 가변부에 있어서 어구의 선택의 여유를 갖게 할 수 있다. 예를 들어, 가변부에 있어서 n개의 어구가 치환 가능한 경우, 번역 장치(1)는, 하나의 템플릿에 의해, n가지의 문례를 작성할 수 있다. 또한, 예를 들어 2개의 가변부를 갖는 경우, 한쪽의 가변부에 있어서 n개의 어구가 치환 가능하며, 다른 쪽의 가변부에 있어서 m개의 어구가 치환 가능한 경우, 번역 장치(1)는 하나의 템플릿으로부터, n×m개의 문례를 작성할 수 있다.
이와 같이, 가변부를 갖지 않는 종래의 장치와, 본 실시 형태에 관한 번역 장치(1)에 있어서, 가령 동일한 수의 템플릿을 구비한 구성으로 한 경우, 작성 가능한 문례의 수는 명확하게 본 실시 형태에 관한 번역 장치(1) 쪽이 많아진다. 이로 인해, 본 실시 형태에 관한 번역 장치(1) 쪽이, 종래의 장치에 비해, 정확한 문례를 선택하는 것이 가능해진다.
또한, 특히, 시소러스 데이터를 사용함으로써, 번역 장치(1)는, 하나의 가변부에 포함되는 어구를 용이하게 정할 수 있다. 또한, 시소러스 데이터를 사용하면, 하나의 가변부에 있어서의 상기 복수의 어구를, 개념적으로 서로 비슷한 어구로 할 수 있다. 이로 인해, 의미가 통하지 않는 문례가 작성될 우려가 없어진다.
또한, 번역 장치(1)는, 적어도, 치환부(24)에 의한 치환을 행한 후의 제2 언어에 의한 템플릿에 기초하는 화상을 출력부(11)에 표시시키는 표시 제어부(25)를 구비하는 구성이기도 하다. 그로 인해, 상기 구성에 의해, 번역 장치(1)의 유저는 제2 언어에 의한 문례를 확인할 수 있다.
또한, 번역 장치(1)는, 선택부(23)에 의해 제1 언어에 의한 템플릿이 선택된 경우, 상기 일치한 어구로 치환 가능한 가변부를 상기 일치한 어구로 치환함과 함께, 치환부(24)에 의한 치환을 행한 후의 제1 언어에 의한 템플릿에 기초하는 화상을 출력부(11)에 표시시키는 구성이기도 하다. 그로 인해, 상기 구성에 의해, 유저는 제1 언어에 의한 문례와 제2 언어에 의한 문례를 동시에 확인할 수 있다.
특히, 번역 장치(1)에서는, 도 4에 나타낸 바와 같이, 기억 장치(13)에는, 제1 언어에 의한 템플릿의 가변부에 있어서의 상기 미리 정한 복수의 어구 각각에 대하여, 제2 언어로 번역한 어구가 하나 대응되어 기억되어 있다. 그리고, 치환부(24)가 제2 언어에 의한 템플릿의 가변부를 기억 장치(13)에 있어서 상기 대응시켜 기억된 제2 언어로 번역한 어구로 치환한다. 그로 인해, 번역 장치(1)에 있어서는, 제1 언어의 템플릿의 가변부에 있어서 치환된 어구에 대응하는, 제2 언어에 의한 어구가 일의로 정해진다. 따라서, 번역 장치(1)는 제2 언어에 의한 템플릿에 기초한, 정확한 제2 언어의 문례를 얻을 수 있다.
또한, 번역 장치(1)에서는, 상술한 바와 같이, 제1 언어에 의한 템플릿의 가변부와, 그 가변부에 대응한 제2 언어에 의한 템플릿의 가변부에는, 어구의 활용형에 관한 정보가 대응되어 있다. 그리고, 치환부(24)가 이 활용형에 관한 정보에 기초하여, 상기 치환한 어구에 대하여 어형을 변화시킨다. 그로 인해, 번역 장치(1)는, 제1 언어에 의한 문례와 제2 언어에 의한 문례의 각각에 대하여, 어형을 변화시키지 않는 경우에 비해, 보다 정확한 문례로 할 수 있다.
또한, 번역 장치(1)에서는, 상술한 바와 같이, 제2 언어에 의한 템플릿에는 가변부로서, 슬롯부와 공기부가 포함되어 있고, 치환부(24)는 슬롯부를 제2 언어에 의한 어구로 치환함과 함께, 상기 치환 후의 어구에 따라서 공기부의 어구를 결정한다. 그로 인해, 슬롯부에 있어서 치환된 어구에 대응한 어구를 사용하여 공기부를 치환 가능해진다. 따라서, 번역 장치(1)는 치환 후의 어구에 따라서 공기부의 어구를 결정하지 않는 구성에 비해, 보다 정확한 문례를 작성할 수 있다.
그런데, 도 29b의 스텝 S814 및 스텝 S815에 관한 구체예를 든 설명에 있어서는, 공기 치환부(42)가 템포러리 제1 공기 버퍼(81)에 기입한 공기 정보(CX)에 기초하여, 공기 관계 대응 데이터베이스로부터 공기 관계 대응 데이터를 판독하는 구성을 설명하였다. 여기서는, 공기 치환부(42)가, 템포러리 제1 공기 버퍼(81)에 기입한 공기 정보(CX)와, 템포러리 제2 공기 버퍼(82)에 기입한 공기 정보(CHX)에 기초하여, 공기 관계 대응 데이터베이스로부터 공기 관계 대응 데이터를 판독하는 구성을 도 41 내지 도 45에 기초하여 설명한다.
도 41은, 템플릿 데이터베이스(60)에 기억되어 있는 템플릿 데이터의 구성을 나타낸 것이다. 설명의 편의상, 일본어 템플릿과 영어 템플릿을 나타내고 있다. 도 41에 나타내는 바와 같이, 일본어 템플릿에는,「{1:NOUN}」이라는 슬롯부가 포함되어 있다. 또한, 영어 템플릿에는,「{1-i:NOUN}」이라는 슬롯부와,「{-i:DET_A}」 및「{-i#CLASSIFIER}」이라는 공기부가 포함되어 있다.
여기서,「{-i#CLASSIFIER}」에 관한 공기 정보가 공기 정보(CHX)에 해당한다. 즉, 이하에서는,「{1:NOUN}」에 관한 슬롯 정보와「{-i#CLASSIFIER}」에 관한 공기 정보에 기초하여,「{-i:DET_A}」으로 치환되는 어구가 결정된다.
도 42는, 도 41에 나타낸 템플릿 데이터에 있어서의 일본어 템플릿의 슬롯부에 있어서 치환되는 어구의 예를 나타낸 도면이다. 또한, 도 41에 있어서는, 입력예 A와 입력예 B와 입력예 C와 입력예 D는, 각각,「{1:NOUN}」이라는 슬롯부에 있어서 치환된 어구의 예를 든 것이다. 예를 들어 입력예 A는,「{1:NOUN}」이라는 슬롯부가「커피」로 치환된 경우를 나타내고 있다.
도 43은, 사전 데이터베이스(61)에 기억되어 있는 사전 데이터를 나타낸 도면이다. 도 43에 나타내는 바와 같이, 사전 데이터에는 일본어의 어구와 그 어구에 대응하는 영어의 어구가 대응되어 기억되어 있다. 또한, 사전 데이터에 있어서는, 상기 영어의 각 어구에 대하여, 조수사에 관한 정보가 대응되어 기억되어 있다.
도 44는 이와 같은 템플릿 데이터와 사전 데이터를 사용하여, 영어의 문례를 작성할 때의 플로우를 나타낸 흐름도이다.
우선, 일본어 템플릿의 슬롯부「{1:NOUN}」에 있어서 치환된 어구에 따라서, 슬롯 치환부(41)가 사전 데이터를 참조함으로써, 영어 템플릿의 슬롯부「{1-i:NOUN}」을, 예를 들어「coffee」라는 어구로 치환한다(S901). 스텝 S901 후에는, 공기 치환부(42)가 영어 템플릿의 공기부「{-i#CLASSIFIER}」에 관하여 치환하는 어구를 결정한다(S902).
예를 들어 입력예 A의 경우에는, 스텝 S902에 있어서는, 공기 치환부(42)는 사전 데이터를 참조함으로써, 공기부「{-i#CLASSIFIER}」을「cup of」라는 어구로 치환하는 것을 결정한다. 또한, 입력예 B의 경우에는, 마찬가지로, 공기 치환부(42)는 공기부「{-i#CLASSIFIER}」을「order of」라는 어구로 치환하는 것을 결정한다. 한편, 입력예 C의 경우에는, 사전 데이터를 참조하면,「펜」이라는 어구에 대응하는 조수사의 정보가「(NULL)」이므로, 공기 치환부(42)는 공기부「{-i#CLASSIFIER}」을「(NULL)」으로 치환하는 것을 결정한다. 입력예 D의 경우에 대해서도,「입력예 C」의 경우와 마찬가지이다.
스텝 S902 후에는, 공기 치환부(42)가 사전 데이터에 기초하여, 공기부「{-i#CLASSIFIER}」에 관하여, 결정된 어구의 번역이 있는지 여부를 판단한다(S903).
스텝 S903에 있어서 번역이 있다고 판단된 경우, 공기 치환부(42)가 상기 결정된 어구의 읽는 법에 기초하여, 공기부「{-i:DET_A}」를「a」로 치환할지, 혹은「an」으로 치환할지를 결정한다(S904). 예를 들어, 입력예 A의 경우에는, 공기 치환부(42)는 공기부「{-i:DET_A}」를「a」로 치환하는 것을 결정한다. 또한, 입력예 B의 경우에는, 공기 치환부(42)는 공기부「{-i:DET_A}」를「an」으로 치환하는 것을 결정한다.
한편, 스텝 S903에 있어서 번역이 없다고 판단된 경우, 공기 치환부(42)가「{1-i:NOUN}」이라는 슬롯부에 있어서 치환되는 것이 결정된 어구의 읽는 법에 기초하여, 공기부 {-i:DET_A}」를「a」로 치환할지, 혹은「an」으로 치환할지를 결정한다(S905). 예를 들어, 입력예 C의 경우에는, 공기 치환부(42)는 공기부「{-i:DET_A}」를「a」로 치환하는 것을 결정한다. 또한, 입력예 D의 경우에는, 공기 치환부(42)는 공기부「{-i:DET_A}」를「an」으로 치환하는 것을 결정한다.
스텝 S904와 스텝 S905 후에는, 제어부(12)는 처리를 스텝 S906으로 진행시킨다. 스텝 S906에 있어서는, 공기 치환부(42)는 공기부「{-i#CLASSIFIER}」에 있어서 치환하는 어구로서 결정된 어구와, 공기부「{-i:DET_A}」에 있어서 치환하는 어구로서 결정된 어구를 사용하여, 각각의 공기부를 치환한다. 단,「(NULL)」이라 함은, 전술한 바와 같이, 아무것도 적지 않는 것을 의미하는 기호이므로, 공기 치환부(42)는「-i#CLASSIFIER」을 소거한다.
그 결과, 번역 장치(1)는, 도 45에 나타내는 바와 같이, 입력예 A 내지 입력예 D의 각각에 대하여, 슬롯부와 2개의 공기부가 어구로 치환된 영어 문례를 생성한다.
그런데, 상기의 설명에 있어서는, 슬롯부에 있어서 치환하는 어구는, 슬롯부끼리의 사이에 독립하여 결정 가능한 구성을 예로 들어 설명하였다. 즉, 예를 들어 도 3에 있어서,「{1:&HUMAN-SUBJ}」와「{2:&VB_EAT+v.ren1}」중 어느 것을 먼저 결정해도 문제없는 구성에 대하여 설명하였다. 이하에서는, 슬롯부간에 있어서 공기 관계를 형성하는 2개의 예에 대하여, 도 46 내지 도 55에 기초하여 설명한다.
우선, 첫번째의 예를, 도 46 내지 도 50에 기초하여 설명한다.
도 46은, 템플릿 데이터베이스(60)에 기억되어 있는 템플릿 데이터의 구성을 나타낸 것이다. 설명의 편의상, 일본어 템플릿과 영어 템플릿을 나타내고 있다. 도 46에 나타내는 바와 같이, 일본어 템플릿에는「{1:THIS-THAT}」와「{2:GOODS}」라는 2개의 슬롯부가 포함되어 있다. 또한, 영어 템플릿에는「{1-i:THIS-THAT}」와「{2-i:GOODS}」라는 2개의 슬롯부가 포함되어 있다. 이 영어 템플릿의 양쪽의 슬롯부에 있어서는,「-i」라는 부호가 부여되어 있다. 즉, 양 슬롯부는 서로 공기 관계를 갖고 있다.
도 47은, 도 46에 나타낸 템플릿 데이터에 있어서의 일본어 템플릿의 슬롯부에 있어서 치환된 어구의 예를 나타낸 도면이다. 또한, 도 47에 있어서는, 입력예 A와 입력예 B와 입력예 C와 입력예 D는, 각각,「{1:THIS-THAT}」와「{2:GOODS}」라는 슬롯부에 있어서 치환된 어구의 예를 든 것이다. 예를 들어 입력예 A는,「{1-i:THIS-THAT}」라는 슬롯부가 어구 W40(지시 대명사)으로 치환되고,「{2-i:GOODS}」라는 슬롯부가 어구 W41(명사)로 치환된 경우를 나타내고 있다.
도 48은, 사전 데이터베이스(61)에 기억되어 있는 사전 데이터를 나타낸 도면이다. 도 48에 나타내는 바와 같이, 사전 데이터에는, 일본어의 어구와 그 어구에 대응하는 영어의 어구가 대응되어 기억되어 있다. 또한, 사전 데이터에 있어서는, 상기 영어의 각 어구에 대하여, 그 각 어구의 복수형에 관한 정보가 대응되어 기억되어 있다.
도 49는, 이와 같은 템플릿 데이터와 사전 데이터를 사용하여, 영어의 문례를 작성할 때의 플로우를 나타낸 흐름도이다. 또한, 이하에서는, 일본어 템플릿의 슬롯부에 있어서의 치환 처리는 종료되어 있는 것으로 하고, 영어 템플릿의 슬롯부에 있어서의 치환 처리를 설명한다.
우선, 슬롯 치환부(41)가, 영어 템플릿의 슬롯부「{1-i:THIS-THAT}」에 있어서 치환되는 어구가 복수형인지 여부를 판단한다(S1001). 여기서, 어구가 복수형인지 여부의 판단은, 슬롯 치환부(41)가 사전 데이터베이스(61)를 참조함으로써 행한다. 또한, 사전 데이터베이스(61)에는, 어구가 단수 혹은 복수형인 것을 나타내는 정보가 기억되어 있다.
예를 들어 입력예 A와 입력예 B와 입력예 C의 경우에는, 스텝 S1001에 있어서, 슬롯 치환부(41)는 복수형이 아니라고 판단한다. 한편, 입력예 D와 입력예 E와 입력예 F의 경우에는, 스텝 S1001에 있어서, 슬롯 치환부(41)는 복수형이라고 판단한다.
스텝 S1001에 있어서 복수형이라고 판단된 경우에는, 슬롯 치환부(41)가 영어 템플릿의 슬롯부「{2-i:GOODS}」에 있어서 치환되는 어구가 복수형을 갖는지 여부를 판단한다(S1002). 한편, 스텝 S1001에 있어서 복수형이 아니라고 판단된 경우에는, 제어부(12)는 처리를 스텝 S1004로 진행시킨다.
스텝 S1002에 있어서 복수형을 갖는다고 판단된 경우에는, 슬롯 치환부(41)가, 도 48에 나타낸 사전 데이터를 참조함으로써, 상기 영어 템플릿의 슬롯부「{2-i:GOODS}」에 사용되는 영어의 어구를 복수형으로 변환한다(S1003). 한편, 스텝 S1002에 있어서 복수형을 갖지 않는다고 판단된 경우에는, 제어부(12)는 처리를 스텝 S1004로 진행시킨다.
예를 들어 입력예 D의 경우에는, 스텝 S1003에 있어서, 슬롯 치환부(41)는「book」이라는 어구를「books」와 같은 복수형의 어구로 변환한다. 또한, 마찬가지로, 입력예 E의 경우에는, 슬롯 치환부(41)는「trousers」라는 어구를「trousers」와 같은 복수형(이 경우, 단수형과 복수형으로 동일)의 어구로 변환한다. 한편, 예를 들어 입력예 F의 경우에는, 도 48에도 나타내는 바와 같이「luggage」라는 어구에 복수형은 존재하지 않으므로, 이 경우에는, 제어부(12)는 처리를 스텝 S1004로 진행시킨다.
스텝 S1004에 있어서는, 슬롯 치환부(41)가 다시 영어 템플릿의 슬롯부「{2-i:GOODS}」에 있어서 치환되는 어구가 복수형을 갖는지 여부를 판단한다. 스텝 S1004에 있어서 복수형을 갖는다고 판단된 경우에는, 슬롯 치환부(41)가 영어 템플릿의 슬롯부「{2-i:GOODS}」에 있어서 치환되는 어구가 복수형인지 여부를 판단한다(S1005). 한편, 스텝 S1004에 있어서 복수형을 갖지 않는다고 판단된 경우에는, 슬롯 치환부(41)가 사전 데이터를 참조함으로써, 영어 템플릿의 슬롯부「{1-i:THIS-THAT}」에 사용되는 어구를 단수형으로 변환한다(S1006). 그리고, 스텝 S1006 후에는 스텝 S1008로 진행한다.
예를 들어, 입력예 A와 입력예 B와 입력예 D와 입력예 E의 경우에는, 스텝 S1004에 있어서, 슬롯 치환부(41)는 영어 템플릿의 슬롯부「{2-i:GOODS}」에 있어서 치환되는 어구가 복수형을 갖는다고 판단한다. 한편, 입력예 C와 입력예 F의 경우에는, 스텝 S1006에 있어서, 슬롯 치환부(41)는 슬롯부「{2-i:GOODS}」를 단수형으로 변환한다. 구체적으로는, 입력예 C의 경우에는, 실질적인 변경은 없지만, 슬롯 치환부(41)는「this」를「this」로 변환한다. 또한, 입력예 F의 경우에는, 슬롯 치환부(41)는「these」를「this」로 변환한다.
그리고, 스텝 S1005에 있어서는, 슬롯 치환부(41)는 입력예 A와 입력예 B와 입력예 D와 입력예 E 중, 입력예 B와 입력예 D와 입력예 E에 대해서는, 슬롯부「{2-i:GOODS}」에 있어서 치환되는 어구가 복수형이라고 판단한다. 한편, 스텝 S1005에 있어서는, 슬롯 치환부(41)는, 입력예 A에 대해서는, 슬롯부「{2-i:GOODS}」에 있어서 치환되는 어구가 복수형이 아니라고 판단한다.
스텝 S1005에 있어서 복수형이라고 판단된 경우에는, 슬롯 치환부(41)가 영어 템플릿의 슬롯부「{1-i:THIS-THAT}」에 사용되는 어구를 복수형으로 변환한다(S1007). 그리고, 스텝 S1007 후에는, 제어부(12)는 처리를 스텝 S1008로 진행시킨다. 한편, 스텝 S1005에 있어서 복수형이 아니라고 판단된 경우에는, 어구를 복수형으로 변환하지 않고, 제어부(12)는 처리를 스텝 S1008로 진행시킨다.
예를 들어, 입력예 B와 입력예 D와 입력예 E의 경우에는, 스텝 S1007에 있어서, 슬롯 치환부(41)는 영어 템플릿의 슬롯부「{1-i:THIS-THAT}」에 있어서 치환되는 어구를 복수형으로 변환한다. 구체적으로는, 입력예 B의 경우에는, 슬롯 치환부(41)는「this」를「these」로 변환한다. 또한, 입력예 D와 입력예 E의 경우에는, 실질적인 변경은 없지만, 슬롯 치환부(41)는「these」를「these」로 변환한다.
스텝 S1008에 있어서는, 슬롯 치환부(41)가, 상술한 변환 처리 후의 어구를 사용하여, 슬롯부「{1-i:THIS-THAT}」와 슬롯부「{2-i:GOODS}」를 치환한다.
이상의 결과, 도 50에 나타내는 바와 같이, 입력예 A 내지 입력예 F의 각각에 대하여, 2개의 슬롯이 어구로 치환된 영어 문례가 생성된다.
다음에, 두번째의 예를, 도 51 내지 도 55에 기초하여 설명한다.
도 51은, 템플릿 데이터베이스(60)에 기억되어 있는 템플릿 데이터의 구성을 나타낸 것이다. 설명의 편의상, 일본어 템플릿과 영어 템플릿을 나타내고 있다. 도 51에 나타내는 바와 같이, 일본어 템플릿에는「{1-i:NOUN}」과「{2:NUM}」과「{3-i:CLASSIFIER}」이라는 3개의 슬롯부가 포함되어 있다. 또한, 영어 템플릿에는,「{2-j:NUM}」과「{3-j:CLASSIFIER}」과「{1-j:NOUN}」이라는 3개의 슬롯부가 포함되어 있다. 이 영어 템플릿의 3개 슬롯부에 있어서는, 공기 관계를 나타내는「-j」라는 부호가 부여되어 있다. 즉, 3개의 슬롯부는 서로 공기 관계를 갖고 있다.
도 52는, 도 51에 나타낸 템플릿 데이터에 있어서의 일본어 템플릿의 슬롯부에 있어서 치환되는 어구의 예를 나타낸 도면이다. 또한, 도 52에 있어서는, 입력예 A와 입력예 B는, 각각,「{1-i:NOUN}」과「{2:NUM}」과「{3-i:CLASSIFIER}」이라는 슬롯부에 있어서 치환되는 어구의 예를 든 것이다. 예를 들어 입력예 A는,「{1-i:NOUN}」이라는 슬롯부가 어구 W42(명사)로 치환되고,「{2:NUM}」이라는 슬롯부가「2」로 치환되고,「{3-i:CLASSIFIER}」이라는 슬롯부가 어구 W43(명사)으로 치환된 경우를 나타내고 있다.
도 53은, 사전 데이터베이스(61)에 기억되어 있는 사전 데이터를 나타낸 도면이다. 도 53에 나타내는 바와 같이, 사전 데이터에는 일본어의 어구와 그 어구에 대응하는 영어의 어구가 대응되어 기억되어 있다.
도 54는, 이와 같은 템플릿 데이터와 사전 데이터를 사용하여, 영어의 문례를 작성할 때의 플로우를 나타낸 흐름도이다.
우선, 슬롯 치환부(41)가, 사전 데이터를 참조하여, 일본어 템플릿의 슬롯부「{1-i:NOUN}」에 있어서 치환된 어구에 따라서, 일본어 템플릿의 슬롯부「{3-i:CLASSIFIER}」에 있어서 치환 가능한 어구의 후보를 선정한다(S1101). 예를 들어, 도 52에 나타내는 입력예 A의 경우에는, 슬롯 치환부(41)는, 상기 후보로서, 어구 W43과 어구 W41(도 53 참조)을 선정한다. 또한, 도 52에 나타내는 입력예 B의 경우에는, 슬롯 치환부(41)는, 상기 후보로서, 어구 W44(명사)를 선정한다.
스텝 S1101 후에는, 슬롯 치환부(41)는 슬롯부 {3-i:CLASSIFIER}」에 있어서 일단 치환된 어구에 기초하여, 상기 후보 중에서 하나의 어구를 결정한다(S1102). 슬롯 치환부(41)는, 예를 들어 입력예 A의 경우에는, 일본어 템플릿의 슬롯부「{3-i:CLASSIFIER}」에 있어서 치환 가능한 어구를 어구 W43으로 결정하고, 입력예 B의 경우에는, 상기 슬롯부「{3-i:CLASSIFIER}」에 있어서 치환 가능한 어구를 어구 W44로 결정한다.
그리고, 스텝 S1102 후에는, 제어부(12)는 처리를 영어 템플릿의 처리로 이행한다.
스텝 S1102 후에는, 슬롯 치환부(41)에 의해, 일본어 템플릿의 슬롯부「{2:NUM}」이「2」이상인지 여부가 판단된다(S1103). 스텝 S1103에 있어서「2」이상이라고 판단된 경우에는, 슬롯 치환부(41)가 일본어 템플릿의 슬롯부 {3-i:CLASSIFIER}」에 있어서의 어구의 번역이 존재하는지 여부를 판단한다(S1104). 한편, 스텝 S1103에 있어서「2」이상이 아니라고 판단된 경우에는, 스텝 S1107로 진행한다.
스텝 S1104에 있어서 번역이 존재한다고 판단된 경우에는, 슬롯 치환부(41)는 영어 템플릿의 슬롯부「{3-j:CLASSIFIER}」의 어구를 복수형으로 변환한다(S1105). 그리고, 스텝 S1105 후에는, 제어부(12)는 처리를 스텝 S1107로 진행시킨다. 한편, 스텝 S1104에 있어서 번역이 존재하지 않는다고 판단된 경우에는, 슬롯 치환부(41)는, 영어 템플릿의 슬롯부「{2-j:NOUN}」의 어구를 복수형으로 변환한다(S1106). 그리고, 스텝 S1106 후에는, 제어부(12)는 처리를 스텝 S1107로 진행시킨다.
예를 들어 입력예 A의 경우에는, 스텝 S1105에 있어서, 슬롯 치환부(41)는「glass of」를「glasses of」로 변환한다. 또한, 입력예 B의 경우에는, 스텝 S1106에 있어서, 슬롯 치환부(41)는「magazine」을「magazines」로 변환한다.
그리고, 스텝 S1107에 있어서는, 번역 장치(1)는 변환 후의 어구를 사용하여 치환 처리를 행한다.
이상의 결과, 도 55에 나타내는 바와 같이, 번역 장치(1)는, 입력예 A 및 입력예 B의 각각에 대하여, 각 슬롯이 어구로 치환된 영어 문례를 생성한다.
또한, 상기의 실시 형태에 있어서는, 도 13의 플로우에도 나타내는 바와 같이, 템플릿 데이터베이스 내의 모든 템플릿 데이터를 검색 대상으로 하고, 추출한 어구가 고정부 또는 가변부에 포함되는 템플릿을 검색하는 구성을 예로 들어 설명하였다. 그러나, 이에 한정되는 것은 아니며, 템플릿 데이터의 일부의 템플릿을 검색의 대상으로 해도 된다.
또한, 상기에 있어서는, 도 3에 나타내는 바와 같이, 복수의 언어의 템플릿이 하나의 템플릿 데이터에 포함되는 구성을 예로 들어 설명하였지만, 이에 한정되는 것은 아니다. 예를 들어, 하나의 템플릿 데이터에는 하나의 언어의 템플릿 데이터가 포함되어 있는 구성으로 해도 된다. 이 경우, 상기 하나의 언어의 템플릿 데이터와 대응 관계에 있는 다른 언어의 템플릿 데이터가, 상기 하나의 언어의 템플릿 데이터와 관련되어 기억 장치(13)에 기억되어 있으면 된다.
또한, 상기에 있어서는, 도 7에 나타내는 바와 같이, 시소러스 데이터를 사용한 예를 들어 설명하였지만, 이에 한정되는 것은 아니다.
어디까지나, 가변부에 있어서 치환 가능한 상기 미리 정해진 복수의 어구는, 소정의 식별 표식에 의해 특정되는 어구이면 된다. 즉, 시소러스 데이터에 있어서의 구분으로서의 라벨로 특정되는 어구에 한정되지 않고, 미리 구분이 마련된 데이터에 있어서의 어느 구분을 나타내는 식별 표식으로 특정되는 어구이면 된다.
예를 들어, 기억 장치(13)에 기억된 제1 언어의 사전 데이터에서는, 그 사전 데이터에 포함되는 어구 중 전부 또는 일부의 어구가, 각각, 적어도 하나의 그룹에 속하도록 분류해 두고, 상기 소정의 식별 표식을 상기 복수의 그룹 중 소정의 그룹을 나타내는 표식으로 해도 된다. 즉, 어떤 어구「A」를, 적어도 하나의 그룹(예를 들어, 그룹 A 및 그룹 B)에 포함되도록 해 두고, 예를 들어 상기 소정의 식별 표식으로서 그룹 B를 나타내는 표식을 사용한 경우에는, 그룹 B에 포함되는 어구 모두가, 하나의 가변부에 있어서 치환 대상이 되도록 하면 된다.
또한, 번역 장치(1)는 출력부(11)에 있어서 화상을 출력하는 구성이었지만, 이에 한정되는 것은 아니다. 예를 들어, 번역 장치(1)를, 화상을 출력함과 함께, 얻어진 각 언어의 문례를 음성 출력하는 구성으로 해도 된다. 또한, 번역 장치(1)를, 상기 문례를 화상 출력하지 않고, 간단히, 음성 출력만 하는 구성으로 해도 된다.
이상 설명해 온 바와 같이, 본 실시 형태에 관한 번역 장치(1)를 사용함으로써, 입력문과 템플릿의 매칭시에, 동일 의미 개념의 언어(어구)는 동정된다. 그 결과, 번역 장치(1)는, 적절한 문례(베이스가 되는 문례)의 선택이 가능해진다. 또한, 템플릿에 있어서의 한 문장 중 가변부의 수가 증가해도, 부당하게 유사도(매치 정도)가 저하되는 일은 없다. 또한, 템플릿에 있어서, 미리 가변부가 되는 개소가 슬롯화되어 특정되어 있으므로, 번역 장치(1)는 비매치 부분의 특정을 잘못하는 일이 없다. 또한, 가변부에서 치환 가능한 어구가 미리 대역 사전으로 지정되어 있으므로, 번역 장치(1)는 확실한 번역어 치환을 행할 수 있다. 또한, 공기 관계를 적은 템플릿, 공기 관계 대응 데이터, 활용형에 관한 정보 등의 데이터를 사용하므로, 번역 장치(1)는 종래의 용례 주도형 방식을 비롯한 각종 방식의 번역 장치로는 실현할 수 없었던「100% 정확하다」라고 할 수 있는 번역 결과를 얻을 수 있다.
<번역 장치(1)의 변형예>
그런데, 상기에 있어서는, 번역 장치(1)는 번역 처리를 실행하지 않는 경우라도, 도 3에 나타낸 형식의 일본어 템플릿이나 영어 템플릿을 기억 장치(13)의 템플릿 데이터베이스(60)에 기억하고 있다. 이하에서는, 번역 장치가 번역 처리를 실행할 때에, 기억 장치(13)의 템플릿 데이터베이스에 미리 기억된 템플릿에 기초하여, 일본어 템플릿 및 영어 템플릿을 생성하는 구성에 대하여 설명한다. 또한, 이하의 설명에서는, 동일한 부품에는 동일한 부호를 부여하고 있다. 그들의 명칭 및 기능도 동일하다. 따라서, 그들에 대한 상세한 설명은 반복하지 않는다.
도 56은 번역 장치(1A)의 개략 구성을 나타낸 도면이다. 도 56을 참조하여, 번역 장치(1A)는 입력부(10)와, 출력부(11)와, 제어부(12A)와, 기억 장치(13A)와, 메모리(14A)를 구비하고 있다. 즉, 번역 장치(1A)가 제어부(12A) 및 기억 장치(13A)를 갖는 점에 있어서, 제어부(12) 및 기억 장치(13)를 갖는 번역 장치(1)와는 상이하다.
기억 장치(13A)는, 템플릿 데이터베이스(60A)와, 사전 데이터베이스(61)와, 일본어 활용형 테이블(62)과, 카테고리 데이터베이스(63)와, 시소러스 데이터(64)와, 공기 관계 데이터베이스(65)를 기억하고 있다.
템플릿 데이터베이스(60A)는, 일본어 템플릿 데이터 대신에, 그 일본어 템플릿을 생성하기 위한 템플릿(이하,「제1 템플릿」이라고 칭함)을 기억하고 있다. 또한, 기억 장치(13A)는, 영어 템플릿 대신에, 그 영어 템플릿을 생성하기 위한 템플릿(이하,「제2 템플릿」이라고 칭함)을 기억하고 있다. 또한, 기억 장치(13A)는, 중국어 템플릿 대신에, 그 중국어 템플릿을 생성하기 위한 템플릿(이하,「제3 템플릿」이라고 칭함)을 기억하고 있다. 제1 템플릿, 제2 템플릿, 및 제3 템플릿의 개요에 대해서는, 후술한다(도 57 참조).
메모리(14A)는, 추출 어구 버퍼(70)와, 검색 결과 템플릿 버퍼(71)와, 슬롯부용 버퍼(72)와, 공기부용 버퍼(73)와, 우선 공기 버퍼(74)와, 처리문 저장 버퍼(75)와, 번역 결과 버퍼(76)와, 템포러리 템플릿 버퍼(77)와, 템포러리 사전 버퍼(78)와, 템포러리 어구 버퍼(79)와, 템포러리 슬롯 버퍼(80)와, 템포러리 제1 공기 버퍼(81)와, 템포러리 제2 공기 버퍼(82)와, 입력문 버퍼(83)와, 전개 데이터 저장 버퍼(도시하지 않음)와, 처리 대기 버퍼(도시하지 않음)와, 요소 버퍼(도시하지 않음)를 구비하고 있다.
제어부(12A)는, 추출부(20)와, 데이터 판독부(21A)와, 판정부(22)와, 선택부(23)와, 치환부(24)와, 표시 제어부(25)와, 출력문 정형부(26)와, 생성부(27)를 구비하고 있다.
데이터 판독부(21A)는 기억 장치(13A)로부터 상기 제1 템플릿과 상기 제2 템플릿을 판독한다.
생성부(27)는, 판독된 제1 템플릿과 제2 템플릿과 제3 템플릿에 기초하여, 일본어 템플릿과 그 일본어 템플릿과 대응 관계에 있는 영어 템플릿 및 중국어 템플릿을 각각 복수 생성한다. 생성부(27)는 상기 생성한 일본어 템플릿과 영어 템플릿과 중국어 템플릿을 기억 장치(13A)에 기억시킨다.
이상의 처리에 의해, 번역 장치(1A)는 기억 장치(13A)에 일본어 템플릿과 영어 템플릿과 중국어 템플릿을 기억시킬 수 있다. 이하, 제1 템플릿, 제2 템플릿, 및 제3 템플릿의 구성을 설명하면서, 생성부(27)의 상세한 처리를 설명한다.
도 57은, 템플릿 데이터베이스(60A)에 포함되는 하나의 템플릿 데이터의 구성을 나타낸 도면이다. 도 57을 참조하여, 템플릿 데이터는, 템플릿 ID와, 제1 템플릿과, 제2 템플릿과, 제3 템플릿을 포함하고 있다.
제1 템플릿은, 소정의 어구로 구성된 제1 부와, 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부와, 미리 정해진 복수의 요소 중 어떠한 요소를 선택 가능한 제2 부를 포함하고 있다.
도 57에 있어서는, 어구 W36, 어구 W45(부정을 나타내는 문자), 및 어구 W46(구점)이 제1 부에 해당한다. 또한, {1:&LANGUAGE}가 가변부에 해당한다. 또한, 문자열 W47과, {2:(&VB_EXPLAIN+v.kanou)|(&VB_PRONOUNCE+v.kanou)|(&VB_INTERPRET+v.kanou)}가 제2 부에 해당한다.
제2 템플릿은, 제1 템플릿과 마찬가지로, 제1 부와 가변부와 제2 부를 포함하고 있다. 도 57에 있어서는,「I」와「can't」가 제1 부에 해당한다. 또한, {1:&LANGUAGE}가 가변부에 해당한다. 또한, {2:(&VB_EXPLAIN+inf)it in|(&VB_PRONOUNCE+inf)it in|(&VB_INTERPRET+inf)it in}이 제2 부에 해당한다.
제3 템플릿에 대해서도, 도 57에 나타내는 바와 같이, 제1 템플릿과 제2 템플릿과 마찬가지로, 제1 부와 가변부와 제2 부를 포함하고 있다.
이상과 같이, 제1 템플릿과 제2 템플릿(혹은 제3 템플릿)은, 소정의 어구로 구성된 제1 부와 미리 정해진 복수의 요소 중 어떠한 요소를 선택 가능한 제2 부를 포함하고 있다.
번역 장치(1A)에 있어서의 처리의 개략은, 도 12에 나타낸 흐름도와 동일하다. 단, 번역 장치(1A)에 있어서의 템플릿 검색(스텝 S2)의 처리는, 도 13에 나타낸 흐름도와는 상이하다.
도 58은, 템플릿 검색에 있어서의 전반의 처리의 흐름을 나타낸 흐름도이다. 도 59는, 당해 템플릿 검색에 있어서의 후반의 처리의 흐름을 나타낸 흐름도이다. 도 58을 참조하여, 스텝 S202와 스텝 S203 사이에, 새롭게 2개의 스텝 S2001, S2002를 포함하는 점에서, 도 58의 처리는 도 13의 처리(스텝 S201 내지 스텝 S204)와는 상이하다. 도 59를 참조하여, 스텝 S207과 스텝 S208 사이에, 새롭게 스텝 S2003을 포함하는 점에서, 도 59의 처리는 도 13의 처리(스텝 S205 내지 스텝 S208)와는 상이하다.
다시 도 58을 참조하여, 스텝 S2001에 있어서, 생성부(27)는 기억 장치(13A)로부터 판독된 템플릿 데이터(도 57 참조)를 전개하고, 그 전개하여 얻어진 템플릿 데이터를 상기 전개 데이터 저장 버퍼에 기입한다. 생성부(27)는, 템플릿 데이터의 전개에 의해, 적어도 하나 이상의 템플릿 데이터를 전개 데이터 저장 버퍼에 기입한다. 스텝 S2002에 있어서, 생성부(27)는 전개 데이터 저장 버퍼로부터 템플릿 데이터를 하나 판독한다.
다시 도 59를 참조하여, 스텝 S2003에 있어서, 생성부(27)는 아직 판독하고 있지 않은 템플릿 데이터가 전개 데이터 저장 버퍼에 존재하는지 여부를 판단한다. 템플릿 데이터가 존재한다고 판단된 경우(스텝 S2003에 있어서 예), 번역 장치(1A)는 처리를 스텝 S2002로 복귀시킨다. 한편, 템플릿 데이터가 존재하지 않는다고 판단된 경우(스텝 S2003에 있어서 아니오), 번역 장치(1A)는 처리를 스텝 S208로 진행시킨다. 스텝 S208에 있어서는, 제어부(12)가 템플릿 데이터베이스(60A) 내에, 아직 판독하고 있지 않은 템플릿 데이터가 템플릿 데이터베이스에 존재하는지 여부를 판단한다.
도 60은, 도 58에 있어서의 스텝 S2001의 상세의 일부를 나타낸 흐름도이다. 도 61은, 도 58에 있어서의 스텝 S2001의 상세의 나머지 부분을 나타낸 흐름도이다.
도 60을 참조하여, 스텝 S2101에 있어서, 번역 장치(1A)는, 스텝 S202에서 판독한 하나의 템플릿 데이터를 처리 대기 버퍼에 저장한다. 예를 들어, 번역 장치(1)는, 도 57에 나타낸 템플릿 데이터를 처리 대기 버퍼에 저장한다. 이하에서는, 도 57에 나타낸 템플릿 데이터[이하,「템플릿 데이터(ID1971-1)」라고 칭함]가 처리 대기 버퍼에 저장된 경우를 예로 들어 설명한다.
스텝 S2103에 있어서, 번역 장치(1A)는 처리 대기 버퍼로부터, 템플릿 데이터를 1건 판독한다. 처리 대기 버퍼에 템플릿 데이터(ID1971-1)만이 저장되어 있으므로, 번역 장치(1A)는 이 템플릿 데이터(ID1971-1)를 판독한다.
스텝 S2105에 있어서, 번역 장치(1A)는 판독한 템플릿 데이터 내에「|」과 같은 구분을 나타내는 기호가 존재하는지 여부를 판단한다. 기호「|」이 존재한다고 판단된 경우(스텝 S2105에 있어서 예), 번역 장치(1A)는 처리를 스텝 S2111(도 61 참조)로 진행시킨다.
기호「|」이 존재하지 않는다고 판단된 경우(스텝 S2105에 있어서 아니오), 스텝 S2107에 있어서, 번역 장치(1A)는 템플릿 데이터를 전개 데이터 저장 버퍼에 기입한다. 그리고, 스텝 S2109에 있어서, 번역 장치(1A)는 처리 대기 버퍼 내에 판독하고 있지 않은 템플릿 데이터가 존재하는지 여부를 판단한다. 템플릿 데이터가 존재한다고 판단된 경우(스텝 S2109에 있어서 예), 번역 장치(1A)는 처리를 스텝 S2103으로 복귀시킨다. 한편, 템플릿 데이터가 존재하지 않는다고 판단된 경우(스텝 S2109에 있어서 아니오), 번역 장치(1A)는 처리를 스텝 S2002(도 58 참조)로 진행시킨다.
템플릿 데이터(ID1971-1)는 기호「|」을 포함하고 있으므로, 번역 장치(1A)는 스텝 S2105 후, 스텝 S2111을 실행한다. 도 61을 참조하여, 스텝 S2111에 있어서, 번역 장치(1A)는 기호「|」을 포함하는 제2 부를 1개 판독한다. 예를 들어, 번역 장치(1A)는 템플릿 데이터(ID1971-1)의 제1 템플릿으로부터 문자열 W47(도 57 참조)을 판독한다.
스텝 S2113에 있어서, 번역 장치(1A)는 판독한 제2 부의「{}」내에 있어서「|」로 구획되어 존재하고 있는 각 요소를 요소 버퍼에 기입한다. 구체적으로는, 번역 장치(1A)는, 도 62에 나타내는 바와 같이, 어구 W48(부사)와 어구 W49(부사)와「」(즉 공백)을 요소 버퍼의 일본어의 란에 기입한다. 또한, 도 62는, 1번째의 스텝 S2113의 처리에 있어서, 요소가 기입된 후의 요소 버퍼의 상태를 나타낸 도면이다. 또한, 제2 템플릿 및 제3 템플릿에는, 문자열 W47에 대응하는 제2 부가 존재하지 않기 때문에, 번역 장치(1A)는 요소 버퍼의 영어 및 중국어의 란에 대하여,「Null」의 상태를 유지한다.
스텝 S2115에 있어서, 번역 장치(1A)는 요소 내에 라벨이 존재하는지 여부를 판단한다. 라벨이 존재한다고 판단된 경우(스텝 S2115에 있어서 예), 스텝 S2117에 있어서, 번역 장치(1A)는 판독한 요소 내에「()」가 존재하는지 여부를 판단한다. 「()」가 존재한다고 판단된 경우(스텝 S2117에 있어서 예), 스텝 S2119에 있어서, 번역 장치(1A)는, 우선, 요소 버퍼에 있어서,「(」를「{」로 변경함과 함께,「)」를「}」로 변경한다. 또한, 스텝 S2119에 있어서, 번역 장치(1A)는「{」의 뒤에 슬롯 번호를 추기한다. 한편,「()」가 존재하지 않는다고 판단된 경우(스텝 S2117에 있어서 아니오), 번역 장치(1A)는, 요소 버퍼에 있어서, 요소 전체를「()」로 묶음과 함께,「{」뒤에 슬롯 번호를 추기한다.
한편, 라벨이 존재하지 않는다고 판단된 경우(스텝 S2115에 있어서 아니오), 번역 장치(1A)는 처리를 스텝 S2123으로 진행시킨다. 스텝 S2123에 있어서, 번역 장치(1A)는, 템플릿 데이터를 요소 버퍼 내의 각 요소를 사용하여 재기입하고, 그 재기입한 템플릿 데이터를 처리 대기 버퍼에 저장한다.
상기와 같이, 요소 버퍼에, 어구 W48과 어구 W49와「」(즉 공백)이 기입되어 있는 경우(도 62 참조), 스텝 S2115에 있어서, 번역 장치(1A)는 라벨이 존재하지 않는다고 판단한다. 이로 인해, 스텝 S2123의 처리의 결과, 번역 장치(1A)는, 도 63에 나타내는 템플릿 데이터, 도 64에 나타내는 템플릿 데이터, 및 도 65에 나타내는 템플릿 데이터를 처리 대기 버퍼에 저장한다.
또한, 도 63은, 처리 대기 버퍼에 저장한 후의 하나의 템플릿 데이터[이하,「템플릿 데이터(1971-1_1)」라고 칭함]를 나타낸 도면이다. 또한, 템플릿 데이터(1971-1_1)는 번역 장치(1)가 템플릿 데이터(ID1971-1)의 문자열 W47을, 어구 W48(요소)을 사용하여 재기입함으로써 얻게 되는 데이터이다.
또한, 도 64는, 처리 대기 버퍼에 저장한 후의 다른 템플릿 데이터[이하,「템플릿 데이터(1971-1_2)」라고 칭함]를 나타낸 도면이다. 또한, 템플릿 데이터(1971-1_2)는 번역 장치(1)가 템플릿 데이터(ID1971-1)의 문자열 W47을, 어구 W49(요소)를 사용하여 재기입함으로써 얻게 되는 데이터이다.
또한, 도 65는, 처리 대기 버퍼에 저장한 후의 또 다른 템플릿 데이터[이하,「템플릿 데이터(1971-1_3)」라고 칭함]를 나타낸 도면이다. 또한, 템플릿 데이터(1971-1_3)는 번역 장치(1)가 템플릿 데이터(ID1971-1)의 문자열 W47을,「」(즉 공백)라는 요소를 사용하여 재기입함으로써 얻게 되는 데이터이다.
번역 장치(1A)가, 템플릿 데이터(1971-1_1), 템플릿 데이터(1971-1_2), 및 템플릿 데이터(1971-1_3)를 처리 대기 버퍼에 저장한 경우, 스텝 S2103에 있어서, 번역 장치(1)는 상기 저장한 3개의 템플릿 데이터로부터 1개의 템플릿 데이터를 판독한다. 여기서, 번역 장치(1A)가 템플릿 데이터(ID1971-1_1)를 판독하였다고 하자. 이 경우, 번역 장치(1A)는, 스텝 S2105에 있어서는 긍정적인 판단을 하고, 번역 장치(1A)는 처리를 스텝 S2111로 진행시킨다.
도 66은, 2번째의 스텝 S2113의 처리에 있어서, 요소가 기입된 후의 요소 버퍼의 상태를 나타낸 도면이다. 도 66을 참조하여, 번역 장치(1A)는,「(&VB_EXPLAIN+v.kanou)」와「(&VB_PRONOUNCE+v.kanou)」와「(&VB_INTERPRET+v.kanou)」를, 요소 버퍼의 일본어의 란에 기입한다. 또한, 번역 장치(1A)는,「(&VB_EXPLAIN+inf)it in」과「(&VB_PRONOUNCE+inf)it in」과「(&VB_INTERPRET+inf)it in」을, 요소 버퍼의 영어의 란에 기입한다. 또한, 번역 장치(1A)는, 요소 버퍼의 중국어의 란에 대해서도, 일본어의 란 및 영어의 란과 마찬가지의 처리를 행한다.
요소 버퍼의 상태가, 스텝 S2113의 처리에 의해 도 66에 나타내는 상태가 된 경우, 요소 내에 라벨이 존재하므로, 번역 장치(1A)는, 스텝 S2115에 있어서 긍정적인 판단을 행하고, 처리를 스텝 S2117로 진행시킨다. 또한, 판독한 요소 내에「()」가 존재하므로, 번역 장치(1A)는, 스텝 S2117에 있어서 긍정적인 판단을 행하고, 처리를 스텝 S2119로 진행시킨다.
1번째의 스텝 S2117의 처리를 행한 후, 번역 장치(1A)는 요소 버퍼의 각 언어의 란에 있어서, 우선,「(」를「{」로 변경함과 함께,「)」를「}」로 변경한다. 또한, 번역 장치(1A)는,「{」뒤에 슬롯 번호「2」를 추기한다. 또한, 도 67은, 상기 1번째의 스텝 S2117의 처리를 행한 후의, 요소 버퍼의 상태를 나타낸 도면이다.
상기 스텝 S2117의 후, 번역 장치(1A)가 스텝 S2123의 처리를 행함으로써, 처리 대기 버퍼에는, 템플릿 데이터(ID1971-1_2)와, 템플릿 데이터(ID1971-1_3)와, 도 68에 나타내는 템플릿 데이터와, 도 69에 나타내는 템플릿 데이터와, 도 70에 나타내는 템플릿 데이터가 저장된다.
또한, 도 68은, 템플릿 데이터(ID1971-1_1)를, 도 67에 나타내는 요소 1을 사용하여 재기입한 템플릿 데이터[이하,「템플릿 데이터(ID1971-1_11)」라고 칭함]를 나타낸 도면이다. 또한, 도 69는, 템플릿 데이터(ID1971-1_1)를, 도 67에 나타내는 요소 2를 사용하여 재기입한 템플릿 데이터[이하,「템플릿 데이터(ID1971-1_12)」라고 칭함]를 나타낸 도면이다. 도 70은, 템플릿 데이터(ID1971-1_1)를, 도 67에 나타내는 요소 3을 사용하여 재기입한 템플릿 데이터[이하,「템플릿 데이터(ID1971-1_13)」라고 칭함]를 나타낸 도면이다.
스텝 S2123 후에는, 스텝 S2103에 있어서, 번역 장치(1A)는 처치 대기 버퍼로부터, 상기 5개의 템플릿 데이터 중, 1개의 템플릿 데이터를 판독한다.
도 60 및 도 61에 나타내는 일련의 처리가 완료된 시점에 있어서, 전개 데이터 저장 버퍼에는, 도 68 내지 도 76에 나타내는 9개의 템플릿 데이터가 기입되어 있다.
또한, 도 71은, 템플릿 데이터(ID1971-1_2)를, 도 67에 나타내는 요소 1을 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다. 도 72는, 템플릿 데이터(ID1971-1_2)를, 도 67에 나타내는 요소 2를 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다. 도 73은, 템플릿 데이터(ID1971-1_2)를, 도 67에 나타내는 요소 3을 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다.
또한, 도 74는, 템플릿 데이터(ID1971-1_3)를, 도 67에 나타내는 요소 1을 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다. 도 75는, 템플릿 데이터(ID1971-1_3)를, 도 67에 나타내는 요소 2를 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다. 도 76은, 템플릿 데이터(ID1971-1_3)를, 도 67에 나타내는 요소 3을 사용하여 재기입한 템플릿 데이터를 나타낸 도면이다.
이와 같이, 번역 장치(1A)는, 도 57에 나타낸 하나의 템플릿 데이터에 기초하여, 도 63 내지 도 65, 및 도 71 내지 도 76에 나타낸 9개의 템플릿을 생성할 수 있다.
또한, 상기에 있어서는, 도 57에 나타내는 바와 같이, 복수의 언어의 템플릿이 하나의 템플릿 데이터에 포함되는 구성을 예로 들어 설명하였지만, 이에 한정되는 것은 아니다. 예를 들어, 하나의 템플릿 데이터에는 하나의 언어의 템플릿 데이터가 포함되어 있는 구성으로 해도 된다. 이 경우, 상기 하나의 언어의 템플릿 데이터와 대응 관계에 있는 다른 언어의 템플릿 데이터가, 상기 하나의 언어의 템플릿 데이터와 관련되어 기억 장치(13A)에 기억되어 있으면 된다.
이상 설명한 바와 같이, 번역 장치(1A)의 기억 장치(13A)에는, 적어도, 일본어 템플릿을 생성하기 위한 제1 템플릿과, 그 일본어 템플릿과 대응 관계에 있는 영어 템플릿을 생성하기 위한 제2 템플릿이 기억되어 있다. 데이터 판독부(21A)는, 기억 장치(13A)로부터 제1 템플릿과 제2 템플릿을 판독한다. 생성부(27)는, 판독된 제1 템플릿과 제2 템플릿에 기초하여, 일본어 템플릿과 그 템플릿과 대응 관계에 있는 영어 템플릿을 각각 복수 생성한다. 또한, 생성부(27)는 상기 생성한 일본어 템플릿과 영어 템플릿을 기억 장치(13A)에 기억시킨다.
따라서, 번역 장치(1A)는 제1 템플릿으로부터 일본어 템플릿을 복수 생성할 수 있다. 또한, 번역 장치(1A)는 제2 템플릿으로부터 상기 일본어 템플릿과 대응 관계에 있는 영어 템플릿을 복수 생성할 수 있다.
그로 인해, 번역 장치(1)와 같이 미리 일본어 템플릿 및 영어 템플릿을 기억 장치(13)에 기억해 두는 구성에 비해, 번역 장치(1A)는 미리 기억해 두는 템플릿의 수를 적게 할 수 있다. 이로 인해, 번역 장치(1A)는 번역 장치(1)에 비하여, 템플릿을 기억시켜 두는 영역의 용량을 작게 할 수 있다.
또한, 제1 템플릿과 제2 템플릿은, 소정의 어구로 구성된 제1 부와 미리 정해진 복수의 요소 중 어떠한 요소를 선택 가능한 제2 부를 포함한다. 생성부(27)는, 제1 템플릿 및 제2 템플릿에 있어서 서로 대응하는 위치의 요소를, 제1 템플릿 및 제2 템플릿에 있어서 순서대로 선택함으로써, 일본어 템플릿과 그 템플릿에 대응하는 영어 템플릿을 각각 복수 생성한다.
따라서, 번역 장치(1A)는 제2 부에 포함되는 요소의 수에 따른, 일본어 템플릿 및 영어 템플릿을 생성할 수 있다.
또한, 도 57에 나타낸 바와 같이, 요소는 가변부이어도 된다. 요소가 가변부인 경우에는, 번역 장치(1A)는 요소가 가변부가 아닌 경우보다도, 수많은 문례를 작성할 수 있다.
금회 개시된 실시 형태는 모든 점에서 예시이며 제한적인 것은 아니라고 생각되어야 한다. 본 발명의 범위는 상기한 설명이 아니라 특허청구범위에 의해 나타내어지고, 특허청구범위와 균등한 의미 및 범위 내에서의 모든 변경이 포함되는 것이 의도된다.
1: 번역 장치
1A: 번역 장치
10: 입력부
11: 출력부
12: 제어부
12A: 제어부
13: 기억 장치
13A: 기억 장치
14: 메모리
14A: 메모리
20: 추출부
22: 판정부
23: 선택부
24: 치환부
25: 표시 제어부
26: 출력문 정형부
27: 생성부
40: 사전 검색부
41: 슬롯 치환부
42: 공기 치환부
43: 변화형 탐색부
44: 미입력 개소 치환부

Claims (17)

  1. 정보 처리 장치로서,
    제1 언어에 의한 템플릿과 그 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿을 기억한 기억 장치(13, 13A)로부터, 상기 제1 언어에 의한 템플릿과 상기 제2 언어에 의한 템플릿을 판독하는 판독부(21, 21A)를 구비하고,
    상기 제1 언어에 의한 템플릿과 상기 제2 언어에 의한 템플릿은, 소정의 어구로 구성된 고정부와 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부를 각각 대응하는 위치에 포함하고,
    상기 판독부(21, 21A)에 의해 판독된 상기 제1 언어에 의한 복수의 템플릿에 대하여, 입력 장치를 통하여 제1 언어로 입력된 문장에 포함되는 어구가, 상기 소정의 어구 및 상기 미리 정한 복수의 어구 중 어느 것과 일치하는지를 판정하는 판정부(22)와,
    상기 판정의 결과에 기초하여, 상기 복수의 템플릿 중에서, 적어도 하나의 템플릿을 선택하는 선택부(23)와,
    상기 선택부(23)에 의해 상기 일치한 어구로 치환 가능한 가변부를 포함하는 템플릿이 선택된 경우, 상기 판독부(21, 21A)에 의해 판독된, 상기 선택된 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿에 대하여, 상기 일치한 어구로 치환 가능한 가변부에 대응한 가변부를, 상기 일치한 어구에 대응하는 제2 언어에 의한 어구로 치환하는 치환부(24)를 더 구비하고,
    상기 제2 언어에 의한 템플릿에는 상기 가변부로서, 제1 가변부와 제2 가변부가 포함되어 있고,
    상기 치환부(24)는 상기 제1 가변부를 상기 제2 언어에 의한 어구로 치환함과 함께, 상기 치환 후의 어구에 따라서 상기 제2 가변부의 어구를 결정하는, 정보 처리 장치(1, 1A).
  2. 제1항에 있어서,
    적어도, 상기 치환부(24)에 의한 치환을 행한 후의 상기 제2 언어에 의한 템플릿에 기초한, 상기 제1 언어로 입력된 문장의 번역 결과를 표시 장치에 표시시키는 표시 제어부(25)를 구비하는, 정보 처리 장치.
  3. 제2항에 있어서,
    상기 치환부(24)는 상기 선택부(23)에 의해 제1 언어에 의한 템플릿이 선택된 경우, 상기 일치한 어구로 치환 가능한 가변부를 상기 일치한 어구로 치환하고,
    상기 표시 제어부(25)는, 또한 상기 치환부(24)에 의한 치환을 행한 후의 상기 제1 언어에 의한 템플릿에 기초하는 화상을 표시 장치에 표시시키는, 정보 처리 장치(1, 1A).
  4. 제1항에 있어서,
    상기 가변부에는 소정의 식별 표식이 대응되어 있고,
    상기 미리 정해진 복수의 어구는 상기 소정의 식별 표식에 의해 특정되는 어구인, 정보 처리 장치(1, 1A).
  5. 제4항에 있어서,
    상기 기억 장치(13, 13A)에는, 상기 제1 언어의 사전 데이터와 상기 제2 언어의 사전 데이터가 기억되어 있음과 함께, 상기 제1 언어의 사전 데이터에서는, 상기 사전 데이터에 포함되는 어구 중 전부 또는 일부의 어구가 각각 적어도 하나의 그룹에 속하도록 분류되어 있고,
    상기 소정의 식별 표식은 상기 복수의 그룹 중 소정의 그룹을 나타내는 표식인, 정보 처리 장치(1, 1A).
  6. 제5항에 있어서,
    상기 기억 장치(13, 13A)에 기억된 사전 데이터는 시소러스(thesaurus)에 관한 데이터를 포함하고, 상기 분류는 상기 시소러스에 관한 데이터에 기초하여 행해지고 있고,
    상기 소정의 그룹은 상기 시소러스에 관한 데이터에 있어서 정의된 소정의 구분에 포함되는 어구인, 정보 처리 장치(1, 1A).
  7. 제1항에 있어서,
    상기 기억 장치(13, 13A)에는, 상기 제1 언어에 의한 템플릿의 가변부에 있어서의 상기 미리 정한 복수의 어구 각각에 대하여, 상기 제2 언어로 번역한 어구가 하나 대응되어 기억되어 있고,
    상기 치환부(24)는, 상기 제2 언어에 의한 템플릿의 가변부를, 상기 기억 장치(13, 13A)에 있어서 상기 대응시켜 기억된 상기 제2 언어로 번역한 어구로 치환하는, 정보 처리 장치(1, 1A).
  8. 제1항에 있어서,
    상기 제1 언어에 의한 템플릿의 가변부와, 그 가변부에 대응한 상기 제2 언어에 의한 템플릿의 가변부에는, 어구의 활용형에 관한 정보가 대응되어 있고,
    상기 치환부(24)는, 상기 활용형에 관한 정보에 기초하여, 상기 치환한 어구에 대하여 어형을 변화시키는, 정보 처리 장치(1, 1A).
  9. 제1항에 있어서,
    상기 제1 가변부는 상기 제2 가변부와의 관련성을 나타내는 부호를 포함하는 것이 가능하고,
    상기 치환부(24)는, 상기 제1 가변부에 상기 부호가 포함되어 있는 경우, 그 부호로 특정되는 제2 가변부에 대하여, 상기 치환 후의 어구에 따라서 상기 제2 가변부의 어구를 결정하는, 정보 처리 장치(1, 1A).
  10. 제1항에 있어서,
    상기 선택된 제1 언어에 의한 템플릿과, 그 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿의 각각에 복수의 가변부가 포함되어 있는 경우, 상기 판정부(22)는 상기 제1 언어에 의한 템플릿을 선택할 때, 각 가변부에 관하여 상기 추출된 어구가 상기 미리 정한 복수의 어구 중 어느 것과 일치하는지를 판정하는, 정보 처리 장치(1, 1A).
  11. 제1항에 있어서,
    상기 기억 장치(13A)에는, 제1 언어에 의한 템플릿을 생성하기 위한 제1 템플릿과, 그 제1 언어에 의한 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿을 생성하기 위한 제2 템플릿이 기억되고,
    상기 판독부(21, 21A)는 상기 기억 장치(13A)로부터 상기 제1 템플릿과 상기 제2 템플릿을 판독하고,
    상기 정보 처리 장치(1A)는,
    상기 판독된 상기 제1 템플릿과 상기 제2 템플릿에 기초하여, 상기 제1 언어에 의한 템플릿과 그 템플릿과 대응 관계에 있는 상기 제2 언어에 의한 템플릿을 각각 복수 생성하고, 그 생성한 제1 언어에 의한 템플릿과 제2 언어에 의한 템플릿을 상기 기억 장치(13A)에 기억시키는 생성부(27)를 더 구비하는, 정보 처리 장치(1A).
  12. 제11항에 있어서,
    상기 제1 템플릿과 상기 제2 템플릿은 소정의 어구로 구성된 제1 부와 미리 정해진 복수의 요소 중 어떠한 요소를 선택 가능한 제2 부를 포함하고,
    상기 생성부(27)는, 상기 제1 템플릿 및 상기 제2 템플릿에 있어서 서로 대응하는 위치의 상기 요소를, 상기 제1 템플릿 및 상기 제2 템플릿에 있어서 순서대로 선택함으로써, 상기 제1 언어에 의한 템플릿과 그 템플릿에 대응하는 상기 제2 언어에 의한 템플릿을 각각 복수 생성하는, 정보 처리 장치(1A).
  13. 제12항에 있어서,
    상기 요소는 상기 가변부인, 정보 처리 장치(1A).
  14. 정보 처리 방법으로서,
    제1 언어에 의한 템플릿과 그 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿을 기억한 기억 장치로부터, 상기 제1 언어에 의한 템플릿과 상기 제2 언어에 의한 템플릿을 판독하는 스텝(S202)을 구비하고,
    상기 제1 언어에 의한 템플릿과 상기 제2 언어에 의한 템플릿은, 소정의 어구로 구성된 고정부와 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부를 각각 대응하는 위치에 포함하고 있고,
    상기 판독된 상기 제1 언어에 의한 복수의 템플릿에 대하여, 입력 장치를 통하여 제1 언어로 입력된 문장에 포함되는 어구가, 상기 소정의 어구 및 상기 미리 정한 복수의 어구 중 어느 것과 일치하는지를 판정하는 스텝(S204, S205)과,
    상기 판정의 결과에 기초하여, 상기 복수의 템플릿 중에서, 적어도 하나의 템플릿을 선택하는 스텝(S401)과,
    상기 일치한 어구로 치환 가능한 가변부를 포함하는 템플릿이 선택된 경우, 상기 판독된, 상기 선택된 템플릿과 대응 관계에 있는 상기 제2 언어에 의한 템플릿에 대하여, 상기 일치한 어구로 치환 가능한 가변부에 대응한 가변부를, 상기 일치한 어구에 대응하는 제2 언어에 의한 어구로 치환하는 스텝(S405, S408)을 더 구비하고,
    상기 제2 언어에 의한 템플릿에는 상기 가변부로서, 제1 가변부와 제2 가변부가 포함되어 있고,
    상기 치환하는 스텝(S405, S408)에서는, 상기 제1 가변부를 상기 제2 언어에 의한 어구로 치환함과 함께, 상기 치환 후의 어구에 따라서 상기 제2 가변부의 어구를 결정하는, 정보 처리 방법.
  15. 정보 처리 방법을 컴퓨터에 실행시키기 위한 프로그램으로서,
    상기 정보 처리 방법은,
    제1 언어에 의한 템플릿과 그 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿을 기억한 기억 장치로부터, 상기 제1 언어에 의한 템플릿과 상기 제2 언어에 의한 템플릿을 판독하는 스텝(S202)을 구비하고,
    상기 제1 언어에 의한 템플릿과 상기 제2 언어에 의한 템플릿은, 소정의 어구로 구성된 고정부와 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부를 각각 대응하는 위치에 포함하고 있고,
    상기 판독된 상기 제1 언어에 의한 복수의 템플릿에 대하여, 입력 장치를 통하여 제1 언어로 입력된 문장에 포함되는 어구가, 상기 소정의 어구 및 상기 미리 정한 복수의 어구 중 어느 것과 일치하는지를 판정하는 스텝(S204, S205)과,
    상기 판정의 결과에 기초하여, 상기 복수의 템플릿 중에서, 적어도 하나의 템플릿을 선택하는 스텝(S401)과,
    상기 일치한 어구로 치환 가능한 가변부를 포함하는 템플릿이 선택된 경우, 상기 판독된, 상기 선택된 템플릿과 대응 관계에 있는 상기 제2 언어에 의한 템플릿에 대하여, 상기 일치한 어구로 치환 가능한 가변부에 대응한 가변부를, 상기 일치한 어구에 대응하는 제2 언어에 의한 어구로 치환하는 스텝(S405, S408)을 더 구비하고,
    상기 제2 언어에 의한 템플릿에는 상기 가변부로서, 제1 가변부와 제2 가변부가 포함되어 있고,
    상기 치환하는 스텝(S405, S408)에서는, 상기 제1 가변부를 상기 제2 언어에 의한 어구로 치환함과 함께, 상기 치환 후의 어구에 따라서 상기 제2 가변부의 어구를 결정하는, 프로그램.
  16. 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체로서,
    상기 프로그램은, 정보 처리 방법을 컴퓨터에 실행시키고,
    상기 정보 처리 방법은,
    제1 언어에 의한 템플릿과 그 템플릿과 대응 관계에 있는 제2 언어에 의한 템플릿을 기억한 기억 장치로부터, 상기 제1 언어에 의한 템플릿과 상기 제2 언어에 의한 템플릿을 판독하는 스텝(S202)을 구비하고,
    상기 제1 언어에 의한 템플릿과 상기 제2 언어에 의한 템플릿은, 소정의 어구로 구성된 고정부와 미리 정해진 복수의 어구 중 어떠한 어구로 치환 가능한 가변부를 각각 대응하는 위치에 포함하고 있고,
    상기 판독된 상기 제1 언어에 의한 복수의 템플릿에 대하여, 입력 장치를 통하여 제1 언어로 입력된 문장에 포함되는 어구가, 상기 소정의 어구 및 상기 미리 정한 복수의 어구 중 어느 것과 일치하는지를 판정하는 스텝(S204, S205)과,
    상기 판정의 결과에 기초하여, 상기 복수의 템플릿 중에서, 적어도 하나의 템플릿을 선택하는 스텝(S401)과,
    상기 일치한 어구로 치환 가능한 가변부를 포함하는 템플릿이 선택된 경우, 상기 판독된, 상기 선택된 템플릿과 대응 관계에 있는 상기 제2 언어에 의한 템플릿에 대하여, 상기 일치한 어구로 치환 가능한 가변부에 대응한 가변부를, 상기 일치한 어구에 대응하는 제2 언어에 의한 어구로 치환하는 스텝(S405, S408)을 더 구비하고,
    상기 제2 언어에 의한 템플릿에는 상기 가변부로서, 제1 가변부와 제2 가변부가 포함되어 있고,
    상기 치환하는 스텝(S405, S408)에서는, 상기 제1 가변부를 상기 제2 언어에 의한 어구로 치환함과 함께, 상기 치환 후의 어구에 따라서 상기 제2 가변부의 어구를 결정하는, 기록 매체.
  17. 제1항에 있어서,
    상기 제2 언어에 의한 템플릿에는 상기 제2 가변부가 복수 포함되어 있고,
    상기 기억 장치(13, 13A)는 각 상기 제2 가변부를 치환하는 순서를 규정하는 우선도 정보를 기억하고 있고,
    상기 치환부(24)는, 상기 우선도 정보에 기초한 순서로, 각 상기 제2 가변부를 치환하는, 정보 처리 장치(1, 1A).
KR1020107021608A 2008-02-29 2009-02-02 정보 처리 장치, 방법 및 기록 매체 KR20100134618A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2008-050733 2008-02-29
JP2008050733 2008-02-29

Publications (1)

Publication Number Publication Date
KR20100134618A true KR20100134618A (ko) 2010-12-23

Family

ID=41015859

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107021608A KR20100134618A (ko) 2008-02-29 2009-02-02 정보 처리 장치, 방법 및 기록 매체

Country Status (6)

Country Link
US (1) US8407040B2 (ko)
EP (1) EP2251798A1 (ko)
JP (1) JP5319655B2 (ko)
KR (1) KR20100134618A (ko)
CN (1) CN101960451A (ko)
WO (1) WO2009107456A1 (ko)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080288239A1 (en) * 2007-05-15 2008-11-20 Microsoft Corporation Localization and internationalization of document resources
WO2009107456A1 (ja) * 2008-02-29 2009-09-03 シャープ株式会社 情報処理装置、方法、およびプログラム
JP2011044023A (ja) * 2009-08-21 2011-03-03 Sharp Corp 情報処理装置、表示制御方法、およびプログラム
JP5039114B2 (ja) * 2009-11-14 2012-10-03 株式会社東芝 機械翻訳装置及びプログラム
KR101377459B1 (ko) * 2009-12-21 2014-03-26 한국전자통신연구원 자동 통역 장치 및 그 방법
EP2548382B1 (de) * 2010-03-18 2014-08-06 Siemens Medical Instruments Pte. Ltd. Verfahren zum test des sprachverstehens einer mit einem hörhilfegerät versorgten person
CN102236643A (zh) * 2010-04-29 2011-11-09 英业达股份有限公司 同时显示多语字词与例句的处理系统及其方法
US9063931B2 (en) * 2011-02-16 2015-06-23 Ming-Yuan Wu Multiple language translation system
US8712761B2 (en) * 2011-11-22 2014-04-29 Google Inc. Techniques for performing translation of messages
US9460082B2 (en) 2012-05-14 2016-10-04 International Business Machines Corporation Management of language usage to facilitate effective communication
CN103106195B (zh) * 2013-01-21 2018-12-11 刘树根 表意构件识别提取和基于表意构件的机译人校互动翻译方法
US9436681B1 (en) * 2013-07-16 2016-09-06 Amazon Technologies, Inc. Natural language translation techniques
JP6459231B2 (ja) * 2014-06-11 2019-01-30 富士ゼロックス株式会社 テンプレート管理装置及びプログラム
US9852131B2 (en) * 2015-05-18 2017-12-26 Google Llc Techniques for providing visual translation cards including contextually relevant definitions and examples
CN105183721B (zh) * 2015-08-13 2018-05-25 小米科技有限责任公司 模板构建方法、信息提取方法及装置
SG11201811724TA (en) 2016-09-09 2019-04-29 Panasonic Ip Man Co Ltd Translation device and translation method
JP6810757B2 (ja) * 2016-12-27 2021-01-06 シャープ株式会社 応答装置、応答装置の制御方法、および制御プログラム
JP6631930B2 (ja) * 2017-02-07 2020-01-15 パナソニックIpマネジメント株式会社 翻訳装置および翻訳方法
SG11201906995UA (en) * 2018-01-19 2019-09-27 Gurunavi Inc Control method of server, server, and control program of server
CN108733831B (zh) * 2018-05-25 2022-05-17 腾讯音乐娱乐科技(深圳)有限公司 一种对词库进行处理的方法及装置
CN112149410A (zh) * 2020-08-10 2020-12-29 招联消费金融有限公司 语义识别方法、装置、计算机设备和存储介质

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4507750A (en) * 1982-05-13 1985-03-26 Texas Instruments Incorporated Electronic apparatus from a host language
US4566078A (en) * 1983-03-30 1986-01-21 International Business Machines Corp. Concurrent multi-lingual use in data processing systems
JPH01314373A (ja) * 1988-06-15 1989-12-19 Hitachi Ltd 機械翻訳システムにおける訳語選択方式
JPH05151260A (ja) * 1991-11-29 1993-06-18 Hitachi Ltd 翻訳テンプレート学習方法および翻訳テンプレート学習システム
JPH05314166A (ja) * 1992-05-08 1993-11-26 Sharp Corp 電子化辞書および辞書検索装置
JPH0652219A (ja) * 1992-08-03 1994-02-25 Hitachi Ltd 機械翻訳方法および例文検索方法
JPH0689302A (ja) * 1992-09-08 1994-03-29 Hitachi Ltd 辞書メモリ
JP3015223B2 (ja) * 1993-05-14 2000-03-06 シャープ株式会社 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置
JP3377290B2 (ja) * 1994-04-27 2003-02-17 シャープ株式会社 イディオム処理機能を持つ機械翻訳装置
JPH08101837A (ja) * 1994-09-30 1996-04-16 Toshiba Corp 機械翻訳装置における翻訳規則学習方法
US6526426B1 (en) * 1998-02-23 2003-02-25 David Lakritz Translation management system
WO2000013102A1 (fr) * 1998-08-31 2000-03-09 Sony Corporation Dispositif et procede pour le traitement du langage naturel
US6275789B1 (en) * 1998-12-18 2001-08-14 Leo Moser Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
JP3822990B2 (ja) * 1999-01-07 2006-09-20 株式会社日立製作所 翻訳装置、記録媒体
JP3669870B2 (ja) * 1999-06-28 2005-07-13 株式会社サン・フレア 最適テンプレートパターン探索方法,探索装置および記録媒体
JP2001100781A (ja) * 1999-09-30 2001-04-13 Sony Corp 音声処理装置および音声処理方法、並びに記録媒体
US6859778B1 (en) * 2000-03-16 2005-02-22 International Business Machines Corporation Method and apparatus for translating natural-language speech using multiple output phrases
US6556972B1 (en) * 2000-03-16 2003-04-29 International Business Machines Corporation Method and apparatus for time-synchronized translation and synthesis of natural-language speech
JP3969628B2 (ja) 2001-03-19 2007-09-05 富士通株式会社 翻訳支援装置、方法及び翻訳支援プログラム
US7447624B2 (en) * 2001-11-27 2008-11-04 Sun Microsystems, Inc. Generation of localized software applications
US6988063B2 (en) * 2002-02-12 2006-01-17 Sunflare Co., Ltd. System and method for accurate grammar analysis using a part-of-speech tagged (POST) parser and learners' model
US7398209B2 (en) * 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
JP4239505B2 (ja) 2002-07-31 2009-03-18 日本電気株式会社 翻訳装置と翻訳方法ならびにプログラムと記録媒体
JP3813911B2 (ja) * 2002-08-22 2006-08-23 株式会社東芝 機械翻訳システム、機械翻訳方法及び機械翻訳プログラム
US20040225491A1 (en) * 2003-05-08 2004-11-11 Taiwan Semiconductor Manufacturing Co., Ltd. Generic script template engine repository adapter system and method of use
JP3765801B2 (ja) * 2003-05-28 2006-04-12 沖電気工業株式会社 対訳表現抽出装置、対訳表現抽出方法、および対訳表現抽出プログラム
JP3766406B2 (ja) * 2003-07-24 2006-04-12 株式会社東芝 機械翻訳装置
US7716037B2 (en) * 2004-05-24 2010-05-11 Sri International Method and apparatus for natural language translation in a finite domain
GB2415518A (en) 2004-06-24 2005-12-28 Sharp Kk Method and apparatus for translation based on a repository of existing translations
US7711544B2 (en) * 2004-11-09 2010-05-04 Sony Online Entertainment Llc System and method for generating markup language text templates
US7577561B2 (en) * 2004-11-09 2009-08-18 Sony Online Entertainment Llc System and method for generating a target language markup language text template
US7983895B2 (en) * 2004-11-09 2011-07-19 Sony Online Entertainment Llc System and method for generating grammatically correct text strings
US20060200336A1 (en) * 2005-03-04 2006-09-07 Microsoft Corporation Creating a lexicon using automatic template matching
JP4745036B2 (ja) 2005-11-28 2011-08-10 パナソニック株式会社 音声翻訳装置および音声翻訳方法
US7747427B2 (en) * 2005-12-05 2010-06-29 Electronics And Telecommunications Research Institute Apparatus and method for automatic translation customized for documents in restrictive domain
WO2007139910A2 (en) * 2006-05-26 2007-12-06 Laden Sondrah S System and method of language translation
US7860705B2 (en) * 2006-09-01 2010-12-28 International Business Machines Corporation Methods and apparatus for context adaptation of speech-to-speech translation systems
KR100859532B1 (ko) * 2006-11-06 2008-09-24 한국전자통신연구원 대응 문형 패턴 기반 자동통역 방법 및 장치
US20080133245A1 (en) * 2006-12-04 2008-06-05 Sehda, Inc. Methods for speech-to-speech translation
US8051061B2 (en) * 2007-07-20 2011-11-01 Microsoft Corporation Cross-lingual query suggestion
WO2009107456A1 (ja) * 2008-02-29 2009-09-03 シャープ株式会社 情報処理装置、方法、およびプログラム

Also Published As

Publication number Publication date
JP5319655B2 (ja) 2013-10-16
US20110264439A1 (en) 2011-10-27
WO2009107456A1 (ja) 2009-09-03
JPWO2009107456A1 (ja) 2011-06-30
CN101960451A (zh) 2011-01-26
US8407040B2 (en) 2013-03-26
EP2251798A1 (en) 2010-11-17

Similar Documents

Publication Publication Date Title
JP5319655B2 (ja) 情報処理装置、情報処理方法、プログラム、およびプログラムを記録したコンピュータ読取り可能な記録媒体
JP4050755B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP5121252B2 (ja) 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
US7979268B2 (en) String matching method and system and computer-readable recording medium storing the string matching method
JP4047885B2 (ja) 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
US6233544B1 (en) Method and apparatus for language translation
JP5100445B2 (ja) 機械翻訳する装置および方法
JP2007141133A (ja) 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
JP2008065395A (ja) 翻訳装置、翻訳方法および翻訳プログラム
JP5002271B2 (ja) 入力された原言語文を目的言語に機械翻訳する装置、方法およびプログラム
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
WO2011021479A1 (ja) 情報処理装置、表示制御方法、およびプログラム
JP2009205357A (ja) 中国語の品詞を判定する装置、方法およびプログラム
JP5688884B2 (ja) 情報処理装置、訳文接続方法、およびプログラム
JP2013186673A (ja) 機械翻訳装置及び機械翻訳プログラム
JP5302784B2 (ja) 機械翻訳方法、及びシステム
JP5169602B2 (ja) 形態素解析装置、形態素解析方法及びコンピュータプログラム
JP2003178087A (ja) 外国語電子辞書検索装置および方法
Vijayanand et al. Named entity recognition and transliteration for Telugu language
Yadav et al. Transliteration from Hindi to English Using Image Processing
JPH06243162A (ja) 機械翻訳装置
JP2006098552A (ja) 音声情報生成装置、音声情報生成プログラム及び音声情報生成方法
KR101753395B1 (ko) 음역 방법 및 장치
Bojar Tagger Voting for Urdu
van Heuven et al. Speech Research 11

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application