KR900005899B1 - 문장작성장치 - Google Patents
문장작성장치 Download PDFInfo
- Publication number
- KR900005899B1 KR900005899B1 KR1019860003287A KR860003287A KR900005899B1 KR 900005899 B1 KR900005899 B1 KR 900005899B1 KR 1019860003287 A KR1019860003287 A KR 1019860003287A KR 860003287 A KR860003287 A KR 860003287A KR 900005899 B1 KR900005899 B1 KR 900005899B1
- Authority
- KR
- South Korea
- Prior art keywords
- conversion
- sentence
- information
- input
- kana
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/018—Input/output arrangements for oriental characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
내용 없음.
Description
제1도는 본 발명의 1실시예장치를 나타낸 개략적인 구성도.
제2도는 단어사전메모리의 구성예를 나타낸 도면.
제3도는 변환제어부의 제어시퀀스에 대한 예를 나타낸 도면.
제4도 내지 제6도는 본 장치에 문장작성처리의 구체예를 나타낸 도면이다.
* 도면의 주요부분에 대한 부호의 설명
1 : 입력장치 2 : 입력메모리
3 : 변환제어부 4 : 가나/한자변환부
5 : 단어사전메모리 6 : 학습사전메모리
7 : 출력메모리 8 : 출력장치
[산업상의 이용분야]
본 발명은 일본문자인 가나(假名)의 독출정보를 한자로 변환시켜 이루어지는 복수개의 같은 발음으로서 뜻이 다른말(동음이의어)중에서 적절한 번역어(번역어구)를 효과적으로 선택할 수 있도록 된 문장작성장치에 관한 것이다.
[종래의 기술 및 그 문제점]
최근 일본어 워드프로세서가 널리 보급되고 있는데, 이러한 종류의 문서작성장치에서는 문장을 형성하는 독출정보를 단어와 어절 및 연속어절과 같은 단위로 입력시켜 이를 가나/한자변환사전을 참조해서 가나 및 한자의 혼합문자열로 변환시키도록 되어 있다.
그런데 일본어에서는 여러종류의 동음이의어가 존재하기 때문에 가나/한자변환처리에 있어서는 복수개의 변환후보(번역어 또는 번역구)를 얻게 되는 경우가 많기 대문에 종래에는 오직 다음 후보키를 사용해서 변환목적으로 하는 번역어(번역어구)를 선택하도록 되어 있기 때문에 상기 동음이의어를 선택하기가 무척 번거로웠다.
여기서 예컨대 순차적으로 선택된 동음이의어를 장치내에서 빈도학습시켜 출현빈도가 높은 번역어(번역어구)를 제1후보로 출력하도록 하는 연구가 이루어져 오고 있고, 또 동일번역어(번역어구)가 반복해서 많이 사용되기 때문에 최종적으로 선택되는 번역어(번역어구)를 제1후보로서 출력하도록 하는 연구도 이루어져 오고 있는 바, 이상과 같은 연구들은 모두 동음이의어의 선택조작회수를 줄이는데 크게 공헌해 왔다.
이하부터는 편의상 부분적으로 일본어를 한국어와 한자로 비교·대치시키면서 설명한다.
예컨대 「記者(기샤)가 歸社(기샤)한다」등과 같이 한문장중에서 복수개의 동음이의어가 사용되는 경우가 흔히 있는데, 이런 경우에는 그때마다 동음이의어가 선택조작이 필요하게 되므로 상기한 바와 같은 연구가 오히려 번거로움을 초래하게 될 뿐이다.
따라서 기계번역기술에서 그 예를 볼 수 있는 구문해석처리(構文解析處理)를 도입해서 상기한 동음이의어를 선택하는 방법을 생각해 볼 수도 있으나, 이러한 구문해석처리는 하나의 문장을 해석처리대상으로 해서 해석되기 때문에 입력단위를 단어나 어절등으로 하여 가나/한자변환처리하게 되는 문장작성장치에 대해서는 적용하기가 곤란하였다.
한편, 새로운 문장작성처리로서 이른바 전체가 입력된 독출정보를 순차적으로 가나/한자변환처리하는 방법이 시도되고 있으나, 이는 실제로 장치내부에서 조합처리할 수 있는 데이터량이 제한됨에 따라 한번에 입력할 수 있는 문자의 수를 제한하여 입력시킨다거나 또는 그 입력문의 선두로부터 단어나 어절의 구분을 자동적으로 검출해서 그 검출단위마다 가나/한자변환처리하도록 되어 있기 때문에 하나의 문장의 전체가 입력되어도 그 전체를 단어나 어절등과 같은 단위로 세밀하게 분할시켜 가나/한자변환처리시킴으로써 그 전체에 관련된 구문적인 특징으로 포착하여 해석처리하기가 곤란하였다.
더욱이 구문을 해석하기 위해서는 1문장의 입력이 완료되기를 기다려야 하기 때문에 문장의 입력으로부터 그 변환처리에 대한 결과를 얻기까지의 응답이 좋지 않다는 문제점이 발생하게 되었다.
그 때문에 문장을 고려한 다음 독출정보를 입력해서 문장을 작성하게 되는 경우에는 그 입력이미지(작성문장이미지)를 파악하기 어렵게 된다고 하는 문제점도 발생하게 되었다.
[발명의 목적]
본 발명은 상기한 점을 감안해서 발명된 것으로, 가나/한자변환결과에 대한 응답시간의 지연이나 처리데이터영역의 증대를 야기시키지 않고, 의미적으로 적절한 번역어(번역어구)를 변환후보로서 사용함으로써 동음이의어의 선택조작에 대한 번거로움을 대폭적으로 경감시킬 수 있는 유용한 문장작성장치를 제공함에 그 목적이 있다.
[발명의 구성]
상기 목적을 달성하기 위한 본 발명은, 문장의 독출정보를 입력받아서 가나 및 한자가 혼합된 문장정보로 변환시키는 문장작성장치에 있어서, 문장에 대한 독출정보와 문장끝을 나타내는 문장끝정보를 입력하는 입력장치(1)와, 이 입력장치(1)로부터 독출된 정보를 저장하는 입력메모리(2), 이 입력메모리(2)로부터 독출된 정보를 단어 또는 어절의 소정 처리단위로 인출하여 제어함과 더불어 문장끝정보가 입력될 경우 변환후 보열로 이루어진 1개의 문장정보를 구분해석함으로써 각 변환후보간의 상관관계를 검토하는 변환제어부(3), 이 변환제어부(3)의 제어하에 단어사전메모리(5)에 미리 격납되어 있는 가나/한자변환의 사전정보를 이용해서 상기 소정 처리단위로 입력된 독출정보에 대한 가나/한자변환결과를 구함과 더불어 동음이의어의 존재에 의해 동일한 판독에 대한 변환후보가 복수개 있는 경우 학습사전메모리(6)에 학습등록되어 있는 각 변환후보에 대한 출현빈도정보나 앞에서 선택된 정보를 참조해서 우선순위가 제1위인 변환후보를 그 변환결과로서 선택하는 가나/한자변환부(4), 순차적으로 변환처리된 가나 및 한자의 혼합변환결과를 인가받아 격납하는 출력메모리(7) 및, 입력된 문장의 독출정보에 대한 변환결과의 후보로서 우선순위가 제1위인 하나의 변환가능성을 순차적으로 표시하는 출력장치(8)로 구성된 것을 특징으로 한다.
(작용)
상기와 같이 구성된 본 발명은, 입력된 독출정보를 예컨대 단어나 어절등과 같은 소정의 변환단위로 하여 순차적으로 가나와 한자가 혼재된 문자정보로 변환함으로써 복수의 변환후보가 얻어질 때에는 우선순위가 높은 변환후보를 출력하도록 하는 한편, 상기 독출정보의 입력에 대한 예컨대 구두점이나 괄호와 단락 및 행바꿈등과 같은 문장의 끝부분을 나타내는 특수한 정보의 입력을 트리거로 이용하여 상기 변환처리된 문장의 구문해석을 행하므로써 상기 변환처리된 문장중 동음이의어가 존재하는 후보중에서 다른 말과 사이에서 수식관계에 있지 않는 후보를 선택하고, 이 수식관계에 있지 않는 후보의 변환후보순위를 내려 그 변환후보의 출력을 제어하도록 되어있다.
[실시예]
이하, 예시도면을 참조해서 본 발명에 따른 1실시예를 상세히 설명한다.
제1도는 본 발명에 따른 실시예장치의 개략적인 구성도로서, 입력장치(1)는 예컨대 일본문자인 가나문자를 입력할 수 있도록 된 키보우드로 이루어지는데, 상기 입력장치(1)를 조작하여 문장작성에 제공되는 독출정보가 가나문자열로서 입력된다.
그런데, 여기서 가나문자열의 정보가 입력되는 일례에 대해 설명했지만, 독출정보를 로마자로 입력해도 되고, 또 음성입력하는 것이라도 된다. 또한 상기 입력장치(1)로부터는 문장끝을 나타내는 구두점이나 괄호, 단락 및 행바꿈등과 같은 정보도 입력된다.
이와 같이 입력장치(1)로부터 입력된 독출정보(예컨대, 가나문자열)는 입력메모리(2)에 축적된 후, 이 입력메모리(2)로부터 변환제어부(3)로 독출된다. 그리고, 상기 독출정보는 기본적으로 변환제어부(3)의 제어하에 단어 또는 어절등 소정의 처리단위마다 인출되어 가나/한자변환부(4)에 의한 가나/한자변환처리로 제공된다.
여기서 상기 가나/한자변환부(4)는 단어사전메모리(5)에 미리 격납되어 있는 가나/한자변환의 사전정보를 이용해서 상기 소정처리단위로 입력된 독출정보에 대한 가나/한자변환결과를 구하게 된다.
그리고 동음이의어의 존재로 말미암은 동일한 판독에 대한 변환후보가 복수개 있는 경우 가나/한자변환부(4)는 학습사전메모리(6)에 학습등록되어 있는 각 변환후보에 대한 출현빈도정보나 앞에서 선택된 정보등을 참조해서 우선순위가 제1위인 변환후보를 그 변환결과로서 선택하게 되어 있다.
이와 같은 가나/한자변환처리에 있어서는 적당한 활용어미변화의 검정이나 부속어에 대한 검정이 이루어지는 것은 물론이고, 또한 이러한 가나/한자변환처리결과에 따라 상기 학습사전메모리(6)에 등록되어 있는 빈동정보등이 수시로 학습갱신된다.
이상과 같이 해서 순차적으로 변환처리된 가나 및 한자의 혼합변환결과는 출력메모리(7)로 출력되어 출력장치(8)에서 순차적으로 표시출력된다.
그리고 상기 변환제어부(3)는 상기 입력장치(1)로부터 문장끝정보가 입력될 경우 출력메모리(7)에 격납된 변화후보의 열(列)로 이루어진 1개의 문장정보를 구문해석하여 각 변환부 보간의 상관관계를 검토하게 된다.
그리고, 동음이의어를 갖는 변환후보(다음후보)가 다른말 사이에서 상관관계를 갖지 않게 되는 경우, 이를 부적절한 변환후보인 것으로 하여 그 변환후보순위를 내리게 되고, 그 결과 다른말과의 사이에서 상관관계를 갖게 되는 다른 변환후보가 그 독출정보에 대한 변환결과로서 재선택되어 상기 출력메모리(7)에 격납된 앞의 변환결과가 교환되게 한다.
그런데 상기 단어사전메모리(5)는 예컨대 제2도에 도시되어 있는 바와같이, 단어의 독출정보를 색인(A)으로 하고, 그 가나한자혼합표기의 변환후보(B), 품사정보(C), 분류코드(D), 결합코드(E)를 분류등록해서 구성된다. 그리고 부호 F는 그 격납어드레스정보를 나타내고 있다.
여기서 독출색인(A)에 대한 변환후보(B) 및 그 품사정보(C)는 예컨대, 종래의 일반적인 어절지정형식의 변환처리에서 사용되는 사전데이터형식과 동일한 것이다. 그리고 분류코드(D) 및 결합코드(E)는 상기한 구문검정(構文檢定)에서 사용되는 것이다.
여기서 상기 분류코드(D)는 단어의 의미적인 성질을 간단하게 할당시켜 놓은 것으로서, 예컨대, "인(人;즉, 사람)"에 관한 정보를 (a), "조직·범인"에 관한 정보를 (b), "차량"에 관한 정보를 (c), 그리고 "장소"에 관한 정보를 (d)로 하고 있다. 또한 어미 「한다」(する)를 부가함에 따라 동사화되는 サ변명사(サ變名詞)에 관해서는 (S)로 이루어진 분류코드를 부여하도록 되어있다
또한 결합코드(E)는 주로 동사(동사화된 サ변명사)에 관한 것으로서, 그 동사가 어떠한 분류코드를 갖는 명사와 어떠한 격조사(格助詞)를 수반하여 결합되는가등의 정보를 나타내고 있다. 예컨대 「發車한다」로 이루어진 동사의 경우, 그 결합코드가 「(c)가 (d)를」로서 되어 부여되므로 「"차량"이 "장소"를 출발한다」로서 결합되어 나타나는 것으로 된다.
또한 「(a)가 (a,b,d)를」로 이루어지는 결합코드는 괄호내의 요소(a)(b)(d)를 각각 결합할 수 있음을 나타내고 있다.
이어, 상기 변환제어부(3)의 상세한 동작에 대해 설명한다.
제3도는 변환제어부(3)의 동작시퀀스 일례를 나타낸 플로우챠트로서, 상기 변환제어부(3)는 상기 입력장치(1)로부터 문자정보가 입력되면(a단계), 먼저 그 입력된 문자코드를 입력메모리(2)에 스택(stack; 저장)한다(b단계).
그리고, 그 입력문자코드가 예컨대 문장의 끝남을 나타내는 구두점인지, 가나/한자변환처리의 구분단위를 나타내는 어절지정의 정보인지, 혹은 독출정보를 나타내는 가나문자코드인지를 판정한다(c단계 및 d단계).
상기 판정결과에 따라 ① 입력문자코드가 가나문자코드인 경우에는 문자입력(a단계)과 그 입력문자코드의 입력메모리(2)에 대한 스택(b단계)이 반복적으로 수행된다.
그리고 ② 입력문자코드가 구두점인 경우 및 ③ 어절지정에 관한 정보인 경우에는 상기 입력메모리(2)에 스택된 입력문자코드열에 대한 가나/한자변환처리를 실행한다(e단계).
상기 가나/한자변환처리의 실행은 상기 입력문자코드열을 가나/한자변환부(4)에 인가함으로써 실행된다.
그리고 상기 가나/한자변환부(4)가 단어사전메모리(5)를 참조하여 그 입력문자코드열(독출정보)에 대한 변환결과를 얻으면, 변화제어부(3)는 다음으로 학습사전메모리(6)에 격납된 빈도정보에 따라 그 출력의 우선순위를 결정한다(f단계).
상기 출력의 우선순위결정은 동일 독출정보에 대한 변환후보가 복수개 존재하는 경우 가나/한자변환부(4)에 지령을 주어 실행되는 것이다.
그리고, 이들 각 변환후보에 대한 과거의 출현빈도정보나 최후에 선택된 변환후보의 정보등을 기초로 출력의 우선순위가 가장 높은 변환후보를 그 독출정보(입력문자코드열)에 대한 변환결과로 선택함으로써 실행된다.
이상과 같이 해서 구해지는 변환결과가 출력메모리(7)에 전송되어 출력장치(8)에서 출력표시된다(g단계).
그리고, 변환제어부(3)는 그 처리단위(어절)에 대한 가나/한자변환처리를 종료하고, 변환결과를 출력메모리(7)에 격납시킨 후, 상기 입력메모리(2)에 격납된 입력문자코드열을 소거해서(h단계) 다음 문자코드입력에 대비한다.
이후 상기와 같이 변환처리된 입력문자코드열의 최후의 입력문자코드가 구두점인가의 여부를 확인한다(i단계).
상기 확인처리에서 ④ 입력문자코드가 상기한 어절구분을 나타내는 정보인 경우에는 상기한 처리를 다시 한번 반복한다.
따라서, 어절단위로 입력되는 문자코드열을 그때마다 가나/한자변환처리되는 것으로 된다.
또한 ⑤ 그 최후의 입력문자코드가 구두점인 경우에는 다음에 나타낸 처리를 실행한다. 또 상기 최후에 입력된 문자코드가 구두점인가의 여부의 확인처리는, 예컨대 상기한 처리단계(c)에서 입력문자코드가 구두점인 것으로 판정될 때 플래그를 일으키고, 이 플래그를 참조하여 동일하게 실행되어진다. 그리하여 최후에 입력된 문자코드가 구두점이고, 지금까지 입력된 문자코드열에 대한 문의 구분이 도시될 때, 상기 출력메모리(7)에는 각 어절의 변환결과에 따라 표시되는 1개의 문장정보가 얻어질 수 있게 된다. 여기서 변환제어부(3)는 상기 출력메모리(7)에 순차적으로 격납된 각 어절의 변환결과의 정보를 독출해서 각 문두를 검색한다(j단계).
그리고, 상기 문두로부터 순서적으로 각 변환결과에 각각 부수되는 상기 분류코드(D)와 결합코드(E)를 구해서 그 구문을 해석한다(k단계).
상기 구문해석은 각 변환결과의 결합코드(E)에 따른 다른 말의 분류코드(D)를 참조하여 그 결합조건을 만족하고 있는가의 여부를 검토함으로써 행해진다.
상기 구문해석에 의해 출력메모리(7)에서 얻어진 변환결과가 다른 변환결과와의 사이에서 소정의 상관관계를 만족하는가의 여부를 판정하게 된다.
그리고, 상관의 결합성이 없는 변환후보가 색인된 경우에는 그 변환후보가 변환결과로서 부적절한 것이라고 판정하여 그 출력우선순위가 낮아지게 된다. 상기 출력우선순위의 변경에 의해 동음이의어의 관계에 있어 다른 변환후보가 최우선순위의 변환후보로서 구해지기 때문에 상기 변환후보에 대해서도 마찬가지로 그 상관관계의 결합성을 검토한다.
이상과 같은 처리에 의해 복수개의 동음이의어중 다른말과의 사이에서 상관관계를 만족하는 것이 선택된다(1단계).
상기 상관관계를 만족하는 변환후보가 복수개 존재하는 경우에는 그 중에서 최고우선순위가 높은것이 선택되는 것은 물론이다.
따라서, 상관관계를 만족하지 않는 변환결과 대신 새롭게 구해지는 변환후보는 출력메모리(7)에 전송된 해당 변환결과와 서로 교체된다. 그 결과 상관관계에 대한 결합성을 만족하는 변환결과만으로 이루어지는 문자정보가 출력메모리(7)에서 얻어질 수 있게 된다.
이서 상기 문자정보가 출력장치(8)에 표시된다(m단계).
이상과 같이해서 출력표시된 문장정보에 대해 필요하다면, 변환후보에 대한 다음 후보선택처리가 종래장치와 마찬가지로 실행된다. 상기한 상관의 결합성 처리에 의해 상관의 부적절한 변환후보가 정정되어지므로 대부분의 경우 적절한 변환처리결과를 얻을 수 있게 된다.
제4도 내지 제6도는 본 장치에 따른 문장작성처리의 구체적인 실시예를 나타낸 것으로, 지금 입력장치(1)로부터 「기샤(きしゃ)가」로 이루어진 독출정보를 입력하고, 이어 어절변환을 지시하면, 상기 독출정보는 가나/한자변환부(4)에서 인가되어 가나/한자변환이 된다.
이러한 경우 제2도에 나타낸 바와 같이 「기샤(きしゃ)가」로 이루어진 독출에 대한 변환후보가 「기샤(貴社), 기샤(記者), 기샤(歸社), 기샤(汽車)」등과 같이 4가지가 존재하므로 그 빈도정도가 참조된다.
그리고 단어사전메모리(5)에는 예컨대 빈도치가 높은 것으로부터 순서적으로 그 변환후보가 교체되어 격납되어 있는 것으로 하면, 이러한 경우에는 「貴社」로 이루어진 표기가 그 변환결과로서 구해진다.
상기 변환처리정보는 출력메모리(7)에 격납되어 출력장치(8)에서 제4도(a)에 나타낸 바와같이 「貴社가」로서 표시된다.
그후 「도오쿄오를(とうきょうを)」로 이루어지는 독출정보를 입력해서 어절변화를 지시하면, 이 경우에는 동음이의어가 존재하지 않으므로 그 변환결과가 직접적으로 「東京」으로서 구해진다. 상기 변환결과를 출력메모리(7)에 먼저 격납된 정보로 인가되어 해당 출력메모리(7)에 격납된다.
이 결과 출력표시장치(80에는 제4도(b)에 나타낸 바와같이 「귀사가 동경을(貴社が東京を)」로 이루어지는 표시가 얻어질 수 있게 된다. 계속해서 「방문한다(ほうもんした)」로 이루이진 독출정보를 입력하고 문장끝을 나타내는 「구두점 ; ·」을 입력하면, 「방문(ほうもん)」으로 이루어지는 독출에 대한 변환결과가 「방문訪問」으로 구해지는 동시에 상기 문장끝 정보입력을 트리거로 하여 문장의 구문해석이 실행된다.
상기 구문해석은 출력메모리(7)에 격납된 어절단위의 변환후보전체를 변환제어부(3)로 독출하고, 각 변환후보의 동음이의어를 구함과 더불어 그들 변환후보의 분류코드(D)와 결합코드(E)에 따라 그들 사이에서 상관결합관계를 검토함에 따라 행해진다.
본 실시예의 경우에는 출력메모리(7)로부터 독출된 정보에 따라 예컨대, 제5도에 나타낸 바와같이 변환후보의 정보를 얻는다. 그리고 제5도에 있어서 「#」와 「*」사이에 표시되는 변환후보는 서로 동음이의어의 관계에 있는것을 나타내고 있다.
따라서 복수의 동음이의어 관계에 있는 변환후보와, 이것에 해당조사(助詞)를 통해 결합되는 다른 변환후보간의 관계를 제6도에 나타낸 바와같이 된다.
여기서 그 분류코드(D)와 결합코드(E)에 따라 그 상관관계의 성립성을 검토하면, 「訪問」으로 이루어진 변환후보의 결합코드로부터 「訪問한다」로 이루어지는 말이 「(a)가 (a,b,d)를 訪問한다」로 이루어져 상관관계가 취득되지 않음을 알 수 있다.
그 결과
「(a)가 東京을 訪問한다」
로 이루어진 상관관계가 성립하는 것이 해석되고, 다시 「貴社」의 분류코드(D)가 (b)이므로,
「貴社가 東京을 訪問한다」
로 이루어진 상관결합이 성립되지 않음을 알 수 있다. 그러나, 상기 경우에는 분류코드(D)가 (a)인 「記者」로 이루어지는 후보만이 수식관계를 만족함이 색인되어
「記者가 東京을 訪問한다」
로 이루어진 구문해석 결과가 얻어지게 된다.
이상과 같은 구문해석 처리에 의해 먼저 구해진 변환후보「貴社」의 출력우선순위가 내려가고, 이에 따라 교체되어 「記者」로 이루어진 변환후보에 의해, 변환결과가 제4도(c)에 나타낸 바와 같이 수정된다.
이상과 같이해서 문장끝 정보입력으로서 그 변환처리된 문장의 구문이 해석되고, 소정의 상관관계를 만족하는 변환후보가 선택되게 된다.
따라서 본 발명에 따른 장치에 의하면, 동음이의어가 존재하는 변환후보는 그 출현빈도 정보등에 따라 선택되면서 다른말과의 상관관계에 따라 선택수정되기 때문에 적절한 변환결과를 효율좋게 얻을 수 있게 된다.
따라서 사용자에 의한 동음이의어의 선택조작회수를 대폭적으로 줄일 수가 있기 때문에 문장작성의 효율향상을 도모할 수 있게 된다.
더욱이 입력된 독출정보에 대한 변환결과가 응답성이 좋게 얻어지고 하나의 문장입력이 종료한 시점에서 상관관계에 있지 않은 변환후보가 수정되기 때문에 문장작성 작업이 용이하게 되는 등의 효과를 얻을 수 있게 된다.
또한, 본 발명은 상기한 실시예에 한정되는 것이 아닌 바, 상기 실시예에서는 어절단위로 가나/한자변환처리를 수행했지만, 2어절이나 3어절등의 연속되는 처리단위마다 가나/한자변환처리를 실행해도 된다. 또한 전체입력된 정보를 내부적으로 띄어쓰기 처리하고, 이것을 순차적으로 가나/한자변환처리를 실행해도 된다.
또한, 독출정보의 입력형태로 상기한 바와 같이 가나문자의 입력에 한정되지 않는 것은 물론이고, 본 발명은 그 요지를 벗어나지 않는 범위내에서 여러가지로 다양하게 변형해서 실시할 수 있다.
[발명의 효과]
상기한 바와같이 본 발명에 의하면, 출현빈도나 정보나 앞의 선택정보등에 따라 입력독출정보가 소정의 변환처리단위마다 순차적으로 가나/한자변환되어 출력표시되기 때문에 그 변환결과의 응답시간이 지연을 초래하지 않게 되고, 또 장치내의 처리데이터영역의 증대를 초래하지 않게 된다.
또한, 문장끝정보가 입력되는 시점에서 그때까지 변환처리된 문장의 구문을 해석하고, 상기 해석결과에 따라 다른말 사이에서 상관관계에 있지 않은 동음이의어의 변환후보순위를 내리기 때문에 본래의 뜻과 다른 동음이의어의 변환출력이 효과적으로 저지된다. 이 결과 동음이의어의 선택조작이 필요회수를 대폭적으로 감소시킬 수 있고, 그 조작성(문장 작성성)의 향상을 도모할 수 있게 된다.
Claims (8)
- 문장의 독출정보를 입력받아 가나 및 한자가 혼합된 문장정보로 변환시키는 문장작성장치에 있어서, 문장에 대한 독출정보와 문장끝을 나타내는 문장끝정보를 입력하는 입력장치(1)와, 이 입력장치(1)로부터 독출된 정보를 저장하는 입력메모리(2), 이 입력메모리(2)로부터 독출된 정보를 단어 또는 어절의 소정처리단위로 인출하여 제어함과 더불어 문장끝정보가 입력될 경우, 변환후보열로 이루어진 1개의 문장정보를 구문해석함으로써 각 변환후보간의 상관관계를 검토하는 변환제어부(3), 이 변환제어부(3)의 제어하에 단어사전메모리(5)에 미리 격납되어 있는 가나/한자변환의 사전정보를 이용해서 상기 소정처리단위로 입력된 독출정보에 대한 가나/한자변환결과를 구함과 더불어 동음이의어의 존재에 의해 동일한 판독에 대한 변환후보가 복수개 있는 경우 학습사전메모리(6)에 학습등록되어 있는 각 변환후보에 대한 출현빈도정보나 앞에서 선택된 정보를 참조해서 우선순위가 제1위인 변환후보를 그 변환결과로서 선택하는 가나/한자변환부(4), 순차적으로 변환처리된 가나 및 한자의 혼합변환결과를 인가받아 격납하는 출력메모리(7) 및, 입력된 문장의 독출정보에 대한 변환결과의 후보로서 우선순위가 제1위인 하나의 변환가능성을 순차적으로 표시하는 출력장치(8)로 구성된 것을 특징으로 하는 문장작성장치.
- 제1항에 있어서, 상기 변환제어부(3)는 입력된 문장의 독출정보에 따라 상기 입력메모리(2)를 검색함으로써 단어나 어절단위로 입력정보를 분할함과 더불어 입력된 가나문자열에 대한 정보를 한자를 포함하는 문자열로 변환시킬 수 있도록 된 것을 특징으로 하는 문장작성장치.
- 제1항에 있어서, 상기 입력장치(1)는 문장끝을 나타내는 정보로서 구두점이나 괄호를 상기 변환제어부(3)에 인가할 수 있도록 된 것을 특징으로 하는 문장작성장치.
- 제1항에 있어서, 상기 입력장치(1)는 문장의 독출정보로서 로마문자열을 상기 변환제어부(3)에 인가할 수 있도록 된 것을 특징으로 하는 문장작성장치.
- 제1항에 있어서, 상기 입력장치(1)는 문장의 독출정보로서 가나문자열을 상기 변환제어부(3)에 인가할 수 있도록 된 것을 특징으로 하는 문장작성장치.
- 제1항에 있어서, 상기 입력장치(1)는 문장의 독출정보로서 음성을 상기 변환제어부(3)에 인가할 수 있도록 된 것을 특징으로 하는 문장작성장치.
- 제1항에 있어서, 상기 입력장치(1)가 키보드로 구성된 것을 특징으로 하는 문장작성장치.
- 제1항에 있어서, 상기 변환제어부(3)는 동음이의어에 대한 변환결과로서 최후에 선택된 단어에 대응하는 변환가능성에다 제1우선순위를 부여하도록 된 것을 특징으로 하는 문장작성장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60170028A JPS6231467A (ja) | 1985-08-01 | 1985-08-01 | 文章作成装置 |
JP85-170028 | 1985-08-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR870002521A KR870002521A (ko) | 1987-03-31 |
KR900005899B1 true KR900005899B1 (ko) | 1990-08-13 |
Family
ID=15897261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019860003287A KR900005899B1 (ko) | 1985-08-01 | 1986-04-28 | 문장작성장치 |
Country Status (4)
Country | Link |
---|---|
US (1) | US4777600A (ko) |
JP (1) | JPS6231467A (ko) |
KR (1) | KR900005899B1 (ko) |
CN (1) | CN1008016B (ko) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5201042A (en) * | 1986-04-30 | 1993-04-06 | Hewlett-Packard Company | Software process and tools for development of local language translations of text portions of computer source code |
US5551049A (en) * | 1987-05-26 | 1996-08-27 | Xerox Corporation | Thesaurus with compactly stored word groups |
JPS6470865A (en) * | 1987-09-11 | 1989-03-16 | Brother Ind Ltd | Language processor based upon voice input |
JPH0731677B2 (ja) * | 1987-09-29 | 1995-04-10 | シャープ株式会社 | 文書作成・校正支援装置 |
JPH0336662A (ja) * | 1989-07-03 | 1991-02-18 | Ricoh Co Ltd | 自然言語処理方式 |
JP2527817B2 (ja) * | 1989-07-14 | 1996-08-28 | シャープ株式会社 | 主題連想装置および単語連想装置 |
JP2836159B2 (ja) * | 1990-01-30 | 1998-12-14 | 株式会社日立製作所 | 同時通訳向き音声認識システムおよびその音声認識方法 |
US5255355A (en) * | 1990-10-10 | 1993-10-19 | Fuji Xerox Co., Ltd. | Document processor |
JPH0594436A (ja) * | 1990-10-10 | 1993-04-16 | Fuji Xerox Co Ltd | 文書処理装置 |
US5488719A (en) * | 1991-12-30 | 1996-01-30 | Xerox Corporation | System for categorizing character strings using acceptability and category information contained in ending substrings |
US5309566A (en) * | 1992-02-04 | 1994-05-03 | International Business Machines Corporation | System and method for character translation |
KR100291372B1 (ko) * | 1992-05-29 | 2001-06-01 | 이데이 노부유끼 | 전자 사전 장치 |
US5448474A (en) * | 1993-03-03 | 1995-09-05 | International Business Machines Corporation | Method for isolation of Chinese words from connected Chinese text |
JPH07114558A (ja) * | 1993-10-19 | 1995-05-02 | Fujitsu Ltd | 漢字変換訂正処理方式 |
US5619563A (en) * | 1994-12-19 | 1997-04-08 | Lucent Technologies Inc. | Mnemonic number dialing plan |
JP2817776B2 (ja) * | 1995-05-25 | 1998-10-30 | 日本電気株式会社 | 単語変換装置 |
US5893133A (en) * | 1995-08-16 | 1999-04-06 | International Business Machines Corporation | Keyboard for a system and method for processing Chinese language text |
US7590224B1 (en) * | 1995-09-15 | 2009-09-15 | At&T Intellectual Property, Ii, L.P. | Automated task classification system |
US5675707A (en) * | 1995-09-15 | 1997-10-07 | At&T | Automated call router system and method |
US5764851A (en) * | 1996-07-24 | 1998-06-09 | Industrial Technology Research Institute | Fast speech recognition method for mandarin words |
US6094634A (en) * | 1997-03-26 | 2000-07-25 | Fujitsu Limited | Data compressing apparatus, data decompressing apparatus, data compressing method, data decompressing method, and program recording medium |
US5999950A (en) * | 1997-08-11 | 1999-12-07 | Webtv Networks, Inc. | Japanese text input method using a keyboard with only base kana characters |
US6064957A (en) * | 1997-08-15 | 2000-05-16 | General Electric Company | Improving speech recognition through text-based linguistic post-processing |
JPH1186434A (ja) * | 1997-09-11 | 1999-03-30 | Sony Corp | 記録装置、記録方法、及びダビング装置 |
US6490563B2 (en) | 1998-08-17 | 2002-12-03 | Microsoft Corporation | Proofreading with text to speech feedback |
JP2000298667A (ja) * | 1999-04-15 | 2000-10-24 | Matsushita Electric Ind Co Ltd | 構文情報による漢字変換装置 |
JP2001043221A (ja) * | 1999-07-29 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 中国語単語分割装置 |
US7085720B1 (en) | 1999-11-05 | 2006-08-01 | At & T Corp. | Method for task classification using morphemes |
US7286984B1 (en) | 1999-11-05 | 2007-10-23 | At&T Corp. | Method and system for automatically detecting morphemes in a task classification system using lattices |
US6681206B1 (en) | 1999-11-05 | 2004-01-20 | At&T Corporation | Method for generating morphemes |
US8392188B1 (en) | 1999-11-05 | 2013-03-05 | At&T Intellectual Property Ii, L.P. | Method and system for building a phonotactic model for domain independent speech recognition |
US20030182113A1 (en) * | 1999-11-22 | 2003-09-25 | Xuedong Huang | Distributed speech recognition for mobile communication devices |
JP2001331272A (ja) * | 2000-05-24 | 2001-11-30 | Alps Electric Co Ltd | 文字入力装置 |
US6941266B1 (en) | 2000-11-15 | 2005-09-06 | At&T Corp. | Method and system for predicting problematic dialog situations in a task classification system |
US6751591B1 (en) | 2001-01-22 | 2004-06-15 | At&T Corp. | Method and system for predicting understanding errors in a task classification system |
US20030023426A1 (en) * | 2001-06-22 | 2003-01-30 | Zi Technology Corporation Ltd. | Japanese language entry mechanism for small keypads |
US7136803B2 (en) * | 2001-09-25 | 2006-11-14 | Apple Computer, Inc. | Japanese virtual dictionary |
US7315982B2 (en) * | 2003-02-26 | 2008-01-01 | Xerox Corporation | User-tailorable romanized Chinese text input systems and methods |
US7299181B2 (en) * | 2004-06-30 | 2007-11-20 | Microsoft Corporation | Homonym processing in the context of voice-activated command systems |
US8374862B2 (en) * | 2006-08-30 | 2013-02-12 | Research In Motion Limited | Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance |
US8175248B2 (en) | 2007-01-29 | 2012-05-08 | Nuance Communications, Inc. | Method and an apparatus to disambiguate requests |
CN102262524A (zh) * | 2010-05-27 | 2011-11-30 | 鼎亿数码科技(上海)有限公司 | 基于无线输入设备的声音识别输入方法及实现装置 |
US9465517B2 (en) | 2011-05-24 | 2016-10-11 | Mitsubishi Electric Corporation | Character input device and car navigation device equipped with character input device |
CN103365427B (zh) | 2012-03-31 | 2017-12-29 | 联想(北京)有限公司 | 一种对输入内容进行调整的方法及电子设备 |
US8977555B2 (en) | 2012-12-20 | 2015-03-10 | Amazon Technologies, Inc. | Identification of utterance subjects |
CN103943109A (zh) * | 2014-04-28 | 2014-07-23 | 深圳如果技术有限公司 | 一种将语音转换为文字的方法及装置 |
JP6070809B1 (ja) * | 2015-12-03 | 2017-02-01 | 国立大学法人静岡大学 | 自然言語処理装置及び自然言語処理方法 |
CN105913682B (zh) * | 2016-06-27 | 2018-08-21 | 重庆交通大学 | 基于rfid技术的智能反向寻车方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5924452B2 (ja) * | 1980-09-22 | 1984-06-09 | 株式会社日立製作所 | 日本文入力装置 |
JPS57201926A (en) * | 1981-06-05 | 1982-12-10 | Hitachi Ltd | "kanji" selecting method for "kanji" input device |
JPS5840684A (ja) * | 1981-09-04 | 1983-03-09 | Hitachi Ltd | 自然言語間の自動翻訳方式 |
JPS5979339A (ja) * | 1982-10-29 | 1984-05-08 | Toshiba Corp | 仮名・漢字変換方式 |
US4544276A (en) * | 1983-03-21 | 1985-10-01 | Cornell Research Foundation, Inc. | Method and apparatus for typing Japanese text using multiple systems |
JPS603017A (ja) * | 1983-06-17 | 1985-01-09 | Ricoh Co Ltd | カナ漢字変換処理装置 |
JPS60124774A (ja) * | 1983-12-09 | 1985-07-03 | Ricoh Co Ltd | 同音語判別装置 |
-
1985
- 1985-08-01 JP JP60170028A patent/JPS6231467A/ja active Granted
-
1986
- 1986-04-28 KR KR1019860003287A patent/KR900005899B1/ko not_active IP Right Cessation
- 1986-07-28 US US06/889,761 patent/US4777600A/en not_active Expired - Fee Related
- 1986-07-31 CN CN86105459A patent/CN1008016B/zh not_active Expired
Also Published As
Publication number | Publication date |
---|---|
JPS6231467A (ja) | 1987-02-10 |
US4777600A (en) | 1988-10-11 |
KR870002521A (ko) | 1987-03-31 |
CN86105459A (zh) | 1987-06-17 |
JPH0433069B2 (ko) | 1992-06-02 |
CN1008016B (zh) | 1990-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR900005899B1 (ko) | 문장작성장치 | |
KR900000094B1 (ko) | 기계번역장치 | |
JP2002215617A (ja) | 品詞タグ付けをする方法 | |
JP2011254553A (ja) | 小型キーパッド用日本語入力メカニズム | |
KR20040101678A (ko) | 복합 형태소 분석 장치 및 방법 | |
EP0357344A2 (en) | Computer assisted language translating machine | |
JPH0576067B2 (ko) | ||
JPS61278970A (ja) | 自然言語処理装置における構文解析結果の表示及び校正のための制御方法 | |
JPH0561902A (ja) | 機械翻訳システム | |
KR20110072496A (ko) | 특정기능어를 이용한 전자사전 검색 장치 및 검색 방법 | |
JPH03222069A (ja) | 機械翻訳装置 | |
JPH01126767A (ja) | 辞書参照装置 | |
JPH08272780A (ja) | 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法 | |
JPH0785040A (ja) | 表記不統一検出方法およびかな漢字変換方法 | |
JPH0821031B2 (ja) | 言語解析装置 | |
JPH0736885A (ja) | 文書作成装置の文字情報変換制御方法及び同装置 | |
JPH0567076A (ja) | かな漢字変換装置 | |
JPH0414168A (ja) | 文書作成装置 | |
JPH086950A (ja) | キーワード翻訳機能付き機械翻訳装置 | |
JPH08241315A (ja) | 文書処理装置の単語登録機構 | |
JPH07230461A (ja) | 構文解析装置及び機械翻訳装置 | |
JPH04205645A (ja) | かな漢字変換装置及びかな漢字変換方法 | |
JPH0736908A (ja) | 英日機械翻訳装置 | |
JPS63136264A (ja) | 機械翻訳装置 | |
Alhonen | Automatic Morphological Parsing of Chinese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
G160 | Decision to publish patent application | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 19960812 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |