KR20040007932A - 언어번역시스템 및 언어번역처리방법 - Google Patents

언어번역시스템 및 언어번역처리방법 Download PDF

Info

Publication number
KR20040007932A
KR20040007932A KR1020020040568A KR20020040568A KR20040007932A KR 20040007932 A KR20040007932 A KR 20040007932A KR 1020020040568 A KR1020020040568 A KR 1020020040568A KR 20020040568 A KR20020040568 A KR 20020040568A KR 20040007932 A KR20040007932 A KR 20040007932A
Authority
KR
South Korea
Prior art keywords
web
cache
language
user
web content
Prior art date
Application number
KR1020020040568A
Other languages
English (en)
Inventor
박기현
Original Assignee
주식회사 네오소프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 네오소프트 filed Critical 주식회사 네오소프트
Priority to KR1020020040568A priority Critical patent/KR20040007932A/ko
Publication of KR20040007932A publication Critical patent/KR20040007932A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은, 실시간 웹표시언어변환서버를 통해 특정 웹표시언어로 작성되어 있는 웹컨텐츠를 상이한 웹표시언어를 지원하는 모바일 단말기에서 실시간 웹표시언어변환기능에 의해 해당 컨텐츠의 이용이 가능하도록 하는 시스템 상에서, 모바일 단말기가 접속한 웹페이지가 해당 단말기에서 표시할 수 없는 타국어로 작성된 경우에 웹표시언어변환서버가 해당 단말기의 브라우저가 사용하고 있는 웹표시언어로 변환을 행하는 것과 함께 웹표시언어 변환서버와 연결되어 있는 언어번역서버로부터 사용자의 단말기가 표시할 수 있는 해당 국가의 언어로 번역한 결과를 전송받아 클라이언트 모바일 단말기로 전송해 주는 언어번역시스템 및 언어번역처리방법에 관한 것이다.
또한, 본 발명은, 프록시서버로서 동작되는 웹표시언어변환서버상에서 컨텐츠의 전송효율을 높이기 위해 내장되어 있는 캐쉬가 동작되는 방법에 관한 것으로 캐쉬에 저장되어 있는 컨텐츠가 상이한 웹표시언어로 변환되어 있는지 아닌지에 따라서 사용자 모바일 단말기에 전송되는 절차를 달리하는 언어번역처리방법에 관한 것이다.

Description

언어번역시스템 및 언어번역처리방법{A LANGUAGE TRANSLATING SYSTEM AND A PROCESSING METHOD OF THE SAME}
본 발명은 cHTML, WML, HTML등의 다양한 웹표시언어로 작성되어 있고, 특정국가의 언어로 표현되어 있는 웹컨텐츠를 사용자가 자신의 모바일단말기를 사용하여 검색하고자 할 때, 사용자의 모바일 단말기에서 사용하고 있는 웹표시언어로 변환한 후, 사용자의 단말기가 표시할 수 있는 국가의 언어(일어, 영어, 한국어등)로 변환하여 검색할 수 있도록 하는 솔루션을 제공하는 언어번역시스템 및 언어번역처리방법에 관한 것이다.
현재 사용되고 있는 모바일 단말기는 웹브라우저를 탑재하여 사용자가 인터넷에 접속함으로써 다양한 컨텐츠를 검색하여 이용할 수 있도록 하고 있으나, 각 모바일 단말기의 웹브라우저에서 컨텐츠를 표시하는 방식은 서비스 사업자별로 다른 웹표시언어(또는, 마크업 언어(Mark-Up Language)라 함)를 사용하여 각 단말기에서의 표시방식을 달리하고 있으므로, 종래의 웹표시언어변환시스템은 사용자가자신의 모바일 단말기로 웹컨텐츠를 검색할 수 있도록 웹컨텐츠를 사용자의 모바일 단말기에서 사용되고 있는 웹표시언어로 변환하여 사용자의 단말기에 전송하고 있다.
이하, 종래의 모바일 단말기의 웹표시언어변환시스템에 대해 설명한다.
도 1a 및 도 1b는 종래의 모바일 단말기의 웹표시언어변환시스템에 관한 도면이다. 도 1a와 도 1b에서, 웹표시언어인 마크업언어는 cHTML, WML, HDML, MML, mHTML, xHTML등 여러 가지가 있으나, 도시의 편의상 이중 cHTML과 WML을 예시로 하였으며, 컨텐츠가 표시된 국가의 언어는 A국과 B국의 두 개국의 언어로만 예시하였다.
도 1a에서와 같이, A국가언어를 표시할 수 있는 사용자의 모바일 단말기는 cHTML 브라우저를 탑재함으로써, 상기 단말기가 지원하는 웹표시언어는 cHTML이며, B국가언어를 표시할 수 있는 사용자의 모바일 단말기가 지원하는 웹표시언어는 WML인 것을 예로 들었다.
도 1a의 사용자가 A국가언어를 표시할 수 있는 모바일 단말기를 사용하여, 특정의 웹페이지를 검색하고자 하여 프락시서버(Proxy Server)인 웹표시언어변환서버에 접속하면, 웹표시언어변환서버는 상기 모바일 단말기로부터 전송된 데이터헤더를 분석한 후, 해당 웹서버를 검색하여 상기 웹서버상의 컨텐츠를 사용자의 모바일 단말기가 지원하는 웹표시언어로 변환하여, 즉 도 1a에서는 A국가 언어로 작성된 WML 컨텐츠를 A국가 언어로 작성된 cHTML의 웹표시언어로 변환하여 사용자에게전송한다.
마찬가지로, 상기의 과정을 거쳐 웹표시언어변환서버는, 도 1a의 B국가언어를 표시할 수 있는 단말기를 사용하는 사용자에게 A국가 언어로 작성된 WML문서를 전송한다.
도 1b에서도 상기 도 1a과 마찬가지로 구성 및 작동되나, 도 1b는 도 1a와 달리, 웹서버의 컨텐츠가 B국가의 언어로 작성된 cHTML형식이며, 수행되는 절차는 상기 도 1a와 동일하다. 즉, 웹표시언어변환서버는 A국가언어를 표시할 수 있는 cHTML형식의 모바일 단말기 사용자에게는, B국가의 언어로 작성된 cHTML형식의 컨텐츠를 제공하고, B국가언어를 표시할 수 있는 WML형식의 모바일 단말기 사용자에게는, B국가의 언어로 작성된 WML형식의 컨텐츠를 제공한다.
상기와 같이, 종래의 웹표시언어변환서버의 경우에는, 사용자의 모바일 단말기가 지원하는 웹표시언어로 웹서버의 컨텐츠를 변환하여 사용자가 검색하고자 하는 웹컨텐츠를 제공하고 있지만, 상기의 웹컨텐츠가 다국어로 표현되어 있지 않거나, 웹컨텐츠가 표현된 국가언어중에 사용자의 단말기가 표시할 수 있는 국가의 언어가 없는 경우에는, 상기 컨텐츠가 작성된 국가의 언어가 그대로 사용자 단말기에 전송되어 그 내용을 표시할 수 없어 사용자로 하여금 그 내용을 파악하기 어렵게 하고 있다.
즉, 도 1a에서 B국가언어를 표시할 수 있는 단말기를 사용하는 사용자에게도 웹컨텐츠가 작성된 국가언어인 A국가의 언어를, 도 1b의 A국가언어를 표시할 수 있는 단말기를 사용하는 사용자에게는 웹컨텐츠가 작성된 B국가의 언어를 그대로 전송하여, 해당 국가의 사용자가 상기 컨텐츠의 내용을 알아볼 수 없도록 하는 문제점을 가지고 있었다.
이와 같이, 인터넷을 통하여, 웹페이지상의 컨텐츠는 국가간의 경계없이 세계 모든 사람에게 제공되고 있으며, 또한, 이를 목적으로 하는 것이지만, 흔히 웹컨텐츠는 상기 컨텐츠를 운영하는 주체가 사용하고 있는 국가의 언어만으로 작성되어 있거나, 상기 컨텐츠를 특정국가의 언어들로 작성하여 제공하고 있으므로, 컨텐츠를 표현하고 있는 언어 이외의 언어를 표시할 수 있는 사용자의 단말기로는 상기 컨텐츠의 내용을 알아볼 수 없는 단점이 있으며, 이러한 문제점을 개선하기 위해 해당 컨텐츠를 각 국가별 언어로 작성한다는 것은 제작면에서와 컨텐츠의 운영면에서 상당한 비용을 증가시킨다는 문제점을 가지고 있다.
또한, 종래의 웹표시언어변환서버는 메모리상의 캐쉬만을 구비하고 있어, 모바일 단말기의 사용자가 전에 사용한 컨텐츠를 재검색하고자 할 때, 해당 컨텐츠가 상기 캐쉬메모리상에 없으면 다시 모든 컨텐츠를 사용자가 사용하는 모바일 단말기의 웹표시언어로 변환한 후, 사용자의 단말기가 표시할 수 있는 해당 국가의 언어로 변환하여 사용자의 단말기에 전송하여야 하기 때문에 시간과 비용측면에서 사용자에게 많은 불편을 초래하고 있었다.
본 발명은, 상기의 종래 웹표시언어변환서버의 단점을 개선하여, 사용자의 단말기가 표시할 수 있는 국가의 언어로 웹서버의 컨텐츠를 변환하여 사용자 단말기에 전송함으로써, 사용자에게 편리함을 제공함과 동시에 웹서버의 운영주체가 필요이상의 국가언어로 웹컨텐츠를 작성해야 하는 불편을 제거함에 그 목적이 있다.
또한, 본 발명은, 사용자가 일단 전에 검색한 웹컨텐츠를 재검색하고자 할 때, 필요없는 절차를 간소화하여 빠르게 웹컨텐츠를 전송받을 수 있도록 함에 그 목적이 있다.
도 1은 종래의 모바일 단말기의 웹표시언어변환시스템을 나타낸 도면이다.
도 2는 본 발명의 언어번역시스템과 사용자 단말기 및 웹서버와의 관계를 나타낸 도면이다.
도 3은 도 2에 나타난 프록시서버의 구체적인 구성을 나타낸다.
도 4는 언어번역처리방법의 구체적인 플로우를 나타내는 플로우챠트이다.
도 5는 본 발명의 일실시예에 의한 웹컨텐츠, 메모리상의 문자열의 저장영역 및 임시변수의 구성을 나타낸 도면이다.
도 6은 본 발명의 일실시예에 의한 언어변환결과를 나타내는 도면이다.
도 7은 본 발명의 더욱 바람직한 실시예인 4중 캐쉬방법을 나타낸 플로우차트이다.
<도면의 주요부분에 부호의 설명>
310 : 사용자의 모바일 단말기 320 : 프록시서버
330 : 웹서버340 : 언어변환서버
321 : 데이터분석부322 : 캐쉬 데이터관리부
323 : 파싱부324 : 웹표시언어의 변환부
325 : 문자열추출부326 : 언어번역서버 접속부
327 : 번역결과 재구성부328 : 전송부
329 : 메모리부 및 캐쉬부
본 발명의 언어번역시스템 및 언어번역처리방법은,
실시간 웹표시언어변환서버의 언어변환기능에 의해 특정 웹표시언어로 작성되어 있는 웹컨텐츠를 상이한 웹표시언어를 지원하는 모바일 단말기에 해당 컨텐츠를 실시간 이용이 가능하도록 하는 시스템에 있어서,
사용자의 모바일 단말기와 웹컨텐츠를 탑재한 웹서버사이에서 중계역할을 하며, 언어번역서버와 인터페이스에 의해 접속된 프록시서버로 구성된 언어번역시스템으로서,
상기 프록시서버는 :
상기 사용자의 모바일 단말기로부터 전송된 데이터를 분석하는 데이터분석부와;
상기 사용자로부터 검색요구된 웹컨텐츠가 캐쉬에 저장되어 있는지를 검색하여, 캐쉬에 저장되어 있는 경우에는 상기 컨텐츠를 사용자에게 전송하고, 캐쉬에 저장되어 있지 않은 경우에는 웹컨텐츠의 검색을 행하는 캐쉬데이터관리부와;
상기 웹검색에 의해 검색된 웹컨텐츠를 파싱하는 웹표시언어의 파싱부와;
상기 파싱부의 파싱결과를 이용하여, 사용자의 모바일 단말기가 지원하는 웹표시언어로 변환하는 웹표시언어 변환부와;
상기 파싱부의 파싱결과를 이용하여, 문자열을 추출하여 임시변수를 생성하는 문자열 추출부와;
상기 임시변수를 언어번역서버에 전송하는 언어번역서버 접속부와;
상기 언어번역서버로부터 문자열이 번역된 임시변수를 전송받아, 상기 검색된 웹컨텐츠를 재구성하는 번역결과 재구성부와;
상기 재구성된 웹컨텐츠를 사용자 모바일 단말기에 전송하는 전송부와;
상기 문자열과 상기 문자열의 위치정보를 저장하는 메모리부 및;
상기 검색된 웹컨텐츠를 일시저장하는 캐쉬부로 구성된 것을 특징으로 한다.
또한, 본 발명은 상기 문자열 추출부에 있어서, 언어번역서버에 전송되는 임시변수는 개행문자와 문자열만으로 구성된 스트링형태의 임시변수인 것을 특징으로한다.
또한, 본 발명은 상기 캐쉬가 웹컨텐츠와 다른 웹표시언어로 변환된 웹컨텐츠를 저장하는 메모리영역의 1차 캐쉬와 디스크영역의 2차 캐쉬 및, 웹컨텐츠 자체의 웹표시언어로 작성된 기본 웹컨텐츠를 저장하는 메모리영역의 3차 캐쉬와 디스크영역의 4차 캐쉬인 4중 캐쉬로 이루어진 것을 특징으로 한다.
또한, 본 발명은, 상기 언어번역서버가 상기 프록시서버와 일체로 구성된 것을 특징으로 한다.
본 발명의 언어번역처리방법은,
실시간 웹표시언어변환서버의 언어변환기능에 의해 특정 웹표시언어로 작성되어 있는 웹컨텐츠를 상이한 웹표시언어를 지원하는 모바일 단말기에 해당 컨텐츠를 실시간 이용이 가능하도록 하는 시스템에 있어서,
사용자의 모바일 단말기와 웹컨텐츠를 탑재한 웹서버사이에서 중계역할을 하여, 언어번역서버와 인터페이스에 의해 접속되어 사용자의 모바일 단말기에서 표시가능한 국가의 언어로 번역된 웹컨텐츠를 전송하는 언어번역처리방법으로서,
상기 사용자의 모바일 단말기로부터 전송된 데이터를 분석하는 단계와;
상기 사용자로부터 검색요구된 웹컨텐츠가 캐쉬에 저장되어 있는지를 검색하여, 캐쉬에 저장되어 있는 경우에는 상기 컨텐츠를 사용자에게 전송하고, 캐쉬에저장되어 있지 않은 경우에는 웹컨텐츠의 검색을 행하는 단계와;
상기 웹검색에 의해 검색된 웹컨텐츠를 파싱하는 단계와;
상기 파싱결과를 이용하여, 사용자의 모바일 단말기에서 지원하는 웹표시언어로 변환하는 단계와;
상기 파싱결과를 이용하여, 문자열을 추출하여 임시변수를 생성하는 단계와;
상기 임시변수를 언어번역서버로 전송하는 단계와;
상기 언어번역서버로부터 문자열이 번역된 임시변수를 전송받아, 상기 검색된 웹컨텐츠를 재구성하는 단계와;
상기 재구성된 웹컨텐츠를 사용자 모바일 단말기에 전송하는 단계로 구성된 것을 특징으로 한다.
또한, 본 발명은, 상기 문자열 추출단계에 있어서, 언어번역서버에 전송되는 임시변수는 개행문자와 문자열만의 구성된 스트링형태의 임시변수로 생성되는 단계를 더욱 포함하는 것을 특징으로 한다.
또한, 본 발명은, 상기 사용자로부터 검색요구된 웹컨텐츠가 상기 캐쉬에 저장되어 있는지를 검색하는 단계에 있어서, 상기 검색은 웹컨텐츠와 다른 웹표시언어로 변환된 웹컨텐츠를 저장하는 메모리영역의 1차캐쉬, 디스크영역의 2차캐쉬, 웹컨텐츠 자체의 웹표시언어로 작성된 기본 웹컨텐츠를 저장하는 메모리영역의 3차캐쉬 및 디스크영역의 4차캐쉬 순으로 순차검색하는 것을 특징으로 하는 것을 특징으로 한다.
또한, 본 발명은, 상기 사용자로부터 검색요구된 웹컨텐츠가 상기 캐쉬에 저장되어 있는지를 검색하는 단계에 있어서, 상기 캐쉬에 저장된 웹컨텐츠가 갱신된 것인지를 검색하는 갱신검색단계를 더욱 포함하는 것을 특징으로 한다.
이하, 본 발명을 보다 상세히 설명한다.
본 발명은, 실시간 웹표시언어변환서버를 통해 특정 웹표시언어로 작성되어 있는 웹컨텐츠를 상이한 웹표시언어를 지원하는 모바일 단말기에서 실시간 웹표시언어변환기능에 의해 해당 컨텐츠의 이용이 가능하도록 하는 시스템 상에서, 모바일 단말기가 접속한 웹페이지가 해당 단말기에서 표시할 수 없는 타국어로 작성된 경우에 웹표시언어변환서버가 해당 단말기의 브라우저가 사용하고 있는 웹표시언어로 변환을 행하는 것과 함께 웹표시언어 변환서버와 연결되어 있는 언어번역서버로부터 사용자의 단말기가 표시할 수 있는 해당 국가의 언어로 번역한 결과를 전송받아 클라이언트 모바일 단말기로 전송해 주는 언어번역시스템 및 언어번역처리방법에 관한 것이다.
또한, 본 발명은 컨텐츠를 파싱한 파싱데이터에서 TAG와 문자열을 분리해서 번역서버로는 분리된 문자열만을 임시변수로 저장하여 전송한다. 그리고 번역되어 되돌아온 임시변수상의 문자열들은, 메모리상의 문자열객체저장영역에 저장되어 있는 해당 문자열의 메모리상의 번지와, 메모리상의 상기 문자열의 라인수가 저장되어 있는 라인수 저장영역상의 데이터를 이용하여, 다시 원래의 TAG들과 결합되어 재구성된 웹컨텐츠를 사용자 모바일 단말기로 전송한다. 이런 방식으로 번역을 진행함으로써 번역대상인 웹컨텐츠가 작성된 국가언어 스트링중 번역되어서는 안되는 스트링들(예를 들면, HTML파일이름, INPUT의 NAME값이나 VALUE값 등등)이 번역되는 것을 미연에 방지할 수 있다.
또한, 본 발명은 실시간 웹표시언어변환서버를 통해 특정 웹표시언어로 작성되어 있는 웹컨텐츠를 상이한 웹표시언어를 지원하는 모바일 단말기에서 실시간 표시언어변환기능에 의해 해당 컨텐츠의 이용이 가능하도록 하는 시스템상에서, 프록시서버로서 동작되는 웹표시언어변환서버상에서 컨텐츠의 전송효율을 높이기 위해 내장되어 있는 캐쉬가 동작되는 방법 및 이를 위한 4중캐쉬에 관한 것으로, 사용자가 검색하고자 하는 웹컨텐츠가 캐쉬에 저장되어 있는지와, 캐쉬에 저장되어 있는 내용이 최신의 정보인지에 따라서 수행되는 절차를 달리하는 4중캐쉬를 이용한 언어번역시스템 및 언어번역처리방법에 관한 것이다.
이하, 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 자세히 설명한다.
본 발명의 언어번역시스템과 사용자 단말기 및 웹서버와의 관계를 나타낸 도 2에 있어서, 프록시서버(320)와, 사용자의 모바일 단말기(310)와, 웹서버(330) 및언어번역서버(340)로 구성되며, 상기 프록시서버(320)는 사용자의 모바일 단말기 (310)와 웹서버(330)의 중계역할을 하여, 사용자가 특정 웹페이지를 검색하고자 하면, 상기 웹페이지의 컨텐츠를 사용자 모바일 단말기(310)가 지원하는 웹표시언어로 변환한 후, 이를 다시 언어번역서버(340)를 통하여 사용자 모바일 단말기(310)가 표시할 수 있는 해당 국가의 언어로 번역하여 전송한다.
도 3은 도 2에 나타난 프록시서버(320)의 구체적인 구성을 나타낸다. 도 3에 나타난 바와 같이, 프록시서버(320)는 단말기의 데이터분석부(321), 캐쉬데이터관리부 (322), 파싱부(323), 웹표시언어 변환부(324), 문자열 추출부(325), 언어번역서버 접속부(326), 번역결과 재구성부(327), 단말기로의 전송부(328), 메모리부 및 캐쉬부(329)로 구성되어 있다.
도 4는 언어번역처리방법의 구체적인 플로우를 나타내는 플로우챠트이다. 도 4에 나타난 바와 같이, 사용자가 모바일 단말기(310)에서 웹페이지를 요청하는 접속이 프록시서버(320)에 이루어진다. 이때 프록시서버(320)의 데이터분석부(321)는 상기 단말기(310)로부터 전송된 데이터 헤드를 분석하여 사용자가 검색하고자 하는 웹주소를 얻고, 상기 데이터 헤드상의 변수 USER_AGENT를 분석하여 사용자 단말기(310)가 지원하는 웹표시언어의 형식과 사용자 단말기(310)가 표시할 수 있는 국가의 언어에 관한 정보를 얻는다(단계 401).
캐쉬데이터관리부(322)는, 상기 데이터분석부(321)에 의해 얻어진 웹주소를 이용하여 사용자가 검색하고자 하는 웹컨텐츠가 캐쉬(329)에 저장되어 있는지를 검색하여, 캐쉬(329)에 있는 경우에는 소정의 절차를 거쳐 사용자 단말기(310)에 전송하고, 캐쉬(329)에 저장되어 있지 않은 경우에는, 웹서버(330)에 접속해서 웹페이지를 취득한다(단계 402).
파싱부(323)는, 취득한 웹페이지를 해당 모바일 단말기의 브라우즈에 표시가능한 웹표시언어로의 변환을 위해 파싱을 수행하여 태그와 문자열을 분리한다(단계 403).
파싱부(323)에 의해 파싱된 결과는, 변환부(324)에 의해 사용자의 모바일 단말기가 지원하는 웹표시언어로 변환된다(단계 404). 즉, 웹페이지의 HTML코드로부터 그 자체로 의미가 있는 하나의 항목(형태소), 예를 들면, 태그와 문자열과 같은 항목들을 분리해 내는 상기 파싱부(323)에 의한 파싱에 의해 각각 분리된 항목들은 트리형태로 구성된 배열에 각각 저장되며, 해당 웹표시언어로 변환을 수행할 때, 배열의 각각의 노드를 대상으로 변환이 수행된다. 이상과 같은 파싱절차 및 파싱트리의 구성은 종래의 웹표시언어변환시스템에서 수행되는 것과 동일하므로, 그 자세한 설명을 생략한다.
파싱되고 변환된 결과에 대해 언어번역서버(340)로 전송할 문자열만을 분리하여 임시변수를 생성하기 위한 파싱 및 변환결과에 대한 전체검색이 문자열추출부 (325)에 의해 수행된다(단계 405). 이때, 전체 웹페이지를 언어번역서버에 전송하여 번역을 수행하지 않고 문자열만을 분리해서 언어번역서버로 전송하는 이유는 웹페이지를 구성하고 있는 HTML코드중에 링크된 HTML파일의 이름이나 INPUT 태그의 NAME, VALUE와 같은 값들은 웹페이지가 표현된 국가의 언어로 구성되어 있는 경우가 있고, 이 문자열들이 언어번역서버를 통해 번역이 되면 웹 페이지가 정상적으로 동작하지 않는 경우가 발생하기 때문이다.
이후, 문자열추출부(325)에 의한 동작은, 파싱 및 변환결과에 대한 전체검색을 행하여, 검색된 데이터가 파싱트리에서 제일 마지막 노드에 존재하는 태그(일반적으로, HTML파일의 끝이라는 것을 알리는 태그인 </HTML>)인지 아닌지를 판단해서 (단계 406), 상기 검색된 데이터가 마지막노드인 경우에는 단계 410으로 이행하고, 마지막노드가 아닌 경우에는 단계 407로 이행하여 이후 파싱 및 변환결과의 전체검색을 통해 웹페이지상의 문자열을 모두 분리하여 스트링형식의 임의변수에 저장하게 된다. 상기의 파싱트리의 제일 마지막 노드는 웹페이지의 전체문서의 가장 마지막 태그를 의미하는 것으로, 이는 일반적으로 웹페이지가 파싱되면서 파싱트리에 순차적으로 태그와 문자열들이 저장되어 갈 때</HTML>태그는 웹페이지의 끝에 존재하므로 파싱트리에서도 가장 나중의 노드에 존재하기 때문이다.
단계 405에서, 검색된 데이터가 파싱트리의 마지막 노드가 아닌 경우에는,검색된 데이터가 문자열인지 아닌지를 판단하여 문자열인 경우에는 단계 408로 이행하며, 문자열이 아닌 경우에는 단계 406을 다시 수행하는 루프를 돌게 된다. 단계 408에서는 문자열의 파싱트리에서의 위치와 라인수를 프락시서버(320) 메모리부의 문자열객체저장영역과 라인수저장영역에 저장하고(단계 408), 문자열을 스트링형태의 임시변수에 추가한 후, 단계 406으로 귀환하여 루프를 돌게 된다(단계 409).
상기의 단계 406 내지 단계 409의 문자열 정보추출루프를, 도 5를 참조하여 더욱 구체적으로 설명하면, 웹컨텐츠가 HTML파일로 도 5a 나타난 바와 같이 작성되었다면, 프락시서버 메모리(329)상의 파싱트리는 도 5b와 같이 각각의 태그가 저장되며, 메모리(329)상의 파싱트리에 있어서 문자열만이 문자추출부(325)에 의해 추출되고, 상기 추출된 문자열의 파싱트리에서의 위치와 라인수가 프락시서버 메모리(329)상의 문자열객체저장영역과 라인수저장영역에 저장된다. 이때 문자열과 개행문자(문자열의 라인과 라인사이를 표시하는 문자로 키보드상의 Enter값에 해당되며, \r\n으로 표시)만이 도 5c와 같이 단계 409에 의해 스트링형태로 임시변수에 모아지며, 계속 단계 406 내지 단계 409의 문자열 정보추출루프를 돌면서 파싱트리에서 문자열만이 추출되어 상기와 같이 문자열과 개행문자만이 임시변수의 스트링에 추가된다. 이때 각 문자열과 다음 문자열을 구분하기 위한 구분개행문자(\r\n) 하나가 추가되며, 이에 따라 라인수도 각 문자열의 개행문자의 수에 “1”을 더한 값이 된다. 즉, 샘플 HTML 파일상에서 문자열 “This is sample page”은 태그<BODY> 뒤의 개행문자(\r\n)과 문자열 뒤의 개행문자(\r\n)과 구분개행문자를 더하여 라인수는 전부 “3”이 되며, 두 번째 문자열 “Click the link\r\nGood luck\r\n”은 태그 <BR>뒤의 개행문자와, 문자열 “Click the link”와 “Good luck”사이의 개행문자와 “Good luck”뒤의 개행문자 및 구분개행문자를 더하여 전부 라인수는 “4”가 된다. 이와 같은 방법에 의해 도 5b의 메모리상의 파싱트리로부터 형성된 스트링형태의 임시변수는 도 5c와 같으며, 문자열객체저장영역과 라인수 저장영역은 도 5b와 같이 형성된다.
파싱 및 변환결과에 대한 전체검색을 모두 수행하여 검색된 데이터가 웹페이지의 끝임이 판명되면, 단계 409에 의해 임시변수에 모아진 문자열(도 5c)을 언어번역서버접속부(326)을 통해 언어번역서버에 전송하게 된다(단계 410).
번역서버(340)에서는 전송된 임시변수 내에 들어있는 문자열에 해당하는 항목만을 상기 데이터분석부(321)에 의해 얻어진 사용자 모바일 단말기가 표시할 수 있는 국가의 언어로 번역하고, 프록시에서 전송받은 스트링형태의 임시변수의 문자열을 번역된 문자열로 치환하여, 전송받은 형식 그대로 다시 프록시서버에 전송한다(단계 411).
번역결과 재구성부(327)에서는, 상기 언어번역서버로부터 문자열이 번역되어 전송되온 임시변수에서 문자열들을 프록시서버 메모리부상의 라인수저장영역에 저장되어 있는 라인수만큼 때어내서 문자열객체저장영역에서의 위치정보에 해당하는 파싱트리의 위치로 문자열을 치환한 후(단계 412), 사용자가 검색을 요구한 웹컨텐츠를 사용자 모바일 단말기(310)가 지원하는 웹표시언어 형식에 맞추어 변환하고, 사용자 모바일 단말기(310)가 표시할 수 있는 해당 국가의 언어로 변환하여 사용자의 모바일 단말기(310)로 전송한다(단계 413).
도 6은, 본 발명의 일 실시예를 나타내는 도면으로서, CHTML형식의 일문 웹페이지를 WML형식의 영문으로 언어변환한 결과를 나타내는 도면이다.
본 발명은, 더욱 바람직하게는, 종래의 웹표시언어변환서버인 프록시서버의 메모리영역의 캐쉬를, 사용자 모바일 단말기(310)가 지원하는 웹표시언어로 변환된 결과를 저장하는 메모리영역의 1차 캐쉬와 디스크영역의 2차 캐쉬 및, 웹컨텐츠 자체의 웹표시언어 작성된 기본 웹페이지(사용자 모바일 단말기가 지원하는 웹표시언어로 변환되기 전의 내용)를 저장하는 메모리영역의 3차 캐쉬와 디스크영역의 4차 캐쉬의 4중 캐쉬로 나누어 사용하는 4중 캐쉬방법을 사용한다.
도 7은 본 발명의 더욱 바람직한 실시예인 4중 캐쉬방법을 나타낸 플로우차트이다. 도 7에 있어서, 사용자의 모바일 단말기(310)로부터 사용자가 다른 웹컨텐츠를 검색한 후에, 다시 전에 검색한 웹컨텐츠를 검색하고자 할 때나 새로운 웹컨텐츠를 검색하고자 할 때에, 검색하고자 하는 웹주소를 데이터분석부(321)에 의해 데이터헤드를 통해 얻어, 사용자요구데이터를 취득한다(단계 710).
상기 사용자요구데이터를 취득하면, 우선 사용자 모바일 단말기(310)가 지원하는 웹표시언어로 변환된 결과를 저장하는 메모리영역의 1차 캐쉬를 검색하여 해당 웹주소의 웹컨텐츠가 상기 1차 캐쉬에 있는지를 판별하고(단계720), 상기 1차 캐쉬에 웹컨텐츠가 없으면, 또한 웹표시언어로 변환된 결과를 저장하는 디스크영역의 2차 캐쉬를 검색하여 동일한 절차를 수행한다(단계 730).
상기 단계 720과 단계 730에 의해 1차 캐쉬와 2차 캐쉬중 어느 하나에 사용자가 검색하고자 하는 웹컨텐츠가 저장되어 있는 경우에, 해당 웹서버에 접속하여(단계 721), 캐쉬내에 존재하는 컨텐츠와 웹서버(330)내에 존재하는 컨텐츠를 비교하여 웹서버(330)내의 컨텐츠가 갱신되어있는지 여부를 판별하여(단계 722), 갱신되지 않은 경우에는 단계 723에 의해 검색된 캐쉬를 그대로 사용할 수 있으므로 바로 문자열추출부(325)로 전송하며(단계 724), 갱신되어 있는 경우에는 단계 751에 의해 해당 웹서버(330)에서 웹컨텐츠를 취득하여 변환부(324)에 의해 웹표시언어를 변환하여(단계 752) 문자열추출부(325)로 전송한다(단계 724).
또한, 만약 사용자가 검색하고자 하는 웹주소의 웹컨텐츠가 1차 캐쉬와 2차 캐쉬에 없는 경우에는, 사용자 모바일 단말기가 지원하는 웹표시언어로 변환되기 전의 기본 웹페이지를 저장하고 있는 메모리영역의 3차 캐쉬와 디스크영역의 4차캐쉬를 순차 검색하여(단계 740과 단계 750), 해당 웹컨텐츠가 캐쉬(329)에 저장된 경우에는, 사용자가 검색하고자 하는 웹주소를 검색하여(단계 741), 해당 웹서버 (330)의 웹컨텐츠가 갱신되었는지의 여부를 판별하여(단계 742), 해당 웹컨텐츠가 갱신되지 않은 경우에는 단계 743에 의해 검색된 웹컨텐츠를 저장하고 있는 캐쉬의 데이터를 이용하여 변환부(324)에 의해 사용자 모바일 단말기가 지원하는 웹표시언어로 변환하고(단계 743), 갱신되어 있는 경우에는 상기와 같이 단계 751, 단계 752를 거쳐 변환된 웹컨텐츠를 문자열추출부(325)로 전송한다(단계 724).
상기와 같이, 본 발명에 의한 캐쉬는 4중 캐쉬로 구성되어, 메모리영역상의 캐쉬와 디스크영역상의 캐쉬로 나누어 캐쉬메모리의 용량이 한계를 극복하며, 사용자 단말기가 지원하는 웹표시언어나 웹컨텐츠가 작성된 웹표시언어와 다른 형식의 웹표시언어로 변환된 결과를 저장하는 캐쉬와, 해당 웹컨텐츠 자체의 웹표시언어로 작성된 기본웹컨텐츠인 다른 웹표시언어로의 변환 전의 내용을 저장하는 캐쉬로 나누어 현재 모바일 단말기를 사용하고 있는 사용자의 재검색 요구시나, 같은 웹표시언어를 지원하는 단말기를 사용하는 다른 사용자가 전에 다른 사용자가 검색한 웹컨텐츠를 검색하고자 하는 검색요구시에, 다시 웹컨텐츠를 사용자 단말기의 환경에 맞게 변환하는 단계를 줄여 보다 빨리 접속이 가능하게함과 동시에, 상기 사용자와 다른 웹표시언어를 지원하는 단말기를 사용하고 있는 사용자가 상기 이전 사용자가 검색한 웹컨텐츠를 검색하고자 할 때, 상기 3차 캐쉬 또는 4차 캐쉬에 저장된 내용을 이용하여, 웹컨텐츠를 검색하고자 하는 사용자 단말기의 형식에 따라 능동적으로 대처하여 웹컨텐츠를 보다 빨리 검색할 수 있도록 하고 있다. 만약, 종래와 같이, 특정의 사용자 단말기가 지원하는 웹표시언어로 변환된 결과만을 캐쉬에 저장하고 있는 경우에는, 다른 웹표시언어를 지원하는 단말기를 사용하는 사용자가 이전 사용자가 검색한 웹컨텐츠를 검색하고자 할 때에는 처음부터 웹서버에 접속해야 하므로, 시간과 비용의 소모가 발생한다는 문제점을 개선할 수 있다.
본 발명은, 종래 웹표시언어변환서버의 단점을 개선하여, 사용자의 단말기가 표시할 수 있는 국가의 언어로 웹서버의 컨텐츠를 변환하여 사용자 단말기에 전송함으로써, 사용자에게 편리함을 제공함과 동시에 웹서버의 운영주체가 필요이상의 국가언어로 웹컨텐츠를 작성해야 하는 불편을 제거할 수 있다.
또한, 본 발명은, 사용자가 일단 전에 검색한 웹컨텐츠를 재검색하고자 할 때나, 전(前)사용자의 단말기가 지원하는 웹표시언어와 같은 웹표시언어를 지원하는 단말기를 사용하는 다른 사용자가, 전의 다른 사용자가 검색한 웹컨텐츠를 검색하고자 할 때, 필요없는 절차를 간소화하여 빠르게 웹컨텐츠를 전송받을 수 있도록 하여 사용자의 시간과 비용을 절감할 수 있다.

Claims (8)

  1. 실시간 웹표시언어변환서버의 언어변환기능에 의해 특정 웹표시언어로 작성되어 있는 웹컨텐츠를 상이한 웹표시언어를 지원하는 모바일 단말기에 해당 컨텐츠를 실시간 이용이 가능하도록 하는 시스템에 있어서,
    사용자의 모바일 단말기와 웹컨텐츠를 탑재한 웹서버사이에서 중계역할을 하며, 언어번역서버와 인터페이스에 의해 접속된 프록시서버로 구성된 언어번역시스템으로서,
    상기 프록시서버는 :
    상기 사용자의 모바일 단말기로부터 전송된 데이터를 분석하는 데이터분석부와;
    상기 사용자로부터 검색요구된 웹컨텐츠가 캐쉬에 저장되어 있는지를 검색하여, 캐쉬에 저장되어 있는 경우에는 상기 컨텐츠를 사용자에게 전송하고, 캐쉬에 저장되어 있지 않은 경우에는 웹컨텐츠의 검색을 행하는 캐쉬데이터관리부와;
    상기 웹검색에 의해 검색된 웹컨텐츠를 파싱하는 웹표시언어의 파싱부와;
    상기 파싱부의 파싱결과를 이용하여, 사용자의 모바일 단말기가 지원하는 웹표시언어로 변환하는 웹표시언어 변환부와;
    상기 파싱부의 파싱결과를 이용하여, 문자열을 추출하여 임시변수를 생성하는 문자열 추출부와;
    상기 임시변수를 언어번역서버에 전송하는 언어번역서버 접속부와;
    상기 언어번역서버로부터 문자열이 번역된 임시변수를 전송받아, 상기 검색된 웹컨텐츠를 재구성하는 번역결과 재구성부와;
    상기 재구성된 웹컨텐츠를 사용자 모바일 단말기에 전송하는 전송부와;
    상기 문자열과 상기 문자열의 위치정보를 저장하는 메모리부 및;
    상기 검색된 웹컨텐츠를 일시저장하는 캐쉬부로 구성된 것을 특징으로 하는 언어번역시스템.
  2. 제 1 항에 있어서, 상기 문자열 추출부에서 생성되어, 언어번역서버에 전송되는 임시변수는 개행문자와 문자열만으로 구성된 스트링형태의 임시변수인 것을 특징으로 하는 언어번역시스템.
  3. 제 1 항에 있어서, 상기 캐쉬부가 웹컨텐츠와 다른 웹표시언어로 변환된 웹컨텐츠를 저장하는 메모리영역의 1차 캐쉬와 디스크영역의 2차 캐쉬 및, 웹컨텐츠 자체의 웹표시언어로 작성된 기본 웹컨텐츠를 저장하는 메모리영역의 3차 캐쉬와 디스크영역의 4차 캐쉬인 4중 캐쉬로 이루어진 것을 특징으로 하는 언어번역시스템.
  4. 제 1 항에 있어서, 상기 언어번역서버가 상기 프록시서버와 일체로 구성된 것을 특징으로 하는 언어번역시스템.
  5. 실시간 웹표시언어변환서버의 언어변환기능에 의해 특정 웹표시언어로 작성되어 있는 웹컨텐츠를 상이한 웹표시언어를 지원하는 모바일 단말기에 해당 컨텐츠를 실시간 이용이 가능하도록 하는 시스템에 있어서,
    사용자의 모바일 단말기와 웹컨텐츠를 탑재한 웹서버사이에서 중계역할을 하여, 언어번역서버와 인터페이스에 의해 접속되어 사용자의 모바일 단말기에서 표시가능한 국가의 언어로 번역된 웹컨텐츠를 전송하는 언어번역처리방법으로서,
    상기 사용자의 모바일 단말기로부터 전송된 데이터를 분석하는 단계와;
    상기 사용자로부터 검색요구된 웹컨텐츠가 캐쉬에 저장되어 있는지를 검색하여, 캐쉬에 저장되어 있는 경우에는 상기 컨텐츠를 사용자에게 전송하고, 캐쉬에 저장되어 있지 않은 경우에는 웹컨텐츠의 검색을 행하는 단계와;
    상기 웹검색에 의해 검색된 웹컨텐츠를 파싱하는 단계와;
    상기 파싱결과를 이용하여, 사용자의 모바일 단말기에서 지원하는 웹표시언어로 변환하는 단계와;
    상기 파싱결과를 이용하여, 문자열을 추출하여 임시변수를 생성하는 단계와;
    상기 임시변수를 언어번역서버로 전송하는 단계와;
    상기 언어번역서버로부터 문자열이 번역된 임시변수를 전송받아, 상기 검색된 웹컨텐츠를 재구성하는 단계와;
    상기 재구성된 웹컨텐츠를 사용자 모바일 단말기에 전송하는 단계로 구성된 것을 특징으로 하는 언어번역처리방법.
  6. 제 5 항에 있어서, 상기 문자열 추출단계에서 생성되어, 언어번역서버에 전송되는 임시변수는 개행문자와 문자열만의 구성된 스트링형태의 임시변수로 생성되는 단계를 더욱 포함하는 것을 특징으로 하는 언어번역처리방법.
  7. 제 5 항에 있어서, 상기 사용자로부터 검색요구된 웹컨텐츠가 상기 캐쉬에 저장되어 있는지를 검색하는 단계에 있어서, 상기 검색은 웹컨텐츠와 다른 웹표시언어로 변환된 결과를 저장하는 메모리영역의 1차캐쉬, 디스크영역의 2차캐쉬, 웹컨텐츠 자체의 웹표시언어로 작성된 기본 웹컨텐츠를 저장하는 메모리영역의 3차캐쉬 및 디스크영역의 4차캐쉬 순으로 순차검색하는 것을 특징으로 하는 것을 특징으로 하는 언어번역처리방법.
  8. 제 5 항에 있어서, 상기 사용자로부터 검색요구된 웹컨텐츠가 상기 캐쉬에 저장되어 있는지를 검색하는 단계에 있어서, 상기 캐쉬에 저장된 웹컨텐츠가 갱신된 것인지를 검색하는 갱신검색단계를 더욱 포함하는 것을 특징으로 하는 언어번역처리방법.
KR1020020040568A 2002-07-12 2002-07-12 언어번역시스템 및 언어번역처리방법 KR20040007932A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020020040568A KR20040007932A (ko) 2002-07-12 2002-07-12 언어번역시스템 및 언어번역처리방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020040568A KR20040007932A (ko) 2002-07-12 2002-07-12 언어번역시스템 및 언어번역처리방법

Publications (1)

Publication Number Publication Date
KR20040007932A true KR20040007932A (ko) 2004-01-28

Family

ID=37317204

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020040568A KR20040007932A (ko) 2002-07-12 2002-07-12 언어번역시스템 및 언어번역처리방법

Country Status (1)

Country Link
KR (1) KR20040007932A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010093171A2 (ko) * 2009-02-10 2010-08-19 Oh Eui Jin 다국어 웹페이지 번역 시스템 및 다국어 웹페이지를 번역하여 제공하는 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010093171A2 (ko) * 2009-02-10 2010-08-19 Oh Eui Jin 다국어 웹페이지 번역 시스템 및 다국어 웹페이지를 번역하여 제공하는 방법
WO2010093171A3 (ko) * 2009-02-10 2010-12-09 Oh Eui Jin 다국어 웹페이지 번역 시스템 및 다국어 웹페이지를 번역하여 제공하는 방법

Similar Documents

Publication Publication Date Title
US6292802B1 (en) Methods and system for using web browser to search large collections of documents
KR100265548B1 (ko) 기계번역방법및장치
US5991773A (en) Information terminal unit with history management functions
KR100461019B1 (ko) 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법
US6230168B1 (en) Method for automatically constructing contexts in a hypertext collection
US5991713A (en) Efficient method for compressing, storing, searching and transmitting natural language text
US7072984B1 (en) System and method for accessing customized information over the internet using a browser for a plurality of electronic devices
US6886130B1 (en) Compiled structure for efficient operation of distributed hypertext
US20010018649A1 (en) Relay device, server device, terminal device, and translation server system utilizing these devices
US20040049737A1 (en) System and method for displaying information content with selective horizontal scrolling
SE524391C2 (sv) Metod och system för innehållskonvertering av elektroniska dokument för trådlösa klienter.
JP2001092854A (ja) ネイティブ言語照会サービスを提供する方法およびシステム
US20120290911A1 (en) Method for Content Folding
KR100359233B1 (ko) 웹 정보 추출 방법 및 시스템
KR100456022B1 (ko) 비피씨 정보단말을 위한 엑스엠엘 기반 웹 페이지 제공방법 및 그 시스템
KR20020031691A (ko) 실시간 인터넷 콘텐츠 변환 방법 및 시스템
WO2002087135A2 (en) System and method for adapting information content for an electronic device
US20030149745A1 (en) Method and apparatus for accessing information from a network data source
JP2002116983A (ja) ウェブコンテンツの変換方法およびシステム
KR20040007932A (ko) 언어번역시스템 및 언어번역처리방법
JP3898016B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラム
KR101117171B1 (ko) 검색 서비스를 위해 데이터를 생성하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
WO2001093068A2 (en) System to facilite navigation of internet from a wireless device
KR20010084491A (ko) 무선통신 단말기를 위한 인터넷 정보검색 방법
JP5276903B2 (ja) 閲覧システム、プラグインプログラム、ならびに、紹介プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application