KR100413309B1 - 모국어 조회 서비스를 제공하기 위한 방법 및 시스템 - Google Patents

모국어 조회 서비스를 제공하기 위한 방법 및 시스템 Download PDF

Info

Publication number
KR100413309B1
KR100413309B1 KR10-2000-0040799A KR20000040799A KR100413309B1 KR 100413309 B1 KR100413309 B1 KR 100413309B1 KR 20000040799 A KR20000040799 A KR 20000040799A KR 100413309 B1 KR100413309 B1 KR 100413309B1
Authority
KR
South Korea
Prior art keywords
query
language
url
search engine
web page
Prior art date
Application number
KR10-2000-0040799A
Other languages
English (en)
Other versions
KR20010085185A (ko
Inventor
판위에
양리핑
로버트슨린던
Original Assignee
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 인터내셔널 비지네스 머신즈 코포레이션
Publication of KR20010085185A publication Critical patent/KR20010085185A/ko
Application granted granted Critical
Publication of KR100413309B1 publication Critical patent/KR100413309B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 다수의 인터넷 검색 엔진을 사용하여 인터넷 사용자들에게 모국어 조회 서비스를 제공하기 위한 방법을 제공하는 것으로서, 상기 방법은 (a) 어떤 사이트에서 사용자로부터 최초 조회 요청(original query request)을 수신하는 단계; (b) 적절한 검색 엔진을 선택하는 단계; (c) 모국어로 되어 있는 상기 조회어를 상기 선택된 검색 엔진의 전용 언어로 되어 있는 조회어로 변환하는 단계; (d) 상기 검색 엔진으로 향하는 새로운 조회 요청을 구축하는 단계; (e) 상기 새로운 조회 요청을 보내고 또한 되돌아온 조회 결과를 수신하는 단계; (f) 상기 조회 결과를 상기 최초 조회 요청에 관한 조회 결과로서 상기 사용자에게 되돌려 보내는 단계를 포함하는 것을 특징으로 한다.

Description

모국어 조회 서비스를 제공하기 위한 방법 및 시스템{METHOD AND SYSTEM FOR PROVIDING NATIVE LANGUAGE QUERY SERVICE}
본 발명은 정보 검색(information retrieval) 조회 방법 및 장치에 관한 것이며, 특히 인터넷 혹은 데이터베이스 사용자에 대해 조회 서비스를 제공하기 위한 방법 및 장치에 관한 것이고, 더 구체적으로는 인터넷 혹은 데이터베이스 사용자에 대해 모국어로 조회 서비스를 제공하기 위한 방법 및 장치에 관한 것이다.
원격 네트워크와 같은 전산화된 정보원(computerized information source)의개발을 통하여, 데이터 처리 시스템(data processing system)의 사용자들은 종래의 방식의 전자 매체(electronic media)로부터는 액세스할 수 없었던 방대한 전자 정보(electronic information)를 검색하기 위하여 다른 서버 및 네트워크에 접속할 수 있게 되었다. 이런 종류의 정보 매체(information media)는 신문 및 심지어는 텔레비전과 같은 종래의 정보 유통(information distribution) 매체를 점차적으로 대체하고 있다.
통신에서, 상이한 컴퓨터 네트워크들이 송신측 네트워크로부터 수신측 네트워크로의 데이터 전송 및 메시지 변환을 다루는 "게이트웨이(gateway)"를 통해 서로에게 연결되어 있다. 게이트웨이는 정보가 하나의 네트워크로부터 다른 네트워크로 전송될 수 있도록 상이한 통신 프로토콜을 사용하는 상이한 네트워크를 연결하기 위해 사용되는 장치이다. 게이트웨이는 또한 다른 네트워크에서 사용하는 프로토콜과 호환이 되도록 정보의 포맷을 변경한다.
인터넷은 오늘날 일반적으로 사용하는 원격 네트워크 중 하나이다. 인터넷은 미국의 ARPAnet으로부터 생겨 났으며 현재는 서로 연결되어 있는 다수의 네트워크로 구성된 최대의 오픈 컴퓨터 네트워크(open computer network)이다. 인터넷은 "Transport Control Protocol/Internet Protocol"의 약어인 TCP/IP 프로토콜을 사용한다. 이 소프트웨어 프로토콜은 컴퓨터간의 통신을 위하여 미국의 국방부에 의해 개발되었다. 인터넷은, 서로 연결되어 있으며 사용자로 하여금 네트워크 정보를 공유하는 것을 가능하도록 하는 네트워크 프로토콜을 수행시키는 컴퓨터들로 구성되어 있는 분산 컴퓨터 네트워크라고 설명될 수 있다. 일반적인 사용에 있어서 정보를 공유하기 위한 요건 때문에, 인터넷과 같은 원격 네트워크들은 "오픈(open)" 네트워크로서 개발되었다. 오픈 시스템(open system)의 경우, 개발자들은 거의 아무런 제약 없이 사양 동작 혹은 서비스(specification operation or service)를 위한 소프트웨어 애플리케이션을 디자인할 수 있다. 객체 및 인터넷의 링크인, 노드(node)에 대해 상세한 설명은, G.H.Cady외 다수가 저자이며 Sybex Company, Alameda, California, USA에서 출판된 "Mastering the Internet"이라는 교과서를 참조하면 된다.
컴퓨터들 사이에서 교환되는 전자 정보(electronic information)들은 대개 하이퍼텍스트 포맷으로 되어 있다. 하이퍼텍스트는 텍스트, 이미지, 오디오 및 액션을 복합, 비선형 네트워크로 결합시키는 선행 기술이며, 사용자로 하여금 관련된 타이틀을 통해 "브라우징" 혹은 "서핑"하도록 허용한다. "하이퍼텍스트"라는 용어는 책, 필름 및 언어에서의 선형 구조와 구별되는 비선형 구조를 보여주는 컴퓨터 파일들을 참조하기 위해 1960년대에 만들어졌다.
반면에, 최근 등장하는 용어 "하이퍼미디어"는 "하이퍼텍스트"의 동의어이지만, 애니메이션, 오디오, 비디오 등과 같은 하이퍼텍스트의 텍스트가 아닌 구성 요소에 대해 강조한다. 하이퍼미디어 이미지, 오디오, 비디오 혹은 그들 임의의 조합은 정보 저장 및 검색 시스템 내에 합성될 수 있다. 하이퍼미디어 및 하이퍼텍스트, 특히 사용자에 의해 선택가능하고 제어가능한 인터렉티브한 것들은, 작업 및 학습(work and study)이 인간의 생각과 병행하는 환경에서 구축된다. 즉, 그것들은 사용자로 하여금 하나의 동작(motion)에서 다른 동작으로 순서대로 움직이는 대신에 토픽(topic)들 간에 상관 관계가 성립하도록 허용한다. 하이퍼미디어 및 하이퍼텍스트는, 사용자가 검색 기간(search period) 동안에 하나의 토픽에서 다른 연관된 토픽으로 건너뛸 수 있도록 링크되어 있다. 하이퍼링크가 하이퍼미디어 혹은 하이퍼텍스트 파일들에 내장되어 있으며, 판독자가 "클릭"할 때 다른 하이퍼미디어나 하이퍼텍스트로 연결된다.
월드 와이드 웹(WWW; World Wide Web), 혹은 "웹(Web)"은, 인터넷 상에서의 멀티미디어 정보 검색 시스템이다. 웹은 네트워크 상에서 데이터를 전송하기 위한 가장 일반적인 방법이다. 다른 방법으로는 FTP(File Transfer Protocol) 및 Gopher 등이 있지만, 웹만큼 일반적이지는 않다. 웹에서, 클라이언트(client)는 하이퍼텍스트 전송 프로토콜(HTTP; Hypertext Transfer Protocol)을 사용하여 웹 서버에 의해 제공되는 서비스에 액세스하는데, 여기서 HTTP는 잘 알려진 애플리케이션 프로토콜로서, 사용자로 하여금 하이퍼텍스트 마크업 랭귀지(HTML; Hypertext Markup Language)라 불리는 표준 페이지 기술 언어(standard page description language)를 사용하여 여러 종류의 파일들(예를 들어, 텍스트 파일, 그래픽, 이미지, 오디오, 비디오 등)에 액세스하도록 허용한다. HTML은 기본적인 파일 형식을 제공하며, 개발자로 하여금 다른 서버 및 파일들에 대한 링크를 지정할 수 있도록 허용한다. 다른 웹 서버에 대한 네트워크 경로를 나타내는 링크는 유니버설 리소스 로케이터(URL; Universal Resource Locator)에 명시된다. URL에 의해 네트워크 경로를 명시하기 위한 전용구문(syntax)이 존재한다.
URL은 일반적으로 http://somehost/someprogram?parameters... 과 같은 형식으로 나타내는데, 여기서 "somehost"라는 것은 URL의 호스트 주소이고, "somedirectory"는 URL에 의해 표시되는 웹 페이지를 찾을 수 있는 디렉토리명이다. URL을 웹 서버의 실제 주소로 분해하는 일반적인 방법은 도메인 서버(domain server)를 사용하는 것이다. 인터넷 혹은 인트라넷(intranet)에서는, 도메인 네임 서버(domain name server)가 호스트 이름을 실제 웹 주소로 변환시켜준다. 도메인 네임 서버의 한 예는 인터넷에서의 도메인 네임 서비스(DNS; Domain Name Service)이다. 웹 사용자가 도메인 네임 서버에게 호스트 이름과 주소를 요구하는 과정을 파싱(parsing)이라 부른다. TCP/IP에서, 도메인 네임 서버는 호스트 이름을 파싱(parse)하여 하나 이상의 IP 주소 리스트를 만드는데, 이것을 HTTP에 입각하여 요구한 웹 클라이언트에게 되돌려준다. 각 IP 주소는 브라우저(browser)에 의해 보내진 요구 컨텐츠를 처리하는데 사용되는 서버를 명시한다.
하이퍼텍스트 프로토콜을 사용하는 WWW는 클라이언트/서버 구조를 따른다. 클라이언트 측에는 브라우저 소프트웨어가 있어서, 웹 서버에게 요구를 보내고 그후 웹 서버에 의해 되돌아온 하이퍼텍스트 정보 및 다른 멀티미디어 파일들에 대해 설명, 디스플레이 혹은 실행을 하게 된다.
수천 수만의 회사, 대학, 정부 관청, 박물관 및 시당국들이 웹상에 자신들의 홈페이지를 구축하는 동안, 인터넷은 매우 가치있는 정보원(information source)으로 자라게 되었다. 초보자조차도 약간의 실습을 거치면, 수천개의 웹 페이지나 뉴스 그룹을 검색할 정도가 된다. 그러므로 인터넷 액세스와 그에 상응하는 시장은 급속도로 성장하게 된다.
오늘날 월드 와이드 웹은 하이퍼텍스트 페이지에 의해 작성된 매우 방대한 양의 정보를 가지고 있다. 페이지의 수는 매우 커서 웹 전체는 말할 것도 없이 IBM과 같은 하나의 사이트 내에서조차도 한 사이트씩, 혹은 한 링크씩 따라가기란 불가능하다. 그러므로 사용자에게 있어서는 월드 와이드 웹상에서 관심있는 정보를 효율적이면서도 빠르고 편리하게 찾는 것이 매우 중요하다.
현재, 많은 종류의 정보 검색 장치가 존재한다. 그중 하나가 디렉토리 서비스(directory service)이다. 디렉토리 서비스에서, 웹사이트/페이지는 카테고리별(category)로 분류되어 있으며, 각 카테고리는 나아가 서브 카테고리별(sub-categories)로 다시 분류되어 있다. 또한, 카테고리들은 계층적으로 구성되어 있으며, 소 카테고리에 대한 링크를 갖는 웹 페이지로서 제공된다. 사용자들은 각 층별로 탐색함으로써, 관련된 웹사이트/페이지들을 찾게 될 것이다. 웹사이트/페이지의 양이 폭발적으로 증가함에 따라, 디렉토리들은 방대한 크기로 성장했다. 예를 들어, Yahoo!는 현재 50만개 이상의 사이트를 갖는 25,000개의 카테고리를 갖고 있다.
또 다른 종류의 정보 검색 장치는 검색 엔진이다. 검색 엔진은 키워드를 사용하여 웹사이트/페이지에 대해 색인화 한다. 사용자는 검색 엔진에서 허용하는 키 워드인 조회어를 입력하게 되면, 관련된 웹사이트/페이지를 얻을 수 있다. 점차 더 많은 사람들이 디렉토리에서의 각 층을 탐색하기보다는 키워드를 사용하여 검색 엔진에 웹사이트/페이지를 조회할 것이다. 카테고리 목록 또한 검색을 위하여 색인화될 수도 있다. 예를 들어, Yahoo!에서 카테고리 목록 및 웹사이트 모두가 검색 결과로 표시된다.
무료 혹은 낮은 가격의 인터넷 검색 엔진과 같은 컴퓨터 애플리케이션 소프트웨어는 사람들로 하여금 웹사이트에서 해당되는 토픽 정보를 얻기 위해 조회를 함으로서 쉽게 해당 웹사이트를 얻을 수 있도록 한다. 사용자가 인터넷을 서핑할 경우, 디렉토리 및 검색 엔진은 인터넷으로의 "포털 사이트(portal site)"로서 인식될 정도로 사용자에게 매우 많은 도움이 된다. 유명한 디렉토리/검색 엔진에는 Yahoo!, Alatavista, Exite 등이 포함된다. Sina(www.sina.com.cn)는 매우 유명한 중국 포털 사이트이다. 그렇지만, 대부분의 웹 페이지는 영어로 쓰여져 있으며, 또한 영어로 카테고리화/색인화 되어 있다. 영어를 읽지 못하는 사용자들은 이런 편의를 즐길 수가 없다.
이런 문제를 해결하기 위하여, 영어에서 중국어로, 혹은 독일어에서 영어로와 같이 한 언어에서 다른 언어로 웹 페이지를 정적으로나 동적으로 번역을 해주는 몇몇 웹 페이지 번역 소프트웨어가 있다. 어떤 소프트웨어는 또한 HTML 태그 구조를 예비해 두어, 사용자로 하여금 어려움없이 자신들의 모국어로 표기된 링크를 따라갈 수 있도록 하였다. 더 나아가 카테고리의 이름들 또한 동적으로 번역이 되기 때문에 사용자는 디렉토리들을 사용할 수도 있다.그럼에도 불구하고, 인터넷 사용자들은 아직도 색인화하는데 사용되는 검색 엔진과 상이한 자신의 모국어로 조회하고 검색할 수가 없다. 그 이유는, 웹 페이지 번역 소프트웨어가 존재한다고 하여도, 조회어를 모국어에서 검색 엔진들이 사용하는 다른 언어로 번역하는 것이 결여되어 있기 때문이다.
어떤 조회 번역 프로토타입/솔루션(prototypes/solutions)은 부분적으로 문제를 해결하고 있다. 이들은 사용자로부터 입력을 수집하고, 그 후 그 사용자 입력을 검색 엔진이 받아들일 수 있는 언어로 번역을 하며, 후에 특정 검색 엔진으로 보내지는 조회 명령어를 구축하도록 사전규정된 형식을 제공한다. 그러나, 이들은 다음과 같은 결점들이 존재한다.
첫째, 많은 인터넷 검색 엔진들은 범위를 좁히기 위하여 조합 조회(combinatorial query) 및/혹은 제 2 조회를 지원한다. 전자의 경우, 검색 조건으로서 일치되어야 하는 단어 문자열은 검색되어야 하는 카테고리 혹은 출판일과 같은 다른 검색 조건들과 논리적으로 조합된다. 후자의 경우, 제2 검색은 제1 검색으로부터 되돌려진 결과를 사용하여 이루어진다. 그러나, 이런 기능들은 사용자가 이런 조회 번역 소프트웨어를 사용하게 되면 사라진다.
둘째로, 번역의 모호성은 올바르게 다루어질 수가 없다. 조회 단어들이 한 언어에서 다른 언어로 번역이 될 때는, 대응이 종종 일대다(one-to-many)인 경우가 많다. 문제는 많은 언어에서, 그중 특히 중국어에서 동의어(여러 의미를 가지는 단어)가 존재함으로 인해 더 복잡해진다. 예를 들어, 중국 단어 "腔"(PINYIN:_qung1)은 4가지 의미를 갖으며, 각 의미는 여러개의 영어 번역에 대응될 수 있다. 제 1 의미는 영어 단어로 "공동" (cavity) 및 "방" (chamber)으로 번역될 수 있다. 제 2 의미는 "연설" (speech)이라는 영어 단어로 번역될 수 있다. 제 3 의미는 "선율" (tune) 및 "조율" (pitch)이라는 영어 단어로 번역될 수있다. 제 4 의미는 "억양" (accent) 및 "어조" (tone)라는 영어 단어로 번역될 수 있다. 중국어에는 이런 종류의 동의어들이 많다.
본 발명이 설명하는 인터넷 검색 엔진을 위한 조회 번역 서버는 위의 단점들을 제거할 수 있다.
그러므로, 본 발명의 제 1 목적은 인터넷 사용자로 하여금 모국어로 조회 서비스를 사용할 수 있도록 하기 위한 방법을 제공하기 위함이다.
본 발명의 제 2 목적은 인터넷 사용자로 하여금 모국어로 조회 서비스를 사용할 수 있도록 하기 위한 시스템을 제공하기 위함이다.
본 발명의 제 3 목적은 데이터베이스 사용자로 하여금 모국어로 조회 서비스를 사용할 수 있도록 하기 위한 일종의 시스템을 제공하기 위함이다.
상기 제 1 목적의 구현을 위하여, 본 발명은 다수의 기존 인터넷 검색 엔진을 사용하여 인터넷 사용자들에게 모국어 조회 서비스를 제공하기 위한 방법인데, 각 검색 엔진은 각각의 전용 조회 언어(dedicated query language)를 가지며, 상기 전용 언어로 된 조회 용어를 포함하는 조회 요청을 수신하고 상기 조회 용어와 관련된 조회 결과를 되돌려주게 되어 있으며, 상기 방법은:
(a) 어떤 사이트에서 사용자로부터 최초 조회 요청(original query request) - 상기 최초 조회 요청에는 상기 사용자 자신의 모국어로 되어 있는 조회 용어가 있음 - 을 수신하는 단계;
(b) 상기 다수의 검색 엔진으로부터 적절한 검색 엔진을 선택하는 단계;
(c) 모국어로 되어 있는 상기 조회 용어를 상기 선택된 검색 엔진의 전용 언어로 되어 있는 조회 용어로 변환하는 단계;
(d) 상기 최초 조회 요청 및 상기 전용 언어로 되어 있는 상기 조회 용어에 기초하여, 상기 검색 엔진으로 향하는 새로운 조회 요청을 구축하는 단계;
(e) 상기 새로운 조회 요청을 상기 선택된 검색 엔진으로 보내고 또한 되돌아온 조회 결과를 수신하는 단계;
(f) 상기 조회 결과를 상기 최초 조회 요청에 관한 조회 결과로서 상기 사용자에게 되돌려 보내는 단계를 포함하는 것을 특징으로 한다.
본 발명은 또한 다수의 기존 인터넷 검색 엔진을 사용하여 인터넷 사용자들에게 모국어 조회 서비스를 제공하기 위한 방법인데, 각 검색 엔진은 각각의 전용 조회 언어(dedicated query language)를 가지며, 상기 전용 언어로 된 조회 용어를 포함하는 조회 요청을 수신하고 상기 조회 용어와 관련된 조회 결과를 되돌려주게 되어 있으며, 상기 방법은:
(a) 어떤 사이트에서 상기 인터넷 사용자로부터 최초 조회 요청 - 상기 최초 조회 요청은 상기 사용자로부터 요청된 URL을 포함하며, 상기 URL은 상기 사이트를 지정하기 위한 프리픽스(prefix)를 가짐 - 을 수신하는 단계;
(b) 상기 URL로부터 상기 프리픽스를 제거하는 단계;
(c) 상기 다수의 검색 엔진으로부터 적절한 검색 엔진을 선택하는 단계;
(d) 만일 상기 제거된 프리픽스가 리다이렉트 프리픽스(redirect prefix)라면,
(d1) 상기 URL을 포함하는 요청을 상기 선택된 검색 엔진에 보내고 그에 대한 응답으로 웹 페이지를 수신하는 단계;
(d2) 조회 용어를 필요로 하는 URL의 앞부분에 번역 프리픽스를 추가하고, 상기 웹 페이지에서 다른 URL들의 앞부분에 리다이렉트 프리픽스를 추가하여, 새로운 웹 페이지를 형성하는 단계를 수행하는 단계를 실행하는 단계;
(e) 만일 상기 제거된 프리픽스가 번역 프리픽스라면,
(e1) 상기 URL의 파라미터에서 사용자의 모국어로 되어 있는 조회 용어를 상기 선택된 검색 엔진의 상기 전용 언어로 되어 있는 조회 단어들로 번역하는 단계;
(e2) 상기 URL의 파라미터들에서 사용자의 모국어로 된 조회 용어를 상기 전용 언어로 된 조회 용어로 바꾸는 단계;
(e3) 상기 URL의 앞부분에 리다이렉트 프리픽스를 추가하는 단계;
(e4) 새로운 웹 페이지를 생성하고, 상기 웹 페이지에 상기 URL 및 스크립트 프로그램(script program)을 내장시키는 단계 - 상기 스크립트 프로그램을 상기 새로운 웹 페이지를 수신하는 클라이언트로 하여금 상기 웹 페이지에 내장되어 있는 상기 URL에 기초하여 또 다른 최초 조회 요청을 자동적으로 보내는 단계를 수행할 수 있게 함 - 를 실행하는 단계;
(f) 상기 새로운 웹 페이지를 최초 조회 요청과 관련된 조회 결과로서 상기 사용자에게 다시 되돌려 보내는 단계를 포함하는 것을 특징으로 한다.
상기 제 2 목적의 구현을 위하여, 본 발명은 다수의 기존 인터넷 검색 엔진을 사용하여 인터넷 사용자들에게 모국어 조회 서비스를 제공하기 위한 시스템인데, 각 검색 엔진은 각각의 전용 조회 언어(dedicated query language)를 가지며, 상기 전용 언어로 된 조회 용어를 포함하는 조회 요청을 수신하고 상기 조회 용어와 관련된 조회 결과를 되돌려주게 되어 있으며, 상기 시스템은:
클라이언트에 의해 보내진 조회 요청을 수신하고 상기 클라이언트에게 조회 결과를 되돌려주기 위한 클라이언트 인터페이스(interface);
상기 클라이언트 인터페이스로부터 상기 조회 요청을 수신하고, 요청된 URL들로부터 프리픽스를 제거하며, 상기 조회 요청들을 상기 제거된 프리픽스에 기초하여 상이한 구성요소들에게 분산하기 위한 요청 디스패칭 장치(request dispatching apparatus);
프리픽스로서 상기 요청 디스패칭 장치로부터의 리다이렉트 프리픽스를 갖는 조회 요청을 수신하고, URL에 의해 지정된 검색 엔진에게 상기 조회 요청을 보내며, URL 요청의 웹 페이지를 얻기 위한 웹 페이지 획득 장치;
조회 용어를 필요로 하는 URL들의 앞부분에 번역 프리픽스를 추가하고 상기 얻어진 웹 페이지에서 다른 URL들의 앞에 리다이렉트 프리픽스를 추가함으로써 새로운 웹 페이지를 형성하며, 상기 새로운 웹 페이지를 상기 클라이언트 인터페이스에 보내기 위한 웹 페이지 수정 장치(web page modifying apparatus);
프리픽스로서 상기 요청 디스패칭 장치로부터의 번역 프리픽스를 갖는 조회 요청을 수신하고, 요청된 URL에서 사용자의 모국어로 되어 있는 조회 용어를 상기 검색 엔진의 전용 언어로 된 조회 용어로 번역하고 상기 번역된 조회요청으로 바꾸며, 상기 URL의 앞부분에 리다이렉트 프리픽스를 추가하기 위한 조회 번역 장치; 및
새로운 웹 페이지를 생성하고, 상기 웹 페이지에 상기 URL 및 스크립트 프로그램(script program)을 내장시키며, 상기 새로운 웹 페이지를 상기 클라이언트 인터페이스에 보내기 위한 웹 페이지 생성장치 - 상기 스크립트 프로그램은 상기 새로운 웹 페이지를 수신하는 클라이언트로 하여금 상기 웹 페이지에 내장되어 있는 상기 URL에 기초하여 또 다른 최초 조회 요청을 자동적으로 보내는 단계를 수행할 수 있게 함 - 를 포함하는 조회 번역 서버를 더 포함하는 것을 특징으로 한다.
상기 제 3 목적의 구현을 위하여, 본 발명은 다수의 데이터베이스(database)를 사용하여 데이터베이스(database) 사용자들에게 모국어 조회 서비스를 제공하기 위한 시스템을 서술하고 있는데, 각 데이터베이스는 각각의 전용 조회 언어(dedicated query language)를 가지며, 상기 전용 언어로 된 조회 용어를 포함하는 조회 요청을 수신하고 상기 조회 용어와 관련된 조회 결과를 되돌려주게 되어 있으며, 상기 시스템은:
클라이언트에 의해 보내진 조회 요청을 수신하고 상기 클라이언트에게 조회 결과를 되돌려주기 위한 클라이언트 인터페이스(interface);
상기 클라이언트 인터페이스에 의해 수신된 조회 요청에서 사용자의 모국어로 되어 있는 조회 용어를 상기 데이터베이스의 전용 언어로 된 조회 용어로 번역하고, 상기 번역된 조회 요청으로 바꾸기 위한 조회 번역 장치;
상기 조회 요청들에 의해 지정된 데이터베이스에 상기 번역된 조회 요청을보내고, 조회 결과들을 획득하는 조회 결과 획득 장치(query result obtaining apparatus)를 포함하는 조회 번역 서버를 더 포함하는 것을 특징으로 한다.
본 발명의 방법 및 시스템을 사용함으로써, 사용자는 단지 인터넷 검색 엔진 중 하나를 선택하여 검색 엔진에 의해 사용되는 언어를 고려할 필요도 없이 자신의 모국어로 조회를 하기 위하여 내장 복합 조회 함수(built-in complex query function)를 사용하기만 하면 된다. 그러므로 다른 국가에 있는 사용자들은 자신들의 모국어를 사용함으로써 인터넷에 있는 정보들을 검색하거나 조회할 때 제공되는 커다란 편의를 공유할 수 있다.
어떤 검색 엔진들은 조합 조회(combinational queries), 진화적 조회(evolutionary queries), 및 제한 조회(restricted queries)를 포함하는 내장 복합 조회 함수들을 제공한다. 본 발명의 방법 및 시스템에 대해서, 상기 함수들은 계속 유지된다.
본 발명의 방법 및 시스템에 따르면, 사이트-특정(site-specific) 조회 번역을 할 수 있고 동의어의 다중 의미 및 한 의미의 다중 번역을 구별하는 것이 가능하다.
상기 특성들을 가능하게 하기 위해서, 브라우저나 상기 검색 엔진과 같은 임의의 클라이언트 소프트웨어를 수정할 필요가 없다. 그러므로 본 발명의 방법 및 시스템은 구현 및 개선이 쉽다.
도 1은 선행 기술에 널리 적용되고 있는 클라이언트/서버(client/server) 구조이다.
도 2는 본 발명의 바람직한 실시예에 따른 컴퓨터 네트워크이다.
도 3은 본 발명의 바람직한 실시예에 따른 클라이언트/브로커(broker)/서버 구조이다.
도 4는 인터넷 사용자들에게 모국어로 된 조회 서비스를 제공하는 본 발명의 제 1 실시예의 실행 흐름도이다.
도 5는 인터넷 사용자들에게 모국어로 된 조회 서비스를 제공하는 본 발명의 제 2 실시예의 실행 흐름도이다.
도 6은 인터넷 사용자들에게 모국어로 된 조회 서비스를 제공하는 본 발명의 시스템을 나타내는 개략도이다.
도 7 내지 10은 본 발명의 방법 및 시스템을 사용하여 사용자가 중국어로 조회를 할 경우에 대한 브라우저의 데모(demonstration)를 도시한 도면이다.
<도면의 주요 부분에 대한 부호의 설명>
88 : 서버
92 : 클라이언트
200 : 브로커
601 : 클라이언트 인터페이스
602 : 요청 디스패칭 장치
603 : 웹 페이지 검색 장치
604 : 웹 페이지 수정 장치
605 : 조회 번역 장치
606 : 웹 페이지 생성 장치
607 : 사전
608 : 검색 엔진 템플릿 저장 장치
609 : 스크립트 생성기
본 발명의 바람직한 실시예를 설명하고 있는 첨부된 도면을 참조함으로써, 본 발명의 특징 및 장점들이 좀 더 분명해 질 것이다.
도 1은 선행 기술에 널리 적용되고 있는 클라이언트/서버(client/server) 구조이다. 클라이언트 요청(91)(조회 요청, 뉴스 요청과 같은)은 클라이언트(92)에 의해 서버(88)에 보내진다. 서버(88)는 인터넷이나 다른 통신 네트워크를 통해 액세스 될 수 있는 원격 컴퓨터 시스템이 될 수도 있다. 예를 들어, 서버(88)에서 인터넷 검색 엔진을 수행시키면서 사용자 퍼스널 컴퓨터(도시되지 않음)에서 클라이언트(92)를 수행하는 것이 가능하다.
매 클라이언트 요청마다, 서버(88)는 최초 정보(온라인 뉴스나 뉴스 그룹과 같은)를 조사 및 검색하며, 그 후, 서버의 응답(93)으로서 클라이언트(92)에게 필터된 전자 정보를 되돌려준다.
클라이언트(92)는 제1 컴퓨터에서 수행되고, 서버 프로세스(server process)는 제2 컴퓨터 시스템에서 수행될 수 있다. 그들은 통신 매체를 통해 서로 통신을 하며, 따라서, 분산 서비스를 제공하고 다수의 클라이언트로 하여금 하나의 서버에서 정보 수집 능력을 활용할 수 있도록 한다.
월드 와이드 웹에서, 클라이언트 컴퓨터에서 수행되고 있는 HTML과 호환되는 브라우저를 통해 정보를 검색하는 것이 가능하다. 브라우저의 사용자가 URL을 통해 경로를 지정할 경우, 클라이언트 컴퓨터는 도메인 네임 서버(domain name server)에게 URL로 되어 있는 호스트 네임을 상기 서버의 IP 주소로 변환하도록 요청을 보낸다. 도메인 네임 서버는 하나 또는 다중 IP 주소의 리스트로 응답한다. 상기 IP 주소들 중 하나는 서버와 연결하기 위해 상기 브라우저에 의해 사용된다. 만일 상기 서버가 사용 가능한 상태이면, HTML에 따라 포맷된 문서나 다른 객체를 되돌려준다. 상기 서버에서 상기 대응하는 서버 소프트웨어가 수행되며, 상기 클라이언트에게 HTTP 응답의 형태로 정보를 제공한다. HTTP 응답은 HTML 언어로 만들어진 웹 페이지나 다른 서버에 의해 생성된 데이터에 해당된다. 웹 브라우저는 많은 네트워크 및 서버들을 액세스하기 위한 메인 인터페이스가 되었다.
예를 들어, 사용자가 검색 엔진을 사용하여 정보를 검색할 경우, 먼저 자신의 퍼스널 컴퓨터에서 브라우저 소프트웨어 중 하나를 실행하고 나서, 검색 엔진을 지정하고, Yahoo! 사이트의 URL인 "http://www.yahoo.com"과 같은 URL을 검색 엔진에 입력한다. Yahoo! 서버는 상기 브라우저에 자신의 홈페이지를 리턴한다. 상기 홈페이지는 HTML 형식으로 되어 있으며, 브라우저는 HTML 규격에 따른 내용을 디스플레이한다. 상기 사용자는 지시 디바이스를 사용하여 하이퍼텍스트를 클릭하거나 혹은 검색이나 조회를 위해 조회 용어를 입력할 수 있다.
상기 브라우저는 Netscape의 Navigator 및 Communicator, Microsoft의 Internet Explorer, Illinois의 Urbana-Champaign에 있는 National Center for Super Computer Application(NCSA)의 Mosaic 및 Lynx와 같은 시중에서 구할 수 있는 어떠한 브라우저도 가능하다. HTTP에 의해 명시된 기능을 제공할 수 있는 어떠한 브라우저도 사용할 수 있다. 일반적으로 웹 브라우저는 HTML 문서를 파싱 (parse) 및 디스플레이 할 수 있는 프로그램이지만, 미래의 브라우저들은 다이나믹 HTML 및 XML 문서와 같은 다른 마크업 언어를 다룰 수 있을 것이라는 것은 본 기술 분야의 숙련된 기술을 가진 사람이라면 알고 있을 것이다.
전형적인 서버에는 AIX(Advanced Interactive Executable program 버전 4.1 혹은 상위 버전) 운영 시스템 및 서버 프로그램을 수행하는 IBM RISC/6000 컴퓨터(소위 축약 명령 집단 컴퓨터(Reduced Instructions Set Computer)라고 불리는 것에 기초함)를 포함한다. 상기 서버는, 상기 클라이언트에 의해 요청된 파일이나 객체를 얻거나 혹은 요청된 태스크(task)를 실행하기 위하여, 다이얼업(dial-up) 컴퓨터 네트워크를 통해 클라이언트로부터 요청을 받아들인다. 《Hardware Technical Reference Manual of RS/6000, 7013 and 7016 POWERstation and POWERserver》(주문 번호 SA23-2644-00)와 같은 IBM 회사의 많은 출판물에는 RISC 기반의 다양한 종류의 컴퓨터들이 설명되어 있다. 1985년 11월에 IBM사가 출간한 《Technical Reference Manual of AIX operation system》의 초판 및 다른 출판물들에 상기 AIX 운영 체제가 설명되어 있다. 위에서 언급한 것들이 실용적인 것이지만, 임의의 적절한 하드웨어/운영 시스템/서버 조합이 사용될 수 있다. 예를 들어, Microsoft사의 WINDOWS 95/98/NT 서버 구조도 이용가능하다.
도 2는 클라이언트/서버 구조를 따르는 컴퓨터 네트워크(80)를 나타낸다. 인터넷은 상기 구조를 따르는 잘 알려진 컴퓨터 네트워크이다. 그러나, 본 분야의 숙련된 기술을 가진 사람은 누구나 상기 컴퓨터 네트워크(80)가 인터넷 뿐만 아니라 인트라넷(Intranet)과 같은 다른 분산 컴퓨터 네트워크에서도 구현될 수 있다는 것을 알 것이다.
이론상으로, 인터넷은, Internet America와 같은 소정의 인터넷 서비스 제공자(84)나 America Online, Prodigy, CompuServe 등과 같은 온라인 서비스 제공자를 통해 통상 퍼스널 컴퓨터인 클라이언트에 의해 액세스될 수 있는 서버(88)로 구성되는 커다란 네트워크이다. 각 클라이언트는 브라우저(클라이언트)를 수행하여 액세스 제공자들을 통해 서버(88)에 액세스할 수 있다. 본 발명에서, 웹사이트는 디렉토리 서비스를 제공하는 사이트나 검색 엔진, 또는 본 발명의 방법을 실행하는 서버 및 인터넷 사용자들에 대해 모국어 조회 서비스를 제공하기 위한 다수의 검색 엔진을 결합하는 시스템일 수도 있다.
본 발명이 네트워크 전송과 관련있기 때문에, 네트워크 및 이에 대한 동작 원리에 대한 이해를 갖고 있는 것이 도움이 된다. 본 발명이 적용될 수 있는 네트워크에 대한 상세한 설명은 하지 않는다. 예를 들어, 본 발명은 인터넷과 같은 글로벌 네트워크(global network)에 적용될 수 있다.
도 1에 나타난 클라이언트/서버 구조에 기초하여, 본 발명은 도 3에 도시된 인터넷용 클라이언트/브로커/서버 구조를 채택한다. 실질적으로, 상기 클라이언트/서버 구조는 브로커(200)와 서버(88)뿐만 아니라 클라이언트(92)와 브로커(200)사이에서도 존재한다. 도 3에서, 클라이언트(92)는 먼저 브로커(200)에게 요청(91)을 보낸다. 브로커(200)는 상기 요청(91)을 처리하고 서버(88)에 상기 처리된 요청을 보낸다. 서버(88)는 상기 요청에 대해 대응하는 서비스를 제공하며 응답(93)을 브로커(200)에게 리턴한다. 브로커(200)는 상기 응답(93)을 처리하고 상기 처리된 응답을 클라이언트(92)에게 리턴한다.
본 발명의 방법을 실행하는 사이트는 브로커(200) 역할을 한다. 클라이언트(92)는 임의의 현존하는 브라우저일 수도 있고, 서버(88)는 검색 엔진을 제공하는 임의의 현존하는 사이트일 수 있다.
현재로는, 모든 검색 엔진은 전용 언어를 사용한다. 하나의 검색 엔진은 오직 전용 언어로 된 조회 용어만을 받아들일 수 있다. 예를 들어, Yahoo!는 영어로 된 조회 용어를 받아들이기 때문에, 전용 언어는 영어이다. 또 다른 예로는 지정언어가 중국어인 Sina(www.sina.com.cn)를 들 수 있다. 사용자의 모국어는 상기 검색 엔진의 전용 언어와 동일하거나 상이한 어떠한 언어도 될 수가 있다.
도 4는 인터넷 사용자들을 위한 모국어로 된 조회 서비스를 제공하는 본 발명의 제1 실시예에 대한 실행의 플로우챠트이다. 상기 방법은 인터넷에서 현존하는 다수의 검색 엔진을 사용하는데, 각각은 전용 언어를 사용하고, 전용 언어로 되어 있는 조회 용어를 포함하는 조회 요청을 받아들이며, 상기 조회 용어에 관련된 조회 결과를 리턴해 준다.
단계(401)에서, 인터넷 사용자의 모국어로 된 조회 용어를 포함하는 최초 조회 요청이 받아들여진다. 단계(402)에서 상기 요청에 대해 다수의 검색 엔진으로부터 적절한 검색 엔진이 선택된다. 단계(403)에서, 모국어로 된 상기 조회 용어는 상기 선택된 검색 엔진에 의해 사용되는 고유 언어로 번역된다. 단계(404)에서, 새로운 조회 요청은 최초 조회 요청 및 상기 선택된 검색 엔진에서 사용되는 고유 언어에 따라 생성된다. 단계(405)에서, 상기 새로운 조회 요청은 상기 선택된 검색 엔진에 보내지며, 조회 결과가 받아들여진다. 단계(406)에서, 상기 조회 결과는 상기 최초 조회 요청의 관련된 조회 결과로서 상기 사용자에게 리턴된다.
개발자는 상기 AIX, Windows95/98/NT 등을 포함하는 다양한 운영 체제들에서 수행될 수 있도록 자바 언어(Java language)를 사용하여, 도 4의 조회 번역 방법을 구현하는 프로그램을 개발할 수도 있다. 상기 프로그램 코드가 Servlet API 표준에 호환될 수 있도록 만들어질 수 있기 때문에, 많은 웹사이트에 내장되어질 수도 있으며, 다른 웹사이트와 함께 수행될 수도 있다. 물론, 도 2에 도시된 네트워크에 있는 새로운 사이트를 도 4에서 보이는 바와 같이, 인터넷 사용자들에게 모국어로 된 조회 서비스들을 제공하는 방법을 실행하게 하는 구성을 만들 수도 있다. 이런 경우, 상기 새로이 구성된 사이트는 조회 번역 서버(query translation server)라고 불려진다.
도 4의 각 단계의 구현은 아래에 상세히 설명되어 있다.
도 4의 단계(401)는 여러 방식으로 구현될 수 있다.
간단한 방식으로, 상기 조회 번역 서버는 프록시 서버(proxy server)로서 수행된다. 이것은 사용자로 하여금 클라이언트의 소프트웨어에 의해 보내진 모든 조회 요청이 본 발명의 조회 번역 서버로 보내지도록 웹 클라이언트 소프트웨어(web client software)를 구성하는 것을 필요로 한다. 이러한 접근은 때로는 사용자에게 불편을 가져오며, 이미지 및 오디오 파일과 같이 번역될 필요가 없는 파일들까지도 보내지기 때문에 상기 조회 번역 서버 및 컴퓨터 네트워크에 부하를 증가시킨다.
다른 방식은, 상기 조회 번역 서버가 정상적인 서버로서 수행이 되지만 URL 변환 구성을 사용하는 것이다. 상기 구성은 사용자가 조회 요청을 보낼 때 상기요청된 URL의 앞에 상기 조회 번역 서버의 네트워크 주소 및 경로를 포함하는 프리픽스(prefix)를 자동적으로 추가한다. 그러므로, 클라이언트의 모든 조회 요청은 본 발명의 상기 조회 번역 서버에게 자동적으로 전송된다.
특히, 만일 아래에 언급된 유일한 URL 변환 구성이 사용된다면, 클라이언트 소프트웨어에 아무런 수정이 필요없으며, 따라서 사용자의 동작을 매우 용이하게 한다. 또 다른 향상으로는 상기 조회 번역 서버 및 컴퓨터 네트워크의 부하를 감소시키기 위하여, 상이한 프리픽스들이 상이한 URL들의 앞에 놓여지게 된다는 것이다. 이 점은 클라이언트에 의해 보내진 상기 조회 요청을 분석함으로서 쉽게 알 수가 있다. 조회 요청들은 2 종류로 분류될 수 있다. 한가지 종류는 검색 엔진에 의해 사용되는 특정 언어와 상이한 종류의 언어로 된 조회 용어라면, 상기 조회 용어들은 상기 검색 엔진에 보내지기 전에 상기 특정 언어로 번역되어야만 한다. 다른 한 종류는 번역이 필요한 어떠한 조회 용어도 포함하지 않다면, 상기 조회 번역 서버는 해당 검색 엔진에 직접 리다이렉트될 수 있다. 그러므로 이런 두 종류의 조회 요청은 상이하게 다루어져야 한다. 본 발명에서, 상이한 프리픽스들, 즉 번역 프리픽스(translation prefix) 및 리다이렉트 프리픽스(redirect prefix)가 상기 두 종류의 조회 요청의 URL들에 추가되어서, 상기 조회 요청들은 본 발명의 조회 번역 서버에서 상이하게 취급된다.
클라이언트 소프트웨어에 아무런 구성의 변화없이, 프리픽스를 추가하는 과정이 조회 번역 서버에서 이루어진다. 조회 번역 서버는 우선 검색 엔진의 홈페이지를 가져오며, 홈페이지에 내장되어 있는 URL(즉 조회 번역 서버들의 URL)에 적절한 프리픽스들을 추가한 다음, 클라이언트에게 상기 수정된 홈페이지를 리턴한다. 다음의 조회들에서, 유사한 URL 변환이 검색 엔진에 의해 리턴된 모든 웹 페이지에 적용된다.
도 4의 단계(402) 및 (403)는 검색 엔진에 대해 본 발명의 소정의 템플릿(template)을 사용하여 구현될 수 있다. 상기 템플릿은 조회 번역 서버의 메모리나 디스크에 저장될 수 있으며 파일이나 데이터베이스에서 검색될 수도 있다. 상기 템플릿은 조회 번역 서버에 의해 지원되는 검색 엔진을 위한 필요한 정보를 포함하며, 상기 정보는 단계(402) 및 단계(403)에서 사용된다.
예를 들어, 검색 엔진을 위한 다음의 템플릿들이 템플릿 파일에 저장될 수 있다.
...
상기 예에서, 처음 두 템플릿들은 각각 Yahoo! 및 IBM을 위한 것이다. 모든템플릿은 검색 엔진의 검색 프로그램에 대한 URL, 조회 명령에서 번역되어질 파라미터들의 리스트, 상기 검색 엔진에 의해 받아들여지는 특정 언어, 조회 용어의 조합에 대한 규칙, 및 특정 사이트의 사전 내용(dictionary context)을 정의한다. 조회 용어들의 조합에 대한 규칙은 조회 용어들 사이의 관계를 규정하는데 사용된다. 예를 들어, 조회 용어는 "+", "-", "AND", "OR", 혹은 "NOT"에 의해 결합될 수 있다. 상기 규칙은 상이한 검색 엔진들에 대해 서로 다르다. 특정 사이트의 사전 내용은 특정 사이트에서 조회가 완료되면 상기 특정 사전을 명명하는데 사용된다.
템플릿을 사용하는 것이 본 발명의 방법을 지원하기 위한 유일한 방식이 아니라는 것을 지적한다. 인터넷 검색 엔진에 대한 필요한 정보를 저장 및 검색하기 위해서 다른 방법들이 사용될 수도 있다. 이것은 도메인에 있는 개발자들의 상식이며 그러므로 본 발명에 어떠한 제약도 가할 수 없다.
Yahoo! 사이트에 대한 최초 조회 요청이 다음의 URL을 포함하는 단계(401)에서 수신되었다고 가정하자:
http://search.yahoo.com/bin/search?p=y=66
단계(402)에서, 상기 URL과 일치하는 검색 엔진의 템플릿을 찾는다. 다음의 검색 엔진 템플릿이 찾아졌다 :
이것은 Yahoo!에 대한 템플릿이다. 그러므로 사용자는 Yahoo! 검색 엔진에 조회하기를 바란다는 것을 알 수 있다. 또한 상기 템플릿이 단지 파라미터 "p"만이 번역될 필요가 있다고 규정하기 때문에, 상기 URL에 있는 파라미터 리스트는 "p="이다. 상기 검색 엔진의 특정 언어는 영어이다. 상기 검색 엔진에 대한 상기 조합 규칙은 제너릭(Generic)이라 명명되었으며 이는 함수의 형식으로 Yahoo! 검색 엔진에 대한 조회 용어의 조합 규칙을 정의한다. 사전 내용은 없으며(null), 이것은 일반적인 사전이 사용되어져야 한다는 것을 나타낸다.
단계(403)에서, 파라미터 리스트의 모국어(여기서는 중국어)로 된 "p="라는 조회 용어에서 ""가 특정 언어(여기서 영어)로 된 조회 용어로 번역되는데, 예를 들어, "recreation"이다.
다음이 주지되어야 한다. 만일 템플릿 파일에 검색 엔진 템플릿과 일치하는 것이 없다면, 디폴트(default) 규칙이 상기 URL에 대해서 사용되어진다. 상기 디폴트 규칙은 우선 상기 URL내에 내장되어 있는 웹 페이지(사용자가 요청을 내보내는 바로 그 페이지)에 의해 사용되는 언어에 기초하여 상기 URL(템플릿에 있는 "language" 파라미터에 해당됨)에 의해 지정된 검색 엔진에 의해 사용되는 전용 언어가 무엇인지를 검사하거나, 조회 번역 서버에 의해 처리된 상기 URL 히스토리 레코드(history record)로부터 상기 URL과 가장 유사한 URL을 알아내어, 상기 리턴된 웹 페이지에 의해 사용되는 언어를 검사한다. 상기 검사된 결과는 전용 언어로서 분류된다. 그 후, 상기 조회 용어 파라미터(템플릿의 "parameter Name" 파라미터에 해당됨)의 위치는 모국어에 표현되는 조회 파라미터 리스트의 파라미터에 기초하여 찾아진다. 상기 조회 용어 파라미터의 위치 결정이후에, 모국어로 있는 조회 용어 파라미터는 전용 언어로 된 조회 용어로 번역된다. 상기 템플릿에 있는 "assemblerClass" 파라미터 및 "dictionaryContext" 파라미터에 해당되는 파라미터들은 그들의 디폴트 값을 가져온다.
단계(404)에서, 상기 선택된 검색 엔진에 대한 새로운 조회 요청은 상기 최초 조회 요청 및 검색 엔진에 의해 사용되는 특정 언어로 된 조회 용어로부터 만들어진다. 상기 예에서는, 새로운 요청은 다음의 URL을 포함한다 :
http://search.yahoo.com/bin/search?p=recreationy=66
단계(405)는 조회 번역 서버에서 직접 수행될 수도 있다. 그러나, 단순한 접근은, 사용자들에게 다중 번역 선택 사항을 제공하는 것과 같은, 본 발명이 가지는 어떤 독점적인 특성들을 잃어버리는 결과를 낳을 수도 있다. 보다 나은 대안은 응답하는 웹 페이지의 일부로서 클라이언트 측에 다운로드될 때 클라이언트에서 수행되는 어떤 스크립트 프로그램을 미리 정의하는 것이다. 그러므로 상기 웹 페이지는 단계(404)에서 오는 조회 요청 및 소정의 스크립트로부터 만들어지며, 그 후, 응답으로서 상기 클라이언트에게 리턴된다. 상기 응답이 상기 클라이언트에게 수신될 때 자동적으로 실행되는 것이 상기 스크립트의 특성이다.
중국 용어 ""가 "recreation", "game" 혹은 "play"와 같은 몇가지 영어 용어들로 번역이 될 수 있기 때문에, 단계(403) 및 (404)는 다음과 같은 여러 URL을 생성할 수 있다 :
http://search.yahoo.com/bin/search?p=recreationy=66,
http://search.yahoo.com/bin/search?p=gamey=66, 및
http://search.yahoo.com/bin/search?p=playy=66.
이중 하나는, 예를 들어
http://search.yahoo.com/bin/search?p=recreationy=66,
는 디폴트 URL로 표기된다.
번역 과정에서 생성되는 다중 번역 옵션(multiple translation options)은 기록된 스크립트 프로그램의 도움으로 사용자에게 디스플레이 될 수 있고, 상기 디폴트로 번역된 조회 요청은 상기 조회 번역 서버를 통해 검색 엔진으로 보내진다. 서버는 스크립트 프로그램의 세그먼트(segment)를 웹 페이지에 추가하는데, 이것은 그 후 클라이언트로 보내진다. 스크립트 프로그램 그 자체는 상기 클라이언트가 상기 웹 페이지를 수신할 경우, 상기 웹 페이지에 내장된 상기 스크립트 프로그램이 자동적으로 실행되도록 하는 기능을 제공한다. 이것은 본 분야의 숙련된 기술을 가진 사람들에게는 잘 알려져 있으며 이에 대한 추가 설명은 생략한다.
또한, 단계(406)는 단계(401)에서의 것과 유사하게 여러 가지 구현 방법을 가지고 있다. 만일 단계(401)가 에이전트 서버(agent server)를 사용함으로서 구현된다면, 단계(406)에서는 단지 검색 엔진에 의해 리턴된 웹 페이지만을 클라이언트에게 단순히 리턴해 주면 된다. 만일 단계(401)가 URL 변환을 사용하여 구현된다면, 단계(406)는 검색 엔진에 의해 리턴된 상기 웹 페이지의 앞서 언급된 URL 변환 후에만 클라이언트에게 상기 웹 페이지를 리턴한다.
도 5는 인터넷 사용자에게 모국어로 된 조회 서비스를 제공하기 위한 본 발명의 방법에 관한 제2 실시예의 흐름도이다. 상기 방법은 현존하는 다수의 검색 엔진들을 사용하는데, 각각은 자신만의 개별적인 전용 언어로 된 조회 용어의 조회 요청을 받아들이고 상기 조회 용어와 관련된 상기 조회 결과를 리턴해 주기 위한 자신만의 전용 언어가 있다.
단계(501)는 사용자의 최초 조회 요청을 수신한다. 도 5에 도시된 조회 번역 방법이 하나의 포털 사이트에서 동작하며, 포털 사이트의 URL이, 예를 들어 http://portal_site/라고 가정해 보자. 그 후, 단계(501)에서 수신된 클라이언트 요청에서, 상기 요청된 URL은 당연히 http://portal_site/를 포함할 것이다.
단계(502)는 상기 요청된 URL의 프리픽스를 제거한다. 아래에 설명된 바와 같이, 상기 프리픽스는 다음과 같을 수 있다 :
http://portal_site/redirect/(redirect prefix), 또는
http://portal_site/translate/(translate prefix).
물론, 이들 2개 프리픽스는 본 발명에서 어떠한 제약도 가하지 않는다. 실제로, 상기 프리픽스들이 정해진 전용구문(syntax)에 부합하는 한, 다양한 함수들에 따라, 많은 종류의 프리픽스들이 있을 것이다.
단계(503)는 다수의 검색 엔진들로부터 적절한 검색 엔진을 선택한다.
단계(504)는 상기 제거된 프리픽스가 리다이렉션 프리픽스 http://portal_site/redirect 인지 아닌지를 판단한다. 만일 단계(504)의 판단이 "아니오(No)"라면, 상기 처리과정은 단계(505)로 진행한다; 그렇지 않다면, 단계(509)로 진행한다. 상기 예와 같이, 단지 2가지의 프리픽스, 즉 리다이렉션 프리픽스(redirection prefix)와 번역 프리픽스(translation prefix)가 있다. 그러므로 단계(505) 전의 상기 단계들에서 제거된 프리픽스는 확실히 번역 프리픽스, 즉 http://portal_site/translate/ 이다.
만일 단계(501)에서 수신된 요청에서 상기 요청된 URL은:
http://portal_site/translation/http://search.yahoo.com/bin/search?p=y=66,
단계(505)에서 프리픽스가 제거된 URL은
http://search.yahoo.com/bin/search?p=y=66
이 된다.
단계(505)에서, 상기 모국어로 된 URL의 조회 용어 ""(상기 예에서는 중국어임)는 도 4에 있는 단계(402) 및 (403)와 유사한 방식(즉, 검색 엔진 템플릿을 사용함으로서)으로 전용 언어(상기 예에서는 영어이다)로 된 조회 용어로 번역된다. 그 후 단계(506)에서 상기 모국어로 된 조회 용어는 전용 언어로 된 것들로 대체된다.
중국어로 된 용어 ""는 "recreation", "game" 혹은 "play"와 같이 많은 영어 용어로 번역될 수 있다.
단계(506)는 다수의 URL을 생성할 수 있는데, 예를 들면,
상기 3개의 URL들 중 하나는, 예를 들어,
http://search.yahoo.com/bin/search?p=recreationy=66는 디폴트 URL로 표기된다.
상기 결합된 조회 요청들을 지원하기 위해서, 조회 요청에서 "+", "-", "AND", 또는 "NOT"과 같은 조합 연산자는 검색 엔진의 템플릿에 의해 규정된 조합 규칙의 수단에 의해서 식별된다. 그 후, 조합 연산자들에 의해 분리되는, 모국어로 된 조회 용어는 전용 언어로 된 조회 용어로 번역된다.
사이트-특정(site-specific) 검색을 지원하기 위해서, 적절한 사전이 검색 엔진에 대한 템플릿의 사전 내용(dictionaryContext)에 의해 선택되어져야 하며, 번역은 상기 사전을 사용하여 이루어진다. 예를 들어, 만일 사용자 조회가 IBM 사이트에 관한 것이라면, 조회 용어 ""는 "RS/6000", "AS/400" 또는 "S/390"으로 번역되어 대체될 수도 있다. 만일 사용자 조회가 HP 사이트에 관한 것이라면, 조회 용어 ""는 "HP3000" 혹은 "NetServer" 등으로 번역되어 대체될 수도 있다.
단계(506) 후에, 단계(507)에서, 리다이렉트 프리픽스는 위의 URL의 앞에 추가된다. 그러므로, 다음의 3개 URL이 형성된다 :
http://portal_site/rediret/http://search.yahoo.com/bin/search?p=recreationy=66,
http://portal_site/rediret/http://search.yahoo.com/bin/search?p=gamey=66, 및
http://portal_site/rediret/http://search.yahoo.com/bin/search?p=playy=66
그 후 처리과정은 단계(508)로 진행한다. 단계(508)에서, 상기 3개의 URL들 및 스크립트의 세그먼트가 내장되어 있는 새로운 웹 페이지가 생성된다. 상기 스크립트는 웹 페이지가 수신될 경우, 클라이언트에 의해 자동적으로 실행될 것이다. 상기 스크립트를 실행함에 따라, 클라이언트는 사용자에게 중국어 조회 용어 ""의 다중 번역 선택사항을 디스플레이한다. 상기 번역 선택사항들을 디스플레이 하는데에는 많은 방식이 있다. 좋은 방식은 새로운 윈도우를 동적으로 열어서 그 윈도우에 상기 번역 선택사항들을 보여주는 것이다. 모든 번역 선택사항은 하이퍼-링크(hyper-link)를 가지는데, 즉, URL은 URL의 번역을 포함한다. 상기 예에서, 중국어 조회 용어 ""는 영어로 3개의 번역 선택사항들을 갖는다: "recreation", "game" 및 "play". 이들 번역 선택사항은 새로운 윈도우에 보여진다. 사용자는 지시 디바이스를 사용하여 3개의 번역들 중 하나를 클릭할 수 있고 브라우저는 그 후 또 다른 최초 조회 요청을 보낸다. 상기 스크립트의 또 다른 함수는 디폴트 URL (http://portal_site/rediret/http://search.yahoo.com.bin/search?p=recreationy=66)에 기초하여 새로운 요청을 보낸다.
스크립트의 특별한 세그먼트는 사용자가 검색 엔진의 템플릿을 수정할 수 있는 함수를 제공하기 위해 단계(508)에서 웹 페이지에 내장될 수 있다. 예를 들어, 상술한 4개의 아이템(item)과 같이 검색 엔진의 템플릿의 내용을 디스플레이할 수 있다. 사용자는 템플릿의 내용을 수정하여 조회 번역 서버에 상기 수정사항을 제출할 수도 있다.
단계(508) 이후에 처리과정은 단계(511)로 진행된다. 단계(511)에서, 상기 새로 발생된 웹 페이지는 응답으로서 클라이언트에 리턴된다. 상술한 바와 같이, 만일 단계(504)에서의 판단 결과가 "예(YES)"이면, 상기 처리과정은 단계(509)로 진행된다. 단계(509)에서, 조회 번역 서버는 인터넷으로부터 상기 URL에 의해 식별된 웹 페이지를 검색한다.
예를 들면,
http://portal_site/rediret/http://search.yahoo.com/bin/search?p=recreationy=66을 포함하는 웹 페이지가 단계(511)에서 클라이언트로 리턴된다면, 그 후, 클라이언트는 자동적으로 상술한 스크립트를 실행하며 새로운 HTTP 요청을 보낸다. 단계(501, 502, 503 및 504)에서의 처리과정이후에, 다음의 URL에 의해 식별되는 웹 페이지는 단계(509)에서 검색된다:
http://search.yahoo.com/bin/search?p=recreationy=66
이것은 상기 처리과정의 상세 설명이다. 상기 요청이 Yahoo! 검색 엔진에 보내진다. Yahoo! 검색 엔진은 상기 조회 용어에 대해 검색을 하며 웹 페이지에 의해 검색 결과를 리턴한다. 그 후, 상기 처리과정은 단계(510)로 넘어간다.
단계(510)에서, 검색 엔진으로부터 수신된 웹 페이지는 파싱되고 내장된 URL은 변환된다.
이것은 웹 페이지 형성에 사용되는 하이퍼텍스트 마크업 랭귀지(HTML; hypertext markup language)에 대한 간단한 소개이다. HTML은 웹 페이지 내용의 디스플레이를 제어하기 위해 태그(tag)나 <>로 인용된 태그쌍(tag pair)을 사용한다. 모든 HTML 파일은 <HTML> 태그로 시작되어야 하며 </HTML>로 끝난다. 다른 태그들은 다음과 같은 것을 포함한다: 앵커(anchor) 및 링크의 제목을 위한 <A HREF> 및 <A>, 프레임 내용을 위한 <FRAME> 및 </FRAME>, 프레임에 이미지를 삽입하기 위한 <FRAME SRC>, 형태에 관련된 <FORM ACTION>. 태그들은 포개진 형태가 되도록 다른 태그들을 포함할 수 있는데, 그 결과 더 확장된 객체를 생성할 수 있다. 예를 들어, <A HREF> 태그는 링크 가능한 이미지를 생성하기 위해 <IMG SRC> 태그를 포함할 수 있다. 물론, HTML은 계속 발전하는 언어이기 때문에 상기 태그는 단지 한 예로서만 간주될 수 있다.
위의 단계(510)에서, 웹 페이지에서 3종류의 URL이 변환될 수 있다. 그들은,
(1) <A> 또는 <AREA> 태그의 "href" 파라미터
(2) <FRAME> 태그의 "src" 파라미터
(3) <FORM> 태그의 "action" 파라미터
타입 (1) 및 타입 (2) URL 앞에는 리다이렉트 프리픽스가 추가된다.
http://portal_site/redirect/
타입 (3) URL 앞에는 번역 프리픽스가 추가된다.
http://portal_site/translate
웹 페이지에 내장된 URL을 변환한 후에, 새로운 웹 페이지가 생성된다. 그 후, 상기 처리과정은 단계(511)로 진행된다. 단계(511)에서, 새로 생성된 웹 페이지는 응답으로서 클라이언트에게 리턴된다.
도 6은 인터넷 사용자들에게 모국어 조회 서비스를 제공하는 본 발명의 시스템을 나타낸다. 점선으로 된 프레임(dotted frame)에 포함된 것은, 인터넷 사용자들에게 모국어 조회 서비스를 제공하는 본 발명의 시스템을 구성하기 위하여 인터넷(600)에서 검색 엔진을 결합하는 본 발명의 조회 번역 서버이다. 도 6에 도시된 바와 같이, 본 발명의 조회 번역 서버는, 클라이언트로부터 조회 요청을 수신하고 상기 클라이언트에게 조회 결과를 리턴하기 위한 클라이언트 인터페이스(601); 상기 조회 요청에 포함되어 있는 URL의 프리픽스 타입을 검사하고, 리다이렉트 프리픽스가 프리픽스된 URL을 포함하는 조회 요청을 웹 페이지 검색 장치(603; web page retrieval device)로 디스패칭하며, 번역 프리픽스가 프리픽스된 URL을 포함하는 조회 요청을 조회 번역 장치(605; query translation device)로 디스패치하기 위한 요청 디스패칭 장치(602; request dispatching device); URL에 의해 명시된 검색 엔진에 조회 요청을 보내고, URL에 의해 요청된 웹 페이지를 수신하기 위한 웹 페이지 획득 장치(603; web page obtaining device); 웹 페이지 검색 장치(603)에 의해 수신된 웹 페이지에 내장되어 있는 URL을 변환하기 위한, 즉, 조회 용어를 요구하는 URL의 앞에 번역 프리픽스를 추가하고 다른 URL들 앞에는 리다이렉트 프리픽스를 추가하기 위한, 웹 페이지 수정 장치(604; web page modification device); 요청된 URL의 모국어로 된 상기 조회 용어를 검색 엔진의 특정 언어로 된 조회 용어로 번역/대체하기 위한 조회 번역 장치(605); 새로운 웹 페이지를 생성하고, 클라이언트가 웹 페이지를 수신하고 또 다른 조회 요청을 보낼 때 자동적으로 실행될 스크립트의 세그먼트 및 URLs를 내장하기 위한 웹 페이지 생성 장치를 포함한다. 또한, 조회 번역 장치(605)는 사전(607) 및 검색 엔진 템플릿 저장 장치(608)도 사용한다. 사전(607)은 풍부한 사전 엔트리들을 저장하는데, 각각은 모국어 용어로 부터 대응되는 번역들로 매핑(mapping)하는 것을 포함한다. 검색 엔진 템플릿 저장 장치(608)는 도 4 및 도 5에 도시된 바와 같이 참조될 수 있다. 웹 페이지 생성 장치(606)는 클라이언트에서 실행되는 스크립트를 생성하기 위한 스크립트 생성기(609)를 사용한다.
도 7 내지 10은 사용자 조회가 중국어로 되어 있는 경우, 본 발명의 방법 및 시스템을 사용하는 브라우저의 데모를 도시한 것이다.
도 7은 사용자가 조회 번역 서버에 대해 다른 포털 사이트를 통해 Yahoo! 검색 엔진에 들어올 수 있다는 것을 보인 것이다. 물론, 포털 사이트와 같은 것을 사용하는 대신에 다른 접근을 통해 Yahoo! URL 앞에 조회 번역 서버의 프리픽스를 추가하는 것도 가능하다.
도 8은 사용자가 Yahoo! 검색 엔진의 홈페이지에서 중국어로 된 조회 용어 ""를 입력하는 것을 도시한 것이다.
도 9는 본 발명의 조회 번역 서버의 수단을 통해 도 8의 중국어 조회 용어 ""에 대한 조회 요청의 응답, 즉 조회 결과로서, Yahoo!에 의해 리턴된 웹 페이지를 도시한 것이다. 브라우저는 스크립트를 실행하고, 실행 결과는 ""에 대한 3개의 영어 번역 선택사항을 나타내는 또 다른 창을 보이게 된다. 동시에, 사용자는 Yahoo! 검색 엔진에 대한 템플릿을 수정하기 위하여 "Modify Current Setting"이라고 제목이 붙여진 하이퍼텍스트를 클릭할 수 있다.
도 10은 "Modify Current Setting"이라고 제목이 붙여진 하이퍼텍스트를 클릭한 후의 브라우저 윈도우를 도시한 것이다. 조회 번역 서버에 의해 사용된 Yahoo! 검색 엔진에 대한 템플릿의 내용을 보여준다. 사용자는 적절한 변화를 만들 수 있다.
본 발명의 방법을 웹 페이지 번역 서비스와 결합함으로서, 완벽한 조회 번역 서비스를 제공하는 것이 가능하다. 도 8 및 도 9에 상기 응용이 보여지는데, 즉, 사용자는 중국어 조회 용어를 입력하고 중국어 조회 결과를 수신한다. 이것에 더하여, 본 발명은 또한 음성 조회 용어(speech query term)를 적절한 텍스트 조회 용어로 번역해 주는 서비스를 제공하기 위한 음성 인식 시스템(speech recognition system)과 함께 결합되어질 수도 있다.
비록 본 발명의 방법 및 시스템에 관한 상기 설명이 인터넷의 검색 엔진의 내용에 대한 것이지만, 본 발명의 디자인은 데이터베이스의 검색 또는 조회에도 적용될 수 있다. 상기 디자인으로, 데이터베이스의 사용자를 위한 모국어 조회 서비스를 제공하기 위해 만들어진 장치는, 다수의 데이터베이스를 포함한다. 각 데이터베이스는 개별적으로 전용 언어를 가지고, 상기 전용 언어로 된 조회 용어를 포함하는 조회 요청을 수신하게 하고, 상기 조회 용어와 관련된 조회 결과를 리턴한다. 상기 시스템은: 클라이언트에 의해 보내진 조회 요청을 수신하고 상기 클라이언트에게 조회 결과를 리턴하기 위한 클라이언트 인터페이스; 상기 클라이언트 인터페이스에 의해 수신된 조회 요청에서 사용자의 모국어로 된 조회 용어를 수신하고, 그것을 데이터베이스의 전용 언어로 된 조회 용어들로 번역하기 위한 조회 번역 장치; 상기 조회 요청들에 지정된 데이터베이스로 상기 번역된 조회 요청을 보내고, 조회 결과들을 획득하는 조회 결과 획득 장치(query result obtaining apparatus)를 포함하는 조회 번역 서버를 갖는 것을 특징으로 한다. 유사하게, 데이터베이스로의 조회 요청에서 모국어로 된 상기 조회 용어는 음성 조회 용어(speech query terms)로 대체될 수도 있다.
비록 본 발명의 특정 바람직한 실시예들이 상기 포함된 도면을 참조로 하여 상세히 설명되었지만, 본 분야의 숙련된 기술을 가진 자들은 본 발명의 개념 및 범주를 벗어남이 없이 변화 및 변형이 가해질 수도 있다는 것을 이해해야 할 것이다. 그러므로, 본 발명의 범주는 단지 청구항들에 의해 정의된다.
본 발명의 방법 및 시스템을 사용함으로써, 사용자는 단지 인터넷 검색 엔진 중 하나를 선택하여 검색 엔진에 의해 사용되는 언어를 고려할 필요도 없이 자신의 모국어로 조회를 하기 위하여 내장 복합 조회 함수(built-in complex query function)를 사용하기만 하면 된다. 그러므로 다른 국가에 있는 사용자들은 자신들의 모국어를 사용함으로써 인터넷에 있는 정보들을 검색하거나 조회할 때 제공되는 커다란 편의를 공유할 수 있다.
어떤 검색 엔진들은 조합 조회(combinational queries)들, 진화적 조회들(evolutionary queries), 및 제한된 조회들(restricted queries)을 포함하는 내장 복합 조회 함수들을 제공한다. 본 발명의 방법 및 시스템에 대해서, 상기 함수들은 계속 유지된다.
본 발명의 방법 및 시스템에 따르면, 사이트-특정(site-specific) 조회 번역을 할 수 있고 동의어의 다중 의미 및 한 의미의 다중 번역을 구별하는 것이 가능하다.
상기 특성들을 가능하게 하기 위해서, 브라우저나 상기 검색 엔진과 같은 임의의 클라이언트 소프트웨어를 수정할 필요가 없다. 그러므로 본 발명의 방법 및 시스템은 구현 및 개선이 쉽다.

Claims (14)

  1. 다수의 기존 인터넷 검색 엔진을 사용하여 인터넷 사용자들에게 모국어 조회 서비스를 제공하기 위한 방법 - 각 검색 엔진은 각각의 전용 언어(dedicated language)를 가지며, 상기 전용 언어로 된 조회어를 포함하는 조회 요청을 수신하고 상기 조회어와 관련된 조회 결과를 되돌려주게 되어 있음 - 에 있어서,
    (a) 어떤 사이트에서 상기 인터넷 사용자들 중 한 사용자로부터 최초 조회 요청(original query request) - 상기 최초 조회 요청은 상기 사용자의 모국어로 되어 있는 조회어를 포함함 - 을 수신하는 단계;
    (b) 상기 다수의 검색 엔진으로부터 적절한 검색 엔진을 선택하는 단계;
    (c) 모국어로 되어 있는 상기 조회어를 상기 선택된 검색 엔진의 전용 언어로 되어 있는 조회어로 변환하는 단계;
    (d) 상기 최초 조회 요청 및 상기 전용 언어로 되어 있는 상기 조회어에 기초하여, 상기 검색 엔진으로 향하는 새로운 조회 요청을 구축하는 단계;
    (e) 상기 새로운 조회 요청을 상기 선택된 검색 엔진으로 보내고 또한 되돌아온 조회 결과를 수신하는 단계; 및
    (f) 상기 조회 결과를 상기 최초 조회 요청에 관한 조회 결과로서 상기 사용자에게 되돌려 보내는 단계
    를 포함하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서,
    상기 단계 (b)는, 상기 선택된 검색 엔진으로서, 상기 최초 조회 요청에서의 URL에 의해 지정된 검색 엔진을 선택하는 단계를 포함하는 것을 특징으로 하는 방법.
  3. 제2항에 있어서,
    상기 단계 (c)는,
    상기 최초 조회 요청에서의 상기 URL에 기초하여, 검색 엔진 템플릿 저장 장치(search engine template storage)로부터 상기 URL과 일치하는 검색 엔진 템플릿을 검색하는 단계; 및
    모국어로 된 상기 조회어들을 상기 검색된 검색 엔진에서 정의된 전용 언어로 된 조회어들로 번역하는 단계를 포함하는 것을 특징으로 하는 방법.
  4. 제3항에 있어서,
    상기 단계 (c)는,
    상기 검색 엔진 템플릿 저장 장치로부터 상기 URL과 일치되는 검색 엔진 템플릿이 검색되지 않는다면, 상기 URL에 기초하여 상기 사이트에서의 히스토리 레코드(history record)로부터 상기 URL에 대응하는 전용 언어를 검색하는 단계;
    파라미터 값들의 언어적 특성(linguistic characteristics)을 사용함으로써 조회어 파라미터들의 위치를 결정하는 단계; 및
    상기 위치에 있는 모국어로 된 조회어들을 상기 전용 언어로 된 조회어들로 번역하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  5. 제3항 또는 제4항에 있어서,
    상기 단계 (d)는, 상기 새로운 조회 요청을 형성하기 위하여, 상기 최초 조회 요청에서 모국어로 된 조회어들을 상기 전용 언어로 된 조회어들로 교체하는 단계를 포함하는 것을 특징으로 하는 방법.
  6. 다수의 기존 인터넷 검색 엔진을 사용하여 인터넷 사용자들에게 모국어 조회 서비스를 제공하기 위한 방법 - 각 검색 엔진은 각각의 전용 언어를 가지며, 상기 전용 언어로 된 조회어를 포함하는 조회 요청을 수신하고 상기 조회어와 관련된 조회 결과를 되돌려주게 되어 있음 - 에 있어서,
    (a) 어떤 사이트에서 상기 인터넷 사용자로부터 최초 조회 요청 - 상기 최초 조회 요청은 상기 사용자에 의해 요청된 URL을 포함하며, 상기 URL은 상기 사이트를 지정하기 위한 프리픽스(prefix)를 가짐 - 을 수신하는 단계;
    (b) 상기 URL로부터 상기 프리픽스를 제거하는 단계;
    (c) 상기 다수의 검색 엔진으로부터 적절한 검색 엔진을 선택하는 단계;
    (d) 상기 제거된 프리픽스가 리다이렉트 프리픽스(redirect prefix)라면,
    (d1) 상기 URL을 포함하는 요청을 상기 선택된 검색 엔진에 전송하고 응답으로 웹 페이지를 수신하는 단계; 및
    (d2) 새로운 웹 페이지를 형성하기 위하여, 조회어를 필요로 하는 URL들 앞에 번역 프리픽스(translation prefix)를 추가하고, 상기 웹 페이지에서 다른 URL들 앞에 리다이렉트 프리픽스를 추가하는 단계
    를 실행하는 단계;
    (e) 상기 제거된 프리픽스가 번역 프리픽스라면,
    (e1) 상기 URL의 파라미터에서 사용자의 모국어로 된 조회어들을 상기 선택된 검색 엔진의 전용 언어로 된 조회어들로 번역하는 단계;
    (e2) 상기 URL의 파라미터들에서 사용자의 모국어로 된 조회어들을 상기 전용 언어로 된 조회어들로 교체하는 단계;
    (e3) 상기 URL의 앞에 리다이렉트 프리픽스를 추가하는 단계; 및
    (e4) 새로운 웹 페이지를 생성하고, 상기 웹 페이지에 상기 URL 및 스크립트 프로그램(Script program)을 내장시키는 단계 - 상기 스크립트 프로그램은 상기 새로운 웹 페이지를 수신하는 클라이언트로 하여금 상기 웹 페이지에 내장되어 있는 상기 URL에 기초하여 다른 최초 조회 요청을 자동적으로 전송하는 단계를 수행할 수 있게 함 - 를 실행하는 단계; 및
    (f) 상기 새로운 웹 페이지를 상기 최초 조회 요청과 관련된 조회 결과로서 상기 사용자에게 다시 전송하는 단계
    를 포함하는 것을 특징으로 하는 방법.
  7. 제6항에 있어서,
    상기 단계 (c)는, 상기 선택된 검색 엔진으로서, 상기 URL에 의해 지정된 검색 엔진을 선택하는 단계를 포함하는 것을 특징으로 하는 방법.
  8. 제7항에 있어서,
    상기 단계 (e1)은,
    상기 URL에 기초하여, 검색 엔진 템플릿 저장 장치로부터 상기 URL과 일치하는 검색 엔진 템플릿을 검색하는 단계; 및
    모국어로 된 상기 조회어들을 상기 검색된 검색 엔진에서 정의된 전용 언어로 된 조회어들로 번역하는 단계를 포함하는 것을 특징으로 하는 방법.
  9. 제8항에 있어서,
    상기 단계 (e1)는,
    상기 검색 엔진 템플릿 저장 장치로부터 상기 URL과 일치되는 검색 엔진 템플릿이 검색되지 않는다면, 상기 URL에 기초하여 상기 사이트에서의 히스토리 레코드로부터 상기 URL에 대응하는 전용 언어를 검색하는 단계;
    파라미터 값들의 언어적 특성을 사용함으로써 조회어 파라미터들의 위치를 결정하는 단계; 및
    상기 위치에 있는 모국어로 된 조회어들을 상기 전용 언어로 된 조회어들로 번역하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  10. 제6항에 있어서,
    단계 (e)는,
    (e) 상기 제거된 프리픽스가 번역 프리픽스라면,
    (e1) 상기 URL의 파라미터에서 사용자의 모국어로 된 조회어를 상기 선택된 검색 엔진의 전용 언어로 된 다수의 조회어들로 번역하는 단계;
    (e2) 상기 URL의 파라미터에서 사용자의 모국어로 된 상기 조회어를 상기 전용 언어로 된 다수의 조회어들 각각으로 교체하고, 다수의 URL들을 형성하는 단계;
    (e3) 상기 다수의 URL들 각각의 앞에 리다이렉트 프리픽스를 추가하는 단계;
    (e4) 상기 다수의 URL들중 하나를 디폴트 URL(default URL)로 설정하는 단계; 및
    (e5) 새로운 웹 페이지를 생성하고, 상기 웹 페이지에 상기 다수의 URL 및 스크립트 프로그램을 내장시키는 단계 - 상기 스크립트 프로그램은 상기 새로운 웹 페이지를 수신하는 클라이언트로 하여금: 상기 전용 언어로 된 상기 다수의 조회어들을 하이퍼 텍스트(hyper text) 형식으로 디스플레이하는 단계, 및 상기 웹 페이지에 내장되어 있는 상기 디폴트 URL에 기초하여 다른 최초 조회 요청을 자동적으로 전송하는 단계를 실행하게 함 -
    를 수행하는 단계인 것을 특징으로 하는 방법.
  11. 인터넷 사용자들에게 모국어 조회 서비스를 제공하기 위한 시스템 - 상기 시스템은 다수의 인터넷 검색 엔진들을 포함하며, 각 검색 엔진은 각각의 전용 언어를 가지며, 상기 전용 언어로 된 조회어를 포함하는 조회 요청을 수신하고 상기 조회어와 관련된 조회 결과를 되돌려주게 되어 있음 - 에 있어서,
    클라이언트에 의해 전송된 조회 요청을 수신하고 상기 클라이언트에게 조회 결과를 되돌려주기 위한 클라이언트 인터페이스;
    상기 클라이언트 인터페이스로부터 상기 조회 요청을 수신하고, 요청된 URL들로부터 프리픽스를 제거하며, 상기 조회 요청들을 상이한 구성요소들로 분배하기 위한 요청 분배 장치(request distribution apparatus);
    프리픽스로서 상기 요청 분배 장치로부터의 리다이렉트 프리픽스를 갖는 조회 요청을 수신하고, URL에 의해 지정된 검색 엔진에게 상기 조회 요청을 전송하며, 요청된 웹 페이지를 얻기 위한 웹 페이지 검색 장치 (web page retrieving apparatus);
    조회어를 필요로 하는 URL들의 앞에 번역 프리픽스를 추가하고, 상기 획득된 웹 페이지에서 다른 URL들의 앞에 리다이렉트 프리픽스를 추가함으로써 새로운 웹 페이지를 형성하며, 상기 새로운 웹 페이지를 상기 클라이언트 인터페이스에 전송하기 위한 웹 페이지 수정 장치(web page modification apparatus);
    프리픽스로서 상기 요청 분배 장치로부터의 번역 프리픽스를 갖는 조회 요청을 수신하고, 상기 요청된 URL에서 사용자의 모국어로 된 조회어들을 상기 검색 엔진의 전용 언어로 된 조회어로 번역 및 교체하며, 상기 URL의 앞에 리다이렉트 프리픽스를 추가하기 위한 조회 번역 장치; 및
    새로운 웹 페이지를 생성하고, 상기 웹 페이지에 상기 URL 및 스크립트 프로그램을 내장시키고, 상기 새로운 웹 페이지를 상기 클라이언트 인터페이스에 전송하기 위한 웹 페이지 생성장치 - 상기 스크립트 프로그램은 상기 새로운 웹 페이지를 수신하는 클라이언트로 하여금 상기 웹 페이지에 내장되어 있는 상기 URL에 기초하여 다른 조회 요청을 자동적으로 전송하는 단계를 실행할 수 있게 함 - 를 포함하는 조회 번역 서버(query translation server)
    를 더 포함하는 것을 특징으로 하는 시스템.
  12. 제11항에 있어서,
    모국어로 된 상기 조회어들은 음성 조회어인 것을 특징으로 하는 시스템.
  13. 데이터베이스 사용자들에게 모국어 조회 서비스를 제공하기 위한 시스템 - 상기 시스템은 복수의 데이터베이스들을 포함하고, 각 데이터베이스는 각각의 전용 언어를 가지며, 상기 전용 언어로 된 조회어를 포함하는 조회 요청을 수신하고 상기 조회어와 관련된 조회 결과를 되돌려 줌 - 에 있어서,
    클라이언트에 의해 전송된 조회 요청을 수신하고 상기 클라이언트에게 조회 결과를 되돌려주기 위한 클라이언트 인터페이스;
    상기 클라이언트 인터페이스에 의해 수신된 상기 조회 요청에서 사용자의 모국어로 된 조회어를 상기 데이터베이스의 상기 전용 언어로 된 조회어들로 번역 및 교체하기 위한 조회 번역 장치; 및
    상기 조회 요청들에 의해 지정된 상기 데이터베이스에 상기 번역된 조회 요청을 전송하고 조회 결과를 획득하는 조회 결과 획득 장치
    를 포함하는 조회 번역 서버
    를 더 포함하는 것을 특징으로 하는 시스템.
  14. 제13항에 있어서,
    모국어로 된 상기 조회어들은 음성 조회어인 것을 특징으로 하는 시스템.
KR10-2000-0040799A 1999-07-28 2000-07-15 모국어 조회 서비스를 제공하기 위한 방법 및 시스템 KR100413309B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN99110540.0 1999-07-28
CNB991105400A CN1176432C (zh) 1999-07-28 1999-07-28 提供本国语言查询服务的方法和系统

Publications (2)

Publication Number Publication Date
KR20010085185A KR20010085185A (ko) 2001-09-07
KR100413309B1 true KR100413309B1 (ko) 2003-12-31

Family

ID=5274586

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2000-0040799A KR100413309B1 (ko) 1999-07-28 2000-07-15 모국어 조회 서비스를 제공하기 위한 방법 및 시스템

Country Status (6)

Country Link
US (1) US7058626B1 (ko)
EP (1) EP1072984A3 (ko)
JP (1) JP3548098B2 (ko)
KR (1) KR100413309B1 (ko)
CN (1) CN1176432C (ko)
TW (1) TW429354B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024063183A1 (ko) * 2022-09-19 2024-03-28 쿠팡 주식회사 테스트를 수행하기 위한 방법 및 장치

Families Citing this family (170)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
CN1176432C (zh) * 1999-07-28 2004-11-17 国际商业机器公司 提供本国语言查询服务的方法和系统
JP3621643B2 (ja) * 2000-05-30 2005-02-16 株式会社 ネットピア.コム 実名を利用した地域情報提供システム及びその方法
US20050044148A1 (en) * 2000-06-29 2005-02-24 Microsoft Corporation Method and system for accessing multiple types of electronic content
US8706747B2 (en) 2000-07-06 2014-04-22 Google Inc. Systems and methods for searching using queries written in a different character-set and/or language from the target pages
US20050144240A1 (en) * 2000-09-13 2005-06-30 Janko Mrsic-Flogel Data communications
US8806326B1 (en) * 2000-09-25 2014-08-12 Nokia Inc. User preference based content linking
JP2002189721A (ja) * 2000-10-11 2002-07-05 Mieko Tsuyusaki Webページ検索システム及び翻訳システム
US7451136B2 (en) * 2000-10-11 2008-11-11 Microsoft Corporation System and method for searching multiple disparate search engines
GB0025299D0 (en) * 2000-10-13 2000-11-29 Ibm Request tracking for analysis of website navigation
US7231421B2 (en) * 2000-10-13 2007-06-12 Kabushiki Kaisha Toshiba Data relay system, data relay method, data relay program, information processing method, and information processing program
US7181508B1 (en) * 2000-11-09 2007-02-20 Oki Data Americas, Inc. System and method for communicating, monitoring and configuring a device operatively connected to a network
US20030115040A1 (en) * 2001-02-09 2003-06-19 Yue Xing International (multiple language/non-english) domain name and email user account ID services system
JP3379090B2 (ja) * 2001-03-02 2003-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
US7512666B2 (en) * 2001-04-18 2009-03-31 Yahoo! Inc. Global network of web card systems and method thereof
GB2378774A (en) * 2001-05-01 2003-02-19 One Stop To Ltd Searching procedures
JP2002351892A (ja) * 2001-05-30 2002-12-06 A & D:Kk 商標検索システム及び商標出願支援システム
US20020188435A1 (en) * 2001-06-07 2002-12-12 Microsoft Corporation Interface for submitting richly-formatted documents for remote processing
US7146358B1 (en) 2001-08-28 2006-12-05 Google Inc. Systems and methods for using anchor text as parallel corpora for cross-language information retrieval
KR100456621B1 (ko) * 2001-12-24 2004-11-10 한국전자통신연구원 데이터베이스 등록소 검색을 이용한 관계-필터 질의어처리장치 및 방법
US7260570B2 (en) 2002-02-01 2007-08-21 International Business Machines Corporation Retrieving matching documents by queries in any national language
US6952691B2 (en) * 2002-02-01 2005-10-04 International Business Machines Corporation Method and system for searching a multi-lingual database
US7853719B1 (en) * 2002-02-11 2010-12-14 Microsoft Corporation Systems and methods for providing runtime universal resource locator (URL) analysis and correction
ATE330287T1 (de) * 2002-04-12 2006-07-15 Targit As Verfahren zur verarbeitung von mehrsprachigen abfragen
JP2004118740A (ja) * 2002-09-27 2004-04-15 Toshiba Corp 質問応答システム、質問応答方法、質問応答プログラム
CN1685341B (zh) * 2002-09-30 2014-09-10 开拧系统公司 跨语言搜索结果的闪烁注释标注加亮
KR100456027B1 (ko) * 2002-12-10 2004-11-08 한국전자통신연구원 지-에프큐엘을 이용한 이비엑스엠엘 필터질의 변환 장치및 방법
US20060106574A1 (en) * 2002-12-19 2006-05-18 Hiroyoshi Asakawa Nozzle information search system and nozzle catalog data base
US7627479B2 (en) * 2003-02-21 2009-12-01 Motionpoint Corporation Automation tool for web site content language translation
WO2004107112A2 (en) * 2003-05-23 2004-12-09 Snapbridge Software, Inc. Data federation methods and system
US7854009B2 (en) 2003-06-12 2010-12-14 International Business Machines Corporation Method of securing access to IP LANs
US8028073B2 (en) * 2003-06-25 2011-09-27 Oracle International Corporation Mobile meeting and collaboration
US9094805B2 (en) * 2003-06-25 2015-07-28 Oracle International Corporation Mobile messaging concierge
US7206780B2 (en) * 2003-06-27 2007-04-17 Sbc Knowledge Ventures, L.P. Relevance value for each category of a particular search result in the ranked list is estimated based on its rank and actual relevance values
WO2005020106A1 (en) * 2003-08-18 2005-03-03 Sap Aktiengesellschaft Method and system for selecting a search engine and executing a search
US8014997B2 (en) 2003-09-20 2011-09-06 International Business Machines Corporation Method of search content enhancement
DE10348920A1 (de) * 2003-10-21 2005-05-25 Bayer Materialscience Ag Computersystem und Verfahren zur mehrsprachigen assoziativen Suche
SG153628A1 (en) * 2004-01-14 2009-07-29 Agency Science Tech & Res Method and system for data retrieval from heterogeneous data sources
US7287042B1 (en) * 2004-03-03 2007-10-23 A9.Com, Inc. Search engine system supporting inclusion of unformatted search string after domain name portion of URL
JP2006526215A (ja) * 2004-03-22 2006-11-16 ニトゲン・テクノロジーズ・インコーポレーテッド ストリーミング基盤のコンテンツ分散形ネットワークシステムとファイル分割、併合及び再生方法
US8972444B2 (en) 2004-06-25 2015-03-03 Google Inc. Nonstandard locality-based text entry
US8392453B2 (en) 2004-06-25 2013-03-05 Google Inc. Nonstandard text entry
US7856441B1 (en) 2005-01-10 2010-12-21 Yahoo! Inc. Search systems and methods using enhanced contextual queries
US7409402B1 (en) * 2005-09-20 2008-08-05 Yahoo! Inc. Systems and methods for presenting advertising content based on publisher-selected labels
US7958115B2 (en) * 2004-07-29 2011-06-07 Yahoo! Inc. Search systems and methods using in-line contextual queries
US7421441B1 (en) * 2005-09-20 2008-09-02 Yahoo! Inc. Systems and methods for presenting information based on publisher-selected labels
US20070106657A1 (en) * 2005-11-10 2007-05-10 Brzeski Vadim V Word sense disambiguation
US7603349B1 (en) 2004-07-29 2009-10-13 Yahoo! Inc. User interfaces for search systems using in-line contextual queries
US7599838B2 (en) * 2004-09-01 2009-10-06 Sap Aktiengesellschaft Speech animation with behavioral contexts for application scenarios
US8694532B2 (en) * 2004-09-17 2014-04-08 First American Data Co., Llc Method and system for query transformation for managing information from multiple datasets
US20060146838A1 (en) * 2004-12-30 2006-07-06 Motorola, Inc. System and method for automatic and direct routing of information in a network
US8751240B2 (en) * 2005-05-13 2014-06-10 At&T Intellectual Property Ii, L.P. Apparatus and method for forming search engine queries based on spoken utterances
US7836027B2 (en) * 2005-06-22 2010-11-16 Statware, Inc. Method and apparatus for communicating list orders
US8249873B2 (en) * 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
US20070050188A1 (en) * 2005-08-26 2007-03-01 Avaya Technology Corp. Tone contour transformation of speech
US7895193B2 (en) * 2005-09-30 2011-02-22 Microsoft Corporation Arbitration of specialized content using search results
US20070106653A1 (en) * 2005-10-12 2007-05-10 Yu Sun Search engine
US7672831B2 (en) * 2005-10-24 2010-03-02 Invention Machine Corporation System and method for cross-language knowledge searching
CA2578666C (en) * 2006-02-13 2016-01-26 Xkoto Inc. Method and system for load balancing a distributed database
US8813021B1 (en) 2006-02-16 2014-08-19 Cypress Semiconductor Corporation Global resource conflict management for an embedded application design
US9507778B2 (en) 2006-05-19 2016-11-29 Yahoo! Inc. Summarization of media object collections
US20070271231A1 (en) * 2006-05-22 2007-11-22 Jimmy Jong-Yuan Lin Search method on the Internet
US8568236B2 (en) * 2006-07-28 2013-10-29 Yahoo! Inc. Fantasy sports agent
US8403756B2 (en) * 2006-07-28 2013-03-26 Yahoo! Inc. Fantasy sports alert generator
CN100416570C (zh) * 2006-09-22 2008-09-03 浙江大学 一种基于问答库的中文自然语言问答方法
US7979425B2 (en) 2006-10-25 2011-07-12 Google Inc. Server-side match
US20080102911A1 (en) * 2006-10-27 2008-05-01 Yahoo! Inc. Integration of personalized fantasy data with general sports content
US8594702B2 (en) 2006-11-06 2013-11-26 Yahoo! Inc. Context server for associating information based on context
US7742922B2 (en) * 2006-11-09 2010-06-22 Goller Michael D Speech interface for search engines
US9110903B2 (en) 2006-11-22 2015-08-18 Yahoo! Inc. Method, system and apparatus for using user profile electronic device data in media delivery
US8402356B2 (en) 2006-11-22 2013-03-19 Yahoo! Inc. Methods, systems and apparatus for delivery of media
US8671354B2 (en) * 2006-12-22 2014-03-11 Yahoo! Inc. Player streaks and game data visualization
US20080153589A1 (en) * 2006-12-22 2008-06-26 Yahoo! Inc. Rotisserie fantasy league visualization tools
US8769099B2 (en) 2006-12-28 2014-07-01 Yahoo! Inc. Methods and systems for pre-caching information on a mobile computing device
US8359188B2 (en) * 2006-12-28 2013-01-22 Verizon Patent And Licensing Inc. Network-based systems and methods for providing access to remote language services assets
KR20080074617A (ko) * 2007-02-09 2008-08-13 (주)넷피아닷컴 키워드별 검색 서비스 제공시스템 및 제공방법
US7720856B2 (en) * 2007-04-09 2010-05-18 Sap Ag Cross-language searching
WO2008151466A1 (en) * 2007-06-14 2008-12-18 Google Inc. Dictionary word and phrase determination
US9015279B2 (en) * 2007-06-15 2015-04-21 Bryte Computer Technologies Methods, systems, and computer program products for tokenized domain name resolution
CN101868797B (zh) * 2007-09-21 2013-05-01 谷歌公司 跨语言搜索
US20090083026A1 (en) * 2007-09-24 2009-03-26 Microsoft Corporation Summarizing document with marked points
US9754022B2 (en) * 2007-10-30 2017-09-05 At&T Intellectual Property I, L.P. System and method for language sensitive contextual searching
US8069142B2 (en) * 2007-12-06 2011-11-29 Yahoo! Inc. System and method for synchronizing data on a network
US8307029B2 (en) 2007-12-10 2012-11-06 Yahoo! Inc. System and method for conditional delivery of messages
US8671154B2 (en) 2007-12-10 2014-03-11 Yahoo! Inc. System and method for contextual addressing of communications on a network
US8166168B2 (en) 2007-12-17 2012-04-24 Yahoo! Inc. System and method for disambiguating non-unique identifiers using information obtained from disparate communication channels
US9706345B2 (en) 2008-01-04 2017-07-11 Excalibur Ip, Llc Interest mapping system
US9626685B2 (en) 2008-01-04 2017-04-18 Excalibur Ip, Llc Systems and methods of mapping attention
US8762285B2 (en) 2008-01-06 2014-06-24 Yahoo! Inc. System and method for message clustering
US20090182618A1 (en) 2008-01-16 2009-07-16 Yahoo! Inc. System and Method for Word-of-Mouth Advertising
US8554623B2 (en) * 2008-03-03 2013-10-08 Yahoo! Inc. Method and apparatus for social network marketing with consumer referral
US8560390B2 (en) 2008-03-03 2013-10-15 Yahoo! Inc. Method and apparatus for social network marketing with brand referral
US8538811B2 (en) 2008-03-03 2013-09-17 Yahoo! Inc. Method and apparatus for social network marketing with advocate referral
US8745133B2 (en) * 2008-03-28 2014-06-03 Yahoo! Inc. System and method for optimizing the storage of data
US8589486B2 (en) 2008-03-28 2013-11-19 Yahoo! Inc. System and method for addressing communications
WO2009118010A1 (en) * 2008-03-28 2009-10-01 Kobenhavns Universitet A search method and a method of providing an electronic database
US8271506B2 (en) 2008-03-31 2012-09-18 Yahoo! Inc. System and method for modeling relationships between entities
US8051080B2 (en) * 2008-04-16 2011-11-01 Yahoo! Inc. Contextual ranking of keywords using click data
KR100978581B1 (ko) * 2008-05-08 2010-08-27 엔에이치엔(주) 웹 페이지 열람 중에 편리하게 사전 서비스를 제공하기위한 방법 및 시스템
US20090287474A1 (en) * 2008-05-16 2009-11-19 Yahoo! Inc. Web embedded language input arrangement
US20090327224A1 (en) * 2008-06-26 2009-12-31 Microsoft Corporation Automatic Classification of Search Engine Quality
US8813107B2 (en) 2008-06-27 2014-08-19 Yahoo! Inc. System and method for location based media delivery
US8452855B2 (en) 2008-06-27 2013-05-28 Yahoo! Inc. System and method for presentation of media related to a context
US8706406B2 (en) 2008-06-27 2014-04-22 Yahoo! Inc. System and method for determination and display of personalized distance
US8583668B2 (en) 2008-07-30 2013-11-12 Yahoo! Inc. System and method for context enhanced mapping
US10230803B2 (en) 2008-07-30 2019-03-12 Excalibur Ip, Llc System and method for improved mapping and routing
US8386506B2 (en) 2008-08-21 2013-02-26 Yahoo! Inc. System and method for context enhanced messaging
JP5137200B2 (ja) * 2008-08-26 2013-02-06 日本電信電話株式会社 ハイパーテキスト転送プロトコルネットワークおよびデータ転送方法
US8281027B2 (en) 2008-09-19 2012-10-02 Yahoo! Inc. System and method for distributing media related to a location
US8108778B2 (en) 2008-09-30 2012-01-31 Yahoo! Inc. System and method for context enhanced mapping within a user interface
US9600484B2 (en) 2008-09-30 2017-03-21 Excalibur Ip, Llc System and method for reporting and analysis of media consumption data
US20100082427A1 (en) * 2008-09-30 2010-04-01 Yahoo! Inc. System and Method for Context Enhanced Ad Creation
US8024317B2 (en) 2008-11-18 2011-09-20 Yahoo! Inc. System and method for deriving income from URL based context queries
US8060492B2 (en) * 2008-11-18 2011-11-15 Yahoo! Inc. System and method for generation of URL based context queries
US8032508B2 (en) 2008-11-18 2011-10-04 Yahoo! Inc. System and method for URL based query for retrieving data related to a context
US9805123B2 (en) * 2008-11-18 2017-10-31 Excalibur Ip, Llc System and method for data privacy in URL based context queries
US9224172B2 (en) 2008-12-02 2015-12-29 Yahoo! Inc. Customizable content for distribution in social networks
US8055675B2 (en) 2008-12-05 2011-11-08 Yahoo! Inc. System and method for context based query augmentation
US8166016B2 (en) 2008-12-19 2012-04-24 Yahoo! Inc. System and method for automated service recommendations
US9323854B2 (en) * 2008-12-19 2016-04-26 Intel Corporation Method, apparatus and system for location assisted translation
US20100185509A1 (en) * 2009-01-21 2010-07-22 Yahoo! Inc. Interest-based ranking system for targeted marketing
CN102439595A (zh) 2009-03-13 2012-05-02 发明机器公司 基于文本文档和用户问题的语义标记的问答系统和方法
US20100241689A1 (en) * 2009-03-19 2010-09-23 Yahoo! Inc. Method and apparatus for associating advertising with computer enabled maps
US8150967B2 (en) 2009-03-24 2012-04-03 Yahoo! Inc. System and method for verified presence tracking
US8108421B2 (en) * 2009-03-30 2012-01-31 Microsoft Corporation Query throttling during query translation
US9171078B2 (en) * 2009-04-29 2015-10-27 Microsoft Technology Licensing, Llc Automatic recommendation of vertical search engines
US20100280913A1 (en) * 2009-05-01 2010-11-04 Yahoo! Inc. Gift credit matching engine
US10671698B2 (en) 2009-05-26 2020-06-02 Microsoft Technology Licensing, Llc Language translation using embeddable component
US9405745B2 (en) * 2009-06-01 2016-08-02 Microsoft Technology Licensing, Llc Language translation using embeddable component
US10223701B2 (en) 2009-08-06 2019-03-05 Excalibur Ip, Llc System and method for verified monetization of commercial campaigns
US20140114986A1 (en) * 2009-08-11 2014-04-24 Pearl.com LLC Method and apparatus for implicit topic extraction used in an online consultation system
US9904436B2 (en) 2009-08-11 2018-02-27 Pearl.com LLC Method and apparatus for creating a personalized question feed platform
US9646079B2 (en) 2012-05-04 2017-05-09 Pearl.com LLC Method and apparatus for identifiying similar questions in a consultation system
US8914342B2 (en) 2009-08-12 2014-12-16 Yahoo! Inc. Personal data platform
US8364611B2 (en) 2009-08-13 2013-01-29 Yahoo! Inc. System and method for precaching information on a mobile device
US20110119268A1 (en) * 2009-11-13 2011-05-19 Rajaram Shyam Sundar Method and system for segmenting query urls
US8650172B2 (en) * 2010-03-01 2014-02-11 Microsoft Corporation Searchable web site discovery and recommendation
US8972397B2 (en) * 2010-03-11 2015-03-03 Microsoft Corporation Auto-detection of historical search context
EP2593884A2 (en) 2010-07-13 2013-05-22 Motionpoint Corporation Dynamic language translation of web site content
US8977624B2 (en) 2010-08-30 2015-03-10 Microsoft Technology Licensing, Llc Enhancing search-result relevance ranking using uniform resource locators for queries containing non-encoding characters
US8239366B2 (en) 2010-09-08 2012-08-07 Nuance Communications, Inc. Method and apparatus for processing spoken search queries
EP2612261B1 (en) * 2010-09-08 2018-11-07 Nuance Communications, Inc. Internet search related methods and apparatus
US20120059658A1 (en) * 2010-09-08 2012-03-08 Nuance Communications, Inc. Methods and apparatus for performing an internet search
US8341142B2 (en) 2010-09-08 2012-12-25 Nuance Communications, Inc. Methods and apparatus for searching the Internet
US9779168B2 (en) 2010-10-04 2017-10-03 Excalibur Ip, Llc Contextual quick-picks
US20120095997A1 (en) * 2010-10-18 2012-04-19 Microsoft Corporation Providing contextual hints associated with a user session
US9164988B2 (en) * 2011-01-14 2015-10-20 Lionbridge Technologies, Inc. Methods and systems for the dynamic creation of a translated website
US20120289156A1 (en) * 2011-05-09 2012-11-15 Wesley Boudville Multiple uses of an e-book reader
US8635201B2 (en) 2011-07-14 2014-01-21 Nuance Communications, Inc. Methods and apparatus for employing a user's location in providing information to the user
US8812474B2 (en) 2011-07-14 2014-08-19 Nuance Communications, Inc. Methods and apparatus for identifying and providing information sought by a user
US9489457B2 (en) 2011-07-14 2016-11-08 Nuance Communications, Inc. Methods and apparatus for initiating an action
US9292603B2 (en) 2011-09-30 2016-03-22 Nuance Communications, Inc. Receipt and processing of user-specified queries
US9342615B2 (en) * 2011-12-07 2016-05-17 Google Inc. Reducing redirects
US9501580B2 (en) 2012-05-04 2016-11-22 Pearl.com LLC Method and apparatus for automated selection of interesting content for presentation to first time visitors of a website
US9275038B2 (en) 2012-05-04 2016-03-01 Pearl.com LLC Method and apparatus for identifying customer service and duplicate questions in an online consultation system
CN102982176B (zh) * 2012-12-17 2016-10-05 北京奇虎科技有限公司 用于浏览器的搜索方法和装置
EP3125134B1 (en) * 2014-03-28 2018-08-15 Panasonic Intellectual Property Management Co., Ltd. Speech retrieval device, speech retrieval method, and display device
US9875446B2 (en) * 2014-04-03 2018-01-23 Amadeus S.A.S. Travel product information sharing
CN104182483B (zh) * 2014-08-07 2017-11-10 蔡剑 基于社会网络的服务索引库的建立方法及服务搜索方法
US10171548B2 (en) * 2014-08-26 2019-01-01 Mavenir Systems, Inc. Method and system for efficient enrichment of upper layer protocol content in transmission control program (TCP) based sessions
CN104850545A (zh) * 2015-04-29 2015-08-19 均康(上海)信息科技有限公司 一种进行网络资源翻译的在线协作系统及方法
CN105159893A (zh) * 2015-08-31 2015-12-16 小米科技有限责任公司 字符串保存方法及装置
KR20170122505A (ko) * 2016-04-27 2017-11-06 삼성전자주식회사 부가 정보를 제공하는 단말 장치 및 제공 방법
RU2652451C2 (ru) * 2016-09-08 2018-04-26 Акционерное общество "Лаборатория Касперского" Способы обнаружения аномальных элементов веб-страниц
RU2638710C1 (ru) 2016-10-10 2017-12-15 Акционерное общество "Лаборатория Касперского" Способы обнаружения вредоносных элементов веб-страниц
CN108280092A (zh) * 2017-01-06 2018-07-13 广州泰尔智信科技有限公司 应用信息获取方法及装置
US10691764B2 (en) * 2017-10-23 2020-06-23 International Business Machines Corporation Search engine optimization techniques
CN108536688A (zh) * 2018-04-23 2018-09-14 苏州大学 发现全网多语言网站并获得平行语料的方法
JP7346891B2 (ja) * 2019-04-18 2023-09-20 株式会社リコー ウェブページ多言語化装置、方法、プログラム、およびシステム

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2101613B1 (es) * 1993-02-02 1998-03-01 Uribe Echebarria Diaz De Mendi Metodo de traduccion automatica interlingual asistida por ordenador.
US5819264A (en) * 1995-04-03 1998-10-06 Dtl Data Technologies Ltd. Associative search method with navigation for heterogeneous databases including an integration mechanism configured to combine schema-free data models such as a hyperbase
AU6849196A (en) * 1995-08-16 1997-03-19 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US5802526A (en) * 1995-11-15 1998-09-01 Microsoft Corporation System and method for graphically displaying and navigating through an interactive voice response menu
US6233544B1 (en) * 1996-06-14 2001-05-15 At&T Corp Method and apparatus for language translation
US6061738A (en) * 1997-06-27 2000-05-09 D&I Systems, Inc. Method and system for accessing information on a network using message aliasing functions having shadow callback functions
US5842206A (en) * 1996-08-20 1998-11-24 Iconovex Corporation Computerized method and system for qualified searching of electronically stored documents
US6167393A (en) * 1996-09-20 2000-12-26 Novell, Inc. Heterogeneous record search apparatus and method
US6038561A (en) * 1996-10-15 2000-03-14 Manning & Napier Information Services Management and analysis of document information text
US5956740A (en) * 1996-10-23 1999-09-21 Iti, Inc. Document searching system for multilingual documents
US6078914A (en) * 1996-12-09 2000-06-20 Open Text Corporation Natural language meta-search system and method
JPH10187752A (ja) * 1996-12-24 1998-07-21 Kokusai Denshin Denwa Co Ltd <Kdd> 言語間情報検索支援システム
JP3627446B2 (ja) * 1997-06-04 2005-03-09 富士ゼロックス株式会社 検索式作成装置及び検索式作成方法
US6009422A (en) * 1997-11-26 1999-12-28 International Business Machines Corporation System and method for query translation/semantic translation using generalized query language
KR980004126A (ko) * 1997-12-16 1998-03-30 양승택 다국어 웹 문서 검색을 위한 질의어 변환 장치 및 방법
US6505212B2 (en) * 1998-02-04 2003-01-07 Interwoven Inc System and method for website development
US6526426B1 (en) * 1998-02-23 2003-02-25 David Lakritz Translation management system
US6289357B1 (en) * 1998-04-24 2001-09-11 Platinum Technology Ip, Inc. Method of automatically synchronizing mirrored database objects
US6178427B1 (en) * 1998-05-07 2001-01-23 Platinum Technology Ip, Inc. Method of mirroring log datasets using both log file data and live log data including gaps between the two data logs
GB2337611A (en) * 1998-05-20 1999-11-24 Sharp Kk Multilingual document retrieval system
US6424983B1 (en) * 1998-05-26 2002-07-23 Global Information Research And Technologies, Llc Spelling and grammar checking system
US6434614B1 (en) * 1998-05-29 2002-08-13 Nielsen Media Research, Inc. Tracking of internet advertisements using banner tags
US6088796A (en) * 1998-08-06 2000-07-11 Cianfrocca; Francis Secure middleware and server control system for querying through a network firewall
US6738827B1 (en) * 1998-09-29 2004-05-18 Eli Abir Method and system for alternate internet resource identifiers and addresses
US6349276B1 (en) * 1998-10-29 2002-02-19 International Business Machines Corporation Multilingual information retrieval with a transfer corpus
US6466901B1 (en) * 1998-11-30 2002-10-15 Apple Computer, Inc. Multi-language document search and retrieval system
US6381598B1 (en) * 1998-12-22 2002-04-30 Xerox Corporation System for providing cross-lingual information retrieval
US6167369A (en) * 1998-12-23 2000-12-26 Xerox Company Automatic language identification using both N-gram and word information
US6314469B1 (en) * 1999-02-26 2001-11-06 I-Dns.Net International Pte Ltd Multi-language domain name service
US6202062B1 (en) * 1999-02-26 2001-03-13 Ac Properties B.V. System, method and article of manufacture for creating a filtered information summary based on multiple profiles of each single user
US6327590B1 (en) * 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US6598039B1 (en) * 1999-06-08 2003-07-22 Albert-Inc. S.A. Natural language interface for searching database
CN1176432C (zh) * 1999-07-28 2004-11-17 国际商业机器公司 提供本国语言查询服务的方法和系统
US20010021934A1 (en) * 2000-03-08 2001-09-13 Takeshi Yokoi Processing device for searching information in one language using search query in another language, and recording medium and method thereof
US6604101B1 (en) * 2000-06-28 2003-08-05 Qnaturally Systems, Inc. Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024063183A1 (ko) * 2022-09-19 2024-03-28 쿠팡 주식회사 테스트를 수행하기 위한 방법 및 장치

Also Published As

Publication number Publication date
CN1176432C (zh) 2004-11-17
KR20010085185A (ko) 2001-09-07
JP2001092854A (ja) 2001-04-06
US7058626B1 (en) 2006-06-06
EP1072984A2 (en) 2001-01-31
CN1282928A (zh) 2001-02-07
EP1072984A3 (en) 2005-10-19
TW429354B (en) 2001-04-11
JP3548098B2 (ja) 2004-07-28

Similar Documents

Publication Publication Date Title
KR100413309B1 (ko) 모국어 조회 서비스를 제공하기 위한 방법 및 시스템
US7010568B1 (en) Search engine request method, product, and apparatus
US7467391B2 (en) Allowing client applications to programmatically access web sites
USRE44898E1 (en) Search engine request method, product, and apparatus
US6925595B1 (en) Method and system for content conversion of hypertext data using data mining
JP4064549B2 (ja) ドキュメントの作成を援助する方法およびシステム
US6490575B1 (en) Distributed network search engine
US5793966A (en) Computer system and computer-implemented process for creation and maintenance of online services
US5745360A (en) Dynamic hypertext link converter system and process
EP0924628A2 (en) Methods and system for using web browser to search large collections of documents
WO2005052811A1 (en) Searching in a computer network
KR19990006461A (ko) 월드 와이드 웹을 통한 정보 및 기타 자료의 관리 및 억세스 시스템
Binding et al. KOS at your service: Programmatic access to knowledge organisation systems
JP2000090001A (ja) 変換設定を使用した電子デ―タの変換方法およびシステム
KR19990044850A (ko) 인터넷 웹 페이지의 국제적 지원을 위한 방법 및 시스템
US20030217076A1 (en) System and method for rapid generation of one or more autonomous websites
JPH11502346A (ja) オンラインサービスの作成および保守用のコンピュータシステムおよびコンピュータ実行プロセス
US20040107177A1 (en) Automated content filter and URL translation for dynamically generated web documents
US20040117349A1 (en) Intermediary server for facilitating retrieval of mid-point, state-associated web pages
WO2001022194A9 (en) A method and system for facilitating research of electronically stored information on a network
US20130132820A1 (en) Web browsing tool delivering relevant content
US20050060291A1 (en) Method and apparatus for searching universal resource identifiers
US7792855B2 (en) Efficient storage of XML in a directory
KR19990078876A (ko) 일괄된 자원 위치기 입력을 통한 정보 검색 방법
Agosti et al. Managing the interactions between handheld devices, mobile applications, and users

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20101109

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee