KR20110095755A - Internationalized internet address processing system and method thereof - Google Patents

Internationalized internet address processing system and method thereof Download PDF

Info

Publication number
KR20110095755A
KR20110095755A KR1020100015395A KR20100015395A KR20110095755A KR 20110095755 A KR20110095755 A KR 20110095755A KR 1020100015395 A KR1020100015395 A KR 1020100015395A KR 20100015395 A KR20100015395 A KR 20100015395A KR 20110095755 A KR20110095755 A KR 20110095755A
Authority
KR
South Korea
Prior art keywords
language
input
internet address
multilingual
address
Prior art date
Application number
KR1020100015395A
Other languages
Korean (ko)
Inventor
이판정
Original Assignee
(주)넷피아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)넷피아 filed Critical (주)넷피아
Priority to KR1020100015395A priority Critical patent/KR20110095755A/en
Publication of KR20110095755A publication Critical patent/KR20110095755A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

PURPOSE: An internationalized internet address processing system and a method thereof are provided to attach and process a TLD(Top Level Domain) by automatically determining a work inputted by a user. CONSTITUTION: If a keyword type character is inputted by an internet address, a client program(150) determines the sorts of the input character and applies a corresponding TLD to a keyword type internet address. If a query message is keyword type, a multi-language address processing module(250) determines the sorts of the user input language through the query message. The multi address process module applies the TLD to the query message and transmits to the DNS(Domain Name System)(200).

Description

다국어 인터넷주소 처리 시스템 및 방법{Internationalized Internet Address Processing System and Method thereof}Internationalized Internet Address Processing System and Method

본 발명은 인터넷주소 처리 시스템 및 방법에 관한 것으로 자세하게는 다국어로 표기된 인터넷주소를 처리함에 있어서 사용자에 의해 입력된 문자의 언어 코드를 판별하는 등의 방법을 이용하여 입력 문자의 언어를 파악함으로써 국가 구분자를 별도로 입력, 부가하지 않고 키워드 형태로만 입력하더라도 처리가 가능하도록 하는 시스템 및 방법에 관한 것이다.The present invention relates to a system and method for processing an Internet address, and more particularly, to identifying a language of an input character using a method such as determining a language code of a character input by a user in processing an internet address written in multiple languages. The present invention relates to a system and a method for enabling processing even if a user inputs only a keyword form without separately inputting or adding the input.

전화 통화를 위해 반드시 전화번호가 필요한 것과 같이 인터넷 상에서 정보에 접근하기 위해서는 인터넷주소가 반드시 필요하다. 예컨대 편지(정보)를 전달하거나 받기 위해 편지봉투에 나와 상대방주소를 기입해야 하듯이, 인터넷에서도 정보를 전달하거나 받기 위해서는 패킷정보에 나와 상대방의 인터넷주소에 관한 정보가 함께 들어가 있어야 하는 것이다. 이러한 용도로 인해 인터넷주소는 인터넷 구성에 있어 가장 기본적이면서도 가장 중요한 요소 중 하나로 일컬어진다.Just as phone numbers are necessary for phone calls, Internet addresses are essential to accessing information on the Internet. For example, in order to deliver or receive a letter (information), you need to fill out the address of the other party. For this purpose, the Internet address is said to be one of the most basic and most important factors in the construction of the Internet.

인터넷 탄생 초기에는 소수의 컴퓨터들만 네트워크로 연결되어 있었기 때문에 인터넷에 연결된 각 장치들을 구분하기 위한 기계 중심의 주소인 IP주소만 존재했다. IP주소는 인터넷 공간에서 네트워크에 연결된 컴퓨터 또는 장치들을 구분하는 식별자가 되는 가장 기본적인 인터넷주소로, 인터넷 상에서 각각의 컴퓨터 또는 장치를 찾아내기 위한 도구가 되며, 인터넷에 연결되는 모든 컴퓨터나 장치들은 반드시 IP주소를 가지고 있어야만 한다. IP주소는 인터넷의 이용을 위해 반드시 필요하지만, 숫자들로 구성되어 있고 특히 IPv6의 경우는 긴 16진수로 표현되고 있어 사람이 직접 기억하여 사용하기에는 많은 어려움이 있기 때문에, IP주소 대신 문자열을 사용할 수 있도록 하는 도메인이름이 개발되게 되었다.In the early days of the Internet, only a few computers were connected by a network, so there was only an IP address, a machine-centric address, used to identify each device connected to the Internet. An IP address is the most basic Internet address that identifies the computer or device connected to the network in the Internet space. It is a tool for finding each computer or device on the Internet. All computers or devices connected to the Internet must be IP. You must have an address. IP address is necessary for the use of the Internet, but it is composed of numbers. Especially, in case of IPv6, it is expressed as long hexadecimal number, so it is difficult for a person to remember and use it. Domain names have been developed.

도메인이름은 “.” 또는 루트(Root)라 불리는 도메인이름 아래에 나무를 거꾸로 위치시킨 것과 같은 역트리(Inverted Tree) 모양의 계층적인 구조로 구성되어 있다. 루트 도메인이름 바로 아래의 단계는 1단계 또는 최상위 도메인(TLD, Top Level Domain)이라 하며 com, net, org, edu 등으로 알려진 일반 최상위 도메인(gTLD, generic TLD)과 kr, jp, cn 등의 국가 최상위 도메인(ccTLD, country code TLD)으로 구분된다. TLD 아래 단계는 2단계 또는 차상위 도메인(SLD, Second Level Domain)이라 부르며 국가 최상위 도메인 아래에서는 기관의 성격을 나타내는 용도로도 사용된다.Domain names are organized in a hierarchical structure, called an Inverted Tree, with a tree placed upside down under a domain name called “.” Or Root. The steps immediately below the root domain name are called Level 1 or Top Level Domains (TLDs), which are known as com, net, org, edu, etc. and countries such as kr, jp, and cn. It is divided into a top level domain (ccTLD, country code TLD). The level below the TLD is called the Second Level or Second Level Domain (SLD) and is used below the national top level domain to characterize the institution.

도메인이름은 월드와이드웹(WWW)과 함께 인터넷 이용을 쉽게 만들어줌으로써 이용자가 폭발적으로 증가하는데 지대한 공헌을 하였으며, 현재까지도 인터넷 상에서 원하는 정보에 접근하기 위해 가장 널리 이용하고 있는 방법이다. 이러한 도메인이름은 LDH(Letter, Digit, Hyphen)라 불리는 영문자만 이용 가능하지만, 비영어권 국가의 자국어로 된 인터넷주소 요구에 따라 한글, 일본어 등의 문자를 소정의 규칙에 따라 LDH로 표현되는 코드로 변환함으로써 자국어로 된 도메인이름을 사용할 수 있는 다국어도메인(IDN, Internationalized Domain Name)이 도입되었다.Domain names, along with the World Wide Web, have made a significant contribution to the explosive growth of users by making it easier to use the Internet, and are still the most widely used method of accessing information on the Internet. These domain names can only be used in English letters called LDH (Letter, Digit, Hyphen) .However, Korean, Japanese, etc. are converted into codes expressed in LDH according to the prescribed rules in accordance with the Internet address request in the native language of non-English speaking countries. This led to the introduction of Internationalized Domain Names (IDNs), which allow the use of domain names in their own language.

다국어도메인, IDN은 기존의 영문자들만 처리 가능한 도메인이름 시스템에서 비영어권 국가의 자국어로 이루어진 다국어 도메인이름을 처리하기 위하여, 비영문자를 정해진 규칙에 따라 영문자들로 변환하는 코딩 변환방식을 이용하고 있다. 예를들어 '대한민국'이라는 비영문자인 문자는 'xn--3e0bs9hfvinn1a'와 같은 형태로 변경되는 방식이다. 그러나 다국어도메인은 기존의 도메인이름의 계층적인 구조를 이용하고 있으므로 웹사이트의 식별자인 기업명, 브랜드명 등의 뒤에 국가코드 등의 TLD가 추가로 부착되어야만 하는 불편함이 있다. 더구나 TLD는 각 처리 시스템을 구분하는 것 외에 큰 의미를 갖지않는 경우가 많다.In order to process multilingual domain names composed of native languages of non-English speaking countries, IDN uses a coding conversion method that converts non-English characters into English characters according to a predetermined rule. For example, the non-English letter 'Korea' is changed to 'xn-3e0bs9hfvinn1a'. However, since multilingual domain names use the hierarchical structure of existing domain names, there is an inconvenience that a TLD such as a country code should be added after the company name, the brand name, etc. of the website. Moreover, TLDs often do not have much meaning besides distinguishing each treatment system.

본 발명은 계층형의 다국어도메인 사용시 반드시 입력, 부착해야만 하는 TLD를 사용자가 직접 일일이 입력하지 않고 키워드 형태의 단어만 입력하더라도 자동적으로 입력 언어를 판단하여 TLD를 부착, 처리할 수 있도록 하고자 하는 방법에 관한 것이다.The present invention provides a method for automatically attaching and processing a TLD by judging an input language even if a user inputs a TLD that must be input and attached when using a hierarchical multilingual domain. It is about.

본 발명은 다국어로 표기된 인터넷주소를 처리함에 있어서 사용자에 의해 입력된 문자의 언어 코드를 판별하는 등의 방법을 이용하여 사용자의 언어와 국가 정보를 파악함으로써 국가 구분자를 별도로 입력, 부가하지 않더라도 해당 DB에서 처리 가능하도록 하는 방법을 이용한다.In the present invention, the language and country information of the user is determined using a method such as determining a language code of a character input by a user in processing an internet address displayed in multiple languages, even if a country separator is not separately inputted or added. Use the method to make it possible to process in.

본 발명은 다국어로 표기된 인터넷주소를 처리하기 위하여 코드 변환 및 언어코드 판별을 클라이언트와 서버 각각의 위치에서 처리하는 방법을 이용한다. The present invention utilizes a method of processing code translation and language code determination at each location of the client and server in order to process multilingual Internet addresses.

본 발명에 의한 다국어주소 처리 시스템 및 방법은 다국어주소를 이용함에 있어 별도의 TLD를 일일이 입력하지 않고 키워드 형태의 단어만 입력하더라도, 입력된 언어를 판단하여 자동으로 TLD가 부착됨으로써 인터넷 이용을 편하게 해 주는 효과가 있다. The multilingual address processing system and method according to the present invention makes it easier to use the Internet by determining the input language and automatically attaching the TLD even when only a word in the form of a keyword is input without using a separate TLD. Giving effect.

도 1은 본 발명의 실시 예에 따른 다국어주소 처리를 위한 시스템의 전체 구성도이다.
도 2는 본 발명의 실시 예에 따른 다국어주소 처리 방법 중 클라이언트 프로그램(150)을 이용하는 경우의 처리 흐름도이다.
도 3는 본 발명의 실시 예에 따른 다국어주소 처리 방법 중 다국어주소 처리 모듈(250)을 이용하는 경우의 처리 흐름도이다.
1 is an overall configuration diagram of a system for multilingual address processing according to an embodiment of the present invention.
2 is a flowchart illustrating a case where the client program 150 is used in the multilingual address processing method according to an exemplary embodiment of the present invention.
3 is a flowchart illustrating a case where the multilingual address processing module 250 is used in the multilingual address processing method according to an exemplary embodiment of the present invention.

본 발명은 다국어 인터넷주소 처리 시스템 및 방법에 관한 것으로 보다 자세하게는 키워드 형태로만 입력하더라도 입력 언어 등의 정보 판단을 통하여 해당 TLD를 자동으로 부착하여 처리하기 위한 시스템 및 방법에 대한 것이다. 예를들어 한글로 '대한민국'이라고만 입력하더라도, 입력 언어 판별을 통해 한국에 대응하는 TLD인 '.kr'을 입력 문자열이 '대한민국' 뒤에 부가하여 '대한민국.kr'로 처리 가능하도록 하는 방법이다.
The present invention relates to a multilingual Internet address processing system and method. More particularly, the present invention relates to a system and method for automatically attaching and processing a corresponding TLD through information input such as input language. For example, even if you input only 'Korea' in Korean, it is possible to add '.kr', a TLD corresponding to Korea, by adding an input string after 'South Korea' so that it can be processed as 'Korea.kr' through Korean language discrimination. .

이하 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 본 발명의 바람직한 실시 예들을 첨부된 도면들을 참조하여 설명한다.
DETAILED DESCRIPTION Hereinafter, exemplary embodiments of the present invention will be described with reference to the accompanying drawings so that those skilled in the art can easily implement the technical idea of the present invention.

도 1은 본 발명의 실시 예에 따른 다국어주소 처리를 위한 시스템의 전체 구성도이다.
1 is an overall configuration diagram of a system for multilingual address processing according to an embodiment of the present invention.

본 발명에 의한 다국어 인터넷주소 처리를 위한 시스템은 크게 사용자 단말(100)과 도메인네임서버(200), 최종적으로 접속이 이루어지는 웹 서버(300)가 다국어 인터넷주소 처리 기능을 하는 기능부의 설치되는 위치, 형태에 따라 사용자 단말(100)에 설치되는 클라이언트 프로그램(150) 또는 도메인네임서버(200)의 내부나 전단에 설치되는 다국어주소 처리 모듈(250)과 함께 구성되어 기능을 하게 된다.
The system for multilingual Internet address processing according to the present invention includes a user terminal 100, a domain name server 200, and a web server 300 where a final connection is made. The multilingual address processing module 250 installed inside or in front of the client program 150 or the domain name server 200 installed in the user terminal 100 functions according to the form.

사용자 단말(100)은 브라우저가 설치되어 있고 사용자가 웹 사이트에 접속하기 위하여 인터넷주소를 입력하여 이용하는 장치로써 일반적인 PC뿐 아니라 냉장고, TV, 스마트폰 등의 인터넷이 가능한 모든 장치들이 가능하며, 유선이나 모바일 등 접속 방법에도 구애되지 않는다.
The user terminal 100 is a device where a browser is installed and a user inputs and uses an Internet address to access a web site. The user terminal 100 can be any device capable of internet, such as a refrigerator, a TV, a smartphone, as well as a general PC. It is not particular about connection method such as mobile.

도메인네임서버(200)는 도메인이름 질의에 대해 IP주소를 응답해 주는 기능을 하는 서버로써, 일반 인터넷 이용자들이 숫자로 된 IP주소를 모르더라도 www.kipo.go.kr과 같은 도메인을 이용하여 쉽고 편하게 인터넷을 이용 가능하게 해 준다. 도메인이름은 계층형 구조를 가지고 있으며, 도메인네임서버(200)는 질의된 도메인이름을 해석, 처리하기 위하여 상위 레벨부터 순차적으로 확인하는 과정을 거쳐 최종적으로 대응되는 IP주소를 찾게 된다. 그러나 도메인네임서버(200)는 도메인이름 시스템이 설계되던 당시 ASCII로 구성된 영문자만 처리 가능하도록 만들어져 있으며, 따라서 통상의 도메인네임서버(200)로 질의를 할 때는 ASCII로 구성된 문자의 형태로 해야만 한다.
The domain name server 200 is a server that responds to an IP address in response to a domain name query. Even if a general Internet user does not know a numerical IP address, it is easy to use a domain such as www.kipo.go.kr. Makes it easy to use the Internet. The domain name has a hierarchical structure, and the domain name server 200 finds the corresponding IP address through a process of sequentially checking from the upper level in order to interpret and process the queried domain name. However, the domain name server 200 is made to process only English characters composed of ASCII at the time the domain name system was designed, so when querying with a conventional domain name server 200 should be in the form of characters composed of ASCII.

웹 서버(300)는 사용자가 인터넷주소를 이용하여 최종적으로 접속하고자 했던 웹 사이트의 내용이 담긴 서버이다. 사용자 단말(100)은 도메인네임서버(200)로부터 웹 서버(300)의 IP주소를 응답받아 서버로 접속하게 된다.
Web server 300 is a server that contains the content of the Web site that the user finally wants to access using the Internet address. The user terminal 100 receives the IP address of the web server 300 from the domain name server 200 to connect to the server.

클라이언트 프로그램(150)과 다국어주소 처리 모듈(250)은 본 발명에 의한 다국어 인터넷주소 처리를 위하여 반드시 필요하며 둘 중 하나만 존재하더라도 처리가 가능하다.
The client program 150 and the multilingual address processing module 250 are necessary for multilingual Internet address processing according to the present invention, and may be processed even if only one of them exists.

먼저 클라이언트 프로그램(150)에 대하여 설명하면, 클라이언트 프로그램(150)은 사용자 단말(100)에 설치되는 프로그램 모듈로서, 본 발명에 의한 다국어 인터넷주소 처리를 위한 주요 기능을 담당하게 된다. 클라이언트 프로그램(150)은 브라우저에 플러그인 형태로 탑재될 수 있으며, 별도의 독립 프로그램 형태로 설치되어 기능 하도록 할 수도 있고, OS 내부 또는 브라우저 내에 포함되어 타 기능들과 결합된 방식으로 구현될 수도 있다. 클라이언트 프로그램(150)은 입력된 인터넷주소가 키워드 형태인지 여부를 확인하고, 키워드 형태인 것으로 판단된 경우 문자 코드 확인 등을 통하여 입력된 문자의 언어를 판단한다. 이 경우 클라이언트 프로그램(150)은 사용자 단말(100)의 웹 브라우저가 비영문자로 된 다국어 인터넷주소를 입력하는 경우 이를 영문 형태로 표현하는 퓨니코드(Punycode) 등의 방법을 이용하여 인코딩하여 처리하는 기능을 포함하고 있는지 여부와 이러한 인코딩 처리를 어느 순간 하는가에 따라 다른 순서와 방법으로 처리하게 됨이 바람직하다. First, the client program 150 will be described. The client program 150 is a program module installed in the user terminal 100, and plays a main function for processing a multilingual Internet address according to the present invention. The client program 150 may be mounted in a browser as a plug-in, may be installed and functioned as a separate stand-alone program, or may be implemented in a manner combined with other functions in the OS or in a browser. The client program 150 checks whether the input Internet address is a keyword type, and if it is determined that the keyword is a keyword type, determines the language of the input character through character code checking. In this case, when the web browser of the user terminal 100 inputs a multilingual Internet address in a non-English character, the client program 150 encodes and processes it using a method such as Punycode that expresses it in English. It is preferable to process in a different order and method depending on whether or not to include the and when the encoding process.

입력된 비영문자가 영문 형태로 인코딩되지 않은 상태에서 문자의 언어를 판단하는 경우, 클라이언트 프로그램(150)은 입력 문자의 문자셋을 확인, 분석함으로써 해당 언어의 종류를 판단하게 된다. 문자셋이란 하나의 언어권에서 사용하는 언어를 표현하기 위한 모든 문자의 모임을 지칭하는 것으로 부호와 공백 등과 같은 특수 문자도 모두 문자셋에 포함된다. 사용자 단말(100)에서 입력되는 문자는 기본적으로 유니코드로 처리가 된다. 유니코드는 전세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 표준 방식의 코드로, 기존의 인코딩들은 그 규모나 범위 면에서 한정되어 있고, 다국어 환경에서는 서로 호환되지 않는 문제점이 있으므로, 현존하는 여러 문자 인코딩 방법들을 모두 유니코드로 교체하고자 하는 목적하에 작업이 진행중이다. 유니코드로 처리되는 사용자 단말(100)에 입력된 문자는 유니코드 내에서 문자셋을 확인함으로써 어떤 언어인지 판단이 가능하다.In the case where the input non-English character is not encoded in the English form and determines the language of the character, the client program 150 determines the type of the corresponding language by checking and analyzing the character set of the input character. A character set refers to a collection of all characters for expressing a language used in a single language, and all special characters such as a sign and a space are also included in the character set. Characters input from the user terminal 100 are basically processed to Unicode. Unicode is a standard code designed to consistently represent and handle all the characters of the world on a computer. Existing encodings are limited in size and scope, and are incompatible with each other in multilingual environments. Work is underway with the aim of replacing all the different character encoding methods with Unicode. Characters input to the user terminal 100 to be processed in Unicode can determine the language by checking the character set in the Unicode.

입력된 인터넷주소가 키워드 형태인 것과 어떤 언어로 된 것인지 확인이 되면, 클라이언트 프로그램(150)은 입력 언어에 해당하는 TLD를 입력된 키워드 형태의 인터넷주소 뒤에 부착하게 된다. 예를들어 입력 언어가 한글로 판단되면 '.kr'을, 입력 언어가 일어로 판단되면 '.jp'를 부착하게 된다. 부착되는 TLD는 기존의 ccTLD일 수도 있으나, 별도로 지정된 다른 TLD가 될 수도 있다. TLD에 대한 정보는 클라이언트 프로그램(150)에 저장되어 있을 수 있으며, 외부의 관리 서버로부터 내용을 받아서 처리할 수 있고, 이 둘을 합하여 외부 서버로부터 자료를 받아 자체 DB로 두고 처리하는 것도 가능하다. 이후 TLD가 부착된 인터넷주소는 기존의 도메인네임서버(200)에서 처리 가능하도록 영문 ASCII 코드 형태로 변환하는 처리를 하게 된다. 일반적으로 널리 알려지고 사용되고 있는 방법은 퓨니코드 등의 방법이며, 인코딩된 문자열은 DNS로 전송, 질의된다. 이때 퓨니코드 등으로의 인코딩 및 DNS로의 질의는 클라이언트 프로그램(150)이 자체적으로 기능하기 보다는 OS나 브라우저 등 사용자 단말(100)에 이미 구비되어 있는 프로그램 및 기능을 이용하는 것이 바람직하다. When it is confirmed that the input Internet address is a keyword type and in which language, the client program 150 attaches a TLD corresponding to the input language after the input keyword type internet address. For example, if the input language is determined to be Korean, '.kr' is attached. If the input language is determined to be Japanese, '.jp' is attached. The attached TLD may be an existing ccTLD, or may be another TLD separately designated. Information about the TLD may be stored in the client program 150, and may receive and process contents from an external management server, and may combine the two to receive data from an external server and process the data in its own DB. After that, the Internet address to which the TLD is attached is processed to be converted into English ASCII code format so that it can be processed by the existing domain name server 200. In general, a widely known method is a method such as Punycode, and the encoded string is transmitted and queried by DNS. In this case, it is preferable to use the programs and functions that are already provided in the user terminal 100 such as an OS or a browser, rather than the client program 150 itself.

입력된 비영문자가 영문 형태로 인코딩된 상태에서 문자의 언어를 판단하는 경우, 클라이언트 프로그램(150)은 인코딩된 문자를 다시 원래의 입력인 유니코드 형태로 인코딩 또는 디코딩 후 유니코드 상태에서 입력 문자의 문자셋을 확인, 분석함으로써 해당 언어의 종류를 판단하게 된다. 언어 종류 판단 후 대응하는 TLD를 찾게 되며, 영문 형태로 인코딩된 문자에, 역시 영문 형태로 인코딩된 TLD를 부가하여 DNS로 전달, 질의되도록 할 수 있으며, 유니코드로 변환된 상태에서 TLD 부가 후 전체를 다시 영문 형태로 인코딩 후 DNS로 전달, 질의되도록 하는 것도 가능하다.
In the case where the input non-alphabetic character is encoded in the English form and determines the language of the character, the client program 150 encodes or decodes the encoded character back to the original input Unicode form and then decodes the input character in the Unicode state. By checking and analyzing the character set, the type of language is determined. After determining the language type, the corresponding TLD is found, and the TLD encoded in the English form is also added to the DNS to be transmitted and queried.The entire TLD is added after conversion to Unicode. Can be encoded in English format, then forwarded to DNS and queried.

다음으로 다국어주소 처리 모듈(250)에 대하여 설명하면, 다국어주소 처리 모듈(250)은 도메인네임서버(200)의 내부 또는 전단에 설치되는 기능 모듈로서, 본 발명에 의한 다국어 인터넷주소 처리를 위한 주요 기능을 담당하게 된다. 다국어주소 처리 모듈(250)은 도메인네임서버(200)의 기존 프로그램에 패치 형태로 삽입되어질 수 있으며, 처음부터 도메인네임서버 프로그램에 포함된 형태로 만들어질 수도 있다. 또한 도메인네임서버(200)의 전단에 설치될 경우에는 별도의 장비와 같은 독립된 형태로 만들어질 수 있으며, 도메인네임서버(200) 내에서 메인 프로그램과 별도의 프로그램 모듈로 실행되어, 도메인네임서버(200)의 메인 프로그램이 기능하기 전에 먼저 처리되도록 하는 것도 가능하다. 다국어주소 처리 모듈(250)은 사용자 단말(100)로부터 전달된 질의메시지가 키워드 형태인지 여부를 확인하고, 키워드 형태인 것으로 판단된 경우 질의메시지의 문자 코드 확인 등을 통하여 사용자 입력문자의 언어를 판단한다.Next, the multilingual address processing module 250 will be described. The multilingual address processing module 250 is a functional module installed inside or at the front end of the domain name server 200. It will be in charge of the function. The multilingual address processing module 250 may be inserted in the form of a patch into an existing program of the domain name server 200, or may be made in a form included in the domain name server program from the beginning. In addition, when installed in the front of the domain name server 200 may be made in a separate form as a separate equipment, and executed as a separate program module and the main program in the domain name server 200, domain name server ( It is also possible to allow the main program of 200) to be processed first before functioning. The multilingual address processing module 250 determines whether the query message transmitted from the user terminal 100 is a keyword type, and if it is determined that the keyword is a keyword type, determines the language of the user input character through checking the character code of the query message. do.

이 경우 다국어주소 처리 모듈(250)은 사용자 단말(100)로부터 전달되어 오는 질의메시지가 영문 형태로 되어 있는지 여부, 즉 7bit로 되어 있는지, 8bit로 되어 있는지에 따라 처리 절차가 달라질 수 있다. In this case, the multilingual address processing module 250 may have a different processing procedure depending on whether the query message transmitted from the user terminal 100 is in English, that is, 7 bits or 8 bits.

대부분의 경우 비영문자로 된 다국어주소가 입력되면, 사용자 단말(100)의 브라우저 등은 이를 퓨니코드 등 7bit의 영문 형태로 인코딩 후 DNS로 전달하게 되며, 이때 영문 형태로 변환된 코딩 질의메시지는 퓨니코드의 경우 'xn--'로 시작되는 등 쉽게 구분 가능하도록 되어 있어, 판단이 용이하다. 그러나 영문 형태로 인코딩된 질의메시지는 그 자체만으로는 사용자가 입력한 문자가 어떤 것이었는지 판단할 수가 없다. 따라서 이때는 영문 형태로 인코딩된 질의메시지를 다시 역으로 변환하여야 한다. 이 경우 역변환을 하게 되면 유니코드 형태로 변환된다. 유니코드 상태에서는 입력 문자의 문자셋을 확인, 분석함으로써 해당 언어의 종류를 판단할 수 있다. 어떤 언어로 된 것인지 확인이 되면, 다국어주소 처리 모듈(250)은 입력 언어에 대응되는 TLD를 키워드 형태의 질의메시지 뒤에 부착하게 된다. 이때 TLD에 대한 정보는 다국어주소 처리 모듈(250) 내부에 DB로 존재하거나 외부의 별도 서버에 저장되어 있을 수 있으며, 외부 서버로부터 내용을 전달받아 다국어주소 처리 모듈(250)에 저장하는 방식으로 이용될 수 있다. 그리고 이를 다시 도메인네임서버(200)가 처리 가능한 7bit 형태로 인코딩하여 도메인네임서버(200)에 전달함으로써, 도메인네임서버(200)가 그에 대응하는 IP주소를 찾아 사용자 단말(100)에 응답할 수 있도록 한다. 이때, 사용자 단말(100)로부터 전달받은 7bit 형태의 질의메시지에 7bit 형태의 TLD를 단순 부가하여 도메인네임서버(200)로 전달하거나 7bit 형태의 질의메시지를 8bit 유니코드 형태로 변환한 상태에서 TLD를 부가하고 다시 7bit 형태로 인코딩 하는 방법 등 질의메시지와 TLD의 인코딩 순서는 여러 형태로 조합하여 구현하는 것이 가능하다. In most cases, when a non-English alphabetic language address is input, the browser of the user terminal 100 encodes it in 7-bit English form such as Punicode, and then transfers it to DNS. In the case of code, it can be easily distinguished by starting with 'xn--' and it is easy to judge. However, an English-language query message cannot determine which character the user has entered by itself. Therefore, in this case, the query message encoded in English format must be converted back. In this case, reverse conversion converts to Unicode. In the Unicode state, the type of the corresponding language can be determined by checking and analyzing the character set of the input character. When it is confirmed in which language, the multilingual address processing module 250 attaches the TLD corresponding to the input language after the query message in the form of a keyword. In this case, the information about the TLD may exist as a DB in the multilingual address processing module 250 or may be stored in a separate server externally, and may be used by receiving contents from an external server and storing the information in the multilingual address processing module 250. Can be. In addition, the domain name server 200 encodes the 7-bit form in a processable 7-bit form and delivers the same to the domain name server 200 so that the domain name server 200 can respond to the user terminal 100 in search of an IP address corresponding thereto. Make sure In this case, the 7-bit TLD of the 7-bit query message received from the user terminal 100 is simply added to the domain name server 200, or the 7-bit query message is converted to 8-bit Unicode form TLD in the state In addition, the encoding order of the query message and the TLD, such as a 7-bit encoding method, can be implemented in various forms.

사용자 단말(100)로부터 전달된 질의메시지가 8bit로 되어 있는 경우에는 사용자가 입력한 문자가 어떤 언어로 되어 있는지 확인하기에 어려움이 있다. 이를 확인하기 위하여 질의메시지를 특정 인코딩으로 가정, 유니코드로 변환하여 정상적으로 변환되는지 여부를 통하여 사용자가 입력한 문자의 인코딩과 언어 종류를 알 수 있다. 많은 인코딩 방법들이 존재하므로 각각의 방법들을 일일이 변환시키며 확인하기에는 시스템 부하와 처리 시간상 문제가 될 수 있으므로, 사용자 단말(100)의 위치 정보 등을 바탕으로 이용률이 높은 인코딩부터 적용하여 확인하는 것이 바람직하다. 입력 언어가 판단된 질의메시지는 언어에 대응하는 TLD가 부가된 후 통상의 도메인네임서버(200)에서 처리 가능한 7bit 형태로 인코딩 된 후 도메인네임서버(200)로 전달함으로써, 도메인네임서버(200)가 그에 대응하는 IP주소를 찾아 사용자 단말(100)에 응답할 수 있도록 한다.
When the query message transmitted from the user terminal 100 is 8 bits, it is difficult to determine in which language the character input by the user is made. To check this, it is possible to know the encoding and the language type of the character input by the user through whether the query message is converted to Unicode by assuming a specific encoding. Since there are many encoding methods, it may be a problem in system load and processing time to convert and check each method individually. Therefore, it is preferable to check and apply the encoding having high utilization rate based on the location information of the user terminal 100. . After the input message is determined, the query message is encoded into a 7-bit form that can be processed by the conventional domain name server 200 after the TLD corresponding to the language is added, and then transferred to the domain name server 200, thereby providing the domain name server 200. Searches for an IP address corresponding thereto and responds to the user terminal 100.

도 2는 본 발명의 실시 예에 따른 다국어주소 처리 방법 중 클라이언트 프로그램(150)을 이용하는 경우의 처리 흐름도이다.
2 is a flowchart illustrating a case where the client program 150 is used in the multilingual address processing method according to an exemplary embodiment of the present invention.

사용자가 사용자 단말(100)의 브라우저 주소창 등에 인터넷주소를 입력하게 되면(S101), 클라이언트 프로그램(150)은 인터넷주소 입력을 인식하고(S103) 입력된 인터넷주소가 키워드 형태인지 여부를 판단하게 된다(S105). 이때 키워드 형태여부 판단은 입력된 인터넷주소에 '.'이 포함되어 있는지 여부를 확인함으로써 간단하게 판단이 가능하다. 만약 사용자가 입력한 인터넷주소가 '.'을 포함하고 있어 키워드 형태가 아닌 것으로 판단되면, 클라이언트 프로그램(150)은 더 이상의 기능을 하지 않고, 입력된 인터넷주소는 종전의 처리 방식에 따라 도메인네임서버(200)로 전송된다(S111). 키워드 형태 여부 판단 단계(S105)에서 입력된 인터넷주소가 키워드 형태인 것으로 판단되며, 클라이언트 프로그램(150은 입력된 인터넷주소의 언어 종류를 확인하게 된다(S107). 입력된 언어 종류의 판단은 입력 문자의 문자셋을 확인, 분석함으로써 해당 언어의 종류를 판단하게 된다. 입력된 인터넷주소에 대하여 언어의 종류가 확인되면 해당 언어에 대응하는 TLD를 찾아 입력된 인터넷주소에 부가하고(S109), 클라이언트 프로그램(150) 또는 클라이언트에 설치되어 있는 브라우저 등의 기능에 의하여 도메인네임서버(200)가 인식, 처리할 수 있는 7bit의 영문자 형태로 인코딩을 하게 된다. 인코딩의 실시 단계는 OS, 브라우저, 클라이언트 프로그램(150)의 구현에 따라 달라질 수 있으며, 경우에 따라서는 생략도 가능하다. 이후 사용자 단말(100)의 윈속 등 프로그램을 통하여 도메인네임서버(200)로 TLD를 포함한 내용이 전달, 질의되게 된다(S111).
When the user inputs the Internet address to the browser address bar of the user terminal 100 (S101), the client program 150 recognizes the Internet address input (S103) and determines whether the input Internet address is a keyword type (S103). S105). At this time, whether the keyword type is determined can be easily determined by checking whether '.' Is included in the input Internet address. If it is determined that the Internet address entered by the user includes '.' And is not a keyword type, the client program 150 does not function any more, and the input Internet address is a domain name server according to a conventional processing method. It is transmitted to (200) (S111). It is determined that the input Internet address in the keyword type determination step (S105) is a keyword type, and the client program 150 checks the language type of the input Internet address (S107). The type of the language is determined by checking and analyzing the character set of the language.If the type of the language is confirmed with respect to the input Internet address, the TLD corresponding to the language is found and added to the input Internet address (S109). 150) or a 7-bit English character that can be recognized and processed by the domain name server 200 by a function such as a browser installed in the client. ), And may be omitted in some cases. The contents including the TLD are transmitted to the domain name server 200 through the RAM and inquired (S111).

도 3는 본 발명의 실시 예에 따른 다국어주소 처리 방법 중 다국어주소 처리 모듈(250)을 이용하는 경우의 처리 흐름도이다.
3 is a flowchart illustrating a case where the multilingual address processing module 250 is used in the multilingual address processing method according to an exemplary embodiment of the present invention.

사용자가 사용자 단말(100)의 브라우저 주소창 등에 인터넷주소를 입력하게 되면(S201), 입력된 인터넷주소는 도메인네임서버(200)로 전달, 질의된다(S203). 이때, 사용자가 입력한 인터넷주소가 8bit의 비영문자인 경우, 사용자 단말(100)의 브라우저 등의 프로그램은 통상의 도메인네임서버(200)가 인식, 처리할 수 있는 7bit 형태의 문자로 인코딩 후 전달할 수도 있다. 다국어주소 처리 모듈(250)은 도메인네임서버(200)의 내부 또는 전단에 설치되어 있으면서, 도메인네임서버(200)로 전송되는 질의를 먼저 수신하여 확인하게 된다(S205). 사용자 단말(100)로부터의 질의메시지를 수신한 다국어주소 처리 모듈(250)은 질의메시지가 키워드 형태인지 여부를 판단한다(S207). 키워드 여부 판단은 질의메시지에 '.'이 포함되어 있는지 확인을 통해 할 수 있다. 만약 키워드 형태 여부 판단 단계(S207)에서 질의메시지가 키워드 형태가 아닌 것으로 판단되며, 다국어주소 처리 모듈(250)은 더 이상의 기능을 하지 않고, 통상의 도메인네임서버(200)가 질의메시지를 처리하게 된다(S213). 질의메시지가 키워드 형태인 것으로 판단되면, 다국어주소 처리 모듈(250)은 질의메시지 분석을 통하여 사용자가 입력하였던 인터넷주소의 언어 종류를 확인하게 된다(S209). 사용자 단말(100)로부터 전달되어 온 질의메시지가 7bit의 퓨니코드 등으로 변환 처리되어 있는 경우, 자국어주소 처리 모듈(250)은 질의메시지를 다시 유니코드로 역변환하고, 문자셋을 통하여 입력 문자의 언어를 확인할 수 있다. 그러나 사용자 단말(100)로부터의 질의메시지가 8bit인 경우에는 질의메시지를 유니코드로 변환 후 정상적으로 변환되었는지 여부 확인을 통하여 사용자가 입력한 문자의 인코딩과 언어 종류를 알 수 있다. 많은 인코딩 방법들이 존재하므로 각각의 방법들을 일일이 변환시키며 확인하기에는 시스템 부하와 처리 시간상 문제가 될 수 있으므로, 사용자 단말(100)의 위치 정보 등을 바탕으로 이용률이 높은 인코딩부터 적용하여 확인하는 것이 바람직하다. 입력 언어가 판단된 질의메시지는 언어에 대응하는 TLD가 부가(S211)된 후 통상의 도메인네임서버(200)에서 처리 가능한 7bit 형태로 인코딩되어 도메인네임서버(200)로 전달(S211)함으로써, 도메인네임서버(200)가 그에 대응하는 IP주소를 찾아 사용자 단말(100)에 응답할 수 있도록 한다. When the user inputs the Internet address to the browser address bar of the user terminal 100 (S201), the input Internet address is transmitted to the domain name server 200 and is queried (S203). At this time, if the Internet address input by the user is an 8-bit non-English letter, a program such as a browser of the user terminal 100 may be encoded and transmitted as a 7-bit type character that can be recognized and processed by a normal domain name server 200. It may be. The multilingual address processing module 250 is installed inside or at the front end of the domain name server 200, and first receives and confirms a query transmitted to the domain name server 200 (S205). The multilingual address processing module 250 receiving the query message from the user terminal 100 determines whether the query message is a keyword form (S207). The keyword can be determined by checking whether '.' Is included in the query message. If it is determined in step S207 that the query message is not a keyword type, the multilingual address processing module 250 does not perform any more functions, and the normal domain name server 200 processes the query message. (S213). When it is determined that the query message is in the form of a keyword, the multilingual address processing module 250 checks the language type of the Internet address input by the user through analyzing the query message (S209). When the query message transmitted from the user terminal 100 is converted into 7-bit punycode or the like, the national language address processing module 250 inverts the query message back to Unicode and converts the language of the input character through the character set. You can check it. However, when the query message from the user terminal 100 is 8 bits, the encoding and the language type of the character input by the user can be known by checking whether the query message is successfully converted after converting the query message to Unicode. Since there are many encoding methods, it may be a problem in system load and processing time to convert and check each method individually. Therefore, it is preferable to check and apply the encoding having high utilization rate based on the location information of the user terminal 100. . The query message that determines the input language is added to the domain name server 200 after the TLD corresponding to the language is added (S211), encoded in a 7-bit form that can be processed by the conventional domain name server 200, and thereby the domain (S211). The name server 200 finds an IP address corresponding to the name server 200 and responds to the user terminal 100.

이후 사용자 단말(100)은 도메인네임서버(200)로부터 입력한 인터넷주소에 대응하는 웹 서버(300)의 IP주소를 응답받아 웹 서버(300)에 접속하게 된다.
Thereafter, the user terminal 100 receives the IP address of the web server 300 corresponding to the Internet address input from the domain name server 200 to access the web server 300.

100 : 사용자 단말
150 : 클라이언트 프로그램
200 : 도메인네임서버
250 : 다국어주소 처리 모듈
300 : 웹 서버
100: user terminal
150: client program
200: domain name server
250: multilingual address processing module
300: web server

Claims (4)

다국어 인터넷주소를 처리하는 시스템에 있어서,
사용자 단말에 설치되어 있으면서, 키워드 형태의 문자가 인터넷주소로 입력되는 경우 상기 입력 문자의 언어 종류를 판단하고, 상기 판단된 입력 문자의 언어에 대응하는 TLD를 상기 키워드 형태의 인터넷주소에 부가하는 클라이언트 프로그램을 포함하는 것을 특징으로 하는 다국어 인터넷주소 처리 시스템
In a system for processing multilingual internet addresses,
The client is installed in the user terminal, when the character of the keyword type is input to the Internet address to determine the language type of the input character, and the client for adding the TLD corresponding to the determined language of the input character to the keyword type Internet address Multilingual Internet address processing system comprising a program
다국어 인터넷주소를 처리하는 시스템에 있어서,
도메인네임시스템 앞에 설치되어 있으면서, 사용자 단말로부터 전달되는 질의메시지가 키워드 형태인 경우 상기 질의메시지를 통하여 사용자가 입력한 언어의 종류를 판단하고, 판단된 언어에 대응하는 TLD를 상기 질의메시지에 부가하여 도메인네임시스템으로 전달하는 다국어주소 처리 모듈을 포함하는 것을 특징으로 하는 다국어 인터넷주소 처리 시스템
In a system for processing multilingual internet addresses,
If the query message transmitted from the user terminal in the form of a domain name system is a keyword type, the type of language input by the user is determined through the query message, and a TLD corresponding to the determined language is added to the query message. Multilingual Internet address processing system comprising a multilingual address processing module for transferring to a domain name system
다국어 인터넷주소를 처리하는 방법에 있어서,
인터넷주소가 입력되는 것을 클라이언트 프로그램이 인식하는 단계;
상기 클라이언트 프로그램이 상기 입력된 인터넷주소가 키워드 형태인지 여부를 판단하는 단계;
상기 입력된 인터넷주소가 키워드 형태인 경우, 입력된 인터넷주소의 언어 종류를 확인하는 단계;
상기 확인된 언어에 대응하는 TLD를 상기 인터넷주소에 부가하는 단계
를 포함하는 것을 특징으로 하는 다국어 인터넷주소 처리 방법
In the method of processing a multilingual internet address,
Recognizing, by the client program, that an Internet address is input;
Determining, by the client program, whether the input internet address is a keyword type;
Checking a language type of the input internet address when the input internet address is a keyword type;
Adding a TLD corresponding to the identified language to the internet address
Multilingual Internet address processing method comprising the
다국어 인터넷주소를 처리하는 방법에 있어서,
사용자 단말로부터 전송되는 질의메시지를 다국어주소 처리 모듈이 수신하는 단계;
상기 다국어주소 처리 모듈이 상기 질의메시지가 키워드 형태인지 여부를 판단하는 단계;
상기 질의메시지가 키워드 형태인 경우, 입력된 언어의 종류를 확인하는 단계;
상기 확인된 언어에 대응하는 TLD를 상기 질의메시지에 부가하는 단계;
상기 TLD가 부가된 질의메시지를 도메인네임서버로 전달하는 단계
를 포함하는 것을 특징으로 하는 다국어 인터넷주소 처리 방법
In the method of processing a multilingual internet address,
Receiving, by the multilingual address processing module, an inquiry message transmitted from the user terminal;
Determining, by the multilingual address processing module, whether the query message is a keyword form;
Checking the type of input language when the query message is a keyword type;
Adding a TLD corresponding to the identified language to the query message;
Delivering the query message added with the TLD to a domain name server;
Multilingual Internet address processing method comprising the
KR1020100015395A 2010-02-19 2010-02-19 Internationalized internet address processing system and method thereof KR20110095755A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100015395A KR20110095755A (en) 2010-02-19 2010-02-19 Internationalized internet address processing system and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100015395A KR20110095755A (en) 2010-02-19 2010-02-19 Internationalized internet address processing system and method thereof

Publications (1)

Publication Number Publication Date
KR20110095755A true KR20110095755A (en) 2011-08-25

Family

ID=44931331

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100015395A KR20110095755A (en) 2010-02-19 2010-02-19 Internationalized internet address processing system and method thereof

Country Status (1)

Country Link
KR (1) KR20110095755A (en)

Similar Documents

Publication Publication Date Title
JP3492580B2 (en) Multilingual domain name service
CN1114168C (en) Www addressing
US20190303384A1 (en) Method and system for consolidating data retrieved from different sources
EA011266B1 (en) Native language internet address system
KR100433982B1 (en) System for acc esing web page using real names and method thereof
KR100706702B1 (en) Korean Internet contents address service method and system using original DNS
JP2001249884A (en) System for using domain name in desired language by internet user
US20100274553A1 (en) Multi-Languages IDN System
CN102597985A (en) Internet domain name super variants
KR100818200B1 (en) The Method and System of Connecting Internet Using Keyword Based on DNS
KR20110095755A (en) Internationalized internet address processing system and method thereof
KR100338666B1 (en) System for accesing web page using many languages and method thereof
KR100383861B1 (en) Korean dns system
KR20110097211A (en) Internationalized internet address processing system and method thereof
KR20110097015A (en) Internationalized internet address processing system and method thereof
CN102073639A (en) System and method for assisting user in input and query
KR20010075446A (en) Method and system for alternate internet resource identifiers and addresses
KR20050099943A (en) System for accessing web page and method thereof
KR101006853B1 (en) Internationalized domain name conversion server and convert it to use
KR100732975B1 (en) System for accessing web page and method thereof
WO2008072886A1 (en) The method and system of connecting internet using keyword based on dns
KR100438722B1 (en) Method for serving voice DNS and apparatus thereof
KR20020057449A (en) Phone-Number Domain and Multilingual Domain of Email-Type
WO2010125560A1 (en) Multi-languages idn system
CN116980885A (en) Method and system for acquiring user information based on 5G terminal eSIM card programmable IPv6 address

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination