KR20110097015A - Internationalized internet address processing system and method thereof - Google Patents

Internationalized internet address processing system and method thereof Download PDF

Info

Publication number
KR20110097015A
KR20110097015A KR1020100016622A KR20100016622A KR20110097015A KR 20110097015 A KR20110097015 A KR 20110097015A KR 1020100016622 A KR1020100016622 A KR 1020100016622A KR 20100016622 A KR20100016622 A KR 20100016622A KR 20110097015 A KR20110097015 A KR 20110097015A
Authority
KR
South Korea
Prior art keywords
domain name
address
multilingual
language
internet address
Prior art date
Application number
KR1020100016622A
Other languages
Korean (ko)
Inventor
이판정
Original Assignee
(주)넷피아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)넷피아 filed Critical (주)넷피아
Priority to KR1020100016622A priority Critical patent/KR20110097015A/en
Publication of KR20110097015A publication Critical patent/KR20110097015A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 인터넷주소 처리 시스템 및 방법에 관한 것으로 다국어로 표기된 인터넷주소를 처리함에 있어서 사용자에 의해 입력된 문자의 언어 코드를 판별하는 등의 방법을 이용하여 입력 문자의 언어를 파악하되, 특히 네트워크에 설치된 다국어주소 처리 시스템을 이용함으로써 국가 구분자를 별도로 입력, 부가하지 않고 키워드 형태로만 입력하더라도 처리가 가능하도록 하는 시스템 및 방법이다.The present invention relates to a system and method for processing an Internet address, in which the language of an input character is determined using a method such as determining a language code of a character input by a user in processing an internet address written in multiple languages. By using the installed multilingual address processing system, it is a system and method for enabling processing even if a country separator is inputted in the form of a keyword without additional input or addition.

Description

다국어 인터넷주소 처리 시스템 및 방법{Internationalized Internet Address Processing System and Method thereof}Internationalized Internet Address Processing System and Method

본 발명은 인터넷주소 처리 시스템 및 방법에 관한 것으로 자세하게는 다국어로 표기된 인터넷주소를 처리함에 있어서 사용자에 의해 입력된 문자의 언어 코드를 판별하는 등의 방법을 이용하여 입력 문자의 언어를 파악하되, 특히 네트워크에 설치된 다국어주소 처리 시스템을 이용함으로써 국가 구분자를 별도로 입력, 부가하지 않고 키워드 형태로만 입력하더라도 처리가 가능하도록 하는 시스템 및 방법에 관한 것이다.The present invention relates to a system and method for processing an Internet address, and more particularly, to determine a language of an input character by using a method such as determining a language code of a character input by a user in processing an internet address written in multiple languages. By using a multilingual address processing system installed in a network, the present invention relates to a system and a method for enabling processing even if a country separator is inputted in a keyword form without separately inputting or adding a country separator.

전화 통화를 위해 반드시 전화번호가 필요한 것과 같이 인터넷 상에서 정보에 접근하기 위해서는 인터넷주소가 반드시 필요하다. 예컨대 편지(정보)를 전달하거나 받기 위해 편지봉투에 나와 상대방주소를 기입해야 하듯이, 인터넷에서도 정보를 전달하거나 받기 위해서는 패킷정보에 나와 상대방의 인터넷주소에 관한 정보가 함께 들어가 있어야 하는 것이다. 이러한 용도로 인해 인터넷주소는 인터넷 구성에 있어 가장 기본적이면서도 가장 중요한 요소 중 하나로 일컬어진다.Just as phone numbers are necessary for phone calls, Internet addresses are essential to accessing information on the Internet. For example, in order to deliver or receive a letter (information), you need to fill out the address of the other party. For this purpose, the Internet address is said to be one of the most basic and most important factors in the construction of the Internet.

인터넷 탄생 초기에는 소수의 컴퓨터들만 네트워크로 연결되어 있었기 때문에 인터넷에 연결된 각 장치들을 구분하기 위한 기계 중심의 주소인 IP주소만 존재했다. IP주소는 인터넷 공간에서 네트워크에 연결된 컴퓨터 또는 장치들을 구분하는 식별자가 되는 가장 기본적인 인터넷주소로, 인터넷 상에서 각각의 컴퓨터 또는 장치를 찾아내기 위한 도구가 되며, 인터넷에 연결되는 모든 컴퓨터나 장치들은 반드시 IP주소를 가지고 있어야만 한다. IP주소는 인터넷의 이용을 위해 반드시 필요하지만, 숫자들로 구성되어 있고 특히 IPv6의 경우는 긴 16진수로 표현되고 있어 사람이 직접 기억하여 사용하기에는 많은 어려움이 있기 때문에, IP주소 대신 문자열을 사용할 수 있도록 하는 도메인네임이 개발되게 되었다.In the early days of the Internet, only a few computers were connected by a network, so there was only an IP address, a machine-centric address, used to identify each device connected to the Internet. An IP address is the most basic Internet address that identifies the computer or device connected to the network in the Internet space. It is a tool for finding each computer or device on the Internet. All computers or devices connected to the Internet must be IP. You must have an address. IP address is necessary for the use of the Internet, but it is composed of numbers. Especially, in case of IPv6, it is expressed as long hexadecimal number, so it is difficult for a person to remember and use it. Domain Names have been developed.

도메인네임은 “.” 또는 루트(Root)라 불리는 도메인네임 아래에 나무를 거꾸로 위치시킨 것과 같은 역트리(Inverted Tree) 모양의 계층적인 구조로 구성되어 있다. 루트 도메인네임 바로 아래의 단계는 1단계 또는 최상위 도메인(TLD, Top Level Domain)이라 하며 com, net, org, edu 등으로 알려진 일반 최상위 도메인(gTLD, generic TLD)과 kr, jp, cn 등의 국가 최상위 도메인(ccTLD, country code TLD)으로 구분된다. TLD 아래 단계는 2단계 또는 차상위 도메인(SLD, Second Level Domain)이라 부르며 국가 최상위 도메인 아래에서는 기관의 성격을 나타내는 용도로도 사용된다.Domain names are organized in a hierarchical structure, called an Inverted Tree, with a tree placed upside down under a domain name called “.” Or Root. The steps immediately below the root domain name are called Level 1 or Top Level Domains (TLDs), which are known as com, net, org, edu, etc. and countries such as kr, jp, and cn. It is divided into a top level domain (ccTLD, country code TLD). The level below the TLD is called the Second Level or Second Level Domain (SLD) and is used below the national top level domain to characterize the institution.

도메인네임은 월드와이드웹(WWW)과 함께 인터넷 이용을 쉽게 만들어줌으로써 이용자가 폭발적으로 증가하는데 지대한 공헌을 하였으며, 현재까지도 인터넷 상에서 원하는 정보에 접근하기 위해 가장 널리 이용하고 있는 방법이다. 이러한 도메인네임은 LDH(Letter, Digit, Hyphen)라 불리는 영문자만 이용 가능하지만, 비영어권 국가의 자국어로 된 인터넷주소 요구에 따라 한글, 일본어 등의 문자를 소정의 규칙에 따라 LDH로 표현되는 코드로 변환함으로써 자국어로 된 도메인네임을 사용할 수 있는 다국어도메인(IDN, Internationalized Domain Name)이 도입되었다.The domain name, together with the World Wide Web, has made a significant contribution to the explosive growth of users by making it easier to use the Internet, and is still the most widely used method for accessing information on the Internet. These domain names are available only for English letters called LDH (Letter, Digit, Hyphen), but the characters of Korean, Japanese, etc. are converted into LDH codes according to the prescribed rules according to the internet address request in the native language of non-English speaking countries. This has led to the introduction of Internationalized Domain Names (IDNs), which allow the use of domain names in their own language.

다국어도메인, IDN은 기존의 영문자들만 처리 가능한 도메인네임 시스템에서 비영어권 국가의 자국어로 이루어진 다국어 도메인네임을 처리하기 위하여, 비영문자를 정해진 규칙에 따라 영문자들로 변환하는 코딩 변환방식을 이용하고 있다. 예를들어 '대한민국'이라는 비영문자인 문자는 'xn--3e0bs9hfvinn1a'와 같은 형태로 변경되는 방식이다. 그러나 다국어도메인은 기존의 도메인네임의 계층적인 구조를 이용하고 있으므로 웹사이트의 식별자인 기업명, 브랜드명 등의 뒤에 국가코드 등의 TLD가 추가로 부착되어야만 하는 불편함이 있다. 더구나 TLD는 각 처리 시스템을 구분하는 것 외에 큰 의미를 갖지않는 경우가 많다.In order to process multilingual domain names composed of native languages of non-English speaking countries, IDN uses a coding conversion method that converts non-English characters into English characters according to a predetermined rule. For example, the non-English letter 'Korea' is changed to 'xn-3e0bs9hfvinn1a'. However, since the multilingual domain name uses the hierarchical structure of the existing domain name, it is inconvenient to add a TLD such as a country code after the company name, the brand name, etc. of the website. Moreover, TLDs often do not have much meaning besides distinguishing each treatment system.

본 발명은 계층형의 다국어도메인 사용시 반드시 입력, 부착해야만 하는 TLD를 사용자가 직접 일일이 입력하지 않고 키워드 형태의 단어만 입력하더라도 자동적으로 입력 언어를 판단하여 TLD를 부착, 처리할 수 있도록 하고자 하는 방법에 관한 것이다. 그러나 기존의 방법들은 이러한 처리를 위하여 사용자 단말이나 도메인네임서버에 별도의 프로그램을 설치해야만 하는 불편함이 있다. The present invention provides a method for automatically attaching and processing a TLD by judging an input language even if a user inputs a TLD that must be input and attached when using a hierarchical multilingual domain. It is about. However, the existing methods are inconvenient to install a separate program in the user terminal or domain name server for this process.

본 발명은 다국어로 표기된 인터넷주소를 처리함에 있어서 사용자에 의해 입력된 문자의 언어 코드를 판별하는 등의 방법을 이용하여 사용자의 언어와 국가 정보를 파악함으로써 국가 구분자를 별도로 입력, 부가하지 않더라도 해당 DB에서 처리 가능하도록 하는 방법을 이용한다.In the present invention, the language and country information of the user is determined using a method such as determining a language code of a character input by a user in processing an internet address displayed in multiple languages, even if a country separator is not separately inputted or added. Use the method to make it possible to process in.

본 발명은 다국어로 표기된 인터넷주소를 처리하기 위하여 코드 변환 및 언어코드 판별을 사용자 단말 또는 도메인네임서버에 해당 기능의 프로그램을 별도로 설치하지 않고 사용자 단말이 연결된 네트워크 단에서 처리하는 방법을 이용한다. The present invention utilizes a method of processing a code conversion and language code determination in a network terminal to which a user terminal is connected without separately installing a program of a corresponding function in a user terminal or a domain name server in order to process an internet address displayed in multiple languages.

본 발명에 의한 다국어주소 처리 시스템 및 방법은 다국어 인터넷주소를 이용함에 있어 별도의 TLD를 일일이 입력하지 않고 키워드 형태의 단어만 입력하더라도, 입력된 언어를 판단하여 자동으로 TLD가 부착됨으로써 인터넷 이용을 편하게 해 주는 효과가 있다. 또한 처리를 위하여 사용자 단말이나 도메인네임서버에 별도의 프로그램을 설치하지 않아도 되므로 사용자에게 불편함을 주지 않으면서도 다수의 사용자들에게 서비스를 제공하는 것이 가능한 효과가 있다. In the multilingual address processing system and method according to the present invention, even when only a word in the form of a keyword is inputted without using a separate TLD, the TLD is automatically attached to determine the input language to facilitate the use of the Internet. It is effective. In addition, since there is no need to install a separate program in the user terminal or domain name server for processing, it is possible to provide a service to a plurality of users without inconvenience to the user.

도 1은 본 발명의 실시 예에 따른 다국어주소 처리를 위한 시스템의 전체 구성도이다.
도 2는 인터넷에서 이용되는 통신 데이터인 이더넷 프레임의 구도조이다.
도 3은 도메인네임 질의 데이터의 구조도이다.
도 4는 본 발명의 실시 예에 따른 다국어주소 처리 방법의 처리 흐름도이다.
1 is an overall configuration diagram of a system for multilingual address processing according to an embodiment of the present invention.
2 is a structure of Ethernet frame which is communication data used in the Internet.
3 is a structural diagram of domain name query data.
4 is a flowchart illustrating a multilingual address processing method according to an embodiment of the present invention.

본 발명은 다국어 인터넷주소 처리 시스템 및 방법에 관한 것으로 보다 자세하게는 인터넷주소를 키워드 형태로만 입력하더라도 입력 언어 등의 정보 판단을 통하여 해당 TLD를 자동으로 부착하여 처리되도록 하기 위한 시스템 및 방법에 대한 것이다. 예를들어 한글로 '대한민국'이라고만 입력하더라도, 입력 언어 판별을 통해 한국에 대응하는 TLD인 '.kr' 또는 '.한국'을 입력 문자열인 '대한민국' 뒤에 부가하여 '대한민국.kr' 또는 '대한민국.한국'으로 처리 가능하도록 하는 방법이다.
The present invention relates to a multilingual Internet address processing system and method, and more particularly, to a system and method for automatically attaching and processing a corresponding TLD by determining information such as an input language even when an Internet address is input in a keyword form. For example, even if you input only 'Korea' in Korean, you can add '.kr' or '.Korea', which corresponds to Korea, after the input string 'Korean,' followed by 'Korean.kr' or ' Korea, Korea. '

이하 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 본 발명의 바람직한 실시 예들을 첨부된 도면들을 참조하여 설명한다.
DETAILED DESCRIPTION Hereinafter, exemplary embodiments of the present invention will be described with reference to the accompanying drawings so that those skilled in the art can easily implement the technical idea of the present invention.

도 1은 본 발명의 실시 예에 따른 다국어주소 처리를 위한 시스템의 전체 구성도이다.
1 is an overall configuration diagram of a system for multilingual address processing according to an embodiment of the present invention.

본 발명에 의한 다국어 인터넷주소 처리를 위한 시스템은 크게 사용자 단말(100)과 다국어 인터넷주소 처리 기능을 하는 다국어주소 처리 시스템(200), 도메인네임서버(300), 최종적으로 접속이 이루어지는 웹 서버(400)로 구성되어 기능을 하게 된다.
The system for multilingual Internet address processing according to the present invention includes a multilingual address processing system 200, a domain name server 300, and a web server 400 finally connected to a user terminal 100 and a multilingual internet address processing function. ) To function.

사용자 단말(100)은 브라우저가 설치되어 있고 사용자가 웹 사이트에 접속하기 위하여 인터넷주소를 입력하여 이용하는 장치로써 일반적인 PC뿐 아니라 냉장고, TV, 스마트폰 등의 인터넷이 가능한 모든 장치들이 가능하며, 유선이나 모바일 등 접속 방법에도 구애되지 않는다.
The user terminal 100 is a device where a browser is installed and a user inputs and uses an Internet address to access a web site. The user terminal 100 can be any device capable of internet, such as a refrigerator, a TV, a smartphone, as well as a general PC. It is not particular about connection method such as mobile.

다국어주소 처리 시스템(200)은 사용자 단말이 인터넷에 연결되는 네트워크의 중단에 위치하여 본 발명에 의한 다국어 인터넷주소 처리를 위한 핵심적인 기능을 하는 것으로, 사용자 단말이 외부 네트워크로 연결하기 위해 이용하는 라우터와 인터넷 서비스 제공자 사이에 위치할 수 있고, 사용자 단말이 연결되어 있는 인터넷 서비스 제공자에 위치할 수도 있으며, 인터넷을 통한 데이터 전송이 집중되는 라우터, 허브 등 네트워크를 통해서 전송되는 데이터를 네트워크 상에서 수신하여 처리하여 목적을 달성할 수 있는 곳이라면 특별히 한정되지 않는다.
The multilingual address processing system 200 serves as a core function for processing a multilingual internet address according to the present invention, which is located at the interruption of a network where the user terminal is connected to the Internet, and the router used by the user terminal to connect to an external network. It can be located between the Internet service providers, and can be located in the Internet service provider to which the user terminal is connected, and receives and processes the data transmitted through the network such as routers and hubs where data transmission is concentrated through the Internet. The place where the purpose can be achieved is not particularly limited.

도메인네임서버(300)는 도메인네임 질의에 대해 IP주소를 응답해 주는 기능을 하는 서버로써, 일반 인터넷 이용자들이 숫자로 된 IP주소를 모르더라도 www.kipo.go.kr과 같은 도메인을 이용하여 쉽고 편하게 인터넷을 이용 가능하게 해 준다. 도메인네임은 계층형 구조를 가지고 있으며, 도메인네임서버(300)는 질의된 도메인네임을 해석, 처리하기 위하여 상위 레벨부터 순차적으로 확인하는 과정을 거쳐 최종적으로 대응되는 IP주소를 찾게 된다. 그러나 도메인네임서버(300)는 도메인네임 시스템이 설계되던 당시 ASCII로 구성된 영문자만 처리 가능하도록 만들어져 있으며, 따라서 통상의 도메인네임서버(300)로 질의를 할 때는 ASCII로 구성된 문자의 형태로 해야만 한다.
The domain name server 300 is a server that responds to an IP address in response to a domain name query. Even if the general Internet users do not know the numerical IP address, it is easy to use a domain such as www.kipo.go.kr. Makes it easy to use the Internet. The domain name has a hierarchical structure, and the domain name server 300 finds a corresponding IP address through a process of sequentially checking from a high level in order to interpret and process a queried domain name. However, the domain name server 300 is made to process only English characters composed of ASCII at the time the domain name system was designed, so when querying with a conventional domain name server 300 should be in the form of characters consisting of ASCII.

웹 서버(400)는 사용자가 인터넷주소를 이용하여 최종적으로 접속하고자 했던 웹 사이트의 내용이 담긴 서버이다. 사용자 단말(100)은 도메인네임서버(300)로부터 웹 서버(400)의 IP주소를 응답받아 서버로 접속하게 된다.
Web server 400 is a server that contains the content of the Web site that the user finally wants to access using the Internet address. The user terminal 100 receives the IP address of the web server 400 from the domain name server 300 to connect to the server.

이하에서는 본 발명의 목적에 따른 기능을 하기 위한 핵심적 기능을 수행하는 다국어주소 처리 시스템(200)에 대하여 보다 구체적으로 설명한다.
Hereinafter, the multilingual address processing system 200 performing core functions for performing a function according to an object of the present invention will be described in more detail.

다국어주소 처리 시스템(200)은 사용자 단말(100)에서 전송된 네트워크 통신 데이터가 모두 거쳐가게 되며, 그 중 처리가 필요한 대상에 대하여 선별적으로 조치를 취하게 된다. 네트워크 중간에 위치하는 다국어주소 처리 시스템(200)이 네트워크 데이터를 수신, 처리하는 방법에는 미러링 방식과 프록시 방식 두 가지가 있다.
The multilingual address processing system 200 passes all network communication data transmitted from the user terminal 100, and selectively takes action on an object requiring processing. There are two methods of receiving and processing network data by the multilingual address processing system 200 located in the middle of a network, such as a mirroring method and a proxy method.

미러링 방식은 전달되는 데이터를 L7 스위치나 네트워크 탭과 같은 네트워크 장치들을 이용하여 복사, 처리하는 방법이며 네트워크 중간에 위치하게 되는 다국어주소 처리 시스템(200)에 장애가 발생하게 되더라도 네트워크의 연결 및 이용에 지장을 주지 않는다는 장점이 있다. The mirroring method is a method of copying and processing the transmitted data by using network devices such as an L7 switch or a network tap. Even if a failure occurs in the multilingual address processing system 200 located in the middle of the network, the connection and use of the network may be disrupted. There is an advantage that does not give.

프록시 방식은 네트워크 중간에 프록시 장비를 추가하고, 모든 데이터가 프록시 서버를 통과해야만 다음 단계로 넘어갈 수 있도록 하는 방법으로, 프록시 장비에서의 처리가 완료되어야만 다음 단계로 넘어갈 수 있으므로 확실한 처리가 보장된다는 장점이 있다.The proxy method adds a proxy device in the middle of the network and allows all data to pass to the next step only after passing through the proxy server. The processing can be passed to the next step only when the proxy device is completed. There is this.

그러나 미러링 방식이나 프록시 방식 모두 전송되는 네트워크 데이터 전체를 대상으로 처리하는 것은 시간도 많이 소요되고 시스템에 많은 부하가 걸리게 되어 효율적이지 못하므로, 네트워크 데이터 중 처리 대상이 되는 데이터만을 추려내어 신속히 처리하는 것이 바람직하다.
However, processing the entire network data that is transmitted in both the mirroring method and the proxy method is time consuming and requires a lot of load on the system. Therefore, it is difficult to extract only the data that is to be processed and to process it quickly. desirable.

네트워크 통신을 위한 데이터는 이더넷 프레임이라 불리는 통신 데이터로 만들어져 전송이 이루어지게 되며, 이더넷 프레임 안에는 통신에 필요한 각종 정보들이 헤더 정보로 포함되게 된다.
Data for network communication is made of communication data called an Ethernet frame to be transmitted, and various information necessary for communication are included as header information in the Ethernet frame.

도 2는 인터넷에서 이용되는 통신 데이터인 이더넷 프레임의 구도조이다.
2 is a structure of Ethernet frame which is communication data used in the Internet.

이더넷 프레임의 내용 중 이더넷헤더에는 하드웨어 주소인 MAC 어드레스 등의 정보가 포함되어 있으며, IP헤더에는 발신지와 목적지의 IP주소에 대한 정보 등이 포함되어 있다. 그리고 TCP(UDP)헤더에는 서비스의 통신 포트 등에 대한 정보가 포함되어 있다. Among the contents of the Ethernet frame, the Ethernet header contains information such as the MAC address, which is a hardware address, and the IP header contains information about the source and destination IP addresses. The TCP (UDP) header includes information on a communication port of a service.

본 발명에 의한 다국어주소 처리 방식은 네트워크를 통하여 전송되는 데이터 중 도메인네임서버(200)를 목적지로 하는 데이터만을 대상으로 처리하면 되며, 이를 위하여 미러링 방식 또는 프록시 방식을 통해 전송되는 네트워크 데이터에 대하여, TCP 헤더의 서비스 통신 포트 정보 등을 확인함으로써 대상 여부를 판단할 수 있다. The multilingual address processing method according to the present invention only needs to process the data of the domain name server 200 as a destination among the data transmitted through the network, and for this, for the network data transmitted through the mirroring method or the proxy method, By checking the service communication port information of the TCP header, it is possible to determine whether the target.

일반적인 HTTP 질의의 경우 목적지 포트 번호가 80번, 도메인네임서버(200)로 질의되는 도메인네임 질의는 목적지 포트 번호가 53번과 같은 식으로 달리 구분되어 사용되므로, 목적지의 포트 번호 확인을 통해 처리 대상 여부 판별이 가능하며, 처리 대상이 되는 경우만 본 발명에 의한 처리를 진행하게 된다.
In the case of a general HTTP query, the destination port number is 80 and the domain name query that is queried by the domain name server 200 is differently used as the destination port number is 53. Therefore, the target port number is processed by checking the port number of the destination. It is possible to determine whether or not, and the process according to the present invention is carried out only when it becomes a process target.

다국어주소 처리 시스템(200)이 프록시 또는 미러링 방법에 의해 전달되고, 포트 번호 확인 등을 통하여 처리 대상인 것으로 판별한 도메인네임 질의 데이터는 도 3과 같은 구조로 이루어져 있다.The domain name query data that is transmitted by the multilingual address processing system 200 by a proxy or mirroring method and determined to be a processing target through port number checking or the like has a structure as shown in FIG. 3.

다국어주소 처리 시스템(200)은 도메인네임 질의 데이터의 내용 중 질의 필드의 내용에 대하여 질의된 인터넷주소가 키워드 형태인지 여부를 확인하고, 질의된 인터넷주소가 키워드 형태인 것으로 판단된 경우 문자 코드 확인 등을 통하여 입력된 문자의 언어를 판단한다. 이 경우 다국어주소 처리 시스템(200)은 사용자 단말(100)로부터 전달된 도메인네임 질의 데이터의 질의 필드 내용이 영문 형태로 되어 있는지 여부, 즉 7bit로 되어 있는지 아니면 8bit로 되어 있는지에 따라 처리 절차가 달라질 수 있다.The multilingual address processing system 200 checks whether the Internet address queried for the content of the query field among the contents of the domain name query data is a keyword type, and if it is determined that the queried Internet address is a keyword type, character code check etc. Determines the language of the text entered through. In this case, the multilingual address processing system 200 may have different processing procedures depending on whether the contents of the query field of the domain name query data transmitted from the user terminal 100 are in English, that is, 7 bits or 8 bits. Can be.

대부분의 경우 비영문자로 된 다국어주소가 입력되면, 사용자 단말(100)의 브라우저 등은 이를 퓨니코드 등 7bit의 영문 형태로 인코딩 후 도메인네임서버(300)로 전달하게 되며, 이때 영문 형태로 변환된 코딩 질의메시지는 퓨니코드의 경우 'xn--'로 시작되는 등 쉽게 구분 가능하도록 되어 있어, 판단이 용이하다. 그러나 영문 형태로 인코딩된 질의메시지는 그 자체만으로는 사용자가 입력한 문자가 어떤 것이었는지 판단할 수가 없다. 따라서 이때는 영문 형태로 인코딩된 질의메시지를 다시 역으로 변환하여 문자의 종류를 판단하게 되며, 퓨니코드를 포함한 많은 경우 역변환을 하게 되면 유니코드 형태로 변환이 된다. 유니코드는 전세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 표준 방식의 코드로, 기존의 인코딩들은 그 규모나 범위 면에서 한정되어 있고, 다국어 환경에서는 서로 호환되지 않는 문제점이 있으므로, 현존하는 여러 문자 인코딩 방법들을 모두 유니코드로 교체하고자 하는 목적하에 작업이 진행중이기도 하다. 사용자 단말(100)에 입력된 문자는 유니코드 상태에서 입력 문자의 문자셋을 확인, 분석함으로써 해당 언어의 종류를 판단할 수 있다. 문자셋이란 하나의 언어권에서 사용하는 언어를 표현하기 위한 모든 문자의 모임을 지칭하는 것으로 부호와 공백 등과 같은 특수 문자도 모두 문자셋에 포함된다. 입력 문자가 어떤 언어로 된 것인지 확인되면, 다국어주소 처리 시스템(200)은 입력 언어에 대응되는 TLD를 키워드 형태의 질의메시지 뒤에 부착하게 된다. 예를들어 입력 언어가 한글로 판단되면 '.kr' 또는 '.한국'을, 입력 언어가 일어로 판단되면 '.jp' 또는 '.日本'을 부착하게 된다. 부착되는 TLD는 기존의 ccTLD일 수도 있으나, 별도로 지정된 다른 TLD가 될 수도 있으며, 다국어로 표현된 것일수도 있다. 이때 TLD에 대한 정보는 다국어주소 처리 시스템(200) 내부에 DB로 존재하거나 외부의 별도 서버에 저장되어 있을 수 있으며, 외부 서버로부터 내용을 전달받아 다국어주소 처리 시스템(200)에 저장하는 방식으로 이용될 수 있다. 다국어주소 처리 시스템(200)은 키워드 형태의 다국어 입력에 대해 TLD를 부가한 후 이를 다시 도메인네임서버(300)가 처리 가능한 7bit 형태로 인코딩하여 도메인네임서버(300)에 전달함으로써, 도메인네임서버(300)가 그에 대응하는 IP주소를 찾아 사용자 단말(100)에 응답할 수 있도록 한다. 이때, 사용자 단말(100)로부터 전달받은 7bit 형태의 질의메시지에 7bit 형태의 TLD를 단순 부가하여 도메인네임서버(300)로 전달하거나 7bit 형태의 질의메시지를 8bit 유니코드 형태로 변환한 상태에서 TLD를 부가하고 다시 7bit 형태로 인코딩 하는 방법 등 질의메시지와 TLD의 인코딩 순서는 여러 형태로 조합하여 구현하는 것이 가능하며, 어느 한 가지 방법으로 한정되지 않는다. In most cases, when a non-English alphabetic language address is input, the browser of the user terminal 100 is encoded in 7-bit English form such as Punicode, and then transferred to the domain name server 300. Coding query messages can be easily distinguished, such as 'xn--' in the case of Punicode, and are easy to determine. However, an English-language query message cannot determine which character the user has entered by itself. Therefore, in this case, the query message encoded in the English form is converted back to determine the type of the character. In many cases including the Punicode, the reverse conversion is converted to the Unicode form. Unicode is a standard code designed to consistently represent and handle all the characters of the world on a computer. Existing encodings are limited in size and scope, and are incompatible with each other in multilingual environments. Work is underway with the goal of replacing all the different character encoding methods with Unicode. The character input to the user terminal 100 may determine the type of the corresponding language by checking and analyzing the character set of the input character in the Unicode state. A character set refers to a collection of all characters for expressing a language used in a single language, and all special characters such as a sign and a space are also included in the character set. When the input character is identified in which language, the multilingual address processing system 200 attaches the TLD corresponding to the input language after the query message in the form of a keyword. For example, if the input language is determined to be Korean, '.kr' or '.Korea' is attached. If the input language is determined to be Japanese, '.jp' or '. 日本' is attached. The attached TLD may be an existing ccTLD, but may be another TLD separately designated, or may be expressed in multiple languages. In this case, the information about the TLD may exist as a DB in the multilingual address processing system 200 or may be stored in a separate server externally, and may be used by receiving contents from an external server and storing the information in the multilingual address processing system 200. Can be. The multilingual address processing system 200 adds a TLD to a multilingual input in the form of a keyword, encodes it in a 7-bit form that the domain name server 300 can process, and then delivers the TLD to the domain name server 300, thereby providing a domain name server ( 300 to find the IP address corresponding to the response to the user terminal 100. In this case, the 7-bit TLD of the 7-bit query message received from the user terminal 100 is simply added to the domain name server 300, or the 7-bit query message is converted to the 8-bit Unicode form TLD in the state In addition, the encoding order of the query message and the TLD, such as a 7-bit encoding method, may be implemented in various forms, and is not limited to any one method.

반면, 사용자 단말(100)로부터 전달된 도메인네임 질의 데이터의 질의 필드 내용이 8bit로 되어 있는 경우에는 사용자가 입력한 문자가 어떤 언어로 되어 있는지 확인하기에 어려움이 있다. 이를 확인하기 위하여 다국어주소 처리 시스템(200)은 질의메시지를 특정 인코딩으로 가정, 유니코드로 변환 후 정상적으로 변환되는지 여부확인을 통하여 사용자가 입력한 문자의 인코딩과 언어 종류를 판단하게 된다. 이때 인코딩 방법에는 여러가지가 있고 각각의 방법들을 일일이 변환시키며 확인하기에는 시스템 부하와 처리 시간상 문제가 될 수 있으므로, 다국어주소 처리 시스템(200)은 사용자 단말(100)의 위치 정보 등을 바탕으로 이용률이 높은 인코딩부터 적용하여 입력 문자의 언어 종류를 확인하는 것이 바람직하다. 입력 언어가 판단된 질의메시지는 언어에 대응하는 TLD가 부가된 후 통상의 도메인네임서버(300)에서 처리 가능한 7bit 형태로 인코딩 후 도메인네임서버(300)로 전달함으로써, 도메인네임서버(300)가 그에 대응하는 IP주소를 찾아 사용자 단말(100)에 응답할 수 있도록 한다.
On the other hand, when the content of the query field of the domain name query data transmitted from the user terminal 100 is 8 bits, it is difficult to confirm in which language the character entered by the user is in a language. In order to confirm this, the multilingual address processing system 200 assumes a query message as a specific encoding, and determines the encoding and the language type of a character input by the user by checking whether the conversion is normally performed after conversion to Unicode. At this time, since there are various encoding methods and it may be a problem in system load and processing time to convert and check each method individually, the multilingual address processing system 200 has a high utilization rate based on the location information of the user terminal 100 and the like. It is desirable to check the language type of the input character by applying the encoding first. The query message in which the input language is determined is encoded in a 7-bit form that can be processed by the conventional domain name server 300 after the TLD corresponding to the language is added, and then transmitted to the domain name server 300, thereby providing a domain name server 300. The corresponding IP address can be found and responded to the user terminal 100.

도 4는 본 발명의 실시 예에 따른 다국어주소 처리 방법의 처리 흐름도이다.
4 is a flowchart illustrating a multilingual address processing method according to an embodiment of the present invention.

사용자가 사용자 단말(100)의 브라우저 주소창 등에 인터넷주소를 입력하게 되면(S101), 입력된 인터넷주소는 도메인네임서버(300)로 질의된다(S103). 이 도메인네임서버(300)로 질의된 데이터는 네트워크 중간에 위치하고 있는 다국어주소 처리 시스템(200)을 먼저 거치게 되며(S105), 다국어주소 처리 시스템(200)은 수신한 데이터에 대하여 도메인네임서버(300)로 질의되는 데이터인지 여부를 판단하게 된다(S107). 만약 네트워크 데이터가 도메인네임 질의가 아니라면 다국어주소 처리 시스템(200)은 처리를 종료하고 네트워크 데이터는 통상의 데이터 전송 방식에 따라 계속 처리가 이루어지게 된다. 다국어주소 처리 시스템(200)이 네트워크 중간에서 수신한 네트워크 데이터가 도메인네임 질의라면, 다국어주소 처리 시스템(200)은 질의 데이터의 내용 중 질의 메시지 부분을 확인하여 질의메시지가 키워드 형태인지 여부를 판단한다(S109). 키워드 여부 판단은 도메인네임 질의 데이터 질의 필드의 질의메시지에 '.'이 포함되어 있는지 확인을 통해 할 수 있다. 만약 키워드 형태 여부 판단 단계(S109)에서 질의메시지가 키워드 형태가 아닌 것으로 판단되며, 다국어주소 처리 시스템(200)은 더 이상의 기능을 하지 않고, 네트워크 데이터는 통상의 데이터 전송 방식에 따라 전송되고 도메인네임서버(300)가 질의메시지를 처리하게 된다(S115). 질의메시지가 키워드 형태인 것으로 판단되면, 다국어주소 처리 시스템(200)은 질의메시지 분석을 통하여 사용자가 입력하였던 인터넷주소의 언어 종류를 확인하게 된다(S111). 사용자 단말(100)로부터 전달된 도메인네임 질의 데이터 질의 필드의 질의메시지가 7bit의 퓨니코드 등으로 변환 처리되어 있는 경우, 자국어주소 처리 시스템(200)은 질의메시지를 다시 유니코드로 역변환하고, 문자셋을 통하여 입력 문자의 언어를 확인할 수 있다. 그러나 사용자 단말(100)로부터 전달된 도메인네임 질의 데이터 질의 필드의 질의메시지가 8bit인 경우에는 질의메시지를 유니코드로 변환 후 정상적으로 변환되었는지 여부 확인을 통하여 사용자가 입력한 문자의 인코딩과 언어 종류를 알 수 있다. 많은 인코딩 방법들이 존재하므로 각각의 방법들을 일일이 변환시키며 확인하기에는 시스템 부하와 처리 시간상 문제가 될 수 있으므로, 사용자 단말(100)의 위치 정보 등을 바탕으로 이용률이 높은 인코딩부터 적용하여 확인하는 것이 바람직하다. 다국어주소 처리 시스템(200)은 입력 언어가 판단된 질의메시지에 대해 언어에 대응하는 TLD 를 부가(S113)한 후 통상의 도메인네임서버(300)에서 처리 가능한 7bit 형태로 인코딩하여 도메인네임서버(300)로 전달(S115)함으로써, 도메인네임서버(300)가 그에 대응하는 IP주소를 찾아 사용자 단말(100)에 응답할 수 있도록 한다. When the user inputs the Internet address to the browser address bar of the user terminal 100 (S101), the input Internet address is queried to the domain name server 300 (S103). The data queried by the domain name server 300 first passes through the multilingual address processing system 200 located in the middle of the network (S105), and the multilingual address processing system 200 receives the domain name server 300 for the received data. It is determined whether the data is queried () (S107). If the network data is not a domain name query, the multilingual address processing system 200 terminates the processing, and the network data is continuously processed according to a normal data transmission method. If the multilingual address processing system 200 receives the domain name query in the middle of the network, the multilingual address processing system 200 checks the query message part of the contents of the query data to determine whether the query message is a keyword type. (S109). The keyword can be determined by checking whether the '.' Is included in the query message of the domain name query data query field. If it is determined in step S109 that the query message is not a keyword type, the multilingual address processing system 200 does not function any more, and network data is transmitted according to a normal data transmission method and is a domain name. The server 300 processes the query message (S115). If it is determined that the query message is in the form of a keyword, the multilingual address processing system 200 checks the language type of the Internet address input by the user through analysis of the query message (S111). When the query message of the domain name query data query field transmitted from the user terminal 100 is converted to 7-bit punycode or the like, the national language address processing system 200 inversely converts the query message back to Unicode, and converts the character set. You can check the language of the input text. However, if the query message of the domain name query data query field transmitted from the user terminal 100 is 8 bits, the encoding and language type of the character input by the user are checked by converting the query message to Unicode and confirming whether it is converted normally. Can be. Since there are many encoding methods, it may be a problem in system load and processing time to convert and check each method individually. Therefore, it is preferable to check and apply the encoding having high utilization rate based on the location information of the user terminal 100. . The multilingual address processing system 200 adds a TLD corresponding to the language to the query message in which the input language is determined (S113), and then encodes the multilingual address processing system into a 7-bit form that can be processed by the conventional domain name server 300. By forwarding (S115), the domain name server 300 finds an IP address corresponding to the domain name server 300 and responds to the user terminal 100.

이후 사용자 단말(100)은 도메인네임서버(300)로부터 입력한 인터넷주소에 대응하는 웹 서버(400)의 IP주소를 응답받아 웹 서버(400)에 접속하게 된다.
Thereafter, the user terminal 100 receives the IP address of the web server 400 corresponding to the Internet address input from the domain name server 300 to access the web server 400.

100 : 사용자 단말
200 : 다국어주소 처리 시스템
300 : 도메인네임서버
400 : 웹 서버
100: user terminal
200: multilingual address processing system
300: domain name server
400: web server

Claims (2)

다국어 인터넷주소를 처리하는 시스템에 있어서,
사용자 단말에서 전송되는 네트워크 정보를 네트워크 상에서 수신하며,
사용자 단말로부터 수신한 네트워크 정보가 도메인네임 서버로 전송되는 인터넷주소 질의 정보인지 여부를 판단하며,
도메인네임 서버로 전송되는 인터넷주소 질의 정보인 경우, 도메인네임으로 질의하는 질의메시지가 키워드형태인지를 판단하고,
질의메시지가 키워드형태인 경우 언어의 종류를 판단하여 대응하는 TLD를 상기 키워드 형태의 질의메시지에 부가하여 네트워크 정보를 구성 후 도메인네임서버로 전송하는 것을 특징으로 하는 다국어 인터넷주소 처리 시스템
In a system for processing multilingual internet addresses,
Receive network information transmitted from the user terminal on the network,
It is determined whether the network information received from the user terminal is Internet address query information transmitted to the domain name server.
In the case of the Internet address query information transmitted to the domain name server, it is determined whether the query message to be queried by the domain name is a keyword type,
If the query message is a keyword type multi-language Internet address processing system characterized in that it determines the type of language and adds the corresponding TLD to the query message of the keyword type to form network information and transmit it to the domain name server.
다국어 인터넷주소를 처리하는 방법에 있어서,
사용자 단말에서 전송되는 네트워크 정보를 네트워크 상에서 수신하는 단계;
사용자 단말로부터 수신한 네트워크 정보가 도메인네임 서버로 전송되는 인터넷주소 질의 정보인지 여부를 판단하는 단계;
도메인네임 서버로 전송되는 인터넷주소 질의 정보인 경우, 도메인네임으로질의하는 질의메시지가 키워드형태인지를 판단하는 단계;
질의메시지가 키워드형태인 경우 언어의 종류를 판단하여 대응하는 TLD를 상기 키워드 형태의 질의메시지에 부가하여 네트워크 정보를 구성 후 도메인네임서버로 전송하는 단계
를 포함하는 것을 특징으로 하는 다국어 인터넷주소 처리 방법
In the method of processing a multilingual internet address,
Receiving network information transmitted from a user terminal on a network;
Determining whether the network information received from the user terminal is Internet address query information transmitted to a domain name server;
If the Internet address query information is transmitted to the domain name server, determining whether the query message queried by the domain name is a keyword type;
If the query message is a keyword type, determining the type of language and adding a corresponding TLD to the query message of the keyword type to configure network information and then transmitting the network information to the domain name server;
Multilingual Internet address processing method comprising the
KR1020100016622A 2010-02-24 2010-02-24 Internationalized internet address processing system and method thereof KR20110097015A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100016622A KR20110097015A (en) 2010-02-24 2010-02-24 Internationalized internet address processing system and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100016622A KR20110097015A (en) 2010-02-24 2010-02-24 Internationalized internet address processing system and method thereof

Publications (1)

Publication Number Publication Date
KR20110097015A true KR20110097015A (en) 2011-08-31

Family

ID=44932099

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100016622A KR20110097015A (en) 2010-02-24 2010-02-24 Internationalized internet address processing system and method thereof

Country Status (1)

Country Link
KR (1) KR20110097015A (en)

Similar Documents

Publication Publication Date Title
US8543732B2 (en) Method and apparatus for multiplexing internet domain names
EP2306689B1 (en) Devices and method for accessing a web server in a local space
US20060129696A1 (en) Systems and methods for communicating across various communication applications using single address strings
KR20020082461A (en) Network address server
CN1289423A (en) Www addressing
WO2012034518A1 (en) Method and system for providing message including universal resource locator
CN112954089B (en) Method, device, equipment and storage medium for analyzing data
CN103368977A (en) Network connection method and terminal equipment
EA011266B1 (en) Native language internet address system
US20190065485A1 (en) Translation system
KR100706702B1 (en) Korean Internet contents address service method and system using original DNS
KR100818200B1 (en) The Method and System of Connecting Internet Using Keyword Based on DNS
KR20110097015A (en) Internationalized internet address processing system and method thereof
KR20070008920A (en) System with supporting multi-language for transferring e-mail and method using same
KR20110097211A (en) Internationalized internet address processing system and method thereof
KR100338666B1 (en) System for accesing web page using many languages and method thereof
CN107995325A (en) A kind of method that domain name mapping failure is reduced on Android
KR20110095755A (en) Internationalized internet address processing system and method thereof
CN103222252A (en) Service access apparatus, method, computer program and computer program product for selective initiation of communication
KR20000071911A (en) 2byte korean dns system
JP2003521844A (en) System and method for communicating across various communication applications using a single address string
WO2023067301A1 (en) Subdomain repurposing
US20070271244A1 (en) Method of searching a specific computer IP address of internet networks using several specific telephone number with numbers in series which are arranged and assembled in sequence and coded with identification codes
KR20060088200A (en) Website connecting method using keyword
KR20010075446A (en) Method and system for alternate internet resource identifiers and addresses

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination