KR20030057241A - Web-page converter and method for mobile web clients considering repeated grammatical pattern - Google Patents

Web-page converter and method for mobile web clients considering repeated grammatical pattern Download PDF

Info

Publication number
KR20030057241A
KR20030057241A KR1020010087639A KR20010087639A KR20030057241A KR 20030057241 A KR20030057241 A KR 20030057241A KR 1020010087639 A KR1020010087639 A KR 1020010087639A KR 20010087639 A KR20010087639 A KR 20010087639A KR 20030057241 A KR20030057241 A KR 20030057241A
Authority
KR
South Korea
Prior art keywords
web
document
web page
converting
web document
Prior art date
Application number
KR1020010087639A
Other languages
Korean (ko)
Inventor
김지홍
황용현
서은경
Original Assignee
유비퀵스(주)
김지홍
황용현
서은경
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 유비퀵스(주), 김지홍, 황용현, 서은경 filed Critical 유비퀵스(주)
Priority to KR1020010087639A priority Critical patent/KR20030057241A/en
Publication of KR20030057241A publication Critical patent/KR20030057241A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/18Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

PURPOSE: A device and a method for converting a user web page using a repeated grammar structure are provided to properly convert the web page fit to the characteristic of a portable information device by installing a proper intermediary between the portable information device and a server providing a web document, and offering a function to properly reduce a size of the web page. CONSTITUTION: An HTML(HyperText Markup Language) analyzer(31) receives an HTML document from the web server and analyzes an electronic document format of the web document. A grammar structure analyzer(32) judges the repeated part, a part to be hidden by a hyperlink, and the remaining part from the web document. A middle form converter(33) converts the web document into an expression method of a middle form for applying a conversion method. A filter(34) filters a part of the document contents from the web document converted into the expression method of the middle form by considering a specification of the portable information terminal. A remaking tool(35) makes the web document passing the filter(34) by a remaking method, and provides it to a mobile HTTP(HyperText Transfer Protocol) client.

Description

반복 문법 구조를 이용한 사용자 웹 페이지 변환 장치 및 방법{WEB-PAGE CONVERTER AND METHOD FOR MOBILE WEB CLIENTS CONSIDERING REPEATED GRAMMATICAL PATTERN}Device and method for converting user web pages using repetitive grammar structure {WEB-PAGE CONVERTER AND METHOD FOR MOBILE WEB CLIENTS CONSIDERING REPEATED GRAMMATICAL PATTERN}

본 발명은 휴대용 정보 기기를 통하여 웹 문서들을 접근할 때에 휴대용 정보 기기의 특성에 맞도록 웹 페이지를 변환하는 기술에 관한 것으로, 반복되는 문법 구조를 이용하여 웹 페이지를 축약함으로써 데스크탑 컴퓨터기반의 웹 문서들을 특정 휴대용 정보 기기에 맞도록 변환하여 문서의 품질이 높아지도록 한, 반복 문법 구조를 이용한 웹 페이지 변환 장치 및 방법에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a technique for converting a web page to fit the characteristics of a portable information device when accessing web documents through a portable information device. The present invention relates to a web document based on a desktop computer by shortening the web page using a repetitive grammar structure. The present invention relates to an apparatus and method for converting a web page using a repetitive grammar structure, by converting them to fit a specific portable information device to improve the quality of a document.

무선 통신 기술의 발달과 인터넷의 급속한 확산에 따라 최근 휴대용 정보 기기를 이용한 인터넷 서비스의 사용 양이 빠르게 증가하고 있다. 특히 인터넷 서비스의 대표 격인 WWW 문서들을 휴대용 정보 기기를 사용하여 접근할 수 있도록 해주는 새로운 서비스들이 여러 부선 통신 회사들을 통하여 제공되고 있으며, 이미 여러 해 전부터 휴대용 정보 기기를 이용한 웹 문서의 접근 가능성은 논의되고 있었다.With the development of wireless communication technology and the rapid spread of the Internet, the amount of use of Internet services using portable information devices is increasing rapidly. In particular, new services are being provided through various telecommunications companies to enable access to WWW documents, which are representative of Internet services, using portable information devices. Accessibility of web documents using portable information devices has been discussed for many years. there was.

하지만 휴대용 정보 기기를 통하여 접근하는 웹 문서들은 대부분 휴대용 정보 기기와는 상이한 시스템 사양(예: 고해상도의 디스플레이, 멀티미디어 지원)을 가지는 데스크탑 PC를 대상으로 설계되었기 때문에 매우 제약된 시스템 자원(예: 작은 디스플레이 화면, 낮은 연산 능력, 적은 기억 공간)을 갖는 휴대용 정보 기기로는 기존에 제작된 웹 문서들을 접근하는데 한계가 있을 수밖에 없다.However, most web documents accessed through portable information devices are designed for desktop PCs that have different system specifications (eg, higher resolution displays, multimedia support) than portable information devices. Portable information devices with screens, low computing power and low memory space have limitations in accessing existing web documents.

다시 말해서, 기존의 웹 문서들이 제공하는 멀티미디어 데이터들이나 고해상도의 디스플레이를 요구하는 이미지 정보들이 휴대용 정보 기기에서 일어나는 웹 문서에 대한 접근을 어렵게 하고 있는 것이다. 결국 이러한 문제점이 해결되지 않은 현시점에서 휴대용 정보 기기를 통한 웹 문서 접근서비스들의 수준은 매우 초보적인 단계라고 할 수 있다.In other words, multimedia data provided by existing web documents or image information requiring a high resolution display make access to a web document occurring in a portable information device difficult. As a result, the level of web document access services through portable information devices is very rudimentary.

매우 제약된 시스템 자원 내에서의 웹 문서의 접근을 위한 기존 연구는 이미 진행되어 왔으며, "특정 기기용 저작 기법(device-specific authoring)", "다중 기기용 저작 기법(multiple-device authoring)", "클라이언트 측의 변환 기법(client-side navigation)"의 세 가지 정도로 구분될 수 있다.Existing studies for accessing web documents within highly constrained system resources have already been conducted, including "device-specific authoring", "multiple-device authoring", There are three different levels of "client-side navigation."

특정 기기용 저작 기법은 현재 무선통신회사에서 상용 서비스 중인 무선 인터넷 서비스에 적용된 기법으로 WAP과 같은 표준 프로토콜을 사용한다. 이는 방대한 양의 웹 문서들 중 일부의 문서만을 특정 기기에 적합하도록 미리 저작하고 그 특정 기기를 통해서만 웹 문서에 접근할 수 있도록 하는 기법이다. 이러한 기법을 적용하기 위해서는 특정 기기에 적합하도록 웹 문서가 이미 변환되어 있어야 한다.The authoring technique for a specific device is a technique applied to a wireless Internet service currently being used by a wireless carrier and uses a standard protocol such as WAP. This is a technique to pre-authorize only a part of a large amount of web documents to be suitable for a specific device and to access the web document only through the specific device. In order to apply these techniques, web documents must already be converted to suit the particular device.

특정 기기용 저작 기법 보다 다소 일반적인 모델을 가정한 것이 다중 기기용 저작 기법이다. 이는 휴대용 정보 기기를 복수 개의 군(group)으로 분류하고 개개의 군에 적합하도록 복수 개의 변형된 웹 문서를 미리 저작해 놓고, 특정 군에 적합한 웹 문서를 서비스 해주는 기법이다. 비슷한 방법으로 사용자가 자신의 환경에 맞도록 스타일 시트(style sheet)를 정의하거나, 특정 기기를 목적(target)으로 정의된 스타일 시트가 웹 문서에 첨부되어 특정 기기에 적합한 화면 표시를 가능케 하는 기법이 있다. 스타일 시트(style sheet)에는 구조적인 측면에서 문서의 화면 표시(display)와 관련된 속성(attribute)(예: 문서의 상위 레벨 머리 글은 빨간색 16 포인트(point)) 등을 정의하고 있다.It is assumed that a more general model is assumed than a specific device authoring technique. This is a technique for classifying portable information devices into a plurality of groups, authoring a plurality of modified web documents in advance to suit individual groups, and serving web documents suitable for a specific group. In a similar way, you can define a style sheet to suit your environment, or attach a style sheet that targets a specific device to a web document, enabling a screen display that is appropriate for that particular device. have. In the style sheet, structurally, the attributes related to the display of the document (for example, the high-level header of the document is red 16 points) are defined.

마지막으로, 클라이언트 측의 변환 기법은 앞서 설명한 두 가지 기법이 서버 측의 변환 기법이라는 점에서 구분된다. 서버 측의 변환 기법이 클라이언트에 적합하도록 미리 서버 측에서 웹 문서에 변형을 가하는 기법들이라고 한다면, 클라이언트 측의 변환 기법은 사용자가 대화식(interactive)으로 특정 시간에 보여지는 웹 문서 영역을 수정할 수 있도록 하는 기법이다(예: 스크롤 바(scroll bar)). 비슷한 방법으로 사용자가 웹 문서를 주밍(zooming) 할 수 있는 기법 또한 소개되었다.Finally, client-side transformations are distinguished in that the two techniques described above are server-side transformations. If the server-side transformation techniques are those that modify the web document on the server side in advance so that they are suitable for the client, the client-side transformation technique allows the user to modify the area of the web document that is viewed at a specific time interactively. Technique (e.g. scroll bar). Similar techniques have been introduced to allow users to zoom a web document.

위에서 간략히 요약한 기법들은 무선 인터넷 환경에서 기존의 유선 인터넷 환경을 가정하고 저작된 웹 문서들을 접근하는데 부분적인 해결책을 제시하고 있으나 일반적인 해결책은 되지 못하고 있다.The techniques outlined above provide a partial solution for accessing authored web documents assuming a wired Internet environment in a wireless Internet environment, but not a general solution.

예를 들어, 특정 기기 혹은 복수 군의 휴대용 정보 단말기를 가정한 변환 기법들은 다양한 휴대용 정보 단말기가 생산되고 있는 현 시점에서 그 적용에 많은어려움이 있으며 더욱이 변환의 수준에 있어서도 웹 문서에서 제공하는 내용 대부분을 잘라 버리는 등 상당히 초보적인 단계에 머무르고 있어 그 적용 범위가 상당히 제한되고 있다. 또한 현재 데스크탑 PC를 가정하고 있는 WWW 환경을 많이 수정해야만 하는 등의 매우 제한적인 측면이 있어 임의의 웹 문서에의 접근에 많은 문제가 따를 수밖에 없다.For example, conversion techniques that assume a specific device or multiple groups of portable information terminals are difficult to apply at the present time when various portable information terminals are being produced, and moreover, most of the contents provided by the web document at the level of conversion. It is still in a very rudimentary stage, such as cutting off the material, and its scope of application is quite limited. In addition, there are very limited aspects, such as a lot of modifications to the WWW environment that currently assumes a desktop PC has a lot of problems to access any web document.

전술한 바와 같은 종래의 웹 페이지 변환 기술들은 웹 문서들을 휴대용 정보 기기의 성능에 맞도록 변환할 때에 웹 문서의 구조적인 측면만을 고려하여 변환하였으며, 이는 곧 무선 인터넷 환경에서 사용자에 의한 임의의 웹 문서로의 접근을 제한하는 요소가 됨을 알 수 있다.Conventional web page conversion techniques as described above have been converted in consideration of the structural aspects of the web document when converting the web document to match the performance of the portable information device, which means that any web document by the user in the wireless Internet environment It can be seen that this is a factor that restricts access to.

본 발명은 웹 문서들을 휴대용 정보 기기의 성능에 맞도록 변환할 때에 웹 문서 내부의 구조적 측면뿐만 아니라 이러한 구조들의 반복을 이용하여 웹 문서 전체의 의미를 훼손하지 않는 범위에서 문서를 축약하여 사용자로 하여금 보다 적은 접근 시간 내에 보다 작은 디스플레이 화면에서 원래의 웹 페이지를 볼 수 있도록 하는 점에서 착안하였다.The present invention uses the repetition of these structures as well as the structural aspects inside the web document when converting the web documents to suit the performance of the portable information device, and allows the user to abbreviate the document in a manner that does not impair the meaning of the entire web document. The idea was to make the original web page visible on a smaller display screen in less access time.

본 발명의 목적은 휴대용 정보 기기와 웹 문서를 제공하는 서버 사이에 적절한 매개자를 두고 웹 서버에서 제공하는 웹 문서들에서 사용되는 반복 문법 구조를 찾아내어 적절히 웹 페이지의 크기를 줄여 주는 기능을 제공함으로써 휴대용 정보 기기의 특성에 맞게 적절히 변환시켜주는 웹 페이지 변환 장치를 제공하는 데 있다.An object of the present invention is to provide a function to reduce the size of a web page appropriately by finding a repeating grammar structure used in web documents provided by a web server with an appropriate intermediary between a portable information device and a server providing a web document. The present invention provides a web page converting apparatus that converts the information appropriately for a characteristic of a portable information device.

본 발명의 다른 목적은 변환 기법을 적용하기 알맞도록 웹 문서들을 중간 형태의 표현법으로 바꾼 후 반복 문법 구조를 찾아 하부 사항을 적절히 걸러낸 후 재저작 기법을 거쳐 최종적으로 재저작된 문서를 만들어 내는 웹 페이지 변환 방법을 제공하는 것이다.Another object of the present invention is to change the web document to the intermediate form to apply the conversion technique, find the repetitive grammar structure, filter out the lower part, and then create the rewritten document through the rewriting technique It is to provide a page conversion method.

이와 같은 목적들을 실현하기 위한 본 발명에 따른 반복 문법 구조를 사용한 웹 페이지 변환 장치 및 방법은, 유선 인터넷 환경에 적합하게 저작된 웹 문서들을 무선 인터넷 환경에 적합하도록 재저작함에 있어서, 반복 문법 구조에 따라 해당 웹 문서에서 일부 문서 내용, 즉 각 구조의 첫 번째 문장에 해당하는 키워드를 제외한 하부 사항을 감추어 다음 접근 단계에서 참조할 수 있게 하고 제거하지는 않는 것을 그 특징으로 한다.The apparatus and method for converting a web page using a repetitive grammar structure according to the present invention for realizing the above-described objects may be applied to a repetitive grammar structure in rewriting web documents written for a wired Internet environment to be suitable for a wireless Internet environment. Therefore, some of the contents of the web document, that is, the lower part except the keyword corresponding to the first sentence of each structure, are hidden so that it can be referred to in the next access step and is not removed.

이러한 본 발명에 의하면, 기존의 WWW 환경을 변화시키지 않고 휴대용 정보 기기의 성능과 웹 문서가 요구하는 성능 사이의 불일치 문제에 대하여 좀 더 일반적인 방법론이 제시되어 상당히 제한된 접근만이 가능한 기존의 유선 인터넷용 웹 문서들에 대한 접근이 좀 더 원활해져 무선 인터넷에서 접근 가능한 웹 페이지의 숫자를 유선 인터넷 수준으로 향상시킬 수 있다.According to the present invention, a more general methodology is proposed for the problem of inconsistency between the performance of a portable information device and the performance required by a web document without changing the existing WWW environment. Access to Web documents is more seamless, which can increase the number of Web pages accessible from the wireless Internet to the wired Internet level.

도 1은 본 발명에 따른 웹 문서 변환 장치를 적용할 수 있 인터넷 서버/클라이언트 시스템의 구성도,1 is a configuration diagram of an Internet server / client system to which a web document conversion apparatus according to the present invention can be applied.

도 2는 본 발명에 따른 반복 문법 구조 분석기를 이용한 웹 문서 변환 장치의 구성도,2 is a block diagram of a web document conversion apparatus using an iterative grammar structure analyzer according to the present invention;

도 3a는 본 발명에 따른 변환 기법에서 사용된 중간 형태의 표현인 트리 자료 구조도,3A is a tree data structure diagram of an intermediate form of representation used in the transformation technique according to the present invention;

도 3b는 본 발명에 따라 도 3a의 웹 문서를 반복 문법 구조 분석 기법으로 재 저작한 트리 자료 구조도,3B is a tree data structure diagram of a web document of FIG. 3A rewritten by an iterative grammar structure analysis technique according to the present invention;

도 4는 본 발명에 따른 반복 문법 구조 분석기를 사용한 웹 문서 변환 방법을 설명하기 위한 플로우차트,4 is a flowchart illustrating a web document conversion method using an iterative grammar structure analyzer according to the present invention;

도 5는 데스크탑 컴퓨터 환경에 적합하게 저작된 웹 문서,5 is a web document authored for a desktop computer environment;

도 6a 내지 도 6c는 도 5의 웹 문서를 구조적인 측면만을 고려하여 변환한 웹 문서,6a to 6c illustrate a web document converted from only the structural aspects of the web document of FIG. 5;

도 7은 본 발명에 따라 도 5의 웹 문서를 반복 문법 구조 분석 기법을 사용하여 변환한 웹 문서이다.7 is a web document obtained by converting the web document of FIG. 5 using an iterative grammar structure analysis technique according to the present invention.

<도면의 주요 부분에 대한 부호의 설명><Description of the code | symbol about the principal part of drawing>

1 : 이동용 HTTP 클라이언트 2 : 웹 서버1: HTTP client for mobile 2: Web server

3 : 프록시 서버 30 : 웹 페이지 변환 장치3: proxy server 30: web page conversion device

31 : HTML 분석기 32 : 반복 문법 구조 분석기31: HTML Analyzer 32: Iterative Grammar Structure Analyzer

33 : 중간 형태 전환기 34 : 여과기33: intermediate form changer 34: filter

35 : 재 저작 도구35: Reauthoring Tool

본 발명의 실시 예로는 다수 개가 존재할 수 있으며, 이하에서는 첨부한 도면을 참조하여 바람직한 실시 예에 대하여 상세히 설명하기로 한다.There may be a plurality of embodiments of the present invention. Hereinafter, preferred embodiments will be described in detail with reference to the accompanying drawings.

이 실시 예를 통해 본 발명의 목적, 특징 및 이점들을 보다 잘 이해할 수 있게 된다. 첨부된 도면은 본 발명의 일 실시 예를 구체적으로 설명하는 것일 뿐이며본 발명의 범위가 도면 또는 도면을 참조한 설명에 의하여 제한되거나 한정되지 아니한다.Through this embodiment, it is possible to better understand the objects, features and advantages of the present invention. The accompanying drawings are only for describing one embodiment of the present invention in detail, and the scope of the present invention is not limited or limited by the drawings or the description with reference to the drawings.

도 1은 본 발명에 따른 웹 페이지 변환 장치를 적용할 수 있는 인터넷 서버/클라이언트 시스템의 구성도로서, 웹 페이지 변환 장치가 무선 인터넷 접속을 위한 프록시 서버에 포함되는 환경의 한 예를 보여 주고 있다.1 is a configuration diagram of an internet server / client system to which a web page converting apparatus according to the present invention is applicable, and shows an example of an environment in which the web page converting apparatus is included in a proxy server for wireless Internet access.

이동용 HTTP 클라이언트(1)는 웹 서버(2)에 직접적으로 웹 문서를 요청하지 않고 필요로 하는 웹 문서를 프록시 서버(3)에 요청하게 되며, 프록시 서버(3)는 요청 받은 웹 페이지를 웹 서버(2)에서 읽어 들이게 된다. 읽어 들인 웹 문서는 프록시 서버(3)에서 내부적으로 작동되고 있는 웹 페이지 변환 장치(30)를 거쳐 HTTP 클라이언트의 사양에 맞도록 적절히 변환된다.The mobile HTTP client 1 requests the proxy server 3 for the necessary web document without directly requesting the web document from the web server 2, and the proxy server 3 sends the requested web page to the web server. It is read in (2). The read web document is appropriately converted to meet the specifications of the HTTP client via the web page conversion device 30 that is operated internally by the proxy server 3.

프록시 서버(3)는 최종적으로 변환된 웹 페이지를 이동용 HTTP 클라이언트(1)에 전달하는 것이다. 도면 중 미설명 부호 4는 WAP 게이트웨이, 5는 WAP 클라이언트, 6은 언-디맨드(On-Demand) 서버이다.The proxy server 3 delivers the finally converted web page to the mobile HTTP client 1. In the figure, reference numeral 4 is a WAP gateway, 5 is a WAP client, and 6 is an on-demand server.

도 2는 본 발명에 따른 문법 구조 분석기를 이용한 웹 페이지 변환장치(30)의 구성도로서, HTML 분석기(31), 문법 구조 분석기(32), 중간 형태 전환기(33), 여과기(34), 재 저작 도구(35)로 이루어진다.2 is a block diagram of a web page converting apparatus 30 using the grammar structure analyzer according to the present invention. The HTML analyzer 31, the grammar structure analyzer 32, the intermediate form converter 33, the filter 34, and the re Authoring tool 35.

HTML 분석기(31)는 사용자의 웹 페이지 요구에 따라 웹 서버(2)로부터 HTML 문서를 입력으로 받아들여 해당 웹 문서의 전자 문서 서식을 분석하는 문서 분석 수단이다.The HTML analyzer 31 is a document analysis means for receiving an HTML document from the web server 2 as an input according to a user's web page request and analyzing the electronic document format of the web document.

문법 구조 분석기(32)는 특정 웹 페이지에서 어떤 부분이 반복되고 있는 구조인지, 그리고 반복되는 구조를 줄이게 된다면 어떤 부분을 하이퍼링크로 숨기고 어떤 부분을 채택하여 남겨둘 것인지를 결정한다.The grammar structure analyzer 32 determines which parts of a particular web page are repeated, and if the reduced structure is reduced, which parts are hidden by hyperlinks and which parts are left to be adopted.

중간 형태 전환기(33)는 해당 웹 문서를 변환 기법을 적용하기 위한 중간 형태의 표현법으로 전환하는 중간 형태 전환수단으로서, HTML 분석기(31)에 의한 문서 서식 분석 정보에 의거하여 해당 웹 문서를 전환시킨다.The intermediate form converting unit 33 is an intermediate form converting means for converting the web document into an intermediate form for applying a conversion technique, and converts the web document based on the document format analysis information by the HTML analyzer 31. .

도 3a는 본 발명에 따른 변환 기법에서 사용된 중간 형태의 표현인 트리 자료 구조도로서, HTML 문서는 그 소스를 분석하여 문서 변환 기법을 적용하기에 알맞도록 중간 형태의 표현법인 트리 자료 구조로 전환한 경우이다.3A is a tree data structure diagram which is an intermediate form of expression used in the conversion technique according to the present invention, and the HTML document is converted into a tree data structure which is an intermediate form of representation in order to apply the document conversion technique by analyzing its source. If it is.

여과기(34)는 웹 문서에서 일부 문서 내용을 제거하는 여과수단으로서, 중간 형태 전환기(33)를 통하여 중간 형태의 표현법으로 전환된 웹 문서에서 휴대용 정보 기기의 사양을 고려하여 일부 문서 내용을 걸러낸다. 일례로, 사용자의 휴대용 정보 기기가 자바 또는 이미지를 처리할 수 없거나 사용자에게 불필요한 광고 같은 정보가 문서에 포함되어 있다면 여과기(34)는 중간 형태의 표현에 나타나 있는 이미지와 자바 그리고, 광고를 없애게 된다.The filter 34 is a filtering means for removing some document content from the web document. The filter 34 filters out some document content in consideration of the specifications of the portable information device in the web document converted to the intermediate form of expression through the intermediate type changer 33. . For example, if a user's portable information device is unable to process Java or an image or contains information such as advertisements that are unnecessary to the user, the filter 34 may remove the image and Java and advertisements in the intermediate form. do.

재 저작 도구(35)는 여과기(34)를 통과한 웹 문서를 재 저작 기법을 거쳐 저작하여 이동용 HTTP 클라이언트(1)로 제공한다.The rewriting tool 35 authors the web document passed through the filter 34 through the rewriting technique and provides it to the mobile HTTP client 1.

도 3b는 본 발명에 따라 도 3a의 웹 문서를 반복 문법 구조를 이용한 변환기법으로 재저작한 경우로서, 중간 형태의 표현인 트리 자료 구조에서 여러개의 또 다른 트리를 만들어 내는 것이다.FIG. 3B is a case in which the web document of FIG. 3A is rewritten by a transform method using an iterative grammar structure, and a plurality of other trees are generated from a tree data structure that is an intermediate form.

도 4는 본 발명에 따른 반복 문법 구조를 이용한 웹 페이지 변환 방법을 설명하기 위한 플로우차트이며, 도 5 내지 도 7은 본 발명에 따른 무선 인터넷 환경에서의 웹 문서의 접근의 일례를 설명하기 위한 웹 문서의 예로서, 도 5는 데스크탑 PC 환경을 가정한 웹 문서이고, 웹 문서의 구조적인 측면만을 고려하여 변환한 웹 문서이며, 도 7은 본 발명에 따라 반복 문법 구조를 이용하여 변환한 웹 문서이다.4 is a flowchart illustrating a web page conversion method using a repetitive grammar structure according to the present invention, Figures 5 to 7 is a web for explaining an example of accessing a web document in a wireless Internet environment according to the present invention As an example of a document, FIG. 5 is a web document assuming a desktop PC environment, and is a web document converted only by considering a structural aspect of the web document. FIG. 7 is a web document converted using a repetitive grammar structure according to the present invention. to be.

이하에서는 도 4 내지 도 7을 참조하여 본 발명에 따른 웹 페이지 변환 과정을 설명하기로 한다.Hereinafter, a web page conversion process according to the present invention will be described with reference to FIGS. 4 to 7.

먼저, 휴대용 정보 기기 등의 이동용 HTTP 클라이언트(1)에 의하여 도 5와 같이 유선 인터넷 환경에 적합하게 제작된 웹 문서가 요구되면 프록시 서버(3)는 웹 서버(2)로부터 해당 웹 문서를 읽어 들인다.First, when a web document produced for a wired Internet environment is requested by a mobile HTTP client 1 such as a portable information device, the proxy server 3 reads the web document from the web server 2. .

만일 사용자가 접근하려는 홈페이지에 대해 반복 문법 구조를 이용한 웹 페이지 변환 방법을 적용하지 않다면, 도 5의 웹 문서는 도 6a 내지 도 6c와 같이 재저작 도구(35)에 의하여 3개의 웹 페이지로 재저작된다(S405∼S408).If the web page conversion method using the repetitive grammar structure is not applied to the home page to be accessed by the user, the web document of FIG. 5 is rewritten into three web pages by the rewriting tool 35 as shown in FIGS. 6A to 6C. (S405 to S408).

하지만, 사용자가 접근하려는 홈페이지에 대해 반복 문법 구조를 이용한 웹 페이지 변환 방법을 적용한다면 웹 페이지 변환 장치(30)는 웹 문서의 구조의 반복적인 측면에서 확실하게 드러난 상하 관계에 의해 상위 개념만을 남기고 나머지 하위 항목들을 하이퍼링크화하여 그 부분만큼을 축소시켜 도 7과 같이 웹 문서를 재저작하게 된다.However, if a user applies a web page conversion method using a repetitive grammatical structure to the homepage to be accessed, the web page conversion device 30 leaves only the high concept by the upper and lower relationships clearly revealed in the repetitive aspect of the structure of the web document. The subitems are hyperlinked to reduce the size of the sub-items, thereby rewriting the web document as shown in FIG.

다시 말해서, HTML 분석기(31)를 통하여 전자 문서 서식을 분석한 후 중간 형태 전환기(33)를 통하여 도 5의 문서를 변환 기법을 적용하기 알맞도록 중간 형태의 표현법으로 바꾸며(S405∼S406), 휴대 정보 기기 사양을 고려하여 여과기(34)에서 도 5의 문서 내용을 어느 정도 걸러내고(S407), 재저작 도구(35)를 통하는 과정에서 반복 문법 구조를 이용한 웹 페이지 변환방법을 함께 사용하여 최종적으로 재 저작 기법을 거쳐 변환된 웹 문서를 만들어 내는 것이다(S408).In other words, after analyzing the electronic document format through the HTML analyzer 31, the intermediate format converter 33 converts the document of FIG. 5 into an intermediate format representation suitable for applying the conversion technique (S405 to S406). In consideration of the information equipment specifications, the filter 34 filters the document contents of FIG. 5 to some extent (S407), and finally, by using a web page conversion method using a repetitive grammar structure in the process through the rewriting tool 35. The web document converted through the rewriting technique is produced (S408).

도 7의 경우에는 도 5의 웹 문서에서 문서가 변환될 때에 좀더 의미있는 내용, 상위 카테고리에 해당하는 내용이 채택되고 그에 따른 하위 항목이 하이퍼링크로 달리는 것을 알 수 있다.In the case of FIG. 7, when the document is converted in the web document of FIG. 5, more meaningful content and content corresponding to a higher category are adopted, and the lower item runs as a hyperlink.

본 발명의 아이디어는 복잡한 웹 페이지에서 페이지의 통일성을 지키기 위해 반복되는 구조를 사용한다는 점과 반복되는 구조에서 가장 앞부분들이 뒤에 따라오는 세부 항목들을 포함한다는 것에 착안하였다. 이는 구조의 가장 앞부분이 정확하게 일치한다는 사실에 근거를 두고 있으며, 실제 구조의 앞부분을 제외한 부분에서는 하위 항목 개수 차이 등 약간의 변형이 일어난다. 그리하여 반복되는 구조를 추출하여 그 중 앞부분만을 잘라서 그 부분을 접근하였을 때 하위 항목이 나타날 수 있게 하는 기술을 발명하게 되었다. 이렇게 세부 항목을 포괄하는 주요 항목을 뽑아낸다는 것은 누구나 공감할 수 있어 특정 사용자에 제한되지 않는다는 장점도 지니고 있다. 또한 크고 복잡한 페이지일수록 반복되는 구조가 많아 페이지 사이즈 축소에 효과적이며, 원래 페이지가 가지고 있던 문맥을 훼손하거나 함부로 잘라버리는 등 종래의 기술을 적용하여 변환된 것보다 페이지 접근에 용이하다.The idea of the present invention is to use a repeating structure to ensure the unity of a page in a complex web page, and to include details followed by the very beginning of the repeating structure. This is based on the fact that the first part of the structure is an exact match, and there are some variations in parts other than the beginning of the structure, such as differences in the number of subitems. Thus, the inventors have invented a technique that extracts a repeating structure, cuts only the front part of the structure, and allows sub-items to appear when the part is approached. Extracting the main items that cover these detailed items also has the advantage that everyone can relate to them and not limit them to specific users. In addition, larger and more complex pages have more repeatable structures, which are effective for reducing page size, and are easier to access pages than those converted by applying conventional techniques such as damaging or arbitrarily cutting off the context of the original page.

발명에 있어서의 구체적인 알고리즘은 다음과 같다. HTML로 만들어진 웹 페이지는 HTML 태그와 실제 웹 페이지의 내용을 나타내는 문자들로 이루어져 있다.따라서, 웹 페이지를 HTML 태그와 문자들을 원소로 가지는 하나의 문자열로 사상 변환하였을 때, 웹 페이지에서 반복되는 구조를 찾아내는 것은 다음과 같은 보다 일반적인 문제로 환원될 수 있다. 주어진 문자열에서, 가능한 모든 반복되는 하위문자열의 내용 및 길이, 반복 횟수 등을 찾아 그 중 실제 페이지에서 적합한 구조라고 인식되는 것을 반복되는 구조로 채택하는 것이다. 이 문제를 트리를 이용한 알고리즘으로 해결할 수 있고, 이 트리를 문자열 트리라 명명한다.The specific algorithm in this invention is as follows. A web page created with HTML is composed of HTML tags and characters that represent the content of the actual web page. Thus, when a web page is mapped into a single string containing HTML tags and characters as elements, the structure is repeated on the web page. Finding can be reduced to more general problems such as: In a given string, it finds the contents and length of all possible repeated substrings, the number of repetitions, etc., and adopts the repetitive structure, which is recognized as a suitable structure in the actual page. This problem can be solved by a tree-based algorithm, which is called a string tree.

문자열 트리는 edge에 사상 변환된 문자열의 원소를 저장하고, 각 노드에는 루트로부터 그 노드까지의 경로를 따라오면서 순차적으로 읽어낼 수 있는 edge에 담긴 원소들을 가지는 하위문자열의 반복 횟수가 담기게 된다.The string tree stores the elements of the mapped string at the edge, and each node contains the number of iterations of the substring with elements contained in the edge that can be read sequentially while following the path from the root to the node.

루트는 비어 있으며, 바로 그 아래 depth부터 태그를 나타내는 트리가 시작된다. 즉, 실제로 어떤 태그이든지 간에 새로운 하위문자열을 시작할 수 있다는 뜻이 된다. 그렇게 하위문자열이 시작하고, 그 다음 태그는 그 태그를 뜻하는 edge에 연결되어 새로운 노드를 추가하게 된다. 이러한 자료 구조를 가지고서, 태그 n 개의 길이의 문자열을 읽어 가며 하위문자열을 찾을 수 있는 최소의 크기인 태그 두 개부터 n-1 개의 태그 길이의 하위문자열까지를 순차적으로 모두 읽어가며 문자열 트리에 저장하게 된다. 각 노드는 비워 두는 것이 아니라, 위와 같은 순차적인 검색을 통해 얻은 하위문자열의 반복된 횟수, 달리 말하면 검출된 개수를 쓰게 된다. 즉, 각 노드를 보면 똑같은 하위문자열이 몇 개가 있는지를 알 수 있다. 이렇게 해서, 하나의 웹 페이지에서 가능한 모든 하위문자열들은 커다란 하나의 문자열 트리 안에 저장되는 것이다. 이것에 관련한 예는 도 8에 잘 나타나 있다.The root is empty and the tree representing the tag starts from the depth beneath it. This means that you can start a new substring of any tag. The substring starts, and the next tag is connected to the edge that represents the tag, adding a new node. With this data structure, it reads a string of length n tags and sequentially reads two tags, the smallest size to find substrings, and a substring of length n-1 tags, and stores them in a string tree. do. Rather than leaving each node empty, the repeated number of substrings obtained through the sequential search described above is written, in other words, the detected number. In other words, each node shows how many identical substrings are present. In this way, all possible substrings in a single web page are stored in a single string tree. An example related to this is shown well in FIG. 8.

발명의 하나의 예로서 설명되고 있는 시스템의 작동 방식은 다음과 같다. 반복되는 문법 구조를 사용해 웹 문서를 변환하는 시스템에서는 HTML 문서를 입력받아 자체적인 HTML 분석 과정을 거쳐 중간 형태의 전환을 거친 후, 반복되는 문법 구조를 위와 같은 알고리즘을 통해서 찾아낸다. 거기에서 적합하다고 판단되는 구조 형식을 선별하여, 그 형식을 갖는 구조들의 첫 번째 문장을 그 구조를 대표할 수 있는 제목으로 뽑아내어 거기에 하이퍼링크 처리를 하여 세부 항목은 하이퍼링크를 클릭했을 때 알 수 있도록 한다. 이렇게 원래 웹 문서가 지니고 있었던 내용에 손상이 가지 않는 범위에서 첫 화면에서 핵심적인 내용 이외의 부분을 줄일 수 있다.The manner of operation of the system described as one example of the invention is as follows. In a system that converts web documents using repeated grammatical structures, HTML documents are input and processed through their own HTML analysis, then converted to intermediate forms, and the repeated grammatical structures are found through the above algorithm. From there, it selects the structure type that it deems appropriate, extracts the first sentence of the structure having the form as a title that can represent the structure, and hyperlinks it so that the detail item is known when the hyperlink is clicked. To help. In this way, you can reduce the non-essential parts of the first screen as long as the contents of the original web document are not damaged.

전술한 바와 같은 본 발명은 유선 인터넷 환경의 웹 문서를 무선 인터넷 환경에 적합하도록 변환함에 있어서 웹 문서의 의미적인 측면을 손상하지 않는 범위를 고려하여 종래의 변환 기술들보다 좀 더 사용자의 요구에 적합한 웹 문서를 제공할 수 있으며, 본 발명으로 인하여 현재 상당히 제한된 접근만이 가능한 기존의 유선 인터넷용 웹 문서들에 대한 접근이 예전보다 훨씬 원활해져 무선 인터넷에서 접근 가능한 웹 페이지의 숫자를 유선 인터넷 수준으로 끌어올릴 수 있는 효과가 있다.As described above, the present invention is more suited to the needs of users than conventional conversion technologies in consideration of a range that does not impair the semantic aspects of the web document in converting the web document of the wired Internet environment to be suitable for the wireless Internet environment. The present invention can provide web documents, and the present invention makes access to existing web documents for wired Internet, which is currently only limited access, much smoother than before, bringing the number of web pages accessible from the wireless internet to the wired internet level. There is an effect that can be raised.

Claims (4)

유선 인터넷 환경에 적합하게 저작된 웹 문서들을 무선 인터넷 환경에 적합하도록 재 저작하는 웹 페이지 변환 장치에 있어서,A web page converting apparatus for rewriting web documents authored for a wired internet environment to suit a wireless internet environment, 반복되는 문법 구조를 사용하여 요청된 웹 문서에서 일부 문서 내용을 숨기고 그 크기를 줄여 재저작하는 것을 특징으로 한 반복되는 문법 구조를 이용한 웹 페이지 변환 장치.An apparatus for converting a web page using a repetitive grammar structure, which uses a repetitive grammar structure to hide some document contents from a requested web document, and to reduce the size of the document. 제 1 항에 있어서, 상기 웹 페이지 변환 장치는The apparatus of claim 1, wherein the web page converting apparatus 사용자의 웹 페이지 요구에 따라 해당 웹 문서의 전자 문서 서식을 분석하는 문서 분석수단과,Document analysis means for analyzing the electronic document format of the web document according to the user's web page needs; 상기 웹 페이지의 구성 요소 중 반복되는 문법 구조를 찾아내는 수단, 즉 문자열 트리 구조를 이용한 알고리즘 및 찾아낸 구조 중 중요한 부분을 채택하는 방식과,Means for finding a repeating grammatical structure among the components of the web page, that is, an algorithm using a string tree structure and a method of adopting an important part of the found structure; 상기 문서 서식 분석 정보에 의거하여 상기 해당 웹 문서를 변환 기법을 적용하기 위한 중간 형태의 표현법으로 전환하는 중간 형태 전환수단과,An intermediate form converting means for converting the web document into an intermediate form of expression for applying a conversion technique based on the document format analysis information; 상기 일부 문서 내용이 제거된 해당 웹 문서를 재저작 기법을 거쳐 반복되는 문법 구조를 이용하여 재저작하는 재저작 도구를 포함하는 반복되는 문법 구조를 이용한 웹 페이지 변환 장치.And a rewriting tool for rewriting the corresponding web document from which the partial document contents have been removed using a rewriting technique. 유선 인터넷 환경에 적합하게 저작된 웹 문서들을 무선 인터넷 환경에 적합하도록 재저작하는 웹 페이지 변환 방법에 있어서,In the web page conversion method for rewriting web documents authored for the wired Internet environment suitable for the wireless Internet environment, 반복되는 문법 구조에 따라 해당 웹 문서에서 일부 문서 내용은 편집하고 문서의 크기를 줄여 재저작하는 것을 특징으로 한 반복되는 문법 구조를 이용한 웹 페이지 변환 방법.A method of converting a web page using a repetitive grammar structure, characterized in that some document contents are edited in the web document according to the repetitive grammar structure, and the document size is reduced and rewritten. 제 1 항에 있어서, 상기 웹 페이지 변환 방법은The method of claim 1, wherein the web page conversion method 유선 인터넷 환경에 적합하게 저작된 웹 문서를 상기 웹 페이지 요구에 따라 분석하여 변환 기법을 적용하기 위한 중간 형태의 표현법으로 전환하는 단계와,Converting a web document authored for a wired Internet environment into an intermediate form for applying a conversion technique by analyzing the web document according to the web page requirements; 상기 반복되는 문법 구조 분석 수단을 이용하여 상기 중간 형태의 해당 웹 문서에서 일부 문서 내용을 편집하는 단계와,Editing a part of document content in the corresponding web document of the intermediate form using the repeated grammar structure analyzing means; 상기 일부 문서 내용이 편집된 해당 웹 문서를 반복되는 문법 구조 분석기를 이용한 재저작 기법을 거쳐 무선 인터넷 환경에 적합하게 재저작하는 단계를 포함하는 반복되는 문법 구조를 이용한 웹 페이지 변환 방법.The web page conversion method using a repetitive grammar structure comprising the step of re-writing the appropriate web document, the content of the partial document is edited appropriately for a wireless Internet environment through a rewriting technique using a repeated grammar structure analyzer.
KR1020010087639A 2001-12-28 2001-12-28 Web-page converter and method for mobile web clients considering repeated grammatical pattern KR20030057241A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020010087639A KR20030057241A (en) 2001-12-28 2001-12-28 Web-page converter and method for mobile web clients considering repeated grammatical pattern

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010087639A KR20030057241A (en) 2001-12-28 2001-12-28 Web-page converter and method for mobile web clients considering repeated grammatical pattern

Publications (1)

Publication Number Publication Date
KR20030057241A true KR20030057241A (en) 2003-07-04

Family

ID=32215354

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010087639A KR20030057241A (en) 2001-12-28 2001-12-28 Web-page converter and method for mobile web clients considering repeated grammatical pattern

Country Status (1)

Country Link
KR (1) KR20030057241A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100904366B1 (en) * 2007-10-29 2009-06-22 에스케이 텔레콤주식회사 System and method for realizing mobile page, and server applied to the same

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000024577A (en) * 2000-02-21 2000-05-06 김상복 Unified Editor for wireless internet documents
GB2344197A (en) * 1998-08-05 2000-05-31 Spyglass Inc Content conversion of electronic documents
KR20000030905A (en) * 2000-03-29 2000-06-05 문병환 An offering method of exchanged web sites
WO2000039666A1 (en) * 1998-12-28 2000-07-06 Spyglass, Inc. Converting content of markup data for wireless devices
KR20000072026A (en) * 2000-07-07 2000-12-05 서노아 The method of constituting phone page which can be interfaced to mobile phone of other company
KR20010069606A (en) * 2001-04-20 2001-07-25 유도욱 Method for converting Html text to language used in wireless internet and the system
KR20020006403A (en) * 2000-07-12 2002-01-19 구자관 The method of dowment conversion maked use of handphone at that time real-time connection of internet
KR20020006722A (en) * 2000-07-13 2002-01-26 권혁 Method of reformatting webpage and method of providing webpage using the same
KR20020023545A (en) * 2000-09-22 2002-03-29 정창우 Web-page converter and method for mobile web clients considering user access pattern
KR20020079133A (en) * 2001-04-13 2002-10-19 (주)오픈베이스 Web content transcoding device

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2344197A (en) * 1998-08-05 2000-05-31 Spyglass Inc Content conversion of electronic documents
WO2000039666A1 (en) * 1998-12-28 2000-07-06 Spyglass, Inc. Converting content of markup data for wireless devices
KR20000024577A (en) * 2000-02-21 2000-05-06 김상복 Unified Editor for wireless internet documents
KR20000030905A (en) * 2000-03-29 2000-06-05 문병환 An offering method of exchanged web sites
KR20000072026A (en) * 2000-07-07 2000-12-05 서노아 The method of constituting phone page which can be interfaced to mobile phone of other company
KR20020006403A (en) * 2000-07-12 2002-01-19 구자관 The method of dowment conversion maked use of handphone at that time real-time connection of internet
KR20020006722A (en) * 2000-07-13 2002-01-26 권혁 Method of reformatting webpage and method of providing webpage using the same
KR20020023545A (en) * 2000-09-22 2002-03-29 정창우 Web-page converter and method for mobile web clients considering user access pattern
KR20020079133A (en) * 2001-04-13 2002-10-19 (주)오픈베이스 Web content transcoding device
KR20010069606A (en) * 2001-04-20 2001-07-25 유도욱 Method for converting Html text to language used in wireless internet and the system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100904366B1 (en) * 2007-10-29 2009-06-22 에스케이 텔레콤주식회사 System and method for realizing mobile page, and server applied to the same

Similar Documents

Publication Publication Date Title
KR100461019B1 (en) web contents transcoding system and method for small display devices
US7496497B2 (en) Method and system for selecting web site home page by extracting site language cookie stored in an access device to identify directional information item
Gundavaram CGI programming on the World Wide Web
US6671853B1 (en) Method and system for selectively streaming markup language documents
US5826031A (en) Method and system for prioritized downloading of embedded web objects
KR100265548B1 (en) Automatic translating method and machine
US20020016801A1 (en) Adaptive profile-based mobile document integration
US20140052778A1 (en) Method and apparatus for mapping a site on a wide area network
JP2000090001A (en) Method and system for conversion of electronic data using conversion setting
JP2003016001A (en) Method for converting contents and method for obtaining converted contents
SE524391C2 (en) Method and system for content conversion of electronic documents for wireless clients.
KR20020031691A (en) Method and system for real-time transforming internet contents
CN110955855A (en) Information interception method, device and terminal
KR20010029147A (en) Internet service method for mobile phone
Kucuk et al. Application of metadata concepts to discovery of internet resources
KR20030088929A (en) System for converting contents for providing wireless contents and method thereof
US8806326B1 (en) User preference based content linking
Maglio et al. LiveInfo: Adapting web experience by customization and annotation
KR20020017966A (en) Method and apparatus in a data processing system for word based render browser for skimming or speed reading web pages
KR20030057241A (en) Web-page converter and method for mobile web clients considering repeated grammatical pattern
Gupta et al. Mobile web: web manipulation for small displays using multi-level hierarchy page segmentation
JP4087754B2 (en) Web use learning support method by web resource reorganization, web resource reconstruction device, and program
Agosti et al. Managing the interactions between handheld devices, mobile applications, and users
KR20020036447A (en) Web-page converter and method for mobile web clients using semantic database
KR20020023545A (en) Web-page converter and method for mobile web clients considering user access pattern

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application