KR100964792B1 - 모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법 - Google Patents

모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법 Download PDF

Info

Publication number
KR100964792B1
KR100964792B1 KR1020080017052A KR20080017052A KR100964792B1 KR 100964792 B1 KR100964792 B1 KR 100964792B1 KR 1020080017052 A KR1020080017052 A KR 1020080017052A KR 20080017052 A KR20080017052 A KR 20080017052A KR 100964792 B1 KR100964792 B1 KR 100964792B1
Authority
KR
South Korea
Prior art keywords
image
data
client device
web page
conversion
Prior art date
Application number
KR1020080017052A
Other languages
English (en)
Other versions
KR20090091854A (ko
Inventor
김원섭
김태용
Original Assignee
중앙대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 중앙대학교 산학협력단 filed Critical 중앙대학교 산학협력단
Priority to KR1020080017052A priority Critical patent/KR100964792B1/ko
Publication of KR20090091854A publication Critical patent/KR20090091854A/ko
Application granted granted Critical
Publication of KR100964792B1 publication Critical patent/KR100964792B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4007Interpolation-based scaling, e.g. bilinear interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities

Abstract

본 발명은 모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법에 관한 것으로, 본 발명에 따른 콘텐츠 적응 시스템은 클라이언트 디바이스에서 웹페이지 요청을 받으면 상기 클라이언트 디바이스의 종류를 판단하여 변환 전략을 생성하는 전처리부, 상기 전처리부에서 제공하는 문서 데이터의 변환과 웹페이지의 레이아웃을 변환하는 문서 데이터 변환부, 상기 전처리부에서 제공하는 이미지 데이터와 상기 문서 데이터에서 제공하는 변환된 문서 데이터를 최적화시키며 상기 이미지 데이터를 변환하는 이미지 데이터 변환부를 구비하여 이미지 변환 시 배치를 고려하여 흐트러짐이나 손상을 최저로 하고, 크기나 용량 면에서 모바일 환경에 적합하도록 변환할 수 있으므로 이미지를 많이 적재하고 있고, 표준을 지키고 있는 웹 문서에 대하여 무선 디바이스용으로 따로 제작할 필요가 없으므로, 재 저작 시에도 비용을 절감함은 물론 사용자와 공급자 모두 만족시킬 수 있는 원소스 멀티유스(One-Source Multi-Use) 환경을 실현할 수 있는 효과가 있다.

Description

모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법{System and method of content adaptation for mobile web conditions}
본 발명은 모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법에 관한 것으로, 더욱 상세하게는 무선 디바이스 사용자들이 인터넷을 원활히 사용할 수 있도록 하기 위하여 보다 최적화된 이미지 및 문서를 제공하도록 하는 모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법에 관한 것이다.
지난 수십 년 사이 웹 문서의 저작(composing)을 위하여 사용되는 하드웨어와 소프트웨어의 발전 그리고 웹 디자이너들의 창조적인 디자인과 이를 뒷받침하는 프로그래머들의 기술력, 그리고 웹 개발 언어들의 향상으로 인하여 웹의 표현 능력은 급속도로 향상되었다. 하지만 휴대용 무선 디바이스에서 웹페이지를 열람하기에는 여전히 어려운 문제점이 있다. 이에 따라 최근 몇 년 사이에 콘텐츠 적응(Content Adaptation)을 통하여 휴대용 무선 디바이스에서도 효과적인 웹페이지 열람이 가능하도록 하기 위한 연구가 진행되고 있다.
한편, 콘텐츠 적응이란 W3C(World Wide Web Consortium)에서 “주어진 전달 콘텍스트에서 요청된 동일한 자원 식별자에 반응하여, 하나 또는 그 이상의 지각할 수 있는 단위를 만드는 선택, 생성 또는 수정하는 프로세스(a process of selection, generation or modification that produces one or more perceivable units in response to a requested uniform resource identifier in a given delivery context)” 라고 정의하고 있다. 즉, 사용자의 환경이나, 사용자의 선호, 네트워크 환경 등의 정보를 고려하여, 입력된 하나하나의 콘텐츠를 여러 개의 문서에 대하여 알맞게 변환하는 것을 말한다.
종래의 콘텐츠 적응을 위한 연구로 "Lurn" 과 "Lau"는 클라이언트의 사용자 콘텍스트(context), 네트워크 환경의 네트워크 콘텍스트, 웹 콘텐츠 제공자의 콘텐츠 프로파일을 동시에 고려한 변환 엔진에 대하여 연구하였다. 이 연구에서는 서버가 미리 사용자의 선호를 파악하여 이를 평가를 통해 스코어 트리(score tree)로 형성한다.
그리고 콘텐츠 변환 요청이 들어오면 요청한 디바이스의 능력과 네트워크 환경 그리고 콘텐츠의 메타 데이터(meta data)를 고려하여 의사결정 로직을 만든다. 이 의사결정 로직을 기준으로 협상 알고리즘을 이용해 스코어 트리를 탐색한 뒤 도출해낸 사용자 선호를 고려하여 웹 콘텐츠의 포맷을 다시 바꾼다. 이 방식은 비록 구현 단계에서는 단순히 포맷을 바꿔주는 기능에 머물렀지만, 사용자 요청에 반응하여 콘텐츠를 알맞게 변화시키는 콘텐츠 적응의 정의에 가장 근접한 접근이라고 볼 수 있다.
다른 연구로 "Gupta 등"은 DOM(Document Object Model)를 기반으로 하여, HTML로 구성된 웹 소스에서 모바일 환경에 맞도록 추출하는 변환 방법을 제시하였다. HTML 문서를 DOM 계층 구조로 재구성하고 서비스를 요청한 디바이스의 처리능력을 고려하여, 서비스 관리자가 수동적으로 기능을 제한하여 변환한다. 이 연구의 결과물은 관리자의 재량에 따라 가장 최상의 결과를 도출해 낼 수 있다는 장점이 있지만, 반대로 관리자의 관리 없이는 변환시 정보의 손실이 많을 수 있고, 무선 디바이스 상에서 정보를 판독하기 힘든 웹 문서를 얻을 수 있다는 단점이 있다. 또한 텍스트 중심의 변환이기 때문에 사용자가 웹 문서 정체성을 파악하기 곤란할 수 있다는 문제가 있다.
이 밖에도 휴리스틱(heuristic)으로 웹 문서를 다시 저작하는 방식도 연구되었다. 우선 웹 문서를 트리 형태로 분석하여 반복되는 패턴을 그룹별로 나눈다. 이 후, 그룹 당 특성을 분석하여, 각 그룹을 보존, 생략, 제거하는데, 이 판단 과정을 ‘요약’이라고 표현하였다. 이러한 휴리스틱을 무작정 적용하면 그림이 생략되고 일부 중요 텍스트가 링크로 대체되면서 결국 웹 저자가 생각했던 웹 문서와는 다른 웹 문서를 서비스하게 된다. 또한 이러한 변환 역시 이미지를 감추어야 되는 존재로 여겼으며, 하이퍼링크로 오브젝트들을 연결시켜서 처음 웹 사이트로 접속하였을 경우 웹사이트의 정체성을 파악하기 어렵게 만들었다.
한편, 이때까지의 웹 콘텐츠는 모든 사용자들이 대화면 칼라 디스플레이, 마우스 및 키보드 같은 PC용 인터페이스를 구비하고 있을 것을 가정한 상태에서 웹 문서를 개발하고 있으며 이러한 개발 방식은 무선 디바이스로 웹 콘텐츠를 서비스 할 때 문제를 야기 시킨다. 또한 종래의 콘텐츠 적응 기술을 사용하는 경우에도 웹 문서가 대용량일 경우 무선 디바이스의 저장 공간의 한계로 내용을 받아들이지 못할 때가 있으며 콘텐츠의 내용이 많을 경우 사용자는 수차례 스크롤해야 원하는 정보를 열람할 수 있는 문제점이 있다. 더욱이 이미지가 포맷에 맞지 않아 아예 열람이 불가능한 경우도 발행하여 대부분이 이미지로 이루어진 문서의 경우 정보 전달이 불가능한 문제가 발생한다.
본 발명에서는 웹 문서를 무선 디바이스에 알맞게 효율적으로 변환하도록 하는 모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법과 이를 위한 이미지 추출방법과 이미지 구분방법을 제공한다.
콘텐츠 적응 시스템은 클라이언트 디바이스에서 웹페이지 요청을 받으면 상기 클라이언트 디바이스의 종류를 판단하여 변환 전략을 생성하는 전처리부, 상기 전처리부에서 제공하는 문서 데이터의 변환과 웹페이지의 레이아웃을 변환하는 문서 데이터 변환부, 상기 전처리부에서 제공하는 이미지 데이터와 상기 문서 데이터에서 제공하는 변환된 문서 데이터를 최적화시키며 상기 이미지 데이터를 변환하는 이미지 데이터 변환부를 구비한다.
상기 전처리부는 상기 클라이언트 디바이스에서 전송하는 서비스 요청 신호의 패킷 헤더(packet header)를 분석하여, 상기 클라이언트 디바이스의 브라우저의 정보와 상기 클라이언트 디바이스의 종류를 판단할 수 있다.
상기 문서 데이터 변환부는 상기 문서 데이터에 대한 인코딩 변환과, 필요 텍스트 추가와, 이미지 경로 변경과, 웹페이지의 레이아웃 변환과, 문법 검사와 수정을 수행할 수 있다.
상기 이미지 데이터 변환부는 상기 이미지 데이터를 상기 이미지 데이터의 히스토그램을 이용하여 인위적인 이미지와 자연적인 이미지로 구분하여 변환할 수 있다.
콘텐츠 적응 방법은 클라이언트 디바이스에서 웹페이지 요청을 받으면 상기 클라이언트 디바이스의 종류를 판단하여 변환 전략의 생성과 상기 웹페이지의 이미지 데이터와 문서 데이터를 구분하고, 상기 변환 전략에 따라 상기 문서 데이터의 변환과 웹페이지의 레이아웃을 변환하고, 상기 이미지 데이터와 상기 문서 데이터에서 제공하는 변환된 문서 데이터가 최적화되도록 상기 이미지 데이터를 변환한다.
상기 클라이언트 디바이스의 판단은 상기 클라이언트 디바이스에서 전송하는 서비스 요청 신호의 패킷 헤더(packet header)를 분석하여, 상기 클라이언트 디바이스의 브라우저의 정보와 상기 클라이언트 디바이스의 종류를 판단할 수 있다.
상기 문서 데이터 변환은 상기 문서 데이터에 대한 인코딩 변환과, 필요 텍스트 추가와, 이미지 경로 변경과, 웹페이지의 레이아웃 변환과, 문법 검사와 수 정을 수행할 수 있다.
상기 이미지 데이터 변환은 상기 이미지 데이터를 상기 이미지 데이터의 히스토그램을 이용하여 인위적인 이미지와 자연적인 이미지로 구분하여 변환할 수 있다.
상기 레이아웃 변환은 웹 문서의 최외곽 테이블에서 셀이 수직적으로 연속적이면, 상기 테이블의 상기 셀 중 첫 번째 테이블 로우의 첫 번째 테이블 데이터(first table row, first table data)와 두 번째 테이블 로우의 첫 번째 테이블 데이터(second table row, first table data)를 비교하고, 상기 첫 번째 테이블 로우의 첫 번째 테이블 데이터와 상기 두 번째 테이블 로우의 첫 번째 테이블 데이터의 가로 길이가 동일하면, 상기 두 번째 테이블 로우의 첫 번째 테이블 데이터를 상기 첫 번째 테이블 로우의 첫 번째 테이블 데이터의 다음에 수직적으로 위치시킬 수 있다.
상기 셀은 합쳐진 다른 셀을 포함하지 않을 수 있다. 상기 웹문서 코드의 분석으로 모든 테이블이 이미지로 구성되어 있으며, 상기 테이블의 사이즈를 비례에 맞게 변경시키고, 상기 테이블의 셀 크기에 맞게 이미지 사이즈를 변경시킬 수 있다.
콘텐츠 적응을 위한 이미지 구분 방법은 웹 문서의 이미지를 인위적인 이미지와 자연적인 이미지를 구분하기 위하여 상기 웹 문서의 이미지의 히스토그램을 획득하고, 상기 히스토그램의 총수와 매그니튜드가 "0"이 아닌 히스토그램의 총수를 비교한 비교값을 획득하고, 상기 비교값이 미리 설정한 기준값보다 크면 자연적 인 이미지(natural image)로 판단하고, 상기 비교값이 상기 기준값보다 작거나 같으면 인위적인 이미지(artificial image)로 판단한다.
상기 이미지가 컬러 이미지이고, 상기 히스토그램은 상기 이미지의 삼원색에 대한 히스토그램으로 판단할 수 있다.
상기 기준값은 복수개의 테스트 이미지에서 상기 테스트 이미지의 히스토그램의 총수와, 매그니튜드가 "0"이 아닌 히스토그램의 총수를 비교하여 결정한 값일 수 있다.
상기 이미지가 인위적인 이미지이면 상기 이미지의 배경과 이미지로 된 웹 문서의 원본 이미지에서 상기 이미지의 에지를 검출하여 상기 이미지의 경계 영역을 추출하고, 상기 이미지에서 임계값 이상의 영역만을 추출하여 배경 영역과 이미지 영역을 구분하는 경계 정보 영역을 추출하고, 상기 배경 영역을 제거한 후 상기 이미지 영역만을 추출할 수 있다.
상기 임계값은 상기 이미지의 에지들에 대한 히스토그램을 도출하여 얻은 것일 수 있다. 상기 경계 정보 영역은 상기 이미지 영역의 복수개의 모서리 점에 대한 위치 정보일수 있다. 추출된 상기 이미지 영역의 크기는 보간법을 이용하여 축소할 수 있다.
콘텐츠 적응을 위한 이미지 추출 방법은 배경과 이미지로 된 웹 문서의 원본 이미지에서 상기 이미지의 에지를 검출하여 상기 이미지의 경계 영역을 추출하고, 상기 이미지에서 임계값 이상의 영역만을 추출하여 배경 영역과 이미지 영역을 구분하는 경계 정보 영역을 추출하고, 상기 배경 영역을 제거한 후 상기 이미지 영역 만을 추출한다.
상기 임계값은 상기 이미지의 에지들에 대한 히스토그램을 도출하여 얻은 것일 수 있다.
상기 경계 정보 영역은 상기 이미지 영역의 모서리 점에 대한 위치 정보일 수 있다. 추출된 상기 이미지 영역의 크기는 보간법을 이용하여 축소할 수 있다.
본 발명에 따른 모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법은 이미지 변환 시 배치를 고려하여 흐트러짐이나 손상을 최저로 하고, 크기나 용량 면에서 모바일 환경에 적합하도록 변환할 수 있으므로 이미지를 많이 적재하고 있고, 표준을 지키고 있는 웹 문서에 대하여 무선 디바이스용으로 따로 제작할 필요가 없으므로, 재 저작 시에도 비용을 절감함은 물론 사용자와 공급자 모두 만족시킬 수 있는 원소스 멀티유스(One-Source Multi-Use) 환경을 실현할 수 있는 효과가 있다.
도 1은 본 실시예에 따른 모바일 웹 환경을 설명하기 위한 도면이고, 도 2는 본 실시예에 따른 모바일 웹 환경을 위한 콘텐츠 적응 시스템을 도시한 도면이다.
도 1과 도 2에 도시된 바와 같이 본 실시예에 따른 모바일 웹 환경은 트렌스코더(transcoder, 110)와 캐시(cache, 120)를 구비하는 프록시 서버(100), 프록시 서버(100)와 무선 연결되며 HTTP 통신규약을 따르는 클라이언트 디바이스(200)와 프록시 서버(100)와 연결되어 웹 콘텐츠를 제공하는 오리지널 웹 서버(300)를 포함한다. 클라이언트 디바이스(200)는 각종 모바일 디바이스(201) 및 개인용 컴퓨터(202)를 모두 포함할 수 있다.
도 2에 도시된 바와 같이 콘텐츠 적응 시스템은 프록시 서버(100)의 트렌스코더(110)는 클라이언트 디바이스(200)를 판단하여 변환 전략을 생성하는 전처리부(111), 문자열로 된 정보를 처리하는 문서 데이터 변환부(7112), 그리고 여러 포맷으로 구성된 웹페이지의 이미지 정보를 처리하고, 또한 이미지 데이터를 변환하는 이미지 데이터 변환부(113)를 구비한다.
도 3은 본 실시예에 따른 모바일 웹 환경을 위한 콘텐츠 적응 시스템의 동작 프로세스에서 전처리부의 동작 상태를 설명하기 위한 도면이다.
도 3에 도시된 바와 같이 전처리부(111)는 디바이스 판단부(111a), 변환 전략 생성부(111b), 데이터 요청 및 수령부(111c)를 구비한다.
먼저 디바이스 판단부(111a)는 클라이언트 디바이스(200)로부터 콘텐츠 서비스 요청을 받았을 때 서비스를 요청한 클라이언트 디바이스(200)의 종류를 판단하기 위한 것이다. 이 디바이스 판단부(111a)는 클라이언트 디바이스(200)의 디스플레이 크기나 힙 메모리(heap memory) 등과 같은 각종 디바이스에 대한 다수의 정보를 사전에 저장하고 있다. 따라서 디바이스 판단부(111a)는 서비스 요청한 신호의 패킷 헤더(packet header)를 분석하여, 브라우저의 정보와 디바이스의 종류를 파악한다.
그리고 변환 전략 생성부(111b)는 디바이스 판단부(111a)로부터 클라이언트 디바이스(200)의 정보를 얻어오면 이 정보를 분석하여 가장 정보 손실을 줄이고, 동시에 해당 클라이언트 디바이스(200)가 표현할 수 있으며, 또한 클라이언트 디바이스(200)의 디스플레이에 알맞은 데이터를 생성하기 위한 전략을 생성한다. 이 변환 전략의 구체적인 내용은 특정 태그의 포함 및 삭제 여부와 버퍼 크기를 고려한 용량적인 측면에서의 페이지 분할 및 기타 필요한 처리가 이루어지도록 하는 것이다.
그리고 데이터 요청 및 수령부(111c)는 변환이 필요한 데이터(HTML 문서 페이지와 이미지 데이터)들을 원래 파일이 보관된 오리지널 웹 서버(300)에 호출하고, 호출한 데이터가 오리지널 웹 서버(300)에 존재할 경우, 해당 데이터를 오리지널 웹 서버(300)로부터 전송받는다. 만약 해당 데이터가 없을 경우 에러 메시지를 출력한다.
그리고 클라이언트 디바이스(200)가 개인용 컴퓨터 디바이스와 같이 데이터 변환 없이 표현 가능한 디바이스인 경우 데이터에 대한 추가적인 변환작업 없이 해당 데이터를 서비스한다. 반면에 클라이언트 디바이스(200)가 모바일 디바이스와 같이 데이터의 표시에 제한이 있는 경우에는 콘텐츠 적응을 위한 변환을 진행한다. 변환의 대상이 문서 데이터인 경우에는 문서 데이터 변환부(112)에서 변환을 수행하고, 이미지 데이터인 경우에는 이미지 데이터 변환부(113)에서 변환을 수행한다.
도 4는 문서 데이터 변환 프로세스와 이미지 데이터 변환 프로세스를 설명하기 위한 도면이다.
도 4에 도시된 바와 같이 문서 데이터 변환부(112)는 인코딩 변환(S10), 필 요 텍스트 추가(S11), 이미지 경로 변경(S12), 문서 최적화(S13), 문법 검사 및 수정(S14) 기능을 수행한다.
먼저 인코딩 변환(S10)은 HTML 문서 데이터에 대한 인코딩 변환을 수행하는 것으로 현재의 네트워크 환경에 적합하도록 인코딩을 변환시키는 과정이다. 웹 문서의 인코딩에는 UTF-7, UTF-8, UNICODE 등의 다양한 인코딩을 사용한다. 하지만 대한민국에서와 같이 모바일 디바이스에서 완성형 ANSI 인코딩(KS_C_5601-1987)만을 지원하는 경우 등 특정사례에 대응하여야 하며, 웹페이지에 텍스트 정보와 문자열 소스를 제대로 변환 전달하려면 인코딩의 최적화된 변환이 필요하다. 따라서 문서 데이터 변환부(111)는 다양한 인코딩 변환 코드를 보유하여 필요시마다 따로 처리한다.
필요 텍스트 추가(S11)는 클라이언트 디바이스(200) 판단 과정에서 생성된 정보를 바탕으로 분할된 문서마다 필요한 텍스트를 추가하는 기능이다. 현재 모바일 디바이스(201)의 웹브라우저 규격은 이동통신사들의 판단에 따라 각자의 규격을 개발자 사이트에 정의해 두었다. 이 규격은 문서 첫 단에 특정 문구를 삽입하도록 하는 등 천차만별이다. 따라서 이동통신사의 이와 같은 요구를 맞추어 변형하여야만 제대로 클라이언트 디바이스(201)에게 서비스가 가능하다. 이 필요 텍스트 추가(S11)과정을 통해 이동통신사에 맞게 서비스할 수 있는 환경이 갖추어지게 된다.
이미지 경로 변경(S12)은 웹페이지에서 표시 가능한 이미지 컴포넌트(image component)들이 모두 캐시(120)에 저장되어 있기 때문에 문서상의 이미지 경로를 캐시(120) 상에 저장된 이미지의 경로로 변경하는 기능을 한다.
문서 최적화(S13)는 HTML 문서를 트리구조로 변환하여 노드와의 관계를 판단하는 단계이다. HTML 문서들은 문법적인 하자가 없을 경우 돔트리(DOM(Document Object Model) tree) 같은 계층적인 트리 구조를 가지고 있다. 하지만 대부분의 PC용 브라우저는 문법에 융통성을 가지고 있고, 웹 저자가 문법을 어긋나게 페이지를 저작하여도 문서가 올바르게 보이는 경우를 볼 수 있다. 그러나 이 경우 트리구조로 파싱(parsing)이 불가능하기 때문에 문법적인 하자를 고치는 과정을 먼저 한 뒤 트리구조로 변환한다. 최종적으로 이 과정에서는 웹 문서를 구조적 태그와 컴포넌트로 구성된 트리 정보를 생성한다.
한편, 일반적인 PC 웹브라우저를 대상으로 한 웹 문서의 테이블을 보면, 모바일 디바이스의 디스플레이에 비교하여 가로 크기나 세로 크기가 지나치게 비대하다. 또한 텍스트나 이미지의 비중이 높아 웹 문서에서 정보를 얻기 위해 수없이 스크롤링을 해야 되는 경우가 발생한다. 또한 레이아웃을 맞추기 위하여 남겨둔 빈공간이 모바일 디스플레이에서는 불편함을 유발한다.
이러한 문제를 해결하기 위해 본 실시예의 문서 최적화(S13) 과정에서는 웹페이지를 구조적으로 분석하여 레이아웃 측면에서 수직 중심 레이아웃 변환과 분할 이미지 레이아웃 변환을 적용하여 텍스트와 문서 구조를 변경한다. 본 실시예에서의 레이아웃 변환 방법은 게슈탈트(Gestalt) 심리학자들이 주장한 그룹핑(grouping) 법칙에 근거를 두었으며 이를 통해 웹페이지의 정체성 손상을 최소화하면서, 페이지의 정보를 효과적으로 유저에게 전달할 수 있고, 나아가 원활한 레이아웃을 구현하여 사용자 편의성을 증대시킬 수 있도록 한다.
먼저, 변환된 데이터를 최종적으로 모바일 디바이스(201) 상에서 읽을 수 있는 포맷으로 변환하여 저장한다. 본 실시예에서는 웹 페이지의 테이블 전체가 이미지로 구성되어 있느냐의 여부에 따라 다르게 실시된다. 만약 웹 페이지의 테이블이 이미지 외에 텍스트가 함께 포함하고 있다면 수직 중심 레이아웃(Vertical first layout)으로 변환하고, 테이블 전체가 이미지로 구성되어 있다면 분할 이미지 레이아웃(Partition image layout)으로 변환을 수행한다.
먼저 수직 중심 레이아웃 변환에 대하여 설명한다. 도 5는 수직 중심 레이아웃 변환 예를 도시한 도면이다. 도 5에 도시된 예에서와 같이 일부 웹 문서들은 전체 페이지를 테이블로 구성하고, 문서상단과 좌측에 사용자 인터페이스를 구성하는 경우가 있다.
도 5의 "(a)와 (b)"에서 상단에 있는 인터페이스가 있는 "②"셀은 큰 카테고리를 이용하기 위해 링크 되어있고, 좌측에 있는 인터페이스가 있는 "③"셀은 현재 이용하고 있는 카테고리 안에서 더 세부적인 카테고리로 이동할 때 이용한다. 만약 이 페이지를 일반적인 변환 방식으로 변환하면 도 5의 "(c)"에서와 같이 가로 순으로 변환되기 때문에 이미지의 연속성이 떨어지고, 세부 카테고리를 이용하려는 사용자들이 스크롤하여 해당 메뉴로 이동해야 하기 때문에 비효율적이다. 또한 무선 디바이스(201)의 화면이 가로보다는 세로로 더 긴 만큼 세로의 연속성을 확보하는 것이 레이아웃 측면에서 합리적이다.
본 실시예에서와 같은 수직 중심 레이아웃 변환 방법은 페이지를 구성하는 테이블 중에서 가장 최외각에 존재하는 테이블에만 적용한다. 이유는 웹 페이지에 포함되어 있는 다른 테이블을 변형시킬 경우 오히려 문서 레이아웃이 더 훼손되는 경우를 발생할 수 있기 때문이다. 또한 "div 태그"로 나누어진 레이아웃은 고려하지 않는다. 따라서 페이지를 분석하면서 최외각 테이블의 구조상 셀의 구조가 수직적으로 연속적이라면 가장 첫 번째 테이블 로우(tr)의 첫 번째 테이블 데이터(td)로 이루어진 셀과 두 번째 테이블 로우(tr)의 첫 번째 테이블 데이터(td)로 이루어진 셀을 비교한다. 즉 도 5에서의 경우 "①"과 "③"셀을 비교한다.
만약, 이 셀(cell)들이 가로 길이가 동일하고, 콜스펀(colspan) 속성으로 다른 셀을 포함하고 있지 않다면 이 셀의 데이터를 첫 셀의 데이터 다음에 위치하도록 한다. 이는 테이블의 맨 첫 셀과 수직한 셀에 대하여 모두 적용하며, 첫 테이블 로우(tr)의 두 번째 테이블 데이터(td) 부터는 이러한 수직변환을 적용하지 않는다. 그 이유는 두 번째 셀 이후에는 주요 데이터가 위치 할 수 있으며, 레이아웃이 훼손될 수 있기 때문이다.
도 5에서와 같이 (a)는 원본 웹페이지로 "②"와 "④" 셀이 수직적으로 근접성과 연속성을 만족하는 연속적인 내용으로 구성되어 있다. 따라서 게슈탈트의 그룹핑 규칙에 따라 사용자들은 웹페이지를 열람할 때 "②"와 "④" 셀을 같이 그룹핑 한다. 따라서 도 5의 "(d)"에서와 같이 "①"과 "③"셀을 그룹핑하고, 수직적으로 "②"와 "④"셀을 그룹핑함으로서 시각적으로 개선된 레이아웃이 제공된다. 즉 본 실시예의 레이아웃은 "③" 셀이 UI 영역으로 무선 디바이스(201) 화면상에 가장 먼저 보일수록 더 사용성이 증가하게 됨으로써 웹 페이지 내용의 연속성이 보장되고, 인터페이스의 사용성이 개선된다.
반면에 종래와 같이 레이아웃을 변환할 경우 도 5의 "(c)"에 나타난 바와 같이 "②"와 "④" 셀 사이에 "③" 셀이 배치됨으로서, 사용자는 원본과 다르게 그룹핑된 상태를 보게 된다.
한편, 웹 페이지의 모든 테이블이 이미지로 만 구성되어 있을 경우에는 분할 이미지 레이아웃 변환으로 변환을 실시한다. 도 6은 분할 이미지 레이아웃 변환 예를 도시한 도면이다.
일반적으로 원본 이미지의 크기가 클 경우 웹 저자들은 이미지를 사용자에서 빠르게 전송하기 위하여 이미지를 분할하고, 그 이미지를 테이블을 사용하여 배치한다. 하지만 이렇게 배치된 이미지를 모바일 페이지에서 볼 경우 도 6의 "(a)"의 이미지가 "(b)"에서와 같이 각 셀의 이미지가 가로 순으로 배치되기 때문에 전혀 무슨 이미지인지 알아볼 수 없는 구조가 생성되며 게슈탈트의 그룹핑 법칙의 4가지 속성 모두 만족하지 않아 사용자들이 혼란을 겪게 된다. 따라서 이 경우 최적화하기 위해서는 이미지 배치가 유지되면서 축소되어야 하며, 축소는 이미지와 테이블의 축소가 동시에 일어나야 한다.
도 6에 도시된 바와 같이 웹 문서 코드를 분석하면서 테이블이 발견되었다면 테이블이 순수하게 이미지로 구성되어 있는지를 파악한다. 만약 테이블에 다른 요소(텍스트 등)가 발견되었다면 분석을 중단하고, 테이블의 셀이 순수하게 이미지 데이터로 구성되어 있다면, 이들 테이블의 사이즈를 우선 비례에 맞게 변경시키고, 테이블의 셀 크기에 맞게 이미지 사이즈를 변경시킨다. 이에 따라 원본 이미지는 도 6의 "(c)"에서와 같이 모바일 디바이스에 최적화됨으로써 이미지가 가지는 정보 를 효율적으로 전달 할 수 있게 된다. 그리고 본 실시예에서는 하이퍼링크에 대한 데이터는 고려하지 않는다.
레이아웃 변환이 완료되면 이후 반복되는 패턴별로 수 개의 그룹으로 묶고, 이 데이터를 분해하거나 생략한 다음 여러 개의 페이지로 나눈다. 이 과정은 트리 구조를 기반으로 변환 전략 생성 과정에서 생성된 변환 전략과 휴리스틱들을 함께 고려하게 된다. 한편, 문서를 나눌 때는 문서간의 하이퍼링크를 생성하도록 되어 있다. 하이퍼링크는 계층적으로 생성되며, 다른 하위 그룹의 페이지를 보기 위해서는 메인의 페이지를 거쳐야 한다.
한편, 문법 검사 및 수정(S14)은 문서 데이터 변환 과정에 있어서 마지막 과정이다. 이 문법 검사 및 수정(S14)은 해당 웹문서가 순수하게 문서 데이터만으로 이루어진 경우에 수행된다. 이러한 문법 검사 및 수정(S14)은 일반적인 PC용 웹브라우저와는 다르게 모바일 디바이스용 웹브라우저는 문법에 엄격하다. 태그는 다 닫혀 있어야 하며, 생략되는 태그나 지원하지 않는 태그가 있을 경우, 문서 전체를 브라우저에서 판독하지 못하는 경우가 발생하게 된다. 본 실시예에서는 문법 검사 및 수정 과정을 두어 문법의 오류를 방지한다.
다음으로 문서 데이터의 변환이 완료되고, 해당 웹문서에 이미지 데이터가 포함되어 있다면 변환 전략에 따라 웹 콘텐츠에 포함된 이미지 데이터에 대한 최적화 전략을 수행한다. 도 4에 도시된 바와 같이 이미지 데이터에 대한 변환은 이미지의 변환이 용이하도록 오리지널 웹 서버(300)로부터 수신한 이미지 데이터를 로우(RAW) 데이터로 변경(S20)한다. 하지만 이 과정에서 해당 이미지 데이터를 읽어 들일 수 없으면 변경을 수행하지 않고, 오류 메시지를 로그에 남기고 해당 이미지를 문서에서 제외시킨다.
이미지 분석 단계(S21)에서는 이미지가 자연적인 이미지인지 인위적인 이미지인지를 분석한다. 도 7은 자연적인 이미지와 인위적인 이미지의 히스토그램을 예시적으로 도시한 도면이다. 도 7을 참조하여 이미지 구분은 수학식 1에 따라 판단한다.
Figure 112008013891587-pat00001
if H(l) > p : 자연적인 이미지(Natural image)
else H(l) ≤ p : 인위적인 이미지(Artificial image)
여기서 "l" 은 매그니튜드(magnitude)가 "0"이 아닌 히스토그램(histogram)의 레벨들의 총 수이고, "L"은 히스토그램 레벨들의 총 수이다. 위 기준은 "red, green, blue" 히스토그램에 대하여 각각 적용한다. "p"는 기준치이며 이 기준치는 10,000개의 인터넷에 존재하는 이미지를 대상으로 하여 분석한 것을 토대로 실험한 결과 "0.7" 정도가 적합하다는 결과를 얻었다. 도 7에 도시된 바와 같이 자연적인 이미지는 도 7의 "(a)"를 예로 할 수 있고, 이 자연적인 이미지의 히스토그램은 도 7의 "(b)"와 같을 수 있다. 그리고 인위적인 이미지는 도 7의 "(c)"를 예로 할 수 있고, 이 인위적인 이미지의 히스토그램은 도 7의 "(d)"를 예로 할 수 있다.
즉, 메인 화면이나 장식으로 쓰이는 이미지들은 글자나 아이콘에 주로 사용 되고, 복잡도가 낮으며, 인위적으로 제작한 파일이 대부분이다. 이런 종류의 이미지의 경우 배경의 비율이 높다. 따라서 아이콘이나 메뉴, 타이틀 이미지 등의 인위적으로 제작한 이미지를 인위적인 이미지로 구분하고, 상대적으로 복잡한 사진이나 회화 이미지를 자연적인 이미지로 구분할 수 있다.
도 4에 도시된 바와 같이 이미지 최적화 단계(S22)에서는 전 단계에서 구분된 인위적인 이미지들과 자연적인 이미지들을 각각 최적화한다(S22a)(S22b). 여기서 주의할 것은 압축으로 무선 디바이스(201)의 웹브라우저는 이동 통신사마다 기준은 다르지만 4Kbyte 안팎으로 한 이미지 당 용량이 제한되기 때문에 이 용량을 맞추기 위해서는 손실 압축이 불가피 하다. 따라서 디바이스와 브라우저를 고려한 분할 압축 정도에 대한 정보는 데이터베이스에 저장되어 있기 때문에 디바이스 정보를 데이터베이스로부터 호출하여 변환하는데 활용한다.
이하에서는 자연적인 이미지의 변환과 인위적인 이미지의 변환에 대하여 보다 구체적으로 설명한다.
도 8은 자연적인 이미지의 변환 과정을 도시한 도면이다. 도 8에 도시된 바와 같이 자연적인 이미지는 무선 디바이스(201) 상에서 명확한 정보전달을 요구하지 않는다고 볼 수 있다. 따라서 형태나 상황에 대해 인식만 이루어지면 충분할 수 있다. 따라서 도 8에서와 같이 한정된 크기를 가지는 무선 디바이스의 디스플레이 상에서 표현하기 위하여 축소할 때 별다른 보간 없이도 도 8의 "(a)", "(b)" 그리고 "(c)"에서와 같이 형태구별이 용이할 수 있다.
본 실시예에서는 무선 디바이스(201)의 화면크기에 맞추어 이미지가 화면의 가로 크기보다 클 경우 가로 세로 비율에 맞추어 이미지 크기를 줄인다. 또한 화면의 가로 크기보다 작을 경우 축소하지 않도록 하였다. 그리고 축소 시에 보간법은 "Parker"의 연구에 따라 근접 픽셀 보간법(Neighbor pixel interpolation)과 양선형 보간법(Bilinear interpolation), 큐빅 B-스플라인 보간법(Cubic B-spline interpolation), 고해상도 B-스플라인 보간법 중에서 선택하여 실시할 수 있다. 본 실시예에서는 비교적 성능이 뛰어난 고해상도 큐빅 B-스플라인 보간법으로 실시한다.
도 9는 인위적인 이미지의 변환 과정을 도시한 도면이다. 도 9에 도시된 바와 같이 인위적인 이미지는 웹 문서 상에서 주로 사용자 인터페이스로 쓰이거나 사이트 정체성과 관련된 정보의 빠르고 명확한 전달을 위하여 사용한다. 특히, 인위적인 이미지는 텍스트나 특정 심벌로 구성된 경우가 많다.
따라서 인위적인 이미지는 비교적 간단하고 명확한 정보를 포함하고 있으며, 이를 위하여 불필요한 여백이 자리 잡고 있는 경우가 많다. 도 9는 인위적인 이미지의 크기를 일정 비율로 축소시킨 것이다. 도 9에 도시된 바와 같이 배경을 제거하여 이미지를 축소한 경우 동일한 면적에서 더 뚜렷하게 이미지가 전달하고자하는 정보를 확인 할 수 있다.
이러한 배경이 제거된 이미지의 경우 원본 이미지에 비하여 문서 내 차지하는 영역이 작아 무선 디바이스에서 효과적인 화면 구성이 가능하다. 또한 마우스로 클릭하기 편리하기 위해 일정 크기 이상이 되어야 되는 PC용 웹 문서와는 다르게 방향키로 선택하는 모바일 페이지의 경우 오히려 크기가 크면 스크롤이 많아져서 사용하기 불편할 수 있다.
이와 같이 인위적인 이미지를 줄이기 위하여 다음과 같은 프로세스로 진행한다.
도 9에 도시된 바와 같이 인위적인 이미지의 변환(S22b)은 원본이미지를 메모리에 복제하는 단계 "(a)", 복제한 이미지를 캐니 에지 검출기를 이용하여 경계영역만을 추출하는 단계 "(b)", 임계값 이상의 영역만을 추출하여 경계정보를 추출하는 단계 "(c)", 복제한 이미지의 경계정보를 바탕으로 원본 이미지의 배경영역 외의 나머지 영역을 추출하는 단계 "(d)", 그리고 추출한 이미지가 무선 디바이스 화면보다 클 경우 크기를 축소하고 최적화하는 단계 "(e)"로 진행한다.
이하 보다 구체적으로 각각의 단계에 대하여 설명하면, 우선 원본 이미지를 메모리에 복제한다 "(a)". 그리고 복제한 이미지를 대상으로 캐니 에지 검출기(canny edge detector)를 사용하여 에지를 검출한다 "(b)". 그리고 에지들에 대한 히스토그램을 도출하고 에지 히스토그램에 대하여 임계값을 구한다. 임계값을 구하기 위한 클러스터 "
Figure 112008013891587-pat00002
"과 "
Figure 112008013891587-pat00003
"에 대한 거리 "
Figure 112008013891587-pat00004
"의 수식은 수학식 2와 같다.
Figure 112008013891587-pat00005
여기서 "
Figure 112008013891587-pat00006
"는 "
Figure 112008013891587-pat00007
"과 "
Figure 112008013891587-pat00008
"의 인터 분산, "
Figure 112008013891587-pat00009
"는 "
Figure 112008013891587-pat00010
"과 "
Figure 112008013891587-pat00011
"의 인트라 분산을 의미한다. 인터 분산(inter-variance)과 인트라 분산(intra-variance)의 수식은 수학식 3과 같다.
Figure 112008013891587-pat00012
Figure 112008013891587-pat00013
Figure 112008013891587-pat00014
"
Figure 112008013891587-pat00015
"는 클러스터의 평균이며, "
Figure 112008013891587-pat00016
Figure 112008013891587-pat00017
"는 클러스터 "
Figure 112008013891587-pat00018
"과 "
Figure 112008013891587-pat00019
"의 글로벌 평균을 의미한다. 수학식 3에서 클러스터가 2개가 될 때까지 재귀적으로 실행하고, 2번째 클러스터의 최소값을 구하면 경계 정보를 얻기 위한 에지의 임계값을 구할 수 있다.
이후 경계 정보를 추출한다 "(c)". 여기서 경계 정보란 경계 사각형의 왼쪽 상단 모서리 점의 위치 정보와 오른쪽 하단 모서리 점의 위치정보를 말한다. 이 정보를 바탕으로 원본 이미지의 배경 영역을 제외한 나머지 이미지 영역에서 이미지를 추출한다 "(d)". 추출한 이미지가 무선 디바이스 화면보다 클 경우 자연적인 이 미지와 동일한 보간법을 이용하여 크기를 축소한다 "(e)". 사람의 시각은 경계부분에 민감하다는 가정 하에 축소된 이미지에 적절한 선명화(sharpen)를 적용한다. 이와 더불어 불필요한 헤더 정보를 제외하고 파일을 압축한다.
그리고 문서최적화와 이미지 최적화가 완료되면 프록시 서버(100)는 해당 클라이언트 디바이스(300)에 대한 콘텐츠 적응이 이루어진 웹문서를 캐시(120)에 저장하고, 이후 클라이언트 디바이스(300)의 이미지 요청에 따라 또는 콘텐츠 적응 완료된 후 캐시(120)에 저장된 콘텐츠 적응된 이미지 문서를 클라이언트 디바이스(300)에 서비스 한다.
이상과 같이 본 실시예에 따른 콘텐츠 적응 시스템과 방법에 따라 실시한 예를 이미지가 표현되는 정도를 나타내기 위해 "Image Component Presentation Rate (ICPR)"이라는 평가 기준을 만들어 종래의 콘텐츠 적응 기술과 비교하였다. 이 비교 결과 도 10에 도시된 바와 같이 본 실시예의 브라우저는 70%이상의 비교적 뛰어난 웹 페이지 표현 성능을 보여주었다. 도 10은 종래 기술"(a)"와 본 실시예(b)에 따른 웹 페이지 표현 능력을 비교하여 나타낸 도면이다.
더욱이 도 10의 가장 오른쪽에 위치한 예의 경우, 날씨 정보를 이미지로 전달하기 때문에 텍스트 중심의 변환으로는 정보를 전달할 수 없다. 따라서 필수적으로 시각적인 측면이 고려된 변환을 해주어야 한다. 또한, 로고가 제외될 경우 사이트의 정체성이 모호해지며, 사용자들이 사이트를 인지하는데도 오해가 생길 가능성이 있지만, 본 실시예에서는 이러한 문제점을 효과적으로 해소하였다. 또한, 이미지 컴포넌트 측면의 처리와 레이아웃 측면의 처리를 통하여 본 실시예는 웹문서의 정보를 한 화면상에 더 많이 표현 할 수 있고, 디바이스에 표시되는 총 화면 길이가 큰 폭으로 줄어드는 효과가 있다.
도 1은 본 실시예에 따른 모바일 웹 환경을 설명하기 위한 도면이다.
도 2는 본 실시예에 따른 모바일 웹 환경을 위한 콘텐츠 적응 시스템을 도시한 도면이다.
도 3은 본 실시예에 따른 모바일 웹 환경을 위한 콘텐츠 적응 시스템의 동작 프로세스에서 전처리 과정을 설명하기 위한 도면이다.
도 4는 문서 데이터 변환 프로세스와 이미지 데이터 변환 프로세스를 설명하기 위한 도면이다.
도 5는 수직 중심 레이아웃 변환 예를 도시한 도면이다.
도 6은 분할 이미지 레이아웃 변환 예를 도시한 도면이다.
도 7은 자연적인 이미지와 인위적인 이미지의 히스토그램을 예시적으로 도시한 도면이다.
도 8은 자연적인 이미지의 변환 과정을 도시한 도면이다.
도 9는 인위적인 이미지의 변환 과정을 도시한 도면이다.
도 10은 종래 기술과 본 실시예에 따른 웹 페이지 표현 능력을 비교하여 나타낸 도면이다.

Claims (22)

  1. 클라이언트 디바이스에서 웹페이지 요청을 받으면 상기 클라이언트 디바이스의 종류를 판단하여 변환 전략을 생성하는 전처리부;
    상기 전처리부에서 제공하는 문서 데이터의 변환과 웹페이지의 레이아웃을 변환하는 문서 데이터 변환부;
    상기 전처리부에서 제공하는 이미지 데이터와 상기 문서 데이터에서 제공하는 변환된 문서 데이터를 최적화시키며 상기 이미지 데이터를 변환하는 이미지 데이터 변환부;를 구비하되, 상기 레이아웃 변환은,
    상기 웹 페이지의 최외곽 테이블에서 셀이 수직적으로 연속적이면, 상기 테이블의 상기 셀 중 첫 번째 테이블 로우의 첫 번째 테이블 데이터(first table row, first table data)와 두 번째 테이블 로우의 첫 번째 테이블 데이터(second table row, first table data)를 비교하고, 상기 첫 번째 테이블 로우의 첫 번째 테이블 데이터와 상기 두 번째 테이블 로우의 첫 번째 테이블 데이터의 가로 길이가 동일하면, 상기 두 번째 테이블 로우의 첫 번째 테이블 데이터를 상기 첫 번째 테이블 로우의 첫 번째 테이블 데이터의 다음에 수직적으로 위치시키고,
    상기 웹 페이지의 코드 분석으로 모든 테이블이 이미지로 구성되어 있으면, 상기 테이블의 사이즈를 비례에 맞게 변경시키고, 상기 테이블의 셀 크기에 맞게 이미지 사이즈를 변경시켜 레이아웃 변환을 수행하는 것을 특징으로 하는 콘텐츠 적응 시스템.
  2. 제 1 항에 있어서, 상기 전처리부는 상기 클라이언트 디바이스에서 전송하는 서비스 요청 신호의 패킷 헤더(packet header)를 분석하여, 상기 클라이언트 디바이스의 브라우저의 정보와 상기 클라이언트 디바이스의 종류를 판단하는 것을 특징으로 하는 콘텐츠 적응 시스템.
  3. 제 1 항에 있어서, 상기 문서 데이터 변환부는 상기 문서 데이터에 대한 인코딩 변환, 필요 텍스트 추가, 이미지 경로 변경, 상기 웹페이지의 레이아웃 변환, 문법 검사 및 문법 수정을 수행하는 것을 특징으로 하는 콘텐츠 적응 시스템.
  4. 제 1항에 있어서, 상기 이미지 데이터 변환부는 상기 이미지 데이터를 상기 이미지 데이터의 히스토그램을 이용하여 인위적인 이미지와 자연적인 이미지로 구분하여 변환하는 것을 특징으로 하는 콘텐츠 적응 시스템.
  5. 클라이언트 디바이스에서 웹페이지 요청을 받으면 전처리부는 상기 클라이언트 디바이스의 종류를 판단하여 변환 전략의 생성과 상기 웹페이지의 이미지 데이터와 문서 데이터를 구분하는 단계;
    문서 데이터 변환부는 상기 변환 전략에 따라 상기 문서 데이터의 변환과 상기 웹페이지의 레이아웃을 변환하는 단계;
    이미지 데이터 변환부는 상기 이미지 데이터와 상기 문서 데이터에서 제공하는 변환된 문서 데이터가 최적화되도록 상기 이미지 데이터를 변환하는 단계;를 포함하되, 상기 레이아웃 변환은,
    상기 웹 페이지의 최외곽 테이블에서 셀이 수직적으로 연속적이면, 상기 테이블의 상기 셀 중 첫 번째 테이블 로우의 첫 번째 테이블 데이터(first table row, first table data)와 두 번째 테이블 로우의 첫 번째 테이블 데이터(second table row, first table data)를 비교하고, 상기 첫 번째 테이블 로우의 첫 번째 테이블 데이터와 상기 두 번째 테이블 로우의 첫 번째 테이블 데이터의 가로 길이가 동일하면, 상기 두 번째 테이블 로우의 첫 번째 테이블 데이터를 상기 첫 번째 테이블 로우의 첫 번째 테이블 데이터의 다음에 수직적으로 위치시키고,
    상기 웹 페이지의 코드 분석으로 모든 테이블이 이미지로 구성되어 있으면, 상기 테이블의 사이즈를 비례에 맞게 변경시키고, 상기 테이블의 셀 크기에 맞게 이미지 사이즈를 변경시켜 레이아웃 변환을 수행하는 것을 특징으로 하는 콘텐츠 적응 방법.
  6. 제 5항에 있어서, 상기 클라이언트 디바이스의 판단은 상기 클라이언트 디바이스에서 전송하는 서비스 요청 신호의 패킷 헤더(packet header)를 분석하여, 상기 클라이언트 디바이스의 브라우저의 정보와 상기 클라이언트 디바이스의 종류를 판단하는 것을 특징으로 하는 콘텐츠 적응 방법.
  7. 제 5항에 있어서, 상기 문서 데이터 변환은 상기 문서 데이터에 대한 인코딩 변환, 필요 텍스트 추가, 이미지 경로 변경, 상기 웹페이지의 레이아웃 변환, 문법 검사 및 문법 수정을 수행하는 것을 특징으로 하는 콘텐츠 적응 방법.
  8. 제 5항에 있어서, 상기 이미지 데이터 변환은 상기 이미지 데이터를 상기 이미지 데이터의 히스토그램을 이용하여 인위적인 이미지와 자연적인 이미지로 구분하여 변환하는 것을 특징으로 하는 콘텐츠 적응 방법.
  9. 삭제
  10. 제 5항에 있어서, 상기 셀은 합쳐진 다른 셀을 포함하지 않는 것을 특징으로 하는 콘텐츠 적응 방법.
  11. 삭제
  12. 제 8항에 있어서, 상기 인위적인 이미지와 자연적인 이미지로 구분하는 것은,
    상기 웹 페이지의 이미지의 히스토그램을 획득하는 단계;
    상기 히스토그램의 총수와 매그니튜드가 소정값 초과인 히스토그램의 총수를 비교한 비교값을 획득하는 단계; 및
    상기 비교값이 미리 설정한 기준값보다 크면 자연적인 이미지(natural image)로 판단하고, 상기 비교값이 상기 기준값보다 작거나 같으면 인위적인 이미지(artificial image)로 판단하는 단계;를 포함하는 것을 특징으로 하는 콘텐츠 적응 방법.
  13. 제 12항에 있어서, 상기 이미지가 컬러 이미지이고, 상기 히스토그램은 상기 이미지의 삼원색에 대한 히스토그램으로 판단하는 것을 특징으로 하는 콘텐츠 적응방법.
  14. 제 12항에 있어서, 상기 기준값은 복수개의 테스트 이미지에서 상기 테스트 이미지의 히스토그램의 총수와, 매그니튜드가 상기 소정값 이상인 히스토그램의 총수를 비교하여 결정한 값이고, 상기 소정값은 매그니튜드가 "0"인 것을 특징으로 하는 콘텐츠 적응 방법.
  15. 제 12항에 있어서, 상기 이미지가 인위적인 이미지이면 상기 이미지의 배경과 이미지로 된 상기 웹 페이지의 원본 이미지에서 상기 이미지의 에지를 검출하여 상기 이미지의 경계 영역을 추출하고, 상기 이미지에서 임계값 이상의 영역만을 추출하여 배경 영역과 이미지 영역을 구분하는 경계 정보를 추출하고, 상기 배경 영역을 제거한 후 상기 이미지 영역만을 추출하는 것을 특징으로 하는 콘텐츠 적응 방법.
  16. 제 15항에 있어서, 상기 임계값은 상기 이미지의 에지들에 대한 히스토그램을 도출하여 얻은 것인 것을 특징으로 하는 콘텐츠 적응 방법.
  17. 제 15항에 있어서, 상기 경계 정보 영역은 상기 이미지 영역의 복수개의 모서리 점에 대한 위치 정보인 것을 특징으로 하는 콘텐츠 적응 방법.
  18. 제 15항에 있어서, 추출된 상기 이미지 영역의 크기는 보간법을 이용하여 축소하는 것을 특징으로 하는 콘텐츠 적응 방법.
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
KR1020080017052A 2008-02-26 2008-02-26 모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법 KR100964792B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080017052A KR100964792B1 (ko) 2008-02-26 2008-02-26 모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080017052A KR100964792B1 (ko) 2008-02-26 2008-02-26 모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20090091854A KR20090091854A (ko) 2009-08-31
KR100964792B1 true KR100964792B1 (ko) 2010-06-21

Family

ID=41209051

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080017052A KR100964792B1 (ko) 2008-02-26 2008-02-26 모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR100964792B1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101350332B1 (ko) * 2009-09-01 2014-01-10 한국전자통신연구원 광고 대체 시스템 및 광고 대체 방법
US9729352B1 (en) 2010-02-08 2017-08-08 Google Inc. Assisting participation in a social network
US8582801B2 (en) 2010-02-08 2013-11-12 Google Inc. Assisting the authoring of posts to an asymmetric social network
US8825759B1 (en) 2010-02-08 2014-09-02 Google Inc. Recommending posts to non-subscribing users
US8527597B2 (en) 2010-12-07 2013-09-03 Google Inc. Determining message prominence
KR101340588B1 (ko) * 2012-02-29 2013-12-11 주식회사 팬택 웹페이지 구성방법 및 그 장치
KR102075030B1 (ko) 2012-09-26 2020-02-10 에스케이텔레콤 주식회사 사이트 기반의 적응적인 데이터 서비스 제어 방법 및 그 장치
KR102065662B1 (ko) 2012-09-26 2020-01-13 에스케이텔레콤 주식회사 접속망 기반의 적응적인 데이터 서비스 제어 방법 및 그 장치
KR101892286B1 (ko) * 2014-01-20 2018-08-27 주식회사 웰시스템코리아 물체 인식을 이용한 콘텐츠 제공 시스템 및 방법
WO2015108243A1 (ko) * 2014-01-20 2015-07-23 주식회사 웰시스템 (영업소) 물체 인식을 이용한 콘텐츠 제공 시스템, 방법 및 그 응용
US20200074006A1 (en) * 2018-08-29 2020-03-05 Intuit Inc. System and method for providing customer specified webpage configuration

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11250009A (ja) * 1998-03-04 1999-09-17 Uniden Corp サーバ装置及びウェブデータ変換方式
KR20020008980A (ko) * 2000-07-21 2002-02-01 이수복 다양한 통신망 환경에서 최적의 인터넷 서비스를 제공할수 있는 개인 통신 지원 시스템 및 이를 이용하는 개인통신 클라이언트
JP2004530959A (ja) * 2000-12-18 2004-10-07 カルゴ、インコーポレイテッド コンテンツのモバイル装置への配信システム及び配信方法
KR20070114243A (ko) * 2006-05-27 2007-11-30 한미아이티 주식회사 다양한 사양 및 종류의 단말기와 애플리케이션 서버 간의데이터 통신을 지원하는 미들웨어 및 그 운용 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11250009A (ja) * 1998-03-04 1999-09-17 Uniden Corp サーバ装置及びウェブデータ変換方式
KR20020008980A (ko) * 2000-07-21 2002-02-01 이수복 다양한 통신망 환경에서 최적의 인터넷 서비스를 제공할수 있는 개인 통신 지원 시스템 및 이를 이용하는 개인통신 클라이언트
JP2004530959A (ja) * 2000-12-18 2004-10-07 カルゴ、インコーポレイテッド コンテンツのモバイル装置への配信システム及び配信方法
KR20070114243A (ko) * 2006-05-27 2007-11-30 한미아이티 주식회사 다양한 사양 및 종류의 단말기와 애플리케이션 서버 간의데이터 통신을 지원하는 미들웨어 및 그 운용 방법

Also Published As

Publication number Publication date
KR20090091854A (ko) 2009-08-31

Similar Documents

Publication Publication Date Title
KR100964792B1 (ko) 모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법
US6336124B1 (en) Conversion data representing a document to other formats for manipulation and display
CN109801347B (zh) 一种可编辑图像模板的生成方法、装置、设备和介质
US8442324B2 (en) Method and system for displaying image based on text in image
US7290006B2 (en) Document representation for scalable structure
US7278117B2 (en) Image segmentation and warping for specialized display viewing
US7177488B2 (en) Resolution sensitive layout of document regions
Chen et al. A visual attention model for adapting images on small displays
KR100461019B1 (ko) 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법
US7694221B2 (en) Choosing between multiple versions of content to optimize display
US6801673B2 (en) Section extraction tool for PDF documents
US20090265611A1 (en) Web page layout optimization using section importance
US20080079730A1 (en) Character-level font linking
US20100074527A1 (en) Editing 2d structures using natural input
JP2010204705A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
CA2518654A1 (en) Method for requesting and viewing a zoomed area of detail from an image attachment on a mobile communication device
WO2013148351A1 (en) System and method for analyzing an electronic documents
US20130227391A1 (en) Method and apparatus for displaying webpage
Whang et al. WebAlchemist: a web transcoding system for mobile web access in handheld devices
Yang et al. A Unit of Information‐Based Content Adaptation Method for Improving Web Content Accessibility in the Mobile Internet
US20190332859A1 (en) Method for identifying main picture in web page
Chen et al. Image Adaptation Based on Attention Model for Small-Form-Factor Device.
US20160042545A1 (en) Display controller, information processing apparatus, display control method, computer-readable storage medium, and information processing system
Kopf et al. Adaptation of web pages and images for mobile applications
Tan et al. Adaptive user interface optimization for multi-screen based on machine learning

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130429

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140326

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150417

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160325

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20171026

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180323

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20190610

Year of fee payment: 10