KR20090060022A - 내용 기반의 문서 브라우징 방법 및 장치 - Google Patents

내용 기반의 문서 브라우징 방법 및 장치 Download PDF

Info

Publication number
KR20090060022A
KR20090060022A KR1020070127152A KR20070127152A KR20090060022A KR 20090060022 A KR20090060022 A KR 20090060022A KR 1020070127152 A KR1020070127152 A KR 1020070127152A KR 20070127152 A KR20070127152 A KR 20070127152A KR 20090060022 A KR20090060022 A KR 20090060022A
Authority
KR
South Korea
Prior art keywords
document
browsing
content
tree
component
Prior art date
Application number
KR1020070127152A
Other languages
English (en)
Inventor
정지혜
이혜정
이종호
김연배
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070127152A priority Critical patent/KR20090060022A/ko
Priority to US12/081,406 priority patent/US20090150759A1/en
Publication of KR20090060022A publication Critical patent/KR20090060022A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]

Abstract

본 발명은 내용 기반의 문서 브라우징 방법 및 장치에 관한 것으로, 문서를 분석하여 내용 기반의 컴포넌트를 기초로 문서 트리를 생성하는 단계와, 생성된 문서 트리를 기초로 브라우징 환경에 적응적으로 문서를 프리젠테이션하는 단계를 포함하는 내용기반의 문서 브라우징 방법을 제안한다. 이에 따라 웹 문서를 다시 제작하지 않고도 다양한 플랫폼과 디스플레이 장치를 구비한 브라우징 환경에 적용가능한 웹 문서 브라우징 방법을 제공할 수 있다.
웹 문서, 내용 기반, 프레젠테이션, 브라우징

Description

내용 기반의 문서 브라우징 방법 및 장치{Method and apparatus for browsing documents based on contents}
본 발명은 브라우징 방법 및 장치에 관한 것으로, 특히 다양한 플랫폼과 디스플레이 장치를 구비한 브라우징 환경에 적용가능한 웹 문서 브라우징 방법 및 장치에 관련된다. 본 발명은 인터넷에 연결되어 웹 브라우징이 가능한 모든 장치에 적용될 수 있다.
일반적으로 사용자들은 컴퓨터를 이용하여 웹(web) 문서로부터 다양한 정보를 얻는다. 컴퓨터는 웹 문서에서 정보를 얻기 위하여 익스플로러나 넷스케이프와 같은 퍼스널 컴퓨터에 적합한 브라우저를 사용하며, 웹 문서들은 컴퓨터용으로 최적화되도록 제작되어 전술한 브라우저를 통해 사용자에게 제공된다.
그러나, 최근 웹에서 얻는 정보의 양이 급증하고 사용자들의 여가 시간이 증가함에 따라 다양한 플랫폼과 디스플레이 장치를 구비한 브라우징 환경에서 웹 문서를 브라우징하기 원하는 사용자가 늘고 있다. 예를 들면, 이동성이 지원되는 피엠피(portable multimedia player: PMP), 핸드폰, 모바일 피씨(Ultra Mobile PC: UMPC) 등 제한된 자원과 작은 크기의 디스플레이 장치를 갖는 브라우징 장치에서 웹 문서를 브라우징하거나, 또는 큰 크기의 디스플레이 장치를 구비한 IPTV 장치에서 웹 문서를 브라우징하는 등, 다양한 플랫폼 및 디스플레이 장치를 구비한 브라우징 환경에서 웹 문서를 브라우징하고자 하는 요구가 증가하고 있다.
이러한 사용자의 요구에 맞추어 기존의 컴퓨터용 웹 문서를 각각의 환경에 맞춰 다시 제작하는 것에는 한계가 있을 것이다.
따라서, 본 발명은 전술한 문제점을 해결하기 위해 안출된 것으로, 웹 문서를 다시 제작하지 않고도 다양한 플랫폼과 디스플레이 장치를 구비한 브라우징 환경에 적용가능한 웹 문서 브라우징 방법 및 장치를 제공하는 것을 목적으로 한다.
전술한 목적을 달성하기 위하여 본 발명은, 문서를 분석하여 내용 기반의 컴포넌트를 기초로 문서 트리를 생성하는 단계와, 생성된 문서 트리를 기초로 브라우징 환경에 적응적으로 문서를 프리젠테이션하는 단계를 포함하는 내용기반의 문서 브라우징 방법을 제안한다.
여기서, 문서 트리를 생성하는 단계는, 내용 기반의 컴포넌트를 의미 관계에 따라 컴포넌트 그룹으로 그룹핑하는 단계와, 컴포넌트 그룹에 대하여 브라우징 환경에 맞는 속성을 부여하는 단계를 포함하며,
문서 트리를 생성하는 단계는, 브라우징 환경에 맞도록 내용 기반의 컴포넌트 또는 컴포넌트 그룹의 프리젠테이션 우선 순위를 조정하는 단계를 더 포함하는 것이 바람직하다.
또한, 문서를 프리젠테이션하는 단계는, 생성된 문서 트리를 기초로 브라우 징 환경에 맞게 부여된 속성에 따라 문서를 랜더링하는 것이 바람직하다.
한편 본 발명의 다른 양상에 따르면 전술한 목적은, 문서를 분석하여 내용 기반의 컴포넌트를 기초로 문서 트리를 생성하는 브라우징 엔진과, 생성된 문서 트리를 기초로 브라우징 환경에 적응적으로 문서를 프리젠테이션하는 랜더링 엔진을 포함하는 내용 기반의 문서 브라우징 장치에 의해 달성된다.
한편, 본 발명의 다른 양상에 따르면 전술한 목적은, 전술한 내용 기반의 문서 브라우징 장치가 탑재된 모바일 단말 또는 IPTV 장치에 의해서도 달성된다.
이하에서는 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명한다. 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 발명의 실시예에서 문서(Document)는, 웹 페이지인 경우를 예로 들어 설명하나 이는 설명의 편의를 위한 것으로 이에 한정되는 것은 아니며, HTML 또는 XML 등과 같은 마크업 언어로 작성된 모든 문서를 포함한다. 본 발명의 실시예에서 브라우징 장치는, PMP, 핸드폰, UMPC와 같은 모바일 단말은 물론, 인터넷을 지원하는 IPTV 장치 등을 포함하는 포괄적인 개념으로 인터넷을 지원하는 모든 디지털 장 치를 아우른다. 본 발명의 실시예에서는 컴퓨터에 최적화하여 작성된 웹 문서를 다시 제작하지 않고도 전술한 다양한 브라우징 장치에 적용가능한 웹 문서 브라우징 장치와 방법을 제안한다.
도 1은 본 발명의 일 실시예에 따른 브라우징 장치의 구성도이다.
도 1을 참조하면, 본 발명에 따른 브라우징 장치(1)는 브라우징 엔진(10) 및 렌더링 엔진(20)을 포함하며, 문서분석엔진(12), 사용자 인터페이스 및 디스플레이 장치를 더 포함하여 구성될 수 있다.
브라우징 엔진(browsing engine)(10)은 문서를 분석하여 내용 기반의 컴포넌트를 기초로 문서 트리(document tree)를 생성한다. 이때, 기존의 웹 문서를 분석하여 생성되는 DOM 트리(Document Object Model tree)(14)를 이용하여 본 발명에 따른 내용 기반의 컴포넌트를 기초로 한 문서 트리를 생성할 수 있다. 본 발명에 따른 문서 트리는 기존의 태그(tag) 중심의 DOM 트리를 내용 기반의 컴포넌트(component based on content)를 중심으로 재구조화한 것이다.
브라우징 엔진(10)은 내용 기반의 컴포넌트를 의미 관계에 따라 컴포넌트 그룹으로 그룹핑하고 컴포넌트 그룹에 대하여 브라우징 환경에 맞는 속성을 부여한다. 여기서 브라우징 환경에 맞게 부여된 속성이라 함은 웹 문서의 레이아웃(layout), 프레젠테이션 스타일(presentation style), 컨텐츠 포맷(content format) 중 적어도 하나를 포함하는 것이 바람직하다.
브라우징 엔진(10)은 문서 트리가 플랫(flat)한 구조를 가지도록 복수의 내용 기반의 컴포넌트들을 유사도에 따라 대표 컴포넌트 노드에 병렬 통합 배치한다. 이에 따라 사용자가 인지하는 문서 구조에 맞도록 문서의 레이아웃과 컨텐츠간의 상관관계를 용이하게 표현할 수 있으며, 문서 구조에 대한 사용자의 이해와 접근을 용이하게 할 수 있다. 이때, 대표 컴포넌트 노드는 복수의 내용 기반의 컴포넌트들의 내용을 요약한 정보를 포함하며, 대표 컴포넌트 노드는 복수의 내용 기반의 컴포넌트들의 노출 정도에 대한 정보를 포함하는 것이 바람직하다. 또한, 브라우징 엔진은 복수의 내용 기반의 컴포넌트들의 레이아웃 또는 반복 패턴을 이용하여 의미 관계에 있는 컴포넌트들을 컴포넌트 그룹으로 그룹핑한다. DOM 트리를 재구조화하여 본 발명에 따른 문서 트리를 생성하는 구체적인 방법은 후술한다.
또한, 브라우징 엔진(10)은 브라우징 환경에 맞도록 내용 기반의 컴포넌트 또는 컴포넌트 그룹의 프리젠테이션 우선 순위를 조정하여 브라우징 환경에 따라 적절한 수준으로 컨텐츠의 노출을 조절할 수 있다. 나아가, 브라우징 엔진(10)은, 생성된 문서 트리를 기초로 문서로부터 특정 내용의 정보를 검색 또는 추출할 수 있다.
한편, 렌더링 엔진(rendering engine)(20)은 생성된 문서 트리를 기초로 브라우징 환경에 적응적으로 문서를 프리젠테이션(presentation)한다. 즉, 랜더링 엔진은 생성된 문서 트리를 기초로 브라우징 환경에 맞게 부여된 속성에 따라 디스플레이 화면에 문서를 랜더링한다.
전술한 바와 같이 본 발명의 일 실시예에 따르면 웹 문서를 분석하여 내용 기반의 컴포넌트를 기초로 문서 트리를 생성하고 이를 기초로 문서를 랜더링함으로써, 웹 문서를 다시 제작하지 않고도 다양한 플랫폼과 디스플레이 장치를 구비한 브라우징 환경에 적용가능한 웹 문서 브라우징 장치를 제공할 수 있다.
이하, 전술한 브라우징 장치(1)의 구성을 기초로 본 발명의 일 실시예에 따른 브라우징 방법을 상세히 살펴본다.
도 2 및 도 3는 본 발명의 일 실시예에 따른 문서의 컴포넌트 구조를 도시한 참고도이다. 도시된 바와 같이, 본 발명의 일 실시예에 따른 문서 트리에는 내용기반 컴포넌트(520), 의미블록 컴포넌트(510), 및 도큐먼트 컴포넌트(500)로 구분되는 3가지 종류의 컴포넌트가 포함될 수 있다.
먼저, 내용기반 컴포넌트(520)(content unit: 이하 '제1 컴포넌트'라 약칭한다)는 문서를 이루는 가장 하위 요소로서 텍스트, 이미지, 비디오, 버튼, 입력창 등과 같은 단일 미디어 포맷과 프리젠테이션 스타일로 구분되는 컨텐츠의 기본 단위이다.
다음으로, 의미블록 컴포넌트(510)(semantic block: 이하 '제2 컴포넌트'라 약칭한다)는 복수의 내용기반 컴포넌트(520)들 중에서 의미적으로 연관된 내용기반 컴포넌트를 그룹화한 컴포넌트 그룹이다. 의미블록 컴포넌트에는 내용기반 컴포넌트 뿐만 아니라 다른 의미블록 컴포넌트가 더 포함될 수 있다. 의미 관계는 웹 문서의 레이아웃 분석이나 패턴 분석 등을 통하여 추론할 수 있다.
마지막으로, 도큐먼트 컴포넌트(500)(Document component: 이하 '제3 컴포넌트'라 약칭한다)는 문서 전체를 의미하고 다수의 제2 컴포넌트를 포함한다. 다수의 제3 컴포넌트가 모여 웹 사이트를 구성한다.
도 4는 본 발명의 일 실시예에 따른 브라우징 방법을 도시한 흐름도이다.
도 4를 참조하면, 본 발명에 따른 브라우징 엔진(10)은 다양한 브라우징 환경에 적용가능한 웹 문서 브라우징 방법을 제공하기 위하여, 먼저 컴퓨터용으로 제작된 기존 웹 문서를 파싱(parsing)하여 DOM 트리를 생성한다(S200).
DOM 트리 구조의 일 예가 도 5에 도시되어 있다. 도 5를 참조하면, DOM 트리는 HTML 이나 XML과 같은 마크업 언어의 태그를 이용하여 문서를 계층적으로 표현한다. DOM 트리의 중간 레벨의 노드들은 문서의 내용이 아니라 이를 표현하기 위한 프레젠테이션 스타일이나 속성 등을 저장한다. 실제로 문서가 표시하고자 하는 내용은 DOM 트리의 최하위 레벨의 리프 노드(leaf node)(710)에 저장된다.
따라서, DOM 트리의 여러 레벨을 거쳐야 문서의 내용에 대한 접근이 가능하다. 또한, 동일 레벨의 내용이라도 DOM 트리 상에 동일 레벨에 위치하지 않는 경우가 많으며, 동일 레벨의 내용이 DOM 트리 상에 분리되어 표현되는 경우도 종종 있다. 이는 DOM 트리가 문서의 내용과는 무관하게 태그 중심으로 계층화된 구조를 표현하기 때문이다. 따라서, 컴퓨터용 브라우징 환경에 적합하도록 제작된 문서를 다른 브라우징 환경에서 브라우징하려면 문서를 다시 제작해야만 한다.
이러한 DOM 트리를 이용한 기존의 브라우징 방법의 문제점을 해결하기 위하여, 본 발명의 일 실시예에 따르면 문서를 다시 제작하지 않고도 다양한 브라우징 환경에 적용할 수 있도록 DOM 트리를 재구성하여 문서 트리를 생성하는 방법을 제안한다.
다시 도 4를 참조하면, 본 발명의 일 실시예에 따른 브라우징 엔진(10)은, 태그 기반으로 구성된 DOM 트리의 리프 노트를 내용 기반의 컴포넌트 단위(제1 컴 포넌트)로 분할한다(S210). 보다 구체적으로, 브라우징 엔진은 컨텐츠를 저장하고 있는 기존의 DOM 트리의 리프 노드를 텍스트, 이미지, 비디오 등의 미디어 포맷(media format)에 따라 내용 기반의 컴포넌트 단위(제1 컴포넌트)로 분할할 수 있다. 또한 폰트 타입, 폰트 크기, 색상, 배경색, 경계선 등의 프리젠테이션 스타일(presentation style)에 따라 내용 기반의 컴포넌트 단위(제1 컴포넌트)로 분할할 수도 있다.
이때, DOM 트리를 바텀업(bottom-up) 방식으로 검사하여 잘게 쪼개진 컨텐츠 단위들을 미디어 포맷이나 프리젠테이션 스타일이 유사한 컨텐츠들끼리 묶어 하나의 내용기반 컴포넌트(제1 컴포넌트)를 구성한다. 이는 유사한 내용일수록 미디어 포맷이나 프리젠테이션 스타일도 유사하게 표현될 가능성이 높다는 관찰 결과를 활용한 것이다. 이와 같이 태그 단위의 DOM 트리를 내용상 유사할 가능성이 높은 내용 기반의 컴포넌트 단위로 분할하여 DOM 트리를 재구성한다.
다시 도 4를 참조하면, 이제 분할된 복수의 내용 기반의 컴포넌트 단위들을 의미 관계에 따라 의미블록 컴포넌트(제2 컴포넌트)로 그룹핑한다(S220). 이때 웹 문서의 레이아웃(layout)이나 반복 패턴(repeated pattern) 등을 이용하여 의미적으로 상호 연관된 컴포넌트 단위들을 그룹핑할 수 있다.
예를 들면, 컴포넌트의 위치, 너비 및 높이, 여백, 정렬 등을 이용하여 헤더(header), 좌측면(left-side), 우측면(right-side), 중앙(center), 풋더(footer) 등의 레이아웃 패턴을 추출하고, 이를 이용하여 제1 컴포넌트들을 그룹핑할 수 있다. 레이아웃 패턴을 추출하여 의미 관계에 따라 컴포넌트를 그룹화하는 예가 도 6에 도시된다. 도 6을 참조하면, 도큐먼트 컴포넌트(제3 컴포넌트)(600)에 포함된 각각의 내용기반 컴포넌트(제1 컴포넌트)(620)들이 레이아웃 패턴에 따라 각각의 의미블록 컴포넌트(제2 컴포넌트)(610)로 그룹핑된 것을 알 수 있다. 다른 예로, 상하 또는 좌우 방향으로 반복되는 패턴이 존재하는지를 추론하여 의미적으로 연관된 컴포넌트 단위들을 그룹핑할 수도 있다.
도 7은 본 발명의 일 실시예에 따른 내용기반의 컴포넌트 구조를 도시한 참고도이다. 도 7을 참조하면, 본 발명의 일 실시예에 따라 DOM 트리를 내용기반 컴포넌트(제1 컴포넌트)로 분할하고 의미 관계에 따라 그룹핑(720)하여 DOM 트리를 재구성한 결과가 도시된다.
다시 도 4를 참조하면, 다음으로 제1 컴포넌트 또는 그룹화된 제2 컴포넌트에 다양한 플랫폼 또는 디스플레이 장치를 구비한 브라우징 환경에 맞는 속성을 부여한다(S230). 여기서 브라우징 환경에 맞는 속성은 웹 문서의 레이아웃, 프레젠테이션 스타일, 컨텐츠 포맷 중 적어도 하나를 포함하는 것이 바람직하다.
레이아웃(layout)은 전술한 바와 같이 헤더, 좌측면, 우측면, 중앙, 풋더로 구분되는 영역 속성들을 포함하며, 프레젠테이션 스타일(presentation style)은 폰트 타입, 폰트 크기, 색상, 배경색, 경계선 등의 속성을 포함한다. 컨텐츠 포맷(content format)은 텍스트, 이미지, 비디오 등으로 표현되는 미디어 포맷(media format)과, 버튼, 텍스트 입력, 리스트, 라디오 버튼, 체크박스 등으로 표현되는 인터랙티브 메쏘드(interactive method), 의미 여부에 따른 구분, 하이퍼링크 연결 여부 등의 컨텐츠가 제공되는 다양한 표현 형식을 포함한다.
또한, 브라우징 엔진(10)은 복수의 내용 기반의 컴포넌트들을 유사도에 따라 대표 컴포넌트 노드에 병렬 통합 배치한다. 이때, 대표 컴포넌트 노드는 복수의 내용 기반의 컴포넌트들의 내용을 요약한 정보를 포함하며, 대표 컴포넌트 노드는 복수의 내용 기반의 컴포넌트들의 노출 정도에 대한 정보를 포함할 수 있다.
브라우징 엔진(10)은 제1 컴포넌트 또는 그룹화된 제2 컴포넌트의 프리젠테이션 우선순위를 조정한다(S240). 이를 통해 브라우징 장치에 구비된 디스플레이 화면의 크기나 특성에 따라 컨텐츠 정보의 노출 정도를 조정할 수 있다. 나아가, 브라우징 엔진(10)은, 생성된 문서 트리를 기초로 문서로부터 특정 내용의 정보를 검색 또는 추출할 수 있다.
도 8은 본 발명의 일 실시예에 따른 컴포넌트 구조를 가지는 문서 트리를 도시한 참고도이다. 도 8을 참조하면, 본 발명의 일 실시예에 따라 DOM 트리를 분할, 그룹화하여 재구성하고 속성을 부여한 문서 트리가 도시된다. C는 내용기반의 컴포넌트(제1 컴포넌트)를, B는 의미적으로 연관된 의미블록 컴포넌트(제2 컴포넌트)를, D는 도큐먼트 컴포넌트(제3 컴포넌트)를 각각 의미한다.
도 5와 도 8을 대비하여 살펴보면, DOM 트리는 사용자가 인지하는 문서 구조와는 달리 태그 중심으로 계층화된 구조를 표현하기 때문에, 여러 레벨을 거쳐야 문서의 내용(710)에 대한 접근이 가능하고, 동일 레벨의 내용이라도 DOM 트리 상에 동일 레벨에 위치하지 않는 경우가 많으며, 동일 레벨의 내용이 DOM 트리 상에 분리되어 표현되는 경우가 발생하여 브라우징 환경에 적응적으로 대처할 수 없다.
그러나, 도 8을 참조하면, 본 발명의 일 실시예에 따른 문서 트리는 내용 기 반의 컴포넌트 구조를 가지고 제1 컴포넌트, 제2 컴포넌트, 및 제 3 컴포넌트가 계층적으로 구성되면서도, 의미적으로 관계를 가지는 컴포넌트들끼리 그룹핑하여 재구성되므로 도 5에 도시된 DOM 트리에 비해 문서의 각각의 내용(C)에 대한 접근이 용이하다. 또한, 동일 레벨의 내용이 문서 트리 상에 동일 레벨에 위치하고, 각 컴포넌트 그룹별로 브라우징 환경에 맞는 속성을 부여할 수 있어, 다양한 브라우징 환경에서도 적응적인 문서의 프레젠테이션이 가능하다. 또한, 내용 기반의 컴포넌트 구조를 이용하여 특정 정보의 검색이나 추출이 매우 용이하다.
이제, 렌더링 엔진(20)은 도시된 문서 트리를 기초로 브라우징 환경에 맞게 각각의 제1 컴포넌트 또는 그룹화된 제2 컴포넌트에 부여된 속성에 따라 디스플레이 화면에 문서를 랜더링한다.
이상에서 상술한 바와 같이 본 발명의 일 실시예에 따르면, 내용 기반의 컴포넌트 구조를 가지는 문서 트리를 생성하여, 실시간으로 사용자에게 제공되는 컨텐츠와 컴포넌트를 조정할 수 있으므로, 다양한 웹 브라우징 환경에 활용할 수 있는 브라우징 장치 및 방법을 제공할 수 있다. 예를 들어, 플랫폼이나 디스플레이 장치와 같은 브라우징 환경이 달라 기존의 웹 문서를 그대로 보여줄 수 없는 경우에도, 본 발명의 일 실시예에 따른 브라우징 방법을 이용하면 웹 문서를 다시 제작하지 않고도 브라우징 환경에 적응적인 웹 문서를 프레젠테이션할 수 있다. 또한, 내용 기반의 컴포넌트간 의미적 관계를 이용하여 웹 문서를 컴포넌트별로 모델링함으로써, 개인 선호에 따라 구성을 달리하는 개인화된 웹 페이지 또는 사용자의 요 구에 따라 결과를 제시해야하는 정보 검색 등의 응용에서도 내용 중심의 보다 정확한 정보 추출 서비스를 제공할 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 브라우징 장치의 구성도,
도 2 및 도 3은 본 발명의 일 실시예에 따른 문서의 컴포넌트 구조를 도시한 참고도,
도 4는 본 발명의 일 실시예에 따른 브라우징 방법을 도시한 흐름도,
도 5는 DOM 트리 구조를 도시한 참고도,
도 6은 본 발명의 일 실시예에 따른 문서 구조를 이용한 컴포넌트 그룹핑 방법을 설명하는 참고도,
도 7은 본 발명의 일 실시예에 따른 내용기반의 컴포넌트 구조를 도시한 참고도,
도 8은 본 발명의 일 실시예에 따른 컴포넌트 구조를 가지는 문서 트리를 도시한 참고도이다.

Claims (17)

  1. 문서를 분석하여 내용 기반의 컴포넌트를 기초로 문서 트리를 생성하는 단계; 및
    상기 생성된 문서 트리를 기초로 브라우징 환경에 적응적으로 상기 문서를 프리젠테이션하는 단계를 포함하는 내용기반의 문서 브라우징 방법.
  2. 제1항에 있어서,
    상기 문서 트리를 생성하는 단계는,
    상기 내용 기반의 컴포넌트를 의미 관계에 따라 컴포넌트 그룹으로 그룹핑하는 단계; 및
    상기 컴포넌트 그룹에 대하여 브라우징 환경에 맞는 속성을 부여하는 단계를 포함하는 내용기반의 문서 브라우징 방법.
  3. 제2항에 있어서,
    상기 문서 트리를 생성하는 단계는,
    상기 브라우징 환경에 맞도록 상기 내용 기반의 컴포넌트 또는 상기 컴포넌트 그룹의 프리젠테이션 우선 순위를 조정하는 단계를 더 포함하는 내용기반의 문서 브라우징 방법.
  4. 제2항에 있어서,
    상기 문서를 프리젠테이션하는 단계는,
    상기 생성된 문서 트리를 기초로 상기 브라우징 환경에 맞게 부여된 속성에 따라 상기 문서를 랜더링하는 내용기반의 문서 브라우징 방법.
  5. 제2항에 있어서,
    상기 브라우징 환경에 맞게 부여된 속성은 레이아웃, 프레젠테이션 스타일, 컨텐츠 포맷 중 적어도 하나를 포함하는 내용 기반의 문서 브라우징 방법.
  6. 제1항에 있어서,
    상기 생성된 문서 트리를 기초로 상기 문서로부터 특정 내용의 정보를 검색 또는 추출하는 단계를 더 포함하는 내용 기반의 문서 브라우징 방법.
  7. 제2항에 있어서,
    상기 그룹핑하는 단계는,
    상기 문서 트리가 플랫(flat)한 구조를 가지도록 복수의 내용 기반의 컴포넌트들을 유사도에 따라 대표 컴포넌트 노드에 병렬 통합 배치하는 내용기반의 문서 브라우징 방법.
  8. 제7항에 있어서,
    상기 대표 컴포넌트 노드는 상기 복수의 내용 기반의 컴포넌트들의 내용을 요약한 정보를 포함하는 내용 기반의 문서 브라우징 방법.
  9. 제7항에 있어서,
    상기 대표 컴포넌트 노드는 상기 복수의 내용 기반의 컴포넌트들의 노출 정도에 대한 정보를 포함하는 내용 기반의 문서 브라우징 방법.
  10. 제2항에 있어서,
    상기 그룹핑하는 단계는,
    복수의 내용 기반의 컴포넌트들의 레이아웃 또는 반복 패턴을 이용하여 의미 관계에 있는 컴포넌트들을 컴포넌트 그룹으로 그룹핑하는 내용 기반의 문서 브라우징 방법.
  11. 문서를 분석하여 내용 기반의 컴포넌트를 기초로 문서 트리를 생성하는 브라우징 엔진; 및
    상기 생성된 문서 트리를 기초로 브라우징 환경에 적응적으로 상기 문서를 프리젠테이션하는 랜더링 엔진을 포함하는 내용 기반의 문서 브라우징 장치.
  12. 제11항에 있어서,
    상기 브라우징 엔진은,
    상기 내용 기반의 컴포넌트를 의미 관계에 따라 컴포넌트 그룹으로 그룹핑하고, 상기 컴포넌트 그룹에 대하여 브라우징 환경에 맞는 속성을 부여하는 내용기반의 문서 브라우징 장치.
  13. 제12항에 있어서,
    상기 브라우징 엔진은,
    상기 브라우징 환경에 맞도록 상기 내용 기반의 컴포넌트 또는 상기 컴포넌트 그룹의 프리젠테이션 우선 순위를 조정하는 내용기반의 문서 브라우징 장치.
  14. 제12항에 있어서,
    상기 랜더링 엔진은,
    상기 생성된 문서 트리를 기초로 상기 브라우징 환경에 맞게 부여된 속성에 따라 상기 문서를 랜더링하는 내용기반의 문서 브라우징 장치.
  15. 제11항에 있어서,
    상기 브라우징 엔진은,
    상기 생성된 문서 트리를 기초로 상기 문서로부터 특정 내용의 정보를 검색 또는 추출하는 내용 기반의 문서 브라우징 장치.
  16. 문서를 분석하여 내용 기반의 컴포넌트를 기초로 문서 트리를 생성하는 브라 우징 엔진; 및
    상기 생성된 문서 트리를 기초로 브라우징 환경에 적응적으로 상기 문서를 프리젠테이션하는 랜더링 엔진을 포함하는 내용 기반의 문서 브라우징 장치가 탑재된 모바일 단말.
  17. 문서를 분석하여 내용 기반의 컴포넌트를 기초로 문서 트리를 생성하는 브라우징 엔진; 및
    상기 생성된 문서 트리를 기초로 브라우징 환경에 적응적으로 상기 문서를 프리젠테이션하는 랜더링 엔진을 포함하는 내용 기반의 문서 브라우징 장치가 탑재된 IPTV 장치.
KR1020070127152A 2007-12-07 2007-12-07 내용 기반의 문서 브라우징 방법 및 장치 KR20090060022A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020070127152A KR20090060022A (ko) 2007-12-07 2007-12-07 내용 기반의 문서 브라우징 방법 및 장치
US12/081,406 US20090150759A1 (en) 2007-12-07 2008-04-15 Method and apparatus for browsing content-based documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070127152A KR20090060022A (ko) 2007-12-07 2007-12-07 내용 기반의 문서 브라우징 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20090060022A true KR20090060022A (ko) 2009-06-11

Family

ID=40722945

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070127152A KR20090060022A (ko) 2007-12-07 2007-12-07 내용 기반의 문서 브라우징 방법 및 장치

Country Status (2)

Country Link
US (1) US20090150759A1 (ko)
KR (1) KR20090060022A (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5669460B2 (ja) * 2010-06-30 2015-02-12 キヤノン株式会社 情報処理装置、情報処理システム、情報処理装置の制御方法及びプログラム
WO2013097136A1 (en) * 2011-12-29 2013-07-04 Intel Corporation Service in support of browser for multi-media content
CN110020311B (zh) * 2017-12-05 2023-03-28 中兴通讯股份有限公司 网页显示方法、浏览器、终端和计算机可读存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6941509B2 (en) * 2001-04-27 2005-09-06 International Business Machines Corporation Editing HTML DOM elements in web browsers with non-visual capabilities
US20030065614A1 (en) * 2001-10-01 2003-04-03 Sweeney Joan M. Method and system for rules based underwriting
US7429987B2 (en) * 2003-09-19 2008-09-30 International Business Machines Corporation Intelligent positioning of items in a tree map visualization
GB2407676A (en) * 2003-10-31 2005-05-04 Hewlett Packard Development Co Flexible layout when flowing XSL-FO content into PPML copy holes
GB2407677A (en) * 2003-10-31 2005-05-04 Hewlett Packard Development Co Post-rendering document space based on rules
US20060123042A1 (en) * 2004-12-07 2006-06-08 Micrsoft Corporation Block importance analysis to enhance browsing of web page search results
US8108765B2 (en) * 2006-10-11 2012-01-31 International Business Machines Corporation Identifying and annotating shared hierarchical markup document trees

Also Published As

Publication number Publication date
US20090150759A1 (en) 2009-06-11

Similar Documents

Publication Publication Date Title
US20180203832A1 (en) Systems and methods for automated content generation
US20180365332A1 (en) Methods and apparatuses to assemble, extract and deploy content from electronic documents
US9569541B2 (en) Evaluating preferences of content on a webpage
US9135341B2 (en) Method and arrangement for paginating and previewing XHTML/HTML formatted information content
Sharda et al. Tourism blog visualizer for better tour planning
US8051371B2 (en) Document analysis system and document adaptation system
US11803582B2 (en) Methods and apparatuses for content preparation and/or selection
Khalili et al. The rdfa content editor-from wysiwyg to wysiwym
US20090077056A1 (en) Customization of search results
US20130339840A1 (en) System and method for logical chunking and restructuring websites
Ahmadi et al. User-centric adaptation of Web information for small screens
CN110799971A (zh) 媒体内容的生成和呈现
Mauro et al. Faceted search of heterogeneous geographic information for dynamic map projection
Paliouras et al. PNS: A personalized news aggregator on the web
US10157222B2 (en) Methods and apparatuses for content preparation and/or selection
KR20090060022A (ko) 내용 기반의 문서 브라우징 방법 및 장치
KR102088619B1 (ko) 검색 결과별 가변적 사용자 인터페이스 제공 시스템 및 방법
Chen et al. Enhancing the precision of content analysis in content adaptation using entropy-based fuzzy reasoning
Huang et al. Web content adaptation for mobile device: A fuzzy-based approach
JP7323484B2 (ja) 情報処理装置、情報処理方法、及びプログラム
Xie et al. An adaptive web page layout structure for small devices
Kim et al. An adaptation system based on personalized web content items for mobile devices
Oinas-Kukkonen et al. Requirements for Web engineering methodologies
Jou Automatic web table transcoding for mobile devices based on table classification
Morel A Better Mobile Browsing Experience Through Pattern Recognition and Dynamic Restructuring of Web Pages

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application