KR20130099700A - 웹페이지 구성방법 및 그 장치 - Google Patents

웹페이지 구성방법 및 그 장치 Download PDF

Info

Publication number
KR20130099700A
KR20130099700A KR1020120021400A KR20120021400A KR20130099700A KR 20130099700 A KR20130099700 A KR 20130099700A KR 1020120021400 A KR1020120021400 A KR 1020120021400A KR 20120021400 A KR20120021400 A KR 20120021400A KR 20130099700 A KR20130099700 A KR 20130099700A
Authority
KR
South Korea
Prior art keywords
paragraph
node
web page
important
web
Prior art date
Application number
KR1020120021400A
Other languages
English (en)
Other versions
KR101340588B1 (ko
Inventor
임오섭
김태용
조민제
Original Assignee
주식회사 팬택
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 팬택 filed Critical 주식회사 팬택
Priority to KR1020120021400A priority Critical patent/KR101340588B1/ko
Priority to US13/728,436 priority patent/US20130227391A1/en
Publication of KR20130099700A publication Critical patent/KR20130099700A/ko
Application granted granted Critical
Publication of KR101340588B1 publication Critical patent/KR101340588B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

웹페이지 구성방법 및 그 장치가 개시된다. 본 발명의 일 실시예에 따른 웹페이지 구성방법은 웹페이지의 텍스트(text) 기반 웹페이지 요소인 상기 메인 요소(main element)를 로드하는 단계와, 웹페이지의 로드된 메인 요소를 분석하여 웹페이지 단락(paragraph)들 중에서 중요단락(main paragraph)을 판단하는 단계와, 중요단락 판단 후, 웹페이지의 비(非) 텍스트 기반 웹페이지 요소인 부가 요소(sub element)가 상기 중요단락에 포함되는지 판단하는 단계 및 상기 부가 요소가 중요단락에 포함되는 경우, 로드된 메인 요소와 중요단락에 포함된 부가 요소를 렌더링하여 표시하는 단계를 포함한다.

Description

웹페이지 구성방법 및 그 장치 {Method and apparatus for comprising webpage}
본 발명은 인터넷 서비스 기술에 관한 것으로, 보다 상세하게는 브라우저를 통해 웹페이지를 제공하는 기술에 관한 것이다.
일반적인 브라우저는 웹페이지의 모든 구성요소를 로드 및 렌더링하여 이를 화면에 표시한다. 예를 들면, 사용자가 관심 있어 하는 뉴스 기사나 블로그 등의 메인 요소뿐만 아니라, 광고나 치장을 위한 이미지, 오디오 또는 비디오 형식의 컨텐트를 포함하는 부가 요소까지도 표시한다. 이 경우, 웹페이지 내 중요 컨텐트와 연관이 없는 부가 요소까지 로드 및 렌더링해야 하므로, 데이터 네트워크 및 렌더링을 위한 시스템 리소스 사용으로 인해 시스템 성능이 저하될 수 있다. 나아가, 자연스레 사용자는 불필요한 부가 요소 때문에 신속하게 웹페이지를 볼 수 없게 되어 이용에 불편함을 느낄 수 있다.
종래 기술의 경우, 웹페이지 내 모든 부가 요소, 예를 들면 멀티미디어 컨텐트가 로드되지 않도록 하는 사용자 설정기능이 제안되었다. 그러나 해당 기능에 따르면 사용자의 의도와는 다르게, 웹페이지 내에 있는 모든 멀티미디어 컨텐트를 로드 및 렌더링 대상에서 제외시키게 된다. 이 경우, 사용자는 메인 요소 내의 포함된 컨텐트까지 볼 수 없게 되며, 사용자는 제외된 컨텐트를 확인하기 위해 설정을 변경하고 해당 웹페이지를 다시 로드해야 하는 불편함이 따른다.
나아가, 디바이스가 스마트폰 등 작은 화면을 갖는 경우에는 웹페이지가 화면에 표시될 때 디바이스의 디스플레이의 크기는 제약됨에 반하여, 웹페이지에서 표시될 컨텐트가 많게 되어 디바이스 사용자는 웹페이지를 보는 것에 불편함이 느낄 수 있다.
본 발명은 사용자에게 필요한 구성만을 포함하도록 최적화된 웹페이지를 제공하기 위한 웹페이지 구성방법 및 그 장치를 제안한다.
일 양상에 따른 웹페이지 구성방법은, 웹페이지의 텍스트(text) 기반 웹페이지 요소인 상기 메인 요소를 로드하는 단계와, 상기 웹페이지의 로드된 메인 요소를 분석하여 웹페이지 단락(paragraph)들 중에서 중요단락(main paragraph)을 판단하는 단계와, 상기 중요단락 판단 후, 상기 웹페이지의 비(非) 텍스트 기반 웹페이지 요소인 상기 부가 요소가 상기 중요단락에 포함되는지 판단하는 단계 및 상기 부가 요소가 상기 중요단락에 포함되는 경우, 상기 로드된 메인 요소와 상기 중요단락에 포함된 부가 요소를 렌더링하여 표시하는 단계를 포함한다.
이때, 상기 메인 요소는 하이퍼텍스트 마크업 언어(Hyper Text Markup Language), 캐스케이딩 스타일 시트(cascading style sheet), 자바 스크립트(java script) 중 적어도 하나를 포함하며, 상기 부가 요소는 이미지, 오디오 또는 비디오 형식의 컨텐트 중 적어도 하나를 포함할 수 있다.
상기 중요단락을 판단하는 단계는, 상기 메인 요소가 제공하는 노드들 중에서 단락을 구분하는 노드를 검색하는 단계, 및 상기 검색된 단락을 구분하는 노드에 해당하는 웹페이지 단락을 중요단락으로 판단하는 단계를 포함할 수 있다.
상기 메인 요소가 제공하는 노드들 중에서 단락을 구분하는 노드를 검색하는 단계는, 상기 메인 요소가 제공하는 노드들을 구조화한 노드트리를 이용하여 상기 노드트리 중에서 단락을 구분하는 노드를 검색할 수 있다. 이때, 노드트리 중 단락을 구분하는 노드는, 자료(article) 태그 노드일 수 있다. 또는 노드트리 중 단락을 구분하는 노드는, 디아이브이(div) 태그 또는 테이블(table) 태그 노드의 아이디(id) 또는 클래스(class) 속성값에 자료 문자열을 포함하는 노드일 수 있다.
상기 중요단락을 판단하는 단계는, 사용자가 이전 웹페이지의 링크를 통해 현재 웹페이지에 접속한 경우, 상기 메인 요소가 제공하는 노드들 중에서 상기 링크의 텍스트와 동일한 문자열을 갖는 노드를 검색하고, 상기 검색된 노드를 포함하는 최상위 노드에 해당하는 웹페이지 단락을 중요단락으로 판단할 수 있다.
상기 중요단락을 판단하는 단계는, 미리 저장된 중요단락 정보를 이용하여, 상기 메인 요소가 제공하는 노드들 중에서 중요단락 정보에 포함된 노드정보와 연관된 노드가 있는지를 검색하여 연관된 노드에 해당하는 웹페이지 단락을 중요단락으로 판단할 수 있다.
나아가, 부가 요소가 상기 중요단락에 포함되지 않는 경우, 상기 로드된 메인 요소를 렌더링하여 표시하는 단계를 더 포함할 수 있다.
나아가, 부가 요소가 상기 중요단락에 포함되지 않은 경우 부가 요소를 대체하는 대체 요소를 로드하는 단계를 더 포함할 수 있다.
상기 부가 요소만 렌더링하여 표시하는 단계는, 상기 부가 요소를 대체하는 대체 요소를 렌더링하되, 대체 요소별로 대체 요소가 제공하는 태그 노드의 색상 속성값을 달리하거나 명도 속성값을 달리하여 대체 요소를 렌더링할 수 있다.
다른 양상에 따른 웹페이지 구성장치는, 웹페이지의 텍스트(text) 기반 웹페이지 요소인 메인 요소와 상기 웹페이지의 비(非) 텍스트 기반 웹페이지 요소인 부가 요소를 로드하는 웹 요소 로더부와, 상기 웹페이지의 로드된 메인 요소를 분석하여 웹페이지 단락(paragraph)들 중에 중요단락(main paragraph)을 판단하고, 상기 웹페이지의 부가 요소가 중요단락에 포함되는지를 판단하는 웹 요소 분석부 및 상기 부가 요소가 상기 중요단락에 포함되는 경우, 상기 웹 요소 로더부를 통해 로드된 메인 요소와 중요단락에 포함된 부가 요소를 렌더링하는 웹 요소 렌더링부를 포함한다.
상기 웹 요소 로더부는, 상기 웹페이지의 메인 요소가 로드된 후, 상기 웹페이지의 부가 요소가 중요단락에 포함되는지를 판단한 다음, 상기 부가 요소를 로드할 수 있다.
상기 웹 요소 분석부는, 상기 메인 요소가 제공하는 노드들 중에서 단락을 구분하는 노드를 검색하고, 검색된 단락을 구분하는 노드에 해당하는 웹페이지 단락을 중요단락으로 판단할 수 있다. 이때, 웹 요소 분석부는, 상기 메인 요소가 제공하는 노드들을 구조화한 노드트리 중에서 단락을 구분하는 노드인 자료(article) 태그 노드를 검색할 수 있다. 또는 상기 웹 요소 분석부는, 상기 메인 요소가 제공하는 노드들을 구조화한 노드트리 중에서 단락을 구분하는 노드인 디아이브이(div) 태그 또는 테이블(table) 태그 노드의 아이디(id) 또는 클래스(class) 속성값에 자료 문자열을 포함하는 노드를 검색할 수 있다.
상기 웹 요소 분석부는, 사용자가 이전 웹페이지의 링크를 통해 현재 웹페이지에 접속한 경우, 상기 메인 요소가 제공하는 노드들 중에서 상기 링크의 텍스트와 동일한 문자열을 갖는 노드를 검색하고, 상기 검색된 노드를 포함하는 최상위 노드에 해당하는 웹페이지 단락을 중요단락으로 판단할 수 있다.
나아가, 중요단락에 대한 정보를 저장하는 중요단락 정보 저장부를 더 포함할 수 있으며, 상기 웹 요소 분석부는, 상기 중요단락 정보 저장부에 저장된 중요단락 정보를 이용하여, 상기 메인 요소가 제공하는 노드들 중에서 중요단락 정보와 연관된 노드가 있는지를 검색하여 연관된 노드에 해당하는 웹페이지 단락을 중요단락으로 판단할 수 있다.
나아가, 부가 요소를 대체하는 대체 요소를 저장하는 대체 요소 저장부를 더 포함할 수 있으며, 상기 대체 요소 저장부는, 추가로 로드하려는 부가 요소가 상기 중요단락에 포함되는지를 판단하여, 부가 요소 대신에 중요단락에 포함되지 않은 경우 상기 대체 요소 저장부에 저장된 대체 요소를 로드할 수 있다.
일 실시예에 따르면, 이미지, 오디오 또는 비디오 형식의 컨텐트 등 대부분 웹페이지 상에서 광고나 치장을 위한 요소인 부가 요소를 웹페이지 구성에서 제외함에 따라, 웹페이지 제공시간을 최소화하여 사용자에게 빠르게 웹페이지를 제공할 수 있다. 즉, 불필요한 부가 요소를 웹페이지 상에 표시하지 않도록 하여, 데이터 네트워크 사용량과 시스템 리소스를 최소화하여, 신속하게 데이터를 제공할 수 있으며, 사용자는 광고나 치장을 위한 부가 요소를 볼 필요 없이 사용자가 보기를 원하는 데이터만을 이용할 수 있다.
나아가, 웹페이지의 불필요한 부가 요소는 제한하되, 모든 부가 요소를 제한하는 게 아니라 꼭 필요한 부가 요소, 예를 들면 뉴스 기사나 블로그 등에 연관된 멀티미디어 컨텐트는 화면에 표시되도록 로드 및 렌더링함에 따라, 사용자가 보고 싶어하거나, 관심 있어 할 가능성이 있는 부가 요소까지도 사용자가 보지 못하도록 차단해버리는 문제를 해결할 수 있다.
나아가, 데이터 네트워크를 이용하여 웹페이지의 모든 구성요소를 표시하는 경우, 다량의 데이터 네트워크 리소스 사용 및 로드 시간이 요구되나, 본 발명에 따르면, 불필요한 리소스 사용 및 로드 시간을 절약하여 해당 웹페이지를 보다 빠르게 로드할 수 있다. 이러한 이득은 특히 사업자 망을 이용하여 데이터 네트워크를 연결한 경우 그 효과가 매우 크다. 데이터 네트워크 제공자의 경우도 본 발명을 적용한 브라우저가 데이터 네트워크에 연결된 경우 불필요한 데이터 네트워크 사용을 줄일 수 있다. 나아가, 부가 요소 중 중요한 부가 요소만을 렌더링함에 따라, 렌더링 속도를 향상시켜 불필요한 구성 요소의 렌더링에 요구되는 배터리 사용을 줄일 수 있다.
도 1은 본 발명의 일 실시예에 따른 웹페이지 제공 시스템의 구성도,
도 2는 본 발명의 일 실시예에 따른 웹페이지 구성장치의 구성도,
도 3은 본 발명의 일 실시예에 따라 웹페이지 구성장치의 중요단락 구분을 통한 웹 요소 로드 및 렌더링 최적화 프로세스를 도시한 흐름도,
도 4는 본 발명의 제1 실시예에 따른 중요단락 추출방법을 도시한 흐름도,
도 5는 도 4의 중요단락 추출을 위한 웹 소스 코드와 웹 소스 코드에 대응되는 웹페이지 화면을 도시한 참조도,
도 6은 본 발명의 제2 실시예에 따른 중요단락 추출방법을 도시한 흐름도,
도 7은 도 6의 중요단락 추출을 위한 웹 소스 코드와 웹 소스 코드에 대응되는 웹페이지 화면을 도시한 참조도,
도 8은 본 발명의 제3 실시예에 따른 중요단락 추출방법을 도시한 흐름도,
도 9 및 도 10은 도 8의 중요단락 추출 프로세스 시 표시되는 웹페이지 화면과 그 웹 소스 코드를 도시한 참조도,
도 11은 본 발명의 제4 실시예에 따른 중요단락 추출방법을 도시한 흐름도,
도 12는 도 11의 중요단락 추출 실시예를 위한 웹페이지 화면과 중요단락 정보 저장부를 도시한 참조도,
도 13은 본 발명의 추가 실시예에 따른 중요단락 추출방법을 도시한 흐름도,
도 14는 본 발명의 중요단락 구분을 통한 웹 요소 로드 및 렌더링 최적화를 위한 웹페이지 구성장치와 사용자 간의 인터렉션을 보여주는 웹페이지 화면을 도시한 참조도,
도 15는 본 발명의 일 실시예에 따라 중요단락에 포함되지 않는 부가 요소를 대체하는 대체 요소를 웹페이지 화면에 표시하는 프로세스를 도시한 참조도,
도 16은 본 발명의 일 실시예에 따라 사용자가 선택한 중요단락에 대한 중요단락 정보를 저장하는 프로세스를 도시한 흐름도,
도 17은 도 16의 사용자가 선택한 중요단락에 대한 중요단락 정보를 저장하기 위한 웹페이지 구성장치와 사용자 간의 인터렉션을 보여주는 웹페이지 화면을 도시한 참조도,
도 18은 본 발명의 일 실시예에 따라 로드 및 렌더링에 포함되지 않은 단락의 부가 요소를 다시 불러오기 위한 프로세스를 도시한 흐름도이다.
이하에서는 첨부한 도면을 참조하여 본 발명의 실시예들을 상세히 설명한다. 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 웹페이지 제공 시스템의 구성도이다.
도 1을 참조하면, 웹페이지 제공 시스템은 웹페이지 구성장치(1), 웹 서버(2) 및 인터넷 망(3)을 포함한다.
웹 서버(2)는 인터넷 망(3)을 통해 웹 서버(2)에 저장된 웹페이지를 웹페이지 구성장치(1)에 제공한다. 웹페이지는 월드 와이드 웹(WWW) 상에 있는 개개의 문서를 가리킨다. 대부분의 웹 페이지는 메인 요소(main element)와 부가 요소(sub element)로 구성된다. 메인 요소는 웹페이지의 텍스트(text) 기반 웹페이지 요소이다. 예를 들면, 메인 요소는 하이퍼텍스트 마크업 언어(Hyper Text Markup Language: 이하 'HTML'이라 칭함), 캐스케이딩 스타일 시트(cascading style sheet: CSS), 자바 스크립트(java script)이다. 메인 요소는 당업자에 있어서 소스 요소(source element)라고 불릴 수도 있다. 부가 요소는 비(非) 텍스트 기반 웹페이지 요소이다. 예를 들면 부가 요소는 이미지, 오디오 또는 비디오 형식의 컨텐트이다. 부가 요소는 대부분 웹페이지 상에서 광고나 치장을 위한 요소에 해당된다. 본 발명은 이러한 부가 요소를 웹페이지 상에 표시하지 않도록 웹페이지 구성을 최적화하여, 불필요한 데이터 네트워크 사용을 방지하고 시스템 리소스 사용을 최소화하여 웹페이지가 화면에 표시되기까지의 시간을 최소화하고자 한다.
웹페이지 구성장치(1)는 웹페이지를 읽을 수 있는 브라우저(browser)를 탑재하여 인터넷 망(3)을 통해 웹 서버(2)로부터 웹페이지를 전송받을 수 있는 모든 기기를 통칭한다. 브라우저는 사용자가 인터넷 망(3)을 통해 제공되는 웹페이지를 볼 수 있도록 해주는 응용 프로그램으로서, 웹 서버(2)로부터 웹페이지를 제공받아 처리하기 위한 클라이언트 프로그램이다. 이하, 도 2를 통해 웹페이지 구성장치(1)의 세부구성에 대해 후술한다.
도 2는 본 발명의 일 실시예에 따른 웹페이지 구성장치(1)의 구성도이다.
도 2를 참조하면, 웹페이지 구성장치(1)는 제어부(10), 네트워크 연결부(12), 입력부(14), 표시부(16) 및 저장부(19)를 포함한다.
도 2에 도시된 웹페이지 구성장치(1)의 구성은 본 발명의 실시예를 설명하기 위하여 필요한 구성 요소만을 개략적으로 도시한 것이다. 따라서 웹페이지 구성장치(1)의 동작을 위하여 필수적인 다른 기능을 수행하기 위한 구성 요소들이 추가로 웹페이지 구성장치(1)에 포함될 수도 있다. 이때, 추가되는 구성 요소들은 사용자 단말(1)의 종류나 기능 등에 따라서 달라질 수 있다.
네트워크 연결부(12)는 인터넷 망(3)을 통해 웹페이지를 웹 서버(2)에 요청하여 이를 제공받는다.
제어부(10)는 네트워크 연결부(12)로부터 전달받은 웹페이지를 로드하고, 로드된 웹페이지를 분석하며, 분석결과에 따라 웹페이지를 렌더링한 후 렌더링 결과를 표시부(16)를 통해 화면에 표시한다. 본 발명에 따른 제어부(10)는 화면에 표시되는 웹페이지 내 중요단락을 구분하여 중요단락만을 화면에 표시되도록 웹페이지 요소를 선택적으로 로드 및 렌더링하는데, 이런 일련의 프로세스를 웹페이지 최적화라고 명한다.
일 실시예에 따르면, 제어부(10)는 웹 요소 로더부(100), 웹 요소 분석부(110) 및 웹 요소 렌더링부(120)를 포함하며, 웹 요소 분석부(110)는 중요단락 판단부(112)를 포함한다.
웹 요소 로더부(100)는 네트워크 연결부(12)로부터 전달받은 웹 요소를 웹 요소 분석부(110)에 제공한다. 본 발명에 따르면, 웹 요소 로더부(100)는 네트워크 연결부(12)로부터 메인 요소와 부가 요소를 각각 전송받아 로드하는데, 메인 요소를 우선적으로 로드한 후 부가 요소를 로드할 수 있다. 이때, 부가 요소 중 중요단락에 포함된 부가 요소만을 로드할 수 있다.
웹 요소 분석부(110)는 웹 요소 로더부(100)로부터 전달받은 웹 요소를 분석하여, 분석한 웹 요소를 화면에 표시하기 위해 웹 요소 렌더링부(120)로 분석결과를 전달한다. 일 실시예에 따르면, 웹 요소 분석부(110)는 웹 요소 중 하나인 메인 요소를 분석하여 메인 요소를 구성하는 노드들을 노드들 간 연결관계를 이용하여 구조화한다. 웹 문서는 웹 문서를 기술하는 객체들로 이루어지는데, 각 객체들을 노드라 명하며, 노드들은 각각 연결고리를 통해 구조화된다. 구조화된 노드들을 문서객체모델(Document Object Model: 이하 'DOM'이라 칭함) 노드트리(Node Tree)라고 명한다. 웹페이지는 DOM 노드트리로 분석될 수 있는데, 브라우저는 분석된 DOM 노드트리의 노드들 중 소정의 노드들을 검색하고 그 노드의 이름, 노드의 값 등과 같은 속성에 접근할 수 있다. DOM은 HTML 등의 문서의 논리구조에 접근하기 위한 API이다. 프로그래머는 DOM API를 이용하여 HTML 등의 문서를 제작할 수 있고, 문서의 구성요소와 내용을 조정, 추가, 수정 삭제할 수도 있다.
웹 요소 분석부(110)의 중요단락 판단부(112)는 화면에 표시되는 웹페이지를 구성하는 단락들 중에서 중요단락을 판단하여, 중요단락과 그렇지 않은 단락을 구분한다. 이때, 중요단락에 포함되지 않는 부가 요소는 로드 및 렌더링 대상에서 제외되거나, 해당 부가 요소가 대체 요소로 대체될 수 있다. 이에 따라, 웹페이지의 전체적인 레이아웃을 크게 훼손하지 않으면서 중요단락 내에 포함되는 부가 요소인 컨텐트를 신속하게 로드 및 렌더링하여 사용자에게 제공할 수 있다.
웹페이지의 모든 부가 요소, 예를 들면 모든 멀티미디어 컨텐트가 로드되지 않는 경우, 로드된 웹페이지의 중요단락에 포함된 멀티미디어 컨텐트도 로드되지 않게 된다. 그러면 사용자가 제외된 컨텐트를 확인하기 위해 설정을 변경하고 해당 웹페이지를 다시 로드해야 하는 불편함이 따른다. 그러나, 본 발명의 중요단락 판단부(112)는 웹페이지 내에서 중요단락을 판단하고, 중요단락에 포함되는 부가 요소를 로드 및 렌더링 대상에 포함시킴에 따라, 최적화된 웹페이지를 사용자에게 제공할 수 있다.
웹 요소 렌더링부(120)는 웹 요소 로더부(100)를 통해 로드되고, 웹 요소 분석부(110)에서 분석된 웹 요소를 표시부(16)에 표시될 웹페이지로 가공한다. 이때, 웹 요소들의 화면 위치와 크기 등의 정보를 이용하여 표시부(16)에 표시될 웹페이지 화면을 구성할 수 있다. 표시부(16)는 웹 요소 렌더링부(120)에서 렌더링된 웹페이지를 전달받아 이를 화면에 표시한다. 입력부(14)는 키패드, 터치 등의 사용자 이벤트를 입력받는다.
저장부(19)는 중요단락 정보 저장부(17)와 대체요소 저장부(18)를 포함한다. 중요단락 정보 저장부(17)는 사용자가 미리 웹페이지의 중요단락을 선택한 경우, 선택된 중요단락에 대한 정보를 저장한다. 중요단락 정보에는 웹사이트 주소, 중요단락 태그, 태그 위치, 태그 아이디 등을 포함한다. 중요단락 정보는 중요단락 판단부(112)의 중요단락 판단을 위한 기준이 될 수 있다. 즉, 중요단락 판단부(112)는 중요단락 정보 저장부(17)에 저장된 중요단락 정보를 이용하여, 현재 웹페이지 단락으로 구분되는 노드들 중에서 중요단락 노드를 정확히 검색할 수 있다.
대체요소 저장부(18)는 중요단락 판단부(112)에서 중요단락에 포함되지 않는 부가 요소를 대체할 대체 부가 요소를 저장한다. 사용자는 대체 요소에 저장된 대체 부가 요소를 사용자가 원하는 형태로 수정 또는 저장할 수 있다.
도 3은 본 발명의 일 실시예에 따라 웹페이지 구성장치(1)의 중요단락 구분을 통한 웹 요소 로드 및 렌더링 최적화 프로세스를 도시한 흐름도이다.
우선, 웹페이지 구성장치(1)는 웹페이지의 메인 요소를 웹 서버(2)로부터 로드한다(300). 이어서, 로드된 메인 요소를 분석하여 웹페이지를 구성하는 단락들 중에 중요단락을 판단한다(310). 중요단락으로 판단된 단락과 그렇지 않은 단락의 자식 노드는 각각 구분되어 로드 및 렌더링된다. 중요단락 판단 실시예들은 도 4 내지 도 13에서 후술한다.
이어서, 웹페이지 구성장치(1)는 웹페이지의 부가 요소가 중요단락에 포함되는지 여부를 판단한다(320).
일 실시예에 따르면 전술한 웹페이지의 부가 요소가 중요단락에 포함되는지 여부를 판단한 결과에 따라, 중요단락에 포함되는 경우 중요단락에 포함된 부가 요소를 로드한다(340). 이에 비해, 중요단락에 포함되지 않는 경우 포함되지 않는 부가 요소를 처리한다(350). 예를 들면, 중요 단락에 포함되지 않는 부가 요소는 로드 및 렌더링 대상에서 제외한다. 이를 위해, 부가 요소를 렌더링에 포함하지 않는 속성값을 정의하여 부가 요소를 로드 및 렌더링 대상에서 제외할 수 있다. 예를 들면 이미지를 삽입하는 태그에 해당하는 HTML <img> 태그의 경우 'src' 속성을 변경하여 이와 같은 효과를 낼 수 있다.
다른 예로, 중요단락에 포함되지 않는 부가 요소 대신에 부가 요소를 대체하는 대체 요소를 로드할 수 있다. 즉, 중요단락에 포함되지 않는 부가 요소들의 각 노드의 소스의 위치를 지정하는 속성값을 대체 요소 저장부(18)의 대체 요소의 위치와 교환하여, 대체 요소를 로드할 수도 있다. 이에 대한 실시예는 도 15에서 후술한다.
또 다른 예로, 사용자가 웹페이지를 열었을 때 웹페이지의 부가 요소가 중요단락에 포함되는지 여부를 판단만 하고, 판단한 결과에 따라 중요단락 정보를 저장하고 있다가, 추후 사용자가 해당 웹페이지에 대해 불필요한 컨텐트와 같은 부가 요소가 표시되는 것을 원치 않을 경우 사용자로부터 해당 명령이 입력되면 기저장된 중요단락 정보를 이용하여 해당하는 부가 요소를 로드 및 렌더링 대상에서 제외하거나, 부가 요소를 대체하는 대체 요소를 로드한다.
이어서, 웹페이지 구성장치(1)는 로드된 웹 요소를 렌더링하고 렌더링 결과를 화면에 표시한다(360).
도 4는 본 발명의 제1 실시예에 따른 중요단락 추출방법을 도시한 흐름도이다.
중요단락 판단부(112)는 웹페이지를 구성하는 노드들이 구조화된 DOM 노드트리에서 <article> 태그 노드를 검색한다(400). 이때, DOM 노드트리의 노드들 중에 노드의 이름이 <article>인 노드를 검색할 수 있다. <article> 태그 노드가 검색되면 해당 노드를 중요단락 노드로 판단한다(410). 중요단락 구분을 위한 <article> 태그 노드가 없다면, 후술되는 도 6, 도 8 및 도 11의 중요단락 판단 프로세스를 추가로 실시할 수 있다.
<article> 태그는 HTML5에서 새로 제안된 요소 중 하나이다. HTML5는 웹 문서를 만들기 위한 기본 프로그래밍 언어인 HTML의 최신규격이다. HTML5 이전 버전의 HTML에서는 레이아웃의 구조를 상세하게 기술하는 요소가 부족했다. 예를 들면, <div>를 사용하고 class를 나누었었기 때문에 구조가 복잡하다. 이런 부분들을 해결하기 위해 HTML5는 <article> 등의 새로운 요소를 이용하여 웹 문서를 논리적으로 구분하고자 한다. <article>은 HTML 문서 내의 뉴스 기사나 블로그 글 같은 독립적인 컨텐트 단위를 표시할 때 사용되는 요소이다.
도 5는 도 4의 중요단락 추출을 위한 웹 소스 코드와 웹 소스 코드에 대응되는 웹페이지 화면을 도시한 참조도이다.
도 5를 참조하면, 참조부호 5010과 같이 HTML 소스 코드(5000)에서 <article> 태그로 단락을 표현하고 있는 경우, 중요단락 판단부(112)는 DOM 노드트리에서 <article> 태그 노드를 중요단락 노드로 판단한다. <article> 태그 노드에 대응되는 웹페이지 중요단락은 웹페이지(5020)에서 참조부호 5030과 같이 화면에 표시된다. 중요단락은 텍스트 여부에 상관없이 모든 데이터가 화면에 표시된다. 예를 들면, 텍스트 형식의 기사와, 기사와 관련된 부가 요소인 이미지 컨텐트가 모두 화면에 표시된다.
도 6은 본 발명의 제2 실시예에 따른 중요단락 추출방법을 도시한 흐름도이다.
중요단락 판단부(112)는 웹페이지를 구성하는 노드들을 구조화한 DOM 노드트리에서 <div> 또는 <table> 태그 노드 중 id 나 class 속성값에 "article" 문자열을 포함하는 단락 노드를 검색한다(600). 이때, 문자열 비교를 통해 "article" 문자열이 있는지를 검색한다. id 나 class 속성값에 "article" 문자열을 포함하는 <div> 또는 <table> 태그 노드가 검색되면 해당 노드를 중요단락 노드로 판단한다(610). 전술한 <div> 또는 <table> 태그 노드가 없다면, 전술한 도 4와 후술되는 도 8 및 도 11의 중요단락 판단 프로세스를 추가로 실시할 수 있다.
도 7은 도 6의 중요단락 추출을 위한 웹 소스 코드와 웹 소스 코드에 대응되는 웹페이지 화면을 도시한 참조도이다.
도 7을 참조하면, 참조부호 7010과 같이 HTML 소스 코드(7000)에서 <div> 또는 <table> 태그의 id 나 class 속성값에 "article" 문자열을 포함하고 있는 경우, 중요단락 판단부(112)는 DOM 노드트리에서 해당하는 <div> 또는 <table> 태그 노드를 중요단락 노드로 판단한다. id 나 class 속성값에 "article" 문자열을 포함하는 <div> 또는 <table> 태그 노드에 대응되는 웹페이지 중요단락은 웹페이지(7020)에서 참조부호 7030과 같이 화면에 표시된다. 중요단락은 텍스트 여부에 상관없이 모든 데이터가 화면에 표시된다. 예를 들면, 텍스트 형식의 기사와, 기사와 관련된 이미지 컨텐트가 모두 화면에 표시된다.
도 8은 본 발명의 제3 실시예에 따른 중요단락 추출방법을 도시한 흐름도이다.
일 실시예에 따르면, 중요단락 판단부(112)는 현재 웹페이지가 이전 웹페이지에서 링크를 통해 열린 페이지인지 확인한다. 확인한 결과에 따라, 사용자가 이전 웹페이지의 링크를 통해 현재 웹페이지에 접속한 경우, 중요단락 판단부(112)는 DOM 노드트리에서 이전 웹페이지 링크의 텍스트와 동일한 문자열을 갖는 노드를 검색한다(800). 예를 들면, 현재 웹페이지의 DOM 노드트리에서 이전 웹페이지 링크의 제목 문자열을 포함하는 노드가 있는지 문자열을 검색한다. 이어서, 검색된 노드를 포함하는 최상위 노드에 해당하는 웹페이지 단락을 중요단락으로 판단한다(810). 예를 들면, 검색된 노드가 특정 뉴스의 제목에 해당하는 노드인 경우, 해당 뉴스의 제목뿐만 아니라 해당 뉴스의 내용에 해당하는 노드를 모두 포함한 최상위 노드에 해당하는 웹페이지 단락을 중요단락으로 판단한다.
도 9 및 도 10은 도 8의 중요단락 추출 프로세스 시 표시되는 웹페이지 화면과 그 웹 소스 코드를 도시한 참조도이다.
도 9는 현재 웹페이지(9020)가 이전 웹페이지(9000)에서 사용자가 선택한 링크(9010)를 통해 열린 페이지인 경우 중요단락 추출 프로세스에 따른 웹페이지 화면을 도시한 것이다. 도 9의 예에서 사용자가 이전 웹페이지(9000)에서 선택한 링크(9010)는 텍스트 "Fitch keeps credit rating"을 포함한다. 참조부호 9030은 이전 웹페이지 링크(9010)의 텍스트 "Fitch keeps credit rating"와 동일한 문자열을 갖는 태그 노드에 해당하는 웹페이지 단락을 화면에 표시한 것이고, 참조부호 9040은 이전 웹페이지 링크(9010)의 텍스트 "Fitch keeps credit rating"와 동일한 문자열을 갖는 태그 노드를 포함하는 최상위 노드에 해당하는 웹페이지 단락을 표시한 것이다. 도 10은 HTML 소스 코드(1000)에서, 사용자가 선택한 링크의 제목, 예를 들면 "Fitch keeps credit rating"과 동일한 스트링을 갖는 태그(1010)를 도시한 것이다.
도 11은 본 발명의 제4 실시예에 따른 중요단락 추출방법을 도시한 흐름도이다.
일 실시예에 따라, 중요단락 판단부(112)는 중요단락 정보 저장부(17)에 저장된 중요단락 정보를 이용하여 중요단락을 추출한다. 이를 위해 사용자가 웹페이지의 중요단락을 선택하면 중요단락 정보가 중요단락 정보 저장부(17)에 저장되는 프로세스가 미리 수행된다. 중요단락 정보는 웹사이트의 주소와 중요단락 노드 정보를 포함한다. 중요단락 노드 정보는 중요단락 태그의 이름, 태그 위치 및 태그 아이디를 포함한다.
도 11을 참조하면, 중요단락 판단부(112)는 중요단락 정보 저장부(17)에서 중요단락 정보를 읽어온다(1100). 그리고, 현재 웹페이지의 DOM 노드트리의 노드들 중에서 읽어온 중요단락 정보 내 단락 노드 위치에 매칭되는 단락 노드를 검색하고, 검색된 단락 노드에 해당하는 웹페이지 단락을 중요단락으로 판단한다(1110).
도 12는 도 11의 중요단락 추출 실시예를 위한 웹페이지 화면과 중요단락 정보 저장부(17)를 도시한 참조도이다.
중요단락 판단부(112)가 중요단락 정보 저장부(17)에 저장된 중요단락 정보 중 태그 인덱스 정보를 이용하여 HTML 코드로 구성된 현재 웹페이지의 DOM 노드트리에서 태그 인덱스 정보가 가리키는 태그 노드를 검색하면, 추후 로드 및 렌더링 과정을 거쳐 검색된 태그 노드에 대응되는 중요단락은 참조부호 1200과 같이 화면에 표시된다.
도 13은 본 발명의 추가 실시예에 따른 중요단락 추출방법을 도시한 흐름도이다.
도 4, 도 6, 도 8 및 도 11을 참조로 하여 전술한 중요단락 추출방법과, 도 13의 중요단락 추출방법의 차이점을 설명하면, 도 13의 중요단락 추출방법은 전술한 중요단락 추출방법 중 적어도 하나 이상을 이용하여 중요단락을 추출할 수 있다는 데에 있다.
도 13를 참조하면, 중요단락 판단부(112)는 현재 웹페이지의 DOM 노드트리에서 단락을 구분하는 노드를 검색한다(1300). 이때, 단락을 구분하는 노드는 도 4에서 전술한 <article> 태그 노드, 도 6에서 전술한 id 나 class 속성값에 "article" 문자열을 포함하는 <div> 또는 <table> 태그 노드일 수 있다. 검색한 결과에 따라, 해당 노드가 존재하는 경우, 중요단락 판단부(112)는 해당 노드를 중요단락 노드로 판단한다(1360).
이어서, 단락을 구분하는 노드가 존재하지 않는 경우, 중요단락 판단부(112)는 현재 웹페이지의 DOM 노드트리에서 이전 웹페이지 링크의 텍스트와 동일한 문자열을 갖는 노드를 검색한다(1320). 검색한 결과에 따라, 전술한 노드가 존재하는 경우, 중요단락 판단부(112)는 해당 노드를 중요단락 노드로 판단한다(1360). 이때, 이전 웹페이지 링크의 텍스트와 동일한 문자열을 갖는 노드를 포함하는 최상위 노드를 중요단락 노드로 판단할 수 있다.
이어서, 이전 웹페이지 링크의 텍스트와 동일한 문자열을 갖는 노드가 존재하지 않는 경우, 중요단락 판단부(112)는 중요단락 정보 저장부(17)에 저장된 중요단락 정보를 이용하여 중요단락 노드를 검색한다(1340). 검색한 결과에 따라 전술한 노드가 존재하는 경우, 중요단락 판단부(112)는 해당 노드를 중요단락 노드로 판단한다(1360). 이때, 중요단락 정보에 해당하는 노드가 존재하지 않는 경우, 중요단락 판단부(112)는 웹페이지 내 중요단락이 없는 것으로 판단한다(1370). 한편, 도 13의 실시예에서의 노드 검색 순서는 용이 변경가능하며, 동시에 수행될 수도 있음을 명시한다.
도 14는 본 발명의 중요단락 구분을 통한 웹 요소 로드 및 렌더링 최적화를 위한 웹페이지 구성장치(1)와 사용자 간의 인터렉션을 보여주는 웹페이지 화면을 도시한 참조도이다.
일 실시예에 따라, 사용자가 웹페이지(1400) 상에서 소정의 링크(1410)를 선택하면, 예를 들면 해당 링크를 클릭하는 동작을 통해 링크(1410)를 선택하면, 웹페이지 구성장치(1)는 표시부(16)를 통해 웹 요소 로드 및 렌더링 최적화를 위한 팝업 창을 화면에 표시한다. 이때, 사용자가 팝업 창 내 메뉴 중 "중요단락 최적화 열기(1430)"을 선택하면, 웹페이지 구성장치(1)의 제어부(10)는 해당 링크를 통해 열리는 웹페이지(1440)를 대상으로 중요단락 구분을 통한 웹 요소 로드 및 렌더링 최적화 프로세스를 수행한다. 웹 요소 로드 및 렌더링 최적화가 수행되면, 웹페이지(1440) 내에서 중요단락으로 판단된 단락(1450)은 모든 데이터가 표시되지만, 중요단락으로 판단되지 않은 단락에 대해서는 데이터가 표시되지 않거나, 해당 데이터를 대체하는 다른 데이터가 표시된다.
도 15는 본 발명의 일 실시예에 따라 중요단락에 포함되지 않는 부가 요소를 대체하는 대체 요소를 웹페이지 화면에 표시하는 프로세스를 도시한 참조도이다.
일 실시예에 따르면, 중요단락에 포함되지 않은 부가 요소는 대체요소 저장부(18)에 저장된 부가 요소로 대체되어 렌더링된 후 화면에 표시된다. 이때, 부가 요소를 대체하는 대체 요소를 렌더링하되, 대체 요소별로 대체 요소가 제공하는 태그 노드의 색상 속성값을 달리하거나 명도 속성값을 달리하여 대체 요소를 렌더링할 수 있다. 예를 들면, 도 15에 도시된 바와 같이, 대체 요소의 원본에 해당하는 부가 요소가 JPEG 컨텐트일 경우 대체 요소는 파랑 색 화면으로 표시되고, 대체 요소의 원본에 해당하는 부가 요소가 GIF 컨텐트일 경우 대체 요소는 빨강 색 화면으로 표시되며, 대체 요소의 원본에 해당하는 부가 요소가 SWF 컨텐트일 경우 대체 요소는 노랑 색 화면으로 표시될 수 있다. 이외에 사용자 설정에 의해 다양한 대체 요소를 구성할 수 있다.
추가 실시예에 따르면, 사용자가 화면에 표시되는 대체 요소를 선택하면, 원본을 화면에 표시한다. 예를 들면, 사용자가 빨강 색 화면을 선택하면, GIF 컨텐트가 화면에 표시된다. 이때, 사용자가 빨상 색 화면을 선택하면 해당 GIF 컨텐트만 화면에 표시될 수 있다.
도 16은 본 발명의 일 실시예에 따라 사용자가 선택한 중요단락에 대한 중요단락 정보를 저장하는 프로세스를 도시한 흐름도이다.
일 실시예에 따르면, 사용자가 현재 웹페이지에서 중요단락을 선택하면, 웹페이지 구성장치(1)는 선택된 중요단락을 저장할지를 묻는 팝업 창을 화면에 표시한다. 이때, 사용자가 팝업 창 내에서 '중요단락 정보 저장'을 선택(1600)하면, 선택된 중요단락 정보가 중요단락 정보 저장부(17)에 이미 존재하는지 여부를 확인한다(1610). 확인한 결과에 따라, 선택된 중요단락 정보가 중요단락 정보 저장부(17)에 존재하지 않는 경우에 선택된 중요단락의 중요단락 정보를 중요단락 정보 저장부(17)에 저장한다(1620).
도 17은 도 16의 사용자가 선택한 중요단락에 대한 중요단락 정보를 저장하기 위한 웹페이지 구성장치(1)와 사용자 간의 인터렉션을 보여주는 웹페이지 화면을 도시한 참조도이다.
도 17을 참조하면, 웹페이지 구성장치(1)는 사용자의 중요단락 선택을 위한 팝업 창(1710)을 화면에 표시한다. 이때, 사용자가 소정의 단락을 중요단락으로 선택(1720)하면, 선택된 중요단락에 대한 중요단락 정보를 중요단락 정보 저장부(17)에 저장한다. 중요단락 정보는 현재 웹페이지의 주소와 중요단락 노드의 검색 가능한 인덱스 정보 등을 포함한다.
도 18은 본 발명의 일 실시예에 따라 로드 및 렌더링에 포함되지 않은 단락의 부가 요소를 다시 불러오기 위한 프로세스를 도시한 흐름도이다.
도 18을 참조하면, 중요단락이 로딩 및 렌더링된 후에 사용자가 로딩 및 렌더링 되지 않은 부가 요소 및 단락을 불러오기 위해 웹페이지에서 부가 요소 및 단락을 선택한다(1800). 이어서, 사용자에 의해 선택된 단락 및 부가 요소를 분석 (1810)하여, 부가 요소 로드가 필요한지 판단(1820)한 후, 필요한 경우 부가 요소를 로드(1830)하고, 부분 렌더링 및 레이아웃 구성 동작(1840)을 수행하여, 사용자에 의해 선택된 부가 요소 및 단락에 대한 렌더링을 완료한다(1850).
이제까지 본 발명에 대하여 그 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
1 : 웹페이지 구성장치 2 : 웹 서버
3 : 인터넷 망 10 : 제어부
12 : 네트워크 연결부 14 : 입력부
16 : 표시부 19 : 저장부
17 : 중요단락 정보 저장부 18 : 대체요소 저장부
100 : 웹 요소 로더부 110 : 웹 요소 분석부
112 : 중요단락 판단부 120 : 웹 요소 렌더링부

Claims (19)

  1. 메인 요소(main element)와 부가 요소(sub element)로 구성되는 웹페이지를 구성하는 방법에 있어서,
    상기 웹페이지의 텍스트(text) 기반 웹페이지 요소인 상기 메인 요소를 로드하는 단계;
    상기 웹페이지의 로드된 메인 요소를 분석하여 웹페이지 단락(paragraph)들 중에서 중요단락(main paragraph)을 판단하는 단계;
    상기 중요단락 판단 후, 상기 웹페이지의 비(非) 텍스트 기반 웹페이지 요소인 상기 부가 요소가 상기 중요단락에 포함되는지 판단하는 단계; 및
    상기 부가 요소가 상기 중요단락에 포함되는 경우, 상기 로드된 메인 요소와 상기 중요단락에 포함된 부가 요소를 렌더링하여 표시하는 단계를 포함하는 것을 특징으로 하는 웹페이지 구성방법.
  2. 제 1 항에 있어서,
    상기 메인 요소는 하이퍼텍스트 마크업 언어(Hyper Text Markup Language), 캐스케이딩 스타일 시트(cascading style sheet), 자바 스크립트(java script) 중 적어도 하나를 포함하며, 상기 부가 요소는 이미지, 오디오 또는 비디오 형식의 컨텐트 중 적어도 하나를 포함하는 것을 특징으로 하는 웹페이지 구성방법.
  3. 제 1 항에 있어서,
    상기 중요단락을 판단하는 단계는, 상기 메인 요소가 제공하는 노드들 중에서 단락을 구분하는 노드를 검색하는 단계, 및
    상기 검색된 단락을 구분하는 노드에 해당하는 웹페이지 단락을 중요단락으로 판단하는 단계를 포함하는 것을 특징으로 하는 웹페이지 구성방법.
  4. 제 3 항에 있어서,
    상기 메인 요소가 제공하는 노드들 중에서 단락을 구분하는 노드를 검색하는 단계는,
    상기 메인 요소가 제공하는 노드들을 구조화한 노드트리를 이용하여 상기 노드트리 중에서 단락을 구분하는 노드를 검색하는 것을 특징으로 하는 웹페이지 구성방법.
  5. 제 4 항에 있어서,
    상기 노드트리 중 단락을 구분하는 노드는, 자료(article) 태그 노드인 것을 특징으로 하는 웹페이지 구성방법.
  6. 제 4 항에 있어서,
    상기 노드트리 중 단락을 구분하는 노드는, 디아이브이(div) 태그 또는 테이블(table) 태그 노드의 아이디(id) 또는 클래스(class) 속성값에 자료 문자열을 포함하는 노드인 것을 특징으로 하는 웹페이지 구성방법.
  7. 제 1 항에 있어서,
    상기 중요단락을 판단하는 단계는, 사용자가 이전 웹페이지의 링크를 통해 현재 웹페이지에 접속한 경우, 상기 메인 요소가 제공하는 노드들 중에서 상기 링크의 텍스트와 동일한 문자열을 갖는 노드를 검색하고, 상기 검색된 노드를 포함하는 최상위 노드에 해당하는 웹페이지 단락을 중요단락으로 판단하는 것을 특징으로 하는 웹페이지 구성방법.
  8. 제 1 항에 있어서,
    상기 중요단락을 판단하는 단계는, 미리 저장된 중요단락 정보를 이용하여, 상기 메인 요소가 제공하는 노드들 중에서 중요단락 정보에 포함된 노드정보와 연관된 노드가 있는지를 검색하여 연관된 노드에 해당하는 웹페이지 단락을 중요단락으로 판단하는 것을 특징으로 하는 웹페이지 구성방법.
  9. 제 1 항에 있어서,
    상기 부가 요소가 상기 중요단락에 포함되지 않는 경우, 상기 로드된 메인 요소를 렌더링하여 표시하는 단계를 더 포함하는 것을 특징으로 하는 웹페이지 구성방법.
  10. 제 1 항에 있어서,
    상기 부가 요소가 상기 중요단락에 포함되지 않은 경우 상기 부가 요소를 대체하는 대체 요소를 로드하는 단계를 더 포함하는 것을 특징으로 하는 웹페이지 구성방법.
  11. 제 10 항에 있어서,
    상기 부가 요소를 렌더링하여 표시하는 단계는, 상기 로드된 대체 요소를 렌더링하되, 대체 요소별로 대체 요소가 제공하는 태그 노드의 색상 속성값을 달리하거나 명도 속성값을 달리하여 대체 요소를 렌더링하는 것을 특징으로 하는 웹페이지 구성방법.
  12. 웹페이지의 텍스트(text) 기반 웹페이지 요소인 메인 요소와 상기 웹페이지의 비(非) 텍스트 기반 웹페이지 요소인 부가 요소를 로드하는 웹 요소 로더부;
    상기 웹페이지의 로드된 메인 요소를 분석하여 웹페이지 단락(paragraph)들 중에서 중요단락(main paragraph)을 판단하고, 상기 웹페이지의 부가 요소가 중요단락에 포함되는지를 판단하는 웹 요소 분석부; 및
    상기 부가 요소가 상기 중요단락에 포함되는 경우, 상기 웹 요소 로더부를 통해 로드된 메인 요소와 중요단락에 포함된 부가 요소를 렌더링하는 웹 요소 렌더링부를 포함하는 것을 특징으로 하는 웹페이지 구성장치.
  13. 제 12 항에 있어서,
    상기 웹 요소 로더부는, 상기 웹페이지의 메인 요소가 로드된 후, 상기 웹페이지의 부가 요소가 중요단락에 포함되는지를 판단한 다음, 상기 부가 요소를 로드하는 것을 특징으로 하는 웹페이지 구성장치.
  14. 제 12 항에 있어서,
    상기 웹 요소 분석부는, 상기 메인 요소가 제공하는 노드들 중에서 단락을 구분하는 노드를 검색하고, 검색된 단락을 구분하는 노드에 해당하는 웹페이지 단락을 중요단락으로 판단하는 것을 특징으로 하는 웹페이지 구성장치.
  15. 제 14 항에 있어서,
    상기 웹 요소 분석부는, 상기 메인 요소가 제공하는 노드들을 구조화한 노드트리 중에서 단락을 구분하는 노드인 자료(article) 태그 노드를 검색하는 것을 특징으로 하는 웹페이지 구성장치.
  16. 제 14 항에 있어서,
    상기 웹 요소 분석부는, 상기 메인 요소가 제공하는 노드들을 구조화한 노드트리 중에서 단락을 구분하는 노드인 디아이브이(div) 태그 또는 테이블(table) 태그 노드의 아이디(id) 또는 클래스(class) 속성값에 자료 문자열을 포함하는 노드를 검색하는 것을 특징으로 하는 웹페이지 구성장치.
  17. 제 12 항에 있어서,
    상기 웹 요소 분석부는, 사용자가 이전 웹페이지의 링크를 통해 현재 웹페이지에 접속한 경우, 상기 메인 요소가 제공하는 노드들 중에서 상기 링크의 텍스트와 동일한 문자열을 갖는 노드를 검색하고, 상기 검색된 노드를 포함하는 최상위 노드에 해당하는 웹페이지 단락을 중요단락으로 판단하는 것을 특징으로 하는 웹페이지 구성장치.
  18. 제 12 항에 있어서,
    중요단락에 대한 정보를 저장하는 중요단락 정보 저장부; 를 더 포함하며,
    상기 웹 요소 분석부는, 상기 중요단락 정보 저장부에 저장된 중요단락 정보를 이용하여, 상기 메인 요소가 제공하는 노드들 중에서 중요단락 정보와 연관된 노드가 있는지를 검색하여 연관된 노드에 해당하는 웹페이지 단락을 중요단락으로 판단하는 것을 특징으로 하는 웹페이지 구성장치.
  19. 제 12 항에 있어서,
    부가 요소를 대체하는 대체 요소를 저장하는 대체 요소 저장부; 를 더 포함하며,
    상기 대체 요소 저장부는, 추가로 로드하려는 부가 요소가 상기 중요단락에 포함되는지를 판단하여, 부가 요소 대신에 중요단락에 포함되지 않은 경우 상기 대체 요소 저장부에 저장된 대체 요소를 로드하는 것을 특징으로 하는 웹페이지 구성장치.
KR1020120021400A 2012-02-29 2012-02-29 웹페이지 구성방법 및 그 장치 KR101340588B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020120021400A KR101340588B1 (ko) 2012-02-29 2012-02-29 웹페이지 구성방법 및 그 장치
US13/728,436 US20130227391A1 (en) 2012-02-29 2012-12-27 Method and apparatus for displaying webpage

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120021400A KR101340588B1 (ko) 2012-02-29 2012-02-29 웹페이지 구성방법 및 그 장치

Publications (2)

Publication Number Publication Date
KR20130099700A true KR20130099700A (ko) 2013-09-06
KR101340588B1 KR101340588B1 (ko) 2013-12-11

Family

ID=49004664

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120021400A KR101340588B1 (ko) 2012-02-29 2012-02-29 웹페이지 구성방법 및 그 장치

Country Status (2)

Country Link
US (1) US20130227391A1 (ko)
KR (1) KR101340588B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200060944A (ko) * 2018-11-23 2020-06-02 배성훈 웹페이지용 텍스트 대체 이미지 생성 및 로딩 시스템 및 방법

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101491591B1 (ko) * 2012-11-05 2015-02-09 주식회사 케이티 웹앱 가상화 서비스를 제공하는 가상화 서버 및 웹앱 가상화 서비스 제공을 위한 데이터 전송방법
US20150254213A1 (en) * 2014-02-12 2015-09-10 Kevin D. McGushion System and Method for Distilling Articles and Associating Images
US10777164B2 (en) * 2014-12-19 2020-09-15 Qualcomm Incorporated Power optimization by rendering low-resolution tiles during page load
RU2610585C2 (ru) * 2015-03-31 2017-02-13 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для модификации текста в документе
CN105205845B (zh) * 2015-09-14 2018-06-22 广州视睿电子科技有限公司 网页动画渲染方法及装置
CN111723318B (zh) * 2020-06-09 2023-09-01 百度在线网络技术(北京)有限公司 页面数据处理方法、装置、设备和存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5903727A (en) * 1996-06-18 1999-05-11 Sun Microsystems, Inc. Processing HTML to embed sound in a web page
US20030023754A1 (en) * 2001-07-27 2003-01-30 Matthias Eichstadt Method and system for adding real-time, interactive functionality to a web-page
JP4686177B2 (ja) * 2004-12-02 2011-05-18 インターナショナル・ビジネス・マシーンズ・コーポレーション Webページ・オーサリング装置、Webページ・オーサリング方法及びプログラム
US20070016577A1 (en) * 2005-07-13 2007-01-18 Rivergy, Inc. System for building a website
US7614012B1 (en) * 2005-12-22 2009-11-03 Adobe Systems Incorporated Methods and apparatus for graphical object implementation
KR100832859B1 (ko) * 2006-08-30 2008-05-28 한양대학교 산학협력단 모바일 웹 콘텐츠 서비스 시스템 및 그 방법
US8181107B2 (en) * 2006-12-08 2012-05-15 Bytemobile, Inc. Content adaptation
US20080244293A1 (en) * 2007-03-29 2008-10-02 Morris Robert P Methods, Systems, And Computer Program Products For Providing For Automatically Closing Application Widgets Based On Markup Language Elements
KR100964792B1 (ko) * 2008-02-26 2010-06-21 중앙대학교 산학협력단 모바일 웹 환경을 위한 콘텐츠 적응 시스템 및 방법
KR100954842B1 (ko) * 2008-08-22 2010-04-28 고려대학교 산학협력단 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체
US8539359B2 (en) * 2009-02-11 2013-09-17 Jeffrey A. Rapaport Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic
WO2011072434A1 (en) * 2009-12-14 2011-06-23 Hewlett-Packard Development Company,L.P. System and method for web content extraction
WO2011130868A1 (en) * 2010-04-19 2011-10-27 Hewlett-Packard Development Company, L. P. Segmenting a web page into coherent functional blocks
WO2012012911A1 (en) * 2010-07-28 2012-02-02 Hewlett-Packard Development Company, L.P. Producing web page content
WO2012055067A1 (en) * 2010-10-26 2012-05-03 Hewlett-Packard Development Company, L.P. Extraction of content from a web page
US8510237B2 (en) * 2011-03-15 2013-08-13 Qualcomm Incorporated Machine learning method to identify independent tasks for parallel layout in web browsers

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200060944A (ko) * 2018-11-23 2020-06-02 배성훈 웹페이지용 텍스트 대체 이미지 생성 및 로딩 시스템 및 방법

Also Published As

Publication number Publication date
KR101340588B1 (ko) 2013-12-11
US20130227391A1 (en) 2013-08-29

Similar Documents

Publication Publication Date Title
US11288338B2 (en) Extracting a portion of a document, such as a page
KR101340588B1 (ko) 웹페이지 구성방법 및 그 장치
US9697183B2 (en) Client side page processing
US20180052843A1 (en) Extracting a portion of a document, such as a web page
US8572202B2 (en) Persistent saving portal
US10542123B2 (en) System and method for generating and monitoring feedback of a published webpage as implemented on a remote client
US8839087B1 (en) Remote browsing and searching
US20150074561A1 (en) Customizable themes for browsers and web content
US9224151B2 (en) Presenting advertisements based on web-page interaction
US9519713B2 (en) Method for searching for multimedia content items on the internet
US10515142B2 (en) Method and apparatus for extracting webpage information
US10387535B2 (en) System and method for selectively displaying web page elements
US20100299589A1 (en) Keyword display method and keyword display system
US20130339840A1 (en) System and method for logical chunking and restructuring websites
US8413070B1 (en) Declarative resizeable list in electronic form
US10853319B2 (en) System and method for display of document comparisons on a remote device
WO2009011837A1 (en) Extraction and reapplication of design information to existing websites
US20120144291A1 (en) Apparatus and method for controlling web browser display
JP6975339B2 (ja) デジタルコンポーネントのバックドロップレンダリング
US9092405B1 (en) Remote browsing and searching
CN104731815B (zh) 一种网页元素的绘制方法及装置
CN117055987A (zh) 网页显示方法、装置、电子设备及计算机可读存储介质
CN110515618A (zh) 页面信息录入优化方法、设备、存储介质及装置
CN115438282B (zh) 页面中元素的定位方法及装置
JP5939711B2 (ja) 情報処理装置およびその制御プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170529

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee