KR20030079919A - 웹 콘텐츠 변환 방법 및 장치 - Google Patents

웹 콘텐츠 변환 방법 및 장치 Download PDF

Info

Publication number
KR20030079919A
KR20030079919A KR10-2003-7004677A KR20037004677A KR20030079919A KR 20030079919 A KR20030079919 A KR 20030079919A KR 20037004677 A KR20037004677 A KR 20037004677A KR 20030079919 A KR20030079919 A KR 20030079919A
Authority
KR
South Korea
Prior art keywords
web content
content
word
terminal device
information
Prior art date
Application number
KR10-2003-7004677A
Other languages
English (en)
Inventor
아키오 야마모토
Original Assignee
휴렛-팩커드 컴퍼니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 휴렛-팩커드 컴퍼니 filed Critical 휴렛-팩커드 컴퍼니
Publication of KR20030079919A publication Critical patent/KR20030079919A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/04Protocols specially adapted for terminals or networks with limited capabilities; specially adapted for terminal portability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/303Terminal profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/565Conversion or adaptation of application format or content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/565Conversion or adaptation of application format or content
    • H04L67/5651Reducing the amount or size of exchanged application data

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

사용자(클라이언트 장치)(20)에 의해 요청된 웹 콘텐츠(40)와, 웹 콘텐츠의 어의 분석 결과(50)를 검색한다. 요청된 웹 콘텐츠(40)는 웹 콘텐츠의 정보 항목 및 어의 분석 결과에 기초하고 클라이언트 장치의 속성이나 사용자의 요청에 따라 콘텐츠 변환 시스템(10)을 사용하여 적절하게 변환된다. 이로써, 변환된 웹 콘텐츠가 클라이언트 장치(20)로 전달된다. 따라서, 디스플레이 패널의 크기가 작은 팜톱 컴퓨터, 핸드헬드형 컴퓨터 또는 이동 전화의 사용자라도 웹 콘텐츠를 편리하고 효율적으로 액세스할 수 있다.

Description

웹 콘텐츠 변환 방법 및 장치{METHOD AND APPARATUS FOR TRANSFORMING CONTENTS ON THE WEB}
전 세계 도처에 분산되어 있는 컴퓨터 망인 인터넷은 복수의 컴퓨터들이 서로 통신할 수 있도록 해 주는 매체로서 그 중요성 및 유효성이 광범위하게 인식되어 지고 있다. 인터넷에 접속되어 있으며 콘텐츠 정보(웹 페이지)를 저장하고 있는 복수의 서버 컴퓨터(웹 서버)와, 그 콘텐츠 정보를 액세싱하기 위한 복수의 클라이언트로 구성된 WWW(World Wide Web)가 최근 가장 강조되고 있는 인터넷 상의 정보 제공 서비스이다. 이 서비스는 텍스트 정보 뿐 아니라, 그래픽 및 이미지 정보, 오디오 및 비디오 정보 등을 제공하고 교환할 수 있다. 또한, 기업의 개인 전용 컴퓨터 망인 인트라넷은 일례로 사내에서의 정보를 용이하게 제공하고 공유할 수 있어, 광범위하게 사용된다. 인터넷 및 인트라넷에 의해 제공되는 정보를 액세스하기 위해, 컴퓨터 상에서 동작하는 넷스케이프 네비게이터(Netscape Navigator)또는 인터넷 익스플로러(Internet Explorer) 등의 그래픽 사용자 인터페이스를 갖는 웹 브라우저를 통상적으로 사용해 왔다.
최근 모바일 컴퓨팅 기술의 신속한 발전으로 인해, 통상의 데스크톱 컴퓨터뿐 아니라, 팜톱이나 핸드헬드형 컴퓨터를 사용하는 클라이언트의 수가 증가하고 있다. 게다가, 네트워크에 접속하도록 적응된 이동 전화를 이용하여 인터넷을 액세싱하려는 사람들이 보다 많아 지고 있다. 일반적으로, 팜톱/핸드헬드형 컴퓨터 또는 이동 전화 등의 모바일 장치에 있어서의 디스플레이 패널은 그 크기가 데스크톱 컴퓨터의 크기보다 작으며, 종종 칼라 표시 등의 능력이 떨어진다. 그 결과, 웹 콘텐츠를 어떤 방식으로든 변환하지 않는 한, 어떤 경우에는 데스크톱 컴퓨터의 디스플레이 패널 상에 표시가능한 웹 콘텐츠의 일부가 모바일 장치의 디스플레이 패널 상에는 표시할 수 없게 된다. 또한, 모바일 단말 장치의 성능 한계로 인해, 예를 들어, 설치된 메모리의 크기 및 네트워크와의 접속 대역폭으로 인해, 웹 콘텐츠를 정확하게 표시할 수 없을 수도 있다.
이들 문제에 대처하기 위한 종래 예가 도 1에 개략적으로 도시되어 있다. 도 1에서 도시된 바와 같이, 액세스에 이용되는 장치의 특성에 적합하게 웹 콘텐츠를 변환시키는 방법을 주로 채용하고 있다. 일례로서, 일본 공개 특허 제345178/1999호, 제122958/2000호, 제222275/2000호, 및 제222276/2000호에 개시되어 있는 바와 같이, 대형의 칼라 이미지를 그 크기를 축소시키고 저해상도의 흑-백 이미지로 변환시킨다. 이 외에도, 문서 콘텐츠에 대해, 텍스트의 폰트나 폰트 크기 변경, 또는 콘텐츠를 모바일 장치의 디스플레이 패널 상에 표시될 수 있는 보다 작은 크기의 부분들(parts)로 분할하는 등의 처리가 행해진다. 그럼에도 불구하고, 후술될 바와 같은 단점들이 지적되고 있다.
웹 콘텐츠를 클라이언트가 사용하는 모바일 단말 장치의 특성에 적합하게 변환함에 따라, 웹 콘텐츠는 본질적으로 동일해지고, 예를 들어, 소형 디스플레이 패널 상에서의 콘텐츠 표시만이 용이해 진다. 반면, 문서 콘텐츠를 분할하는 방법이 적합하지 않은 경우에는, 콘텐츠로의 액세스가 보다 복잡해져 클라이언트에게 불편함을 준다.
발명의 개시
본 발명은 상술한 단점들을 감안하여 이루어진 것으로, 본 발명의 목적은 모바일 단말 장치의 디스플레이 패널 상에서의 콘텐츠 표시를 용이하게 해 주는 것 이외에도, 모바일 단말 장치의 사용자에게 보다 효율적인 액세스 설비를 제공해 줄 수 있도록 웹 콘텐츠를 변환하는 데 있다.
본 발명의 다른 목적은, 클라이언트가 모든 콘텐츠를 조사하지 않고도 그 콘텐츠가 자신에게 필요한지의 여부를 쉽사리 판단하게끔 해 주며, 또한 그 클라이언트가 그 콘텐츠 내에서 중요한 것으로 보이는 위치로 즉시 이동할 수 있게끔 해 주는 하이퍼링크(hyperlinks)를 갖는 네비게이션 메카니즘을 구현할 수 있도록 웹 콘텐츠를 변환하는 데 있다.
본 발명의 또 다른 목적은, 하나의 문서로 이루어진 콘텐츠 뿐 아니라, 복수의 문서로 이루어진 방대한 콘텐츠에 대해서도, 상기와 동일하게 클라이언트가 최소한의 액세스(통신)로 정보를 검색(브라우징)하게끔 해 주는 설비를 제공할 수 있도록 웹 콘텐츠를 변환하는 데 있다.
본 발명에 따르면, 단말 장치로부터 웹 콘텐츠 요청이 수신되면, 요청된 웹 콘텐츠를 분석하여, 형식적인 단락(paragraph) 정보 뿐 아니라, 편집 정보를 추출한다. 요청된 콘텐츠에 더불어 이들 정보는 이에 대응되는 어의 분석 결과(semantic analysis results)에 링크된다. 대응하는 어의 분석 결과를 발견하지 못한 경우에는, 요청된 웹 콘텐츠에 대해 어의 분석 프로그램을 실행시켜 그 웹 콘텐츠로부터 핵심어(keywords), 핵심 문장(key sentences) 및/또는 핵심 단락(key paragraph)을 추출해 낸다. 또한, 콘텐츠의 요약도 생성한다. 얻어진 이들 어의 정보 항목들을 어의 분석 결과로서 저장한다. 이어서, 요청된 문서 콘텐츠를 검색된 어의 분석 결과에 포함된 어의 정보에 기초하여, 클라이언트의 요청 또는 단말 장치의 속성들에 따라 적절하게 변환시킨다. 이 경우, 변환 처리에는 문서의 제목 및 다른 편집 정보와, 메뉴 정보로 구성된 톱 페이지(top page)의 생성; 요약 페이지의 생성; 핵심어, 핵심 문장 등의 목록, 및 그 핵심어 등이 나타나는 위치로의 링크의 생성; 생성된 페이지 간에서의 하이퍼링크의 생성이 포함된다. 클라이언트의 요청에 순응하여 단말 장치 상에 웹 콘텐츠를 대화식으로 표시한다.
본 발명은 웹 서버에 의한 문서 콘텐츠를 제공하기 위한 방법에 관한 것으로, 보다 상세하게는, 웹 콘텐츠를 클라이언트(또는 브라우저)에게 제공함에 있어 그 웹 콘텐츠의 어의 분석 결과에 기초하여 문서를 적절히 변환하기 위한 방법 및 장치에 관한 것이다.
도 1은 종래 기술의 정보 액세스 시스템을 도시하는 블럭 다이어그램.
도 2는 본 발명에 따른 장치의 아키텍쳐를 도시하는 블럭 다이어그램.
도 3은 본 발명의 일 실시예를 도시하는 흐름도.
도 4는 본 발명에서의 핵심어 목록의 일례를 도시하는 다이어그램.
도 5는 변환 기술 객체의 논리 구조를 도시하는 다이어그램.
도 6은 본 발명에서의 사용자 오퍼레이션을 설명하는 다이어그램.
본 발명을 수행하기 위한 정보 액세스 시스템의 블럭 다이어그램을 도 2에 도시하고 있다. 콘텐츠 변환 시스템(10)은 클라이언트 장치 즉 단말 장치(20)와 클라이언트가 검색하는 웹 콘텐츠(40) 사이에 물리적으로 배치되어, 이들 간에서 인터페이스로서 기능한다. 콘텐츠 변환 시스템(10)은 서버 컴퓨터(30) 내에 존재할 수도 있다. 서버 컴퓨터(30)가 인터넷 등의 통신망을 통해 접속된 단말 장치(20)로부터 클라이언트가 희망하는 웹 콘텐츠(40)로의 액세스 요청을 수신하면, 콘텐츠 변환 시스템(10)은 웹 콘텐츠(40)와, 웹 콘텐츠(40)에 대응하는 어의 분석 결과(semantic analysis result)(50)를 액세스한다.
"어의 분석 결과(50)"란 웹 콘텐츠(40)에 포함된 어의 정보를 추출하여 분석함으로써 얻어져 저장되는 결과, 웹 콘텐츠(40)에 대해 어의 분석 프로그램을 실행시켜 미리 생성될 수 있는 결과를 의미한다. 서버 컴퓨터(30)가 웹 콘텐츠(40)로의 액세스 요청을 수신하였을 때 어의 분석 결과를 발견하지 못한 경우, 어의 분석 프로그램을 실행시켜 어의 분석 결과(50)를 생성한다. 콘텐츠 변환 시스템(10)은 웹 콘텐츠 분석기(120) 및 어의 분석 결과 분석기(130)를 사용하여, 클라이언트가 요청한 웹 콘텐츠(40)의 엘리먼트와 그 웹 콘텐츠에 대응하는 어의 분석 결과(50)의 엘리먼트로부터 변환 기술 객체(Transformation description object)(110)를 생성한다. 상기 변환 기술 객체(110)는 웹 콘텐츠(40) 및 어의 분석 결과(50)에 포함된 엘리먼트의 목록과, 그 엘리먼트에 대응하는 웹 콘텐츠간의 링크 정보를 포함한다. 클라이언트와 콘텐츠 변환 시스템(10)이 대화식으로 통신하고 있는 중에, 콘텐츠 변환 시스템(10)은 클라이언트가 갖고 있는 단말 장치(20)의 특성에 맞게 클라이언트가 행한 요청에 따라 클라이언트가 요청하는 정보를 검색하여, 그 정보가 단말 장치(20)의 디스플레이 패널 상에 표시되도록 서버컴퓨터(30)를 통해 요청정보를 단말장치(20)에 전송한다.
참조부호(140)는 후술될 변환 엔진을 나타낸다.
지금부터, 본 발명의 일 실시예를 기술한다. 이 실시예의 흐름도를 도 3에 도시하고 있다.
단계 210: 단말 장치가 웹 콘텐츠로의 액세스 요청을 행한다.
단계 220: 요청된 웹 콘텐츠에 관한 어의 분석 결과를 검색한다.
단계 230: 어의 분석 결과를 발견하였는지를 체크한다.
단계 240: 어의 분석 결과를 발견하지 못하였으면, 어의 분석 프로그램을 실행시킨다.
단계 250: 웹 콘텐츠 및 어의 분석 결과를 분석하여 변환 기술 객체를 생성한다.
단계 260: 웹 콘텐츠의 각 엘리먼트를 사용자의 요청 및 단말 장치의 속성들에 따라 변환한다.
단계 270: 변환된 엘리먼트를 전송하여 단말 장치 상에 표시한다.
상기 실시예에 대해 이하에서 상세히 기술한다. 인터넷 등의 통신망을 통해접속된 클라이언트 장치(20; 도 2)로부터 전송 제어 프로토콜/인터넷 프로토콜(TCP/IP) 접속에 관한 하이퍼텍스트 전달 프로토콜(HTTP)을 사용하여 서버 컴퓨터(30)로 소정의 웹 콘텐츠로의 액세스 요청이 전달된다. 웹 콘텐츠는 확장성 생성 언어(eXtensible Markup Language:이하 "XML") 등의 표준 페이지 기술어로 포맷된다.
콘텐츠 변환 시스템(10)에서 진행되는 콘텐츠 변환 동작은 크게 두 처리 단계로 이루어진다.
제1 단계에서, 콘텐츠 변환 시스템(10)은 웹 콘텐츠에 포함된 엘리먼트를 추출하기 위해 웹 콘텐츠 분석기(120)에 의해 대응하는 웹 콘텐츠를 분석한다. 예를 들어, 문서의 제목, 저자, 날짜와; 문서의 본문(body) 등의 편집 정보와; 이들을 구성하는 형식적인 단락 정보가 추출된다. 이와 동시에, 콘텐츠 변환 시스템(10)은 이들 추출된 정보를 웹 콘텐츠(40)에 대응하는 어의 분석 결과(50)에 링크시킨다. 콘텐츠 변환 시스템(10)은 이러한 링크를 이용함으로써 요구된 바 대로 어의 분석 결과(50)를 검색할 수 있다.
어의 분석 결과(50)는 웹 콘텐츠(40)의 어의 정보를 XML 포맷으로 담고있다. 상기 어의 정보에는 추출된 핵심어, 핵심 문장 또는 핵심 단락의 정보; 문서 상에서 이들이 나타나는 위치 정보 등이 포함된다. 또한, 문장 간의 문맥을 분석하여 얻어지는 문서의 어의 일관성을 나타내는 텍스트 구조에 관한 정보도 포함된다. 그러나, 어의 정보는 이러한 전형적인 정보에만 제한되는 것은 아니다. 어의 분석 결과(50)로부터 추출된 핵심어에 관련된 부분들의 예를 도 4에 도시하고 있다.
어의 분석 결과(50)가 미리 생성되지 않거나, 어떤 이유로 인해 어의 분석 결과(50)를 이용할 수 없는 경우에는, 요청된 웹 콘텐츠(40)에 대해 어의 분석 프로그램을 실행시켜 웹 콘텐츠(40)의 어의 정보를 추출한다. 얻어진 어의 정보는 XML 포맷으로 어의 분석 결과(50)로서 저장된다. 핵심어의 추출에 관해서는, 문서에 자주 나타나는 단어가 문서의 주제를 나타내는 경향이 있다는 가설에 기초하여 출현 빈도수가 높은 단어(명사)를 핵심어로 설정한다. 출현 비율에 따라 단어를 가중(weighting)시키는 기술에 대해서는, 1989년 애디슨-웨슬리 퍼블리싱사(Addison-Wesley Publishing Company)에서 지. 살톤(G. Salton)에 의해 발표된 "Automatic Text Processing"에 상세히 설명되어 있다. 그 밖에, 단어의 출현 빈도수와 단어가 나타나는 텍스트의 수를 고려하여 각각의 단어를 가중시키고, 문장에서 나타나는 단어의 가중치 합산을 문장의 중요성 레벨로 간주하는 방식으로 핵심문장이 추출된다. 이 방법은 케이. 제크너(K. Zechner)에 의해 제안되었으며, 컴퓨터에 의한 언어학에 대한 1996년 제16차 국제 회의록 986-989 페이지의 "Fast Generation of Abstracts from General Domain Text Corpora by Extracting Relevant Sentences"에 개시되어 있다. 상기 실시예에서도 이 방법에 의해 얻어진 결과를 사용한다.
문서의 어의 구조화에 관해서는, 문서를 윌리엄 씨. 만(William C. Mann)과 산드라 에이. 톰슨(Sandra A. Thompson)이 주창한 수사학 구조 분석에 기초하여 분석한다. 이 방법에 관한 상세한 사항은 1992년 존 벤자민스 퍼블리싱사(John Benjamins Publishing Company)에서 더블유. 씨. 만(W. C. Mann)과 에스. 에이. 톰슨(S. A. Thompson)에 의해 발표된 "Discource Description: Diverse Linguistics Analysis of a Fund-Raising Text"에 포함된 "Rhetorical Structure Theory and Text Analysis"에 기술되어 있다.
그리고, 콘텐츠 변환 시스템(10)은, 예를 들어, 핵심어목록, 각 핵심어에 깊이 관련된 단어나 단어군의 목록과, 문서에서 이들이 나타나는 위치에 관한 정보를 추출하기 위해 어의 분석 결과 분석기(130)를 사용하여 어의 분석 결과(50)를 분석한다. 또한, 문서의 핵심 문장, 핵심 단락 및 요약에 관한 정보도 추출된다.
다음에는, 웹 콘텐츠 분석기(120) 및 어의 분석 결과 분석기(130)의 결과를 사용하여, 콘텐츠 변환 시스템(10)은 변환 기술 객체(110)를 생성한다. 변환 기술 객체(110)는 핵심어, 핵심 문장 등의 목록과, 이들의 엘리먼트에 관한 정보가 저장되어 있는 웹 콘텐츠(40)에 대한 링크 정보를 포함한다. 클라이언트가 핵심어, 핵심 문장 등의 목록 내에 있는 엘리먼트 중 희망하는 하나를 지정하면, 콘텐츠 변환 시스템(10)은 관련 정보를 검색하여 검색된 정보를 그 클라이언트에게 제공한다. 상기 실시예에서는, 변환 기술 객체(110)는 도 5에서 도시된 바와 같은 구조를 가지며 XML 문서 객체로서 표현된다. 변환 기술 객체(110)는 아래와 같이 엘리먼트의 생성을 표현하는 논리 구조를 가진다.
(a) 톱 페이지 정보
문서의 제목, 저자 및 날짜 등의 편집 정보; 각 정보 항목과의 링크를 갖는 메뉴 정보 등으로 구성된 톱 페이지
(b) 요약
문서의 요약만을 포함하는 페이지
(c) 핵심어 페이지 정보
추출된 핵심어의 목록과; 문서 상에서 핵심어가 나타나는 위치로의 링크를 포함하는 핵심어 페이지
(d) 핵심구 페이지 정보
핵심어에 관련된 핵심구의 목록과; 문서 상에서 핵심구가 나타나는 위치로의 링크를 포함하는 핵심구 페이지
(e) 핵심 문장 페이지 정보
추출된 핵심 문장의 목록과; 문서 상에서 핵심 문장이 나타나는 위치로의 링크를 포함하는 핵심 문장 페이지
(f) 핵심 단락 페이지 정보
추출된 핵심 단락의 목록과; 문서 상에서 핵심 단락이 나타나는 위치로의 링크를 포함하는 핵심 단락 페이지
(g) 엘리먼트 간에서의 하이퍼링크
생성된 페이지 간에서의 관련성을 나타내는 하이퍼링크
변환 기술 객체(110)를 생성하는 방법에 대해 후술하기로 한다. 먼저, 변환 엔진(140)은 변환 규칙을 정의하는 데, 즉 클라이언트 장치(20)에 대한 웹 콘텐츠(40) 및 어의 분석 결과(50)에 포함된 엘리먼트의 표시 양상; 상기 엘리먼트들이 링크되는 경우의 링크 목적지 정보 등에 대한 일련의 규칙을 정의한다. 변환 엔진(140)은 웹 콘텐츠(40) 및 어의 분석 결과(50)에 포함된 각각의 엘리먼트를 모든 엘리먼트에 대해 정의된 변환 규칙에 기초하여 변환한다. 그러나, 이 단계에서 변환 엔진(140)은 콘텐츠의 최종 변환 처리를 실행하는 것이 아니라, 단지 변환된 콘텐츠의 논리 구조를 구축하는 데, 즉 엘리먼트에 대한 변환 방법을 기술하는 객체를 생성한다.
변환된 문서는 그 논리 구조로서 도 5에서 도시된 바와 같은 구조를 가질 수 있다. 상기 실시예에서, 논리 구조는 문서의 편집 정보와 요약, 핵심어, 및 핵심 문장과의 링크를 포함하는 톱 페이지; 핵심어, 핵심 문장 등의 목록과 문서 상에서 핵심어, 핵심 문장 등이 각각 나타나는 위치로의 링크를 포함하는 페이지; 문서의 본문을 적당한 크기의 부분들로 분할하여 얻어진 문서 단편(fragment)으로 구성된다.
또한, 제2 단계에서, 변환 엔진(140)에 의해 콘텐츠의 변환 처리를 실제로 실행한다. 클라이언트 장치(20)로부터의 액세스 요청은 HTTP 프로토콜을 이용하여 웹 서버(30)로 전달된다. 여기서, 단말 장치(20)에 내장된 통신 설비, 디스플레이 설비 등에 대한 정보 아이템(item)들을 HTTP 헤더의 일부로서 포함할 수 있다. 단말 장치 속성에 대한 정보 아이템, 및 제1 단계에서 생성된 변환 기술 객체(110)에 따라 각 엘리먼트에 대해 변환 처리를 실행한다. 이로써, 문서 본문의 페이지가 생성되고, 동시에, 상술된 페이지 및 하이퍼링크 (a) 내지 (g)가 생성된다.
지금부터 도 6을 참조하면서 클라이언트나 사용자와 콘텐츠 변환 시스템(10) 간에서의 통신의 일례에 대해 기술하기로 한다. 클라이언트 장치(20)가 톱 페이지 (a)를 표시하고 클라이언트가 "핵심어" 또는 "핵심어에 관련된 핵심구"에 대한 정보를 알기를 원하면, 그는 "핵심어"를 선택하여 "핵심 페이지" (b)를 오픈한다(open). 핵심어 및 각 핵심어에 관련된 핵심구의 목록을 포함하는 페이지로의 앵커(anchor)가 핵심어 페이지 (b)에 나타난다. 핵심어 페이지 (b) 상에서 임의 핵심어, 예를 들어, "핵심어 1"이 선택되면, 문서의 본문에 "핵심어 1"의 부분이 표시된다. 동일한 문서 내에서 "핵심어 1"에 대한 복수의 부분이 존재하는 경우, 이들 "핵심어 1" 부분들이 연속하여 표시된다. 그 밖에, 클라이언트가 "핵심어에 관련된 핵심구"에 대한 정보를 알기를 원하면, 그는 핵심어 페이지 (b) 상에서, 예를 들어, 관련 핵심어(핵심어 1)에 대응하는 "핵심어 1에 관련된 핵심구"를 지정함으로써, "핵심구 페이지" (d)를 오픈한다. 동일하게, 클라이언트가 "핵심어 1에 관련된 핵심구 1"을 선택하면, 문서 본문에 "핵심어 1에 관련된 핵심구 1" 부분이 표시된다. 동일한 문서 내에서 "핵심어 1에 관련된 핵심구 1"에 대한 복수의 부분이 존재하는 경우, 이들 "핵심어 1에 관련된 핵심구 1" 부분들이 연속하여 표시된다.
이와 같이 함으로써, 클라이언트는 모든 문서 콘텐츠를 조사할 필요없이 전체 문서를 쉽사리 파악할 수 있다. 또한, 클라이언트 장치(20)의 디스플레이 스크린이 소형이라는 제한 상황에도 대처할 수 있다.
따라서, 모바일 장치의 디스플레이 패널 상에서의 웹 콘텐츠 표시가 용이해질 뿐아니라, 모바일 단말 장치의 사용자에게 보다 효율적인 액세스 설비를 제공할 수 있다. 또한, 클라이언트가 모든 콘텐츠를 조사하지 않고도 콘텐츠가 자신에게 필요한지의 여부를 쉽사리 판단하게끔 해 주고, 그 클라이언트가 그 콘텐츠 내에서중요한 것으로 보이는 위치로 즉시 이동하게끔 해 주는 하이퍼링크를 갖는 네비게이션 메카니즘을 구현할 수 있다. 또한, 하나의 문서로 이루어진 콘텐츠 뿐 아니라, 복수의 문서로 이루어진 방대한 콘텐츠에 대해서도, 상기와 동일하게 클라이언트가 최소한의 액세스(통신)로 정보를 검색(브라우징)하게끔 해 주는 설비를 제공할 수 있다.
본 발명의 오퍼레이션을 실행하기 위한 컴퓨터 프로그램 코드는 자바(Java) 또는 C++ 등의 객체 지향형 프로그래밍어로 생성되는 것이 바람직하다. 그러나, C, 또는 함수형 프로그래밍어 등의 종래의 절차 지향형 프로그래밍어로 생성될 수도 있다,
상기 실시예에서, 콘텐츠 변환 처리는 자바 프로그래밍어를 사용한 Java Servlet로서 구현되며, 웹 서버(30)에서 실행된다. 이와는 달리, 상기 콘텐츠 변환 처리는 또한 일반 게이트웨이 인터페이스(CGI) 응용 프로그램, 또는 액티브 서버 페이지(ASP)에 포함된 로직으로서 구현될 수도 있다.
그 밖에, 이 실시예에서는, 모든 프로그램 코드는 웹 서버(30) 상에서 실행된다. 그러나, 웹 서버(30)에 의한 프로그램 코드의 일부 및 웹 프록시(Web proxy)에 의한 다른 프로그램 코드를 실행할 수도 있다.
본 발명에 따르면, 문서 콘텐츠의 어의 분석 결과를 참조하여 문서의 핵심어 및 핵심 문장 등의 문서 핵심 정보에 기초하여 새로운 하이퍼링크를 생성하고, 전체 문서를 어의적으로 구조화하여 얻어진 결과와 액세스를 행하는 단말 장치에 내장된 통신 및 디스플레이 설비를 나타내는 단말기 속성들에 기초하여 문서 콘텐츠를 적절하게 분할하는 동적 콘텐츠 변환 방법으로 인해, 모바일 단말 장치의 디스플레이 패널 상에서의 문서 콘텐츠 표시를 용이하게 할 뿐 아니라, 콘텐츠로의 액세스를 보다 효율적으로 실현할 수 있다.
그 밖에, 클라이언트가 모든 콘텐츠를 조사하지 않고도 적어도 하나의 관련 문서의 요약, 핵심 엘리먼트, 상관된 핵심어 등으로부터, 콘텐츠가 자신에게 필요한지의 여부를 쉽사리 판단하게끔 해 주고, 그 클라이언트가 그 콘텐츠 내에서 중요한 것으로 보이는 위치로 즉시 이동하게끔 해 주는 하이퍼링크를 갖는 네비게이션 메카니즘으로 인해, 방대한 웹 콘텐츠에 대해서도 최소한의 액세스(통신)로 정보 제공/검색을 구현할 수 있다. 이들 기능은 모바일 단말 장치 뿐 아니라, 통상의 데스크톱 컴퓨터로 웹 콘텐츠를 액세스하는데 매우 효과적이다.

Claims (8)

  1. 통신망을 통해 서버 컴퓨터에 접속된 단말 장치 상에 웹 콘텐츠를 표시하기 위해, 하나 이상의 엘리먼트를 포함하는 웹 콘텐츠를 변환하는 방법에 있어서,
    (a) 상기 서버 컴퓨터가 상기 단말 장치로부터 상기 웹 콘텐츠로의 액세스 요청을 수신하는 단계;
    (b) 요청된 상기 웹 콘텐츠에 관한 어의 분석 결과를 검색하는 단계;
    (c) 상기 웹 콘텐츠에 포함된 엘리먼트 중 적어도 하나를 상기 어의 분석 결과에 연관시키는 변환 기술 객체를 생성하는 단계;및
    (d) 상기 변환 기술 객체를 사용하여, 상기 적어도 하나의 엘리먼트를 상기 단말 장치의 속성들에 적합하도록 변환하는 단계;를 포함하는 웹 콘텐츠 변환 방법.
  2. 제1항에 있어서, 상기 웹 콘텐츠에 관한 상기 어의 분석 결과를 검색하는 단계는 상기 웹 콘텐츠에 대한 어의 분석을 실행하는 단계를 포함하는 웹 콘텐츠 변환 방법.
  3. 제1항에 있어서, 상기 변환 기술 객체는 확장성 생성언어(XML) 문서 객체인 웹 콘텐츠 변환 방법.
  4. 제1항에 있어서, 상기 변환 기술 객체는 상기 웹 콘텐츠 내에서 상기 적어도 하나의 연관된 엘리먼트가 나타나는 위치에 대한 링크 정보와, 상기 연관된 엘리먼트와 관련이 있는 다른 상기 엘리먼트에 대한 링크 정보 중 하나를 포함하는 웹 콘텐츠 변환 방법.
  5. 제1항에 있어서, 상기 변환 기술 객체를 생성하는 단계는 상기 적어도 하나의 엘리먼트를 복수의 엘리먼트로 분할하는 단계와, 상기 복수의 엘리먼트를 적어도 하나의 엘리먼트로 통합시키는 단계를 포함하는 웹 콘텐츠 변환 방법.
  6. 제1항에 있어서, 상기 변환 기술 객체를 생성하는 단계는 상기 웹 콘텐츠 및 상기 어의 분석 결과에 포함된 엘리먼트들 중 적어도 하나의 엘리먼트를 사용하여 적어도 하나의 새로운 관련 엘리먼트를 생성하는 단계를 포함하는 웹 콘텐츠 변환 방법.
  7. 제1항에 있어서, 상기 적어도 하나의 엘리먼트를 변환하는 단계는 상기 단말 장치의 사용자에 의해 행해진 요청에 따르도록 상기 엘리먼트를 변환하는 단계를 포함하는 웹 콘텐츠 변환 방법.
  8. 통신망을 통해 서버 컴퓨터에 접속된 단말 장치 상에 웹 콘텐츠를 표시하기 위해, 하나 이상의 엘리먼트를 포함하는 웹 콘텐츠를 변환하는 장치에 있어서,
    (a) 상기 서버 컴퓨터가 상기 단말 장치로부터 상기 웹 콘텐츠로의 액세스 요청을 수신하기 위한 수단;
    (b) 요청된 상기 웹 콘텐츠에 관한 어의 분석 결과를 검색하기 위한 수단;
    (c) 상기 웹 콘텐츠에 포함된 엘리먼트 중 적어도 하나를 상기 어의 분석 결과에 연관시키는 변환 기술 객체를 생성하기 위한 수단;및
    (d) 상기 변환 기술 객체를 사용하여, 상기 적어도 하나의 엘리먼트를 상기 단말 장치의 속성들에 적합하도록 변환하기 위한 수단;을 포함하는 웹 콘텐츠 변환 장치.
KR10-2003-7004677A 2000-10-02 2001-10-02 웹 콘텐츠 변환 방법 및 장치 KR20030079919A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000302728A JP2002116983A (ja) 2000-10-02 2000-10-02 ウェブコンテンツの変換方法およびシステム
JPJP-P-2000-00302728 2000-10-02
PCT/US2001/030691 WO2002029590A1 (en) 2000-10-02 2001-10-02 Method and apparatus for transforming contents on the web

Publications (1)

Publication Number Publication Date
KR20030079919A true KR20030079919A (ko) 2003-10-10

Family

ID=18784035

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-7004677A KR20030079919A (ko) 2000-10-02 2001-10-02 웹 콘텐츠 변환 방법 및 장치

Country Status (5)

Country Link
EP (1) EP1323051A1 (ko)
JP (1) JP2002116983A (ko)
KR (1) KR20030079919A (ko)
CN (1) CN1254751C (ko)
WO (1) WO2002029590A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100870146B1 (ko) * 2006-08-22 2008-11-24 주식회사 미디어워크 모바일 기기를 이용한 학습 시스템 및 그 방법
KR101134267B1 (ko) * 2010-04-14 2012-04-12 한국과학기술원 컨텐츠 변환 방법 및 시스템
KR20160091756A (ko) * 2015-01-26 2016-08-03 (주)해나소프트 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1391825A4 (en) * 2001-05-18 2005-12-21 Sharp Kk CONTENT DISTRIBUTION SYSTEM, CONTENT SERVER, AND CONTENT DISTRIBUTION METHOD
US7373347B2 (en) 2002-07-22 2008-05-13 Ricoh Company, Ltd. Information processing apparatus and information processing method
JP2004078655A (ja) * 2002-08-20 2004-03-11 Ntt Advanced Technology Corp 情報管理装置ならびにその方法、情報管理プログラム
FR2849308B1 (fr) * 2002-12-18 2007-01-26 France Telecom Procede et systeme d'extraction de resume en coeur de reseau
CN100351832C (zh) * 2003-03-28 2007-11-28 联想(北京)有限公司 一种移动浏览设备与数据自适应的方法
BRPI0413978A (pt) * 2003-09-01 2006-10-31 Koninkl Philips Electronics Nv sistema de transcodificação, dispositivo hospedeiro de uma plataforma de aplicação, solicitação, e, resposta
DE602006005943D1 (de) * 2005-09-08 2009-05-07 Ibm Verfahren und system für verbesserte client-servlet-kommunikation
FR2935855B1 (fr) * 2008-09-11 2010-09-17 Alcatel Lucent Procede et systeme de communication pour la determination d'une sequence de services lies a une conversation.
CN108733635B (zh) * 2017-04-24 2021-12-03 珠海金山办公软件有限公司 一种文本信息展示方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5727159A (en) * 1996-04-10 1998-03-10 Kikinis; Dan System in which a Proxy-Server translates information received from the Internet into a form/format readily usable by low power portable computers
US5991713A (en) * 1997-11-26 1999-11-23 International Business Machines Corp. Efficient method for compressing, storing, searching and transmitting natural language text

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100870146B1 (ko) * 2006-08-22 2008-11-24 주식회사 미디어워크 모바일 기기를 이용한 학습 시스템 및 그 방법
KR101134267B1 (ko) * 2010-04-14 2012-04-12 한국과학기술원 컨텐츠 변환 방법 및 시스템
US8775567B2 (en) 2010-04-14 2014-07-08 Intellectual Discovery Co., Ltd. System and method for converting content
KR20160091756A (ko) * 2015-01-26 2016-08-03 (주)해나소프트 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치

Also Published As

Publication number Publication date
CN1473297A (zh) 2004-02-04
WO2002029590A1 (en) 2002-04-11
EP1323051A1 (en) 2003-07-02
JP2002116983A (ja) 2002-04-19
CN1254751C (zh) 2006-05-03
WO2002029590A8 (en) 2002-07-11

Similar Documents

Publication Publication Date Title
KR100461019B1 (ko) 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법
US7721214B2 (en) Web browser with multilevel functions
KR100413309B1 (ko) 모국어 조회 서비스를 제공하기 위한 방법 및 시스템
JP3703080B2 (ja) ウェブコンテンツを簡略化するための方法、システムおよび媒体
KR100265548B1 (ko) 기계번역방법및장치
US6338059B1 (en) Hyperlinked search interface for distributed database
US6226655B1 (en) Method and apparatus for retrieving data from a network using linked location identifiers
US7174506B1 (en) Method and system for producing dynamic web pages
US20040054973A1 (en) Method and apparatus for transforming contents on the web
KR100815215B1 (ko) 웹사이트 통합 검색 장치 및 방법
US7730395B2 (en) Virtual tags and the process of virtual tagging
US20050273706A1 (en) Systems and methods for identifying and extracting data from HTML pages
US7228495B2 (en) Method and system for providing an index to linked sites on a web page for individuals with visual disabilities
US20020016801A1 (en) Adaptive profile-based mobile document integration
US20020122053A1 (en) Method and apparatus for presenting non-displayed text in Web pages
US20070005649A1 (en) Contextual title extraction
US6738827B1 (en) Method and system for alternate internet resource identifiers and addresses
WO2001050349A1 (en) Electronic document customization and transformation utilizing user feedback
JPH11161682A (ja) 情報検索装置、情報検索方法及び記録媒体
KR20030079919A (ko) 웹 콘텐츠 변환 방법 및 장치
CA2377576A1 (en) System and method for capturing and managing information from digital source
KR100519748B1 (ko) 연속어 음성 명령을 통한 인터넷 네비게이션 시스템 및 그방법
KR19990078876A (ko) 일괄된 자원 위치기 입력을 통한 정보 검색 방법
Agosti et al. Managing the interactions between handheld devices, mobile applications, and users
US20020124056A1 (en) Method and apparatus for modifying a web page

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid