KR20120073866A - 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법 및 시스템 - Google Patents

서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법 및 시스템 Download PDF

Info

Publication number
KR20120073866A
KR20120073866A KR1020100135768A KR20100135768A KR20120073866A KR 20120073866 A KR20120073866 A KR 20120073866A KR 1020100135768 A KR1020100135768 A KR 1020100135768A KR 20100135768 A KR20100135768 A KR 20100135768A KR 20120073866 A KR20120073866 A KR 20120073866A
Authority
KR
South Korea
Prior art keywords
contents
index
search
list
indexes
Prior art date
Application number
KR1020100135768A
Other languages
English (en)
Other versions
KR101697167B1 (ko
Inventor
송민아
남궁현
송승재
김홍기
Original Assignee
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단 filed Critical 서울대학교산학협력단
Priority to KR1020100135768A priority Critical patent/KR101697167B1/ko
Publication of KR20120073866A publication Critical patent/KR20120073866A/ko
Application granted granted Critical
Publication of KR101697167B1 publication Critical patent/KR101697167B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

도메인 지식을 체계적으로 제공하기 위하여, 도메인에 속하는 발행서적으로부터 목차와 색인목록을 추출하고, 목차 순으로 도메인 지식을 제공하되 목차에 속하는 색인으로 검색한 검색결과를 제공하는 시맨틱 지식구조 기반 정보검색 방법 및 시스템에 관한 것으로서, (a) 발행서적의 목차 목록과 색인 목록을 입력받되, 목차 목록은 순서대로 나열된 다수의 목차 항목을 포함하고, 색인 목록은 다수의 색인을 포함하는 단계; (b) 목차 항목에 속하는 색인들을 색인 목록에서 검색하는 단계; (c) 검색된 색인들을 키워드로 하여 검색 사이트에서 검색하는 단계; (d) 검색 사이트의 검색결과를 검색된 색인의 검색결과로 제공하는 단계; 및, (e) 목차 항목에 속하는 색인들의 검색결과를, 목차 목록내의 목차 항목 순으로 제공하는 단계를 포함하는 구성을 마련한다.
상기와 같은 시맨틱 지식구조 기반 정보검색 방법 및 시스템에 의하여, 산발적으로 생성되는 다양하고 풍부한 웹 리소스에서 웹 사용자가 전반적이며 체계적인 지식구조에 맞추어 유관한 지식을 보다 쉽게 획득할 수 있다.

Description

서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법 및 시스템 { An information retrieval method based-on semantic knowledge structures for learners using books' contents and index and the system thereof }
본 발명은 도메인 지식을 체계적으로 제공하기 위하여, 도메인에 속하는 발행서적으로부터 목차와 색인목록을 추출하고, 목차 순으로 도메인 지식을 제공하되 목차에 속하는 색인으로 검색한 검색결과를 제공하는 시맨틱 지식구조 기반 정보검색 방법 및 시스템에 관한 것이다.
생물정보학(Bioinformatics) 학습자들은 생물정보학 관련 지식을 습득하기 위해 흔히 책과 웹 검색을 병행하곤 한다. 그렇다면, 왜 생물정보학 학습자들은 웹 검색을 통한 지식습득이 가능함에도 책을 필요로 하는 것이며, 책이 있음에도 웹 검색을 통해 추가적인 지식을 구하려고 하는 것일까?
웹을 통한 지식습득이 가능함에도 책을 필요로 하는 것은 한 권의 책을 통해서 생물정보학에 대한 전반적인 내용이나 지식흐름 파악할 수 있기 때문이며, 책이 있음에도 웹 검색을 필요로 하는 것은 웹 컨텐츠의 다양함과 풍부함 때문이다.
한 권의 책이 담고 있는 전반적인 지식흐름을 개괄적으로 표현하는 것이 목차인데, Seeberg에 의하면 목차는 책 저자의 생각을 개괄적이고 압축적으로 표현한 것으로, 해당 분야 혹은 해당 도메인에 대한 체계적이고 전반적인 지식구조를 나타낸다고 설명하고 있다[1].
하지만, 책은 제한되거나 풍부하지 못한 설명 예제, 다양하지 못한 설명 난이도, 그리고 빠른 업데이트 등에 대한 어려움이 있다.
이에 비해 웹 컨텐츠는 수많은 사용자에 의해 생성되는 만큼 컨텐츠의 풍부하고 다양한 예제와 설명 난이도, 컨텐츠의 빠른 생성과 업데이트가 가능하다.
특히, 웹 2.0 시대와 함께 사용자의 참여를 지원하는 서비스가 발달하면서, 일반 사용자에 의해 생성되는 웹 컨텐츠의 수가 급격하게 증가하고 있다. 실제로 유투브의 경우, 유투브 사용자들은 매 초마다 24시간 분량의 동영상을 업로드 하고 있으며[12], 2010년 4월까지 140억 개 이상의 동영상을 업로드 하였고, 이를 공유하였다[13][4].
하지만, 생물정보학 학습자들은 웹 검색시 일반적으로 키워드 검색에 의존할 수 밖에 없는데, 학습자가 생물정보학에 대한 기본 지식을 가지고 있지 않다면 일반적인 키워드 검색으로는 수많은 사용자에 의해 산발적으로 생성되는 웹 컨텐츠로부터 생물정보학에 대한 전반적인 지식 구조를 파악하거나, 체계적인 정보를 검색하기 쉽지 않다.
또한 생물정보학에 대한 배경지식이 없는 초보 학습자(생물정보학 입문자)와 어느 정도 이상의 지식을 가지고 있는 학습자(생물정보학 익숙자)가 해당 분야에 대한 지식의 정도가 다름에도 불구하고 같은 검색 방법을 통해 유의미한 웹 컨텐츠를 검색해야 하는 어려움이 있다.
따라서 본 발명에서는 사용자 참여 서비스가 발달하면서 수많은 사용자에 의해 산발적으로 생성되는 다양한 웹 컨텐츠에서 생물정보학(Bioinformatics)학습자에게 의미있는 웹 컨텐츠를 제공하기 위한 검색 서비스인 위북(WeBook)을 제안한다.
위북은 생물정보학에 대한 배경지식이 없는 초보 학습자인 생물정보학 입문자에게 시맨틱 지식구조 기반의 검색 방법을 제공함으로써, 일반적인 키워드 검색으로는 생물정보학에 대한 전반적인 지식의 흐름이나 지식구조를 파악하기 어려운 일반적인 키워드 검색을 보완하였다. 또한 생물정보학에 대한 어느 정도 지식을 가진 학습자인 생물정보학 익숙자에게는 관련 개념 기반의 검색방법을 제공함으로써, 학습자의 지식수준과 상관 없이 동일한 검색 방법을 이용해야 했던 일반적인 키워드 검색 방법을 보완하였다.
본 발명에서 제안하는 위북(WeBook)은 책과 웹 컨텐츠의 특성을 보완하여 생물정보학 학습자의 의미적인 웹 검색을 지원하기 위한 시스템 구현을 목표로 하고 있다.
이를 위해 생물정보학 전문가에 의해 생성된 체계적이고 전반적인 지식구조인 목차와 인덱스를 기반으로 시맨틱 지식구조와 관련 개념들을 함께 보여주는 개념 네트워크를 생성하였다. 이렇게 생성한 시맨틱 지식구조와 특정 웹 서비스를 매쉬업함으로써 학습자에게 시맨틱 지식구조 기반의 웹 검색이 가능하도록 하였다.
또한 시맨틱 강의 검색 프로제트(Semantic Course Search Project)와의 매쉬업을 통해 학습자에게 생물정보학 관련 대학, 강좌 및 강의 자료, 강의 계획서에 대한 정보를 제공한다.
본 발명의 목표는 다음과 같다.
1. 생물정보학 입문자를 위한 검색 방법인 시맨틱 지식구조 제공
2. 생물정보학 익숙자를 위한 검색 방법인 개념 네트워크 제공
3. 시맨틱 지식구조와 특정 사이트와의 매쉬업
4. 시맨틱 강의검색(Semantic Course Search) 프로젝트와의 매쉬업
본 발명에서 제안하는 위북은 책의 목차와 인덱스를 발명의 기반으로 하고 있다. 목차란 저자가 특정 분야에 대해 구축한 의미적으로 연결된 개괄적인 구조이며, 사람들은 이러한 목차를 통해서 개념들간의 관계 및 흐름을 파악할 수 있다고 설명한다[1][2].
Egan. et al.[3][5]은 이러한 목차의 특성을 활용하여 목차기반 텍스트 브라우저인 SuperBook(도 1)을 제안하였다. Egan et al.은 SuperBook과 일반적인 종이 책을 이용한 검색 속도를 비교하였다. 검색 속도 실험은 동일한 한 권의 책의 내용을 검색하는 것으로, 목차 기반 브라우저인 SuperBook과 일반적인 종이 책의 검색 방법의 효율성에 대한 비교평가를 위해 진행되었다. Egan et al.의 실험에 의하면, SuperBook 사용자들의 검색 속도와 정확성이 더 높았으며, open-book 평가에서도 SuperBook의 사용자가 더 높은 수준의 에세이를 제출하였다. 또한 피실험자들은 SuperBook에 대한 사용성 평가에서도 일반적인 종이 책에 비해 더 높은 만족도를 보였다.
SuperBook은 목차에 대한 의의와 활용 가능성을 제안하였지만, 한 권의 책 내용에 대한 검색 효율성에 관한 발명인 만큼, 외부 컨텐츠 활용에 대한 한계점을 가지고 있다.
Meriill은 지식구조를"지식을 구성하는 구성요소들간의 관계 및 구조"라고 정의하고 있으며[6], 위키피디아에서는 지식구조를 "특정 분야에 대한 사실이나 지식간의 상호 관계들의 집합"으로 설명하고 있다[14].
본 발명에서는 특정 분야에 대한 시맨틱 지식구조를 생성하기 위해 책의 목차를 채택하였으며, 이러한 근거로 목차의 특성인 다음 4가지 요인을 제시한다.
1. about a Domain(해당 분야에 대한)
2. by Domain Experts(해당 분야 전문가에 의한)
3. with Domain Concepts(해당 분야 개념으로)
4. Relationship and Structure(관계와 구조)
즉, 목차는"해당 분야(about a Domain)에 대해 해당 분야 전문가(by Experts)가 해당 분야 개념(with Concepts)들로 나타낸 개념들간의 의미적인 관계와 구조(Relationship and Structure)"로 설명될 수 있으며, 목차는 "특정 분야에 대한 사실이나 지식간의 상호 관계들의 집합"인 지식구조와 그 의미가 같다.
본 발명에서는 목차를 기반으로 생성한 지식구조를, 산발적으로 생성되는 방대한 양의 웹 컨텐츠에서 학습자에게 의미적인 컨텐츠를 검색하고 제공하는 의미적 구조로 활용하였다.
매쉬업(Mash-up)은 아티스트나 디스크자키가 여러 곡을 섞어 하나의 곡으로 만들어 연주하는 것을 의미하며, 원래 팝 뮤직분야에서 사용되기 시작하였다. 섞는다는 의미의 매쉬업은 웹에서 제공하고 있는 정보나 서비스, 공개 API를 융합 혹은 결합하여 새로운 소프트웨어나 서비스, 융합 어플리케이션 등을 만드는 것으로 확장되어 사용되고 있다[4][10].
매쉬업의 가장 대표적인 사례 중 하나인 하우징맵[16]은 구글맵 API와 부동산 매물 정보를 결합하여 제공하는 서비스로[11], 사용자는 하우징맵을 통해 관심 지역의 매물 정보를 쉽게 검색할 수 있다(도 2 참조).
이와 비슷한 서비스인 리얼에스테이트옥션[17]은 미국의 최대 경매 사이트인 eBay API와 구글맵 API를 매쉬업함으로써, eBay[18]에 등록된 부동산 정보를 제공하는 서비스이다(도 3).
웹 2.0의 대표적 특징이라고 할 수 있는 매쉬업은 학습(Learning) 분야에서도 활발하게 연구되고 있다. 학습 분야에서 이루어지는 매쉬업은 교수자의 강의자료 작성을 지원하는 툴을 제공하는데 이용되거나[7][8], 학습자에게 다양한 외부 컨텐츠를 제공함으로써 학습자의 학습능률을 높이기 위해 이용된다[9].
Hsiao et al.이 제안한 EduLINK[7]는 교수자(교사)가 자바 프로그래밍 언어에 관한 강의자료를 만들 때, 교수자가 필요로 하는 예제와 유사한 코드를 자바 온톨로지를 기반으로 웹에서 검색해 제공(도 4)해줌으로써, 기(旣) 생성된 웹 컨텐츠를 재사용할 수 있도록 하고, 이를 통해 강의자료 작성에 요구되는 교수자의 시간과 노동을 줄여줄 수 있도록 지원한다.
Capuano et al.[8]은 수업시간에 필요한 인지과정을 분석한 후, 각각의 인지과정에 적합한 강의자료 작성을 지원하는 템플릿을 제안하였다. 예를 들어, 교수자가 강의자료 작성시 필요한 새로운 개념에 대한 정의가 필요할 때, '개념 정의' 관련 템플릿은 Wiktionary 사이트에서 웹 컨텐츠를 메타 검색해 결과를 제공해 줌으로써(도 5), 교수자의 관련 자료 검색 시간과 노동을 줄여준다. 도 6은 Capuano et al.이 제안한 템플릿을 이용하여 작성한 강의자료의 일부이다.
Drachsler et al.[9]이 제안하는 Re-Mashed는 개인환경학습(PLE: Personal Learning Environment)을 위한 매쉬업 시스템으로(도 7), 학습 관련 컨텐츠에 대한 학습자들의 의견을 협업필터링(Collaborative Filtering)한 후 개개인 학습자에게 유의미한 컨텐츠의 추천을 목표로 하고 있다.
학습분야에서 다양한 매쉬업 연구가 진행되고 있지만, 교수자의 강의자료 작성에 요구되는 노동력을 줄여주기 위한 연구나, 학습자에게 외부 컨텐츠를 제공하기 위한 연구에 한정되어 있으며, 학습초보자(도메인 입문자)에게 해당 도메인에 대한 전반적인 지식흐름이나 지식구조를 제공하기 위한 매쉬업 시스템에 대한 연구는 미비한 상황이다.
[1] C. Seeberg, A. Steinacker, K. Reichenberger, S. Fischer, R. Steinmentz,"Individual Tables of Contents in Web-based Learning Systems" Conference on Hypertext and Hypermedia, pp. 167-168, 1999
[2] M. Thuring, J. Hannemann, J. Haake, "Hypermedia and Cognition: Designing for Comprehension", Designing Hypermedia Application, Communications of the ACM, pp.57-66, 1995
[3] E. Egan, R. Remde, K. Landauer, C. Lochbaum, M. Gomez, "Behavior Evaluation and Analysis of a Hypertext Browser", CHI, pp.205-210, 1989
[4] R. Floyd, M. Jones, D. Rathi, M. Twidale, "Web Mash-ups and Patchwork Prototyping: User-driven Technological Innovation with Web 2.0 and Open Source Software", Hawaii International Conference on System Science, pp.1-10, 2007
[5] R. Remde, M. Gomez, K. Landauer, "SuperBook: An Automatic Tool for Information Exploration -Hypertext?"Hypertext, pp.175-188, 1987
[6] M. D. Merrill, "Knowledge Objects and Mental Models, Advanced Learning Technologies, pp.244-246, 2000
[7] L. Hsiao, Q. Li, Y. Lin, "Educational Social Linking in Example Authoring", Hypertext, pp.229-230, 2008
[8] N. Capuano, A. Pierri, F. Colace, M. Gaeta, "A Mash-up Authoring Tool for e-Learning based on Pedagogical Templates", Multimedia Technologies for Distance Learning, pp.1-8, 2009
[9] H. Drachsler, D. Pecceu, T. Arts, E. Hutten, L. Rutledge, P. Rosmalen, H. Hummel, R. Koper, "ReMashed-Recommendations for Mash-Up Personal Learning Environments", Learning in the Synergy of Multiple Disciplines, pp.788-793, 2009
[10] 김동희, "맵 API 매쉬업을 이용한 위치 컨텐츠 시스템 설계 및 구축", 건국대학교 벤처전문기술학과 석사학위 논문, 2010
[11] 이혜경, "구글맵 API 매쉬업을 이용한 지도교육 콘텐츠 연구", 이화여자대학교 디자인대학원 석사학위 논문,2008
[12] Stephanie Lyn Flosi, "comScore Releases May 2010 U.S. Online Video Rankings". COMSCORE, Written June 24, 2010. Retrieved June 27, 2010. http://www.comscore.com/Press_Events/Press_Releases/2010/6/comScore_Releases_May_2010_U.S._Online_Video_Rankings,
[13] Glenn Chapman, "Youtube Serving up Two Billion Videos Daily". AFP, Written March 16, 2010. Retrieved June 1, 2009.
http://www.google.com/hostednews/afp/article/ALeqM5jK4sI9GfUTCKAkVGhDzpJ1ACZm9Q
[14] 위키피디아: http://www.wikipedia.org
[15] 아마존: http://www.amazon.com
[16] 하우징 맵: http://www.housingmaps.com
[17] 리얼에스테이트옥션: http://www.realestateauction.com
[18] 이베이: http://www.ebay.com
[19] SKOS: http://www.w3.org/2004/02/skos/core
[20] DC core: http://purl.org/dc/elements/1.1
[21] FOAF: http://xmlns.com.foaf/0.1
[22] 시맨틱 강의 검색: http://147.46.70.151:7000/bmi/index.htm
[23] 유투브: http://www.youtube.com
[24] 슬라이드쉐어: http://slideshare.net
[25] 딜리셔스: http://www.delicious.com
[26] 야후 파이프: http://pipes.yahoo.com
본 발명의 목적은 상술한 바와 같은 문제점을 해결하기 위한 것으로, 도메인 지식을 체계적으로 제공하기 위하여, 도메인에 속하는 발행서적으로부터 목차와 색인목록을 추출하고, 목차 순으로 도메인 지식을 제공하되 목차에 속하는 색인으로 검색한 검색결과를 제공하는 시맨틱 지식구조 기반 정보검색 방법 및 시스템을 제공하는 것이다.
상기 목적을 달성하기 위해 본 발명은 검색서버와 네트워크로 연결되고, 발행서적의 목차 목록과 색인 목록을 입력받아, 상기 목차 목록의 순으로 도메인 지식을 검색하여 제공하는 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법에 관한 것으로서, (a) 상기 발행서적의 목차 목록과 색인 목록을 입력받되, 상기 목차 목록은 순서대로 나열된 다수의 목차 항목을 포함하고, 상기 색인 목록은 다수의 색인을 포함하는 단계; (b) 상기 목차 항목에 속하는 색인들을 상기 색인 목록에서 검색하는 단계; (c) 검색된 색인들을 키워드로 하여 상기 검색 사이트에서 검색하는 단계; (d) 상기 검색 사이트의 검색결과를 상기 검색된 색인의 검색결과로 제공하는 단계; 및, (e) 상기 목차 항목에 속하는 색인들의 검색결과를, 상기 목차 목록내의 상기 목차 항목 순으로 제공하는 단계를 포함하는 것을 특징으로 한다.
또, 본 발명은 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법에 있어서, 상기 (b)단계에서, 상기 목차 항목의 페이지 범위를 추출하고, 상기 페이지 범위에 속하는 페이지를 가지는 색인들을 상기 목차 항목에 속하는 색인으로 검색하는 것을 특징으로 한다.
또, 본 발명은 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법에 있어서, 상기 (e)단계에서, 상기 색인의 단어가 상기 목차 항목 내에 포함되는 단어이면, 상기 목차 항목의 검색 결과들 중 상기 색인의 검색결과를 최우선으로 제공하는 것을 특징으로 한다.
상술한 바와 같이, 본 발명에 따른 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법 및 시스템에 의하면, 산발적으로 생성되는 다양하고 풍부한 웹 리소스에서 웹 사용자가 전반적이며 체계적인 지식구조에 맞추어 유관한 지식을 보다 쉽게 획득할 수 있는 효과가 얻어진다.
본 발명에서 제안한 위북에 대한 실험결과를 요약하면 다음과 같다.
1. 생물정보학 입문자에게 있어 위북검색은 생물정보학 관련 지식구조 파악에 효율적이다.
2. 생물정보학 익숙자에게 있어 위북검색은 생물정보학 관련 지식구조 파악에 효율적이다.
3. 생물정보학 입문자에게 있어 위북검색은 생물정보학 관련개념 파악에 효율적이다.
4. 생물정보학 입문자에게 있어 위북검색은 생물정보학 관련개념 파악에 효율적이다.
5. 위북의 지식구조 기반 검색에 대한 만족도는 생물정보학 입문자, 익숙자와 무관하게 높은 만족도를 보였다.
6. 위북의 관련개념 기반 검색에 대한 만족도는 생물정보학 익숙자가 입문자에 비해 유의미하게 더 높은 만족도를 보였다.
책과 관련해 기본적으로 제공되는 데이터인 저자, ISBN과 같이 목차와 인덱스 데이터가 점차 개방되고 공유된다면, 본 발명에서 제안하는 위북 시스템은 분야의 확장성과 다양성을 보장받을 수 있을 거라 사료된다. 또한 점차 웹 컨텐츠에 대한 시맨틱한 정보표현이 확산됨에 따라 위북 시스템에서 매쉬업하여 제공하는 웹 컨텐츠 질 역시 보장될 수 있을 것이다.
도 1은 SuperBook의 인터페이스 화면 도식.
도 2는 하우징맵.
도 3은 리얼에스테이트 옥션.
도 4는 EduLink 인터페이스.
도 5는 학습 속성과 관련 웹2.0 서비스.
도 6은 Pedagogical Template을 활용한 학습자료.
도 7은 ReMashed 인터페이스.
도 8은 아마존에서 제공하는 목차 일부.
도 9는 TopBraid에 입력된 책 데이터 일부.
도 10은 RDF로 변환한 목차 일부.
도 11은 목차 정보와 관계를 표현하기 위해 생성한 속성.
도 12는 위북 스키마.
도 13은 위북 프로세스.
도 14는 야후! 파이프의 매쉬업 인터페이스.
도 15는 시맨틱 강의 검색 인터페이스.
도 16은 책 목록 제공 화면.
도 17은 시맨틱 지식구조 기반 검색 화면.
도 18은 인덱스 기반 검색 화면.
도 19는 개념 네트워크 도식.
도 20은 개념 네트워크 기반 검색 화면.
이하, 본 발명의 실시를 위한 구체적인 내용을 도면에 따라서 설명한다.
또한, 본 발명을 설명하는데 있어서 동일 부분은 동일 부호를 붙이고, 그 반복 설명은 생략한다.
생물정보학에 대한 시맨틱 지식구조와 개념 네트워크를 생성하기 위해 아마존[15] 책 섹션에서 제공하는 생물정보학 분야 책의 기본적인 정보와 목차와 인덱스 정보를 추출하였다. 추출한 책 데이터(도 8)는 RDF(Resource Description Framework)스키마와 OWL((Web Ontology Language)을 기반으로 도메인 온톨로지의 생성 및 관리를 지원하는 TopBraid 툴(도 9)을 이용해 반자동으로 RDF형식(도 10)으로 변환하였다.
책의 저자, 출판사, ISBN, 출판일과 같은 기본적인 정보를 표현하기 위해 SKOS(Simple Knowledge Organization System)[19]와 DC(DCMI, Dublin Core Metadata Initiative)[20], 그리고 FOAF(Friend OF A Friend)[21] 를 상속받았으며, 목차와 인덱스 데이터와 관계 표현을 위한 일부 속성들을 생성하였다. 도 11은 본 연구에서 제안하는 시맨틱 지식구조 기반 정보 검색 시스템인 위북에서 생성한 속성 일부를, 도 12는 위북 시스템의 스키마를 나타낸다.
위북에서 상속한 명세에 대한 각각의 설명은 다음과 같다.
l SKOS: Simple Knowledge Organization System
SKOS는 시소러스, 분류체계 등과 같은 지식어휘체계를 표현하기 위한 RDF용어집이다. SKOS는 RDF에 기반되어 생성되었기 때문에, SKOS로 표현된 지식어휘체계는 기계가 이해할 수 있고(machine-readable), 어플리케이션 간의 상호호환이 가능(interoperability)하며, 웹으로의 발행(publishing)이 가능하다.
l DC: DCMI(Dublin Core Metadata Initiative)
더블린코어는 메타데이터 간의 상호호환을 지원하기 위해 생성된 메타데이터 표준 중 하나로써, 유의미한 정보 검색과 처리를 지원하기 위해 생성된 메타데이터이다. 더블린코어는 텍스트, 이미지, 웹 페이지, 소리, 동영상 등 복합매체에 쉽게 적용이 가능해, 널리 사용되며, 보통 XML(eXtensible Markup Language)과 RDF를 사용한다.
l FOAF: Friend OF A Friend
FOAF는 기계가 이해할 수 있는 온톨로지로, 사람에 대한 정보, 사람과 사람간의 관계, 사람과 객체간의 관계 등을 기술하기 위해 생성되었다. FOAF는 RDF와 OWL 표현법을 사용한다.
도 12의 위북 스키마는 책과 목차(chapter), 인덱스, 그리고 컨셉간의 관계를 보여준다. 컨셉은 목차와 인덱스로부터 추출한 wb:hasConcept, wb:hasKeyword 속성 값을 가지는 키워드들의 집합을 나타낸다.
사용자 참여 서비스가 발달하면서 수많은 사용자에 의해 산발적으로 생성되는 다양하고 풍부한 웹 컨텐츠에서, 생물정보학 학습자가 전반적이면서 체계적인 지식구조에 맞추어 유관한 지식을 보다 쉽게 획득할 수 있도록 지원하기 위한 시맨틱 지식구조기반과 개념 네트워크 기반의 정보 검색 서비스인 위북의 프로세스는 도 13과 같다.
위북 프로세스는 크게 RDF로 표현한 지식구조 생성단계와 매쉬업 단계로 나눌 수 있다. RDF로 지식구조를 생성하는 단계에 대해서는 앞서 설명하였으므로, 이
위북은 생물정보학 전문가에 의해 생성된 체계적이고 전반적인 지식구조인 목차와 인덱스를 기반으로 생성한 시맨틱 지식구조에 특정 웹 서비스를 매쉬업함으로써 학습자에게 시맨틱 지식구조 기반의 웹 검색 결과를 제공할 수 있도록 하였다.
위북과의 매쉬업은 학습자료나 강의자료로의 활용이 용이한 웹 컨텐츠가 주로 생성되는 위키피디아[14], 유투브[23], 슬라이드쉐어[24], 딜리셔스[25] 웹 서비스로 한정하여 진행하였으며, 매쉬업은 매쉬업 지원 서비스 중 하나인 야후 파이프(Yahoo! Pipes)[26]를 이용하여 구현하였다.
야후 파이프(도 14)는 다른 매쉬업 지원 서비스인 구글의 Mashup Editor나 마이크로소프트사의 Popfly와 비교해 좀 더 개발자 지향적이고
데이터 지향적이어서 일반 사용자가 쓰기엔 불편하지만, 훨씬 유연한 결과물을 얻을 수 있다는 강점이 있다.
또한 학술진흥재단 연구지원(KRF-2008-D00035)을 받아 수행한 생물정보학 커리큘럼 개발(Curriculum Development for Bioinformatics) 연구 산출물인 시맨틱 강의 검색[22] 서비스와 매쉬업함으로써, 학습자에게 생물정보학 관련 대학, 강의 및 강의자료, 강의 계획서 등에 대한 정보를 제공하였다(도 15).
위북은 생물정보학 입문자의 학습 지원을 주 목적으로 하는 시맨틱 지식구조 기반 검색 인터페이스와 생물정보학 익숙자의 학습 지원을 주 목적으로 하는 개념 네트워크 기반 검색 인터페이스로 구성되어 있다.
학습자가 위북을 사용하기 위해서 먼저 위북에서 제공하는 생물정보학 관련 책 목록 중 관심 책을 선택한 후(도 16), 생물정보학에 대한 학습자의 관련 지식에 따라 시맨틱 지식구조 기반 검색과 개념 네트워크 검색을 화면 메뉴에서 선택할 수 있다.
- 시맨틱 지식구조 기반 검색 인터페이스
시맨틱 지식구조 기반 검색은 생물정보학에 대한 배경지식이 없는 생물정보학 초보학습자(생물정보학 입문자)를 주요 대상으로 하고 있으며, 한 권의 책에 대한 지식구조가 제공된다.
학습자가 지식구조를 살펴보다가 관심 있는 용어를 선택하면, 매쉬업을 통해 위키피디아, 딜리셔스, 슬라이드쉐어, 유투브로부터 관련 웹 컨텐츠의 검색결과를 제공 받게 되며, 동시에 학술진흥재단의 지원을 받아 진행한 연구 산출물인 시맨틱 강의 검색 결과를 함께 제공받게 된다(도 17).
뿐 만 아니라 해당 목차와 관련된 인덱스를 함께 제공해 줌으로써 보다 풍부한 지식구조를 제공받을 수 있도록 하였으며(도 17), 인덱스를 통한 매쉬업 결과도 제공된다(도 18).
- 개념 네트워크 기반 검색 인터페이스
개념 네트워크 기반 검색은 생물정보학에 대한 배경지식이 어느 정도 있는 학습자(생물정보학 익숙자)를 주요 대상으로 하고 있으며, 하나의 생물정보학 개념과 관련 있는 개념들을 네트워크 형식으로 함께 제공한다.
학습자가 지식구조나 인덱스를 살펴보다가 관심 있는 용어를 선택하면, 해당 개념과 관련 있는 여러 개념들을 그룹핑하여 제공함으로써(도 19), 학습자가 관련 개념을 쉽게 파악할 수 있도록 하였다(도 20).
또한 개념 검색 기능을 추가함으로써 학습자가 지식구조나 인덱스에 기반한 검색뿐 만 아니라 자유검색이 가능하도록 지원하였다.
이상, 본 발명자에 의해서 이루어진 발명을 상기 실시 예에 따라 구체적으로 설명하였지만, 본 발명은 상기 실시 예에 한정되는 것은 아니고, 그 요지를 이탈하지 않는 범위에서 여러 가지로 변경 가능한 것은 물론이다.
본 발명은 도메인 지식을 체계적으로 제공하기 위하여, 도메인에 속하는 발행서적으로부터 목차와 색인목록을 추출하고, 목차 순으로 도메인 지식을 제공하되 목차에 속하는 색인으로 검색한 검색결과를 제공하는 시맨틱 지식구조 기반 정보검색 시스템을 개발하는 데 유용하다.

Claims (3)

  1. 검색서버와 네트워크로 연결되고, 발행서적의 목차 목록과 색인 목록을 입력받아, 상기 목차 목록의 순으로 도메인 지식을 검색하여 제공하는 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법에 있어서,
    (a) 상기 발행서적의 목차 목록과 색인 목록을 입력받되, 상기 목차 목록은 순서대로 나열된 다수의 목차 항목을 포함하고, 상기 색인 목록은 다수의 색인을 포함하는 단계;
    (b) 상기 목차 항목에 속하는 색인들을 상기 색인 목록에서 검색하는 단계;
    (c) 검색된 색인들을 키워드로 하여 상기 검색 사이트에서 검색하는 단계;
    (d) 상기 검색 사이트의 검색결과를 상기 검색된 색인의 검색결과로 제공하는 단계; 및,
    (e) 상기 목차 항목에 속하는 색인들의 검색결과를, 상기 목차 목록내의 상기 목차 항목 순으로 제공하는 단계를 포함하는 것을 특징으로 하는 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법.
  2. 제1항에 있어서,
    상기 (b)단계에서, 상기 목차 항목의 페이지 범위를 추출하고, 상기 페이지 범위에 속하는 페이지를 가지는 색인들을 상기 목차 항목에 속하는 색인으로 검색하는 것을 특징으로 하는 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법.
  3. 제1항에 있어서,
    상기 (e)단계에서, 상기 색인의 단어가 상기 목차 항목 내에 포함되는 단어이면, 상기 목차 항목의 검색 결과들 중 상기 색인의 검색결과를 최우선으로 제공하는 것을 특징으로 하는 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법.
KR1020100135768A 2010-12-27 2010-12-27 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법 및 시스템 KR101697167B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100135768A KR101697167B1 (ko) 2010-12-27 2010-12-27 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100135768A KR101697167B1 (ko) 2010-12-27 2010-12-27 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20120073866A true KR20120073866A (ko) 2012-07-05
KR101697167B1 KR101697167B1 (ko) 2017-01-18

Family

ID=46708149

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100135768A KR101697167B1 (ko) 2010-12-27 2010-12-27 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101697167B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014025174A1 (ko) * 2012-08-06 2014-02-13 Ji Seung Hwan 지식체계 맵핑을 통한 전자적 형태의 서적의 관리방법
WO2014025175A1 (ko) * 2012-08-06 2014-02-13 Ji Seung Hwan 학습플랜을 이용한 전자서적 추천방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010067115A (ko) * 1999-11-23 2001-07-12 고성민 검색결과 디스플레이 시스템 및 방법
KR20090063423A (ko) * 2007-12-14 2009-06-18 한국과학기술정보연구원 웹문서에 대한 사전검색과 데이터 처리 및 검색어 처리를통한 정보검색 시스템 및 그 방법
KR20110125075A (ko) * 2010-05-12 2011-11-18 주식회사 아이네크 서지 메타데이터를 기반으로 의미적 그룹핑과 비주얼한 네비게이션을 지원하는 시맨틱 검색 서비스 방법 및 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010067115A (ko) * 1999-11-23 2001-07-12 고성민 검색결과 디스플레이 시스템 및 방법
KR20090063423A (ko) * 2007-12-14 2009-06-18 한국과학기술정보연구원 웹문서에 대한 사전검색과 데이터 처리 및 검색어 처리를통한 정보검색 시스템 및 그 방법
KR20110125075A (ko) * 2010-05-12 2011-11-18 주식회사 아이네크 서지 메타데이터를 기반으로 의미적 그룹핑과 비주얼한 네비게이션을 지원하는 시맨틱 검색 서비스 방법 및 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
이유진 외, 시맨틱 디지털도서관 서비스를 위한 서지 온톨로지 구축, 정보관리학회지 제26권제1호 2009. pp.215-230 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014025174A1 (ko) * 2012-08-06 2014-02-13 Ji Seung Hwan 지식체계 맵핑을 통한 전자적 형태의 서적의 관리방법
WO2014025175A1 (ko) * 2012-08-06 2014-02-13 Ji Seung Hwan 학습플랜을 이용한 전자서적 추천방법
KR101521331B1 (ko) * 2012-08-06 2015-05-19 지승환 학습플랜을 이용한 전자서적 추천방법
KR101521330B1 (ko) * 2012-08-06 2015-05-20 지승환 지식체계 맵핑을 통한 전자적 형태의 서적의 관리방법

Also Published As

Publication number Publication date
KR101697167B1 (ko) 2017-01-18

Similar Documents

Publication Publication Date Title
Bartolomé Web 2.0 and new learning paradigms
Berger et al. Choosing Web 2.0 tools for learning and teaching in a digital world
Carr et al. “More than words”: screencasting as a reference tool
Downes The buntine oration: learning networks
Roza et al. The Inside of English Textbooks in a City of Education: A Cultural Content Analysis
KR101697167B1 (ko) 서적의 목차와 색인을 이용한 시맨틱 지식구조 기반 정보검색 방법 및 시스템
Ramsky et al. Study of information search systems of the internet
Joel Awareness and purpose of electronic information resources among postgraduate students of library and information science in Borno State
Thamarasseri Edification of Multimedia Resources: Aligning Technology for Student Empowerment.
Paneva-Marinova et al. DEVELOPMENT OF A COURSEWARE ON BULGARIAN ICONOGRAPHY FOR UBIQUITOUS ON-DEMAND STUDYING
Al-Zoube et al. A Data Mashup for Dynamic Composition of Adaptive Courses.
Zhang Teachers as curators: Curating authentic online content for beginning and intermediate CFL learners
Lee et al. The visual display of temporal information for e-textbook: incorporating the mind-mapped timeline authoring tool
Chen The application of computer multimedia technology to the informatization of linguistic content
Pavlov et al. Ubiquitous learning applications on top of iconographic digital library
Landy The ElectroAcoustic Resource Site (EARS)
Wolpers et al. Supporting architecture education using the MACE system
Selahattin et al. The Effect of the Computer Assisted Teaching and 7e Model of the Constructivist Learning Methods on the Achievements and Attitudes of High School Students
Heiyanthuduwage et al. A learner oriented ontology to make effective learning management systems
Xue et al. Design of English Information Resource System and Application in English Teaching
Donnelly Carnival, Calypso and Steel Pan: A Bibliographic Guide to Popular Music of the English-speaking Caribbean and its Diaspora by John Gray
Gold Less is more: essential web resources that eliminate clutter and enhance service
Baskin et al. The Online Classroom: A Self-Actualising Theme Park or a Trial by Multimedia?
Ariyan et al. Selection Criteria of Media Resources in the Context of Teaching Foreign Languages and Cultures
Chaoui et al. Proposition and Organization of an Adaptive Learning Domain based on Fusion from the Web

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20200102

Year of fee payment: 4