KR20030078792A - 컨텐츠 검색 장치, 컨텐츠 검색 방법, 컨텐츠 변환 장치,컨텐츠 변환 방법 및 프로그램을 저장한 기억 매체 - Google Patents

컨텐츠 검색 장치, 컨텐츠 검색 방법, 컨텐츠 변환 장치,컨텐츠 변환 방법 및 프로그램을 저장한 기억 매체 Download PDF

Info

Publication number
KR20030078792A
KR20030078792A KR10-2003-0019707A KR20030019707A KR20030078792A KR 20030078792 A KR20030078792 A KR 20030078792A KR 20030019707 A KR20030019707 A KR 20030019707A KR 20030078792 A KR20030078792 A KR 20030078792A
Authority
KR
South Korea
Prior art keywords
content
term
viewpoint
content description
search
Prior art date
Application number
KR10-2003-0019707A
Other languages
English (en)
Other versions
KR100503546B1 (ko
Inventor
에무라고이치
후지카와와타루
오카다유지
다카하시가츠나오
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20030078792A publication Critical patent/KR20030078792A/ko
Application granted granted Critical
Publication of KR100503546B1 publication Critical patent/KR100503546B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/913Multimedia
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은, 검색 요구와 검색 대상의 컨텐츠 기술의 관점이 다른 표현인 경우에, 컨텐츠 기술에 포함되는 용어와 용어를 다르게 표현한 용어를 대응시켜 기술한 용어 변환 기술을 이용하여, 검색 요구와 검색 대상의 컨텐츠 기술의 관점이 같은 표현이 되도록 변환하고 나서 컨텐츠를 검색하도록 한 것이다. 이것에 의해, 컨텐츠 기술에 복수의 관점을 기술하지 않더라도, 검색 요구에 이용할 수 있는 표현수를 늘릴 수 있고, 또한 컨텐츠 기술의 용장성을 억제할 수 있다.

Description

컨텐츠 검색 장치, 컨텐츠 검색 방법, 컨텐츠 변환 장치, 컨텐츠 변환 방법 및 프로그램을 저장한 기억 매체{APPARATUS AND METHOD FOR SEARCHING CONTENTS}
본 발명은, 영상, 음성, 텍스트 등의 멀티미디어 컨텐츠(이하, 컨텐츠라 함)의 내용을 기술하는 컨텐츠 기술을 검색하는 컨텐츠 검색 장치 및 컨텐츠 검색 방법에 관한 것이다.
종래에 검색할 수 없던 영상이나 음성을 포함하는 멀티미디어 컨텐츠의 검색, 필터링을 위한 기술 인터페이스인 MPEG-7이 표준화되었다. 이것에 의해, W3C가 표준화한 XML 방안을 베이스로 한 기술 방안을 이용하여 여러 가지 컨텐츠 기술을 만들 수 있게 되었다. 그리고, MPEG-7이, 방송, 휴대 통신, 인터넷 등에서 이용되기 시작하고 있다.
이하, MPEG-7을 이용한 컨텐츠 검색의 처리에 대하여 설명한다. MPEG-7은 컨텐츠 기술마다 컨텐츠를 검색할 때에 사용되는 관점(key word)을 기술하고 있다(예컨대, 일본 특허공개 제 2001-160066 호 공보). 이 컨텐츠 기술에 대하여 클라이언트가 검색 요구로서 소망하는 용어(key word)를 입력하면, 클라이언트가 입력한 검색 요구에 이용한 용어와, 미리 저장하여 놓은 컨텐츠 기술로 기술된 관점을비교한다. 그리고, 검색 요구와 같은 관점이 기술된 컨텐츠 기술을 추출한다. 이와 같이, 클라이언트가 요구하는 컨텐츠 기술을 검색하고 있다.
그리고, MPEG-7에서는, 컨텐츠 기술에 복수의 관점을 부여할 수 있다. 이것에 의해, 컨텐츠 기술에 다른 언어로 기술된 복수의 관점을 부여할 수 있어, 클라이언트가 컨텐츠를 검색하는 경우에, 검색 요구에 이용하는 용어로서 다른 언어로 표현한 용어를 이용할 수 있다. 예컨대, 검색 요구의 용어로서 야마다라는 이름을 입력하고자 하는 경우, 영어로 "Yamada", 일본어의 한자로 "○○" 등으로 입력할 수 있다. 즉, MPEG-7은 다국어 검색 기능을 지원하고 있다. 또, "○○"은 영어의"Yamada"를 일본어의 한자로 나타낸 것이다.
또한, MPEG-7에서는, 컨텐츠 기술에 같은 의미를 가지는 다른 용어를 관점으로서 복수 기술할 수 있다. 이것에 의해, 클라이언트가 컨텐츠를 검색하는 경우에, 검색 요구에 이용하는 용어로서 같은 의미를 가지는 다른 용어를 이용할 수 있다. 예컨대, 검색 요구로서 야마다라는 이름을 입력하고자 하는 경우, 영어로 "Yamada", 별명으로 "Yama", 일본어의 한자로 "○○", 일본어의 히라가나로 "△△△" 등으로 입력할 수 있다. 또, "△△△"는, 영어의 "Yamada"를 일본어의 히라가나로 나타낸 것이다.
그러나, MPEG-7에서는, 대응 언어의 수를 많게 할 경우, 다른 언어로 기술한 복수의 관점을 컨텐츠에 기술해야 한다. 즉, MPEG-7에서는, 대응 언어의 수를 많게 하면 할 수록, 작성하는 컨텐츠 기술의 데이터량이 늘어나게 된다.
또한, 마찬가지로, MPEG-7에서는, 대응 용어(어휘)의 수를 많게 하는 경우,컨텐츠에 같은 의미의 용어를 복수 컨텐츠로 기술해야 한다. 즉, MPEG-7에서는, 대응 용어의 수를 많게 하면 할 수록, 작성하는 컨텐츠 기술의 데이터량이 늘어나게 된다.
이상과 같이, MPEG-7에서는, 용어로서 사용할 수 있는 대응 언어의 수나 대응 용어의 수를 늘려, 용어의 표현수를 늘림으로써 컨텐츠의 용장도가 늘어나게 된다. 이 결과, 용어의 표현수를 늘리는 데 따른 비용대 효과가 떨어지고, 또한 컨텐츠를 관리하기가 어려워지는 등의 문제가 있다.
본 발명의 목적은, 단어의 표현수를 늘리더라도, 컨텐츠의 용장도가 늘어나지 않도록 하는 것이다.
도 1은 본 발명의 실시예 1에 있어서의 컨텐츠 검색 장치의 블록도,
도 2는 실시예 1에 따른 컨텐츠 기술을 나타낸 도면,
도 3은 실시예 1에 따른 컨텐츠 기술을 나타낸 도면,
도 4는, 실시예 1에 따른 용어 변환 기술의 기술 정의를 나타낸 도면,
도 5는 실시예 1에 따른 용어 변환 기술의 기술 정의로 이용하는 MPEG-7 표준 규격의 데이터 유형을 나타낸 도면,
도 6은 실시예 1에 따른 용어 변환 기술의 예를 나타낸 도면,
도 7은 실시예 1에 따른 컨텐츠 검색 장치의 동작을 설명하는 흐름도,
도 8은 본 발명의 실시예 2에 따른 컨텐츠 검색 장치의 동작을 설명하는 흐름도,
도 9는 실시예 2에 따른 변환 후의 컨텐츠 기술을 나타내는 도면,
도 10은 본 발명의 실시예 3에 따른 컨텐츠 검색 장치의 동작을 설명하는 흐름도,
도 11은 본 발명의 실시예 4에 따른 컨텐츠 검색 장치의 동작을 설명하는 흐름도,
도 12는 본 발명의 실시예 5에 따른 컨텐츠 검색 장치의 블록도,
도 13은 실시예 5에 따른 용어 변환 기술의 기술 정의를 나타낸 도면,
도 14는 실시예 5에 따른 용어 변환 기술의 예를 나타낸 도면,
도 15는 실시예 5에 따른 컨텐츠 기술을 나타낸 도면,
도 16은 실시예 5에 따른 컨텐츠 기술을 나타낸 도면,
도 17은 실시예 5에 따른 컨텐츠 기술을 나타낸 도면,
도 18은 실시예 5에 따른 컨텐츠 기술을 나타낸 도면,
도 19는 실시예 5에 따른 검색식을 나타낸 도면,
도 20은 실시예 5에 따른 검색 결과를 나타낸 도면,
도 21은 실시예 5에 따른 검색식을 나타낸 도면,
도 22는 실시예 5에 따른 검색 결과를 나타낸 도면,
도 23은 실시예 5에 따른 검색식을 나타낸 도면,
도 24는 본 발명의 실시예 6에 따른 용어 변환 기술의 예를 나타낸 도면,
도 25는 실시예 6에 따른 컨텐츠 기술을 나타낸 도면,
도 26은 실시예 6에 따른 컨텐츠 기술을 나타낸 도면.
도면의 주요 부분에 대한 부호의 설명
10, 1200 : 컨텐츠 검색 장치31, 1201 : 용어 변환 기술
32, 1202 : 컨텐츠 기술33, 1206 : 컨텐츠
101 : 저장부102 : 입력부
104, 1204 : 검색부106 : 모니터
107 : 스피커1203 : 컨텐츠 변환부
상기 목적을 달성하기 위해서, 본 발명은, 컨텐츠 기술에 포함되는 용어와 용어를 다르게 표현한 용어를 대응시켜 기술한 용어 변환 기술을 이용하여 컨텐츠 기술에 포함되는 용어를 다르게 표현한 용어로 변환하도록 했다.
이것에 의해, 용어의 표현수를 늘리더라도, 컨텐츠 기술의 용장성을 억제할 수 있다.
본 발명의 상술한 목적 및 기타 목적은 첨부된 도면과 관련하여 일실시예로서 설명하는 하기의 설명에 의해서 보다 명확해질 것이다.
(실시예 1)
이하, 본 발명의 실시예 1에 있어서의 컨텐츠 검색 장치에 대하여 설명한다. 우선, 실시예 1에 있어서의 컨텐츠 검색 장치의 구성에 대하여 도 1을 이용하여 설명한다. 도 1은 실시예 1에 있어서의 컨텐츠 검색 장치의 블럭도이다.
컨텐츠 검색 장치(10)에는, 통신 수단으로서, 인터넷 등의 네트워크(20)를 거쳐서 다른 미디어와 통신하는 미디어 접속부(100)가 마련되어 있다. 그리고, 컨텐츠 검색 장치(10)는, 미디어 접속부(100)를 이용하여, 네트워크(20)를 거쳐서 복수의 컨텐츠 기술(32)을 저장하고 있는 컨텐츠 기술 서버(30)와 통신하여, 컨텐츠 기술 서버(30)로부터 컨텐츠 기술(32)을 얻는다.
컨텐츠 검색 장치(10)에는, 컨텐츠 기술 서버(30)로부터 얻은 컨텐츠 기술(32)을 저장하는 저장부(101)가 마련되어 있다. 도 2 및 도 3에 컨텐츠 기술(32)의 예를 나타낸다. 도 2, 도 3은, 실시예 1에 따른 컨텐츠 기술을 나타낸 도면이다.
도면으로부터 알 수 있는 바와 같이, 컨텐츠 기술은, ISO/IEC 15938-2 및 ISO/IEC 15938-5(MPEG-7 표준 규격)에 근거한 것으로 이루어져 있다. 또한, 도면에 201a로 도시하는 바와 같이 도 2에 나타내는 컨텐츠 기술(32a)은 언어로서 영어가 이용되고 있다. 따라서, 도면에 202a로 도시하는 바와 같이 관점이 "Yamada"라고 영어로 기술되어 있다. 또한, 도면에 203a로 도시하는 바와 같이 관점의 중요도도 기술되어 있다.
또한, 도면에 201b로 도시하는 바와 같이 도 3에 나타내는 컨텐츠 기술(32b)은, 언어로서 일본어가 이용되고 있다. 따라서, 도면에 202b로 도시하는 바와 같이 관점이 "○○"이라고 일본어의 한자로 기술되어 있다. 또한, 도면에 203b로 도시하는 바와 같이 관점의 중요도도 기술되어 있다.
그리고, 저장부(101)에는, 용어를 변환하기 위한 용어 변환 기술(31)도 저장되어 있다. 여기서, 용어 변환 기술(31)에 대하여 설명한다. 용어 변환 기술(31)의 기술 정의(XML 방안 정의 : XML Schema Definition)(21)는, 도 4에 도시하는 바와 같이 되어 있다. 또한, 용어 변환 기술(31)의 기술 정의(21)로 이용하는 MPEG-7 표준 규격의 데이터 유형(22)은, 도 5에 도시하는 바와 같이 되어 있다. 도면에 400으로 도시하는 바와 같이 용어 변환 기술(31)은, 용어를 나타내는 Term 요소를 갖는다. Term 요소의 값에는, 같은 어휘를 다른 언어로 기술한 용어나 같은 의미를 다르게 표현한 용어를 복수 기술할 수 있다.
또한, 도면에 401로 도시하는 바와 같이 Term 요소는 용어의 유사도를 나타내는 similarity 속성을 가진다. similarity 속성의 값이 1.0인 경우에는, 단순한 언어 변환이다. 또한, 어휘의 확장인 경우에는, similarity 속성의 값으로서 1.0 미만이 기술되고, 그 속성값으로 유사도가 기술된다. 어휘의 유사도가 높을수록, similarity 속성의 값은 높아진다.
또한, 도면에 402로 도시하는 바와 같이 Term 요소는, xml:lang 속성을 갖고, xml:lang 속성의 값으로 언어의 종류가 기술된다.
도 6에, 용어 변환 기술(31)의 예를 나타낸다. 도 6의 예에서는, 601로 도시된 Term 요소에는, 영어의 "Yamada"라고 하는 용어가 기술되고, 또한 유사도로서1.0이 기술되어 있다. 602로 도시된 Term 요소에는, 일본어의 한자로 "○○"이라고 하는 용어가 기술되고, 또한 유사도로서 1.0이 기술되어 있다. 603으로 도시된 Term 요소에는, 영어로 "Yama"라고 하는 용어가 기술되고, 또한 유사도로서 0.7이 기술되어 있다. 또한, 601∼603으로 도시된 용어는, Term Exchange 요소로 묶여 있다. 즉, 영어로 기술된 "Yamada", 일본어로 기술된 "○○" 및 별명인 "Yama"가, 각각 대응하는 용어로서 기술되어 있다. 또한, "Yamada"와 "○○"은 유사도가 1.0이기 때문에, 이들의 용어는 단순히 언어 변환한 것을 나타내고 있다. 또한, "Yama"는 유사도가 0.7이기 때문에, "Yamada"와 "○○"의 표현을 바꾼 용어인 것을 나타내고 있다.
도 1로 되돌아가 컨텐츠 검색 장치(10)의 설명으로 되돌아간다. 컨텐츠 검색 장치(10)에는, 검색 요구의 용어를 입력하는 키보드 등의 입력부(102)가 마련되어 있다. 입력부(102)로부터 입력된 용어인 검색 요구는 입력 제어부(103), 메모리(108)를 거쳐서 검색부(2104)로 보내진다. 메모리(108)는 검색부(104)의 작업 메모리이다.
검색부(104)는, 입력된 검색 요구에 대응하는 관점을 가지는 세그먼트를 컨텐츠 기술(32)로부터 추출하여, 추출된 세그먼트를 함께 묶어서 요약을 작성하여, 출력 제어부(105)에 출력한다. 또한, 검색부(104)는, 입력된 검색 요구에 대응하는 관점을 가지는 컨텐츠 기술(32)을 검출하여, 출력 제어부(105)에 보내는 형태이더라도 좋다. 또, 검색부(104)의 컨텐츠 검색 처리에 관해서는, 나중에 상세히 설명한다.
출력 제어부(105)는, 검색부(104)로부터 보내진 요약 또는 컨텐츠 기술(32)의 영상 기술을 모니터(106)에, 음성 기술을 스피커(107)에 출력한다. 그리고, 모니터(106)는 요약 또는 컨텐츠 기술(32)을 표시하고, 스피커(107)는 요약 또는 컨텐츠 기술(32)을 음성 출력한다.
또한, 컨텐츠 검색 장치(10)의 각 처리부는, 시스템 버스(109)에 의해 접속되어 있다.
다음에, 컨텐츠 검색 장치(10)의 컨텐츠 검색 동작에 대하여, 도 7을 이용하여 설명한다. 도 7은 실시예 1에 따른 컨텐츠 검색 장치의 동작을 설명하는 흐름도이다.
우선, 컨텐츠 검색 장치(10)는, 입력부(102)로부터 검색 요구(RQ)가 입력되면, 입력된 검색 요구(RQ)를, 입력 제어부(103)를 거쳐서 메모리(108)에서 판독하여(s1001), 검색부(104)에 의한 검색을 개시한다.
우선, 검색부(104)는, 메모리(108) 상의 검색 요구(RQ)의 기술 언어(RQL)를 식별한다(s1002). 다음에, 검색부(104)는, 저장부(101)에 저장된 컨텐츠 기술(32)(CD)을 읽어들인다(s1003). 그리고, 검색부(104)는, 컨텐츠 기술(32)(CD)의 기술 언어(CDL)를 식별하여(s1004), 검색 요구 언어(RQL)와 컨텐츠 기술 언어(CDL)를 비교한다(s1005).
그리고, 검색부(104)는, 검색 요구 언어(RQL)와 컨텐츠 기술 언어(CDL)가 동일한 경우에 검색 요구(RQ)에 의한 컨텐츠 기술(32)(CD)의 검색을 처리한다(s1006). 구체적으로는, 검색부(104)는, s1006에 있어서, 검색 요구(RQ)와 동일한 관점을 가지는 세그먼트를 컨텐츠 기술(32)(CD)로부터 추출하여, 추출한 세그먼트를 함께 묶어 요약을 생성한다.
또, s1006에 있어서, 요약을 작성하지 않고서, 검색 요구(RQ)와 동일한 관점을 가지는 컨텐츠 기술(32)(CD)을 단순히 검색하여 출력하는 형태이더라도 좋다.
한편, 검색 요구 언어(RQL)와 컨텐츠 기술 언어(CDL)가 다른 경우에, 검색부(104)는 컨텐츠 기술 용어 변환 처리(s1007)를 행한 후, 검색 처리를 하여, 검색 결과를 모니터(106)나 스피커(107) 등에 출력한다(s1006).
다음에, 컨텐츠 기술 용어 변환 처리(s1007)에 대하여 상세히 설명한다. 우선, 검색부(104)는, 검색 요구 언어(RQL)를 검색에 사용하는 변환처 언어로서 식별한다(s1008). 다음에, 검색부(104)는, 저장부(101)에 저장하여 놓은 용어 변환 기술(31)(TD)을 읽어들인다(s1009). 그리고, 검색부(104)는, 용어 변환 기술(31)(TD)에 기술된 Term 요소를 참조하여, 저장부(101)로부터 판독한 컨텐츠 기술(32)(CD)을 변환처 언어인 검색 요구 언어(RQL)로 기술된 새로운 컨텐츠 기술로 컨텐츠 기술 언어 변환을 행한다(s1010). 구체적으로는, 검색부(104)는, 컨텐츠 기술(32)의 요소 xml:lang을 변환처 언어인 검색 요구 언어(RQL)에 맞춰서 변환하는 동시에, 컨텐츠 기술(32)에 기술된 관점을 검색 요구 언어(RQL)로 변환하여, 새로운 컨텐츠 기술을 생성한다.
예컨대, 검색 요구 언어(RQL)를 일본어로 하고, 컨텐츠 기술 언어(CDL)를 영어로 기술된 컨텐츠 기술(32a)이라고 하면, 컨텐츠 용어 변환 처리(s1008)에서는, 일본어를 변환처 언어로서 식별하고(s1008), 용어 변환 기술(31)(TD)을이용하여(s1009), 판독한 컨텐츠 기술(32)(CD)의 기술 언어(CDL)를 영어로부터 변환처 언어인 일본어로 기술한 컨텐츠 기술(32b)로 컨텐츠 기술 언어 변환을 행함으로써 새로운 컨텐츠 기술을 생성한다(s1010).
그리고, 검색부(104)는, s1006에 있어서, 검색 요구와 동일한 관점이 부여된 새로운 컨텐츠 기술의 세그먼트를 추출하고, 함께 묶어 요약을 작성하여 출력한다. 또, 검색 요구와 동일한 관점이 부여된 새로운 컨텐츠 기술을 검색하도록 하더라도 좋다.
이상과 같이, 실시예 1에 따르면, 검색 요구 언어와 컨텐츠 기술 언어가 다른 경우에도, 검색부(104)가, 용어 변환 기술(31)을 이용하여, 검색 대상의 컨텐츠 기술의 언어를 검색 요구의 언어로 변환한 새로운 컨텐츠 기술을 생성하여, 검색 요구에 대응하는 새로운 컨텐츠 기술을 검색할 수 있다. 이 결과, 검색 요구에 복수의 언어를 이용하는, 즉 다국어 검색을 가능하게 할 수 있다. 또한, 컨텐츠에 복수의 언어로 기술된 관점을 기술할 필요가 없어지기 때문에, 컨텐츠 기술의 용장성을 억제하여 비용대 효과를 높일 수 있다.
또한, 실시예 1에서는, 용어 변환 기술(31)과 컨텐츠 기술(32)을 분리하여 기술함으로써, 용어의 관리를 컨텐츠의 관리와 분리하여 실행할 수 있다. 이것에 의해, 용어 변환 기술(31)과 컨텐츠 기술(32)의 관리가 용이하여 진다.
또한, 실시예 1에 따르면, 컨텐츠 기술(32)을 MPEG-7 표준 규격에 근거하여 기술할 수 있어, 용어 변환 기술(31)의 기술 정의(XML Schema Definition)(21)를 MPEG-7 표준 규격의 데이터 유형(22)에 근거하여 기술할 수 있다. 이와 같이, 컨텐츠 기술(32) 및 용어 변환 기술(31)을 MPEG-7에 근거하여 기술함으로써, 컨텐츠 기술(32) 및 용어 변환 기술(31)에 범용성을 갖게 할 수 있다.
(실시예 2)
본 발명의 실시예 2는, 용어 변환 기술(31)을 이용하여, 한 개의 용어(단일 용어)가 관점으로서 기술된 컨텐츠 기술을, 동일한 의미인데 다르게 표현된 용어(동의어, 다용어)가 관점으로서 기술된 컨텐츠 기술로 변환하는 것이다. 그리고, 변환한 컨텐츠 기술에 대하여 검색하도록 한 것이다.
이하, 본 발명의 실시예 2에 있어서의 컨텐츠 검색 장치에 대하여 설명한다. 실시예 2에 따른 컨텐츠 검색 장치의 구성은, 실시예 1에 따른 컨텐츠 검색 장치(10)의 구성과 같다. 따라서, 실시예 2에 따른 컨텐츠 검색 장치의 구성에 대한 설명을 생략한다. 또한, 용어 변환 기술(31)에 관해서도 실시예 1과 마찬가지다.
다음에, 실시예 2에 따른 컨텐츠 검색 장치의 검색 처리에 대하여, 도 8을 이용하여 설명한다. 도 8은 실시예 2에 따른 컨텐츠 검색 장치의 동작을 설명하는 흐름도이다.
우선, 컨텐츠 검색 장치(10)는, 입력부(102)로부터 검색 요구(RQ)가 입력되면, 입력된 검색 요구(RQ)를, 입력 제어부(103)를 거쳐서 메모리(108)에서 읽어들여(s1101), 검색부(104)에 의한 검색을 개시한다.
우선, 검색부(104)는, 저장부(101)에 저장된 컨텐츠 기술(32)(CD)을 읽어들인다(s1102). 다음에, 검색부(104)는, 용어 변환 기술(31)을 이용하여, 한 개의 용어(단일 용어)로 기술된 컨텐츠 기술(32)을, 동일한 의미의 다른 어휘(동의어)로 표현된 용어(다(多)용어)로 기술된 컨텐츠 기술로 변환하는 컨텐츠 기술 용어 변환 처리(s1103)로 이행된다.
우선, 검색부(104)는, 검색 요구(RQ)에서 지정 또는 미리 설정된 변환처 어휘를 식별한다(s1104). 다음에, 검색부(104)는, 저장부(101)에서 용어 변환 기술(31)(TD)을 읽어들인다(s1105). 그리고, 검색부(104)는, 판독한 용어 변환 기술(31)(TD)을 이용하여, 컨텐츠 기술(32)에 기술된 관점을 다른 표현을 이용한 용어(동의어)로 변환한 새로운 컨텐츠 기술을 생성하는 컨텐츠 기술 용어 변환 처리를 한다(s1106).
구체적으로는, s1106에 있어서, 검색부(104)는, 검색 요구(RQ)에서 지정된 변환처 어휘와 유사도를 식별한다. 다음에, 검색부(104)는, 용어 변환 기술(31)에 있는 복수의 변환 후보의 용어 중 "변환처 어휘의 언어이면서 지정된 유사도에 대응하는 용어"인 후보를 이용하여, 단일 용어의 관점을 "변환처 어휘의 언어이면서 지정된 유사도에 대응하는 용어"로 기술한 동의어(다용어)의 관점으로 변환하여, 단일 용어의 관점을 가지는 컨텐츠 기술(32)을 다용어의 관점을 가지는 컨텐츠 기술로 변환한다.
검색 요구(RQ)에서 지정 또는 미리 설정된 변환처 어휘의 언어가 일본어 및 영어로 유사도가 0.6이라고 하면, 용어 변환 기술(31)에 있는 복수의 변환 후보 중 "일본어이면서 유사도가 0.6 이상" 또는 "영어이면서 유사도가 0.6 이상"인 후보를이용해서, 단일 용어의 관점을 다용어(동의어)의 관점으로 변환하여, 단일 용어의 관점을 가지는 컨텐츠 기술(32)을 다용어의 관점을 가지는 컨텐츠 기술로 컨텐츠 기술 용어 변환을 행한다.
예컨대, 도 6에 나타내는 용어 변환 기술(31)을 이용하여 도 2에 나타내는 컨텐츠 기술(32a) 또는 도 3에 나타내는 컨텐츠 기술(32b)(단일 용어)을 컨텐츠 기술 용어 변환하면, 도 9에 도시된 컨텐츠 기술(34)(동의어, 다용어)이 된다. 도면으로부터 알 수 있는 바와 같이, 컨텐츠 기술(32a)의 Seg0으로 도시된 세그먼트에는 관점으로서 "Yamada", 컨텐츠 기술(32b)의 Seg0으로 도시된 세그먼트에는 관점으로서 "○○"이라고 하는 한 개의 용어가 기술되어 있을 뿐이다. 이것에 대하여, 도 9에 나타내는 컨텐츠 기술(34)의 Seg0으로 도시된 세그먼트에는 관점으로서, 용어 변환 기술(31)에 기술된 용어 중 "Yamada" 또는 "○○"에 대하여 일본어 및 영어이고 유사도가 0.6 이상인 용어인 "Yamada", "○○", 및 "Yama"가 기술되어 있다.
또, 변환처의 어휘의 언어가 검색 요구(RQ)에서 지정된다고 했지만, 미리 설정되어 있는 형태이더라도 좋다.
그리고, 검색부(104)는, 컨텐츠 기술 용어 변환 처리(s1103)를 행한 후, 컨텐츠 기술 변환 처리를 하여 생성한 새로운 컨텐츠 기술에 대하여, 입력된 검색 요구를 이용하여 검색 처리를 한다(s1107). 또, s1107에 있어서의 검색 처리는, 실시예 1에 따른 s1006의 검색 처리와 같기 때문에, 상세한 설명을 생략한다.
이렇게 하여, 검색부(104)는, 변환된 새로운 컨텐츠 기술(34)을 검색 요구로검색한 결과를 출력한다.
이상과 같이, 실시예 2에 따르면, 용어 변환 기술(31)을 마련함으로써, 입력된 검색 요구와 관점이 다른 경우에, 검색 대상의 컨텐츠 기술의 관점을 용어 변환 기술에 따라서 적어도 하나 이상의 다르게 표현한 용어(어휘, 동의어)로 변환하고 나서 검색할 수 있다. 이것에 의해, 컨텐츠의 와일드카드 검색을 가능하게 할 수 있다. 또한, 컨텐츠에 다수의 관점을 기술하지 않아도 되기 때문에, 컨텐츠 기술의 용장성을 억제하여 비용대 효과를 높일 수 있다.
또한, 용어 변환 기술과 컨텐츠 기술을 분리하여 기술함으로써, 용어의 어휘의 관리를 컨텐츠 기술로부터 분리하여 관리를 용이하게 할 수 있다.
(실시예 3)
본 발명의 실시예 3은, 용어 변환 기술(31)을 이용하여, 검색 요구의 언어를 컨텐츠 기술의 언어로 변환하고 나서 검색하도록 한 것이다. 그리고, 검색한 컨텐츠 기술을, 검색 요구의 언어로 변환하도록 한 것이다.
이하, 본 발명의 실시예 3에 있어서의 컨텐츠 검색 장치에 대하여 설명한다. 실시예 3에 따른 컨텐츠 검색 장치의 구성은, 실시예 1에 따른 컨텐츠 검색 장치(10)의 구성과 같다. 따라서, 실시예 3에 따른 컨텐츠 검색 장치의 구성의 설명을 생략한다. 또한, 용어 변환 기술(31)에 관해서도 실시예 1과 마찬가지다.
다음에, 실시예 3에 따른 컨텐츠 검색 장치의 검색 처리에 대하여, 도 10을 이용하여 설명한다. 도 10은 실시예 3에 따른 컨텐츠 검색 장치의 동작을 설명하는 흐름도이다.
우선, 컨텐츠 검색 장치(10)는, 입력부(102)로부터 검색 요구(RQ)가 입력되면, 입력된 검색 요구(RQ)를, 입력 제어부(103)를 거쳐서 메모리(108)에서 읽어들여(s1201), 검색부(104)에 의한 검색을 개시한다.
우선, 검색부(104)는, 메모리(108) 상의 검색 요구(RQ)의 기술 언어(RQL)를 식별한다(s1202). 다음에, 검색부(104)는 저장부(101)에 저장된 컨텐츠 기술(32)(CD)을 읽어들인다(s1203). 그리고, 검색부(104)는, 컨텐츠 기술(32)(CD)의 기술 언어(CDL)를 식별하여(s1204), 검색 요구 언어(RQL)와 컨텐츠 기술 언어(CDL)를 비교한다(s1205).
그리고, 검색부(104)는, 검색 요구 언어(RQL)와 컨텐츠 기술 언어(CDL)가 동일한 경우에 검색 요구(RQ)에 의한 컨텐츠 기술(32)(CD)의 검색 처리를 한다(s1206). 또, s1206에 있어서의 검색 처리는, 실시예 1에 따른 s1006의 검색 처리와 같기 때문에, 상세한 설명을 생략한다.
한편, 검색부(104)는, 검색 요구 언어(RQL)와 컨텐츠 기술 언어(CD L)가 다른 경우에 검색 요구 용어 변환 처리(s1207)를 행한 후, 검색 처리를 한다(s1206).
다음에, 검색 요구 용어 변환 처리(s1207)에 대하여, 설명한다. 우선, 검색부(104)는, 컨텐츠 기술(32)의 언어(CDL)를 검색에 사용하는 변환처 언어로서 식별한다(s1208). 다음에, 검색부(104)는, 저장부(101)에 저장하여 놓은 용어 변환 기술(31)(TD)을 읽어들인다(s1209).
다음에, 검색부(104)는, 용어 변환 기술(31)(TD)에 기술된 Term 요소를 참조하여, 검색 요구(RQ)의 기술 언어(RQL)와 동일한 의미를 갖고, 또한 컨텐츠 기술(32)의 기술 언어(CDL)로 기술된 용어로 변환한다. 그리고, 이 변환한 검색 요구(RQ)를 새로운 검색 요구(RQ)로 한다(s1210).
예컨대, 검색 요구 언어(RQL)를 일본어로 하고, 컨텐츠 기술(32)의 언어(CDL)를 영어라고 하면, 검색 요구 용어 변환 처리 s1207에서는, CDL=영어를 변환처 언어로서 식별하여(s1208), 저장부(101)로부터 판독한 용어 변환 기술(31)(TD)을 이용하여(s1209), 검색 요구(RQ)를 그 기술 언어(RQL=일본어)부터 변환처 언어인 영어로 기술된 검색 요구로 검색 요구 언어 변환을 한다(s1210).
그리고, 검색부(104)는, s1210에서 변환된 새로운 검색 요구를 이용하여 컨텐츠 기술의 검색 처리를 한다(s1206).
다음에, 검색부(104)는, s1206에 있어서 검색된 검색 결과(RS)의 언어가, 컨텐츠 기술 언어(CDL)이며 입력된 사용자가 인식할 수 있는 언어인 검색 요구 언어(RQL)와는 다르기 때문에, 검색 결과(RS)의 언어를 검색 요구 언어(RQL)로 변환하는 처리로 이행한다.
우선, 검색부(104)는, 검색 결과(RS)의 언어가 검색 요구 언어(RQL)와 동일한 지의 여부를 판단하기 위해서, 검색 요구 언어(RQL)와 컨텐츠 기술 언어(CDL)를 비교한다(s1211). 그리고, 검색 요구 언어(RQL)와 컨텐츠 기술 언어(CDL)가 동일한 경우에는, 검색 결과(RS)가 검색 요구 언어(RQL)와 동일한 언어로 기술되어 있게 된다. 즉, 사용자가 사용하는 언어와 동일한 언어로 기술되어 있기 때문에, 언어 변환을 하지 않고 검색 결과(RS)를 출력하여 처리를 종료한다.
한편, 검색 요구 언어(RQL)와 컨텐츠 기술 언어(CDL)가 다른 경우에는, 검색 결과(RS)를 사용자가 인식할 수 있는 언어인 검색 요구 언어(RQL)와 동일한 언어로 기술해야 한다. 그래서, 다음에, 검색부(104)는, 검색 결과 용어 변환 처리로 이행한다(s1212).
검색 결과 용어 변환 처리 s1212에 있어서, 검색부(104)는, 우선, 컨텐츠 기술 언어(CDL)로 기술한 검색 요구에서 컨텐츠 기술(32)을 검색한 검색 결과(RS)를 읽어들인다(s1213). 다음에, 검색부(104)는 검색 결과(RS)의 기술 언어(RSL)를 식별한다(s1214). 다음에, 검색부(104)는 검색 요구 언어(RQL)를 변환처 언어로서 식별한다(s1215). 그리고, 검색부(104)는, 저장부(101)로부터 용어 변환 기술(31)(TD)을 읽어들여(s1216), 용어 변환 기술(31)을 이용하여, 검색식 결과(RS)의 검색 결과 언어(RSL)를 변환처 언어인 검색 요구 언어(RQL)로 변환하는 검색 결과 언어 변환을 한다(s1217).
예컨대, 검색 결과 용어 변환 처리 s1212에 있어서, 컨텐츠 기술 언어(CDL)가 영어이고 검색 결과 언어(RSL)가 영어이며, 검색 요구 언어(RQL)가 일본어인 경우, 검색부(104)는, 검색 기술 언어(RSL=영어)를 식별하고, RQL=일본어를 변환처 언어로서 식별한다. 그리고, 검색부(104)는, 저장부(101)로부터 읽어들인 용어 변환 기술(31)(TD)을 이용하여, 검색 결과(R S)를 검색 결과 언어(RSL=영어)로부터 변환처 언어인 일본어로 기술된 검색 결과로 검색 결과 언어 변환을 행한다.
그리고, 검색부(104)는 검색 결과 언어 변환을 행한 검색 결과(RS)를 출력한다.
이상과 같이, 실시예 3에 따르면, 검색 요구 언어와 컨텐츠 기술 언어가 다른 경우이더라도, 검색부(104)가, 용어 변환 기술(31)을 이용해서 검색 요구의 언어를 컨텐츠 기술의 언어로 변환하여, 변환한 검색 요구를 이용해서 컨텐츠 기술을 검색할 수 있다. 이 결과, 컨텐츠 기술(32)의 언어와 다른 언어의 검색 요구를 사용할 수 있다. 즉 다국어 검색을 가능하게 할 수 있다. 또한, 컨텐츠에 복수의 언어를 기술할 필요가 없어지기 때문에, 컨텐츠 기술의 용장성을 억제하여 비용대 효과를 높일 수 있다.
또한, 실시예 3에 따르면, 변환한 검색 요구를 이용하여 컨텐츠 기술을 검색한 경우이더라도, 검색 결과의 언어를 검색 요구 언어로 변환하고 나서 출력할 수 있다. 이것에 의해, 검색 결과의 언어를 사용자가 사용하는 언어, 즉 인식할 수 있는 언어로 변환할 수 있다. 따라서, 사용자가 검색 결과를 인식할 수 있다.
(실시예 4)
본 발명의 실시예 4는, 용어 변환 기술(31)을 이용하여, 검색 요구를 동일한 의미를 갖는 다른 용어로 변환하고 나서 검색하도록 한 것이다.
이하, 본 발명의 실시예 4에 있어서의 컨텐츠 검색 장치에 대하여 설명한다. 실시예 4에 따른 컨텐츠 검색 장치의 구성은, 실시예 1에 따른 컨텐츠 검색 장치(10)의 구성과 같다. 따라서, 실시예 4에 따른 컨텐츠 검색 장치의 구성의 설명을 생략한다. 또한, 용어 변환 기술(31)에 관해서도 실시예 1과 마찬가지다.
다음에, 실시예 4에 따른 컨텐츠 검색 장치의 검색 처리에 대하여, 도 11을이용하여 설명한다. 도 10은 실시예 3에 따른 컨텐츠 검색 장치의 동작을 설명하는 흐름도이다.
우선, 컨텐츠 검색 장치(10)는, 입력부(102)로부터 검색 요구(RQ)가 입력되면, 입력된 검색 요구(RQ)를, 입력 제어부(103)를 거쳐서 메모리(108)에서 읽어들여(s1301), 검색부(104)에 의한 검색을 개시한다.
우선, 검색부(104)는, 저장부(101)에 저장된 컨텐츠 기술(32)(CD)을 읽어들인다(s1302). 다음에, 검색부(104)는, 용어 변환 기술(31)을 이용하여, 검색 요구(RQ)를, 동일한 의미를 갖는 다른 용어(어휘)로 변환하는 컨텐츠 기술 용어 변환 처리로 이행한다(s1303).
검색 요구 용어 변환 처리 s1303에 있어서, 검색부(104)는, 변환처 어휘를 식별하여(s1304), 저장부(101)로부터 읽어들인 용어 변환 기술(31)(TD)을 이용하여(s1305), 검색 요구의 어휘 변환을 행한다(s1306).
예컨대, 검색 요구(RQ)에서 지정된 변환처 어휘의 언어가 일본어로 유사도가 0.6이라고 하면, 용어 변환 기술(31)에 있는 복수의 변환 후보 중 "일본어로 유사도가 0.6 이상"인 후보를 이용하여, 한 개의 용어로 이루어지는 검색 요구(단일 용어)를, 복수의 용어를 가지는 검색 요구(동의어, 다용어)로 검색 요구 어휘 변환을 행한다.
그리고, 검색부(104)는, 검색 요구 용어 변환 처리 s1304에 있어서, 변환한 동의어(다용어)의 검색 요구(RQ)를 이용하여 컨텐츠 기술(32)을 검색하여, 검색 결과를 출력한다(s1307). 또한, 검색부(104)는, s1307에 있어서, 검색 요구(RQ)가복수로 된 경우에는, 복수의 검색 요구(RQ) 전부를 이용하여 컨텐츠 기술(32)을 검색한다.
또, s1307에 있어서의 검색 처리는, 실시예 1에 따른 s1006의 검색 처리와 같기 때문에, 상세한 설명을 생략한다.
또한, 이렇게 하여, 검색부(104)는, 컨텐츠 기술(32)을, 변환된 검색 요구(동의어, 다용어)로 검색한 결과를 검색 결과로서 출력한다.
이상과 같이, 실시예 따르면, 용어 변환 기술(31)을 이용하여, 검색 요구를 적어도 하나 이상의 용어의 어휘로 변환하고 나서 컨텐츠 기술의 검색할 수 있다. 이것에 의해, 사용자가 컨텐츠 기술의 관점에 이용되고 있는 용어를 모르더라도 같은 의미를 가지는 용어를 이용하여 검색한다, 소위 와일드카드 검색을 가능하게 할 수 있다. 또한, 컨텐츠 기술에 다수의 관점을 기술할 필요가 없어지기 때문에, 컨텐츠 기술의 용장성을 억제하여 비용대 효과를 높일 수 있다.
또, 모든 실시예에 있어서, 검색부(104), 용어 변환 기술(31)은, 클라이언트측이 아니고, 서버측 또는 완전히 별도의 사이트에 있더라도 좋다. 또한, 컨텐츠 기술(32)을, 네트워크를 거쳐서 컨텐츠 기술 서버로부터 취득하는 형태로 설명했지만, 컨텐츠 기술을 취득하는 형태는 이 밖의 것이더라도 좋다. 예컨대, CD-ROM 등의 기억 매체에 기억된 컨텐츠 기술(32)을 저장부(101)에 저장하는 형태라도 좋다.
또한, 본 발명에서 이용한 컨텐츠 기술예(32), 용어 변환 기술(31)의 기술 방법은 일례이며, 여러가지 기술이 가능하다. 또한, 변환처 어휘 식별 방법에 관해서는, 언어와 유사도 이외의 종류이더라도 좋고, 그 조합 등 상기에 한정되지 않는다.
또한, 본 발명의 검색부(104)가 실행하는 처리를, 컴퓨터를 이용하여 소프트웨어에 의해서 실현하는 것도 상관없고, 그들의 처리 기능을 발휘하는 전용 하드웨어를 이용하여 실현하더라도 상관없다.
(실시예 5)
본 발명의 실시예 5는, 컨텐츠 기술에 포함되는 용어를 다른 언어로 변환함으로써, 용어의 언어수를 늘리더라도, 컨텐츠 기술의 용장성이 억제되도록 한 것이다.
이하, 실시예 5에 따른 컨텐츠 검색 장치에 대하여 설명한다. 우선, 실시예 5에 따른 컨텐츠 검색 장치의 구성에 대하여 도 12를 이용하여 설명한다. 도 12는, 실시예 5에 따른 컨텐츠 검색 장치의 블럭도이다. 또, 이미 설명한 부분과 동일한 부분에는 동일한 부호를 부여하고, 상세한 설명을 생략한다.
실시예 5에 따른 컨텐츠 검색 장치(1200)에는, 변환부(1203)가 마련되어 있다. 변환부(1203)는 저장부(101)에 저장된 용어 변환 기술(1201)을 이용하여 컨텐츠 기술(1202)을 변환한다.
또한, 컨텐츠 검색 장치(1200)에는, 저장부(101)에 저장된 검색식(1205)을 이용하여, 입력부(102)로부터 입력된 검색 요구에 대응하는 컨텐츠 기술(1202)을 검색하여, 검색한 컨텐츠 기술(1202)에 포함되는 용어를 추출하는 검색부(1204)가 마련되어 있다.
또, 저장부(101)에 저장된 컨텐츠 기술(1202)은, 컨텐츠 기술 서버(30)로부터 얻은 것이다.
다음에, 실시예 5에 따른 용어 변환 기술(1201)에 대하여 도 13, 도14를 이용하여 설명한다. 우선, 도 13을 이용하여, 용어 변환 기술(1201)의 기술 정의(XML Schema Definition)에 대하여 설명한다.
도면에 1301로 도시하는 바와 같이 실시예 5에 따른 기술 정의(1300)에는, 요소로서 TermExchangeCollection이 정의되어 있다.
또한, 도면에(1302)에 도시하는 바와 같이 TermExchangeCollection(1301)에는, 요소로서 TermExchangePack이 하나 이상 기술될 수 있다고 정의되어 있다. 또한, 도면에 1306으로 도시하는 바와 같이 TermExchangePack(1302)에는 대상으로 삼는 컨텐츠 기술의 URL이 기술된다고 정의되어 있다.
또한, 도면에 1304로 도시하는 바와 같이 TermExchangePack(1302)에는, 요소로서 TermExchange를 한 개 이상 기술할 수 있다고 정의되어 있다.
TermExchange(1305)에 관해서는, 실시예 1에서 설명한 것과 같은 것으로 되어있다. 구체적으로는, 도면에 400으로 도시하는 바와 같이 TermExchange(1305)는, 용어를 나타내는 Term 요소를 가진다. 또한, Term 요소의 값에는, 동일한 어휘를 다른 언어로 기술한 용어나 동일한 의미를 다르게 표현한 용어를 복수 기술할 수 있다. 또한, 도면에 401로 도시하는 바와 같이 Term 요소는 용어의 유사도를 나타내는 similarity 속성을 가진다. similarity 속성의 값이 1.0인 경우는 단순한 언어 변환이다. 또한, 어휘의 확장의 경우에는, similarity 속성의 값으로서1.0 미만이 기술되어, 그 속성값으로 유사도가 기술된다. 어휘의 유사도가 높을 수록, similarity 속성의 값은 높아진다.
이와 같이 기술 정의(1300)를 정의함으로써, TermExchangePack(1302)을 이용하여 복수의 용어를 동일한 의미마다 합쳐서 기술할 수 있다. 이것에 의해, 용어 변환 기술(1201)에 용어와 용어를 다른 언어로 표현한 용어의 조(組)를 복수로 할 수 있다.
다음에, 도 14를 이용하여, 용어 변환 기술(1201)의 구체예에 대하여 설명한다. 도 14는 실시예 5에 따른 용어 변환 기술을 나타낸 도면이다.
실시예 5에 따른 용어 변환 기술(1201a)에는, 복수의 TermExchangePack(1401a, 1401b)이 기술되어 있다. TermExchangePack(1401a, 1401b)에는, 각각 대상으로 되는 URL(1402a, 1402b)이 기술되어 있다.
또한, TermExchangePack(1401a)에는, 복수의 TermExchange(1403a∼1403d)가 기술되어 있다.
TermExchange(1403a)에는, Term 요소로서, 영어의 "Creator"와, 일본어의 "□□□"이라는 용어가 기술되어 있고, 각각 유사도로서 1.0이 기술되어 있다. 이와 같이, 영어의 "Creator"와, 일본어의 "□□□"가 대응되어 기술되어 있다. 또, "□□□"는, 영어의 "Creator"를 일본어의 한자로 나타낸 것이다.
또한, TermExchange(1403b)에는, Term 요소로서, 영어의 "Yamada"와, 일본어의 "○○"이라는 용어가 기술되어 있고, 각각 유사도로서 1.0이 기술되어 있다. 이와 같이, 영어의 "Yamada"와, 일본어의 "○○"이 대응되어 기술되어 있다.
또한, TermExchange(1403c)에는, Term 요소로서, 영어의 "Taro"와, 일본어의 "△△"이라는 용어가 기술되어 있고, 각각 유사도로서 1.0이 기술되어 있다. 이와 같이, 영어의 "Taro"와, 일본어의 "△△"이 대응되어 기술되어 있다. 또, "△△"은, 영어의 "Taro"를 일본어의 한자로 나타낸 것이다.
또한, TermExchange(1403d)에는, Term 요소로서, 영어의 "Tokyo"와, 일본어의 "▽▽"이라는 용어가 기술되어 있고, 각각 유사도로서 1.0이 기술되어 있다. 이와 같이, 영어의 "Tokyo"와, 일본어의 "▽▽" 이 대응되어 기술되어 있다. 또, "▽▽"은 영어의 "Tokyo"를 일본어의 한자로 나타낸 것이다.
또한, TermExchangePack(1401b)에는, 복수의 TermExchange(1403e∼1403f)가 기술되어 있다.
TermExchange(1403e)에는, Term 요소로서, 영어의 "Island Series"와, 일본어의 "○×△○×△"라는 용어가 기술되어 있고, 각각 유사도로서 1.0이 기술되어 있다. 이와 같이, 영어의 "island Series"와, 일본어의 "○×△○×△"가 대응되어 기술되어 있다. 또, "○×△○×△"는 영어의 "island Series"를 일본어로 나타낸 것이다.
또한, TermExchange(1403f)에는, Term 요소로서, 영어의 "Sports Channel"과, 일본어의 "□△○□△○"이라는 용어가 기술되어 있고, 각각 유사도로서 1.0이 기술되어 있다. 이와 같이, 영어의 "Sports Channel"과, 일본어의 "□△○□△○"이 대응되어 기술되어 있다. 또, "□△○□△○"은 영어의 "Sports Channel"을 일본어로 나타낸 것이다.
이와 같이, TermExchangePack(1401a, 1401b)을 이용함으로써, 다른 기술에 대응하는 용어 변환을 하나의 용어 변환 기술로 합칠 수 있다.
또한, TermExchangePack(1401a, 1401b)에 복수의 TermExchange(1403a∼1403f)를 기술함으로써, 대상으로 되는 컨텐츠 기술에 포함되는 모든 용어와 이들의 용어를 다르게 표현한 용어를 기술할 수 있다.
또한, TermExchange(1403e, 1403f)에는, 용어로서 문절(文節)이 사용되어 있다. 이와 같이, 용어 변환 기술(1201a)에는 용어로서 문절도 사용할 수 있다.
다음에, 컨텐츠 변환부(1203)의 컨텐츠 변환 처리에 대하여 상세히 설명한다.
먼저, 컨텐츠 변환부(1203)가, 용어 변환 기술(1201a)을 사용하여, 도 15에 나타내는 컨텐츠 기술(1202a)을 도 16에 나타내는 컨텐츠 기술(1202b)로 변환하는 처리에 대하여 설명한다.
우선, 컨텐츠 변환부(1203)는, 컨텐츠 기술(1202a)을 참조하여, 컨텐츠 기술(1202a)을 제작한 사람에 관한 정보인 <Creator>로부터 </Creator>를 참조한다. 그리고, 컨텐츠 변환부(1203)는, 컨텐츠 기술(1202a)을 제작한 사람의 역할을 나타내는 "Creator"(1501), 컨텐츠 기술(1202a)을 제작한 사람의 이름을 나타내는 "Taro"(1502), 컨텐츠 기술(1202a)을 제작한 사람의 성을 나타내는 "Yamada" (1503)를 추출한다.
다음에, 컨텐츠 변환부(1203)는, 컨텐츠 기술(1202a)을 제작한 장소에 관한 정보인 "Tokyo"(1504)를 추출한다.
다음에, 컨텐츠 변환부(1203)는, 용어 변환 기술(1201a)의 컨텐츠 기술(1202a)에 대응하는 부분인 도면의 1403a∼1403d를 참조한다. 그리고, 컨텐츠 변환부(1203)는, 추출한 "Creator"(1501), "T aro"(1502), "Yamada"(1503), 및 "Tokyo"(1504)를 다른 언어로 표현한 용어를 추출한다.
구체적으로는, 컨텐츠 변환부(1203)는, "Creator"(1501)에 대하여 "□□□", "Taro"(1502)에 대하여 "△△", "Yamada"(1503)에 대하여 "○○", 및 "Tokyo"(1504)에 대하여 "▽▽"을 추출한다.
다음에, 컨텐츠 변환부(1203)는, 컨텐츠 기술(1202a)의 "Creator"(1501) 부분을 "□□□"(1601), "Taro"(1502) 부분을 "△△"(1602), "Yamada"(1503) 부분을 "○○"(1603), 및 "Tokyo"(1504) 부분을 "▽▽"(1604)으로 변환한다.
또한, 컨텐츠 변환부(1203)는, 컨텐츠 기술(1202a)의 기술 언어를 나타내는 MPEG 요소의 xml:lang 속성값을 "en"(1505)으로부터 "ja"(1605)로 변환한다.
이렇게 하여, 컨텐츠 변환부(1203)는, 영어로 되어 있던 컨텐츠 기술(1202a)을 일본어로 쓰여진 컨텐츠 기술(1202b)로 변환한다.
다음에, 컨텐츠 변환부(1203)가, 용어 변환 기술(1201a)을 사용하여, 도 17에 나타내는 컨텐츠 기술(1202c)을 도 18에 나타내는 컨텐츠 기술(1202d)로 변환하는 처리에 대하여 설명한다.
우선, 컨텐츠 변환부(1203)는, 컨텐츠 기술(1202c)을 참조하여, 컨텐츠 기술(1202c)에 관한 정보인 <Creation>로부터 </Creation>를 참조한다. 그리고, 컨텐츠 변환부(1203)는, 컨텐츠 기술(1202a)의 타이틀을 나타내는 "Islandseries"(1701), 컨텐츠 기술(1202a)을 제작한 에이전트의 이름을 나타내는 "Sports Channnel"(1702)을 추출한다.
다음에, 컨텐츠 변환부(1203)는, 용도 변환 기술(1201a)의 컨텐츠 기술(1202c)에 대응하는 부분인 도면의 1403e∼1403f를 참조한다. 그리고, 컨텐츠 변환부(1203)는, 추출한 "Island series"(1701), "Sports Channnel"(1702)을 다른 언어로 표현한 용어를 추출한다.
구체적으로는, 컨텐츠 변환부(1203)는, "Island series"(1701)에 대하여 "○×△○×△", 및 "Sports Channne1"(1702)에 대하여 "□△○□△○"을 추출한다.
다음에, 컨텐츠 변환부(1203)는, 컨텐츠 기술(1202a)의 "Island series"(1701) 부분을 "○×△○×△"(1801), 및 "Sports Channnel"(1702) 부분을 "□△○□△○"(1802)로 변환한다.
또한, 컨텐츠 변환부(1203)는, 요소 <Title>과 <Name>의 기술 언어를 나타내는 MPEG 요소의 xml:lang 속성값을 각각"en"(1703, 1704)으로부터 "ja"(1803, 1804)로 변환한다.
이렇게 하여, 컨텐츠 변환부(1203)는, 영어로 되어 있던 컨텐츠 기술(1202c)을 일본어로 쓰여진 컨텐츠 기술(1202d)로 변환한다.
다음에, 검색부(1204)의 동작에 대하여 상세히 설명한다.
검색부(1204)는, W3C의 XQuery 규격에 근거한 검색식(1204)을 이용하여 검색한다.
여기서, 검색식(1205)에 대하여, 도 19를 이용하여 상세히 설명한다. 도 19는, 실시예 5에 따른 검색식을 나타낸 도면이다.
도 19에 나타내는 검색식(1205a)에는, 도면에 2201로 도시하는 바와 같이 컨텐츠 기술의 참조처인 URL("http://foo/mpeg7-2.xml")이 기술되고, 또한 이 컨텐츠 기술 중 참조 장소(/Mpeg7/∼/Creation)가 기술되어 있다.
또한, 검색식(1205a)에는, 도면에(2202)에 도시된 바와 같이 컨텐츠 기술의 타이틀에 기술된 용어가, 검색 용어인 "Island series"인지의 여부를 판단하는 조건식이 기술되어 있다. 또, 이 예는, 입력부(102)로부터 검색 용어로서 "Island series"가 입력된 경우의 검색식이다.
그리고, 검색식(1205a)은, 도면에 2202로 나타내는 조건을 충족하는 경우에, "return" 이하를 실행하는 기술로 되어 있다.
구체적으로는, 검색식(1205a)에는, return 이하에 있는 { } 안에 도시된 위치에 기술된 용어를 대입하도록 기술되어 있다.
이 예에서는, 도면에 2203로 나타내는 { } 안에는, 컨텐츠 기술 중 Mpeg 7 요소 하의 Description 요소 하의 CreationInformation 요소 하의 Creation 요소(여기까지를 변수$b로 함) 하의 Creator 요소 하의 Agent 요소 하의 Name 요소의 속성 값이 대입되게 되어 있다. 또한, 도면에 2204로 나타내는 { } 안에는, 컨텐츠 기술 중 변수 $b 하의 Creator 요소 하의 Agent 요소 하의 Name 요소의 xml:lang 속성의 값이 대입되게 되어 있다. 또한, 도면에 2205로 나타내는 { } 안에는, 컨텐츠 기술 중 변수$b 하의 Creator 요소 하의 Agent 요소 하의 Name 요소의 값이 대입되게 되어 있다.
또, 검색식(1205a)은, XQuery에 근거한 것이기 때문에, < > 부분은 그대로 결과로서 출력된다.
다음에, 검색부(1204)가, 도 19에 나타내는 검색식(1205a)을 이용하여, 도 17에 나타내는 컨텐츠(1202c)를 검색한 결과를 도 20에 나타낸다.
도 20에 도시하는 바와 같이 검색부(1204)는, 검색식(1205a)에 < >로 기술된 부분은, 그대로 출력되어 있다.
또한, 검색부(1204)는, 검색식(1205a)의 { } 안에 대응하는 용어를 대입하고 있다.
구체적으로는, 도면에 2301로 나타내는 부분에 도 17에 1705로 나타내는 용어를 대입하고, 도면에 2302로 나타내는 부분에 도 17에 1704로 나타내는 용어를 대입하며, 도면에 2303로 나타내는 부분에 도 17에 1702로 나타내는 용어를 대입하고 있다.
이렇게 하여, 검색부(1204)는, 검색식(1205a)을 이용하여, 입력된 검색 용어에 대응하는 컨텐츠 기술(1202c)에 포함되는 용어를 추출하여 출력한다.
다음에, 검색부(1204)가 도 21에 나타내는 검색식을 이용한 경우의 검색에 대하여 설명한다.
도 21에 나타내는 검색식(1205b)은, 검색 용어로서 "○×△○×△"가 입력된 경우의 것이다. 따라서, 검색식(1205b)에는, 도면에(2400)에 도시하는 바와 같이 컨텐츠의 타이틀에 기술된 용어가, 검색 용어인 "○×△○×△"인지의 여부를 판단하는 조건식이 기술되어 있다.
또한, 검색식(1205b)은, 도 18에 나타내는 컨텐츠 기술(1202c)에 대응하는 것이기 때문에, 도면에 2401로 나타내는 바와 같은 컨텐츠 기술의 참조처가 기술되어 있다.
검색부(1204)가, 도 21에 나타내는 검색식(1205b)을 이용하여, 도 18에 나타내는 컨텐츠 기술(1202d)을 검색하면, 도 22에 나타내는 검색 결과가 출력된다.
검색부(1204)는, 도면에 2501로 나타내는 부분에 도 18에 1805로 나타내는 용어를 대입하고, 도면에 2502로 나타내는 부분에 도 18에 1804에 나타내는 용어를 대입하며, 도면에 2503으로 나타내는 부분에 도 18에 1802로 나타내는 용어를 대입하고 있다.
다음에, 검색식의 별도의 예를 도 23에 나타낸다.
도 23에 나타내는 검색식(1205c)은, 복수의 검색 용어에 대응하게 되어 있다. 구체적으로는, 검색 용어로서 "Island series"와 "○×△○×△"가 입력된 경우의 것이다. 따라서, 검색식(1205c)은, 도면에 2600으로 도시하는 바와 같이 컨텐츠 기술의 타이틀에 기술된 용어가 검색 용어인 "Island series"인지 또는 "○×△○×△"인지의 여부를 판단하는 조건식이 기술되어 있다.
검색부(1204)가, 검색식(1205c)을 이용하여 검색을 하면, 타이틀 부분에, "Islahd series" 또는"○×△○×△"가 기술된 컨텐츠 기술을 검색하여, 검색한 컨텐츠 기술에 포함되는 용어를 추출한다.
이와 같이, 다른 언어의 다르게 표현된 검색 용어를 이용해서도 검색할 수 있다.
또, 상술한 검색은 모두 타이틀에 대한 검색이지만, 4행째의 where문의 값을 변환·전개함으로써, 다른 부분에 대한 검색도 실행할 수 있다.
예컨대, 3행째를 for $b in document(http://foo/mpeg7. xml)/Mpeg7/Description/MultimediaContent/AudioVisual/TemporalD ecomposition/AudioVisualSegment로 하고, 4행째를 where $b/PointOfView/@viewpoint="Yamada" 등으로 재기입함으로써 관점에 대해서도 검색할 수 있다.
또한, 4행째를 where $b/PointOfView/@viewpoint="Yamada" and $b/Point0fView/Importance/Value&gt;0.2 등으로 재기입함으로써 0.2 이상의 중요도를 가지는 컨텐츠 기술 내의 세그먼트도 검색할 수 있다.
이상 설명한 바와 같이, 실시예 5에 따르면, 컨텐츠 기술에 포함되는 용어를 다른 언어의 용어로 변환할 수 있다. 이 결과, 컨텐츠 기술에 복수의 다른 언어의 용어를 기술할 필요가 없어지기 때문에, 용어의 언어수를 늘리더라도, 컨텐츠 기술의 용장성을 억제할 수 있다.
또, 실시예 5는, 컨텐츠 검색 장치(1200)로부터 검색부(1204)를 제외한, 즉 컨텐츠 변환 장치의 형태이더라도 좋다.
(실시예 6)
본 발명의 실시예 6은, 컨텐츠 기술에 포함되는 용어를 동일한 의미의 다르게 표현한 용어인 동의어로 변환함으로써, 용어의 표현수를 늘리더라도, 컨텐츠 기술의 용장성이 억제되도록 한 것이다.
이하, 실시예 6에 따른 컨텐츠 검색 장치에 대하여 설명한다. 실시예 6에 따른 컨텐츠 검색 장치의 구성에 관해서는 실시예 5와 동일하기 때문에 설명을 생략한다.
실시예 6에 따른 용어 변환 기술(1201)에 대하여 설명한다. 용어 변환 기술(1201)의 기술 정의(XML Schema Definition)에 관해서는, 실시예 5에서 설명한 도 13에 도시된 기술 정의(1300)와 동일하기 때문에 설명을 생략한다.
다음에, 도 24를 이용하여, 실시예 6에 따른 용어 변환 기술의 구체예에 대하여 설명한다. 도 24는, 실시예 6에 따른 용어 변환 기술을 나타낸 도면이다.
실시예 6에 따른 용어 변환 기술(1201b)에는, TermExchangePack(1901)이 기술되어 있다. TermExchangePack(1901)에는, 대상으로 되는 URL(1902)이 기술되어 있다.
또한, TermExchangePack(1901)에는, 복수의 TermExchange(1903a, 1903b)가 기술되어 있다.
TermExchange(1903a)에는, Term 요소로서, 일본어의 "◇◇◇◇□△×"(1904a)와, 일본어의 "◇◇◇◇"(1904b), 일본어의 "◎◎"(1904c), 영어의 "United States of America"(1904d), 영어의 "America"(1904e), 영어의 "U. S. A."(1904f), 및 영어의 "U. S."(1904g)라는 용어가 기술되어 있다.
또, "◇◇◇◇□△×"는, 영어의 "United States of America"를 일본어로 나타낸 것이다. 또한, "◇◇◇◇"는, 영어의 "United States of America"를 일본어의 생략 형태로 나타낸 것이다. 또한, "◎◎"은, 영어의 "United States of America"를 일본어의 한자로 나타낸 생략 형태이다.
또한, 일본어의 "◇◇◇◇□△×"(1904a)에는 유사도로서 1.0, 일본어의 "◇◇◇◇"(1904b)에는 유사도로서 0.8, 일본어의 "◎◎"(1904c)에는 유사도로서 0.9, 영어의 "United States of America"(1904d)에는 유사도로서 1.0, 영어의 "America"(1904e)에는 유사도로서 0.8, 영어의 "U. S. A."(1904f)에는 유사도로서 0.9, 및 영어의 "U. S."(1904g)에는 유사도로서 0.7이 기술되어 있다. 이와 같이, 1904a∼1904g로 나타내는 용어가 기술되어 있다.
또한, TermExchange(1903b)에는, Term 요소로서, 일본어의 "▽○□▽○×"(1904h)와, 영어의 "Presidential election"(1904i), 영어의 "Presidential race"(1904j)라는 용어가 기술되어 있다.
또, "▽○□▽○×"는, 영어의 "Presidential election"을 일본어의 한자로 나타낸 것이다.
또한, 일본어의 "▽○□▽○×"(1904h)에는 유사도로서 1.0, 영어의 "Presidential election"(1904i)에는 유사도로서 1.0, 영어의 "Presidential race"(1904j)에는 유사도로서 0.9가 기술되어 있다. 이와 같이, 1904h∼1904j로 나타내는 용어가 기술되어 있다.
이와 같이, TermExchangePack(1901)에 복수의 TermExchange(1903a, 1903b)를 기술함으로써, 대상으로 되는 컨텐츠 기술에 포함되는 모든 용어와 이들 용어의 동의어 및 다른 언어로 표현한 용어를 기술할 수 있다.
다음에, 실시예 6에 따른 컨텐츠 변환부(1203)의 컨텐츠 변환 처리에 대하여 상세히 설명한다. 컨텐츠 변환부(1203)가, 용어 변환 기술(1201b)을 사용하여, 도 25에 나타내는 컨텐츠 기술(1202e)을 도 26에 나타내는 컨텐츠 기술(1202f)로 변환하는 처리에 대하여 설명한다. 이하의 설명에서는, 사용자가 입력부(102)로부터 모든 유사도의 용어를 이용하여 컨텐츠 변환을 한다고 하여 설명한다.
우선, 컨텐츠 변환부(1203)는, 컨텐츠 기술(1202e)을 참조하여, 컨텐츠 기술(1202a)의 키워드인 "United States of America"(2001a)와, "Presidential election"(2001b)를 추출한다.
다음에, 컨텐츠 변환부(1203)는, 용도 변환 기술(1201b)의 컨텐츠 기술(1202e)에 대응하는 부분인 도면의 1903a, 1903b를 참조한다. 그리고, 컨텐츠 변환부(1203)는, 추출한 "United States of America"(2001a)와, "Presidential election"(2001b)를 다르게 표현한 용어를 추출한다.
구체적으로는, 컨텐츠 변환부(1203)는, "United States of America"(2001a)에 대하여 "America", "U. S. A.", "U. S.", "◇◇◇◇□△×", "◇◇◇◇", 및 "◎◎"를 추출하고, "Presidential election"(2001)에 대하여 "▽○□▽○×"와 "Presidential race"를 추출한다.
다음에, 컨텐츠 변환부(1203)는, 컨텐츠 기술(1202e)의 "United States of America"(2001a) 및 "Presidential election"(2001b)에 더하여, "America"(2102a), "U. S. A."(2101b), "U. S."(2101c), "Presidential race"(2101d), "◇◇◇◇□△×"(2101e), "◇◇◇◇(2101f), "◎◎"(2101g), 및 "▽○□▽○×"(2101h)를 추가하여 기술한다.
이와 같이, 컨텐츠 변환부(1203)는, 컨텐츠 기술(1202e)을 컨텐츠 기술(1202f)로 변환한다. 이것에 의해, 컨텐츠 기술(1202f)에는, 컨텐츠 기술(1202e)의 키워드를 별도로 표현한 키워드가 전부 기술된다. 이 결과, 한 개의 컨텐츠 기술에 용어를 다르게 표현한 복수의 용어를 기술할 수 있기 때문에, 컨텐츠 기술의 용장성을 더욱 억제할 수 있다.
또한, 컨텐츠 변환부(1203)는, 영어인 "United States of America"(2001a), "Presidential election"(2001b)에 더하여, "America"(2102a), "U. S. A."(2101b), "U. S."(2101c), 및 "Presidential race"(2101d)를, "en"(2102a)에서 정리하고, "◇◇◇◇□△×"(2101e), "◇◇◇◇"(2101f), "◎◎"(2101g), 및 "▽○□▽○×"(2101h)를 "ja"(2102b)에서 정리하고 있다.
이와 같이, 컨텐츠 기술(1202d)에 대응하는 용어를 언어마다 정리하고 있다. 이것에 의해, 컨텐츠 기술(1202d)에 대응하는 용어를 언어마다 나누어 이해할 수 있다.
또한, 이상의 설명에서는, 사용자가 입력부(102)로부터 모든 유사도의 용어를 이용하여 컨텐츠를 변환한다고 설명했지만, 사용자는 임의 유사도의 용어를 이용하여 컨텐츠 변환을 행하는 형태이더라도 좋다.
이 경우는, 컨텐츠 변환부(1203)는, 사용자가 지정한 유사도 이상의 용어를 이용하여 컨텐츠 변환을 한다. 예컨대, 상술한 예에서 사용자가 유사도 0.9 이상으로 지정한 경우에는, 컨텐츠 변환부(1203)는, 유사도가 0.9 이상인 용어인 "United States of America"(2001a), "U. S. A."(1904f), "◇◇◇◇□△×"(1904a), 및 "◎◎"(1904c)을, "Presidential election"(2001b)에 대하여 "▽○□▽○×"(1904f)와 "Presidential race"(1904j)를 추출한다. 그리고, 컨텐츠 변환부(1203)는, 추출한 용어만을 이용하여 컨텐츠 변환을 행한다.
이상 설명한 바와 같이 실시예 6에 따르면, 컨텐츠 기술에 포함되는 용어를 동일한 의미의 다르게 표현한 용어인 동의어로 변환함으로써, 용어의 표현수를 늘리더라도, 컨텐츠 기술의 용장성을 억제되도록 할 수 있다.
이상 설명한 바와 같이, 본 발명에 의하면, 컨텐츠 기술에 포함되는 용어를 다른 표현의 용어로 변환할 수 있기 때문에, 컨텐츠 기술에 복수의 다르게 표현한 용어를 기술할 필요가 없어져, 용어의 표현수를 늘리더라도, 컨텐츠 기술의 용장성을 억제할 수 있다.
본 발명은 상술한 실시예로 한정되지 않고, 본 발명의 범주 내에서 다양한 변형 실시가 가능하다.
본 출원은 2002년 3월 28일자로 출원한 일본 특허 출원 제 2002-091234 호와, 2003년 2월 20일자로 출원한 일본 특허 출원 제 2003-043290 호에 근거한 것으로, 거기에 개시된 모든 내용은 본 명세서에 포함된다.
본 발명에 따르면, 컨텐츠 기술에 복수의 관점을 기술하지 않더라도, 검색요구에 이용할 수 있는 표현수를 늘릴 수 있고, 또한 컨텐츠 기술의 용장성을 억제할 수 있다.

Claims (25)

  1. 내용을 나타내는 관점이 부여된 컨텐츠 기술(記述)을 저장하는 컨텐츠 저장부와,
    상기 관점과 상기 관점을 다르게 표현한 용어를 대응시켜 기술한 용어 변환 기술을 저장한 용어 변환 기술 저장부와,
    상기 컨텐츠 기술을 검색하기 위해서 입력된 검색 요구와 상기 관점이 다른 경우에, 상기 용어 변환 기술을 이용해서 상기 관점에 대응하는 상기 다르게 표현한 용어를 추출하여, 추출한 상기 다르게 표현한 용어를 새로운 상기 관점으로 한 상기 컨텐츠 기술을 생성하고, 상기 검색 요구와 동일한 상기 새로운 관점이 부여된 상기 새로운 컨텐츠를 검색하는 검색부
    를 포함하는 컨텐츠 검색 장치.
  2. 제 1 항에 있어서,
    상기 다르게 표현한 용어는, 상기 관점을 다른 언어로 표현한 것인 컨텐츠 검색 장치.
  3. 제 1 항에 있어서,
    상기 다르게 표현한 용어는, 상기 관점의 동의어인 컨텐츠 검색 장치.
  4. 제 1 항에 있어서,
    상기 컨텐츠 기술은 상기 관점이 부여된 복수의 세그먼트로 구성되고, 상기 검색부는 상기 검색 요구와 동일한 상기 새로운 관점이 부여된 상기 세그먼트를 추출하는 컨텐츠 검색 장치.
  5. 제 1 항에 있어서,
    상기 컨텐츠 기술 및 상기 용어 변환 기술은 XML을 이용하여 기술되어 있는 컨텐츠 검색 장치.
  6. 제 1 항에 있어서,
    상기 컨텐츠 기술은, ISO/IEC 15938-2 및 ISO/IEC 15938-5에 근거한 기술로 되어 있는 컨텐츠 검색 장치.
  7. 내용을 나타내는 관점이 부여된 컨텐츠 기술을 저장하는 컨텐츠 저장부와,
    상기 관점과 상기 관점을 다르게 표현한 용어를 대응시켜 기술한 용어 변환 기술을 저장한 용어 변환 기술 저장부와,
    상기 컨텐츠 기술을 검색하기 위해서 입력된 검색 요구와 상기 관점이 다른 경우에, 상기 용어 변환 기술을 이용해서 상기 검색 요구에 대응하는 상기 관점을 다르게 표현한 용어를 추출하여, 상기 검색 요구를 추출한 상기 다르게 표현한 용어로 변환한 새로운 상기 검색 요구를 생성하고, 상기 새로운 검색 요구와 동일한 상기 관점이 부여된 상기 컨텐츠 기술을 검색하는 검색부
    를 포함하는 컨텐츠 검색 장치.
  8. 제 7 항에 있어서,
    상기 다르게 표현한 용어는, 상기 관점을 다른 언어로 표현한 것인 컨텐츠 검색 장치.
  9. 제 7 항에 있어서,
    상기 다르게 표현한 용어는, 상기 관점의 동의어인 컨텐츠 검색 장치.
  10. 제 7 항에 있어서,
    상기 컨텐츠 기술은 상기 관점이 부여된 복수의 세그먼트로 구성되고, 상기 검색부는 상기 새로운 검색 요구와 동일한 상기 관점이 부여된 상기 세그먼트를 추출하는 컨텐츠 검색 장치.
  11. 제 7 항에 있어서,
    상기 컨텐츠 기술 및 상기 용어 변환 기술은 XML을 이용하여 기술되어 있는 컨텐츠 검색 장치.
  12. 제 7 항에 있어서,
    상기 컨텐츠 기술은, ISO/IEC 15938-2 및 ISO/IEC 15938-5에 근거한 기술로 되어 있는 컨텐츠 검색 장치.
  13. 검색 대상이며 내용을 나타내는 관점이 부여된 컨텐츠 기술에 대하여 입력된 상기 컨텐츠 기술을 검색하기 위한 검색 요구의 언어가 상기 컨텐츠 기술의 상기 관점의 언어와 다른 경우에, 상기 관점과 상기 관점을 다르게 표현한 용어를 대응시켜 기술한 용어 변환 기술을 이용하여 상기 관점에 대응하는 상기 다르게 표현한 용어를 추출하는 단계와,
    추출한 상기 다르게 표현한 용어를 새로운 상기 관점으로 한 상기 컨텐츠 기술을 생성하는 단계와,
    상기 검색 요구와 동일한 상기 새로운 관점이 부여된 상기 새로운 컨텐츠를 검색하는 상기 관점을 상기 검색 요구의 언어로 변환한 새로운 상기 관점이 부여된 새로운 상기 컨텐츠 기술을 생성하는 단계와,
    상기 검색 요구와 동일한 상기 새로운 관점이 부여된 상기 새로운 컨텐츠 기술을 검색하는 단계
    를 포함하는 컨텐츠 검색 방법.
  14. 검색 대상이며 내용을 나타내는 관점이 부여된 컨텐츠 기술에 대하여 입력된 상기 컨텐츠 기술을 검색하기 위한 검색 요구가 상기 관점과 다른 경우에, 상기 관점과 상기 관점과 동일한 의미의 다른 용어를 대응시켜 기술한 용어 변환 기술을 이용하여 상기 검색 요구에 대응하는 상기 관점을 다르게 표현한 용어를 추출하는 단계와,
    상기 검색 요구를 추출한 상기 다르게 표현한 용어로 변환한 새로운 상기 검색 요구를 생성하는 단계와,
    상기 새로운 검색 요구와 동일한 상기 관점이 부여된 상기 컨텐츠 기술을 검색하는 단계
    를 포함하는 컨텐츠 검색 방법.
  15. 컴퓨터로 하여금,
    검색 대상이며 내용을 나타내는 관점이 부여된 컨텐츠 기술에 대하여 입력된 상기 컨텐츠 기술을 검색하기 위한 검색 요구의 언어가 상기 컨텐츠 기술의 상기 관점의 언어와 다른 경우에, 상기 관점과 상기 관점을 다르게 표현한 용어를 대응시켜 기술한 용어 변환 기술을 이용하여 상기 관점에 대응하는 상기 다르게 표현한 용어를 추출시키고,
    추출시킨 상기 다르게 표현한 용어를 새로운 상기 관점으로 한 상기 컨텐츠 기술을 생성시키고,
    상기 검색 요구와 동일한 상기 새로운 관점이 부여된 상기 새로운 컨텐츠를 검색하는 상기 관점을 상기 검색 요구의 언어로 변환한 새로운 상기 관점이 부여된 새로운 상기 컨텐츠 기술을 생성시키고,
    상기 검색 요구와 동일한 상기 새로운 관점이 부여된 상기 새로운 컨텐츠 기술을 검색하게 하는
    프로그램을 저장한 기억 매체.
  16. 컴퓨터로 하여금,
    검색 대상이며 내용을 나타내는 관점이 부여된 컨텐츠 기술에 대하여 입력된 상기 컨텐츠 기술을 검색하기 위한 검색 요구가 상기 관점과 다른 경우에, 상기 관점과 상기 관점과 동일한 의미의 다른 용어를 대응시켜 기술한 용어 변환 기술을 이용하여 상기 검색 요구에 대응하는 상기 관점을 다르게 표현한 용어를 추출시키고,
    상기 검색 요구를 추출시킨 상기 다르게 표현한 용어로 변환한 새로운 상기 검색 요구를 생성시키고,
    상기 새로운 검색 요구와 동일한 상기 관점이 부여된 상기 컨텐츠 기술을 검색하게 하는
    프로그램을 저장한 기억 매체.
  17. 컨텐츠 기술을 저장하는 컨텐츠 저장부와,
    상기 컨텐츠 기술에 포함되는 용어와 상기 용어를 다르게 표현한 용어를 대응시켜 기술한 용어 변환 기술을 저장한 용어 변환 기술 저장부와,
    상기 용어 변환 기술을 이용하여 상기 컨텐츠 기술에 포함되는 용어를 상기 다르게 표현한 용어로 변환하는 변환부
    를 포함하는 컨텐츠 변환 장치.
  18. 제 17 항에 있어서,
    상기 용어 변환 기술에는, 상기 컨텐츠 기술에 포함되는 용어와 상기 다르게표현한 용어의 조(組)를 복수 기술하고 있는 컨텐츠 변환 장치.
  19. 제 17 항에 있어서,
    상기 다르게 표현한 용어는, 상기 용어를 다른 언어로 표현한 것인 컨텐츠 변환 장치.
  20. 제 17 항에 있어서,
    상기 다르게 표현한 용어는, 상기 용어의 동의어인 컨텐츠 변환 장치.
  21. 제 17 항에 있어서,
    상기 컨텐츠 기술 및 상기 용어 변환 기술은 XML을 이용하여 기술되어 있는 컨텐츠 변환 장치.
  22. 제 17 항에 있어서,
    상기 컨텐츠 기술은, ISO/IEC 15938-2 및 ISO/IEC 15938-5에 근거한 기술로 되어 있는 컨텐츠 변환 장치.
  23. 제 18 항에 있어서,
    상기 변환부는, 상기 용어 변환 기술을 이용하여 상기 컨텐츠 기술에 포함되는 용어를 다르게 표현한 복수의 용어로 변환하는 컨텐츠 변환 장치.
  24. 컨텐츠 기술에 포함되는 용어와 상기 용어를 다르게 표현한 용어를 대응시켜 기술한 용어 변환 기술을 이용하여 상기 컨텐츠 기술에 포함되는 용어에 대응하는 상기 다르게 표현한 용어를 추출하는 단계와,
    추출한 상기 다르게 표현한 용어를 이용하여 상기 컨텐츠 기술에 포함되는 용어를 상기 추출한 다르게 표현한 용어로 변환하는 단계
    를 포함하는 컨텐츠 변환 방법.
  25. 컴퓨터로 하여금,
    기술한 용어 변환 기술을 이용하여 상기 컨텐츠 기술에 포함되는 용어에 대응하는 상기 다르게 표현한 용어를 추출시키고,
    추출한 상기 다르게 표현한 용어를 이용하여 상기 컨텐츠 기술에 포함되는 용어를 상기 추출한 다르게 표현한 용어로 변환시키는
    프로그램을 저장한 기억 매체.
KR10-2003-0019707A 2002-03-28 2003-03-28 컨텐츠 검색 장치, 컨텐츠 검색 방법, 컨텐츠 변환 장치,컨텐츠 변환 방법 및 프로그램을 저장한 기억 매체 KR100503546B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JPJP-P-2002-00091234 2002-03-28
JP2002091234 2002-03-28
JP2003043290A JP2004005439A (ja) 2002-03-28 2003-02-20 コンテンツ検索装置およびコンテンツ検索方法
JPJP-P-2003-00043290 2003-02-20

Publications (2)

Publication Number Publication Date
KR20030078792A true KR20030078792A (ko) 2003-10-08
KR100503546B1 KR100503546B1 (ko) 2005-07-25

Family

ID=28043840

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-0019707A KR100503546B1 (ko) 2002-03-28 2003-03-28 컨텐츠 검색 장치, 컨텐츠 검색 방법, 컨텐츠 변환 장치,컨텐츠 변환 방법 및 프로그램을 저장한 기억 매체

Country Status (5)

Country Link
US (1) US7082431B2 (ko)
EP (1) EP1351162A3 (ko)
JP (1) JP2004005439A (ko)
KR (1) KR100503546B1 (ko)
CN (1) CN100492353C (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4369708B2 (ja) * 2002-09-27 2009-11-25 パナソニック株式会社 データ処理装置
US7698262B2 (en) * 2006-03-29 2010-04-13 Electronics And Telecommunications Research Institute Apparatus and method for searching multimedia data based on metadata
US7930290B2 (en) * 2007-01-12 2011-04-19 Microsoft Corporation Providing virtual really simple syndication (RSS) feeds
KR101194635B1 (ko) * 2007-07-24 2012-10-29 에스케이텔레콤 주식회사 패러프레이즈를 이용하여 언어 학습 서비스를 제공하는방법과 그를 위한 시스템, 서버 및 컴퓨터로 읽을 수 있는기록매체
CN106095742A (zh) * 2016-06-20 2016-11-09 北京金山安全软件有限公司 一种文本内容生成方法与服务器
US20230054480A1 (en) * 2021-08-19 2023-02-23 International Business Machines Corporation Viewpoint analysis of video data

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2007384A (en) * 1933-02-23 1935-07-09 Superstat Company Balanced thermostat
JP3379985B2 (ja) 1993-05-07 2003-02-24 松下電器産業株式会社 翻訳例文検索装置
US5913215A (en) * 1996-04-09 1999-06-15 Seymour I. Rubinstein Browse by prompted keyword phrases with an improved method for obtaining an initial document set
JPH1153384A (ja) * 1997-08-05 1999-02-26 Mitsubishi Electric Corp キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
US6167397A (en) * 1997-09-23 2000-12-26 At&T Corporation Method of clustering electronic documents in response to a search query
JP3181548B2 (ja) 1998-02-03 2001-07-03 富士通株式会社 情報検索装置及び情報検索方法
AU1380599A (en) 1998-11-04 2000-05-22 Sullivan Walter III Database system with restricted keyword list and bi-directional keyword translation
US6629132B1 (en) * 1998-12-23 2003-09-30 Novell, Inc. Predicate indexing of data stored in a computer with application to indexing cached data
JP2001160066A (ja) 1998-12-25 2001-06-12 Matsushita Electric Ind Co Ltd データ処理装置、データ処理方法および記録媒体、並びに該データ処理方法をコンピュータに実行させるためのプログラム
AU2001257450A1 (en) * 2000-05-04 2001-11-12 Kickfire, Inc. An information repository system and method for an itnernet portal system
JP2001337981A (ja) 2000-05-30 2001-12-07 Patolis Corp 第1言語検索式を第2言語検索式に変換するための検索式変換方法
JP2002056020A (ja) * 2000-08-09 2002-02-20 Nippon Telegraph & Telephone East Corp コンテンツ検索方法、コンテンツ検索システムおよびコンテンツ検索プログラムが記録されたコンピュータ読み取り可能な記録媒体
KR100633219B1 (ko) * 2001-11-21 2006-10-12 콘텍스 디디 엘엘씨 데이터 딕셔너리 방법

Also Published As

Publication number Publication date
EP1351162A3 (en) 2004-05-12
CN1448869A (zh) 2003-10-15
CN100492353C (zh) 2009-05-27
EP1351162A2 (en) 2003-10-08
JP2004005439A (ja) 2004-01-08
US7082431B2 (en) 2006-07-25
KR100503546B1 (ko) 2005-07-25
US20030187829A1 (en) 2003-10-02

Similar Documents

Publication Publication Date Title
US6983240B2 (en) Method and apparatus for generating normalized representations of strings
US6662152B2 (en) Information retrieval apparatus and information retrieval method
EP1485830B1 (en) Retrieving matching documents by queries in any national language
US20100287162A1 (en) method and system for text summarization and summary based query answering
US20020032693A1 (en) Method and system of establishing electronic documents for storing, retrieving, categorizing and quickly linking via a network
JP5229226B2 (ja) 情報共有システム、情報共有方法、および情報共有プログラム
WO2010109709A1 (ja) コンテンツ推薦装置及び方法
CN110377884A (zh) 文档解析方法、装置、计算机设备及存储介质
KR20040035318A (ko) 객체기반 엠팩-4 컨텐츠 편집/저작과 검색 장치 및 방법
WO2010150910A1 (ja) 情報検索装置、情報検索方法、情報検索プログラム、および、情報検索プログラムを記録した記録媒体
KR100503546B1 (ko) 컨텐츠 검색 장치, 컨텐츠 검색 방법, 컨텐츠 변환 장치,컨텐츠 변환 방법 및 프로그램을 저장한 기억 매체
JP2007058706A (ja) 文書検索システム、文書検索方法及び文書検索プログラム
JPH11184865A (ja) 文書要約装置
JP2948159B2 (ja) データベース装置
JP2997469B2 (ja) 自然言語理解方法および情報検索装置
JP4783563B2 (ja) インデックス生成プログラム、検索プログラム、インデックス生成方法、検索方法、インデックス生成装置および検索装置
JP2008026967A (ja) 文書検索システム及びプログラム
JP4452527B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
Simard et al. TransSearch: A bilingual concordance tool
JP5160120B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラム
Melikyan Technology for creating digital explanatory dictionaries
Marin-Castro et al. VR-Tree: A novel tree-based approach for modeling Web Query Interfaces
WO2019008384A1 (en) SEARCH METHOD AND APPARATUS
González et al. Semiautomatic Extraction of Thesauri and Semantic Search in a Digital Image Archive.
among Lexicons The Workshop Programme

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20090708

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee