JP2004005439A - コンテンツ検索装置およびコンテンツ検索方法 - Google Patents

コンテンツ検索装置およびコンテンツ検索方法 Download PDF

Info

Publication number
JP2004005439A
JP2004005439A JP2003043290A JP2003043290A JP2004005439A JP 2004005439 A JP2004005439 A JP 2004005439A JP 2003043290 A JP2003043290 A JP 2003043290A JP 2003043290 A JP2003043290 A JP 2003043290A JP 2004005439 A JP2004005439 A JP 2004005439A
Authority
JP
Japan
Prior art keywords
content
description
term
viewpoint
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003043290A
Other languages
English (en)
Inventor
Koichi Emura
江村 恒一
Wataru Fujikawa
藤川 渡
Yuji Okada
岡田 雄治
Katsunao Takahashi
高橋 克直
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2003043290A priority Critical patent/JP2004005439A/ja
Priority to US10/391,899 priority patent/US7082431B2/en
Priority to EP03006771A priority patent/EP1351162A3/en
Priority to CNB031085180A priority patent/CN100492353C/zh
Priority to KR10-2003-0019707A priority patent/KR100503546B1/ko
Publication of JP2004005439A publication Critical patent/JP2004005439A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/913Multimedia
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索要求に用いることができる表現数を増やしても、コンテンツの冗長度が増大することがないようにすること。
【解決手段】本発明は、検索要求と検索対象のコンテンツ記述の観点が異なる表現である場合に、コンテンツ記述に含まれる用語と用語を異なる表現した用語とを対応つけて記述した用語変換記述を用いて、検索要求と検索対象のコンテンツ記述の観点が同じ表現になるように変換してからコンテンツ検索するようにしたものである。これにより、コンテンツ記述に複数の観点を記述しなくても、検索要求に用いることができる表現数を増やすことができ、かつコンテンツ記述の冗長性を押さえることができる。
【選択図】   図1

Description

【0001】
【発明の属する技術分野】
本発明は、映像、音声、テキストなどのマルチメディアコンテンツ(以下、コンテンツという)の内容を記述するコンテンツ記述の検索を行うコンテンツ検索装置およびコンテンツ検索方法に関するものである。
【0002】
【従来の技術】
従来検索できなかった映像や音声を含むマルチメディアコンテンツの検索、フィルタリングのための記述インタフェースであるMPEG−7が標準化された。これにより、W3Cが標準化したXML Schemaをベースとした記述スキーマを用いて様々なコンテンツ記述を作ることが可能となった。そして、MPEG−7が、放送、携帯通信、インターネットなどで利用され始まろうとしている。
【0003】
以下、MPEG−7を用いたコンテンツ検索の処理について説明する。MPEG−7は、コンテンツ記述毎にコンテンツを検索する際に使用される観点(キーワード)を記述している(例えば、特許文献1)。このコンテンツ記述に対してクライアントが検索要求として所望の用語(キーワード)を入力すると、クライアントが入力した検索要求に用いた用語と、あらかじめ蓄積してあるコンテンツ記述に記述された観点の比較を行う。そして、検索要求と同じ観点が記述されたコンテンツ記述を抽出する。このように、クライアントが要求するコンテンツ記述の検索を行っている。
【0004】
また、MPEG−7では、コンテンツ記述に複数の観点を付与することができる。これにより、コンテンツ記述に異なる言語で記述された複数の観点を付与することができ、クライアントがコンテンツの検索を行う場合に、検索要求に用いる用語として異なる言語で表現した用語を用いることができる。例えば、検索要求の用語として山田という名前を入力しようとする場合、漢字で「山田」、英語で「YAMADA」などと入力することができる。つまり、MPEG−7は、マルチリンガル検索機能をサポートしている。
【0005】
また、MPEG−7では、コンテンツ記述に同じ意味を持つ異なる用語を観点として複数記述することができる。これにより、クライアントがコンテンツの検索を行う場合に、検索要求に用いる用語として同じ意味を持つ異なる用語を用いることができる。例えば、検索要求として山田という名前を入力しようとする場合、漢字で「山田」、ひらがなで「やまだ」、愛称で「やま」などと入力することができる。
【0006】
【特許文献1】
特開2001−160066号公報
【0007】
【発明が解決しようとする課題】
しかしながら、MPEG−7では、対応言語数を多くする場合、異なる言語で記述した複数の観点をコンテンツに記述する必要がある。つまり、MPEG−7では、対応言語数を多くすればするほど、作成するコンテンツ記述のデータ量が増えることになる。
【0008】
また同様に、MPEG−7では、対応用語(語彙)数を多くする場合、コンテンツに同じ意味の用語を複数コンテンツに記述する必要がある。つまり、MPEG−7では、対応用語数を多くすればするほど、作成するコンテンツ記述のデータ量が増えることになる。
【0009】
以上のように、MPEG−7では、用語として使用できる対応言語数や対応用語数を増やすことにより、用語の表現数を増やすことで、コンテンツの冗長度が増すことになる。この結果、用語の表現数を増やすことによる費用対効果が下がり、さらにコンテンツの管理が困難となるなどの問題がある。
【0010】
本発明は、かかる点に鑑みてなされたものであり、用語の表現数を増やしても、コンテンツの冗長度が増大することがないようにすることを目的とする。
【0011】
【課題を解決するための手段】
上記目的を達成するために、本発明は、コンテンツ記述に含まれる用語と用語を異なる表現した用語とを対応つけて記述した用語変換記述を用いてコンテンツ記述に含まれる用語を異なる表現した用語に変換するようにしたものである。
【0012】
これにより、用語の表現数を増やしても、コンテンツ記述の冗長性を抑えることができる。
【0013】
【発明の実施の形態】
本発明の第1の態様にかかるコンテンツ検索装置は、内容を示す観点が付与されたコンテンツ記述を格納するコンテンツ格納手段と、前記観点と前記観点を異なる表現した用語とを対応つけて記述した用語変換記述を格納した用語変換記述格納手段と、前記コンテンツ記述を検索するために入力された検索要求と前記観点とが異なる場合に、前記用語変換記述を用いて前記観点に対応する前記異なる表現をした用語を抽出し、抽出した前記異なる表現をした用語を新たな前記観点とした前記コンテンツ記述を生成し、前記検索要求と同じ前記新たな観点が付与された前記新たなコンテンツを検索する検索手段と、を具備した構成を採る。
【0014】
この構成により、検索要求と観点が異なる表現の場合であっても、用語変換記述を用いて、検索対象のコンテンツ記述に付与された観点を検索要求の表現に変換した新しいコンテンツ記述を生成し、新しいコンテンツ記述に対して検索要求を用いて検索することができる。この結果、検索要求に複数の表現を用いることが可能となる。また、コンテンツ記述に複数の表現の観点を記述する必要がなくなるので、コンテンツ記述の冗長性を抑えることで費用対効果を高くすることができる。また、用語変換記述とコンテンツ記述とを分離して記述することで、用語の管理をコンテンツの管理と分離して行える。これにより、用語の管理をコンテンツの管理の管理が容易となる。
【0015】
本発明の第2の態様は、第1の態様にかかるコンテンツ検索装置において、前記異なる表現をした用語は、前記観点を異なる言語で表現したものである。
【0016】
この構成により、検索要求の言語と観点の言語が異なる場合であっても、用語変換記述を用いて、検索対象のコンテンツ記述に付与された観点の言語を検索要求の言語に変換した新しいコンテンツ記述を生成し、新しいコンテンツ記述に対して検索要求を用いて検索することができる。この結果、検索要求に複数の言語を用いる、つまりマルチリンガル検索を可能とすることができる。また、コンテンツ記述に複数の言語の観点を記述する必要がなくなるので、コンテンツ記述の冗長性を抑えることで費用対効果を高くすることができる。また、用語変換記述とコンテンツ記述とを分離して記述することで、用語の管理をコンテンツの管理と分離して行える。これにより、用語の管理をコンテンツの管理の管理が容易となる。
【0017】
本発明の第3の態様は、第1の態様にかかるコンテンツ検索装置において、前記異なる表現をした用語は、前記観点の同義語である。
【0018】
この構成により、入力された検索要求と観点とが異なる場合に、検索対象のコンテンツ記述の観点を用語変換記述に従って少なくとも1つ以上の異なる用語へ変換してから検索することができる。これにより、コンテンツのあいまい検索を可能とすることができる。また、コンテンツに多数の観点を記述しなくても良いので、コンテンツ記述の冗長性を抑えることで費用対効果を高くすることができる。また、用語変換記述とコンテンツ記述とを分離して記述することで、用語の語彙の管理をコンテンツ記述から分離して管理を容易とすることができる。
【0019】
本発明の第4の態様は、第1の態様から第3の態様いずれかにかかるコンテンツ検索装置において、前記コンテンツ記述は前記観点が付与された複数のセグメントから構成され、前記検索手段は前記検索要求と同じ前記新たな観点が付与された前記セグメントを抽出する。
【0020】
これにより、検索要求と同じ新たな観点が付与されたセグメントを抽出することができ、このセグメントを繋ぎ合わせることでユーザが入力した検索要求、つまり好みに対応した要約を作ることができる。
【0021】
本発明の第5の態様にかかるコンテンツ検索装置は、内容を示す観点が付与されたコンテンツ記述を格納するコンテンツ格納手段と、前記観点と前記観点を異なる表現した用語とを対応つけて記述した用語変換記述を格納した用語変換記述格納手段と、前記コンテンツ記述を検索するために入力された検索要求と前記観点とが異なる場合に、前記用語変換記述を用いて前記検索要求に対応する前記観点を異なる表現にした用語を抽出し、前記検索要求を抽出した前記異なる表現をした用語に変換した新たな前記検索要求を生成し、前記新たな検索要求と同じ前記観点が付与された前記コンテンツ記述を検索する検索手段と、を具備した構成を採る。
【0022】
この構成により、検索要求言語とコンテンツ記述言語が異なる場合であっても、用語変換記述を用いて、検索要求をコンテンツ記述の表現に変換し、変換した検索要求を用いてコンテンツ記述を検索することができる。この結果、この結果、コンテンツ記述と異なる表現の検索要求を使用できる。また、コンテンツに複数の表現を記述する必要がなくなるので、コンテンツ記述の冗長性を抑えることで費用対効果を高くすることができる。
【0023】
本発明の第6の態様は、第5の態様にかかるコンテンツ検索装置において、前記異なる表現をした用語は、前記観点を異なる言語で表現したものである。
【0024】
この構成により、検索要求言語とコンテンツ記述言語が異なる場合であっても、用語変換記述を用いて、検索要求の言語をコンテンツ記述の言語に変換し、変換した検索要求を用いてコンテンツ記述を検索することができる。この結果、この結果、コンテンツ記述の言語と異なる言語の検索要求を使用できる。つまり、マルチリンガル検索を可能とすることができる。また、コンテンツに複数の言語を記述する必要がなくなるので、コンテンツ記述の冗長性を抑えることで費用対効果を高くすることができる。
【0025】
本発明の第7の態様は、第5の態様にかかるコンテンツ検索装置において、前記異なる表現をした用語は、前記観点の同義語である。
【0026】
この構成により、検索要求と観点とが異なる場合であっても。用語変換記述を用いて、検索要求を少なくとも1つ以上の用語へ変換してからコンテンツ記述の検索することができる。これにより、ユーザがコンテンツ記述の観点に用いられている用語を知らなくても同じ意味を持つ他の用語を用いて検索する、いわゆるあいまい検索を可能とすることができる。また、コンテンツ記述に多数の観点を記述する必要がなくなるので、コンテンツ記述の冗長性を抑えることで費用対効果を高めることができる。
【0027】
本発明の第8の態様は、第5の態様から第7の態様のいずれかにかかるコンテンツ検索装置において、前記コンテンツ記述は前記観点が付与された複数のセグメントから構成され、前記検索手段は前記新たな検索要求と同じ前記観点が付与された前記セグメントを抽出する。
【0028】
これにより、検索要求と同じ新たな観点が付与されたセグメントを抽出することができ、このセグメントを繋ぎ合わせることで要約を作ることができる。
【0029】
本発明の第9の態様は、第1の態様から第8の態様のいずれかにかかるコンテンツ検索装置において、前記コンテンツ記述および前記用語変換記述はXMLを用いて記述されている。
【0030】
これにより、コンテンツ記述および用語変換記述に汎用性を持たせることができる。
【0031】
本発明の第10の態様は、第1の態様から第9の態様のいずれかにかかるコンテンツ検索装置において、前記コンテンツ記述は、ISO/IEC 15938−2およびISO/IEC 15938−5に基づいた記述になされている。
【0032】
これにより、コンテンツ記述をISO/IEC 15938−2およびISO/IEC 15938−5、つまりMPEG−7に基づいた記述にできる。この結果、コンテンツ記述を標準規格に対応させることができ、本発明を標準規格に対応させられる。
【0033】
本発明の第11の態様は、検索対象であり内容を示す観点が付与されたコンテンツ記述に対して入力された前記コンテンツ記述を検索するための検索要求の言語が前記コンテンツ記述の前記観点の言語と異なる場合に、前記観点と前記観点を異なる表現した用語とを対応つけて記述した用語変換記述を用いて前記観点に対応する前記異なる表現をした用語を抽出し、抽出した前記異なる表現をした用語を新たな前記観点とした前記コンテンツ記述を生成し、前記検索要求と同じ前記新たな観点が付与された前記新たなコンテンツを検索する前記観点を前記検索要求の言語に変換した新たな前記観点が付与された新たな前記コンテンツ記述を生成し、前記検索要求と同じ前記新たな観点が付与された前記新たなコンテンツ記述を検索することを特徴とするコンテンツ検索方法である。
【0034】
本発明の第12の態様は、検索対象であり内容を示す観点が付与されたコンテンツ記述に対して入力された前記コンテンツ記述を検索するための検索要求が前記観点と異なる場合に、前記観点と前記観点と同じ意味の異なる用語とを対応つけて記述した用語変換記述を用いて前記検索要求に対応する前記観点を異なる表現にした用語を抽出し、前記検索要求を抽出した前記異なる表現をした用語に変換した新たな前記検索要求を生成し、前記新たな検索要求と同じ前記観点が付与された前記コンテンツ記述を検索することを特徴とするコンテンツ検索方法である。
【0035】
本発明の第13の態様は、コンピュータに、検索対象であり内容を示す観点が付与されたコンテンツ記述に対して入力された前記コンテンツ記述を検索するための検索要求の言語が前記コンテンツ記述の前記観点の言語と異なる場合に、前記観点と前記観点を異なる表現した用語とを対応つけて記述した用語変換記述を用いて前記観点に対応する前記異なる表現をした用語を抽出させ、抽出させた前記異なる表現をした用語を新たな前記観点とした前記コンテンツ記述を生成させ、前記検索要求と同じ前記新たな観点が付与された前記新たなコンテンツを検索する前記観点を前記検索要求の言語に変換した新たな前記観点が付与された新たな前記コンテンツ記述を生成させ、前記検索要求と同じ前記新たな観点が付与された前記新たなコンテンツ記述を検索させることを特徴とするプログラムである。
【0036】
本発明の第14の態様は、コンピュータに、検索対象であり内容を示す観点が付与されたコンテンツ記述に対して入力された前記コンテンツ記述を検索するための検索要求が前記観点と異なる場合に、前記観点と前記観点と同じ意味の異なる用語とを対応つけて記述した用語変換記述を用いて前記検索要求に対応する前記観点を異なる表現にした用語を抽出させ、前記検索要求を抽出させた前記異なる表現をした用語に変換した新たな前記検索要求を生成させ、前記新たな検索要求と同じ前記観点が付与された前記コンテンツ記述を検索させることを特徴とするプログラムである。
【0037】
本発明の第15の態様にかかるコンテンツ変換装置は、コンテンツ記述を格納するコンテンツ格納手段と、前記コンテンツ記述に含まれる用語と前記用語を異なる表現した用語とを対応つけて記述した用語変換記述を格納した用語変換記述格納手段と、前記用語変換記述を用いて前記コンテンツ記述に含まれる用語を前記異なる表現した用語に変換する変換手段、を具備した構成を採る。
【0038】
これにより、コンテンツ記述に含まれる用語を異なる表現の用語に変換にできる。この結果、コンテンツ記述に複数の異なる表現をした用語を記述する必要がなくなるので、用語の表現数を増やしても、コンテンツ記述の冗長性を抑えることができる。
【0039】
本発明の第16の態様は、第15の態様にかかるコンテンツ変換装置において、前記用語変換記述には、前記コンテンツ記述に含まれる用語と前記異なる表現した用語との組を複数記述している。
【0040】
これにより、ひとつの用語変換記述に複数の用語と異なる表現の用語との組を記述できるので、用語数を増やしても複数の用語変換記述を用意する必要がなくなる。この結果、用語の表現数を増やしても、コンテンツ記述の冗長性をさらに抑えることができる。
【0041】
本発明の第17の態様は、第16の態様にかかるコンテンツ変換装置において、前記変換手段は、前記用語変換記述を用いて前記コンテンツ記述に含まれる用語を異なる表現した複数の用語に変換する。
【0042】
これにより、ひとつのコンテンツ記述に用語を異なる表現した複数の用語を記述することができる。これにより、コンテンツ記述の冗長性をさらに抑えることができる。
【0043】
本発明の第18の態様は、第15の態様から第17の態様のいずれかにかかるコンテンツ変換装置において、前記異なる表現をした用語は、前記用語を異なる言語で表現したものである。
【0044】
これにより、コンテンツ記述に含まれる用語を異なる言語の用語に変換にできる。この結果、コンテンツ記述に複数の異なる言語の用語を記述する必要がなくなるので、用語の言語数を増やしても、コンテンツ記述の冗長性を抑えることができる。
【0045】
本発明の第19の態様は、第15の態様から第17の態様のいずれかにかかるコンテンツ変換装置において、前記異なる表現をした用語は、前記用語の同義語である。
【0046】
これにより、コンテンツ記述に含まれる用語を同義語に変換にできる。この結果、コンテンツ記述に複数の同義語を記述する必要がなくなるので、用語の表現数を増やしても、コンテンツ記述の冗長性を抑えることができる。
【0047】
本発明の第20の態様は、第15の態様から第19の態様のいずれかにかかるコンテンツ検索装置において、前記コンテンツ記述は、ISO/IEC 15938−2およびISO/IEC 15938−5に基づいた記述になされている。
【0048】
これにより、コンテンツ記述をISO/IEC 15938−2およびISO/IEC 15938−5、つまりMPEG−7に基づいた記述にできる。この結果、コンテンツ記述を標準規格に対応させることができ、本発明を標準規格に対応させられる。
【0049】
本発明の第21の態様は、コンテンツ記述に含まれる用語と前記用語を異なる表現した用語とを対応つけて記述した用語変換記述を用いて前記コンテンツ記述に含まれる用語を異なる表現した用語に変換することを特徴とするコンテンツ変換方法である。
【0050】
本発明の第22の態様は、コンピュータに、コンテンツ記述に含まれる用語と前記用語を異なる表現した用語とを対応つけて記述した用語変換記述を用いて前記コンテンツ記述に含まれる用語を異なる表現した用語に変換させることを特徴とするプログラムである。
【0051】
(実施の形態1)
以下、本発明の実施の形態1におけるコンテンツ検索装置について説明する。まず、実施の形態1におけるコンテンツ検索装置の構成について図1を用いて説明する。図1は実施の形態1におけるコンテンツ検索装置のブロック図である。
【0052】
コンテンツ検索装置10には、通信手段として、インターネットなどのネットワーク20を介して他のメディアと通信を行うメディア接続部100が設けられている。そして、コンテンツ検索装置10は、メディア接続部100を用いて、ネットワーク20を介して複数のコンテンツ記述32を蓄積しているコンテンツ記述サーバ30と通信を行い、コンテンツ記述サーバ30からコンテンツ記述32を得る。
【0053】
コンテンツ検索装置10には、コンテンツ記述サーバ30から得たコンテンツ記述32を蓄積する蓄積部101が設けられている。図2および図3にコンテンツ記述32の例を示す。図2、図3は、実施の形態1にかかるコンテンツ記述を示した図である。
【0054】
図からわかるように、コンテンツ記述は、ISO/IEC 15938−2およびISO/IEC 15938−5(MPEG−7標準規格)に基づいたものになっている。また、図中201aに示すように、図2に示すコンテンツ記述32aは言語として英語が用いられている。よって、図中202aに示すように、観点が「Yamada」と英語で記述されている。また、図中203aに示すように観点の重要度も記述されている。
【0055】
また、図中201bに示すように、図3に示すコンテンツ記述32bは、言語として日本語が用いられている。よって、図中202bに示すように、観点が「山田」と日本語で記述されている。また、図中203bに示すように観点の重要度も記述されている。
【0056】
また、蓄積部101には、用語を変換するための用語変換記述31も蓄積されている。ここで、用語変換記述31について説明する。用語変換記述31の記述定義(XML Schema Definition)21は、図4に示すようになっている。また、用語変換記述31の記述定義21で用いるMPEG−7標準規格のデータタイプ22は、図5に示すようになっている。図中400に示すように、用語変換記述31は、用語を示すTerm要素を持つ。Term要素の値には、同じ語彙を異なる言語で記述した用語や同じ意味を異なる表現をした用語を複数記述できる。
【0057】
また、図中401に示すように、Term要素は用語の類似度を示すsimilarity属性を持つ。similarity属性の値が1.0の場合は、単なる言語変換である。また、語彙の拡張の場合には、similarity属性の値として1.0未満が記述され、その属性値で類似度が記述される。語彙の類似度が高いほど、similarity属性の値は高くなる。
【0058】
さらに、図中402に示すように、Term要素は、xml:lang属性を持ち、xml:lang属性の値で言語の種類が記述される。
【0059】
図6に、用語変換記述31の例を示す。図6の例では、601で示されるTerm要素には、英語の「Yamada」という用語が記述され、さらに類似度として1.0が記述されている。602で示されるTerm要素には、日本語の「山田」という用語が記述され、さらに類似度として1.0が記述されている。603で示されるTerm要素には、日本語で「ヤマ」という用語が記述され、さらに類似度として0.7が記述されている。また、601〜603に示されるtermは、TermExchange要素で括られている。つまり、英語で記述された「Yamada」、日本語で記述された「山田」および「ヤマ」が、それぞれ対応する用語として記述されている。また、「Yamada」と「山田」とは類似度が1.0であるため、これらの用語は単純に言語変換したものであることを示している。また、「ヤマ」は類似度が0.7であるため、「Yamada」と「山田」の表現を変えた用語であることを示している。
【0060】
図1に戻りコンテンツ検索装置10の説明に戻る。コンテンツ検索装置10には、検索要求の用語を入力するキーボードなどの入力部102が設けられている。入力部102から入力された用語である検索要求は入力制御部103、メモリ108を介して検索部104に送られる。メモリ108は、検索部104のワークメモリである。
【0061】
検索部104は、入力された検索要に対応する観点を持つセグメントをコンテンツ記述32から抽出し、抽出したセグメントを繋ぎ合せて要約を作成し、出力制御部105に出力する。また、検索部104は、入力された検索要に対応する観点を持つコンテンツ記述32を検出して、出力制御部105に送る形態であってもよい。なお、検索部104のコンテンツ検索処理については、後で詳述する。
【0062】
出力制御部105は、検索部104から送られてきた要約もしくはコンテンツ記述32の映像記述をモニタ106に、音声記述をスピーカ107に出力する。そして、モニタ106は要約もしくはコンテンツ記述32を表示し、スピーカ107は要約もしくはコンテンツ記述32を音声出力する。
【0063】
また、コンテンツ検索装置10の各処理部は、システムバス109により接続されている。
【0064】
次に、コンテンツ検索装置10のコンテンツ検索動作について、図7を用いて説明する。図7は、実施の形態1にかかるコンテンツ検索装置の動作を説明するフロー図である。
【0065】
まず、コンテンツ検索装置10は、入力部102から検索要求(RQ)が入力されると、入力された検索要求(RQ)を、入力制御部103を介してメモリ108に読み込み(s1001)、検索部104による検索を開始する。
【0066】
まず、検索部104は、メモリ108上の検索要求(RQ)の記述言語(RQL)を識別する(s1002)。次に、検索部104は、蓄積部101に蓄積されたコンテンツ記述32(CD)を読み込む(s1003)。そして、検索部104は、コンテンツ記述32(CD)の記述言語(CDL)を識別し(s1004)、検索要求言語(RQL)とコンテンツ記述言語(CDL)の比較を行う(s1005)。
【0067】
そして、検索部104は、検索要求言語(RQL)とコンテンツ記述言語(CDL)が同じ場合に検索要求(RQ)によるコンテンツ記述32(CD)の検索処理を行う(s1006)。具体的には、検索部104は、s1006において、検索要求(RQ)と同じ観点を持つセグメントをコンテンツ記述32(CD)から抽出し、抽出したセグメントを繋ぎ合せて要約を生成する。
【0068】
なお、s1006において、要約を作成せずに、検索要求(RQ)と同じ観点を持つコンテンツ記述32(CD)を単純に検索し出力する形態であっても良い。
【0069】
一方、検索要求言語(RQL)とコンテンツ記述言語(CDL)が違う場合には、検索部104はコンテンツ記述用語変換処理(s1007)を行った後、検索処理を行い、検索結果をモニタ106やスピーカ107などに出力する(s1006)。
【0070】
次に、コンテンツ記述用語変換処理(s1007)について、詳細に説明する。まず、検索部104は、検索要求言語(RQL)を検索に使用する変換先言語として識別する(s1008)。次に、検索部104は、蓄積部101に蓄積してある用語変換記述31(TD)を読み込む(s1009)。そして、検索部104は、用語変換記述31(TD)に記述されたTerm要素を参照し、蓄積部101から読み込んだコンテンツ記述32(CD)を変換先言語である検索要求言語(RQL)で記述された新たなコンテンツ記述へコンテンツ記述言語変換を行う(s1010)。具体的には、検索部104は、コンテンツ記述32の要素xml:langを変換先言語である検索要求言語(RQL)に合わせて変換すると共に、コンテンツ記述32に記述された観点を検索要求言語(RQL)に変換することで、新たなコンテンツ記述を生成する。
【0071】
例えば、検索要求言語(RQL)を日本語とし、コンテンツ記述言語(CDL)を英語で記述されたコンテンツ記述32aとすると、コンテンツ用語変換処理s1008では、日本語を変換先言語として識別し(s1008)、用語変換記述31(TD)を用いて(s1009)、読み込んだコンテンツ記述32(CD)の記述言語(CDL)を英語から変換先言語である日本語で記述したコンテンツ記述32bへコンテンツ記述言語変換を行うことで、新たなコンテンツ記述を生成する(s1010)。
【0072】
そして、検索部104は、s1006において、検索要求と同じ観点が付与された新たなコンテンツ記述のセグメントを抽出し、繋ぎ合せて要約を作成し出力する。なお、検索要求と同じ観点が付与された新たなコンテンツ記述を検索するようにしても良い。
【0073】
以上のように、実施の形態1によれば、検索要求言語とコンテンツ記述言語が異なる場合であっても、検索部104が、用語変換記述31を用いて、検索対象のコンテンツ記述の言語を検索要求の言語に変換した新たなコンテンツ記述を生成し、検索要求に対応する新たなコンテンツ記述を検索することができる。この結果、検索要求に複数の言語を用いる、つまりマルチリンガル検索を可能とすることができる。また、コンテンツに複数の言語で記述された観点を記述する必要がなくなるので、コンテンツ記述の冗長性を抑えることで費用対効果を高くすることができる。
【0074】
また、実施の形態1では、用語変換記述31とコンテンツ記述32とを分離して記述することで、用語の管理をコンテンツの管理と分離して行える。これにより、用語変換記述31とコンテンツ記述32の管理が容易となる。
【0075】
また、実施の形態1によれば、コンテンツ記述32をMPEG−7標準規格に基づいて記述でき、用語変換記述31の記述定義(XML Schema Definition)21をMPEG−7標準規格のデータタイプ22に基づいて記述することができる。このように、コンテンツ記述32および用語変換記述31をMPEG−7に基づいて記述することで、コンテンツ記述32および用語変換記述31に汎用性を持たせることができる。
【0076】
(実施の形態2)
本発明の実施の形態2は、用語変換記述31を用いて、ひとつの用語(単用語)が観点として記述されたコンテンツ記述を、同じ意味で異なる表現をした用語(同義語、多用語)が観点として記述されたコンテンツ記述に変換するものである。そして、変換したコンテンツ記述に対して検索を行うようにしたものである。
【0077】
以下、本発明の実施の形態2におけるコンテンツ検索装置について説明する。実施の形態2にかかるコンテンツ検索装置の構成は、実施の形態1にかかるコンテンツ検索装置10の構成と同じである。よって、実施の形態2にかかるコンテンツ検索装置の構成の説明を省略する。また、用語変換記述31についても実施の形態1と同様である。
【0078】
次に、実施の形態2にかかるコンテンツ検索装置の検索処理について、図8を用いて説明する。図8は、実施の形態2にかかるコンテンツ検索装置の動作を説明するフロー図である。
【0079】
まず、コンテンツ検索装置10は、入力部102から検索要求(RQ)が入力されると、入力された検索要求(RQ)を、入力制御部103を介してメモリ108に読み込み(s1101)、検索部104による検索を開始する。
【0080】
まず、検索部104は、蓄積部101に蓄積されたコンテンツ記述32(CD)を読み込む(s1102)。次に、検索部104は、用語変換記述31を用いて、ひとつの用語(単用語)で記述されたコンテンツ記述32を、同じ意味の異なる語彙(同義語)で表現された用語(多用語)で記述されたコンテンツ記述に変換するコンテンツ記述用語変換処理(s1103)に移行する。
【0081】
まず、検索部104は、検索要求(RQ)で指定またはあらかじめ設定された変換先語彙を識別する(s1104)。次に、検索部104は、蓄積部101から用語変換記述31(TD)を読み込む(s1105)。そして、検索部104は、読み込んだ用語変換記述31(TD)を用いて、コンテンツ記述32に記述された観点を他の表現を用いた用語(同義語)に変換した新たなコンテンツ記述を生成するコンテンツ記述用語変換処理を行う(s1106)。
【0082】
具体的には、s1106において、検索部104は、検索要求(RQ)で指定された変換先語彙と類似度を識別する。次に、検索部104は、用語変換記述31にある複数の変換候補の用語うち「変換先語彙の言語であってかつ指定された類似度に対応する用語」の候補を用いて、単用語の観点を「変換先語彙の言語であってかつ指定された類似度に対応する用語」で記述した同義語(多用語)の観点に変換することで、単用語の観点を持つコンテンツ記述32を多用語の観点を持つコンテンツ記述に変換を行う。
【0083】
検索要求(RQ)で指定またはあらかじめ設定された変換先語彙の言語が日本語および英語で類似度が0.6とすると、用語変換記述31にある複数の変換候補のうち「日本語かつ類似度が0.6以上」または「英語かつ類似度が0.6以上」の候補を用いて、単用語の観点を多用語(同義語)の観点に変換し、単用語の観点を持つコンテンツ記述32を多用語の観点を持つコンテンツ記述へコンテンツ記述用語変換を行う。
【0084】
例えば、図6に示す用語変換記述31を用いて図2に示すコンテンツ記述32aもしくは図3に示すコンテンツ記述32b(単用語)をコンテンツ記述用語変換すると、図9に示すコンテンツ記述34(同義語、多用語)になる。図からわかるように、コンテンツ記述32aのseg0で示されるセグメントには観点として「Yamada」、コンテンツ記述32bのseg0で示されるセグメントには観点として「山田」というひとつの用語が記述されているだけである。これに対して、図9に示すコンテンツ記述34のseg0で示されるセグメントには観点として、用語変換記述31に記述された用語のうち「Yamada」もしくは「山田」に対して日本語かつ英語であって類似度が0.6以上である用語である「Yamada」、「山田」、および「ヤマ」が記述されている。
【0085】
なお、変換先の語彙の言語が検索要求(RQ)で指定されるとしたが、あらかじめ設定されている形態であっても良い。
【0086】
そして、検索部104は、コンテンツ記述用語変換処理(s1103)を行った後、コンテンツ記述変換処理を行うことで生成した新たなコンテンツ記述に対して、入力された検索要求を用いて検索処理を行う(s1107)。なお、s1107における検索処理は、実施の形態1にかかるs1006の検索処理と同じであるので、詳細な説明を省略する。
【0087】
このようにして、検索部104は、変換された新たなコンテンツ記述34を検索要求で検索した結果を出力する。
【0088】
以上のように、実施の形態2によれば、用語変換記述31を設けることにより、入力された検索要求と観点とが異なる場合に、検索対象のコンテンツ記述の観点を用語変換記述に従って少なくとも1つ以上の他の表現をした用語(語彙、同義語)へ変換してから検索することができる。これにより、コンテンツのあいまい検索を可能とすることができる。また、コンテンツに多数の観点を記述しなくても良いので、コンテンツ記述の冗長性を抑えることで費用対効果を高くすることができる。
【0089】
また、用語変換記述とコンテンツ記述とを分離して記述することで、用語の語彙の管理をコンテンツ記述から分離して管理を容易とすることができる。
【0090】
(実施の形態3)
本発明の実施の形態3は、用語変換記述31を用いて、検索要求の言語をコンテンツ記述の言語に変換してから検索するようにしたものである。そして、検索したコンテンツ記述を、検索要求の言語に変換するようにしたものである。
【0091】
以下、本発明の実施の形態3におけるコンテンツ検索装置について説明する。実施の形態3にかかるコンテンツ検索装置の構成は、実施の形態1にかかるコンテンツ検索装置10の構成と同じである。よって、実施の形態3にかかるコンテンツ検索装置の構成の説明を省略する。また、用語変換記述31についても実施の形態1と同様である。
【0092】
次に、実施の形態3にかかるコンテンツ検索装置の検索処理について、図10を用いて説明する。図10は、実施の形態3にかかるコンテンツ検索装置の動作を説明するフロー図である。
【0093】
まず、コンテンツ検索装置10は、入力部102から検索要求(RQ)が入力されると、入力された検索要求(RQ)を、入力制御部103を介してメモリ108に読み込み(s1201)、検索部104による検索を開始する。
【0094】
まず、検索部104は、メモリ108上の検索要求(RQ)の記述言語(RQL)を識別する(s1202)。次に、検索部104は、蓄積部101に蓄積されたコンテンツ記述32(CD)を読み込む(s1203)。そして、検索部104は、コンテンツ記述32(CD)の記述言語(CDL)を識別し(s1204)、検索要求言語(RQL)とコンテンツ記述言語(CDL)の比較を行う(s1205)。
【0095】
そして、検索部104は、検索要求言語(RQL)とコンテンツ記述言語(CDL)が同じ場合に検索要求(RQ)によるコンテンツ記述32(CD)の検索処理を行う(s1206)。なお、s1206における検索処理は、実施の形態1にかかるs1006の検索処理と同じであるので、詳細な説明を省略する。
【0096】
一方、検索部104は、検索要求言語(RQL)とコンテンツ記述言語(CDL)が違う場合に検索要求用語変換処理(s1207)を行った後、検索処理を行う(s1206)。
【0097】
次に、検索要求用語変換処理(s1207)について、説明する。まず、検索部104は、コンテンツ記述32の言語(CDL)を検索に使用する変換先言語として識別する(s1208)。次に、検索部104は、蓄積部101に蓄積してある用語変換記述31(TD)を読み込む(s1209)。
【0098】
次に、検索部104は、用語変換記述31(TD)に記述されたTerm要素を参照し、検索要求(RQ)の記述言語(RQL)と同じ意味を持ち、かつコンテンツ記述32の記述言語(CDL)で記述された用語に変換する。そして、この変換した検索要求(RQ)を新たな検索要求(RQ)とする(s1210)。
【0099】
例えば、検索要求言語(RQL)を日本語とし、コンテンツ記述32の言語(CDL)を英語とすると、検索要求用語変換処理s1207では、CDL=英語を変換先言語として識別し(s1208)、蓄積部101から読み込んだ用語変換記述31(TD)を用いて(s1209)、検索要求(RQ)をその記述言語(RQL=日本語)から変換先言語である英語で記述された検索要求へ検索要求言語変換を行う(s1210)。
【0100】
そして、検索部104は、s1210で変換された新たな検索要求を用いてコンテンツ記述の検索処理を行う(s1206)。
【0101】
次に、検索部104は、S1206において検索された検索結果(RS)の言語が、コンテンツ記述言語(CDL)であり入力されたユーザが認識できる言語である検索要求言語(RQL)とは違うので、検索結果(RS)の言語を検索要求言語(RQL)に変換する処理に移行する。
【0102】
まず、検索部104は、検索結果(RS)の言語が検索要求言語(RQL)と同じか否かを判断するために、検索要求言語(RQL)とコンテンツ記述言語(CDL)との比較を行う(s1211)。そして、検索要求言語(RQL)とコンテンツ記述言語(CDL)が同じである場合には、検索結果(RS)が検索要求言語(RQL)と同じ言語で記述されていることになる。つまり、ユーザが使用する言語と同じ言語で記述されているので、言語変換を行わず検索結果(RS)を出力し処理を終了する。
【0103】
一方、検索要求言語(RQL)とコンテンツ記述言語(CDL)が異なる場合には、検索結果(RS)をユーザが認識できる言語である検索要求言語(RQL)と同じ言語で記述する必要がある。そこで、次に、検索部104は、検索結果用語変換処理に移行する(s1212)。
【0104】
検索結果用語変換処理s1212において、検索部104は、まず、コンテンツ記述言語(CDL)で記述した検索要求でコンテンツ記述32を検索した検索結果(RS)を読み込む(s1213)。次に、検索部104は、検索結果(RS)の記述言語(RSL)を識別する(s1214)。次に、検索部104は、検索要求言語(RQL)を変換先言語として識別する(s1215)。そして、検索部104は、蓄積部101から用語変換記述31(TD)を読み込み(s1216)、用語変換記述31を用いて、変検索結果(RS)の検索結果言語(RSL)を変換先言語である検索要求言語(RQL)に変換する検索結果言語変換を行う(s1217)。
【0105】
例えば、検索結果用語変換処理s1212において、コンテンツ記述言語(CDL)が英語であり検索結果言語(RSL)が英語であり、検索要求言語(RQL)が日本語である場合、検索部104は、検索記述言語(RSL=英語)を識別し、RQL=日本語を変換先言語として識別する。そして、検索部104は、蓄積部101から読み込んだ用語変換記述31(TD)を用いて、検索結果(RS)を、検索結果言語(RSL=英語)から変換先言語である日本語で記述された検索結果に検索結果言語変換を行う。
【0106】
そして、検索部104は、検索結果言語変換を行った検索結果(RS)を出力する。
【0107】
以上のように、実施の形態3によれば、検索要求言語とコンテンツ記述言語が異なる場合であっても、検索部104が、用語変換記述31を用いて、検索要求の言語をコンテンツ記述の言語に変換し、変換した検索要求を用いてコンテンツ記述を検索することができる。この結果、コンテンツ記述32の言語と異なる言語の検索要求を使用できる。つまりマルチリンガル検索を可能とすることができる。また、コンテンツに複数の言語を記述する必要がなくなるので、コンテンツ記述の冗長性を抑えることで費用対効果を高くすることができる。
【0108】
また、実施の形態3によれば、変換した検索要求を用いてコンテンツ記述を検索した場合であっても、検索結果の言語を検索要求言語に変換してから出力することができる。これにより、検索結果の言語をユーザの使用する言語、つまり認識できる言語に変換することができる。よって、ユーザが、検索結果を認識できる。
【0109】
(実施の形態4)
本発明の実施の形態4は、用語変換記述31を用いて、検索要求を、同じ意味を持つ他の用語に変換してから検索するようにしたものである。
【0110】
以下、本発明の実施の形態4におけるコンテンツ検索装置について説明する。実施の形態4にかかるコンテンツ検索装置の構成は、実施の形態1にかかるコンテンツ検索装置10の構成と同じである。よって、実施の形態4にかかるコンテンツ検索装置の構成の説明を省略する。また、用語変換記述31についても実施の形態1と同様である。
【0111】
次に、実施の形態4にかかるコンテンツ検索装置の検索処理について、図11を用いて説明する。図11は、実施の形態4にかかるコンテンツ検索装置の動作を説明するフロー図である。
【0112】
まず、コンテンツ検索装置10は、入力部102から検索要求(RQ)が入力されると、入力された検索要求(RQ)を、入力制御部103を介してメモリ108に読み込み(s1301)、検索部104による検索を開始する。
【0113】
まず、検索部104は、蓄積部101に蓄積されたコンテンツ記述32(CD)を読み込む(s1302)。次に、検索部104は、用語変換記述31を用いて、検索要求(RQ)を、同じ意味を持つ他の用語(語彙)に変換するコンテンツ記述用語変換処理に移行する(s1303)。
【0114】
検索要求用語変換処理s1303において、検索部104は、変換先語彙を識別し(s1304)、蓄積部101から読み込んだ用語変換記述31(TD)を用いて(s1305)、検索要求の語彙変換を行う(s1306)。
【0115】
例えば、検索要求(RQ)で指定された変換先語彙の言語が日本語で類似度が0.6とすると、用語変換記述31にある複数の変換候補のうち「日本語で類似度が0.6以上」の候補を用いて、ひとつの用語からなる検索要求(単用語)を、複数の用語を持つ検索要求(同義語、多用語)へ検索要求語彙変換を行う。
【0116】
そして、検索部104は、検索要求用語変換処理s1304において、変換した同義語(多用語)の検索要求(RQ)を用いてコンテンツ記述32の検索を行い、検索結果を出力する(s1307)。また、検索部104は、s1307において、検索要求(RQ)が複数になった場合には、複数の検索要求(RQ)すべてを用いてコンテンツ記述32の検索を行う。
【0117】
なお、s1307における検索処理は、実施の形態1にかかるs1006の検索処理と同じであるので、詳細な説明を省略する。
【0118】
また、このようにして、検索部104は、コンテンツ記述32を、変換された検索要求(同義語、多用語)で検索した結果を検索結果として返す。
【0119】
以上のように、実施の形態4によれば、用語変換記述31を用いて、検索要求を少なくとも1つ以上の用語の語彙へ変換してからコンテンツ記述の検索することができる。これにより、ユーザがコンテンツ記述の観点に用いられている用語を知らなくても同じ意味を持つ用語を用いて検索する、いわゆるあいまい検索を可能とすることができる。また、コンテンツ記述に多数の観点を記述する必要がなくなるので、コンテンツ記述の冗長性を抑えることで費用対効果を高めることができる。
【0120】
なお、すべての実施の形態において、検索部104、用語変換記述31は、クライアント側でなく、サーバ側または全く別のサイトにあっても良い。また、コンテンツ記述32を、ネットワークを介してコンテンツ記述サーバから取得する形態で説明したが、コンテンツ記述を取得する形態はこれ以外であっても良い。例えば、CD−ROMなどの記憶媒体に記憶されたコンテンツ記述32を蓄積部101に格納する形態でも良い。
【0121】
また、本発明で用いたコンテンツ記述32,用語変換記述31の記述方法は一例であり、様々な記述が可能である。また、変換先語彙識別の方法については、言語と類似度以外の種類であっても良いし、その組合せなど上記に限定されない。
【0122】
また、本発明の検索部104が行う処理を、コンピュータを用いてソフトウェアによって実現することも、それらの処理の機能を発揮する専用のハードウェアを用いて実現しても構わない。
【0123】
(実施の形態5)
本発明の実施の形態5は、コンテンツ記述に含まれる用語を違う言語に変換することにより、用語の言語数を増やしても、コンテンツ記述の冗長性を抑えられるようにしたものである。
【0124】
以下、実施の形態5にかかるコンテンツ検索装置について説明する。まず、実施の形態5にかかるコンテンツ検索装置の構成について図12を用いて説明する。図12は、実施の形態5にかかるコンテンツ検索装置のブロック図である。なお、すでに説明した部分と同一の部分には同一の符号を付与し、詳細な説明を省略する。
【0125】
実施の形態5にかかるコンテンツ検索装置1200には、変換部1203が設けられている。変換部1203は、蓄積部101に格納された用語変換記述1201を用いてコンテンツ記述1202を変換する。
【0126】
また、コンテンツ検索装置1200には、蓄積部101に格納された検索式1205を用いて、入力部102から入力された検索要求に対応するコンテンツ記述1202を検索し、検索したコンテンツ記述1202に含まれる用語を抽出する検索部1204が設けられている。
【0127】
なお、蓄積部101に格納されたコンテンツ記述1202は、コンテンツ記述サーバ30から得たものである。
【0128】
次に、実施の形態5にかかる用語変換記述1201について図13、図14を用いて説明する。まず、図13を用いて、用語変換記述1201の記述定義(XML Schema Definition)について説明する。
【0129】
図中1301に示すように、実施の形態5にかかる記述定義1300には、要素としてTermExchangeCollectionが定義されている。
【0130】
また、図中1302に示すように、TermExchangeCollection1301には、要素としてTermExchangePackがひとつ以上記述できると定義されている。また、図中1306に示すように、TermExchangePack1302には対象とするコンテンツ記述のURLが記述されると定義されている。
【0131】
さらに、図中1304に示すように、TermExchangePack1302には、要素としてTermExchangeをひとつ以上記述できると定義されている。
【0132】
TermExchange1305については、実施の形態1で説明したのと同じものとなっている。具体的には、図中400に示すように、TermExchange1305は、用語を示すTerm要素を持つ。また、Term要素の値には、同じ語彙を異なる言語で記述した用語や同じ意味を異なる表現をした用語を複数記述できる。また、図中401に示すように、Term要素は用語の類似度を示すsimilarity属性を持つ。similarity属性の値が1.0の場合は、単なる言語変換である。また、語彙の拡張の場合には、similarity属性の値として1.0未満が記述され、その属性値で類似度が記述される。語彙の類似度が高いほど、similarity属性の値は高くなる。
【0133】
このように記述定義1300を定義することにより、TermExchangePack1302を用いて複数の用語を同じ意味毎にまとめて記述することができる。これにより、用語変換記述1201に用語と用語を異なる言語で表現した用語との組を複数できる。
【0134】
次に、図14を用いて、用語変換記述1201の具体例について説明する。図14は、実施の形態5にかかる用語変換記述を示した図である。
【0135】
実施の形態5にかかる用語変換記述1201aには、複数のTermExchangePack1401a、1401bが記述されている。TermExchangePack1401a、1401bには、それぞれ対象となるURL1402a、1402bが記述されている。
【0136】
また、TermExchangePack1401aには、複数のTermExchange1403a〜1403dが記述されている。
【0137】
TermExchange1403aには、Term要素として、英語の「Creator」と、日本語の「制作者」という用語が記述されていて、それぞれ類似度として1.0が記述されている。このように、英語の「Creator」と、日本語の「制作者」が対応つけられて記述されている。
【0138】
また、TermExchange1403bには、Term要素として、英語の「Yamada」と、日本語の「山田」という用語が記述されていて、それぞれ類似度として1.0が記述されている。このように、英語の「Yamada」と、日本語の「山田」が対応つけられて記述されている。
【0139】
また、TermExchange1403cには、Term要素として、英語の「Taro」と、日本語の「太郎」という用語が記述されていて、それぞれ類似度として1.0が記述されている。このように、英語の「Taro」と、日本語の「太郎」が対応つけられて記述されている。
【0140】
また、TermExchange1403dには、Term要素として、英語の「Tokyo」と、日本語の「東京」という用語が記述されていて、それぞれ類似度として1.0が記述されている。このように、英語の「Tokyo」と、日本語の「東京」が対応つけられて記述されている。
【0141】
また、TermExchangePack1401bには、複数のTermExchange1403e〜1403fが記述されている。
【0142】
TermExchange1403eには、Term要素として、英語の「Isrand Series」と、日本語の「島対抗シリーズ」という用語が記述されていて、それぞれ類似度として1.0が記述されている。このように、英語の「Isrand Series」と、日本語の「島対抗シリーズ」が対応つけられて記述されている。
【0143】
また、TermExchange1403fには、Term要素として、英語の「Sports Channel」と、日本語の「スポーツ・チャンネル」という用語が記述されていて、それぞれ類似度として1.0が記述されている。このように、英語の「Sports Channel」と、日本語の「スポーツ・チャンネル」が対応つけられて記述されている。
【0144】
このように、TermExchangePack1401a、1401bを用いることにより、異なるコンテンツ記述に対応する用語変換をひとつの用語変換記述にまとめることができる。
【0145】
また、TermExchangePack1401a、1401bに複数のTermExchange1403a〜1403fを記述することにより、対象となるコンテンツ記述に含まれるすべての用語とこれらの用語を異なる表現にした用語を記述することができる。
【0146】
また、TermExchange1403e、1403fには、用語として文節が使用されている。このように、用語変換記述1201aには用語として文節も使用することができる。
【0147】
次に、コンテンツ変換部1203のコンテンツ変換処理について詳細に説明する。
【0148】
まず、コンテンツ変換部1203が、用語変換記述1201aを使い、図15に示すコンテンツ記述1202aを図16に示すコンテンツ記述1202bに変換する処理について説明する。
【0149】
まず、コンテンツ変換部1203は、コンテンツ記述1202aを参照し、コンテンツ記述1202aを制作した人に関する情報である<Creator>から</Creator>を参照する。そして、コンテンツ変換部1203は、コンテンツ記述1202aを制作した人の役割を示す「Creator」1501、コンテンツ記述1202aを制作した人の名前を示す「Taro」1502、コンテンツ記述1202aを制作した人の姓を示す「Yamada」1503を抽出する。
【0150】
次に、コンテンツ変換部1203は、コンテンツ記述1202aを制作した場所に関する情報である「Tokyo」1504を抽出する。
【0151】
次に、コンテンツ変換部1203は、用語変換記述1201aのコンテンツ記述1202aに対応する部分である図中1403a〜1403dを参照する。そして、コンテンツ変換部1203は、抽出した「Creator」1501、「Taro」1502、「Yamada」1503、および「Tokyo」1504を違う言語で表現をした用語を抽出する。
【0152】
具体的には、コンテンツ変換部1203は、「Creator」1501に対して「制作者」、「Taro」1502に対して「太郎」、「Yamada」1503に対して「山田」、および「Tokyo」1504に対して「東京」を抽出する。
【0153】
次に、コンテンツ変換部1203は、コンテンツ記述1202aの「Creator」1501の部分を「制作者」1601、「Taro」1502の部分を「太郎」1602、「Yamada」1503の部分を「山田」1603、および「Tokyo」1504の部分を「東京」1604に変換する。
【0154】
また、コンテンツ変換部1203は、コンテンツ記述1202aの記述言語を示すMPEG要素のXML:lang属性値を「en」1505から「ja」1605に変換する。
【0155】
このようにして、コンテンツ変換部1203は、英語でかかれたコンテンツ記述1202aを日本語で書かれたコンテンツ記述1202bに変換する。
【0156】
次に、コンテンツ変換部1203が、用語変換記述1201aを使い、図17に示すコンテンツ記述1202cを図18に示すコンテンツ記述1202dに変換する処理について説明する。
【0157】
まず、コンテンツ変換部1203は、コンテンツ記述1202cを参照し、コンテンツ記述1202cに関する情報である<Creation>から</Creation>を参照する。そして、コンテンツ変換部1203は、コンテンツ記述1202aのタイトルを示す「Island series」1701、コンテンツ記述1202aを制作したエージェントの名前を示す「Sports Channel」1702を抽出する。
【0158】
次に、コンテンツ変換部1203は、用度変換記述1201aのコンテンツ記述1202cに対応する部分である図中1403e〜1403fを参照する。そして、コンテンツ変換部1203は、抽出した「Island series」1701、「Sports Channel」1702を違う言語で表現をした用語を抽出する。
【0159】
具体的には、コンテンツ変換部1203は、「Island series」1701に対して「島対抗シリーズ」、およびSports Channel」1702に対して「スポーツ・チャンネル」を抽出する。
【0160】
次に、コンテンツ変換部1203は、コンテンツ記述1202aの「Island series」1701の部分を「島対抗シリーズ」1801、およびSports Channel」1702の部分を「スポーツ・チャンネル」1802に変換する。
【0161】
また、コンテンツ変換部1203は、要素<Title>と<Name>の記述言語を示すMPEG要素のxml:lang属性値をそれぞれ「en」1703、1704から「ja」1803、1804に変換する。
【0162】
このようにして、コンテンツ変換部1203は、英語でかかれたコンテンツ記述1202cを日本語で書かれたコンテンツ記述1202dに変換する。
【0163】
次に、検索部1204の動作について詳細に説明する。
【0164】
検索部1204は、W3CのXQuery規格に基づいた検索式1205を用いて検索を行う。
【0165】
ここで、検索式1205について、図19を用いて詳細に説明する。図19は、実施の形態5にかかる検索式を示した図である。
【0166】
図19に示す検索式1205aには、図中2201に示すように、コンテンツ記述の参照先のURL(「http://foo/mpeg7−2.xml」)が記述され、さらにこのコンテンツ記述中の参照場所(/Mpeg7/〜/Creation)が記述されている。
【0167】
また、検索式1205aには、図中2202に示すように、コンテンツ記述のTitleに記述された用語が、検索用語である「Island series」であるか否かを判断する条件式が記述されている。なお、この例は、入力部102から検索用語として「Island series」が入力された場合の検索式である。
【0168】
そして、検索式1205aは、図中2202で示す条件を満たす場合に、return以下を実行する記述になっている。
【0169】
具体的には、検索式1205aには、return以下にある[  ]中に示される位置に記述された用語を代入するような記述がされている。
【0170】
この例では、図中2203に示す{ }中には、コンテンツ記述中のMpeg7要素の下のDescription要素の下のCreationInformation要素の下のCreation要素(ここまでを変数$bとする)の下のCreator要素の下のAgent要素の下のName要素の属性の値が代入されるようになっている。また、図中2204に示す{ }中には、コンテンツ記述中の変数$bの下のCreator要素の下のAgent要素の下のName要素のxml:lang属性の値が代入されるようになっている。また、図中2205に示す{ }中には、コンテンツ記述中の変数$bの下のCreator要素の下のAgent要素の下のName要素の値が代入されるようになっている。
【0171】
なお、検索式1205aは、XQueryに基づいたものであるので、< >の部分はそのまま結果として出力される。
【0172】
次に、検索部1204が、図19に示す検索式1205aを用いて、図17に示すコンテンツ1202cを検索した結果を図20に示す。
【0173】
図20に示すように、検索部1204は、検索式1205aに< >で記述された部分は、そのまま出力している。
【0174】
また、検索部1204は、検索式1205aの[  ]中に対応する用語を代入している。
【0175】
具体的には、図中2301に示す部分に図17中の1705に示す用語を、図中2302に示す部分に図17中の1704に示す用語を、図中2303に示す部分に図17中の1702に示す用語を代入している。
【0176】
このようにして、検索部1204は、検索式1205aを用いて、入力された検索用語に対応するコンテンツ記述1202cに含まれる用語を抽出して出力する。
【0177】
次に、検索部1204が図21に示す検索式を用いた場合の検索について説明する。
【0178】
図21に示す検索式1205bは、検索用語として「島対抗シリーズ」が入力された場合のものである。よって、検索式1205bには、図中2400に示すように、コンテンツのTitleに記述された用語が、検索用語である「島対抗シリーズ」であるか否かを判断する条件式が記述されている。
【0179】
また、検索式1205bは、図18に示すコンテンツ記述1202cに対応するものなので、図中2401に示すようなコンテンツ記述の参照先が記述されている。
【0180】
検索部1204が、図21に示す検索式1205bを用いて、図18に示すコンテンツ記述1202dを検索すると、図22に示す検索結果を出力する。
【0181】
検索部1204は、図中2501に示す部分に図18中の1805に示す用語を、図中2502に示す部分に図18中の1804に示す用語を、図中2503に示す部分に図18中の1802に示す用語を代入している。
【0182】
次に、検索式の別の例を図23に示す。
【0183】
図23に示す検索式1205cは、複数の検索用語に対応するようになっている。具体的には、検索用語として「Island series」と「島対抗シリーズ」が入力された場合のものである。よって、検索式1205cは、図中2600に示すように、コンテンツ記述のTitleに記述された用語が検索用語である「Island series」もしくは「島対抗シリーズ」であるか否かを判断する条件式が記述されている。
【0184】
検索部1204が、検索式1205cを用いて検索を行うと、Titleの部分に、「Island series」もしくは「島対抗シリーズ」が記述されたコンテンツ記述を検索し、検索したコンテンツ記述に含まれる用語を抽出する。
【0185】
このように、異なる言語の異なる表現をした検索用語を用いて検索を行うこともできる。
【0186】
なお、上述した検索はいずれもTitleに対する検索であったが、4行目のwhere文の値を変換・展開することで、他の部分に対する検索も行える。
【0187】
例えば、3行目をfor $b in document(http://foo/mpeg7.xml) /Mpeg7/Description/MultimediaContent/AudioVisual/TemporalDecomposition/AudioVisualSegment とし、4行目をwhere $b/PointOfView/@viewpoint=”Yamada”などと書き換えることにより観点に対する検索を行うこともできる。
【0188】
また、4行目をwhere $b/PointOfView/@viewpoint=”Yamada” and $b/PointOfView/Importance/Value>0.2などと書き換えることにより0.2以上の重要度を持つコンテンツ記述中のセグメントの検索も行うことができる。
【0189】
以上説明したように、実施の形態5によれば、コンテンツ記述に含まれる用語を異なる言語の用語に変換にできる。この結果、コンテンツ記述に複数の異なる言語の用語を記述する必要がなくなるので、用語の言語数を増やしても、コンテンツ記述の冗長性を抑えることができる。
【0190】
なお、実施の形態5は、コンテンツ検索装置1200から検索部1204を除いた、つまりコンテンツ変換装置の形態であっても良い。
【0191】
(実施の形態6)
本発明の実施の形態6は、コンテンツ記述に含まれる用語を同じ意味で違う表現をした用語である同義語に変換することにより、用語の表現数を増やしても、コンテンツ記述の冗長性を抑えられるようにしたものである。
【0192】
以下、実施の形態6にかかるコンテンツ検索装置について説明する。実施の形態6にかかるコンテンツ検索装置の構成については実施の形態5と同一であるので説明を省略する。
【0193】
実施の形態6にかかる用語変換記述1201について説明する。用語変換記述1201の記述定義(XML Schema Definition)については、実施の形態5で説明した図13に示す記述定義1300と同一であるので説明を省略する。
【0194】
次に、図24を用いて、実施の形態6にかかる用語変換記述の具体例について説明する。図24は、実施の形態6にかかる用語変換記述を示した図である。
【0195】
実施の形態6にかかる用語変換記述1201bには、TermExchangePack1901が記述されている。TermExchangePack1901には、対象となるURL1902が記述されている。
【0196】
また、TermExchangePack1901には、複数のTermExchange1903a、1903bが記述されている。
【0197】
TermExchange1903aには、Term要素として、日本語の「アメリカ合衆国」1904aと、日本語の「アメリカ」1904b、日本語の「米国」1904c、英語の「United States of America」1904d、英語の「America」1904e、英語の「U.S.A.」1904f、および英語の「U.S.」1904gという用語が記述されている。
【0198】
また、日本語の「アメリカ合衆国」1904aには類似度として1.0、日本語の「アメリカ」1904bには類似度として0.8、日本語の「米国」1904cには類似度として0.9、英語の「United States of America」1904dには類似度として1.0、英語の「America」1904eには類似度として0.8、英語の「U.S.A.」1904fには類似度として0.9、および英語の「U.S.」1904gには類似度として0.7が記述されている。このように、1904a〜1904gに示す用語が記述されている。
【0199】
また、TermExchange1903bには、Term要素として、日本語の「大統領選挙」1904hと、英語の「Presidentioal election」1904i、英語の「Presidential race」1904jという用語が記述されている。
【0200】
また、日本語の「大統領選挙」1904hには類似度として1.0、英語の「Presidentioal election」1904iには類似度として1.0、英語の「Presidential race」1904jには類似度として0.9が記述されている。このように、1904h〜1904jに示す用語が記述されている。
【0201】
このように、TermExchangePack1901に複数のTermExchange1903a、1903bを記述することにより、対象となるコンテンツ記述に含まれるすべての用語とこれらの用語の同義語および異なる言語で表現にした用語を記述することができる。
【0202】
次に、実施の形態6にかかるコンテンツ変換部1203のコンテンツ変換処理について詳細に説明する。コンテンツ変換部1203が、用語変換記述1201bを使い、図25に示すコンテンツ記述1202eを図26に示すコンテンツ記述1202fに変換する処理について説明する。以下の説明では、ユーザが入力部102からすべての類似度の用語を用いてコンテンツ変換を行うとして説明する。
【0203】
まず、コンテンツ変換部1203は、コンテンツ記述1202eを参照し、コンテンツ記述1202aのキーワードである「United States of America」」2001aと、「Presidentioal election」2001bを抽出する。
【0204】
次に、コンテンツ変換部1203は、用度変換記述1201bのコンテンツ記述1202eに対応する部分である図中1903a、1903bを参照する。そして、コンテンツ変換部1203は、抽出した「United States of America」2001aと、「Presidentioal election」2001bを違う表現した用語を抽出する。
【0205】
具体的には、コンテンツ変換部1203は、「United States of America」2001aに対して「America」、「U.S.A.」、「U.S.」、「アメリカ合衆国」、「アメリカ」、および「米国」を、「Presidentioal election」2001bに対して「大統領選挙」と「Presidential race」を抽出する。
【0206】
次に、コンテンツ変換部1203は、コンテンツ記述1202eの「United States of America」2001aおよび「Presidentioal election」2001b」に加えて、「America」2102a、「U.S.A.」2101b、「U.S.」2101c、「Presidential race」2101d、「アメリカ合衆国」2101e、「アメリカ」2101f、「米国」2101g、および「大統領選挙」2101hを追加して記述する。
【0207】
このように、コンテンツ変換部1203は、コンテンツ記述1202eをコンテンツ記述1202fに変換する。これにより、コンテンツ記述1202fには、コンテンツ記述1202eのキーワードを別の表現したキーワードがすべて記述される。この結果、ひとつのコンテンツ記述に用語を異なる表現した複数の用語を記述することができるので、コンテンツ記述の冗長性をさらに抑えることができる。
【0208】
また、コンテンツ変換部1203は、英語であるUnited Statesof America」2001a、「Presidentioal election」2001b」に加えて、「America」2102a、「U.S.A.」2101b、「U.S.」2101c、および「Presidential race」2101dを、「en」2102aでまとめ、アメリカ合衆国」2101e、「アメリカ」2101f、「米国」2101g、および「大統領選挙」2101hを「ja」2102bでまとめている。
【0209】
このように、コンテンツ記述1202dに対応する用語を言語毎まとめている。これにより、コンテンツ記述1202dに対応する用語を言語を言語毎に分けて理解できる。
【0210】
また、以上の説明では、ユーザが入力部102からすべての類似度の用語を用いてコンテンツ変換を行うとして説明したが、ユーザは任意の類似度の用語を用いてコンテンツ変換を行う形態であっても良い。
【0211】
この場合は、コンテンツ変換部1203は、ユーザが指定した類似度以上の用語を用いてコンテンツ変換を行う。例えば、上述した例でユーザが類似度0.9以上と指定した場合には、コンテンツ変換部1203は、類似度が0.9以上の用語である「United States of America」2001a、「U.S.A.」1904f、「アメリカ合衆国」1904a、および「米国」1904cを、「Presidentioal election」2001bに対して「大統領選挙」1904fと「Presidential race」1904jを抽出する。そして、コンテンツ変換部1203は、抽出した用語のみを用いてコンテンツ変換を行う。
【0212】
以上説明したように実施の形態6によれば、コンテンツ記述に含まれる用語を同じ意味で違う表現をした用語である同義語に変換することにより、用語の表現数を増やしても、コンテンツ記述の冗長性を抑えられるようにできる。
【0213】
【発明の効果】
以上説明したように、本発明によれば、コンテンツ記述に含まれる用語を異なる表現の用語に変換にできるので、コンテンツ記述に複数の異なる表現をした用語を記述する必要がなくなり、用語の表現数を増やしても、コンテンツ記述の冗長性を抑えることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1におけるコンテンツ検索装置のブロック図
【図2】実施の形態1にかかるコンテンツ記述を示した図
【図3】実施の形態1にかかるコンテンツ記述を示した図
【図4】実施の形態1にかかる用語変換記述の記述定義を示した図
【図5】実施の形態1にかかる用語変換記述の記述定義で用いるMPEG−7標準規格のデータタイプを示した図
【図6】実施の形態1にかかる用語変換記述の例を示した図
【図7】実施の形態1にかかるコンテンツ検索装置の動作を説明するフロー図
【図8】実施の形態2にかかるコンテンツ検索装置の動作を説明するフロー図
【図9】実施の形態2にかかる変換後のコンテンツ記述を示す図
【図10】実施の形態3にかかるコンテンツ検索装置の動作を説明するフロー図
【図11】実施の形態4にかかるコンテンツ検索装置の動作を説明するフロー図
【図12】実施の形態5にかかるコンテンツ検索装置のブロック図
【図13】実施の形態5にかかる用語変換記述の記述定義を示した図
【図14】実施の形態5にかかる用語変換記述の例を示した図
【図15】実施の形態5にかかるコンテンツ記述を示した図
【図16】実施の形態5にかかるコンテンツ記述を示した図
【図17】実施の形態5にかかるコンテンツ記述を示した図
【図18】実施の形態5にかかるコンテンツ記述を示した図
【図19】実施の形態5にかかる検索式を示した図
【図20】実施の形態5にかかる検索結果を示した図
【図21】実施の形態5にかかる検索式を示した図
【図22】実施の形態5にかかる検索結果を示した図
【図23】実施の形態5にかかる検索式を示した図
【図24】実施の形態6にかかる用語変換記述の例を示した図
【図25】実施の形態6にかかるコンテンツ記述を示した図
【図26】実施の形態6にかかるコンテンツ記述を示した図
【符号の説明】
10、1200 コンテンツ検索装置
31、1201 用語変換記述
32、1202 コンテンツ記述
101 蓄積部
102 入力部
104、1204 検索部
106 モニタ
107 スピーカ
1203 コンテンツ変換部

Claims (22)

  1. 内容を示す観点が付与されたコンテンツ記述を格納するコンテンツ格納手段と、前記観点と前記観点を異なる表現した用語とを対応つけて記述した用語変換記述を格納した用語変換記述格納手段と、前記コンテンツ記述を検索するために入力された検索要求と前記観点とが異なる場合に、前記用語変換記述を用いて前記観点に対応する前記異なる表現をした用語を抽出し、抽出した前記異なる表現をした用語を新たな前記観点とした前記コンテンツ記述を生成し、前記検索要求と同じ前記新たな観点が付与された前記新たなコンテンツを検索する検索手段と、を具備したことを特徴とするコンテンツ検索装置。
  2. 前記異なる表現をした用語は、前記観点を異なる言語で表現したものであることを特徴とする請求項1記載のコンテンツ検索装置。
  3. 前記異なる表現をした用語は、前記観点の同義語であることを特徴とする請求項1記載のコンテンツ検索装置。
  4. 前記コンテンツ記述は前記観点が付与された複数のセグメントから構成され、前記検索手段は前記検索要求と同じ前記新たな観点が付与された前記セグメントを抽出することを特徴とする請求項1から請求項3のいずれかに記載のコンテンツ検索装置。
  5. 内容を示す観点が付与されたコンテンツ記述を格納するコンテンツ格納手段と、前記観点と前記観点を異なる表現した用語とを対応つけて記述した用語変換記述を格納した用語変換記述格納手段と、前記コンテンツ記述を検索するために入力された検索要求と前記観点とが異なる場合に、前記用語変換記述を用いて前記検索要求に対応する前記観点を異なる表現にした用語を抽出し、前記検索要求を抽出した前記異なる表現をした用語に変換した新たな前記検索要求を生成し、前記新たな検索要求と同じ前記観点が付与された前記コンテンツ記述を検索する検索手段と、を具備したことを特徴とするコンテンツ検索装置。
  6. 前記異なる表現をした用語は、前記観点を異なる言語で表現したものであることを特徴とする請求項5記載のコンテンツ検索装置。
  7. 前記異なる表現をした用語は、前記観点の同義語であることを特徴とする請求項5記載のコンテンツ検索装置。
  8. 前記コンテンツ記述は前記観点が付与された複数のセグメントから構成され、前記検索手段は前記新たな検索要求と同じ前記観点が付与された前記セグメントを抽出することを特徴とする請求項5から請求項7のいずれかに記載のコンテンツ検索装置。
  9. 前記コンテンツ記述および前記用語変換記述はXMLを用いて記述されていることを特徴とする請求項1から請求項8のいずれかに記載のコンテンツ検索装置。
  10. 前記コンテンツ記述は、ISO/IEC 15938−2およびISO/IEC 15938−5に基づいた記述になされていることを特徴とする請求項1から請求項9のいずれかに記載のコンテンツ検索装置。
  11. 検索対象であり内容を示す観点が付与されたコンテンツ記述に対して入力された前記コンテンツ記述を検索するための検索要求の言語が前記コンテンツ記述の前記観点の言語と異なる場合に、前記観点と前記観点を異なる表現した用語とを対応つけて記述した用語変換記述を用いて前記観点に対応する前記異なる表現をした用語を抽出し、抽出した前記異なる表現をした用語を新たな前記観点とした前記コンテンツ記述を生成し、前記検索要求と同じ前記新たな観点が付与された前記新たなコンテンツを検索する前記観点を前記検索要求の言語に変換した新たな前記観点が付与された新たな前記コンテンツ記述を生成し、前記検索要求と同じ前記新たな観点が付与された前記新たなコンテンツ記述を検索することを特徴とするコンテンツ検索方法。
  12. 検索対象であり内容を示す観点が付与されたコンテンツ記述に対して入力された前記コンテンツ記述を検索するための検索要求が前記観点と異なる場合に、前記観点と前記観点と同じ意味の異なる用語とを対応つけて記述した用語変換記述を用いて前記検索要求に対応する前記観点を異なる表現にした用語を抽出し、前記検索要求を抽出した前記異なる表現をした用語に変換した新たな前記検索要求を生成し、前記新たな検索要求と同じ前記観点が付与された前記コンテンツ記述を検索することを特徴とするコンテンツ検索方法。
  13. コンピュータに、検索対象であり内容を示す観点が付与されたコンテンツ記述に対して入力された前記コンテンツ記述を検索するための検索要求の言語が前記コンテンツ記述の前記観点の言語と異なる場合に、前記観点と前記観点を異なる表現した用語とを対応つけて記述した用語変換記述を用いて前記観点に対応する前記異なる表現をした用語を抽出させ、抽出させた前記異なる表現をした用語を新たな前記観点とした前記コンテンツ記述を生成させ、前記検索要求と同じ前記新たな観点が付与された前記新たなコンテンツを検索する前記観点を前記検索要求の言語に変換した新たな前記観点が付与された新たな前記コンテンツ記述を生成させ、前記検索要求と同じ前記新たな観点が付与された前記新たなコンテンツ記述を検索させることを特徴とするプログラム。
  14. コンピュータに、検索対象であり内容を示す観点が付与されたコンテンツ記述に対して入力された前記コンテンツ記述を検索するための検索要求が前記観点と異なる場合に、前記観点と前記観点と同じ意味の異なる用語とを対応つけて記述した用語変換記述を用いて前記検索要求に対応する前記観点を異なる表現にした用語を抽出させ、前記検索要求を抽出させた前記異なる表現をした用語に変換した新たな前記検索要求を生成させ、前記新たな検索要求と同じ前記観点が付与された前記コンテンツ記述を検索させることを特徴とするプログラム。
  15. コンテンツ記述を格納するコンテンツ格納手段と、前記コンテンツ記述に含まれる用語と前記用語を異なる表現した用語とを対応つけて記述した用語変換記述を格納した用語変換記述格納手段と、前記用語変換記述を用いて前記コンテンツ記述に含まれる用語を前記異なる表現した用語に変換する変換手段、を具備したことを特徴とするコンテンツ変換装置。
  16. 前記用語変換記述には、前記コンテンツ記述に含まれる用語と前記異なる表現した用語との組を複数記述していることを特徴とする請求項15記載のコンテンツ変換装置。
  17. 前記変換手段は、前記用語変換記述を用いて前記コンテンツ記述に含まれる用語を異なる表現した複数の用語に変換することを特徴とする請求項16記載のコンテンツ変換装置。
  18. 前記異なる表現をした用語は、前記前記用語を異なる言語で表現したものであることを特徴とする請求項15から請求項17のいずれかに記載のコンテンツ変換装置。
  19. 前記異なる表現をした用語は、前記用語の同義語であることを特徴とする請求項15から請求項17のいずれかに記載のコンテンツ変換装置。
  20. 前記コンテンツ記述は、ISO/IEC 15938−2およびISO/IEC 15938−5に基づいた記述になされていることを特徴とする請求項15から請求項19のいずれかに記載のコンテンツ変換装置。
  21. コンテンツ記述に含まれる用語と前記用語を異なる表現した用語とを対応つけて記述した用語変換記述を用いて前記コンテンツ記述に含まれる用語を異なる表現した用語に変換することを特徴とするコンテンツ変換方法。
  22. コンピュータに、コンテンツ記述に含まれる用語と前記用語を異なる表現した用語とを対応つけて記述した用語変換記述を用いて前記コンテンツ記述に含まれる用語を異なる表現した用語に変換させることを特徴とするプログラム。
JP2003043290A 2002-03-28 2003-02-20 コンテンツ検索装置およびコンテンツ検索方法 Pending JP2004005439A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2003043290A JP2004005439A (ja) 2002-03-28 2003-02-20 コンテンツ検索装置およびコンテンツ検索方法
US10/391,899 US7082431B2 (en) 2002-03-28 2003-03-20 Content retrieval apparatus and method
EP03006771A EP1351162A3 (en) 2002-03-28 2003-03-25 Content retrieval apparatus and method
CNB031085180A CN100492353C (zh) 2002-03-28 2003-03-28 内容检索设备和方法
KR10-2003-0019707A KR100503546B1 (ko) 2002-03-28 2003-03-28 컨텐츠 검색 장치, 컨텐츠 검색 방법, 컨텐츠 변환 장치,컨텐츠 변환 방법 및 프로그램을 저장한 기억 매체

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002091234 2002-03-28
JP2003043290A JP2004005439A (ja) 2002-03-28 2003-02-20 コンテンツ検索装置およびコンテンツ検索方法

Publications (1)

Publication Number Publication Date
JP2004005439A true JP2004005439A (ja) 2004-01-08

Family

ID=28043840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003043290A Pending JP2004005439A (ja) 2002-03-28 2003-02-20 コンテンツ検索装置およびコンテンツ検索方法

Country Status (5)

Country Link
US (1) US7082431B2 (ja)
EP (1) EP1351162A3 (ja)
JP (1) JP2004005439A (ja)
KR (1) KR100503546B1 (ja)
CN (1) CN100492353C (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4369708B2 (ja) * 2002-09-27 2009-11-25 パナソニック株式会社 データ処理装置
US7698262B2 (en) * 2006-03-29 2010-04-13 Electronics And Telecommunications Research Institute Apparatus and method for searching multimedia data based on metadata
US7930290B2 (en) * 2007-01-12 2011-04-19 Microsoft Corporation Providing virtual really simple syndication (RSS) feeds
KR101194635B1 (ko) * 2007-07-24 2012-10-29 에스케이텔레콤 주식회사 패러프레이즈를 이용하여 언어 학습 서비스를 제공하는방법과 그를 위한 시스템, 서버 및 컴퓨터로 읽을 수 있는기록매체
CN106095742A (zh) * 2016-06-20 2016-11-09 北京金山安全软件有限公司 一种文本内容生成方法与服务器
US20230054480A1 (en) * 2021-08-19 2023-02-23 International Business Machines Corporation Viewpoint analysis of video data

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2007384A (en) * 1933-02-23 1935-07-09 Superstat Company Balanced thermostat
JP3379985B2 (ja) 1993-05-07 2003-02-24 松下電器産業株式会社 翻訳例文検索装置
US5913215A (en) * 1996-04-09 1999-06-15 Seymour I. Rubinstein Browse by prompted keyword phrases with an improved method for obtaining an initial document set
JPH1153384A (ja) * 1997-08-05 1999-02-26 Mitsubishi Electric Corp キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
US6167397A (en) * 1997-09-23 2000-12-26 At&T Corporation Method of clustering electronic documents in response to a search query
JP3181548B2 (ja) 1998-02-03 2001-07-03 富士通株式会社 情報検索装置及び情報検索方法
WO2000026766A1 (en) 1998-11-04 2000-05-11 Sullivan Walter, Iii Database system with restricted keyword list and bi-directional keyword translation
US6629132B1 (en) * 1998-12-23 2003-09-30 Novell, Inc. Predicate indexing of data stored in a computer with application to indexing cached data
JP2001160066A (ja) 1998-12-25 2001-06-12 Matsushita Electric Ind Co Ltd データ処理装置、データ処理方法および記録媒体、並びに該データ処理方法をコンピュータに実行させるためのプログラム
US20020103818A1 (en) * 2000-05-04 2002-08-01 Kirkfire, Inc. Information repository system and method for an internet portal system
JP2001337981A (ja) 2000-05-30 2001-12-07 Patolis Corp 第1言語検索式を第2言語検索式に変換するための検索式変換方法
JP2002056020A (ja) * 2000-08-09 2002-02-20 Nippon Telegraph & Telephone East Corp コンテンツ検索方法、コンテンツ検索システムおよびコンテンツ検索プログラムが記録されたコンピュータ読み取り可能な記録媒体
EP1454263A4 (en) * 2001-11-21 2008-02-13 Contecs Dd Llc DATA DICTIONARY OF DIGITAL RIGHTS MANAGEMENT

Also Published As

Publication number Publication date
US7082431B2 (en) 2006-07-25
CN1448869A (zh) 2003-10-15
KR20030078792A (ko) 2003-10-08
EP1351162A2 (en) 2003-10-08
US20030187829A1 (en) 2003-10-02
CN100492353C (zh) 2009-05-27
EP1351162A3 (en) 2004-05-12
KR100503546B1 (ko) 2005-07-25

Similar Documents

Publication Publication Date Title
US7587389B2 (en) Question answering system, data search method, and computer program
JP5699789B2 (ja) 情報処理装置、情報処理方法、プログラム及び情報処理システム
JP3755134B2 (ja) コンピュータベースの適合テキスト検索システムおよび方法
JP5229226B2 (ja) 情報共有システム、情報共有方法、および情報共有プログラム
US20100287162A1 (en) method and system for text summarization and summary based query answering
US8589778B2 (en) System and method for processing multi-modal communication within a workgroup
US8935152B1 (en) Method and apparatus for frame-based analysis of search results
JP2005516306A (ja) 任意の各国語での照会によるマッチング文書の検索
US10838953B1 (en) Method and apparatus for frame based search
US9026529B1 (en) Method and apparatus for determining search result demographics
KR20020058639A (ko) 엑스엠엘 문서 검색 시스템 및 그 방법
WO2010089248A1 (en) Method and system for semantic searching
JP4092933B2 (ja) 文書情報検索装置及び文書情報検索プログラム
US8229970B2 (en) Efficient storage and retrieval of posting lists
JP4177070B2 (ja) 文書検索装置
Noh et al. WIRE: an automated report generation system using topical and temporal summarization
JP2004005439A (ja) コンテンツ検索装置およびコンテンツ検索方法
Houben et al. HERA: Automatically generating hypermedia front-ends for ad hoc data from heterogeneous and legacy information systems
Fauzi et al. Image understanding and the web: a state-of-the-art review
Poomagal et al. K-means for search results clustering using url and tag contents
JP4469817B2 (ja) 文書検索システム及びプログラム
KR101835994B1 (ko) 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치
JP4452527B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP2000163441A (ja) 辞書作成方法及び装置及び辞書作成プログラムを格納した記憶媒体及び検索要求作成方法及び装置及び検索要求作成プログラムを格納した記憶媒体及び多言語対応情報検索システム
Ziegler Advances in the acute therapy of hypertension

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090313

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090407