JP2008139942A - Information processing apparatus, information processing method and program - Google Patents

Information processing apparatus, information processing method and program Download PDF

Info

Publication number
JP2008139942A
JP2008139942A JP2006323110A JP2006323110A JP2008139942A JP 2008139942 A JP2008139942 A JP 2008139942A JP 2006323110 A JP2006323110 A JP 2006323110A JP 2006323110 A JP2006323110 A JP 2006323110A JP 2008139942 A JP2008139942 A JP 2008139942A
Authority
JP
Japan
Prior art keywords
content
information
processing apparatus
target content
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006323110A
Other languages
Japanese (ja)
Inventor
Shiyunkei Irie
俊慶 入江
Toshinori Nagahashi
敏則 長橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2006323110A priority Critical patent/JP2008139942A/en
Publication of JP2008139942A publication Critical patent/JP2008139942A/en
Withdrawn legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an information processing apparatus, an information processing method and a program that can significantly reduce a load of digital content management. <P>SOLUTION: The information processing apparatus 1 refers to the category of content to be processed, acquires content related to the category, extracts the most significant word from the acquired content, and includes the extracted most significant word in metadata on the target content. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、静止画像や動画像等のコンテンツを処理する情報処理装置、情報処理方法、
および、プログラムに関する。
The present invention relates to an information processing apparatus, an information processing method for processing content such as a still image and a moving image,
And related to the program.

近年、個人が保存している画像等のコンテンツは増加する一方である。代表的なコンテ
ンツであるデジタル画像データには、デジタルカメラの機能によって、撮影日時を示す情
報等を含むメタデータが付加されることが多い。このメタデータに含まれる情報を利用す
れば、例えば特定の日に撮影されたデジタル画像データを検索することができ、デジタル
画像データの管理の一助となる。ところが、一般的なメタデータに含まれる情報は、撮影
日時や撮影時の条件(ISO感度、シャッタースピードなど)を示す情報であり、コンテ
ンツの内容に関連する情報は含まれない。このため、メタデータに含まれる情報を用いて
も、コンテンツの内容に基づく管理を行うことは困難であった。そこで、従来、画像デー
タに関連するイベントを探す機能を備えた装置が提案された(例えば、特許文献1参照)
。この装置は、イベントの日時に関する情報を記憶しており、対象の画像データの撮影日
時に基づいて、画像データとイベントとの関連の有無を判定する。
特開2003−303210号公報
In recent years, content such as images stored by individuals has been increasing. Digital image data, which is representative content, is often added with metadata including information indicating the shooting date and time by the function of the digital camera. By using the information included in this metadata, for example, digital image data captured on a specific day can be searched, which helps to manage the digital image data. However, information included in general metadata is information indicating the shooting date and time and shooting conditions (ISO sensitivity, shutter speed, etc.), and does not include information related to the content. For this reason, it is difficult to perform management based on the contents even if information included in the metadata is used. Thus, conventionally, an apparatus having a function of searching for an event related to image data has been proposed (see, for example, Patent Document 1).
. This apparatus stores information related to the date and time of the event, and determines whether or not the image data and the event are related based on the shooting date and time of the target image data.
JP 2003-303210 A

しかしながら、上記従来の装置は、イベントの日時に関する正確な情報を用意する必要
がある。このため、ユーザは常に最新の正確な情報を入力しなければならず、負荷が大き
いという問題があった。
また、コンテンツの管理を効率よく行うため、ユーザ自身が、コンテンツの内容に関連
する情報等を、例えばメタデータの形で付加しておけばよい。しかしながら、一つ一つの
コンテンツに対して、手作業でデータを入力する作業は非常に煩雑で負荷が大きく、多数
のコンテンツを処理することはできない。このため、多数のコンテンツを簡単に効率よく
管理するための手法が求められていた。
本発明は、多数のコンテンツを効率よく管理することが可能で、コンテンツの管理に係
る負荷を大幅に軽減できる情報処理装置、情報処理方法、および、プログラムを提供する
ことを目的とする。
However, the conventional apparatus needs to prepare accurate information regarding the date and time of the event. For this reason, the user must always input the latest accurate information, and there is a problem that the load is large.
Further, in order to efficiently manage the content, the user himself / herself may add information related to the content content in the form of metadata, for example. However, manually inputting data for each piece of content is very complicated and heavy, and a large number of pieces of content cannot be processed. Therefore, a method for easily and efficiently managing a large number of contents has been demanded.
An object of the present invention is to provide an information processing apparatus, an information processing method, and a program that can efficiently manage a large number of contents and can significantly reduce the load related to the management of contents.

上記目的を達成するため、本発明は、処理対象コンテンツの内容に関する属性情報を取
得し、この属性情報に関連する参照コンテンツを取得する参照コンテンツ取得手段と、前
記参照コンテンツ取得手段により取得された前記参照コンテンツから特徴情報を抽出する
抽出手段と、前記抽出手段により抽出された特徴情報を含む前記処理対象コンテンツの付
加情報を生成する付加情報生成手段と、を備えることを特徴とする情報処理装置を提供す
る。
この構成によれば、処理対象コンテンツの内容に関する属性情報をもとに取得された参
照コンテンツから特徴情報が抽出され、この特徴情報を含む処理対象コンテンツの付加情
報が生成されるので、処理対象コンテンツの内容に関連する情報を付加情報に含めること
ができる。ここで生成される付加情報を、例えば検索キーとして利用すれば、処理対象コ
ンテンツを、その内容に基づいて検索することが可能になり、コンテンツを効率よく管理
できる。また、付加情報を生成する際には処理対象コンテンツの内容に関する属性情報に
関連する参照コンテンツが取得されるので、処理対象コンテンツに対応する属性情報があ
れば、自動的に付加情報が生成される。このため、付加情報の生成に関してユーザが煩雑
な作業を行う必要がなく、コンテンツの管理に係る負荷を大幅に軽減できる。
In order to achieve the above object, the present invention acquires attribute information related to the contents of the processing target content, acquires reference content related to the attribute information, and the reference content acquisition unit acquires the reference content An information processing apparatus comprising: extraction means for extracting feature information from reference content; and additional information generation means for generating additional information of the processing target content including the feature information extracted by the extraction means. provide.
According to this configuration, the feature information is extracted from the reference content acquired based on the attribute information related to the content of the processing target content, and the additional information of the processing target content including the feature information is generated. Can be included in the additional information. If the additional information generated here is used as, for example, a search key, it becomes possible to search the processing target content based on the content, and the content can be managed efficiently. Further, when generating the additional information, reference content related to the attribute information related to the content of the processing target content is acquired. Therefore, if there is attribute information corresponding to the processing target content, the additional information is automatically generated. . For this reason, it is not necessary for the user to perform complicated work regarding generation of additional information, and the load related to content management can be greatly reduced.

ここで、前記属性情報毎に基準表現を記憶する基準表現記憶手段と、前記処理対象コン
テンツの属性情報に対応する基準表現を、前記基準表現記憶手段から取得する基準表現取
得手段と、を備え、前記参照コンテンツ取得手段は、前記基準表現取得手段により取得さ
れた基準表現または取得された基準表現に類似する表現を含む前記参照コンテンツを取得
する構成としてもよい。
この場合、参照コンテンツは属性情報に対応する基準表現または基準表現に類似する表
現を含んでいるので、処理対象コンテンツの内容に無関係な参照コンテンツが取得される
ことがない。このため、参照コンテンツから抽出された特徴情報は、確実に処理対象コン
テンツの内容に関連する情報であり、特徴情報の信頼性は非常に高いといえる。従って、
処理対象コンテンツの付加情報が、その内容と高い関連性を有する情報を含むことになり
、コンテンツを極めて効率よく管理できるようになる。
Here, a standard expression storage unit that stores a standard expression for each attribute information, and a standard expression acquisition unit that acquires a standard expression corresponding to the attribute information of the processing target content from the standard expression storage unit, The reference content acquisition unit may be configured to acquire the reference content including a reference expression acquired by the reference expression acquisition unit or an expression similar to the acquired reference expression.
In this case, since the reference content includes the standard expression corresponding to the attribute information or an expression similar to the standard expression, the reference content unrelated to the content of the processing target content is not acquired. For this reason, the feature information extracted from the reference content is certainly information related to the content of the processing target content, and it can be said that the reliability of the feature information is very high. Therefore,
The additional information of the processing target content includes information having high relevance to the content, and the content can be managed extremely efficiently.

また、前記抽出手段は、前記参照コンテンツ取得手段により複数の前記参照コンテンツ
が取得された場合に、これら複数の前記参照コンテンツから特徴情報の候補を抽出する候
補抽出手段と、前記基準表現の出現状態に基づいて各々の前記参照コンテンツの重み付け
を行うコンテンツ評価手段と、前記特徴情報の候補が抽出された前記参照コンテンツの重
みに基づいて、複数の前記特徴情報の候補の中から前記特徴情報を抽出する特徴情報抽出
手段と、を備えて構成されるものとしてもよい。
この場合、基準表現の出現状態に基づいて参照コンテンツに重み付けがなされ、さらに
、参照コンテンツから抽出された各々の特徴情報の候補の中から、その出自となった参照
コンテンツの重みに基づいて、特徴情報が選択される。このため、特徴情報の候補のうち
、処理対象コンテンツの内容と高い関連性を有する参照コンテンツから抽出されたものが
、特徴情報となる。従って、処理対象コンテンツの付加情報が、その内容と高い関連性を
有する情報を含むことになり、コンテンツを極めて効率よく管理できるようになる。
In addition, when the plurality of reference contents are acquired by the reference content acquisition unit, the extraction unit extracts candidate feature information from the plurality of reference contents, and the appearance state of the reference expression Content evaluation means for weighting each reference content based on the feature information, and extracting the feature information from a plurality of feature information candidates based on the weight of the reference content from which the feature information candidates are extracted And feature information extraction means.
In this case, the reference content is weighted based on the appearance state of the standard expression, and further, the feature based on the weight of the reference content that is the origin from among the candidate feature information extracted from the reference content. Information is selected. For this reason, the feature information is extracted from the reference content having high relevance to the content of the processing target content among the feature information candidates. Therefore, the additional information of the processing target content includes information having high relevance with the content, and the content can be managed extremely efficiently.

また、前記候補抽出手段は、前記参照コンテンツに含まれる言語表現を言語単位に分割
し、個々の言語単位に対して重み付けを行い、この重みに基づいて一部の前記言語表現を
前記言語単位で選択して、前記特徴情報の候補とするものとしてもよい。
この場合、特徴情報の候補を抽出する際に、言語表現を言語単位で分割した上で重み付
けを行うので、参照コンテンツの中で重要性の高い言語表現を、特徴情報の候補として抽
出できる。このため、特徴情報の候補が処理対象コンテンツの内容と高い関連性を有する
ものとなる。さらに、特徴情報の候補が言語表現であるため、ユーザにとって非常にわか
りやすく、かつ、検索キーとして簡単かつ有効に利用できる。従って、処理対象コンテン
ツの付加情報が認識しやすく、検索容易性が高いので、コンテンツの管理を非常に効率よ
く行うことができる。
Further, the candidate extraction unit divides the language expression included in the reference content into language units, performs weighting on each language unit, and based on the weights, part of the language expressions is performed in the language unit. It may be selected as a candidate for the feature information.
In this case, when extracting feature information candidates, weighting is performed after the language expression is divided in units of languages, so that language expressions having high importance in the reference content can be extracted as feature information candidates. For this reason, the feature information candidates are highly relevant to the content of the processing target content. Furthermore, since the feature information candidates are linguistic expressions, it is very easy for the user to understand and can be used easily and effectively as a search key. Therefore, the additional information of the processing target content is easy to recognize and the searchability is high, so that the content can be managed very efficiently.

さらに、前記基準表現は、単語、句、節、文、段落のいずれかの言語単位で構成される
言語表現であるものとしてもよい。
この場合、基準表現が単語、句、節、文、段落のいずれかの言語単位で構成される言語
表現であるため、この基準表現が適切か否かをユーザが容易に判断することができ、基準
表現の最適化を容易に行うことができる。これにより、処理対象コンテンツの内容に高い
関連性を有する参照コンテンツを取得することができ、ひいては、特徴情報の信頼性をよ
り高めることができ、より効率よくコンテンツを管理できるようになる。
Further, the reference expression may be a linguistic expression composed of any language unit of a word, a phrase, a clause, a sentence, and a paragraph.
In this case, since the reference expression is a linguistic expression composed of any language unit of words, phrases, sections, sentences, and paragraphs, the user can easily determine whether or not the reference expression is appropriate, The standard expression can be easily optimized. As a result, it is possible to acquire reference content having a high relevance to the content of the processing target content, and as a result, the reliability of the feature information can be further increased, and the content can be managed more efficiently.

また、前記属性情報を入力するための入力手段を備え、前記参照コンテンツ取得手段は
、前記入力手段により入力された属性情報に関連する前記参照コンテンツを取得する構成
としてもよい。
この場合、処理対象コンテンツの属性情報を入力することで、参照コンテンツが取得さ
れ、処理対象コンテンツの付加情報が生成される。これにより、付加情報を入力する作業
を行うだけで、有用な付加情報が生成されるので、コンテンツの管理に係る負荷を大幅に
軽減できる。
In addition, an input unit for inputting the attribute information may be provided, and the reference content acquisition unit may acquire the reference content related to the attribute information input by the input unit.
In this case, the reference content is acquired by inputting the attribute information of the processing target content, and additional information of the processing target content is generated. As a result, useful additional information is generated simply by performing an operation of inputting additional information, so that the load related to content management can be greatly reduced.

さらにまた、前記参照コンテンツ取得手段は、前記処理対象コンテンツが作成または更
新された日時から所定時間内に、作成または更新された前記参照コンテンツを取得するも
のとしてもよい。
この場合、参照コンテンツは、処理対象コンテンツが作成または更新された日時から近
い時期に作成または更新されたものであるから、参照コンテンツに含まれる情報は、確実
に、処理対象コンテンツの内容と高い関連性を有するものとなる。言い換えれば、処理対
象コンテンツの内容と乖離した参照コンテンツを排除することができ、ひいては、特徴情
報の信頼性をより高めることができ、より効率よくコンテンツを管理できるようになる。
Furthermore, the reference content acquisition means may acquire the reference content created or updated within a predetermined time from the date and time when the processing target content was created or updated.
In this case, since the reference content is created or updated at a time close to the date and time when the processing target content was created or updated, the information included in the reference content is surely related to the details of the processing target content. It will have a sex. In other words, the reference content deviating from the content of the processing target content can be excluded, and as a result, the reliability of the feature information can be further improved, and the content can be managed more efficiently.

さらに、外部接続された通信回線を介して情報を送受信する通信手段を備え、前記参照
コンテンツ取得手段は、前記通信手段により通信可能な外部の装置から前記参照コンテン
ツを取得する構成としてもよい。
この場合、外部接続された通信回線を介して参照コンテンツを取得することで、極めて
多数のコンテンツの中から、参照コンテンツとして好適なコンテンツを取得できる。
Furthermore, it is good also as a structure provided with the communication means which transmits / receives information via the communication line connected externally, and the said reference content acquisition means acquires the said reference content from the external apparatus communicable by the said communication means.
In this case, by acquiring reference content via an externally connected communication line, content suitable as reference content can be acquired from an extremely large number of content.

また、前記通信手段により受信したコンテンツを表示する外部コンテンツ表示手段を備
え、前記参照コンテンツ取得手段は、前記外部コンテンツ表示手段により過去に表示され
たコンテンツを前記参照コンテンツとして取得する構成としてもよい。
この場合、処理対象コンテンツの付加情報を生成する処理以外の動作において、表示さ
れたコンテンツの中から、参照コンテンツを取得することができるので、より好適な参照
コンテンツを取得できる。
In addition, an external content display unit that displays the content received by the communication unit may be provided, and the reference content acquisition unit may acquire the content displayed in the past by the external content display unit as the reference content.
In this case, since the reference content can be acquired from the displayed content in an operation other than the process of generating the additional information of the processing target content, more preferable reference content can be acquired.

本発明は、処理対象コンテンツの内容に関する属性情報を取得し、この属性情報に関連
する参照コンテンツを取得し、取得した前記参照コンテンツから特徴情報を抽出し、抽出
した特徴情報を含む前記処理対象コンテンツの付加情報を生成すること、を特徴とする情
報処理方法を提供する。
この方法によれば、処理対象コンテンツの内容に関する属性情報をもとに取得された参
照コンテンツから特徴情報が抽出され、この特徴情報を含む処理対象コンテンツの付加情
報が生成されるので、処理対象コンテンツの内容に関連する情報を付加情報に含めること
ができる。ここで生成される付加情報は、コンテンツの内容に基づく検索を行う場合など
に利用することができ、コンテンツを効率よく管理できる。また、処理対象コンテンツの
内容に関する属性情報があれば付加情報が生成されるので、付加情報の生成に関してユー
ザが煩雑な作業を行う必要がなく、コンテンツの管理に係る負荷を大幅に軽減できる。
The present invention acquires attribute information relating to the content of the processing target content, acquires reference content related to the attribute information, extracts feature information from the acquired reference content, and includes the extracted feature information An information processing method characterized by generating additional information is provided.
According to this method, the feature information is extracted from the reference content acquired based on the attribute information regarding the content of the processing target content, and the additional information of the processing target content including the feature information is generated. Can be included in the additional information. The additional information generated here can be used when performing a search based on the content, and the content can be managed efficiently. In addition, since additional information is generated if there is attribute information related to the content of the processing target content, it is not necessary for the user to perform complicated work for generating the additional information, and the load related to content management can be greatly reduced.

また、本発明は、コンピュータを、処理対象コンテンツの内容に関する属性情報を取得
し、この属性情報に関連する参照コンテンツを取得する参照コンテンツ取得手段と、前記
参照コンテンツ取得手段により取得された前記参照コンテンツから特徴情報を抽出する抽
出手段と、前記抽出手段により抽出された特徴情報を含む前記処理対象コンテンツの付加
情報を生成する付加情報生成手段と、して機能させるためのプログラムを提供する。
このプログラムをコンピュータによって実行することにより、コンピュータは、処理対
象コンテンツの内容に関する属性情報をもとに取得された参照コンテンツから特徴情報を
抽出し、この特徴情報を含む処理対象コンテンツの付加情報を生成する。このため、処理
対象コンテンツの内容に関連する情報を付加情報に含めることができる。ここで生成され
る付加情報は、コンテンツの内容に基づく検索を行う場合などに利用することができ、コ
ンテンツを効率よく管理できる。また、処理対象コンテンツの内容に関する属性情報があ
れば、コンピュータが付加情報を生成するので、付加情報の生成に関してユーザが煩雑な
作業を行う必要がなく、コンテンツの管理に係る負荷を大幅に軽減できる。
The present invention also provides a computer for acquiring attribute information related to the content of the processing target content, acquiring reference content related to the attribute information, and the reference content acquired by the reference content acquiring means. There is provided a program for functioning as extraction means for extracting feature information from, and additional information generation means for generating additional information of the processing target content including the feature information extracted by the extraction means.
By executing this program by the computer, the computer extracts feature information from the reference content acquired based on the attribute information regarding the content of the processing target content, and generates additional information of the processing target content including the feature information. To do. For this reason, information related to the content of the processing target content can be included in the additional information. The additional information generated here can be used when performing a search based on the content, and the content can be managed efficiently. In addition, if there is attribute information related to the content of the processing target content, the computer generates additional information, so that the user does not have to perform complicated operations for generating additional information, and the load related to content management can be greatly reduced. .

以下、図面を参照して本発明を適用した実施形態について説明する。
図1は、本発明を適用した実施形態に係る情報処理装置1の構成を示すブロック図であ
る。
情報処理装置1は、デジタルコンテンツを対象として、その内容に関連する単語を選び
、選んだ単語を含むメタデータ(付加情報)を生成するメタデータ生成処理を実行する。
このメタデータ生成処理で、情報処理装置1は、予め登録されている他のコンテンツ(
以下、登録コンテンツと呼ぶ)のうち、処理対象のデジタルコンテンツ(以下、対象コン
テンツと呼ぶ)の作成日時に近い日時に作成または更新された登録コンテンツを選んで取
得する。情報処理装置1においては、ユーザの入力操作により、対象コンテンツの内容を
表す分野が指定される。情報処理装置1は、入力された対象コンテンツの分野に対応する
キーワードをもとに、取得した登録コンテンツを選び、選んだ各々の登録コンテンツから
重要単語を抽出する。さらに、情報処理装置1は、複数の登録コンテンツから抽出された
複数の重要単語(特徴情報の候補)の中から、最重要単語(特徴情報)を選び、この最重
要単語を含むメタデータを生成して、対象コンテンツのメタデータとする。
ここで、対象コンテンツは、動画像や静止画像の画像データ、或いは音声データ等、い
わゆるコンテンツと呼ばれる全てのものを含み、その記録方式等について制限はなく、ア
ナログコンテンツであってもデジタルコンテンツであってもよい。本実施形態では、一例
として、デジタル画像データ等を含むデジタルコンテンツを処理する場合について説明す
る。
まず、情報処理装置1の構成について説明する。
Embodiments to which the present invention is applied will be described below with reference to the drawings.
FIG. 1 is a block diagram showing a configuration of an information processing apparatus 1 according to an embodiment to which the present invention is applied.
The information processing apparatus 1 selects a word related to the content of digital content and executes metadata generation processing for generating metadata (additional information) including the selected word.
In this metadata generation processing, the information processing apparatus 1 uses other contents (
Hereinafter, the registered content created or updated at a date close to the creation date of the digital content to be processed (hereinafter referred to as target content) is selected and acquired. In the information processing apparatus 1, a field representing the content of the target content is designated by a user input operation. The information processing apparatus 1 selects the acquired registered content based on the keyword corresponding to the input target content field, and extracts an important word from each selected registered content. Further, the information processing apparatus 1 selects the most important word (feature information) from a plurality of important words (feature information candidates) extracted from a plurality of registered contents, and generates metadata including the most important word. Thus, the metadata of the target content is used.
Here, the target content includes all so-called content such as image data of moving images and still images, audio data, and the like, and there is no restriction on the recording method and the like, and even analog content is digital content. May be. In the present embodiment, as an example, a case where digital content including digital image data and the like is processed will be described.
First, the configuration of the information processing apparatus 1 will be described.

図1に示すように、情報処理装置1は、情報処理装置1の各部の制御、および、後述す
る処理を実行する制御部2と、制御部2によって実行される各種制御プログラムを記憶し
たROM3と、プログラムやデータを一時的に記憶するRAM4とを備えている。
また、情報処理装置1は、制御部2によって実行されるプログラム、および、このプロ
グラムの実行時に処理されるデータ等を記憶する記憶部5と、ユーザが情報処理装置1に
対する指示入力を行うための入力部6と、制御部2によって実行される処理の結果等を出
力する出力部7と、外部の装置(図示略)に接続される外部インタフェース(I/F)8
と、外部の通信回線15に接続された通信インタフェース9とを備えている。これらの各
部はバス10により相互に接続されている。
As shown in FIG. 1, the information processing apparatus 1 includes a control unit 2 that executes control of each unit of the information processing apparatus 1 and processing that will be described later, and a ROM 3 that stores various control programs executed by the control unit 2. And a RAM 4 for temporarily storing programs and data.
In addition, the information processing apparatus 1 includes a storage unit 5 that stores a program executed by the control unit 2 and data processed when the program is executed, and an instruction input by the user to the information processing apparatus 1. An input unit 6, an output unit 7 for outputting the results of processing executed by the control unit 2, and an external interface (I / F) 8 connected to an external device (not shown)
And a communication interface 9 connected to an external communication line 15. These units are connected to each other by a bus 10.

記憶部5は、磁気的記録媒体、光学的記録媒体、または半導体記憶デバイスを用いて各
種情報を不揮発的に記憶する。記憶部5は、情報処理装置1の各種機能を実現するための
アプリケーションプログラム51を記憶している。また、記憶部5は、図4〜図6を参照
して後述するメタデータ生成処理を情報処理装置1において実行するためのメタデータ生
成プログラム52を記憶している。
さらに、記憶部5は複数のデータ記憶領域を有し、これらのデータ記憶領域には、アプ
リケーションプログラム51の実行時に生成されたデータを格納するアプリケーション用
データ記憶部53、分野別にキーワードを記憶する分野別キーワード情報記憶部54、対
象コンテンツを記憶する対象コンテンツ記憶部55、登録コンテンツに係る情報を記憶す
る登録コンテンツ情報記憶部56、メタデータ生成処理で生成される情報を記憶する重要
単語記憶部57および最重要単語記憶部58が含まれる。
The storage unit 5 stores various information in a nonvolatile manner using a magnetic recording medium, an optical recording medium, or a semiconductor storage device. The storage unit 5 stores an application program 51 for realizing various functions of the information processing apparatus 1. In addition, the storage unit 5 stores a metadata generation program 52 for executing metadata generation processing, which will be described later with reference to FIGS. 4 to 6, in the information processing apparatus 1.
Further, the storage unit 5 has a plurality of data storage areas, and in these data storage areas, an application data storage unit 53 for storing data generated when the application program 51 is executed, a field for storing keywords by field. Another keyword information storage unit 54, a target content storage unit 55 that stores target content, a registered content information storage unit 56 that stores information related to registered content, and an important word storage unit 57 that stores information generated in the metadata generation process And the most important word storage unit 58 is included.

アプリケーションプログラム51は、情報処理装置1によって、ウェブブラウザ機能お
よび電子メール送受信機能を含む各種機能を実現するためのプログラムである。ウェブブ
ラウザ機能は、通信インタフェース9に接続された外部の通信回線15を介して、インタ
ーネット等のネットワーク20に接続し、ネットワーク20を介してサーバ(図示略)に
アクセスし、サーバ上のウェブコンテンツを受信して表示画面71に表示する機能である
。このウェブブラウザ機能の実行時、制御部2は、外部コンテンツ表示手段として機能す
る。ウェブコンテンツは、HTML等の形式で記述されたテキストデータや画像データ等
を含む1または複数のファイルから構成されるコンテンツである。ウェブコンテンツを構
成する各種ファイルの形式に制限はなく、他のファイルへのリンクを含んでいてもよい。
The application program 51 is a program for realizing various functions including a web browser function and an e-mail transmission / reception function by the information processing apparatus 1. The web browser function connects to a network 20 such as the Internet via an external communication line 15 connected to the communication interface 9, accesses a server (not shown) via the network 20, and retrieves web content on the server. This is a function for receiving and displaying on the display screen 71. When this web browser function is executed, the control unit 2 functions as external content display means. Web content is content composed of one or more files including text data and image data described in a format such as HTML. There are no restrictions on the format of various files constituting the web content, and links to other files may be included.

ウェブブラウザ機能の実行時、情報処理装置1は、表示したウェブコンテンツの履歴を
、ブラウザ履歴としてアプリケーション用データ記憶部53に記憶する。この表示履歴は
、例えば、表示したウェブコンテンツを取得するためのURL(Uniform Resource Locat
or)と、表示した日時とを含む。
電子メール送受信機能は、通信インタフェース9に接続された通信回線15を介してネ
ットワーク20に接続し、ネットワーク20を介して電子メールの送受信を行うとともに
、送受信した電子メールをアプリケーション用データ記憶部53に記憶する。なお、電子
メール送受信機能を、いわゆるウェブメール機能として実現してもよい。この場合、実際
に電子メールを送受信する機能はネットワーク20上のサーバ(図示略)によって実行さ
れ、送受信した電子メールは上記サーバに記憶される。情報処理装置1は、所定のIDお
よびパスワードを用いて上記サーバにアクセスすることにより、電子メールを送受信し、
送受信した電子メールを取得できる。
アプリケーション用データ記憶部53は、アプリケーションプログラム51の実行時に
生成または取得されたデータを記憶するための領域であり、上述したように、ブラウザ履
歴および送受信した電子メール等を記憶する。
When executing the web browser function, the information processing apparatus 1 stores the displayed web content history in the application data storage unit 53 as a browser history. This display history is, for example, a URL (Uniform Resource Locat) for acquiring the displayed web content.
or) and the displayed date and time.
The e-mail transmission / reception function is connected to the network 20 via the communication line 15 connected to the communication interface 9, transmits / receives e-mail via the network 20, and sends the transmitted / received e-mail to the application data storage unit 53. Remember. The e-mail transmission / reception function may be realized as a so-called web mail function. In this case, the function of actually transmitting / receiving electronic mail is executed by a server (not shown) on the network 20, and the transmitted / received electronic mail is stored in the server. The information processing apparatus 1 sends and receives e-mails by accessing the server using a predetermined ID and password,
You can get sent and received emails.
The application data storage unit 53 is an area for storing data generated or acquired when the application program 51 is executed. As described above, the application data storage unit 53 stores a browser history, transmitted and received e-mails, and the like.

分野別キーワード情報記憶部54(基準表現記憶手段)は、複数の分野(属性情報)に
ついて、分野毎にキーワード(基準表現)を記憶する領域である。
図2は、分野別キーワード情報記憶部54に記憶されるキーワードの例を模式的に示す
図である。
この図2に示すように、分野としては、例えば、海外旅行、国内旅行、学校行事、サー
クル、海外出張、国内出張、家族行事等が挙げられる。また、各分野に対応づけて、乗り
継ぎ、待ち時間、直行便、船旅、列車、ホテル、運動会、ランドセル、撮影会、ホテル、
会議、結婚式など、各分野に関連するキーワードが記憶されている。
これらの分野および各分野に対応するキーワードは、入力部6の操作によってユーザが
自由に入力することが可能であり、図2の例に限定されず、情報処理装置1で処理する対
象コンテンツに適した分野とキーワードとが記憶されていることが好ましい。すなわち、
図2に例示した分野は、例えばユーザが撮影した静止画像や動画像である場合に適してい
るが、他の種類の対象コンテンツを用いる場合、分野は上記の例に限らない。例えば、ス
ポーツ、ドラマ、バラエティ、アニメーション、アクション、バイオレンス、サスペンス
、ミュージカル、成人向け、ホラー、家族向け、子供向け、音楽、政治、教育など、対象
コンテンツのジャンル等を示す情報を分野として用いてもよい。
また、図2にはキーワードとして単語が記憶される例を示したが、キーワードは単語に
限らず、句、節、文、段落等の言語単位で構成される言語表現を用いることができる。
The field-specific keyword information storage unit 54 (standard expression storage means) is an area for storing keywords (standard expressions) for each field for a plurality of fields (attribute information).
FIG. 2 is a diagram schematically illustrating an example of keywords stored in the field-specific keyword information storage unit 54.
As shown in FIG. 2, examples of the field include overseas travel, domestic travel, school events, circles, overseas business trips, domestic business trips, family events, and the like. In addition, in connection with each field, connection, waiting time, direct flight, voyage, train, hotel, athletic meet, school bag, photo session, hotel,
Keywords related to each field such as meetings and weddings are stored.
These fields and keywords corresponding to each field can be freely input by the user by operating the input unit 6, and are not limited to the example of FIG. 2, and are suitable for target content processed by the information processing apparatus 1. Preferably, the field and keyword are stored. That is,
The field illustrated in FIG. 2 is suitable for, for example, a still image or a moving image captured by the user, but when other types of target content are used, the field is not limited to the above example. For example, even if information such as sports, drama, variety, animation, action, violence, suspense, musical, adult, horror, family, children, music, politics, education, etc. is used as the field Good.
FIG. 2 shows an example in which words are stored as keywords, but the keywords are not limited to words, and language expressions composed of language units such as phrases, clauses, sentences, and paragraphs can be used.

対象コンテンツ記憶部55は、情報処理装置1が実行するメタデータ生成処理の対象と
なるコンテンツを記憶する領域である。対象コンテンツ記憶部55には、対象コンテンツ
自体のデータに加え、対象コンテンツのメタデータが記憶される。このメタデータは、Ex
if(Exchangeable Image File Format)等の規格化された形式で対象コンテンツ自体
のデータに付加されていてもよいし、対象コンテンツとは独立したデータとして対象コン
テンツ記憶部55に記憶されていてもよい。
また、対象コンテンツ記憶部55に記憶される対象コンテンツは、例えば、外部インタ
フェース8等を介して、外部のハードディスクドライブや半導体メモリを内蔵したストレ
ージデバイス、パーソナルコンピュータ、デジタルスチルカメラ、デジタルビデオカメラ
、携帯型電話機等の装置から情報処理装置1に入力される。また、情報処理装置1自体が
静止画像または動画像を撮影する撮像部を備える場合、この撮像部で撮影された画像デー
タを対象コンテンツとして対象コンテンツ記憶部55に記憶してもよい。
The target content storage unit 55 is an area for storing content that is a target of metadata generation processing executed by the information processing apparatus 1. The target content storage unit 55 stores the metadata of the target content in addition to the data of the target content itself. This metadata is Ex
It may be added to the data of the target content itself in a standardized format such as if (Exchangeable Image File Format) or may be stored in the target content storage unit 55 as data independent of the target content.
The target content stored in the target content storage unit 55 is, for example, an external hard disk drive or a storage device incorporating a semiconductor memory, a personal computer, a digital still camera, a digital video camera, a mobile phone via the external interface 8 or the like. It is input to the information processing apparatus 1 from a device such as a type telephone. When the information processing apparatus 1 itself includes an imaging unit that captures a still image or a moving image, the image data captured by the imaging unit may be stored in the target content storage unit 55 as target content.

登録コンテンツ情報記憶部56は、メタデータ生成処理で登録コンテンツを取得するた
めの情報を記憶する領域である。
図3は、登録コンテンツ情報記憶部56に記憶される情報の構成例を示す図である。
この図3に示すように、登録コンテンツ情報記憶部56には、複数のコンテンツについ
て、コンテンツの名称と、各コンテンツを取得するためのコンテンツ取得情報とが対応づ
けて記憶されている。登録コンテンツとしては、インターネット等のネットワーク20を
介して取得可能なウェブコンテンツ(ウェブページ、ブログ形式のウェブページ、静止画
像データ、動画像データ、音声データなど)や、電子メール等が挙げられる。ネットワー
ク20を介して取得可能な情報については、コンテンツ取得情報として、例えばURLが
記憶されている。また、電子メールに対応するコンテンツ取得情報は、例えばアプリケー
ション用データ記憶部53に記憶されている送受信された電子メールのデータを参照する
ためのパスである。
The registered content information storage unit 56 is an area for storing information for acquiring registered content in the metadata generation process.
FIG. 3 is a diagram illustrating a configuration example of information stored in the registered content information storage unit 56.
As shown in FIG. 3, the registered content information storage unit 56 stores content names and content acquisition information for acquiring each content in association with each other. Examples of the registered content include web content (web page, blog format web page, still image data, moving image data, audio data, etc.) that can be acquired via the network 20 such as the Internet, and e-mail. For information that can be acquired via the network 20, for example, a URL is stored as content acquisition information. The content acquisition information corresponding to the e-mail is a path for referring to the transmitted / received e-mail data stored in the application data storage unit 53, for example.

重要単語記憶部57は、メタデータ生成処理で抽出された重要単語を一時的に記憶する
領域であり、最重要単語記憶部58は、メタデータ生成処理で抽出された最重要単語を記
憶する領域である。
入力部6は、数字・文字・記号等を入力するキーや特定の動作を指示する機能キー等の
各種キースイッチ、ロータリースイッチ、電源ON/OFFボタン等を備え、これらスイ
ッチ或いはボタン等の操作に対応する操作信号を生成して、制御部2に出力する。
出力部7は、制御部2による処理結果や処理中の画像等を出力する。具体的には、LC
D(液晶ディスプレイ)等により構成される表示画面71に画像を表示させる機能、或い
は、図示しない印刷装置により画像を印刷させる機能を具備する。
情報処理装置1は、入力部6および出力部7を用いて、分野別キーワード情報記憶部5
4に記憶される分野とキーワードの入力を受け付けることが可能である。具体的には、情
報処理装置1は、制御部2による制御のもと、キーワード入力用画面を表示画面71に表
示し、このキーワード入力用画面が表示された状態で、入力部6の操作により入力された
文字列を、分野およびキーワードとして取得して、分野別キーワード情報記憶部54に記
憶する。
The important word storage unit 57 is an area for temporarily storing the important words extracted in the metadata generation process, and the most important word storage unit 58 is an area for storing the most important words extracted in the metadata generation process. It is.
The input unit 6 includes various key switches such as keys for inputting numbers, letters, symbols, etc., function keys for instructing a specific operation, a rotary switch, a power ON / OFF button, and the like. A corresponding operation signal is generated and output to the control unit 2.
The output unit 7 outputs a processing result by the control unit 2 and an image being processed. Specifically, LC
It has a function of displaying an image on a display screen 71 constituted by D (liquid crystal display) or the like, or a function of printing an image by a printing device (not shown).
The information processing apparatus 1 uses the input unit 6 and the output unit 7 to use the field-specific keyword information storage unit 5.
It is possible to accept input of fields and keywords stored in 4. Specifically, the information processing apparatus 1 displays a keyword input screen on the display screen 71 under the control of the control unit 2, and operates the input unit 6 while the keyword input screen is displayed. The input character string is acquired as a field and a keyword and stored in the field-specific keyword information storage unit 54.

外部インタフェース8は、情報処理装置1の外部の装置に接続されるインタフェースで
ある。ここで外部の装置としては、ハードディスクドライブや半導体メモリを内蔵したス
トレージデバイス、パーソナルコンピュータ、デジタルスチルカメラ、デジタルビデオカ
メラ、携帯型電話機等が挙げられる。外部インタフェース8は、USB(Universal Serial
Bus)、IEEE1394、Bluetooth(登録商標)、UWB、ZigBee(登録商標)等の機器接続方
式に対応したコネクタ等を備え、さらに、上記各種接続方式に対応したプロトコルを実行
可能なインタフェース回路を備える。
通信インタフェース9は、情報処理装置1の外部の通信回線15に接続され、通信回線
15を介してインターネット等のネットワーク20を利用して、各種データの送受信を行
う。通信インタフェース9の具体的な構成としては、Ethernet(登録商標)等の通信方式
に対応した有線接続インタフェース、および、IEEE802.11等の通信方式に対応した無線通
信インタフェース等が挙げられる。通信インタフェース9は、上記規格に準じたコネクタ
や無線通信部を備え、さらに、上記規格に準じたプロトコルを実行可能なインタフェース
回路を備える。
The external interface 8 is an interface connected to a device external to the information processing device 1. Here, examples of the external device include a storage device incorporating a hard disk drive and a semiconductor memory, a personal computer, a digital still camera, a digital video camera, and a mobile phone. External interface 8 is USB (Universal Serial
Bus), IEEE1394, Bluetooth (registered trademark), UWB, ZigBee (registered trademark) and other connectors that correspond to device connection methods, etc., and an interface circuit that can execute protocols corresponding to the various connection methods.
The communication interface 9 is connected to a communication line 15 outside the information processing apparatus 1, and transmits and receives various data using the network 20 such as the Internet via the communication line 15. Specific configurations of the communication interface 9 include a wired connection interface corresponding to a communication method such as Ethernet (registered trademark), a wireless communication interface corresponding to a communication method such as IEEE 802.11, and the like. The communication interface 9 includes a connector conforming to the above standard and a wireless communication unit, and further includes an interface circuit capable of executing a protocol conforming to the above standard.

通信回線15およびネットワーク20は、専用線、公衆電話回線、衛星通信回線、移動
体通信回線等の各種通信回線や図示しない各種サーバ装置等を含んで構成され、各種デー
タを送受信可能な通信回線および通信回線網であり、その具体的・物理的態様は特に限定
されない。ネットワーク20に接続される各装置との間には、通信事業者が提供するサー
バやファイアーウォール、ゲートウェイ装置等の各種機器が介在する構成としても良いが
、ここでは図示しない。
The communication line 15 and the network 20 are configured to include various communication lines such as a dedicated line, a public telephone line, a satellite communication line, and a mobile communication line, various server devices (not shown), and the like. It is a communication line network, and its specific and physical aspects are not particularly limited. Various devices such as a server, a firewall, and a gateway device provided by a telecommunications carrier may be interposed between the devices connected to the network 20, but they are not shown here.

次に、情報処理装置1の動作について説明する。以下に説明する動作において、制御部
2は、参照コンテンツ取得手段、抽出手段、付加情報生成手段、基準表現取得手段、候補
抽出手段、コンテンツ評価手段、および特徴情報抽出手段として機能する。
図4は、情報処理装置1により実行されるメタデータ生成処理を示すフローチャートで
ある。
この図4に示すメタデータ生成処理を開始する前に、情報処理装置1の対象コンテンツ
記憶部55には対象コンテンツが記憶される。
そして、制御部2は、出力部7を制御して、表示画面71によって対象コンテンツの分
野の入力を案内するとともに、入力部6の操作により入力される対象コンテンツの分野を
取得する(ステップS11)。
Next, the operation of the information processing apparatus 1 will be described. In the operation described below, the control unit 2 functions as a reference content acquisition unit, an extraction unit, an additional information generation unit, a reference expression acquisition unit, a candidate extraction unit, a content evaluation unit, and a feature information extraction unit.
FIG. 4 is a flowchart showing metadata generation processing executed by the information processing apparatus 1.
Prior to starting the metadata generation process shown in FIG. 4, the target content is stored in the target content storage unit 55 of the information processing apparatus 1.
Then, the control unit 2 controls the output unit 7 to guide the input of the target content field on the display screen 71 and acquire the target content field input by the operation of the input unit 6 (step S11). .

続いて、制御部2は、登録コンテンツ情報記憶部56に記憶された情報と、分野別キー
ワード情報記憶部54に記憶されたキーワードとをもとにして、登録コンテンツに対する
重要単語抽出処理を実行する(ステップS12)。このステップS12の処理は、図5を
参照して後述する。
さらに、制御部2は、アプリケーション用データ記憶部53に記憶されたブラウザ履歴
と、分野別キーワード情報記憶部54に記憶されたキーワードとをもとにして、ウェブブ
ラウザ機能により表示された情報に対する重要単語抽出処理を実行する(ステップS13
)。このステップS13の処理については、ステップS12の処理と同様、図5を参照し
て後述する。
Subsequently, the control unit 2 executes an important word extraction process for the registered content based on the information stored in the registered content information storage unit 56 and the keywords stored in the field-specific keyword information storage unit 54. (Step S12). The process of step S12 will be described later with reference to FIG.
Furthermore, the control unit 2 uses the browser history stored in the application data storage unit 53 and the keywords stored in the field-specific keyword information storage unit 54 to determine the importance of information displayed by the web browser function. A word extraction process is executed (step S13).
). The process of step S13 will be described later with reference to FIG. 5 in the same manner as the process of step S12.

その後、制御部2は、ステップS12およびS13の重要単語抽出処理により抽出され
た重要単語をもとに、最重要単語抽出処理を実行して、一つまたは所定数の最重要単語を
抽出する(ステップS14)。このステップS14の処理は、図6を参照して後述する。
そして、制御部2は、ステップS14で抽出した最重要単語を含むメタデータを生成し
て、対象コンテンツのメタデータとして対象コンテンツ記憶部55に記憶させ(ステップ
S15)、本処理を終了する。このステップS15で、既に対象コンテンツのメタデータ
が対象コンテンツ記憶部55に記憶されていれば、制御部2は、対象コンテンツ記憶部5
5に記憶されているメタデータに最重要単語を含ませて更新する。
Thereafter, the control unit 2 executes the most important word extraction process based on the important words extracted by the important word extraction process in steps S12 and S13, and extracts one or a predetermined number of the most important words ( Step S14). The process of step S14 will be described later with reference to FIG.
And the control part 2 produces | generates the metadata containing the most important word extracted by step S14, and memorize | stores it in the object content memory | storage part 55 as metadata of object content (step S15), and complete | finishes this process. If the metadata of the target content has already been stored in the target content storage unit 55 in step S15, the control unit 2 determines that the target content storage unit 5
5 is updated by including the most important word in the metadata stored in 5.

図5は、重要単語抽出処理を示すフローチャートである。
先に説明したように、図4のステップS12では、以下に説明する重要単語抽出処理を
、登録コンテンツについて実行する。また、ステップS13では、ウェブブラウザ機能に
より過去に表示されたウェブコンテンツについて重要単語抽出処理を実行する。
FIG. 5 is a flowchart showing important word extraction processing.
As described above, in step S12 of FIG. 4, the important word extraction process described below is executed for the registered content. In step S13, an important word extraction process is executed for web contents displayed in the past by the web browser function.

この重要単語抽出処理で、制御部2は、ステップS11(図4)で入力された分野に対
応づけて分野別キーワード情報記憶部54に記憶されているキーワードを取得する(ステ
ップS21)。
続いて、制御部2は、対象コンテンツ記憶部55に記憶された対象コンテンツのメタデ
ータを参照し、対象コンテンツが作成または最後に更新された日時を取得する(ステップ
S22)。そして、制御部2は、登録コンテンツ情報記憶部56に記憶された登録コンテ
ンツの情報、および、アプリケーション用データ記憶部53に記憶されたブラウザ履歴を
取得し、これらの情報により取得されるコンテンツのうち、対象コンテンツが作成または
更新された日時から所定時間以内に、作成または更新されたコンテンツを一つ選択する(
ステップS23)。ステップS23で選択されるコンテンツは、対象コンテンツが作成ま
たは更新された日時より前か後かを問わず、所定時間以内に作成または更新された登録コ
ンテンツまたはウェブコンテンツである。
その後、制御部2は、選択したコンテンツのデータを取得する(ステップS24)。こ
こで、選択したコンテンツがウェブコンテンツである場合、制御部2は通信インタフェー
ス9を介してネットワーク20にアクセスし、ウェブコンテンツを取得する。また、選択
したコンテンツがアプリケーション用データ記憶部53に記憶されている場合、制御部2
は、アプリケーション用データ記憶部53からコンテンツを取得する。
In this important word extraction process, the control unit 2 acquires a keyword stored in the field-specific keyword information storage unit 54 in association with the field input in step S11 (FIG. 4) (step S21).
Subsequently, the control unit 2 refers to the metadata of the target content stored in the target content storage unit 55, and acquires the date and time when the target content was created or last updated (step S22). And the control part 2 acquires the information of the registration content memorize | stored in the registration content information memory | storage part 56, and the browser log | history memorize | stored in the data storage part 53 for applications, Out of the content acquired by these information , Select one content created or updated within a predetermined time from the date and time when the target content was created or updated (
Step S23). The content selected in step S23 is registered content or web content created or updated within a predetermined time regardless of whether the target content is created or updated before or after.
Thereafter, the control unit 2 acquires data of the selected content (step S24). Here, when the selected content is web content, the control unit 2 accesses the network 20 via the communication interface 9 and acquires the web content. When the selected content is stored in the application data storage unit 53, the control unit 2
Acquires content from the application data storage unit 53.

制御部2は、ステップS24で取得したコンテンツが、ステップS21で取得したキー
ワードのいずれか、または、キーワードの類似語を含むか否かを判別する(ステップS2
5)。
ここで、類似語とは、キーワードの同義語または類義語、若しくは、見かけ上キーワー
ドと類似する語である。
同義語または類義語を利用する場合、例えば、予め記憶部5に類似語辞書を記憶してお
き、ステップS21でキーワードを取得した際に類似語辞書から類似語を選択してもよい
。また、見かけ上キーワードに類似している語を利用する場合、例えば、ステップS25
でコンテンツ中のキーワードを検索する際に、検索条件を適宜設定して、キーワードと一
部の文字のみが一致する語を、キーワードと一緒に検索してもよい。
そして、コンテンツがキーワードまたは類似語を含む場合、制御部2は、このコンテン
ツを重要単語抽出対象コンテンツとして確定して(ステップS26)、ステップS27に
移行する。また、コンテンツがキーワードも類似語も含まない場合、制御部2は、そのま
まステップS27に移行する。
The control unit 2 determines whether the content acquired in step S24 includes any of the keywords acquired in step S21 or a similar word of the keyword (step S2).
5).
Here, the similar term is a synonym or synonym of a keyword, or a word that looks similar to a keyword.
When using synonyms or synonyms, for example, a similar word dictionary may be stored in the storage unit 5 in advance, and similar words may be selected from the similar word dictionary when a keyword is acquired in step S21. Further, when using a word that looks similar to a keyword, for example, step S25.
When searching for a keyword in the content, a search condition may be set as appropriate, and a word that matches only a part of the character with the keyword may be searched together with the keyword.
If the content includes a keyword or similar word, the control unit 2 determines this content as the important word extraction target content (step S26), and proceeds to step S27. If the content contains neither a keyword nor a similar word, the control unit 2 proceeds to step S27 as it is.

ステップS27で、制御部2は、確定したコンテンツ以外に、登録コンテンツ情報記憶
部56に記憶された登録コンテンツの情報、および、アプリケーション用データ記憶部5
3に記憶されたブラウザ履歴から取得可能なコンテンツがあるか否かを判別する。ここで
他のコンテンツがある場合、制御部2はステップS23に戻り、別のコンテンツを選択し
て上記の処理を繰り返す。
これにより、対象コンテンツが作成または更新された日時から所定時間以内に作成また
は更新されたコンテンツのうち、キーワードまたは類似語を含むコンテンツが、重要単語
抽出対象コンテンツとして確定される。
In step S27, in addition to the confirmed content, the control unit 2 stores the registered content information stored in the registered content information storage unit 56, and the application data storage unit 5
3, it is determined whether there is content that can be acquired from the browser history stored in 3. If there is another content, the control unit 2 returns to step S23, selects another content, and repeats the above processing.
As a result, among the contents created or updated within a predetermined time from the date and time when the target content is created or updated, the content including the keyword or similar word is determined as the important word extraction target content.

そして、全てのコンテンツについてステップS23〜S26の処理が終了した場合(ス
テップS27;No)、制御部2は、ステップS26で確定した各々の重要単語抽出対象
コンテンツに対し、TF/IDF(Term Frequency & Inverse Document Frequency
)処理を実行し、各々の重要単語抽出対象コンテンツから重要単語を抽出する(ステップ
S28)。
When the processing of steps S23 to S26 is completed for all the contents (step S27; No), the control unit 2 performs TF / IDF (Term Frequency & IDF) for each important word extraction target content determined in step S26. Inverse Document Frequency
) The process is executed, and important words are extracted from each important word extraction target content (step S28).

ステップS28の処理について詳述する。
TF/IDF処理は、重要単語抽出対象コンテンツにテキストデータとして含まれる全
ての語について、重みを計算する処理である。
一つの重要単語抽出対象コンテンツのテキストデータをd、そのうちの一つの単語をt
とした場合、テキストデータdにおける単語tの重みW(t,d)は、下記式(1)によ
り求められる。
W(t,d)=TF(t,d)×IDF(t) ・・・(1)
ここで、TF(t,d)は、テキストデータdにおける単語tの出現頻度である。
また、IDF(t)は、全ての重要単語抽出対象コンテンツのうち、単語tが出現する
重要単語抽出対象コンテンツのテキストデータの数を、単語tの出現頻度として計算した
ものである。
The process of step S28 will be described in detail.
The TF / IDF process is a process for calculating weights for all words included as text data in the important word extraction target content.
Text data of one important word extraction target content is d, and one of the words is t
In this case, the weight W (t, d) of the word t in the text data d is obtained by the following equation (1).
W (t, d) = TF (t, d) × IDF (t) (1)
Here, TF (t, d) is the appearance frequency of the word t in the text data d.
IDF (t) is calculated from the number of text data of the important word extraction target content in which the word t appears among all the important word extraction target content as the appearance frequency of the word t.

TF(t,d)は、一つの重要単語抽出対象コンテンツにおける出現頻度をもとに、単
語の重要度を表す指標である。言い換えれば、コンテンツ中に多く出現する単語が、重要
な単語とみなされる。
また、IDF(t)は、単語tが、特定の重要単語抽出対象コンテンツにおいて特異的
に出現する語であるかどうかを示す指標である。言い換えれば、特定のコンテンツに多く
出現する単語が、重要な単語とみなされる。
ステップS28で、制御部2は、上記式(1)に示す演算により、重要単語抽出対象コ
ンテンツに含まれる全ての単語について重みW(t,d)を求め、このW(t,d)によ
り示される重みが大きい単語を、重要単語として抽出する。この抽出は、重要単語抽出対
象コンテンツ毎に、全ての重要単語抽出対象コンテンツについて行われる。ここで抽出す
る重要単語の数は特に制限されず、制御部2は、予め定められた数の単語を抽出してもよ
いし、W(t,d)が一定の値を超えた単語を全て抽出してもよい。
TF (t, d) is an index representing the importance of a word based on the appearance frequency in one important word extraction target content. In other words, words that frequently appear in the content are regarded as important words.
IDF (t) is an index indicating whether the word t is a word that appears specifically in a specific important word extraction target content. In other words, words that frequently appear in specific content are regarded as important words.
In step S28, the control unit 2 obtains weights W (t, d) for all the words included in the important word extraction target content by the calculation shown in the above formula (1), and indicates the weights W (t, d). A word with a large weight is extracted as an important word. This extraction is performed for all important word extraction target contents for each important word extraction target content. The number of important words to be extracted is not particularly limited, and the control unit 2 may extract a predetermined number of words, or all the words having W (t, d) exceeding a certain value. It may be extracted.

続くステップS29で、制御部2は、ステップS28で抽出された重要単語を、その重
要単語を抽出した重要単語抽出対象コンテンツに対応づけて、重要単語記憶部57に記憶
する。
さらに、制御部2はステップS30に移行して、各々の重要単語抽出対象コンテンツに
ついて、その重要単語抽出対象コンテンツから抽出した重要単語の重みW(t,d)、そ
の重要単語抽出対象コンテンツに出現したキーワードおよび類似語の種類、出現したキー
ワードおよび類似語の出現数を加味して、重要単語抽出対象コンテンツ毎の重みを求める
処理を行う。
この図5に示す重要単語抽出処理を、登録コンテンツ、および、ブラウザ履歴から取得
可能なコンテンツの両方について実行した後、制御部2は、次に説明する最重要単語抽出
処理を実行する。
In subsequent step S29, the control unit 2 stores the important word extracted in step S28 in the important word storage unit 57 in association with the important word extraction target content from which the important word has been extracted.
Further, the control unit 2 proceeds to step S30, and for each important word extraction target content, the weight W (t, d) of the important word extracted from the important word extraction target content, appears in the important word extraction target content. The processing for obtaining the weight for each important word extraction target content is performed in consideration of the types of the keywords and similar words and the number of appearing keywords and similar words.
After executing the important word extraction process shown in FIG. 5 for both the registered content and the content obtainable from the browser history, the control unit 2 executes the most important word extraction process described below.

図6は、最重要単語抽出処理を示すフローチャートである。
制御部2は、まず、図5に示す重要単語抽出処理で確定された重要単語抽出対象コンテ
ンツのうち一つを選択して、その重要単語抽出対象コンテンツから抽出された重要単語と
、各々の重要単語の重みを重要単語記憶部57から読み出して取得する(ステップS41
)。
続いて、制御部2は、選択している重要単語抽出対象コンテンツについて、その重要単
語抽出対象コンテンツに出現したキーワードおよび類似語の種類、出現したキーワードお
よび類似語の出現数、および、その重要単語抽出対象コンテンツについて図5のステップ
S30で求めた重みを取得する(ステップS42)。
FIG. 6 is a flowchart showing the most important word extraction process.
First, the control unit 2 selects one of the important word extraction target contents determined by the important word extraction process shown in FIG. 5, and extracts the important words extracted from the important word extraction target contents and each important word. The word weight is read and acquired from the important word storage unit 57 (step S41).
).
Subsequently, the control unit 2 selects, for the selected important word extraction target content, the types of keywords and similar words that appear in the important word extraction target content, the number of appearing keywords and similar words, and the important words. The weight obtained in step S30 in FIG. 5 is acquired for the content to be extracted (step S42).

そして、ステップS42で取得したキーワードおよび類似語の種類、出現したキーワー
ドおよび類似語の出現数、および、その重要単語抽出対象コンテンツの重みに基づいて、
その重要単語抽出対象コンテンツから抽出した重要単語の重みを再計算し(ステップS4
3)、重要単語と重みとを再び重要単語記憶部57に記憶する(ステップS44)。
制御部2は、他の重要単語抽出対象コンテンツがあるか否かを判別し(ステップS45
)、他の重要単語抽出対象コンテンツがある場合はステップS41に戻り、別の重要単語
抽出対象コンテンツを選択して上記の処理を繰り返す。
また、全ての重要単語抽出対象コンテンツについてステップS41〜S44の処理が済
んだ場合(ステップS45;Yes)、制御部2は、重要単語記憶部57に記憶された重
要単語の中から、各重要単語の重みを基準として最重要単語を選択し、最重要単語記憶部
58に記憶する(ステップS46)。ここで制御部2が選択する最重要単語の数について
特に制限はなく、一つであってもよいし、複数の最重要単語を選択してもよく、対象コン
テンツのメタデータの容量に関する制限などを基準として決めればよい。
Then, based on the keyword and similar word type acquired in step S42, the number of appearing keywords and similar words, and the weight of the important word extraction target content,
The weight of the important word extracted from the important word extraction target content is recalculated (step S4).
3) The important word and the weight are stored again in the important word storage unit 57 (step S44).
The control unit 2 determines whether there is another important word extraction target content (step S45).
) If there is another important word extraction target content, the process returns to step S41, and another important word extraction target content is selected, and the above processing is repeated.
When the processing of steps S41 to S44 is completed for all important word extraction target contents (step S45; Yes), the control unit 2 selects each important word from the important words stored in the important word storage unit 57. The most important word is selected on the basis of the weight of and stored in the most important word storage unit 58 (step S46). Here, the number of the most important words selected by the control unit 2 is not particularly limited, and may be one or a plurality of the most important words, and may be limited with respect to the metadata capacity of the target content. Can be determined on the basis of.

以上のように、本発明を適用した実施形態に係る情報処理装置1は、ユーザが対象コン
テンツに関係する分野を指定すると、指定された分野に関連する重要単語抽出対象コンテ
ンツを選択し、選択したコンテンツから最重要単語を選び出し、この最重要単語を対象コ
ンテンツのメタデータに登録する。これにより、対象コンテンツの内容に関係する適切な
単語を、対象コンテンツのメタデータに含ませることができる。
このメタデータは、対象コンテンツを含む多数のコンテンツから所望のコンテンツを検
索する際に用いることができる。特に、コンテンツの内容に関連する単語を含むメタデー
タを利用すれば、複雑な条件を用いて検索を行うことができるので、コンテンツの管理に
要する負荷を大幅に軽減できるという利点がある。さらに、情報処理装置1は、ユーザが
対象コンテンツの分野を指定するだけで上記の処理を実行する。つまり、ユーザは分野を
指定する入力を行うだけでよく、ユーザがコンテンツの内容に関連するメタデータを手作
業で作成する場合と比較して、操作が極めて簡単であり、ユーザの負荷を大幅に軽減でき
る。
As described above, when the user specifies a field related to the target content, the information processing apparatus 1 according to the embodiment to which the present invention is applied selects and selects the important word extraction target content related to the specified field. The most important word is selected from the content, and this most important word is registered in the metadata of the target content. Thereby, an appropriate word related to the content of the target content can be included in the metadata of the target content.
This metadata can be used when a desired content is searched from a large number of contents including the target content. In particular, if metadata including words related to the content content is used, it is possible to perform a search using a complicated condition, so that there is an advantage that the load required for content management can be greatly reduced. Furthermore, the information processing apparatus 1 performs the above-described processing only by the user specifying the field of the target content. In other words, the user only has to input the field, and compared with the case where the user manually creates metadata related to the content, the operation is extremely simple and the load on the user is greatly increased. Can be reduced.

また、情報処理装置1は、予め、複数の分野に属するキーワードを分野別キーワード情
報記憶部54に記憶しており、ユーザが指定した対象コンテンツの分野に対応して記憶し
たキーワードまたはキーワードの類似語を含むか否かをもとに、重要単語抽出対象コンテ
ンツを選択する。これにより、対象コンテンツの内容と確実に関連する重要単語抽出対象
コンテンツを選び、これらの重要単語抽出対象コンテンツから単語を抽出することで、適
切な単語を抽出できる。
また、情報処理装置1は、重要単語を抽出する際に、重要単語抽出対象コンテンツのテ
キストを単語に分割した上で重み付けを行うので、重要単語抽出対象コンテンツの中で確
実に重要性の高い単語を、重要単語として抽出できる。
さらに、情報処理装置1は、重要単語のうち、その出自となった重要単語抽出対象コン
テンツの重みに基づいて最重要単語を抽出するので、対象コンテンツの内容と高い関連性
を有する最重要単語を抽出できる。
また、上記処理で抽出される重要単語および最重要単語は、単語という言語単位で分割
された言語表現であるため、ユーザにとって非常にわかりやすく、かつ、検索キーとして
簡単かつ有効に利用できる。従って、ユーザが認識しやすく、検索容易性が高い情報をメ
タデータに含ませることで、コンテンツの管理を非常に効率よく行うことができる。
Further, the information processing apparatus 1 stores keywords belonging to a plurality of fields in the field-specific keyword information storage unit 54 in advance, and stores keywords or similar keywords stored corresponding to the field of the target content designated by the user. Important word extraction target content is selected based on whether or not it is included. Thereby, an important word can be extracted by selecting an important word extraction target content that is reliably related to the content of the target content and extracting a word from these important word extraction target content.
Further, when extracting the important word, the information processing apparatus 1 performs weighting after dividing the text of the important word extraction target content into words, so that the important word extraction target content is surely a highly important word. Can be extracted as an important word.
Furthermore, since the information processing apparatus 1 extracts the most important word based on the weight of the important word extraction target content from which the important word originated, the information processing apparatus 1 selects the most important word having high relevance to the content of the target content. Can be extracted.
Further, since the important word and the most important word extracted by the above processing are language expressions divided in units of words called words, it is very easy for the user to understand and can be used easily and effectively as a search key. Therefore, content can be managed very efficiently by including in the metadata information that is easy for the user to recognize and easy to search.

また、情報処理装置1は、対象コンテンツの作成または最終更新日時の前後所定時間内
に作成または更新されたコンテンツの中から重要単語抽出対象コンテンツを選択する。対
象コンテンツの作成または最終更新日時から離れた時期に作成または更新されたコンテン
ツにおいては、キーワードや類似語が異なる意味・ニュアンスで使われる可能性がある。
情報処理装置1は、対象コンテンツと時間的に離れたコンテンツを処理対象から排除する
ことにより、実質的に、対象コンテンツの内容から乖離したコンテンツを排除し、対象コ
ンテンツの分野と確実に関連する重要単語抽出対象コンテンツを選ぶので、より適切な単
語を抽出できる。
Further, the information processing apparatus 1 selects the important word extraction target content from the content created or updated within a predetermined time before and after the creation or last update date and time of the target content. In content created or updated at a time away from the creation or last update date of the target content, keywords and similar words may be used with different meanings and nuances.
The information processing device 1 eliminates content that is temporally separated from the target content from the processing target, thereby substantially eliminating the content that deviates from the content of the target content, and is importantly related to the field of the target content. Since the word extraction target content is selected, more appropriate words can be extracted.

また、情報処理装置1は、予め登録されたコンテンツの中から重要単語抽出対象コンテ
ンツを選択することが可能である上に、ブラウザ履歴に含まれていたコンテンツの中から
、重要単語抽出対象コンテンツを選択することもできる。ユーザが情報処理装置1を使用
して閲覧したウェブコンテンツの中から、重要単語抽出対象コンテンツを選択することで
、過去にユーザの興味を惹いたコンテンツを重要単語抽出対象コンテンツとして利用する
。これにより、重要単語抽出対象コンテンツの選択にユーザの趣向を反映させることで、
対象コンテンツの内容と確実に関連する重要単語抽出対象コンテンツを選択できる。
In addition, the information processing apparatus 1 can select important word extraction target content from pre-registered content, and can also select important word extraction target content from content included in the browser history. You can also choose. By selecting the important word extraction target content from the web content browsed by the user using the information processing apparatus 1, the content that has attracted the user's interest in the past is used as the important word extraction target content. By reflecting the user's taste in the selection of the important word extraction target content,
An important word extraction target content that is surely related to the content of the target content can be selected.

なお、上記実施形態において、図1に示した構成は、主としてハードウェア構成により
、或いはハードウェアとソフトウェアとの協働により実現されるものであり、情報処理装
置1を構成する各部の具体的形態や物理的態様については任意である。
また、上記実施形態においては、キーワードとして単語を用い、重要単語および最重要
単語を抽出および処理する例について説明したが、本発明はこれに限定されるものではな
く、複数の単語からなる句、或いは、節、文、段落等をキーワードとして用いてもよいし
、重要単語および最重要単語に代えて、上記言語単位からなる情報を抽出および処理する
ことが可能である。
In the above embodiment, the configuration shown in FIG. 1 is realized mainly by a hardware configuration or by cooperation of hardware and software, and a specific form of each part constituting the information processing apparatus 1 The physical aspect is arbitrary.
In the above embodiment, an example in which a word is used as a keyword and an important word and a most important word are extracted and processed has been described, but the present invention is not limited to this, and a phrase including a plurality of words, Alternatively, clauses, sentences, paragraphs, etc. may be used as keywords, and information consisting of the language units can be extracted and processed instead of important words and most important words.

また、上記実施形態においては、ユーザが入力部6を操作して対象コンテンツの分野を
入力する場合について説明したが、例えば、上述のメタデータ生成処理の実行前に、対象
コンテンツ記憶部55に記憶された対象コンテンツのメタデータに、既に対象コンテンツ
の分野を示す情報が含まれている場合は、この情報を読み取ることにより、入力部6によ
る入力を省略してもよい。具体的には、例えば、デジタル放送されたコンテンツには番組
のジャンルを示す情報が付加されているが、この情報を、対象コンテンツの分野を示す情
報として利用してもよい。
In the above embodiment, the case where the user operates the input unit 6 to input the field of the target content has been described. For example, the target content storage unit 55 stores the target content before executing the metadata generation process described above. If the metadata of the target content already contains information indicating the field of the target content, the input by the input unit 6 may be omitted by reading this information. Specifically, for example, information indicating the genre of the program is added to the digitally broadcast content, but this information may be used as information indicating the field of the target content.

さらに、上記実施形態においては対象コンテンツの内容に関する属性情報の一例として
、対象コンテンツの分野を用いた場合について説明したが、本発明はこれに限定されるも
のではなく、対象コンテンツの内容に関する属性情報として、自分で撮影した静止画像、
購入した静止画像、劇場映画、テレビ放送映像等のコンテンツの出自を示す情報や、対象
コンテンツが制作された国や地域を示す情報、R指定等の対象コンテンツの放送または放
映に関して設けられた規制を示す情報、対象コンテンツが映像である場合に当該映像に映
っている人または物あるいは場所や風景を示す情報等を用いることができる。
Furthermore, although the case where the field of the target content is used as an example of the attribute information regarding the content of the target content has been described in the above embodiment, the present invention is not limited to this, and the attribute information regarding the content of the target content As a still image taken by myself,
Information indicating the origin of content such as purchased still images, theatrical movies, and TV broadcast videos, information indicating the country or region in which the target content was produced, and restrictions on broadcasting or broadcasting the target content such as R designation When the target content is a video, information indicating a person or an object, a location, or a landscape shown in the video can be used.

上記実施形態で説明した情報処理装置1は、具体的には、パーソナルコンピュータ、P
DA、携帯型電話機等に適用可能であるが、デジタルスチルカメラ、デジタルビデオカメ
ラ、スキャナ、プロジェクタ、テレビ、プリンタおよびその他の画像データを処理する電
子機器に実装または接続することが可能である。この場合、例えば、デジタルスチルカメ
ラ、デジタルビデオカメラ、およびスキャナ等の画像生成機器に本発明を適用すれば、対
象コンテンツとしての画像の生成とともに、この画像に特徴情報を含むメタデータを付加
することができる。さらに、プロジェクタ、テレビ、プリンタ等の画像出力機器に本発明
を適用すれば、対象コンテンツとしての画像出力時に、特徴情報をメタデータに含ませる
ことができ、さらに、このメタデータを画像とともに出力することができる。
その他、情報処理装置1を構成する各部の具体的な細部構成については、本発明の趣旨
を逸脱しない範囲において、任意に変更可能である。
Specifically, the information processing apparatus 1 described in the above embodiment is a personal computer, P
The present invention can be applied to DAs, mobile phones, etc., but can be mounted or connected to digital still cameras, digital video cameras, scanners, projectors, televisions, printers, and other electronic devices that process image data. In this case, for example, if the present invention is applied to an image generation device such as a digital still camera, a digital video camera, and a scanner, metadata including feature information is added to the image as the target content is generated. Can do. Furthermore, if the present invention is applied to an image output device such as a projector, a television, or a printer, the feature information can be included in the metadata when outputting the image as the target content, and the metadata is output together with the image. be able to.
In addition, the specific detailed configuration of each unit constituting the information processing apparatus 1 can be arbitrarily changed without departing from the gist of the present invention.

本発明の実施形態に係る情報処理装置の構成を示すブロック図である。It is a block diagram which shows the structure of the information processing apparatus which concerns on embodiment of this invention. 分野別のキーワードの例を示す図である。It is a figure which shows the example of the keyword according to field. 登録コンテンツ情報の例を模式的に示す図である。It is a figure which shows the example of registration content information typically. メタデータ生成処理を示すフローチャートである。It is a flowchart which shows a metadata production | generation process. 重要単語抽出処理を示すフローチャートである。It is a flowchart which shows an important word extraction process. 最重要単語抽出処理を示すフローチャートである。It is a flowchart which shows the most important word extraction process.

符号の説明Explanation of symbols

1…情報処理装置、2…制御部(参照コンテンツ取得手段、抽出手段、付加情報生成手
段、基準表現取得手段、候補抽出手段、コンテンツ評価手段、特徴情報抽出手段、外部コ
ンテンツ表示手段)、3…ROM、4…RAM、5…記憶部、6…入力部、7…出力部、
8…外部インタフェース、9…通信インタフェース、15…通信回線、20…ネットワー
ク、51…アプリケーションプログラム、52…メタデータ生成プログラム、53…アプ
リケーション用データ記憶部、54…分野別キーワード情報記憶部(基準表現記憶手段)
、55…対象コンテンツ記憶部、56…登録コンテンツ情報記憶部、57…重要単語記憶
部、58…最重要単語記憶部。
DESCRIPTION OF SYMBOLS 1 ... Information processing apparatus, 2 ... Control part (Reference content acquisition means, extraction means, additional information generation means, reference expression acquisition means, candidate extraction means, content evaluation means, feature information extraction means, external content display means), 3 ... ROM, 4 ... RAM, 5 ... storage unit, 6 ... input unit, 7 ... output unit,
DESCRIPTION OF SYMBOLS 8 ... External interface, 9 ... Communication interface, 15 ... Communication line, 20 ... Network, 51 ... Application program, 52 ... Metadata generation program, 53 ... Data storage part for applications, 54 ... Keyword information storage part by field (standard expression) Storage means)
55 ... target content storage unit, 56 ... registered content information storage unit, 57 ... important word storage unit, 58 ... most important word storage unit.

Claims (11)

処理対象コンテンツの内容に関する属性情報を取得し、この属性情報に関連する参照コ
ンテンツを取得する参照コンテンツ取得手段と、
前記参照コンテンツ取得手段により取得された前記参照コンテンツから特徴情報を抽出
する抽出手段と、
前記抽出手段により抽出された特徴情報を含む前記処理対象コンテンツの付加情報を生
成する付加情報生成手段と、
を備えることを特徴とする情報処理装置。
Reference content acquisition means for acquiring attribute information related to the content of the processing target content and acquiring reference content related to the attribute information;
Extraction means for extracting feature information from the reference content acquired by the reference content acquisition means;
Additional information generating means for generating additional information of the processing target content including the feature information extracted by the extracting means;
An information processing apparatus comprising:
前記属性情報毎に基準表現を記憶する基準表現記憶手段と、
前記処理対象コンテンツの属性情報に対応する基準表現を、前記基準表現記憶手段から
取得する基準表現取得手段と、を備え、
前記参照コンテンツ取得手段は、前記基準表現取得手段により取得された基準表現また
は取得された基準表現に類似する表現を含む前記参照コンテンツを取得すること、
を特徴とする請求項1記載の情報処理装置。
Reference expression storage means for storing a reference expression for each attribute information;
Reference expression acquisition means for acquiring a reference expression corresponding to the attribute information of the processing target content from the reference expression storage means,
The reference content acquisition means acquires the reference content including a reference expression acquired by the reference expression acquisition means or an expression similar to the acquired reference expression;
The information processing apparatus according to claim 1.
前記抽出手段は、
前記参照コンテンツ取得手段により複数の前記参照コンテンツが取得された場合に、こ
れら複数の前記参照コンテンツから特徴情報の候補を抽出する候補抽出手段と、
前記基準表現の出現状態に基づいて各々の前記参照コンテンツの重み付けを行うコンテ
ンツ評価手段と、
前記特徴情報の候補が抽出された前記参照コンテンツの重みに基づいて、複数の前記特
徴情報の候補の中から前記特徴情報を抽出する特徴情報抽出手段と、を備えて構成される
こと、
を特徴とする請求項2記載の情報処理装置。
The extraction means includes
Candidate extraction means for extracting candidate feature information from the plurality of reference contents when a plurality of the reference contents are acquired by the reference content acquisition means;
Content evaluation means for weighting each of the reference contents based on the appearance state of the reference expression;
Feature information extracting means configured to extract the feature information from a plurality of feature information candidates based on the weight of the reference content from which the feature information candidates have been extracted;
The information processing apparatus according to claim 2.
前記候補抽出手段は、前記参照コンテンツに含まれる言語表現を言語単位に分割し、個
々の言語単位に対して重み付けを行い、この重みに基づいて一部の前記言語表現を前記言
語単位で選択して、前記特徴情報の候補とすること、
を特徴とする請求項3記載の情報処理装置。
The candidate extraction unit divides the language expression included in the reference content into language units, weights each language unit, and selects a part of the language expressions based on the weight in the language unit. A candidate for the feature information,
The information processing apparatus according to claim 3.
前記基準表現は、単語、句、節、文、段落のいずれかの言語単位で構成される言語表現
であること、
を特徴とする請求項2から4のいずれかに記載の情報処理装置。
The reference expression is a linguistic expression composed of a linguistic unit of a word, a phrase, a clause, a sentence, or a paragraph;
The information processing apparatus according to claim 2, wherein:
前記属性情報を入力するための入力手段を備え、
前記参照コンテンツ取得手段は、前記入力手段により入力された属性情報に関連する前
記参照コンテンツを取得すること、
を特徴とする請求項1から5のいずれかに記載の情報処理装置。
An input means for inputting the attribute information;
The reference content acquisition means acquires the reference content related to the attribute information input by the input means;
The information processing apparatus according to claim 1, wherein:
前記参照コンテンツ取得手段は、前記処理対象コンテンツが作成または更新された日時
から所定時間内に、作成または更新された前記参照コンテンツを取得すること、
を特徴とする請求項1から6のいずれかに記載の情報処理装置。
The reference content acquisition means acquires the reference content created or updated within a predetermined time from the date and time when the processing target content was created or updated;
The information processing apparatus according to claim 1, wherein:
外部接続された通信回線を介して情報を送受信する通信手段を備え、
前記参照コンテンツ取得手段は、前記通信手段により通信可能な外部の装置から前記参
照コンテンツを取得すること、
を特徴とする請求項1から7のいずれかに記載の情報処理装置。
Comprising a communication means for transmitting and receiving information via an externally connected communication line;
The reference content acquisition means acquires the reference content from an external device communicable by the communication means;
The information processing apparatus according to claim 1, wherein:
前記通信手段により受信したコンテンツを表示する外部コンテンツ表示手段を備え、
前記参照コンテンツ取得手段は、前記外部コンテンツ表示手段により過去に表示された
コンテンツを前記参照コンテンツとして取得すること、
を特徴とする請求項8記載の情報処理装置。
External content display means for displaying the content received by the communication means,
The reference content acquisition means acquires the content previously displayed by the external content display means as the reference content;
The information processing apparatus according to claim 8.
処理対象コンテンツの内容に関する属性情報を取得し、この属性情報に関連する参照コ
ンテンツを取得し、取得した前記参照コンテンツから特徴情報を抽出し、抽出した特徴情
報を含む前記処理対象コンテンツの付加情報を生成すること、
を特徴とする情報処理方法。
Acquire attribute information regarding the content of the processing target content, acquire reference content related to the attribute information, extract feature information from the acquired reference content, and add additional information of the processing target content including the extracted feature information Generating,
An information processing method characterized by the above.
コンピュータを、
処理対象コンテンツの内容に関する属性情報を取得し、この属性情報に関連する参照コ
ンテンツを取得する参照コンテンツ取得手段と、
前記参照コンテンツ取得手段により取得された前記参照コンテンツから特徴情報を抽出
する抽出手段と、
前記抽出手段により抽出された特徴情報を含む前記処理対象コンテンツの付加情報を生
成する付加情報生成手段と、
して機能させるためのプログラム。
Computer
Reference content acquisition means for acquiring attribute information related to the content of the processing target content and acquiring reference content related to the attribute information;
Extraction means for extracting feature information from the reference content acquired by the reference content acquisition means;
Additional information generating means for generating additional information of the processing target content including the feature information extracted by the extracting means;
Program to make it function.
JP2006323110A 2006-11-30 2006-11-30 Information processing apparatus, information processing method and program Withdrawn JP2008139942A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006323110A JP2008139942A (en) 2006-11-30 2006-11-30 Information processing apparatus, information processing method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006323110A JP2008139942A (en) 2006-11-30 2006-11-30 Information processing apparatus, information processing method and program

Publications (1)

Publication Number Publication Date
JP2008139942A true JP2008139942A (en) 2008-06-19

Family

ID=39601364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006323110A Withdrawn JP2008139942A (en) 2006-11-30 2006-11-30 Information processing apparatus, information processing method and program

Country Status (1)

Country Link
JP (1) JP2008139942A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026996A (en) * 2008-07-24 2010-02-04 Nippon Telegr & Teleph Corp <Ntt> Tag attachment support method and its device, program, and recording medium
JP2010160541A (en) * 2009-01-06 2010-07-22 Nec Corp Information processing device
JP2013109629A (en) * 2011-11-22 2013-06-06 Kddi Corp Dialogue system, dialogue method and program
JP2016509703A (en) * 2012-12-20 2016-03-31 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. System and method for retrieving labeled primarily non-text items

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026996A (en) * 2008-07-24 2010-02-04 Nippon Telegr & Teleph Corp <Ntt> Tag attachment support method and its device, program, and recording medium
JP2010160541A (en) * 2009-01-06 2010-07-22 Nec Corp Information processing device
JP2013109629A (en) * 2011-11-22 2013-06-06 Kddi Corp Dialogue system, dialogue method and program
JP2016509703A (en) * 2012-12-20 2016-03-31 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. System and method for retrieving labeled primarily non-text items
US9940382B2 (en) 2012-12-20 2018-04-10 Koninklijke Philips N.V. System and method for searching a labeled predominantly non-textual item

Similar Documents

Publication Publication Date Title
WO2012137397A1 (en) Content-processing device, content-processing method, content-processing program, and integrated circuit
JP5300068B2 (en) Movie recommendation device
JP2010514023A (en) How to automatically prefetch words while entering multimedia message text
JP2008192055A (en) Content search method and content search apparatus
KR20060129508A (en) Data processing device capable of performing data transmission by a predetermined access method
WO2009119063A1 (en) Program information display device and program information display method
US9203986B2 (en) Imaging device, imaging system, image management server, image communication system, imaging method, and image management method
KR101245665B1 (en) Search system for providing integrated multimedia contents and method thereof
KR20160062667A (en) A method and device of various-type media resource recommendation
KR20210090273A (en) Voice packet recommendation method, device, equipment and storage medium
JP2009075977A (en) Portable terminal browsing document distribution server, portable terminal, and portable terminal browsing document distribution system
JP4894253B2 (en) Metadata generating apparatus and metadata generating method
JP2008139942A (en) Information processing apparatus, information processing method and program
JP2010102393A (en) Index video generation device, video image search apparatus and video image search system
JP2008160512A (en) Reproducing device, electronic equipment, reproducing method, and program
US20080255826A1 (en) Dictionary data generating apparatus, character input apparatus, dictionary data generating method, and character input method
JP2010140195A (en) Image delivery device, system, and method
JP2007052581A (en) Metadata generation device, metadata generation system, processing method in them and program making computer execute the method
JP5454751B2 (en) SEARCH METHOD, SEARCH SYSTEM, PROGRAM, AND COMPUTER
JP5342509B2 (en) CONTENT REPRODUCTION DEVICE, CONTENT REPRODUCTION DEVICE CONTROL METHOD, CONTROL PROGRAM, AND RECORDING MEDIUM
JP2011076408A (en) Data management apparatus, data management method and data management program
US20120179676A1 (en) Method and apparatus for annotating image in digital camera
JP5134882B2 (en) Content management device
JP2007251706A (en) Title setting of image
JP2008242820A (en) Document processing system

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100202