JP2006501545A - Method and apparatus for automatically determining salient features for object classification - Google Patents
Method and apparatus for automatically determining salient features for object classification Download PDFInfo
- Publication number
- JP2006501545A JP2006501545A JP2004539741A JP2004539741A JP2006501545A JP 2006501545 A JP2006501545 A JP 2006501545A JP 2004539741 A JP2004539741 A JP 2004539741A JP 2004539741 A JP2004539741 A JP 2004539741A JP 2006501545 A JP2006501545 A JP 2006501545A
- Authority
- JP
- Japan
- Prior art keywords
- features
- feature
- data
- list
- unique features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
Abstract
オブジェクトの分類のための顕著な特徴(308)を自動的に判定する方法および装置が提供される。一実施例によると、1または複数の固有の特徴を、オブジェクトの第1コンテンツグループから抽出して、第1特徴リストを形成し、1または複数の固有の特徴を、オブジェクトの第2アンチコンテンツグループから抽出して、第2特徴リストを形成する。次に、第1特徴リストの固有の特徴と第2特徴リストの固有の特徴との間に統計的弁別を適用することにより、特徴のランク付けされたリストを作成する。顕著な特徴のセット(308)を、結果として生じた特徴のランク付けされたリストから識別する。A method and apparatus is provided for automatically determining salient features (308) for object classification. According to one embodiment, one or more unique features are extracted from the first content group of the object to form a first feature list, and the one or more unique features are extracted from the second anti-content group of the object. To form a second feature list. Next, a ranked list of features is created by applying statistical discrimination between the unique features of the first feature list and the unique features of the second feature list. A salient feature set (308) is identified from the ranked list of resulting features.
Description
本発明は、データ処理の分野に関する。さらに詳細には、本発明は、オブジェクトをグループに分類するのに使用するためのオブジェクトの特徴を自動的に選択することに関する。 The present invention relates to the field of data processing. More particularly, the invention relates to automatically selecting object features for use in classifying objects into groups.
ワールドワイドウェブは、オンラインでの閲覧およびダウンロードに利用可能な莫大な数のページが推定される情報を有する重要な情報源を提供する。しかし、このような情報を有効に活用するためには、この莫大に広がるデータをナビゲートするための実用的な方法が必要である。 The World Wide Web provides an important source of information with information that estimates an enormous number of pages available for online browsing and downloading. However, in order to effectively use such information, a practical method for navigating this enormous amount of data is necessary.
インターネットサーフィンの初期に、ウェブ検索に役立つ2つの基本的な方法が開発された。第1の手法では、新しいページおよび一意のページを探してウェブの中を「クロール(crawl)」する自動化された検索エンジンによって収集されたウェブページのコンテンツに基づき、インデックス化されたデータベースを作成する。このデータベースを、様々なクエリ技術を使用して検索することができ、クエリの形式との類似性に基づいてランク付けすることが多い。第2の手法では、ウェブページは、典型的にはツリー形式で示されるカテゴリ階層にグループ化される。次に、ユーザは、決定ポイントの下にあるサブツリー間で顕著な相違を示す各レベルで2以上の選択肢がある階層を降下し、最後にテキストおよび/またはマルチメディアコンテンツのページを含むリーフノードに達する間に一連の選択をする。 In the early days of surfing the Internet, two basic methods were developed to help with web searches. The first approach creates an indexed database based on the content of web pages collected by automated search engines that search for new and unique pages and “crawl” the web. . This database can be searched using various query techniques and is often ranked based on similarity to the form of the query. In the second approach, web pages are grouped into category hierarchies, typically shown in a tree format. The user then descends down the hierarchy with two or more choices at each level that show significant differences between the subtrees below the decision point, and finally to the leaf node that contains the text and / or multimedia content pages. Make a series of choices while reaching.
例えば、図1に、典型的な先行技術の主題階層102を示す。ここでは、複数の決定ノード(以下「ノード」と言う)130−136が、複数の親及び/又は子ノードに階層的に配置されており、それらノードの各々が、独自の主題カテゴリと関連付けられている。例えば、ノード130は、ノード131と132に対する親ノードであり、ノード131と132は、ノード130に対する子ノードである。ノード131と132は、両方とも同じ親ノード(例えばノード130)に対する子ノードなので、ノード131と132は、互いに兄弟であると言える。主題階層102に付加される兄弟の組は、ノード133と134ならびにノード135と136を含む。図1から、ノード130が、主題階層102の第1レベル137を形成し、ノード131−132が主題階層102の第2レベル138を形成し、ノード133−136が主題階層102の第3レベル139を形成することが分かる。加えてノード130は、他のいずれのノードに関しても子ではないので、主題階層102の根ノードと呼ばれる。
For example, FIG. 1 shows a typical prior
ウェブページに関する階層組織を作成する過程は、多数の課題を提示する。まず、階層の性質が定義されなければならない。これは、典型的には、特定の主題領域の専門家の手により、図書館のデューイ十進方式においてカテゴリを作成するのに類似した方法でなされる。これらのカテゴリに説明ラベルが与えられ、ユーザ及びカテゴリ分け担当者が、階層をナビゲートしながら適切に決定できるようにする。例えば、個々の電子文書といった形式のコンテンツは、手動検索により階層を通じてカテゴリに配置される。 The process of creating a hierarchical organization for web pages presents a number of challenges. First, the nature of the hierarchy must be defined. This is typically done in a manner similar to creating a category in the library's Dewey decimal format, by the hands of an expert in a particular subject area. These categories are provided with descriptive labels so that users and categorizers can make appropriate decisions while navigating the hierarchy. For example, contents in the form of individual electronic documents are arranged in categories through a hierarchy by manual search.
近年では、この過程の各種段階を自動化する方向に関心が向けられている。文書のコーパスから文書を自動的に分類するためのシステムが存在する。例えば、あるシステムは、文書に関連したキーワードを利用して類似した文書を自動的にクラスタ化またはグループ化する。このようなクラスタを、スーパークラスタへと繰り返しグループ化することができ、階層構造を作成する。しかしながら、これらのシステムは、キーワードを手動で挿入する必要があるので、体系的構造のない階層を作成する。そのような階層が手動検索に使われるのであれば、サブノード又はリーフ文書を手動で調べて共通の特徴を特定することにより、その階層のノードにラベルを付さなくてはならない。 In recent years, interest has been directed towards automating the various stages of this process. Systems exist for automatically classifying documents from a document corpus. For example, some systems automatically cluster or group similar documents using keywords associated with the documents. Such clusters can be grouped repeatedly into super clusters, creating a hierarchical structure. However, these systems create a hierarchy without a systematic structure because keywords need to be inserted manually. If such a hierarchy is used for manual retrieval, the nodes in that hierarchy must be labeled by manually examining subnodes or leaf documents to identify common features.
多くの分類システムは、文書を分類するために見出し単語のリストを利用する。典型的には、主要な単語は、あらかじめ定義されるか、処理される文書から選択され、その文書をより正確に特徴付ける。普通、これら主要な単語リストは、1セットの文書の各々に使われた全単語の出現頻度を計数することにより作成される。次に、1または複数の判断基準により、単語を単語リストから削除する。多くの場合、文書のコーパスにたまにしか出現しない単語は削除される。このような単語は、カテゴリ内で正確に特徴を示すことが非常にまれなためである。一方、あまりに頻繁に出現する単語も削除される。このような単語は、カテゴリをまたいで全ての文書によく出現すると推測されるからである。 Many classification systems use a list of headwords to classify documents. Typically, key words are either pre-defined or selected from the document to be processed and more accurately characterize that document. Usually, these main word lists are created by counting the frequency of occurrence of all words used in each of a set of documents. Next, the word is deleted from the word list according to one or more criteria. In many cases, words that appear only occasionally in the document corpus are deleted. This is because such words are very rarely characterized accurately within a category. On the other hand, words that appear too frequently are also deleted. This is because such words are presumed to appear frequently in all documents across categories.
更に、「ストップワード」及び語幹も、顕著な特徴の判定を円滑にするため特徴リストから削除されることが多い。ストップワードには、意味のある内容を含まないと受け止められる「a」、「the」、「his」、「and」など、言語に共通の単語が含まれる。ここで、語幹は「−ing」、「−end」、「−is」、「−able」などの接尾辞をあらわす。残念ながら、ストップワードと語幹のリストの生成は、言語特有の問題で、時代により異なることのある構文、文法、用法に関する専門知識を必要とする。そのため、顕著な特徴を判定するのにより柔軟性のある方法が望まれている。 In addition, “stop words” and stems are often deleted from the feature list to facilitate the determination of salient features. Stop words include words that are common to languages, such as “a”, “the”, “his”, “and”, etc., which are accepted as having no meaningful content. Here, the stem represents a suffix such as “-ing”, “-end”, “-is”, “-able”. Unfortunately, the generation of stopwords and stem lists is a language-specific issue and requires expertise in syntax, grammar, and usage that can vary over time. Therefore, a more flexible method for determining salient features is desired.
本発明は、添付図面に示す典型的な実施例を用いて記述されるが、それに限定されるものではない。図面では類似参照番号は類似要素を意味する。 The present invention will be described using the exemplary embodiments shown in the accompanying drawings, but is not limited thereto. In the drawings, like reference numbers indicate like elements.
以下の記述において、本発明の各種態様が記述される。しかし当業者には、本発明はその一部のみまたは全部の態様を用いて実施され得ることが明らかであろう。説明の目的で、具体的な数字、材料および構成が本発明の完全な理解を提供するために示されるが、当業者には本発明はそのような具体的な詳細がなくても実施され得ることが明らかであろう。他の事例において、本発明をわかりにくくしないために、公知の特性は省略又は簡略化されている。 In the following description, various aspects of the present invention will be described. However, it will be apparent to those skilled in the art that the present invention may be practiced using only some or all of the embodiments. For purposes of explanation, specific numbers, materials, and configurations are set forth in order to provide a thorough understanding of the present invention, but the present invention may be practiced without such specific details. It will be clear. In other instances, well-known properties have been omitted or simplified so as not to obscure the present invention.
以下の記述の一部は、データ、記憶、選択、判定、計算などの用語を使用してプロセッサベースの装置によって行われる操作に関して示され、当業者が自己の仕事の要旨を他の当業者に伝えるために普通に採用する方法と一致する。当業者には良く理解されているように、量は、プロセッサベースのデバイスの機械的及び電気的構成部品を通じて記憶、伝送、結合及びその他の操作をすることの出来る電気、磁気、又は光信号の形を取る。また、プロセッサという用語は、独立型、補助型又は埋込型のマイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ等を含む。 Some of the following descriptions are presented in terms of operations performed by processor-based devices using terms such as data, storage, selection, determination, calculation, etc., to enable those skilled in the art to give their work summary to others skilled in the art Consistent with the method normally adopted to communicate. As is well understood by those skilled in the art, quantities are quantities of electrical, magnetic, or optical signals that can be stored, transmitted, coupled, and otherwise manipulated through the mechanical and electrical components of processor-based devices. Take shape. The term processor includes stand-alone, auxiliary or embedded microprocessors, microcontrollers, digital signal processors and the like.
各種の操作は、複数の離散ステップとして順に、本発明の理解に最も役立つ方法で記述されるが、この記述の順序は、これらの演算が必然的に順序に依存することを意味すると見なされるものではない。詳細には、これらの演算は、提示された順序で行われる必要はない。さらに、以下の記述では「一実施例」の文言が繰り返し使用されるが、これは、同一実施例を指すこともあるが、通常は同一実施例を指すものではない。 The various operations are described in sequence as a plurality of discrete steps in a way that is most useful for understanding the present invention, but the order of the descriptions is considered to mean that these operations are necessarily dependent on the order. is not. In particular, these operations need not be performed in the order presented. Further, in the following description, the word “one embodiment” is repeatedly used. This may refer to the same embodiment, but usually does not refer to the same embodiment.
本発明の一実施例において、1または複数の固有の特徴を、オブジェクトの第1グループから抽出して、第1の特徴セットを形成し、1または複数の固有の特徴を、オブジェクトの第2グループから抽出して、第2特徴セットを形成する。次に、第1の特徴セットの固有の特徴と第2の特徴セットの固有の特徴との間に統計的弁別を適用して、特徴のランク付けされたリストを作成する。そして、顕著な特徴セットを、結果として生じた特徴のランク付けされたリストから識別する。 In one embodiment of the invention, one or more unique features are extracted from a first group of objects to form a first feature set, and one or more unique features are extracted from a second group of objects. To form a second feature set. A statistical discrimination is then applied between the unique features of the first feature set and the unique features of the second feature set to create a ranked list of features. A salient feature set is then identified from the ranked list of resulting features.
一実施例において、顕著な特徴を判定して、データオブジェクトの効率のよい分類とカテゴリ化を容易にする。データオブジェクトのカテゴリ化は、これに限定されないが、非常に大規模な階層的分類ツリー内および単層ファイルのように非階層的なデータ構造内の独自フォーマットおよび汎用フォーマットの双方を含むテキストファイル、画像ファイル、音声およびビデオシーケンスを含む。例えば、テキストファイルでは、特徴は、単語の形式を取り得る。ここで「単語」という用語は、普通には、ある言語において、何らかの意味論的に意味を有する文字のグループを示すことが理解される。より一般的には、特徴は、N−トークングラムとなることが出来る。ここでトークンとは、例えば、英語ではN−文字グラムとN−単語グラムを、アジアの言語ではN−表意文字グラムを含むある言語の1つの原子である。例えば、音声シーケンスにおいて、音符、抑揚、テンポ、持続時間、音程、音量等は、特徴としてその音声を分類するのに用いられ得る。一方、ビデオシーケンス及び静止画像において、クロミナンス、輝度のレベルなどの各種ピクセル属性を特徴として用いることができる。本発明の一実施例では、例えば、1つの特徴グループが、電子文書などといったあるグループから識別されると、これらの特徴のサブセットは、与えられたデータオブジェクトのグループを分類するために顕著であると判定される。「電子文書」という用語は、1または複数の構造的名特徴を含む、上述したような一群のデータオブジェクトを記述するために本明細書中で広く使用される。電子文書は、テキストを含むことができ、テキストに代わり、またはテキストに加え、音声および/またはビデオコンテンツを同様に含むことができる。 In one embodiment, salient features are determined to facilitate efficient classification and categorization of data objects. Data object categorization includes, but is not limited to, text files that contain both proprietary and generic formats within very large hierarchical classification trees and non-hierarchical data structures such as single layer files, Includes image files, audio and video sequences. For example, in a text file, the feature can take the form of a word. Here, it is understood that the term “word” usually refers to a group of characters that have some semantic meaning in a language. More generally, the feature can be an N-tokengram. Here, the token is one atom of a language including, for example, an N-character gram and an N-word gram in English, and an N-ideogram character in an Asian language. For example, in a speech sequence, notes, intonation, tempo, duration, pitch, volume, etc. can be used to classify the speech as a feature. On the other hand, various pixel attributes such as chrominance and luminance level can be used as features in video sequences and still images. In one embodiment of the invention, for example, if a single feature group is identified from a group, such as an electronic document, a subset of these features is prominent for classifying a given group of data objects. It is determined. The term “electronic document” is used broadly herein to describe a group of data objects as described above, including one or more structural name features. An electronic document can include text and can similarly include audio and / or video content in place of or in addition to text.
特徴選択基準が判定される(すなわち、各種のテキスト/音声/ビデオ属性がデータオブジェクトのセット内で判定用の特徴として利用される)と、本発明による顕著な特徴を判定する過程が行われる。顕著な特徴を判定する過程を開始するために、データオブジェクトは、2つのグループに分割される。「適合性のオッズ」を示す式を、データオブジェクトのこれら2つのグループに適用される(例えば式1を参照)。式中、O(d)は、与えられたあるデータオブジェクトが第1グループのデータオブジェクトのメンバであるオッズを表し、P(R|d)は、そのデータオブジェクトがその第1グループのメンバである確率を表し、P(R’|d)は、そのデータオブジェクトが第2グループのメンバである確率を表す。 Once the feature selection criteria are determined (ie, various text / audio / video attributes are utilized as determining features in the set of data objects), the process of determining salient features according to the present invention is performed. In order to begin the process of determining salient features, the data object is divided into two groups. An expression indicating “fitness odds” is applied to these two groups of data objects (see, for example, Expression 1). Where O (d) represents the odds that a given data object is a member of the first group of data objects, and P (R | d) is the data object is a member of the first group. P (R ′ | d) represents the probability that the data object is a member of the second group.
データオブジェクトの手動によるグループ化では、適合性のオッズを計算するための所望の確率が与えられないので、式(1)は、この値を概算するため最大化することが出来る。したがって、ベイズの公式を併用した対数関数を、式(1)の両辺に適用することができ、式(2)が導き出される。 Since manual grouping of data objects does not give the desired probability for calculating the odds of fitness, equation (1) can be maximized to approximate this value. Therefore, a logarithmic function using the Bayes formula can be applied to both sides of Equation (1), and Equation (2) is derived.
あるデータオブジェクトが、1セットの特徴{Fi}からなると仮定され、かつ任意の特徴fiが、データオブジェクトに存在する場合にXiが1であり、fiが存在しない場合はXiは0であるならば、 It is assumed that a data object consists of a set of features {F i } and if any feature f i is present in the data object, X i is 1 and if f i is not present, X i is If it is 0,
となる。logP(R)とlogP(R’)は定数であり、上記データオブジェクトの中で顕著なものとして選択された特徴とは無関係なので、新しい量g(d)が次のように定義される。 It becomes. Since logP (R) and logP (R ') are constants and are independent of the features selected as prominent in the data object, a new quantity g (d) is defined as follows:
pi=P(Xi=1|R)は、任意の特徴(fi)がデータオブジェクトの第1グループにあるデータオブジェクトに生じる確率を示すと仮定し、qi=P(Xi=1|R’)は、任意の特徴(fi)がデータオブジェクトの第2グループにあるデータオブジェクトに生じる確率を示すと仮定すると、代入し、式を簡単にすることによって式(5)が導き出される。 Let p i = P (X i = 1 | R) denote the probability that any feature (f i ) will occur in a data object in the first group of data objects, and q i = P (X i = 1 Assuming that | R ′) represents the probability that any feature (f i ) will occur in a data object in the second group of data objects, substituting and simplifying the equation yields equation (5) .
2番目の積算は、データオブジェクト中の特徴発生に依存しないので、これを消去でき、結果として式(6)が得られる。 Since the second integration does not depend on the occurrence of features in the data object, it can be deleted, resulting in equation (6).
log関数は単調関数なので、 Since the log function is a monotone function,
の比を最大にすることが、対応するlog値を最大にする十分条件である。本発明の一実施例によると、顕著な特徴の識別を容易にするため、式(7)を、データオブジェクトの2つのグループ用に結合された特徴リストの中の各特徴に適用される。そのようにするため、Piは、特徴fiを少なくとも1回は含むデータオブジェクトの第1グループにあるデータオブジェクトの数を示すと推定され、データオブジェクト文書の第1グループにあるデータオブジェクトの総数によって除される。同様に、qiは、特徴fiを少なくとも1回は含む第結果ベクトルを獲得する2グループのデータオブジェクトの数を示すと推定され、データオブジェクトの第2グループにあるデータオブジェクトの総数によって除される。 It is a sufficient condition to maximize the corresponding log value. According to one embodiment of the present invention, equation (7) is applied to each feature in the feature list combined for two groups of data objects to facilitate the identification of salient features. To do so, P i is presumed to indicate the number of data objects in the first group of data objects that include the feature f i at least once, and the total number of data objects in the first group of data object documents. Divided by. Similarly, q i is estimated to indicate the number of data objects in two groups that obtain a second result vector that includes feature f i at least once, and divided by the total number of data objects in the second group of data objects. The
図2A−Cに、本発明の一実施例にかかる顕著な特徴の判定機能の操作フローを示す。最初に、データオブジェクトの第1のセットが検査され、少なくともデータオブジェクトの第1のセットからの1または複数のデータオブジェクト内に示された固有の特徴からなる特徴リストを作成する(ブロック210)。識別された各固有の特徴ごとに、式(7)が適用され、ランク付けされた特徴リストを生成する(ブロック220)。そして、ランク付けされた特徴リストの少なくとも1つのサブセットが顕著な特徴として選ばれる(ブロック230)。この顕著な特徴リストは、ランク付けされた特徴リストから選択された要素の1または複数の連続または非連続グループを含むことができる。一実施例において、特徴のランク付けされたリストの最初のN個の要素は、顕著なものとして選ばれる。ここでNはシステムの要件に従って変動し得る。代替実施例において、特徴のランク付けされたリストの最後のM個の要素は、顕著なものとして選ばれる。ここでMもまたシステムの要件に従って変動し得る。 2A to 2C show an operation flow of the distinctive feature determination function according to one embodiment of the present invention. Initially, a first set of data objects is examined to create a feature list consisting of at least the unique features shown in one or more data objects from the first set of data objects (block 210). For each unique feature identified, equation (7) is applied to generate a ranked feature list (block 220). Then, at least one subset of the ranked feature list is selected as a salient feature (block 230). This salient feature list can include one or more continuous or non-contiguous groups of elements selected from the ranked feature list. In one embodiment, the first N elements of the ranked list of features are chosen as prominent. Here N may vary according to system requirements. In an alternative embodiment, the last M elements of the ranked list of features are chosen as prominent. Here, M can also vary according to the requirements of the system.
本発明の一実施例によると、ブロック210で特徴リストを作成する間に、データオブジェクトの各グループ内に含まれるデータオブジェクトの総数が判定され(ブロック212)、少なくともデータオブジェクトの第1グループの中に識別される固有の特徴毎に、その固有の特徴を含むデータオブジェクトの総数もまた判定される(ブロック214)。さらに、固有の特徴のリストは、所望の通りに各種判断基準に基づいてフィルタされ得る(ブロック216)。例えば、固有の特徴のそのリストは切り詰められてもよく、少なくともある程度の最小数のデータオブジェクト中に見出されない特徴、ある程度確定した最短の長さより短い特徴および/または割当量より少ない回数しか生じない特徴は削除される。
According to one embodiment of the present invention, during the creation of the feature list at
本発明の一実施例によると、図2Aのブロック220に記述するように、統計的弁別を適用して特徴のランク付けされたリストを獲得することは、さらに図2Cに示す過程を含む。換言すれば、統計的弁別の適用において(即ち、式(7)により示されるように)、データオブジェクトの第1のセット内で識別された固有の特徴が、データオブジェクトの第2のセット内にも存在するかについて判定がなされ(ブロック221)、ならびにデータオブジェクトの第1のセット内で識別された固有の特徴が、文書の第2のセット内には存在しないかについても判定がなされる(ブロック222)。例示した実施例によると、データオブジェクトの1つのセットの中に存在するが、別のセットには存在しないと判定される特徴には、特徴のランク付けされたリストの中で高い相対順位を割当て(ブロック223)、データオブジェクトの両方のセットの中に存在すると判定される特徴には、特徴のランク付けされたリストの中で、統計的弁別(即ち、式(7))を通じて判定されるような、低い相対順位を割当てる(ブロック224)。状況に応じ、このような特徴は、各個別の特徴を含むデータオブジェクトの総数に基づき、ランク付けされた特徴リスト内でさらにランク付けされてもよい。
According to one embodiment of the present invention, applying statistical discrimination to obtain a ranked list of features, as described in
適用例
ここで図3を参照すると、ここには、本発明の一実施例にかかる顕著な特徴を判定する手段の適用例が示されている。図に示すように、クラシファイア300を設けて、電子文書などのデータオブジェクトを、効率良く分類しカテゴリ化する。電子文書は、これに限定されないが、極めて大規模な階層分類ツリー及びフラットファイルフォーマットを含む各種データ構造内での、独自フォーマット及び汎用フォーマットのテキストファイル、画像ファイル、音声及びビデオシーケンスを含む。クラシファイア300は、クラシファイアトレーニングサービス305を含み、クラシファイア300をトレーニングして、予めカテゴリ化されたデータ階層から抽出される分類規則に基づいて、新規データオブジェクトをカテゴリ化する。同様に、クラシファイアカテゴリ化サービス315を含み、クラシファイア300に入力された新規データオブジェクトをカテゴリ化する。
Application Example Referring now to FIG. 3, there is shown an application example of means for determining salient features according to one embodiment of the present invention. As shown in the figure, a
クラシファイアトレーニングサービス305は、集約機能306、本発明の顕著な特徴の判定機能308、及びノード特徴付け機能309を含む。図示の実施例に従うと、予めカテゴリ化されたデータ階層からのコンテンツを、階層内の各ノードに集め、例えば集約機能306などを介して、データのコンテンツとアンチコンテンツ両方のグループを形成する。次に、これらデータのグループの各々からの特徴を抽出し、顕著な特徴の判定機能308を用いて、これら特徴のサブセットが顕著であることを判定する。ノード特徴付け機能309を使用して、予めカテゴリ化されたデータ階層の各ノードを、顕著な特徴に基づいて特徴付けし、このような階層の特徴付けを、例えばデータストア310に記憶し、さらにクラシファイアカテゴリ化サービス315で使用する。
The
クラシファイアトレーニングサービス305及びクラシファイアカテゴリ化サービス315を含むクラシファイア300に関する追加情報は、これと同時出願であって本願代理人が同じく担当する米国特許出願第51026.P004号、名称「Very-Large-Scale Automatic Categorizer For Web Content」に記述されており、その開示をここに参照によって組み込む。
Additional
クラシファイアトレーニングサービス
図4は、本発明の一実施例にかかる図3のクラシファイアトレーニングサービス305の機能的ブロック図を示す。図4に示すように、予めカテゴリ化されたデータ階層402は、クラシファイア300のクラシファイアトレーニングサービス305の入力として与えられる。予めカテゴリ化されたデータ階層402は、予め(一般的には個人による手入力により)主題階層に分類およびカテゴリ化されている、オーディオ、ビデオ及び/又はテキストオブジェクトなどのデータオブジェクトのセットを表わす。予めカテゴリ化されたデータ階層402は、ウェブポータル又は検索エンジンなどにより予めカテゴリ化された電子文書の1または複数のセットを表してもよい。
Classifier Training Service FIG. 4 shows a functional block diagram of the
図示の例によると、集約機能406は、予めカテゴリ化されたデータ階層402からのコンテンツを、データのコンテンツグループとアンチコンテンツグループに集約して、階層の各レベルにおける兄弟ノードの間の弁別が増加させる。顕著な特徴の判定機能408は、データのコンテンツグループとアンチコンテンツグループから特徴を抽出して、抽出された特徴(409)のうち顕著と見なすべきもの(409’)を判定するように動作する。
According to the illustrated example, the
加えて、図示の例によると、図3のノード特徴付け機能309は、データのコンテンツグループとアンチコンテンツグループを特徴付けるように動作する。一実施例において、データのコンテンツグループとアンチコンテンツグループは、判定される顕著な特徴に基づいて特徴付けされる。一実施例においては、特徴付けをデータストア310に記憶する。データストア310は、データベース、ディレクトリ構造、又は簡易ルックアップテーブルなど任意の数のデータ構造の形で実現される。本発明の一実施例においては、各ノードのクラシファイアに関するパラメータは、予めカテゴリ化されたデータ階層を模倣するファイル構造を有する階層カテゴリ化ツリーに記憶される。
In addition, according to the illustrated example, the
コンピュータシステムの例
図5は、本発明の一実施例にかかる顕著な特徴の判定に使用するのに適するコンピュータシステムの一例を示す。図示するように、コンピュータシステム500は、1または複数のプロセッサ502とシステムメモリ504を含む。加えて、コンピュータシステム500は、大容量記憶装置506(ディスケット、ハードドライブ、CDROMなど)、入出力装置508(キーボード、カーソル制御など)及び通信インタフェース510(ネットワークインタフェースカード、モデムなど)を含む。各要素は、1または複数のバスをあらわすシステムバス512を介して互いに結合される。システムバス512が多数のバスをあらわす場合、それらは1または複数のバスブリッジ(図示せず)を用いてブリッジされる。
Example Computer System FIG. 5 illustrates an example of a computer system suitable for use in determining salient features according to one embodiment of the present invention. As shown,
これらの要素の各々は、公知の従来の機能を実行する。詳細には、システムメモリ504と大容量記憶装置506を用いて、本発明のカテゴリ化システムを実行するプログラム命令の作業用コピーと永久コピーを記憶する。プログラム命令の永久コピーは、工場又は現場で、前述のように、配布媒体(図示せず)を介して、又は(配布サーバ(図示せず)から)通信インタフェース510を介して、大容量記憶装置506にロードされる。これら要素502−512の構造は公知なので、これ以上は記述しない。
Each of these elements performs a known conventional function. Specifically,
このようにして上の記述から、オブジェクト分類のため顕著な特徴を自動的に判定するための新規の方法と装置を記述したことが分かる。上に示す実施例を用いて本発明を記述したけれども、当業者は、本発明が記述の実施例に限定されるものでないことを認識するであろう。本発明は、添付の特許請求の範囲の精神と範囲の中で修正と変更をおこなって実施することが出来る。したがって、本記述は本発明に関する限定ではなく解説と見なされるものである。 Thus, it can be seen from the above description that a novel method and apparatus for automatically determining salient features for object classification has been described. Although the present invention has been described using the embodiments shown above, those skilled in the art will recognize that the invention is not limited to the described embodiments. The present invention may be practiced with modification and alteration within the spirit and scope of the appended claims. The description is thus to be regarded as illustrative instead of limiting on the present invention.
Claims (36)
データオブジェクト文書の第2アンチコンテンツグループから1または複数の固有の特徴を抽出して第2特徴リストを形成すること、
前記第1特徴リストの固有の特徴と前記第2特徴リストの固有の特徴との間に統計的弁別を適用することにより、特徴のランク付けされたリストを作成すること、および、
前記特徴のランク付けされたリストから顕著な特徴のセットを識別すること
を備えたことを特徴とする方法。 Extracting one or more unique features from a first content group of data objects to form a first feature list;
Extracting one or more unique features from the second anti-content group of the data object document to form a second feature list;
Creating a ranked list of features by applying statistical discrimination between the unique features of the first feature list and the unique features of the second feature list; and
Identifying a set of salient features from the ranked list of features.
前記データオブジェクトの第2アンチコンテンツグループを含む第2データオブジェクト総数を判定すること
をさらに備えたことを特徴とする請求項1に記載の方法。 Determining a total number of first data objects including a first content group of the data objects; and
The method of claim 1, further comprising: determining a total number of second data objects that include a second anti-content group of the data objects.
前記第2特徴リストを形成する前記1または複数の固有の特徴毎に、前記データオブジェクトの第2アンチコンテンツグループの第2データオブジェクトの数を判定することであって、前記データオブジェクトの前記第2アンチコンテンツグループは、前記第2特徴リストの前記1または複数の固有の特徴それぞれに少なくとも1つのインスタンスを含むこと
をさらに備えたことを特徴とする請求項3に記載の方法。 Determining the number of first data objects in the first content group of the data object for each of the one or more unique features forming the first feature list, the first content group of the data object Includes at least one instance for each of the one or more unique features of the first feature list; and
Determining, for each of the one or more unique features forming the second feature list, a number of second data objects in a second anti-content group of the data object, the second of the data objects The method of claim 3, further comprising: an anti-content group includes at least one instance for each of the one or more unique features of the second feature list.
前記第2特徴リストに存在しない、前記第1特徴リストの固有の特徴を排他的特徴として識別すること、
前記第2特徴リストにも存在する、前記第1特徴リストの固有の特徴を共通特徴として識別すること、および、
前記ランク付けされたリストを順序付け、前記排他的特徴が前記ランク付けされたリストの中で前記共通特徴に比較して高いランクにすること
を備えたことを特徴とする請求項4に記載の方法。 Creating the ranked list is:
Identifying unique features of the first feature list that are not present in the second feature list as exclusive features;
Identifying a unique feature of the first feature list that is also present in the second feature list as a common feature; and
5. The method of claim 4, comprising: ordering the ranked list so that the exclusive feature is ranked higher than the common feature in the ranked list. .
前記共通特徴を前記ランク付けされたリストの中で少なくとも一部は前記確率関数の結果ベクトルに基づいて順序付けること
をさらに備えたことを特徴とする請求項5に記載の方法。 Applying a probability function to each of the common features to obtain a result vector, the probability function including a quotient dividing the number of first data objects by the total number of first data objects; Including a ratio to the quotient dividing the number of data objects by the total number of second data objects; and
The method of claim 5, further comprising: ordering the common features at least in part in the ranked list based on a result vector of the probability function.
前記データオブジェクトの第2アンチコンテンツグループは、選択されたノードの何らかの関連兄弟ノードと、該兄弟ノードの何らかの関連サブノードとに相当するデータオブジェクトを含むことを特徴とする請求項1に記載の方法。 The first content group of data objects includes data objects corresponding to selected nodes of the subject hierarchy having a plurality of nodes and some related subnodes of the selected nodes;
The method of claim 1, wherein the second anti-content group of data objects includes data objects corresponding to some related sibling nodes of the selected node and any related subnodes of the sibling node.
第1データクラスのメンバである1または複数の固有の特徴を識別すること、
第2データクラスを検査して、前記第2データクラスのメンバでもある前記1または複数の固有の特徴と、前記第2データクラスのメンバでない前記1または複数の固有の特徴とを識別すること、
前記第2データクラスの中で、前記1または複数の固有の特徴の各々のメンバシップに基づく順序を有する固有の特徴のランク付けされたリストを生成すること、および、
前記固有の特徴のランク付けされたリストの1または複数を顕著であるとして識別すること
を備えたことを特徴とする方法。 A method for identifying salient features, comprising:
Identifying one or more unique features that are members of the first data class;
Examining a second data class to identify the one or more unique features that are also members of the second data class and the one or more unique features that are not members of the second data class;
Generating a ranked list of unique features having an order based on membership of each of the one or more unique features in the second data class; and
Identifying one or more of the ranked list of unique features as prominent.
データオブジェクトの第1コンテンツグループから1または複数の固有の特徴を抽出して第1特徴リストを形成し、
データオブジェクトの第2アンチコンテンツグループから1または複数の固有の特徴を抽出して第2特徴リストを形成し、
前記第1特徴リストの固有の特徴と前記第2特徴リストの固有の特徴との間に統計的弁別を適用することにより、特徴のランク付けされたリストを作成し、
前記特徴のランク付けされたリストから顕著な特徴のセットを識別する1または複数の機能を含む記憶媒体と、
プログラム命令を実行するように前記記憶媒体に結合されたプロセッサと
を備えたことを特徴とする装置。 A storage medium for internally storing a plurality of program instructions designed to perform a plurality of functions related to a category designation service for giving a category name to a data object,
Extracting one or more unique features from the first content group of the data object to form a first feature list;
Extracting one or more unique features from the second anti-content group of the data object to form a second feature list;
Creating a ranked list of features by applying statistical discrimination between the unique features of the first feature list and the unique features of the second feature list;
A storage medium comprising one or more functions for identifying a set of salient features from the ranked list of features;
And a processor coupled to the storage medium to execute program instructions.
前記データオブジェクトの前記第1コンテンツグループを含む第1データオブジェクト総数を判定し、
前記データオブジェクトの前記第2アンチコンテンツグループを含む第2データオブジェクト総数を判定する命令をさらに含むことを特徴とする請求項19に記載の装置。 The plurality of instructions are:
Determining a total number of first data objects including the first content group of the data objects;
The apparatus of claim 19, further comprising instructions for determining a total number of second data objects that include the second anti-content group of the data objects.
前記第1特徴リストを形成する前記1または複数の固有の特徴毎に、前記データオブジェクトの第1コンテンツグループの第1データオブジェクトの数を判定することであって、前記データオブジェクトの第1コンテンツグループは、前記第1特徴リストの前記1または複数の固有の特徴のそれぞれに少なくとも1つのインスタンスを含むこと、および、
前記第2特徴リストを形成する前記1または複数の固有の特徴毎に、前記データオブジェクトの第2アンチコンテンツグループの第2データオブジェクトの数を判定することであって、前記データオブジェクトの前記第2アンチコンテンツグループは、前記第2特徴リストの前記1または複数の固有の特徴それぞれに少なくとも1つのインスタンスを含むことという命令をさらに含むことを特徴とする請求項19に記載の装置。 The plurality of instructions are:
Determining the number of first data objects in the first content group of the data object for each of the one or more unique features forming the first feature list, the first content group of the data object Includes at least one instance for each of the one or more unique features of the first feature list; and
Determining, for each of the one or more unique features forming the second feature list, a number of second data objects in a second anti-content group of the data object, the second of the data objects The apparatus of claim 19, wherein the anti-content group further comprises an instruction to include at least one instance for each of the one or more unique features of the second feature list.
前記第2特徴リストに存在しない、前記第1特徴リストの固有の特徴を排他的特徴として識別し、
前記第2特徴リストにも存在する、前記第1特徴リストの固有の特徴を共通特徴として識別し、
前記ランク付けされたリストを順序付け、前記排他的特徴が前記ランク付けされたリストの中で前記共通特徴に比較して高いランクにする命令を含むことを特徴とする請求項20に記載の装置。 The plurality of instructions for creating the ranked list is:
Identifying unique features of the first feature list that are not present in the second feature list as exclusive features;
Identifying a unique feature of the first feature list that is also present in the second feature list as a common feature;
21. The apparatus of claim 20, wherein the ranked list is ordered and the exclusive feature includes an instruction that ranks higher in the ranked list than the common feature.
前記共通特徴の各々に確率関数を適用し、結果ベクトルを獲得することであって、前記確率関数は、前記第1データオブジェクトの数を前記第1データオブジェクト総数で除する商と、前記第2文書数を前記第2データオブジェクト総数で除する商との比を含むこと、および、
前記共通特徴を前記ランク付けされたリストの中で少なくとも一部は前記確率関数の結果ベクトルに基づいて順序付けることという命令をさらに含むことを特徴とする請求項23に記載の装置。 The plurality of instructions are:
Applying a probability function to each of the common features to obtain a result vector, the probability function including a quotient dividing the number of first data objects by the total number of first data objects; Including a ratio to the quotient dividing the number of documents by the total number of second data objects; and
24. The apparatus of claim 23, further comprising an instruction to order the common features at least partially in the ranked list based on the result vector of the probability function.
新規データオブジェクトを、少なくとも一部は前記顕著な特徴のセットに基づいて、前記データオブジェクトの第1コンテンツグループおよび前記データオブジェクトの第2アンチコンテンツグループとのうちの1つに最も関連しているとして、分類する命令をさらに含むことを特徴とする請求項19に記載の装置。 The plurality of instructions are:
A new data object is most relevant to one of the first content group of the data object and the second anti-content group of the data object, at least in part based on the set of salient features. The apparatus of claim 19 further comprising instructions for classifying.
データオブジェクトの前記第2アンチコンテンツグループは、選択されたノードの何らかの関連兄弟ノードと、該兄弟ノードの何らかの関連サブノードとに相当するデータオブジェクトを含むことを特徴とする請求項19に記載の装置。 The first content group of data objects includes data objects corresponding to selected nodes of the subject hierarchy having a plurality of nodes and some related subnodes of the selected nodes;
The apparatus of claim 19, wherein the second anti-content group of data objects includes data objects corresponding to some related sibling nodes of the selected node and any related subnodes of the sibling nodes.
第1データクラスのメンバである1または複数の固有の特徴を識別し、
第2データクラスを検査して、前記第2データクラスのメンバでもある前記1または複数の固有の特徴と、前記第2データクラスのメンバでない前記1または複数の固有の特徴とを識別し、
前記第2データクラスの中で、前記1または複数の固有の特徴の各々のメンバシップに基づく順序を有する固有の特徴のランク付けされたリストを生成し、
前記固有の特徴のランク付けされたリストの1または複数を顕著であるとして識別する1または複数の機能を含む記憶媒体と、
プログラム命令を実行するように前記記憶媒体に結合されたプロセッサと
を備えたことを特徴とする装置。 A storage medium that internally stores a plurality of program instructions designed to perform a plurality of functions,
Identifying one or more unique features that are members of the first data class;
Examining a second data class to identify the one or more unique features that are also members of the second data class and the one or more unique features that are not members of the second data class;
Generating a ranked list of unique features having an order based on membership of each of the one or more unique features in the second data class;
A storage medium comprising one or more functions that identify one or more of the ranked list of unique features as prominent;
And a processor coupled to the storage medium to execute program instructions.
前記固有の特徴のランク付けされたリストの各々について、それぞれの固有の特徴を含む前記第1データクラスの中のオブジェクトの数を判定する命令を含むことを特徴とする請求項31に記載の装置。 The plurality of instructions are:
32. The apparatus of claim 31, comprising instructions for determining a number of objects in the first data class that include a respective unique feature for each of the ranked list of unique features. .
32. The plurality of instructions that are identified as prominent include an instruction that selects a last set of M consecutive unique features from the ranked list of unique features. The device described.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2002/030457 WO2004029826A1 (en) | 2002-09-25 | 2002-09-25 | Method and apparatus for automatically determining salient features for object classification |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006501545A true JP2006501545A (en) | 2006-01-12 |
Family
ID=32041246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004539741A Pending JP2006501545A (en) | 2002-09-25 | 2002-09-25 | Method and apparatus for automatically determining salient features for object classification |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP1543437A4 (en) |
JP (1) | JP2006501545A (en) |
CN (1) | CN100378713C (en) |
AU (1) | AU2002334669A1 (en) |
BR (1) | BR0215899A (en) |
CA (1) | CA2500264A1 (en) |
MX (1) | MXPA05003249A (en) |
WO (1) | WO2004029826A1 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7576755B2 (en) | 2007-02-13 | 2009-08-18 | Microsoft Corporation | Picture collage systems and methods |
US8935249B2 (en) | 2007-06-26 | 2015-01-13 | Oracle Otc Subsidiary Llc | Visualization of concepts within a collection of information |
US8832140B2 (en) | 2007-06-26 | 2014-09-09 | Oracle Otc Subsidiary Llc | System and method for measuring the quality of document sets |
US9307107B2 (en) * | 2013-06-03 | 2016-04-05 | Kodak Alaris Inc. | Classification of scanned hardcopy media |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997008604A2 (en) * | 1995-08-16 | 1997-03-06 | Syracuse University | Multilingual document retrieval system and method using semantic vector matching |
US6539115B2 (en) * | 1997-02-12 | 2003-03-25 | Fujitsu Limited | Pattern recognition device for performing classification using a candidate table and method thereof |
US6233575B1 (en) * | 1997-06-24 | 2001-05-15 | International Business Machines Corporation | Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values |
US6018733A (en) * | 1997-09-12 | 2000-01-25 | Infoseek Corporation | Methods for iteratively and interactively performing collection selection in full text searches |
US6353825B1 (en) * | 1999-07-30 | 2002-03-05 | Verizon Laboratories Inc. | Method and device for classification using iterative information retrieval techniques |
AU2001278932A1 (en) * | 2000-07-17 | 2002-01-30 | Asymmetry, Inc. | System and method for storage and processing of business information |
-
2002
- 2002-09-25 JP JP2004539741A patent/JP2006501545A/en active Pending
- 2002-09-25 AU AU2002334669A patent/AU2002334669A1/en not_active Abandoned
- 2002-09-25 WO PCT/US2002/030457 patent/WO2004029826A1/en active Application Filing
- 2002-09-25 CA CA002500264A patent/CA2500264A1/en not_active Abandoned
- 2002-09-25 MX MXPA05003249A patent/MXPA05003249A/en unknown
- 2002-09-25 BR BR0215899-0A patent/BR0215899A/en not_active IP Right Cessation
- 2002-09-25 CN CNB02829663XA patent/CN100378713C/en not_active Expired - Fee Related
- 2002-09-25 EP EP02807873A patent/EP1543437A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
BR0215899A (en) | 2005-07-26 |
AU2002334669A1 (en) | 2004-04-19 |
EP1543437A4 (en) | 2008-05-28 |
MXPA05003249A (en) | 2005-07-05 |
WO2004029826A1 (en) | 2004-04-08 |
CN1669023A (en) | 2005-09-14 |
EP1543437A1 (en) | 2005-06-22 |
CN100378713C (en) | 2008-04-02 |
CA2500264A1 (en) | 2004-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6938025B1 (en) | Method and apparatus for automatically determining salient features for object classification | |
KR100304335B1 (en) | Keyword Extraction System and Document Retrieval System Using It | |
KR100756921B1 (en) | Method of classifying documents, computer readable record medium on which program for executing the method is recorded | |
US7523095B2 (en) | System and method for generating refinement categories for a set of search results | |
US6735583B1 (en) | Method and system for classifying and locating media content | |
US6725217B2 (en) | Method and system for knowledge repository exploration and visualization | |
US20020174095A1 (en) | Very-large-scale automatic categorizer for web content | |
US8341159B2 (en) | Creating taxonomies and training data for document categorization | |
JP3673487B2 (en) | Hierarchical statistical analysis system and method | |
US6286000B1 (en) | Light weight document matcher | |
EP1024437A2 (en) | Multi-modal information access | |
US20050010559A1 (en) | Methods for information search and citation search | |
US8983965B2 (en) | Document rating calculation system, document rating calculation method and program | |
US7024405B2 (en) | Method and apparatus for improved internet searching | |
US20180004838A1 (en) | System and method for language sensitive contextual searching | |
WO2002048921A1 (en) | Method and apparatus for searching a database and providing relevance feedback | |
JP2008071372A (en) | Method and device for searching data of database | |
US7275052B2 (en) | Combined classification based on examples, queries, and keywords | |
JP2006227823A (en) | Information processor and its control method | |
JP5418138B2 (en) | Document search system, information processing apparatus, and program | |
JP2006501545A (en) | Method and apparatus for automatically determining salient features for object classification | |
JP2005010848A (en) | Information retrieval device, information retrieval method, information retrieval program and recording medium | |
JP3856388B2 (en) | Similarity calculation method, similarity calculation program, and computer-readable recording medium recording the similarity calculation program | |
WO2002037328A2 (en) | Integrating search, classification, scoring and ranking | |
JPH10162011A (en) | Information retrieval method, information retrieval system, information retrieval terminal equipment, and information retrieval device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080905 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081205 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090127 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20090420 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20090428 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090420 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090428 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090527 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090619 |
|
A912 | Removal of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20090731 |