JP2009266065A - 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム - Google Patents

関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム Download PDF

Info

Publication number
JP2009266065A
JP2009266065A JP2008116844A JP2008116844A JP2009266065A JP 2009266065 A JP2009266065 A JP 2009266065A JP 2008116844 A JP2008116844 A JP 2008116844A JP 2008116844 A JP2008116844 A JP 2008116844A JP 2009266065 A JP2009266065 A JP 2009266065A
Authority
JP
Japan
Prior art keywords
words
related word
combination
word
occurrence frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008116844A
Other languages
English (en)
Inventor
Yosuke Ohashi
洋介 大橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2008116844A priority Critical patent/JP2009266065A/ja
Publication of JP2009266065A publication Critical patent/JP2009266065A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】手間を掛けずに関連語辞書を作成する。
【解決手段】メタデータが付された二つ一組の画像を入力し、二つ一組でサーバに入力された画像のそれぞれに付されたメタデータの組合せ毎に、メタデータ共起頻度テーブルの共起頻度を「1」加算する。スコア算出部は、メタデータ共起頻度テーブルを参照しながら、共起頻度に基づく式を用いて、単語同士の関連スコアを算出する。スコア算出部で算出された関連スコアをもって関連語辞書テーブルを更新する。
【選択図】図13

Description

本発明は、単語同士の関連性を記憶した関連語辞書を作成する関連語辞書作成方法及び装置、並びに関連語辞書作成プログラムに関する。
最近、携帯電話やパーソナルコンピュータなどの情報端末機器の普及に伴い、映像、画像、音楽、ゲーム、電子辞書、Webページといった様々なコンテンツを大量且つ容易に得ることが可能になった。このため、情報端末機器でコンテンツの検索を行う機会が増加している。コンテンツの検索を行う場合、テキスト検索が広く用いられている。テキスト検索では、ユーザにより入力されたテキストが検索条件として用いられ、予めコンテンツに付されたメタデータに基づいてコンテンツが探し出されることとなる。コンテンツが探し出されると、検索結果として文字や画像などの項目が表示され、ユーザはこれを選択することによりコンテンツを得ることができる。
しかし、ユーザにより入力されるテキストは、検索条件として必ずしも適切であるとは限らない。このため、ユーザは、満足のいく検索結果が得られるまで異なるテキストを思考しながら検索を繰り返すこともある。
このため、単語同士の関連性を記憶した関連語辞書を利用して、入力されたテキストと同義や類似などの語を、入力されたテキストとの結び付きの強さに応じて検索条件に追加し、拡張された検索条件でコンテンツの検索を行う方法がある(例えば、特許文献1、2参照)。関連語辞書を利用することで、入力されたテキストが検索条件として適切とはいえない場合であっても、ユーザが所望するコンテンツを検索にヒットさせることが可能になる。
ところで、そのような関連語辞書を作成する場合、人手で行うと、長い年月と莫大な費用が掛かる。また、新語の出現や単語の使い方の変化に応じて関連語辞書をメンテナンスする場合にも、人手で行うことは面倒である。
一方で、手間を掛けずに自動的に関連語辞書を作成する方法もある。例えば、特許文献1の発明では、入力された文章から単語を抽出し、抽出された単語の組合せをデータベースに記憶することで関連語辞書を作成する。特許文献2の発明では、入力された質問文から単語を抽出し、抽出された単語と、抽出された単語に基づく回答候補の単語から選択された単語との組合せをデータベースに記憶することで関連語辞書を作成する。
特開平08−161343号公報 特開2006−343925号公報
しかしながら、特許文献1、2の発明では、ユーザが文章を入力しなければならない。また、特許文献1の発明では、どの単語が関連語辞書に反映されたのかが明確ではない。さらに、特許文献2の発明では、回答候補の単語の中から選択する必要があり、単語の組合せを入力した場合と同等の手間が掛かる。
本発明は、上記課題を鑑みてなされたものであり、手間を掛けずに関連語辞書を作成する関連語辞書作成方法及び装置、並びに関連語辞書作成プログラムを提供することを目的とする。
上記目的を達成するために、本発明の関連語辞書作成装置は、単語が付された二つ一組のコンテンツが、前記単語とともに入力される入力部と、一方のコンテンツに付された単語、及び他方のコンテンツに付された単語の組合せを記憶する関連語記憶部とを備えている。
請求項2に記載の発明では、単語が前記組合せで過去に何回入力されたかを示す共起頻度を、単語の組合せ毎に記憶する共起頻度記憶部と、前記共起頻度に基づいて、単語同士の関連度合を示す関連スコアを算出するスコア算出部とを備えている。また、前記関連語記憶部は、単語の組合せとともに前記関連スコアを記憶する。
請求項3に記載の発明では、前記スコア算出部は、前記共起頻度をrel_countとし、且つ前記共起頻度記憶部に記憶されている前記共起頻度の中で最高値をMAX(rel_count)として数1の式を用いて関連スコアを算出する。
Figure 2009266065
本発明の関連語辞書作成方法は、単語が付された二つ一組のコンテンツが、前記単語とともに入力される入力ステップと、一方のコンテンツに付された単語、及び他方のコンテンツに付された単語の組合せを記憶する関連語記憶ステップとを備えている。
請求項5に記載の発明では、前記関連語記憶ステップの前に、単語が前記組合せで過去に何回入力されたかを示す共起頻度を、単語の組合せ毎に記憶する共起頻度記憶ステップと、前記共起頻度に基づいて、単語同士の関連度合を示す関連スコアを算出するスコア算出ステップとを備えている。また、前記関連語記憶ステップでは、単語の組合せとともに前記関連スコアを記憶する。
本発明の関連語辞書作成プログラムは、単語同士の関連性を記憶した関連語辞書を作成する関連語辞書作成装置のコンピュータに、単語が付された二つ一組のコンテンツが、前記単語とともに入力される入力ステップと、一方のコンテンツに付された単語、及び他方のコンテンツに付された単語の組合せを記憶する関連語記憶ステップとを実行させるためのものである。
請求項7に記載の発明では、前記関連語記憶ステップの前に、単語が前記組合せで過去に何回入力されたかを示す共起頻度を、単語の組合せ毎に記憶する共起頻度記憶ステップと、前記共起頻度に基づいて、単語同士の関連度合を示す関連スコアを算出するスコア算出ステップとを実行させる。また、前記関連語記憶ステップでは、単語の組合せとともに前記関連スコアを記憶する。
本発明の別の関連語辞書作成装置は、単語が付された二つ一組のコンテンツが、前記単語とともに入力される入力部と、単語の組合せを記憶する関連語記憶部と、一方のコンテンツに付された単語、及び他方のコンテンツに付された単語の組合せを前記関連語記憶部から削除する関連語削除部とを備えている。
本発明の関連語辞書作成方法及び装置、並びに関連語辞書作成プログラムによれば、入力部から入力された二つ一組のコンテンツに付された単語について、一方のコンテンツに付された単語と、他方のコンテンツに付された単語とを関連付けて単語の組合せとして関連語記憶部に記憶するだけなので、手間を掛けずに関連語辞書を作成することができる。
[第1実施形態]
図1において、第1実施形態における関連語辞書作成装置は、関連語辞書作成プログラム37(図3参照)のインストールによってサーバ11に構築される形式で実現される。関連語辞書作成装置は、メタデータ(単語)が付された二つ一組のコンテンツの入力によって、単語同士の関連性を記憶し、関連語辞書を作成する。なお、本実施形態では、画像に付されたメタデータに基づいて作成する場合を例に説明するが、映像、音楽、ゲーム、電子辞書、その他のコンテンツに付されたメタデータに基づいて作成するようにしてもよい。
サーバ11は、インターネット12を媒介して接続されたクライアント端末13とともに、ネットワークシステム14を構成する。クライアント端末13は、例えば周知のパーソナルコンピュータやワークステーションであり、各種操作画面などを表示するモニタ15と、操作信号を出力するマウス16及びキーボード17からなる操作部18とを備えている。
クライアント端末13には、デジタルカメラ19で撮影して得られた画像や、メモリカードやCD−Rなどの記録媒体20に記録された画像が送信され、あるいは、インターネット12を経由して画像が転送される。
デジタルカメラ19は、例えば、IEEE1394、USB(Universal Serial Bus)などに準拠した通信ケーブルや、無線LANなどによりクライアント端末13に接続され、クライアント端末13とのデータの相互通信が可能となっている。また、記録媒体20も同様に、専用のドライバを介してクライアント端末13とのデータの遣り取りが可能となっている。
図2に示すように、クライアント端末13を構成するCPU21は、操作部18から入力される操作信号などに従ってクライアント端末13全体を統括的に制御する。CPU21には、操作部18の他に、データバス22を介して、RAM23、ハードディスクドライブ(HDD)24、通信インターフェース(通信I/F)25、及びモニタ15が接続されている。
RAM23は、CPU21が処理を実行するための作業用メモリである。HDD24には、クライアント端末13を動作させるための各種プログラムやデータが記憶されている他に、デジタルカメラ19、記録媒体20、あるいは、インターネット12から取り込まれた画像データが記憶される。CPU21は、HDD24からプログラムを読み出してRAM23に展開し、読み出したプログラムを逐次処理する。
通信I/F25は、例えばモデムやルータであり、インターネット12に適合した通信プロトコルの制御を行い、インターネット12を経由したデータの遣り取りを媒介する。また、通信I/F25は、デジタルカメラ19や記録媒体20などの外部機器とのデータ通信も行う。
図3に示すように、サーバ11を構成するCPU31は、インターネット12を経由してクライアント端末13から入力される操作信号に従ってサーバ11全体を統括的に制御する。CPU31には、データバス32を介して、RAM33、ハードディスクドライブ(HDD)34、通信インターフェース(通信I/F)35、及びスコア算出部36が接続されている。
RAM33は、CPU31が処理を実行するための作業用メモリである。HDD34には、サーバ11を動作させるための各種プログラムやデータが記憶されている。また、HDD34には、関連語辞書作成プログラム37が記憶されている。CPU31は、HDD34からプログラムを読み出してRAM33に展開し、読み出したプログラムを逐次処理する。
HDD34には、画像データベース(画像DB)38と、関連語辞書データベース(辞書DB)39とが設けられている。画像DB38には、インターネット12を経由して入力された画像のデータとともに、図4に示す画像一覧テーブル41、及び図5に示すメタデータ一覧テーブル42が格納されている。
画像一覧テーブル41は、取込み時に自動的に付けられるID(取込み順に付した通し番号)を見出しとして、画像のファイル名を記憶している。また、メタデータ一覧テーブル42は、IDを見出しとして、画像に付されたメタデータを記憶している。
メタデータには、画像に元々付されたもの、画像を取り込んだ際にファイルシステムなどの外部データベースから取得したもの(画像のタイトル、ジャンル、画像のイメージなど)などがある。例えば、図6に示すID「0003」の画像43には、「桜」、「青空」、「ピンク」、「春」が付されている。また、図7に示すID「0004」の画像44には、「桜」、「菜の花」、「花」が付されている。なお、画像一覧テーブル41とメタデータ一覧テーブル42とを統合して、一つのデータテーブルとしてもよい。
辞書DB39には、図8に示すメタデータ共起頻度テーブル45、及び図9に示す関連語辞書テーブル46が格納されている。
メタデータ共起頻度テーブル45は、メタデータの組合せの種類毎に、その共起頻度を記憶する共起頻度記憶部である。共起頻度とは、二つ一組でサーバ11に入力された画像のそれぞれに付されたメタデータの組合せが、今までにどれだけ存在したかを示す値である。例えば、「桜」が付された画像と「ピンク」が付された画像が二つ一組でサーバ11に入力された回数が今までに3回あった場合、「桜」と「ピンク」の共起頻度は「3」である。
図6に示す画像43と図7に示す画像44が二つ一組でサーバ11に入力された場合、図10に示すように、「桜」と「桜」、「桜」と「菜の花」、「桜」と「花」、「青空」と「桜」、「青空」と「菜の花」、「青空」と「花」、「ピンク」と「桜」、「ピンク」と「菜の花」、「ピンク」と「花」、「春」と「桜」、「春」と「菜の花」、「春」と「花」がそれぞれ共起している。但し、「桜」と「桜」は同一のメタデータであり、形式的に共起しているに過ぎず、除外される。
図8に示すメタデータ共起頻度テーブル45は、図11に示すように、形式的に共起している「桜」と「桜」を除外した残りの組合せ「桜」と「菜の花」、「桜」と「花」、「青空」と「桜」、「青空」と「菜の花」、「青空」と「花」、「ピンク」と「桜」、「ピンク」と「菜の花」、「ピンク」と「花」、「春」と「桜」、「春」と「菜の花」、「春」と「花」の共起頻度がそれぞれ「1」加算される。なお、今までにない組合せについて加算する場合、メタデータ共起頻度テーブル45には、新たな組合せのメタデータの欄が追加されるとともに、その共起頻度に「1」が付与される。
関連語辞書テーブル46は、メタデータの組合せの種類毎にその関連度合を示す関連スコアを記憶する関連語記憶部である。すなわち、関連語辞書テーブル46は、関連語辞書として機能する。画像がサーバ11に入力され、メタデータ共起頻度テーブル45が更新されると、関連語辞書テーブル46は更新される。なお、関連語辞書テーブル46の具体的な更新方法については、後述する。
図3に戻って、通信I/F35は、例えばモデムやルータであり、インターネット12に適合した通信プロトコルの制御を行い、インターネット12を経由したデータの遣り取りを媒介する。通信I/F35は、画像に付されたメタデータなどが入力される入力部として機能する。通信I/F35を媒介して入力されたデータは、RAM33に一時的に記憶される。
スコア算出部36は、二つ一組の画像がサーバ11に入力されると、メタデータ共起頻度テーブル45を参照しながら、メタデータ同士の関連度合を示す関連スコアを算出する。関連スコアRは、例えば、以下の数3の式によって求められる。なお、rel_countは、メタデータの共起頻度である。また、MAX(rel_count)は、メタデータ共起頻度テーブル45に記憶されている中で最高の共起頻度である。
Figure 2009266065
例えば、図11に示す共起頻度テーブル45を参照して「桜」と「ピンク」の関連スコアを求めると、R=80(=4/5×100)となる。
関連スコアが算出されると、その関連語スコアをもって関連語辞書テーブル46は更新される。なお、関連スコアが算出されたメタデータの組合せが新しいものである場合、関連語辞書テーブル46には、新たな組合せのメタデータの欄が追加されるとともに、その関連スコアが記憶される。図11に示す共起頻度テーブル45を参照して関連スコアが算出された場合、関連語辞書テーブル46は、図12に示すように更新される。例えば、「桜」と「ピンク」の関連スコアは「80」となる。
次に、上記構成のサーバ11(図1、図3参照)が関連語辞書作成装置として機能したときの処理手順について、図13のフローチャートを参照しながら説明する。ユーザは、クライアント端末13の操作部18を操作して、サーバ11に二つ一組の画像を入力する。サーバ11に入力された二つ一組の画像は、それに付されたメタデータとともにRAM33に記憶される。
サーバ11に入力された画像は、RAM33から画像DB38に読み出され、画像DB38に記憶される。また、サーバ11に入力された画像に基づいて画像一覧テーブル41(図4参照)が更新される。
一方、サーバ11に入力されたメタデータに基づいて、メタデータ一覧テーブル42(図5参照)、及びメタデータ共起頻度テーブル45(図8→図11)が更新される。
また、サーバ11に入力されたメタデータは、RAM33からスコア算出部36に読み出される。スコア算出部36では、メタデータ共起頻度テーブル45が参照されながら、上記数3の式に基づいて、関連スコアが算出される。算出された関連スコアは、RAM33に記憶される。
スコア算出部36で算出された関連スコアは、RAM33から辞書DB39に読み出される。そして、辞書DB39に読み出された関連スコアをもって関連語辞書テーブル46(図9→図12)が更新される。
以上説明したように、メタデータが付された二つ一組の画像が入力されるだけで、関連語辞書テーブル46が更新される(単語の組合せが追加される)ので、ユーザは手間を掛けずに関連語辞書を作成することができる。また、関連語辞書テーブル46に記憶されていない新たなメタデータ(未知語)についても、メタデータ共起頻度テーブル45に新たに記憶させることができるので、ひいては、関連語辞書テーブル46に未知語を記憶させることができる。
なお、上記第1実施形態では、既にメタデータが記憶されている関連語辞書テーブル46を更新する場合を例に説明したが、何も記憶されていない関連語辞書テーブル46にメタデータを記憶するようにしてもよい。
また、上記第1実施形態では、二つ一組で入力された画像のそれぞれに付されたメタデータの組合せに基づいて、共起頻度を「1」だけ加算したが、メタデータ共起頻度テーブル45の中で最も高くなるように共起頻度を加算するようにしてもよい。例えば、図8に示すメタデータ共起頻度テーブル45に「桜」と「花」の共起頻度を加算する場合、新たな欄が設けられ、さらに、それまでで最高であった「桜」と「菜の花」の共起頻度「4」に「1」を加えた「5」が共起頻度として付与される。ひいては、「桜」と「花」の関連スコアが最高値となる。つまり、最後に入力された二つ一組の画像のそれぞれに付されたメタデータの組合せの関連スコアが最高値となる。このようにすることで、ユーザは、任意のメタデータの組合せの関連スコアを容易に最高値とすることができる。また、話題の単語を含む組合せの関連スコアを急上昇させることができる。
また、上記第1実施形態では、二つ一組で入力された画像のそれぞれに付されたメタデータの組合せに基づいて共起頻度を加算したが、次の第2実施形態で説明するように、共起頻度を減算するようにしてもよい。
[第2実施形態]
図6に示す画像34と図7に示す画像44が二つ一組でサーバ11に入力された場合、図10に示すように、「桜」と「桜」、「桜」と「菜の花」、「桜」と「花」、「青空」と「桜」、「青空」と「菜の花」、「青空」と「花」、「ピンク」と「桜」、「ピンク」と「菜の花」、「ピンク」と「花」、「春」と「桜」、「春」と「菜の花」、「春」と「花」がそれぞれ共起している。但し、「桜」と「桜」は同一のメタデータであり、形式的に共起しているに過ぎず、除外される。
図8に示すメタデータ共起頻度テーブル45は、図14に示すように、形式的に共起している「桜」と「桜」を除外した残りの組合せ「桜」と「菜の花」、「桜」と「花」、「青空」と「桜」、「青空」と「菜の花」、「青空」と「花」、「ピンク」と「桜」、「ピンク」と「菜の花」、「ピンク」と「花」、「春」と「桜」、「春」と「菜の花」、「春」と「花」の共起頻度がそれぞれ「1」減算される。なお、メタデータ共起頻度テーブル45に元々ない組合せについては無視される。また、「1」減算されたことで共起頻度が「0」となった場合、そのメタデータの欄は削除される。
スコア算出部36は、二つ一組の画像がサーバ11に入力されると、関連スコアを算出する。例えば、図14に示す共起頻度テーブル45を参照して「桜」と「ピンク」の関連スコアを求めると、R=66.667(≒2/3×100)となる。図14に示す共起頻度テーブル45を参照して関連スコアが算出された場合、関連語辞書テーブル46は、図15に示すように更新される。例えば、「桜」と「ピンク」の関連スコアは「66.667」となる。
以上説明したように、メタデータが付された二つ一組の画像が入力されるだけで、関連語辞書テーブル46が更新される(単語の組合せが削除される)ので、ユーザは手間を掛けずに関連語辞書を作成することができる。なお、上記第1実施形態と同様の構成、処理手順、及び効果については、その説明を省略する。
なお、上記第2実施形態では、二つ一組で入力された画像のそれぞれに付されたメタデータの組合せに基づいて、共起頻度を「1」だけ減算したが、メタデータ共起頻度テーブル45から削除されるように共起頻度を「0」まで減算するようにしてもよい。例えば、図8に示すメタデータ共起頻度テーブル45から「かわいい」と「菜の花」の共起頻度を減算する場合、「かわいい」と「菜の花」の共起頻度は「0」まで減算され、さらに、そのメタデータの欄は削除される。ひいては、関連語辞書テーブル46から「かわいい」と「菜の花」の組合せが削除される。このようにすることで、ユーザは、任意のメタデータの組合せを、関連語辞書テーブル46から容易に削除することができる。すなわち、一時の流行語で死語となった単語を含む組合せを関連語辞書テーブル46から削除することが容易である。
また、上記各実施形態を組み合わせ、二つ一組の画像を入力するだけで、単語の組合せを追加したり削除したりすることができるようにしてもよい。
また、上記各実施形態では、スコア算出部36は、上記数3の式に基づいて関連スコアを算出したが、共起頻度(rel_count)が大きいほど関連スコアが大きくなる増加関数であれば、これに限定されるものではない。
また、上記各実施形態では、二つ一組の画像をユーザが入力する場合を例に説明したが、サーバ11が自動的に二つ一組の画像を取得するようにしてもよい。
また、上記各実施形態では、インターネット12に接続されたサーバ11に関連語辞書作成装置が構築され、万人がアクセス可能な関連語辞書を作成する場合を例に説明したが、これに限定されるものではない。例えば、個人が使用するパーソナルコンピュータに関連語辞書作成装置が構築され、当該パーソナルコンピュータに関連語辞書を作成するようにしてもよい。この場合、メモリカードが記憶した情報を読み込むカードリーダなどが、当該コンテンツに付されたメタデータ(単語)が入力される入力部として機能する。
また、上記各実施形態で示した関連語辞書作成装置は一例にすぎず、本発明の趣旨を逸脱しなければ、如何様な態様にも適宜変更することができる。
ネットワークシステムの構成を示す概略図である。 クライアント端末の内部構成を示すブロック図である。 サーバの内部構成を示すブロック図である。 画像一覧テーブルの構成を示す説明図である。 メタデータ一覧テーブルの構成を示す説明図である。 「桜」、「青空」、「ピンク」及び「春」が付された画像図である。 「桜」、「菜の花」及び「花」が付された画像図である。 メタデータ共起頻度テーブルの構成を示す説明図である。 関連語辞書テーブルの構成を示す説明図である。 共起するメタデータの組合せを説明する図である。 メタデータ共起頻度テーブルの構成を示す説明図である。 関連語辞書テーブルの構成を示す説明図である。 関連語辞書作成の処理手順を説明するフローチャートである。 メタデータ共起頻度テーブルの構成を示す説明図である。 関連語辞書テーブルの構成を示す説明図である。
符号の説明
11 サーバ(関連語辞書作成装置)
35 通信インターフェース(通信I/F、入力部)
36 スコア算出部
37 プログラム
45 メタデータ共起頻度テーブル(共起頻度記憶部)
46 関連語辞書テーブル(関連語記憶部)

Claims (8)

  1. 単語が付された二つ一組のコンテンツが、前記単語とともに入力される入力部と、
    一方のコンテンツに付された単語、及び他方のコンテンツに付された単語の組合せを記憶する関連語記憶部とを備えたことを特徴とする関連語辞書作成装置。
  2. 単語が前記組合せで過去に何回入力されたかを示す共起頻度を、単語の組合せ毎に記憶する共起頻度記憶部と、
    前記共起頻度に基づいて、単語同士の関連度合を示す関連スコアを算出するスコア算出部とを備え、
    前記関連語記憶部は、単語の組合せとともに前記関連スコアを記憶することを特徴とする請求項1に記載の関連語辞書作成装置。
  3. 前記スコア算出部は、前記共起頻度をrel_countとし、且つ前記共起頻度記憶部に記憶されている前記共起頻度の中で最高値をMAX(rel_count)として数1の式を用いて関連スコアを算出することを特徴とする請求項2に記載の関連語辞書作成装置。
    Figure 2009266065
  4. 単語が付された二つ一組のコンテンツが、前記単語とともに入力される入力ステップと、
    一方のコンテンツに付された単語、及び他方のコンテンツに付された単語の組合せを記憶する関連語記憶ステップとを備えたことを特徴とする関連語辞書作成方法。
  5. 前記関連語記憶ステップの前に、
    単語が前記組合せで過去に何回入力されたかを示す共起頻度を、単語の組合せ毎に記憶する共起頻度記憶ステップと、
    前記共起頻度に基づいて、単語同士の関連度合を示す関連スコアを算出するスコア算出ステップとを備え、
    前記関連語記憶ステップでは、単語の組合せとともに前記関連スコアを記憶することを特徴とする請求項4に記載の関連語辞書作成方法。
  6. 単語同士の関連性を記憶した関連語辞書を作成する関連語辞書作成装置のコンピュータに、
    単語が付された二つ一組のコンテンツが、前記単語とともに入力される入力ステップと、
    一方のコンテンツに付された単語、及び他方のコンテンツに付された単語の組合せを記憶する関連語記憶ステップとを実行させるための関連語辞書作成プログラム。
  7. 前記関連語記憶ステップの前に、
    単語が前記組合せで過去に何回入力されたかを示す共起頻度を、単語の組合せ毎に記憶する共起頻度記憶ステップと、
    前記共起頻度に基づいて、単語同士の関連度合を示す関連スコアを算出するスコア算出ステップとを実行させ、
    前記関連語記憶ステップでは、単語の組合せとともに前記関連スコアを記憶することを特徴とする請求項6に記載の関連語辞書作成プログラム。
  8. 単語が付された二つ一組のコンテンツが、前記単語とともに入力される入力部と、
    単語の組合せを記憶する関連語記憶部と、
    一方のコンテンツに付された単語、及び他方のコンテンツに付された単語の組合せを前記関連語記憶部から削除する関連語削除部とを備えたことを特徴とする関連語辞書作成装置。
JP2008116844A 2008-04-28 2008-04-28 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム Pending JP2009266065A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008116844A JP2009266065A (ja) 2008-04-28 2008-04-28 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008116844A JP2009266065A (ja) 2008-04-28 2008-04-28 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム

Publications (1)

Publication Number Publication Date
JP2009266065A true JP2009266065A (ja) 2009-11-12

Family

ID=41391817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008116844A Pending JP2009266065A (ja) 2008-04-28 2008-04-28 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム

Country Status (1)

Country Link
JP (1) JP2009266065A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011128737A (ja) * 2009-12-16 2011-06-30 Nifty Corp 辞書生成処理方法、プログラム及び装置
JP2020065108A (ja) * 2018-10-15 2020-04-23 日本電信電話株式会社 映像管理装置、映像管理方法及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011128737A (ja) * 2009-12-16 2011-06-30 Nifty Corp 辞書生成処理方法、プログラム及び装置
JP2020065108A (ja) * 2018-10-15 2020-04-23 日本電信電話株式会社 映像管理装置、映像管理方法及びプログラム
WO2020080095A1 (ja) * 2018-10-15 2020-04-23 日本電信電話株式会社 映像管理装置、映像管理方法及びプログラム
JP7119881B2 (ja) 2018-10-15 2022-08-17 日本電信電話株式会社 映像管理装置、映像管理方法及びプログラム

Similar Documents

Publication Publication Date Title
US11256848B2 (en) Automated augmentation of text, web and physical environments using multimedia content
US9659278B2 (en) Methods, systems, and computer program products for displaying tag words for selection by users engaged in social tagging of content
KR101088983B1 (ko) 데이터 탐색 시스템 및 방법과, 데이터 탐색 방법을수행하는 장치
JP2008192055A (ja) コンテンツ検索方法、およびコンテンツ検索装置
JP2010073114A6 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
JP2010073114A (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
JP2015156099A (ja) 会議支援装置、会議支援装置の制御方法、及びプログラム
JP2005242669A (ja) 構造化文書表示処理装置、構造化文書表示方法、構造化文書表示プログラム
CN112860642A (zh) 一种庭审数据处理方法、服务器及终端
US11745093B2 (en) Developing implicit metadata for data stores
JP2008191936A (ja) コンテンツ登録・検索システムの構築支援方法、およびコンテンツ登録・検索システムの構築支援装置
JP2009266065A (ja) 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム
JP5153390B2 (ja) 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム
JP2010086075A (ja) 検索装置、情報処理装置、検索方法、プログラム及び記録媒体
JP2009217741A (ja) メタデータ付与方法及び装置、並びにメタデータ付与プログラム
JP2007233752A (ja) 検索装置、コンピュータプログラム及び記録媒体
JP5861747B2 (ja) 情報処理装置、情報処理システム、制御方法、及びプログラム
US20090234819A1 (en) Metadata assigning device, metadata assigning method, and metadata assigning program
JP2010250400A (ja) タグ付け方法及び装置、並びにタグ付けプログラム
JP2002132825A (ja) 画像検索システム、画像検索方法、画像検索プログラム、画像検索プログラムを記録したコンピュータ読み取り可能な記憶媒体、および画像検索装置
KR20090049433A (ko) 색상 키워드를 이용한 검색 방법 및 시스템
JP2007041864A (ja) メタデータ取得・管理方法及び装置及びプログラム
JP6905724B1 (ja) 情報提供システム及び情報提供方法
JP2008234226A (ja) 検索装置および検索方法
JP2011054006A (ja) 画像のキーワード決定システム