JP2009217367A - 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム - Google Patents
関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム Download PDFInfo
- Publication number
- JP2009217367A JP2009217367A JP2008058196A JP2008058196A JP2009217367A JP 2009217367 A JP2009217367 A JP 2009217367A JP 2008058196 A JP2008058196 A JP 2008058196A JP 2008058196 A JP2008058196 A JP 2008058196A JP 2009217367 A JP2009217367 A JP 2009217367A
- Authority
- JP
- Japan
- Prior art keywords
- words
- metadata
- score
- word
- occurrence frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】画像に付されたメタデータのセットとして入力された複数の単語を、セット毎にメタデータ一覧テーブルに記憶する。メタデータ一覧テーブルに記憶された単語の種類毎にその出現頻度をメタデータ出現頻度テーブルに記憶する。メタデータのセットとして入力された複数の単語について、2つの単語毎に、その2つの単語を含むメタデータのセットがメタデータ一覧テーブルにどれだけ存在するかを示す共起頻度を取得し、メタデータ共起頻度テーブルに記憶する。スコア算出部は、メタデータ出現頻度テーブル及びメタデータ共起頻度テーブルを参照しながら、単語同士の相互情報量を算出し、さらに、メタデータ共起頻度テーブルを参照しながら、単語同士の関連スコアを算出する。スコア算出部で算出された関連スコアをもって関連語辞書テーブルを更新する。
【選択図】図10
Description
図1において、第1実施形態における関連語辞書作成装置は、関連語辞書作成プログラム37(図3参照)のインストールによってサーバ11に構築される形式で実現される。関連語辞書作成装置は、メタデータ(単語)が複数付された画像の入力によって、単語同士の関連性を記憶し、関連語辞書を作成する。なお、本実施形態では、画像に付されたメタデータに基づいて作成する場合を例に説明するが、映像、音楽、ゲーム、電子書籍、その他のコンテンツに付されたメタデータに基づいて作成するようにしてもよい。
図11において、第2実施形態における関連語辞書作成装置は、関連語辞書作成プログラム51のインストールによってサーバ52に構築される形式で実現される。関連語辞書作成装置は、複数の単語からなるテキストデータが入力されることによって、単語同士の関連性を記憶し、関連語辞書を作成する。
31 CPU(共起頻度取得部)
35 通信インターフェース(通信I/F、入力部)
36 スコア算出部(相互情報量算出部)
37、51 関連語辞書作成プログラム
42、55 メタデータ一覧テーブル(単語記憶部)
43 画像(コンテンツ)
46 関連語辞書テーブル(関連語記憶部)
53 単語抽出部
55 単語一覧テーブル(単語記憶部)
Claims (8)
- 単語同士の関連性を記憶した関連語辞書を作成する関連語辞書作成装置において、
複数の単語がメタデータとして付されたコンテンツの前記複数の単語がメタデータのセットとして入力される入力部と、
前記単語をメタデータのセット毎に記憶する単語記憶部と、
メタデータのセットで入力された複数の単語について、2つの単語毎に、その2つの単語を含むメタデータのセットが前記単語記憶部にどれだけ存在するかを示す共起頻度を取得する共起頻度取得部と、
前記共起頻度に基づいて、前記2つの単語の相互依存の尺度を示す相互情報量を算出する相互情報量算出部と、
前記共起頻度及び前記相互情報量に基づいて、前記2つの単語の関連度合を示す関連スコアを算出するスコア算出部と、
前記関連スコアを記憶するとともに、その関連スコアによって関連度合が示された単語の組合せを記憶する関連語記憶部とを備えたことを特徴とする関連語辞書作成装置。 - 前記スコア算出部は、前記2つの単語の前記共起頻度が、その単語の一方と前記単語記憶部に記憶されている各単語との共起頻度の中で何番目に高いかを示す順位を取得し、その順位に基づいて、前記関連スコアを算出することを特徴とする請求項1記載の関連語辞書作成装置。
- 前記スコア算出部は、
前記2つの単語の一方と前記単語記憶部に記憶されている各単語との共起頻度の中で最高値をMAX(rel_count(X,*))として数2の式を用いて共起頻度スコアを算出し、
前記2つの単語の前記順位をrank(X,Y)とし、且つ、前記2つの単語の一方と共起する単語が前記単語記憶部に何種類記憶されているかを示す値をMAX(rank(X,*))として数3の式を用いて順位スコアを算出し、
前記共起頻度スコアと前記順位スコアとの相加平均値をAVERAGE_SCORE(X,Y)とし、且つ、前記相互情報量をI(X,Y)として数4の式を用いて前記関連スコアを算出することを特徴とする請求項3記載の関連語辞書作成装置。
- 単語同士の関連性を記憶した関連語辞書を作成する関連語辞書作成方法において、
複数の単語がメタデータとして付されたコンテンツの前記複数の単語がメタデータのセットとして入力される入力ステップと、
前記単語をメタデータのセット毎に単語記憶部に記憶する単語記憶ステップと、
メタデータのセットで入力された複数の単語について、2つの単語毎に、その2つの単語を含むメタデータのセットが前記単語記憶部にどれだけ存在するかを示す共起頻度を取得する共起頻度取得ステップと、
前記共起頻度に基づいて、前記2つの単語の相互依存の尺度を示す相互情報量を算出する相互情報量算出ステップと、
前記共起頻度及び前記相互情報量に基づいて、前記2つの単語の関連度合を示す関連スコアを算出するスコア算出ステップと、
前記関連スコアを関連語記憶部に記憶するとともに、その関連スコアによって関連度合が示された単語の組合せを前記関連語記憶部に記憶する関連語記憶ステップとを備えたことを特徴とする関連語辞書作成方法。 - 単語同士の関連性を記憶した関連語辞書を作成する関連語辞書作成装置のコンピュータに、
複数の単語がメタデータとして付されたコンテンツの前記複数の単語がメタデータのセットとして入力される入力ステップと、
前記単語をメタデータのセット毎に単語記憶部に記憶する単語記憶ステップと、
メタデータのセットで入力された複数の単語について、2つの単語毎に、その2つの単語を含むメタデータのセットが前記単語記憶部にどれだけ存在するかを示す共起頻度を取得する共起頻度取得ステップと、
前記共起頻度に基づいて、前記2つの単語の相互依存の尺度を示す相互情報量を算出する相互情報量算出ステップと、
前記共起頻度及び前記相互情報量に基づいて、前記2つの単語の関連度合を示す関連スコアを算出するスコア算出ステップと、
前記関連スコアを関連語記憶部に記憶するとともに、その関連スコアによって関連度合が示された単語の組合せを前記関連語記憶部に記憶する関連語記憶ステップとを実行させるための関連語辞書作成プログラム。 - 単語同士の関連性を記憶した関連語辞書を作成する関連語辞書作成装置において、
複数の単語から構成されるテキストデータが入力される入力部と、
前記テキストデータから単語を抽出する単語抽出部と、
抽出元のテキストデータが同一である単語をセットとして記憶する単語記憶部と、
入力されたテキストデータから抽出された複数の単語について、2つの単語毎に、その2つの単語を含む前記セットが前記単語記憶部にどれだけ存在するかを示す共起頻度を取得する共起頻度取得部と、
前記共起頻度に基づいて、前記2つの単語の相互依存の尺度を示す相互情報量を算出する相互情報量算出部と、
前記共起頻度及び前記相互情報量に基づいて、前記2つの単語の関連度合を示す関連スコアを算出するスコア算出部と、
前記関連スコアを記憶するとともに、その関連スコアによって関連度合が示された単語の組合せを記憶する関連語記憶部とを備えたことを特徴とする関連語辞書作成装置。 - 前記スコア算出部は、前記2つの単語の前記共起頻度が、その単語の一方と前記単語記憶部に記憶されている各単語との共起頻度の中で何番目に高いかを示す順位を取得し、その順位に基づいて、前記関連スコアを算出することを特徴とする請求項7記載の関連語辞書作成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008058196A JP5153390B2 (ja) | 2008-03-07 | 2008-03-07 | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008058196A JP5153390B2 (ja) | 2008-03-07 | 2008-03-07 | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009217367A true JP2009217367A (ja) | 2009-09-24 |
JP5153390B2 JP5153390B2 (ja) | 2013-02-27 |
Family
ID=41189180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008058196A Expired - Fee Related JP5153390B2 (ja) | 2008-03-07 | 2008-03-07 | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5153390B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011154638A (ja) * | 2010-01-28 | 2011-08-11 | Yahoo Japan Corp | 検索スコア算出装置 |
JP2011227633A (ja) * | 2010-04-19 | 2011-11-10 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002245070A (ja) * | 2001-02-20 | 2002-08-30 | Hitachi Ltd | データ表示方法及び装置並びにその処理プログラムを記憶した媒体 |
JP2004062726A (ja) * | 2002-07-31 | 2004-02-26 | Nec Corp | 翻訳装置と翻訳方法ならびにプログラムと記録媒体 |
JP2004356691A (ja) * | 2003-05-27 | 2004-12-16 | Sony Corp | 情報検索システムおよび方法、情報処理装置および方法、プログラム、並びに記録媒体 |
-
2008
- 2008-03-07 JP JP2008058196A patent/JP5153390B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002245070A (ja) * | 2001-02-20 | 2002-08-30 | Hitachi Ltd | データ表示方法及び装置並びにその処理プログラムを記憶した媒体 |
JP2004062726A (ja) * | 2002-07-31 | 2004-02-26 | Nec Corp | 翻訳装置と翻訳方法ならびにプログラムと記録媒体 |
JP2004356691A (ja) * | 2003-05-27 | 2004-12-16 | Sony Corp | 情報検索システムおよび方法、情報処理装置および方法、プログラム、並びに記録媒体 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011154638A (ja) * | 2010-01-28 | 2011-08-11 | Yahoo Japan Corp | 検索スコア算出装置 |
JP2011227633A (ja) * | 2010-04-19 | 2011-11-10 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5153390B2 (ja) | 2013-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20110078176A1 (en) | Image search apparatus and method | |
US20080215548A1 (en) | Information search method and system | |
US20060190684A1 (en) | Reverse value attribute extraction | |
JP4049317B2 (ja) | 検索支援装置およびプログラム | |
US9542474B2 (en) | Forensic system, forensic method, and forensic program | |
JP5204244B2 (ja) | 誤訳の検出を支援する装置及び方法 | |
CN116168793A (zh) | 体检数据的处理分析方法及相关设备 | |
JP2009025968A (ja) | 関連語辞書作成装置、方法、及びプログラム、並びにコンテンツ検索装置 | |
JP5687312B2 (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
JP2008268985A (ja) | タグを付与する方法 | |
KR20110035001A (ko) | 키워드 시각화 장치 및 그 방법 | |
JP2009199302A (ja) | ドキュメントを解析するためのプログラム,装置および方法 | |
JP2008191936A (ja) | コンテンツ登録・検索システムの構築支援方法、およびコンテンツ登録・検索システムの構築支援装置 | |
JP5153390B2 (ja) | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム | |
JP2009217741A (ja) | メタデータ付与方法及び装置、並びにメタデータ付与プログラム | |
TW201822031A (zh) | 以文字資訊建立圖表索引方法及其電腦程式產品 | |
JP2009266065A (ja) | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム | |
JP2009217742A (ja) | メタデータ付与方法及び装置、並びにメタデータ付与プログラム | |
JP6034584B2 (ja) | 特許調査支援装置、特許調査支援方法、およびプログラム | |
JP4484957B1 (ja) | 検索式生成装置、検索式生成方法、およびプログラム | |
JP2020021455A (ja) | 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム | |
JP5856905B2 (ja) | 主題抽出装置およびそのプログラム | |
JP2005258910A (ja) | 階層キーワード抽出装置、方法、およびプログラム | |
WO2022009354A1 (ja) | 発明評価装置、発明評価方法、および発明評価プログラム | |
JP6457153B2 (ja) | キーワード抽出システム、キーワード抽出方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100713 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120530 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120822 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121204 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |