JP5153390B2 - 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム - Google Patents
関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム Download PDFInfo
- Publication number
- JP5153390B2 JP5153390B2 JP2008058196A JP2008058196A JP5153390B2 JP 5153390 B2 JP5153390 B2 JP 5153390B2 JP 2008058196 A JP2008058196 A JP 2008058196A JP 2008058196 A JP2008058196 A JP 2008058196A JP 5153390 B2 JP5153390 B2 JP 5153390B2
- Authority
- JP
- Japan
- Prior art keywords
- score
- words
- storage unit
- word
- rank
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1において、第1実施形態における関連語辞書作成装置は、関連語辞書作成プログラム37(図3参照)のインストールによってサーバ11に構築される形式で実現される。関連語辞書作成装置は、メタデータ(単語)が複数付された画像の入力によって、単語同士の関連性を記憶し、関連語辞書を作成する。なお、本実施形態では、画像に付されたメタデータに基づいて作成する場合を例に説明するが、映像、音楽、ゲーム、電子書籍、その他のコンテンツに付されたメタデータに基づいて作成するようにしてもよい。
図11において、第2実施形態における関連語辞書作成装置は、関連語辞書作成プログラム51のインストールによってサーバ52に構築される形式で実現される。関連語辞書作成装置は、複数の単語からなるテキストデータが入力されることによって、単語同士の関連性を記憶し、関連語辞書を作成する。
31 CPU(共起頻度取得部)
35 通信インターフェース(通信I/F、入力部)
36 スコア算出部(相互情報量算出部)
37、51 関連語辞書作成プログラム
42、55 メタデータ一覧テーブル(単語記憶部)
43 画像(コンテンツ)
46 関連語辞書テーブル(関連語記憶部)
53 単語抽出部
55 単語一覧テーブル(単語記憶部)
Claims (4)
- 単語同士の関連性を記憶した関連語辞書を作成する関連語辞書作成装置において、
複数の単語がメタデータとして付されたコンテンツの前記複数の単語がメタデータのセットとして入力される入力部と、
前記単語をメタデータのセット毎に記憶する単語記憶部と、
メタデータのセットで入力された複数の単語について、2つの単語毎に、その2つの単語を含むメタデータのセットが前記単語記憶部にどれだけ存在するかを示す共起頻度rel_count(X,Y)を取得する共起頻度取得部と、
前記共起頻度rel_count(X,Y)と、前記単語記憶部に記憶されている単語の種類数Sと、前記2つの単語の一方が前記単語記憶部に記憶されている個数num_count(X)と、前記2つの単語の他方が前記単語記憶部に記憶されている個数num_count(Y)を用い、数1の式にしたがって、前記2つの単語の相互依存の尺度を示す相互情報量I(X,Y)を算出する相互情報量算出部と、
前記2つの単語の一方と前記単語記憶部に記憶されている各単語との共起頻度の中で最高値MAX(rel_count(X,*))を用い、数2の式にしたがって共起頻度スコアREL_SCORE(X,Y)を算出し、前記共起頻度スコアREL_SCORE(X,Y)と、前記2つの単語の前記共起頻度が、その単語の一方と前記単語記憶部に記憶されている各単語との共起頻度の中で何番目に高いかを示す順位rank(X,Y)と、前記順位rank(X,Y)と前記2つの単語の一方と共起する単語が前記単語記憶部に何種類記憶されているかを示す値MAX(rank(X,*))とを用い、数3の式にしたがって順位スコアRANK_SCORE(X,Y)を算出し、前記共起頻度スコアREL_SCORE(X,Y)と前記順位スコアRANK_SCORE(X,Y)との相加平均値AVERAGE_SCORE(X,Y)と、前記相互情報量I(X,Y)を用い、数4の式にしたがって前記2つの単語の関連度合を示す関連スコアMUTUAL_SCORE(X,Y)を算出するスコア算出部と、
前記関連スコアMUTUAL_SCORE(X,Y)を記憶するとともに、その関連スコアMUTUAL_SCORE(X,Y)によって関連度合が示された単語の組合せを記憶する関連語記憶部と、
を備えたことを特徴とする関連語辞書作成装置。
- 単語同士の関連性を記憶した関連語辞書を作成する関連語辞書作成方法において、
複数の単語がメタデータとして付されたコンテンツの前記複数の単語がメタデータのセットとして入力される入力ステップと、
前記単語をメタデータのセット毎に単語記憶部に記憶する単語記憶ステップと、
メタデータのセットで入力された複数の単語について、2つの単語毎に、その2つの単語を含むメタデータのセットが前記単語記憶部にどれだけ存在するかを示す共起頻度rel_count(X,Y)を取得する共起頻度取得ステップと、
前記共起頻度rel_count(X,Y)と、前記単語記憶部に記憶されている単語の種類数Sと、前記2つの単語の一方が前記単語記憶部に記憶されている個数num_count(X)と、前記2つの単語の他方が前記単語記憶部に記憶されている個数num_count(Y)を用い、数5の式にしたがって、前記2つの単語の相互依存の尺度を示す相互情報量I(X,Y)を算出する相互情報量算出ステップと、
前記2つの単語の一方と前記単語記憶部に記憶されている各単語との共起頻度の中で最高値MAX(rel_count(X,*))を用い、数6の式にしたがって共起頻度スコアREL_SCORE(X,Y)を算出する共起頻度スコア算出ステップと、
前記共起頻度スコアREL_SCORE(X,Y)と、前記2つの単語の前記共起頻度が、その単語の一方と前記単語記憶部に記憶されている各単語との共起頻度の中で何番目に高いかを示す順位rank(X,Y)と、前記順位rank(X,Y)と前記2つの単語の一方と共起する単語が前記単語記憶部に何種類記憶されているかを示す値MAX(rank(X,*))とを用い、数7の式にしたがって順位スコアRANK_SCORE(X,Y)を算出する順位スコア算出ステップと、
前記共起頻度スコアREL_SCORE(X,Y)と前記順位スコアRANK_SCORE(X,Y)との相加平均値AVERAGE_SCORE(X,Y)と、前記相互情報量I(X,Y)を用い、数8の式にしたがって前記2つの単語の関連度合を示す関連スコアMUTUAL_SCORE(X,Y)を算出するスコア算出ステップと、
前記関連スコアMUTUAL_SCORE(X,Y)を関連語記憶部に記憶するとともに、その関連スコアMUTUAL_SCORE(X,Y)によって関連度合が示された単語の組合せを前記関連語記憶部に記憶する関連語記憶ステップと、
を、を関連語辞書作成装置が行うことを特徴とする関連語辞書作成方法。
- 単語同士の関連性を記憶した関連語辞書を作成する関連語辞書作成装置のコンピュータに、
複数の単語がメタデータとして付されたコンテンツの前記複数の単語がメタデータのセットとして入力される入力ステップと、
前記単語をメタデータのセット毎に単語記憶部に記憶する単語記憶ステップと、
メタデータのセットで入力された複数の単語について、2つの単語毎に、その2つの単語を含むメタデータのセットが前記単語記憶部にどれだけ存在するかを示す共起頻度rel_count(X,Y)を取得する共起頻度取得ステップと、
前記共起頻度rel_count(X,Y)と、前記単語記憶部に記憶されている単語の種類数Sと、前記2つの単語の一方が前記単語記憶部に記憶されている個数num_count(X)と、前記2つの単語の他方が前記単語記憶部に記憶されている個数num_count(Y)を用い、数9の式にしたがって、前記2つの単語の相互依存の尺度を示す相互情報量I(X,Y)を算出する相互情報量算出ステップと、
前記2つの単語の一方と前記単語記憶部に記憶されている各単語との共起頻度の中で最高値MAX(rel_count(X,*))を用い、数10の式にしたがって共起頻度スコアREL_SCORE(X,Y)を算出する共起頻度スコア算出ステップと、
前記共起頻度スコアREL_SCORE(X,Y)と、前記2つの単語の前記共起頻度が、その単語の一方と前記単語記憶部に記憶されている各単語との共起頻度の中で何番目に高いかを示す順位rank(X,Y)と、前記順位rank(X,Y)と前記2つの単語の一方と共起する単語が前記単語記憶部に何種類記憶されているかを示す値MAX(rank(X,*))とを用い、数11の式にしたがって順位スコアRANK_SCORE(X,Y)を算出する順位スコア算出ステップと、
前記共起頻度スコアREL_SCORE(X,Y)と前記順位スコアRANK_SCORE(X,Y)との相加平均値AVERAGE_SCORE(X,Y)と、前記相互情報量I(X,Y)を用い、数12の式にしたがって前記2つの単語の関連度合を示す関連スコアMUTUAL_SCORE(X,Y)を算出するスコア算出ステップと、
前記関連スコアMUTUAL_SCORE(X,Y)を関連語記憶部に記憶するとともに、その関連スコアMUTUAL_SCORE(X,Y)によって関連度合が示された単語の組合せを前記関連語記憶部に記憶する関連語記憶ステップと、
を実行させるための関連語辞書作成プログラム。
- 単語同士の関連性を記憶した関連語辞書を作成する関連語辞書作成装置において、
複数の単語から構成されるテキストデータが入力される入力部と、
前記テキストデータから単語を抽出する単語抽出部と、
抽出元のテキストデータが同一である単語をセットとして記憶する単語記憶部と、
入力されたテキストデータから抽出された複数の単語について、2つの単語毎に、その2つの単語を含む前記セットが前記単語記憶部にどれだけ存在するかを示す共起頻度rel_count(X,Y)を取得する共起頻度取得部と、
前記共起頻度rel_count(X,Y)と、前記単語記憶部に記憶されている単語の種類数Sと、前記2つの単語の一方が前記単語記憶部に記憶されている個数num_count(X)と、前記2つの単語の他方が前記単語記憶部に記憶されている個数num_count(Y)を用い、数13の式にしたがって、前記2つの単語の相互依存の尺度を示す相互情報量I(X,Y)を算出する相互情報量算出部と、
前記2つの単語の一方と前記単語記憶部に記憶されている各単語との共起頻度の中で最高値MAX(rel_count(X,*))を用い、数14の式にしたがって共起頻度スコアREL_SCORE(X,Y)を算出し、前記共起頻度スコアREL_SCORE(X,Y)と、前記2つの単語の前記共起頻度が、その単語の一方と前記単語記憶部に記憶されている各単語との共起頻度の中で何番目に高いかを示す順位rank(X,Y)と、前記順位rank(X,Y)と前記2つの単語の一方と共起する単語が前記単語記憶部に何種類記憶されているかを示す値MAX(rank(X,*))とを用い、数15の式にしたがって順位スコアRANK_SCORE(X,Y)を算出し、前記共起頻度スコアREL_SCORE(X,Y)と前記順位スコアRANK_SCORE(X,Y)との相加平均値AVERAGE_SCORE(X,Y)と、前記相互情報量I(X,Y)を用い、数16の式にしたがって前記2つの単語の関連度合を示す関連スコアMUTUAL_SCORE(X,Y)を算出するスコア算出部と、
前記関連スコアMUTUAL_SCORE(X,Y)を記憶するとともに、その関連スコアMUTUAL_SCORE(X,Y)によって関連度合が示された単語の組合せを記憶する関連語記憶部と、
を備えたことを特徴とする関連語辞書作成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008058196A JP5153390B2 (ja) | 2008-03-07 | 2008-03-07 | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008058196A JP5153390B2 (ja) | 2008-03-07 | 2008-03-07 | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009217367A JP2009217367A (ja) | 2009-09-24 |
JP5153390B2 true JP5153390B2 (ja) | 2013-02-27 |
Family
ID=41189180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008058196A Expired - Fee Related JP5153390B2 (ja) | 2008-03-07 | 2008-03-07 | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5153390B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5094891B2 (ja) * | 2010-01-28 | 2012-12-12 | ヤフー株式会社 | 検索スコア算出装置 |
JP5234836B2 (ja) * | 2010-04-19 | 2013-07-10 | 日本電信電話株式会社 | コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002245070A (ja) * | 2001-02-20 | 2002-08-30 | Hitachi Ltd | データ表示方法及び装置並びにその処理プログラムを記憶した媒体 |
JP4239505B2 (ja) * | 2002-07-31 | 2009-03-18 | 日本電気株式会社 | 翻訳装置と翻訳方法ならびにプログラムと記録媒体 |
JP4348603B2 (ja) * | 2003-05-27 | 2009-10-21 | ソニー株式会社 | 情報検索システムおよび方法、情報処理装置および方法、プログラム、並びに記録媒体 |
-
2008
- 2008-03-07 JP JP2008058196A patent/JP5153390B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009217367A (ja) | 2009-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20110078176A1 (en) | Image search apparatus and method | |
US20080215550A1 (en) | Search support apparatus, computer program product, and search support system | |
US7606797B2 (en) | Reverse value attribute extraction | |
US20080215548A1 (en) | Information search method and system | |
JP5494126B2 (ja) | 文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム | |
JP4049317B2 (ja) | 検索支援装置およびプログラム | |
US9542474B2 (en) | Forensic system, forensic method, and forensic program | |
JP5204244B2 (ja) | 誤訳の検出を支援する装置及び方法 | |
JP5687312B2 (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
CN110209780B (zh) | 一种问题模板生成方法、装置、服务器及存储介质 | |
CN114141384A (zh) | 用于检索医学数据的方法、设备和介质 | |
US20150339786A1 (en) | Forensic system, forensic method, and forensic program | |
JP3583631B2 (ja) | 情報マイニング方法、情報マイニング装置、および情報マイニングプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2009199302A (ja) | ドキュメントを解析するためのプログラム,装置および方法 | |
JP5153390B2 (ja) | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム | |
JP2009217741A (ja) | メタデータ付与方法及び装置、並びにメタデータ付与プログラム | |
JP2005122665A (ja) | 電子機器装置、関連語データベースの更新方法、プログラム | |
US20090234819A1 (en) | Metadata assigning device, metadata assigning method, and metadata assigning program | |
TW201822031A (zh) | 以文字資訊建立圖表索引方法及其電腦程式產品 | |
JP2009266065A (ja) | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム | |
JP4484957B1 (ja) | 検索式生成装置、検索式生成方法、およびプログラム | |
CN112257408A (zh) | 一种文本对比的方法及相关装置 | |
JP2013210834A (ja) | 特許調査支援装置、特許調査支援方法、およびプログラム | |
WO2022009354A1 (ja) | 発明評価装置、発明評価方法、および発明評価プログラム | |
JP2010113511A (ja) | 感性情報抽出・検索装置、その方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100713 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120530 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120822 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121204 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |