JPH11312168A - 同義語計算装置及びその方法並びに同義語計算プログラムを記録した媒体 - Google Patents

同義語計算装置及びその方法並びに同義語計算プログラムを記録した媒体

Info

Publication number
JPH11312168A
JPH11312168A JP10118579A JP11857998A JPH11312168A JP H11312168 A JPH11312168 A JP H11312168A JP 10118579 A JP10118579 A JP 10118579A JP 11857998 A JP11857998 A JP 11857998A JP H11312168 A JPH11312168 A JP H11312168A
Authority
JP
Japan
Prior art keywords
relevance
words
group
belonging
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10118579A
Other languages
English (en)
Other versions
JP3553795B2 (ja
Inventor
Masakatsu Okubo
雅且 大久保
Takashi Inoue
孝史 井上
Masayuki Sugizaki
正之 杉崎
Kazuo Tanaka
一男 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11857998A priority Critical patent/JP3553795B2/ja
Publication of JPH11312168A publication Critical patent/JPH11312168A/ja
Application granted granted Critical
Publication of JP3553795B2 publication Critical patent/JP3553795B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 少なくとも2種類の関連度を反映した同義語
辞書を自動的に作成する。 【解決手段】 同一利用者による検索の時間間隔に基づ
いて単語同士の関連度を定義した間隔関連度辞書1を用
いて単語グループ初期化部3により単語グループを初期
化するとともに、間隔関連度辞書1及び各検索語の使用
頻度の時系列の相関係数に基づいて単語同士の関連度を
定義した時系列関連度辞書2を用いて単語グループ化部
4により単語グループを併合処理することによって同義
語グループを作成し、検索間隔と使用頻度の時系列の相
関を反映した同義語辞書を作成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、単語同士の関連度
が定義された複数の辞書を用いて、同義語とみなせる単
語をグループ化する同義語計算装置及びその方法並びに
同義語計算プログラムを記録した媒体に関するものであ
る。
【0002】
【従来の技術】従来、表記は異なるが同じ意味を持つ単
語をまとめた辞書として、同義語辞書があった。
【0003】同義語辞書は、例えば情報検索において1
つの単語を検索語として入力した際に、同義語辞書を用
いてその検索語を補完して検索することによって、利用
者の意図する情報を簡単に検索できるようにするために
使用される。あるいは、情報検索サービスにおいて、さ
まざまな情報に対する利用者からの要求の強さは検索語
の使用回数によって測定することができるが、その際、
同義語に対する使用回数をまとめて集計することによっ
て、より正確な値を求めることができる。
【0004】しかし、単語同士の関係は、時と共に変化
する。例えば「オリンピック」という検索語は、オリン
ピックの歴史や競技種目を検索する場合、オリンピック
会場へのアクセス方法や入場チケットについて検索する
場合、オリンピックの競技結果の速報を知りたい場合、
次に開催されるオリンピックについて知りたい場合等、
時期に応じて様々な用途で使用される。
【0005】従来の同義語辞書は、このような時と共に
変化する関係は考慮されておらず、このため、同義語辞
書を用いて検索しても、常に同じ検索結果しか得られな
いという問題があった。また、情報要求の強さについて
も、従来の同義語辞書では正確な測定ができないという
問題があった。
【0006】
【発明が解決しようとする課題】ところで、本出願人が
先に提案した検索ログを解析する情報関連づけ装置(特
願平9−148519号)を用いることにより、時と共
に変化する関係に自動的に追随した関連度辞書を構築で
きる。しかし、このようにして作成された関連度辞書で
は、単語同士の関連度は求められるが、どの単語とどの
単語が、その時に同義語として利用されているかを正確
に判定することはできない。関連度が所定の閾値以上の
ものを同義語とみなすことも考えられるが、この方法で
は誤差が大きくなることが懸念される。
【0007】例えば、3つの単語W1,W2,W3があ
って、W1とW2、W2とW3の間の関連度がそれぞれ
閾値より大きかったとしても、W1とW3の関連度が閾
値より大きいとは限らない。即ち、単純に閾値だけによ
る判定では、このような連鎖による誤判定を招いてしま
う。また、前記の情報関連付け装置では、異なる2種類
の観点からの関連度を求めることができるが、この両者
を効果的に組み合わせて同義語辞書を構築する手段につ
いては述べていなかった。
【0008】本発明の目的は、上記のような問題点に鑑
みてなされたものであり、少なくとも2種類の辞書を効
果的に組み合わせて同義語とみなされる単語を自動的に
グループ化し得る、同義語計算装置及びその方法並びに
同義語計算プログラムを記録した媒体を提供することに
ある。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、本発明では、少なくとも2種類の関連度辞書を用
い、一の関連度辞書に基づいて単語グループを初期化す
るとともに、各関連度辞書に基づいて単語グループを併
合処理することによって同義語グループを作成するた
め、少なくとも2種類の関連度を反映した同義語辞書を
作成することができる。また、関連度辞書として所定期
間の検索ログを解析して作成した辞書を用いることによ
り、一般的な同義語ではなく、その時期に同義語的に用
いられた関連語を集約できるので、現在の情報ニーズを
反映した同義語辞書を作成することができる。
【0010】
【発明の実施の形態】以下、本発明を図面に基づいて詳
述する。
【0011】図1は本発明の実施の形態の一例を示すも
ので、図中、1は間隔関連度辞書、2は時系列関連度辞
書、3は単語グループ初期化部、4は単語グループ化部
である。
【0012】間隔関連度辞書1は、本出願人が先に提案
した、検索ログを解析する情報関連づけ装置(特願平9
−148519号)を用いて、同一利用者による検索の
時間間隔に基づいて単語同士の関連度を定義・作成した
もので、図2にその一例を示す。
【0013】図2において、単語W1と単語W2,W
3,……との関連度(間隔関連度と呼ぶ。)は、それぞ
れ、Ir(1,2),Ir(1,3),……であること
を示している。また、Ir(1,2)=Ir(2,
1),Ir(1,3)=Ir(3,1),……である。
【0014】時系列関連度辞書2は、本出願人が先に提
案した、検索ログを解析する情報関連づけ装置(特願平
9−148519号)を用いて、各検索語の使用頻度の
時系列の相関係数に基づいて単語同士の関連度を定義・
作成したもので、図3にその一例を示す。
【0015】図3において、単語W1と単語W2,W
3,……との関連度(時系列関連度と呼ぶ。)は、それ
ぞれ、Cr(1,2),Cr(1,3),……であるこ
とを示している。また、Cr(1,2)=Cr(2,
1),Cr(1,3)=Cr(3,1),……である。
【0016】単語グループ初期化部3は、各単語が属す
るグループの初期値を設定するもので、図4に初期値設
定フローチャートの一例を示す。図4において、G[W
i]は、単語Wiが属するグループの名前を表してお
り、初期値としてG[Wi]=iとしている。即ち、各
単語はそれぞれ、その単語のみからなるグループに属す
るように設定される。
【0017】単語グループ化部4は、各単語間の間隔関
連度と時系列関連度に基づいて単語をグループ化するも
ので、図5に単語グループ化処理の基本フローチャート
の一例を示す。図5では、2つの単語WjとWkの基準
となる関連度をR(j,k)、R(j,k)の閾値をT
Hとしている。
【0018】処理の流れは、R(j,k)の最も大きな
組(j,k)を取り出し(ステップS1)、R(j,
k)>THでなければ終了する(ステップS2)。R
(j,k)>THであれば、G[Wj]に属する単語
(要素)Wp、G[Wk]に属する単語(要素)Wqを
それぞれ取り出し(ステップS3)、WpとWqとがグ
ループ化条件を満たすかどうかを検査する(ステップS
4)。
【0019】条件を満たす場合、G[Wj]内の全ての
要素Wpと、G[Wk]内の全ての要素Wqとについて
検査し(ステップS5)、これらがグループ化条件を満
たす場合、G[Wk]をG[Wj]に併合して1つのグ
ループとする、即ちG[Wj]=G[Wj]+G[W
k]とする(ステップS6)。
【0020】全ての(j,k)についてステップS2か
らS6までの処理を行っていれば終了し(ステップS
7)、そうでなければ、次に大きなR(j,k)値を持
つ(j,k)の組を取り出し(ステップS8)、これが
G[Wj]=G[Wk]でなければ(ステップS9)、
ステップS2からS6まで繰り返す。
【0021】単語グループ化部4では、上記基本フロー
チャートに基づいて単語のグループ化処理を行う。この
際に、R(j,k)としてIr(j,k)、閾値として
THI1を用い、また、ステップS4におけるグループ
化条件として、 Ir(p,q)>THI2またはCr(p,q)>THCR1 ……(条件1) を用いる。
【0022】この結果、各単語はグループに分けること
ができ、各グループに含まれる単語間には(条件1)が
成り立つ。即ち、各グループ内の単語は間隔関連度がT
HI2より大きいか、または時系列関連度がTHCR1
より大きくなっており、それらの単語同士を同義語とし
て出力する。
【0023】図6は単語グループ初期化部3の別の例を
示すもので、図1と同一構成部分は同一符号をもって表
す。即ち、1は間隔関連度辞書、5は単独グループ生成
部、6はコアグループ生成部である。
【0024】単独グループ生成部5は、図4のフローチ
ャートに基づいて各単語のみからのグループを生成す
る。また、コアグループ生成部6は間隔関連度に基づい
てコアとなる単語グループを生成する。この処理は図5
の基本フローチャートにおいて、R(j,k)としてI
r(j,k)、閾値としてTHI3を用い、また、ステ
ップS4におけるグループ化条件として、 Ir(p,q)>THI3 ……(条件2) を用いて行う。この結果、各グループ内の単語は(条件
2)が成り立ち、このコアグループを初期値として前記
のグループ化処理を行う。
【0025】図7は単語グループ初期化部3のさらに別
の例を示すもので、図6と同一構成部分は同一符号をも
って表す。即ち、1は間隔関連度辞書、5は単独グルー
プ生成部、7は余弦計算部、8はコアグループ生成部で
ある。
【0026】余弦計算部7は、単語WjとWkとの間の
余弦値Cos(j,k)を以下のようにして計算する。
即ち、間隔関連度辞書1に基づいて、Wj={Ir
(j,1),Ir(j,2),……Ir(j,n)}、
Wk={Ir(k,1),Ir(k,2),……Ir
(k,n)}とする時(但し、j=1,2,……n、k
=1,2,……n、j≠k)、 Cos(j,k)={Ir(j,1)・Ir(k,1)+Ir(j,2) ・Ir(k,2)+……+Ir(j,n)・Ir(k, n)}/〔{Ir(i,1)2 +Ir(j,2)2 +… …+Ir(j,n)2 1/2 ・{Ir(k,1)2 + Ir(k,2)2 +……+Ir(k,n)2 1/2 〕 として計算する。
【0027】上記式で求められたCos(j,k)は、
各Wj,Wkをn次元空間で表した時のコサイン値(余
弦値)に等しい。ここで、各間隔関連度は全て0以上の
値であるので、Cos(j,k)の値は、0から1まで
の間の値となる。即ち、Cos(j,k)の値が大きい
ほどWjとWkの角度は小さくなる。
【0028】また、コアグループ生成部8では、各単語
間の余弦値に基づいてコアとなる単語グループを生成す
る。この処理は図5の基本フローチャートにおいて、R
(j,k)としてCos(j,k)、閾値としてTHC
OS1を用い、また、ステップS4におけるグループ化
条件として、 Cos(p,q)>THCOS1 ……(条件3) を用いて行う。この結果、各グループ内の単語は(条件
2)が成り立ち、このコアグループを初期値として単語
のグループ化処理を行う。
【0029】単語グループ初期化部を図7の構成とした
時、単語グループ化部4の処理は、図5の基本フローチ
ャートにおいて、R(j,k)としてIr(j,k)、
閾値としてTHI4を用い、また、ステップS4におけ
るグループ化条件として、 Ir(p,q)>THI4またはCr(p,q)>THCR2 またはCos(p,q)>THCOS2 ……(条件4) を用いて行う。
【0030】この結果、各単語はグループに分けること
ができ、各グループに含まれる単語間には(条件4)が
成り立つ。即ち、各グループ内の単語は間隔関連度がT
HI4より大きいか、または時系列関連度がTHCR2
より大きいか、あるいは余弦値がTHCOS2より大き
くなっており、それらの単語同士を同義語として出力す
る。
【0031】このように、性格の異なる2種類の関連度
をもとにして、各単語が同義語としてみなすことができ
るかどうかを判定し、同義語同士を同じグループに入れ
ることができる。また、関連度辞書として、本出願人が
先に提案した検索ログを解析する情報関連づけ装置(特
願平9−148519号)によって生成された辞書を用
いることにより、「その時点で同義語的に使用された単
語」をグループ化することができるため、時代の流れに
即した同義語辞書を自動的に生成できる。
【0032】なお、関連度辞書の構成としては、各単語
間の関連度が記述してあればその構成は任意であること
はいうまでもない。
【0033】
【発明の効果】以上説明したように、本発明によれば、
単語同士の関連度を定義した少なくとも2種類の辞書を
用いることによって同義語を検出しグループ化するた
め、同義語辞書を自動的に作成することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態の一例を示すブロック図
【図2】間隔関連度辞書の一例を示す説明図
【図3】時系列関連度辞書の一例を示す説明図
【図4】単語グループ初期化部における処理のフローチ
ャート
【図5】関連度に基づいて単語をグループ化する処理の
フローチャート
【図6】単語グループ初期化部の別の例を示すブロック
【図7】単語グループ初期化部のさらに別の例を示すブ
ロック図
【符号の説明】
1:間隔関連度辞書、2:時系列関連度辞書、3:単語
グループ初期化部、4:単語グループ化部、5:単独グ
ループ生成部、6,8:コアグループ生成部、7:余弦
計算部。
フロントページの続き (72)発明者 田中 一男 東京都新宿区西新宿3丁目19番2号 日本 電信電話株式会社内

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 単語同士の関連度をそれぞれ異なる観点
    から定義した少なくとも2種類の関連度辞書と、 一の関連度辞書に含まれる全ての単語についてそれらが
    属するグループを初期設定する単語グループ初期化部
    と、 一のグループに属する単語と他のグループに属する単語
    とが同一グループに属するとみなせるか否かを、前記少
    なくとも2種類の関連度辞書に定義された単語同士の関
    連度に基づいて判定し、一のグループに属する全ての単
    語と他のグループに属する全ての単語との全ての組み合
    わせについて同一グループに属するとみなせる場合、一
    のグループと他のグループとを併合する単語グループ化
    部とを備えたことを特徴とする同義語計算装置。
  2. 【請求項2】 一の関連度辞書に含まれる全ての単語に
    ついてその単語のみを含むグループを初期設定する単語
    グループ初期化部を備えたことを特徴とする請求項1記
    載の同義語計算装置。
  3. 【請求項3】 一の関連度辞書に定義された単語同士の
    関連度が所定の閾値より大きい単語のみを含むグループ
    を初期設定する単語グループ初期化部を備えたことを特
    徴とする請求項1記載の同義語計算装置。
  4. 【請求項4】 一の関連度辞書に定義された単語同士の
    関連度を用いて作成したベクトル間の余弦値が所定の閾
    値より大きい単語のみを含むグループを初期設定する単
    語グループ初期化部を備えたことを特徴とする請求項1
    記載の同義語計算装置。
  5. 【請求項5】 いずれかの関連度辞書に定義された単語
    同士の関連度が予め辞書毎に設定された特定の閾値より
    大きい場合、一のグループに属する単語と他のグループ
    に属する単語とが同一グループに属すると見なして処理
    する単語グループ化部を備えたことを特徴とする請求項
    1乃至4いずれか記載の同義語計算装置。
  6. 【請求項6】 いずれかの関連度辞書に定義された単語
    同士の関連度が予め辞書毎に設定された特定の閾値より
    大きい場合もしくは一の関連度辞書に定義された単語同
    士の関連度を用いて作成したベクトル間の余弦値が特定
    の閾値より大きい場合、一のグループに属する単語と他
    のグループに属する単語とは同一グループに属すると見
    なして処理する単語グループ化部を備えたことを特徴と
    する請求項1乃至4いずれか記載の同義語計算装置。
  7. 【請求項7】 所定期間の検索ログを解析して作成した
    関連度辞書を備えたことを特徴とする請求項1乃至6い
    ずれか記載の同義語計算装置。
  8. 【請求項8】 単語同士の関連度をそれぞれ異なる観点
    から定義した少なくとも2種類の関連度辞書のうちの一
    の関連度辞書に含まれる全ての単語についてそれらが属
    するグループを初期設定し、 一のグループに属する単語と他のグループに属する単語
    とが同一グループに属するとみなせるか否かを、前記少
    なくとも2種類の関連度辞書に定義された単語同士の関
    連度に基づいて判定し、 一のグループに属する全ての単語と他のグループに属す
    る全ての単語との全ての組み合わせについて同一グルー
    プに属するとみなせる場合、一のグループと他のグルー
    プとを併合することを特徴とする同義語計算方法。
  9. 【請求項9】 一の関連度辞書に含まれる全ての単語に
    ついてその単語のみを含むグループを初期設定すること
    を特徴とする請求項8記載の同義語計算方法。
  10. 【請求項10】 一の関連度辞書に定義された単語同士
    の関連度が所定の閾値より大きい単語のみを含むグルー
    プを初期設定することを特徴とする請求項8記載の同義
    語計算方法。
  11. 【請求項11】 一の関連度辞書に定義された単語同士
    の関連度を用いて作成したベクトル間の余弦値が所定の
    閾値より大きい単語のみを含むグループを初期設定する
    ことを特徴とする請求項8記載の同義語計算方法。
  12. 【請求項12】 いずれかの関連度辞書に定義された単
    語同士の関連度が予め辞書毎に設定された特定の閾値よ
    り大きい場合、一のグループに属する単語と他のグルー
    プに属する単語とが同一グループに属するとみなすこと
    を特徴とする請求項8乃至11いずれか記載の同義語計
    算方法。
  13. 【請求項13】 いずれかの関連度辞書に定義された単
    語同士の関連度が予め辞書毎に設定された特定の閾値よ
    り大きい場合もしくは一の関連度辞書に定義された単語
    同士の関連度を用いて作成したベクトル間の余弦値が特
    定の閾値より大きい場合、一のグループに属する単語と
    他のグループに属する単語とは同一グループに属すると
    みなすことを特徴とする請求項8乃至11いずれか記載
    の同義語計算方法。
  14. 【請求項14】 所定期間の検索ログを解析して作成し
    た関連度辞書を用いることを特徴とする請求項8乃至1
    3いずれか記載の同義語計算方法。
  15. 【請求項15】 単語同士の関連度をそれぞれ異なる観
    点から定義した少なくとも2種類の関連度辞書のうちの
    一の関連度辞書に含まれる全ての単語についてそれらが
    属するグループを初期設定し、 一のグループに属する単語と他のグループに属する単語
    とが同一グループに属するとみなせるか否かを、前記少
    なくとも2種類の関連度辞書に定義された単語同士の関
    連度に基づいて判定し、 一のグループに属する全ての単語と他のグループに属す
    る全ての単語との全ての組み合わせについて同一グルー
    プに属するとみなせる場合、一のグループと他のグルー
    プとを併合することを特徴とする同義語計算プログラム
    を記録した媒体。
  16. 【請求項16】 一の関連度辞書に含まれる全ての単語
    についてその単語のみを含むグループを初期設定するこ
    とを特徴とする請求項15記載の同義語計算プログラム
    を記録した媒体。
  17. 【請求項17】 一の関連度辞書に定義された単語同士
    の関連度が所定の閾値より大きい単語のみを含むグルー
    プを初期設定することを特徴とする請求項15記載の同
    義語計算プログラムを記録した媒体。
  18. 【請求項18】 一の関連度辞書に定義された単語同士
    の関連度を用いて作成したベクトル間の余弦値が所定の
    閾値より大きい単語のみを含むグループを初期設定する
    ことを特徴とする請求項15記載の同義語計算プログラ
    ムを記録した媒体。
  19. 【請求項19】 いずれかの関連度辞書に定義された単
    語同士の関連度が予め辞書毎に設定された特定の閾値よ
    り大きい場合、一のグループに属する単語と他のグルー
    プに属する単語とが同一グループに属するとみなすこと
    を特徴とする請求項15乃至18いずれか記載の同義語
    計算プログラムを記録した媒体。
  20. 【請求項20】 いずれかの関連度辞書に定義された単
    語同士の関連度が予め辞書毎に設定された特定の閾値よ
    り大きい場合もしくは一の関連度辞書に定義された単語
    同士の関連度を用いて作成したベクトル間の余弦値が特
    定の閾値より大きい場合、一のグループに属する単語と
    他のグループに属する単語とは同一グループに属すると
    みなすことを特徴とする請求項15乃至18いずれか記
    載の同義語計算プログラムを記録した媒体。
  21. 【請求項21】 所定期間の検索ログを解析して作成し
    た関連度辞書を用いることを特徴とする請求項15乃至
    20いずれか記載の同義語計算プログラムを記録した媒
    体。
JP11857998A 1998-04-28 1998-04-28 同義語計算装置及びその方法並びに同義語計算プログラムを記録した媒体 Expired - Lifetime JP3553795B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11857998A JP3553795B2 (ja) 1998-04-28 1998-04-28 同義語計算装置及びその方法並びに同義語計算プログラムを記録した媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11857998A JP3553795B2 (ja) 1998-04-28 1998-04-28 同義語計算装置及びその方法並びに同義語計算プログラムを記録した媒体

Publications (2)

Publication Number Publication Date
JPH11312168A true JPH11312168A (ja) 1999-11-09
JP3553795B2 JP3553795B2 (ja) 2004-08-11

Family

ID=14740092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11857998A Expired - Lifetime JP3553795B2 (ja) 1998-04-28 1998-04-28 同義語計算装置及びその方法並びに同義語計算プログラムを記録した媒体

Country Status (1)

Country Link
JP (1) JP3553795B2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001243230A (ja) * 2000-02-25 2001-09-07 Nippon Telegr & Teleph Corp <Ntt> 類似性判別方法
JP2002032557A (ja) * 2000-07-19 2002-01-31 Asahi Kasei Corp 住宅商品共同企画支援装置
JP2002056010A (ja) * 2000-06-09 2002-02-20 Trw Inc 語彙探索及び分類システム及び方法
JP2005304640A (ja) * 2004-04-19 2005-11-04 Sony Computer Entertainment Inc ゲームキャラクタの制御装置、及びゲームキャラクタの制御方法
JP2006285460A (ja) * 2005-03-31 2006-10-19 Konica Minolta Holdings Inc 情報検索システム
US7581180B2 (en) * 2000-05-12 2009-08-25 Sony Corporation Portable terminal, method for inputting the information, method and apparatus for dictionary retrieval and medium
WO2010035412A1 (ja) * 2008-09-25 2010-04-01 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
WO2012077369A1 (ja) 2010-12-07 2012-06-14 楽天株式会社 サーバ、辞書生成方法、辞書生成プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
WO2013146736A1 (ja) * 2012-03-30 2013-10-03 日本電気株式会社 同義関係判定装置、同義関係判定方法、及びそのプログラム
US9158790B2 (en) 2010-12-07 2015-10-13 Rakuten, Inc. Server, dictionary creation method, dictionary creation program, and computer-readable recording medium recording the program
WO2019049483A1 (ja) 2017-09-11 2019-03-14 株式会社Screenホールディングス 同義語辞書作成装置、同義語辞書作成プログラム及び同義語辞書作成方法
CN111209531A (zh) * 2018-11-21 2020-05-29 百度在线网络技术(北京)有限公司 关联度的处理方法、装置和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07325832A (ja) * 1994-05-31 1995-12-12 Fujitsu Ltd 単語使用パターンの時間的変化を利用した検索方法および情報検索装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07325832A (ja) * 1994-05-31 1995-12-12 Fujitsu Ltd 単語使用パターンの時間的変化を利用した検索方法および情報検索装置

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001243230A (ja) * 2000-02-25 2001-09-07 Nippon Telegr & Teleph Corp <Ntt> 類似性判別方法
US7581180B2 (en) * 2000-05-12 2009-08-25 Sony Corporation Portable terminal, method for inputting the information, method and apparatus for dictionary retrieval and medium
JP2002056010A (ja) * 2000-06-09 2002-02-20 Trw Inc 語彙探索及び分類システム及び方法
JP2002032557A (ja) * 2000-07-19 2002-01-31 Asahi Kasei Corp 住宅商品共同企画支援装置
JP2005304640A (ja) * 2004-04-19 2005-11-04 Sony Computer Entertainment Inc ゲームキャラクタの制御装置、及びゲームキャラクタの制御方法
JP2006285460A (ja) * 2005-03-31 2006-10-19 Konica Minolta Holdings Inc 情報検索システム
WO2010035412A1 (ja) * 2008-09-25 2010-04-01 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
US8612202B2 (en) 2008-09-25 2013-12-17 Nec Corporation Correlation of linguistic expressions in electronic documents with time information
JP5387577B2 (ja) * 2008-09-25 2014-01-15 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
US9158790B2 (en) 2010-12-07 2015-10-13 Rakuten, Inc. Server, dictionary creation method, dictionary creation program, and computer-readable recording medium recording the program
WO2012077369A1 (ja) 2010-12-07 2012-06-14 楽天株式会社 サーバ、辞書生成方法、辞書生成プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
WO2013146736A1 (ja) * 2012-03-30 2013-10-03 日本電気株式会社 同義関係判定装置、同義関係判定方法、及びそのプログラム
JPWO2013146736A1 (ja) * 2012-03-30 2015-12-14 日本電気株式会社 同義関係判定装置、同義関係判定方法、及びそのプログラム
US9489370B2 (en) 2012-03-30 2016-11-08 Nec Corporation Synonym relation determination device, synonym relation determination method, and program thereof
WO2019049483A1 (ja) 2017-09-11 2019-03-14 株式会社Screenホールディングス 同義語辞書作成装置、同義語辞書作成プログラム及び同義語辞書作成方法
KR20200038984A (ko) 2017-09-11 2020-04-14 가부시키가이샤 스크린 홀딩스 동의어 사전 작성 장치, 동의어 사전 작성 프로그램 및 동의어 사전 작성 방법
CN111209531A (zh) * 2018-11-21 2020-05-29 百度在线网络技术(北京)有限公司 关联度的处理方法、装置和存储介质
CN111209531B (zh) * 2018-11-21 2023-08-08 百度在线网络技术(北京)有限公司 关联度的处理方法、装置和存储介质

Also Published As

Publication number Publication date
JP3553795B2 (ja) 2004-08-11

Similar Documents

Publication Publication Date Title
US8108392B2 (en) Identifying clusters of words according to word affinities
JP4664423B2 (ja) 適合性のある情報を検索する方法
Montague et al. Relevance score normalization for metasearch
Sakurai et al. Stream monitoring under the time warping distance
US20080104056A1 (en) Distributional similarity-based models for query correction
US8543380B2 (en) Determining a document specificity
US8266157B2 (en) Method and system for using social bookmarks
US20030079185A1 (en) Method and system for generating a document summary
US20090094262A1 (en) Automatic Generation Of Ontologies Using Word Affinities
JPH11312168A (ja) 同義語計算装置及びその方法並びに同義語計算プログラムを記録した媒体
US20070136281A1 (en) Training a ranking component
US20070106406A1 (en) Music-piece classifying apparatus and method, and related computer program
Khashabi et al. Learning what is essential in questions
US11288453B1 (en) Key-word identification
KR20110031327A (ko) 해시 니모닉을 생성하는 방법 및 장치
US8606779B2 (en) Search method, similarity calculation method, similarity calculation, same document matching system, and program thereof
US20090094209A1 (en) Determining The Depths Of Words And Documents
WO2018102014A1 (en) Determination of similarity between videos using shot duration correlation
US20100284625A1 (en) Computing Visual and Textual Summaries for Tagged Image Collections
Chifu et al. Query performance prediction focused on summarized letor features
US20180137149A1 (en) De-identification data generation apparatus, method, and non-transitory computer readable storage medium thereof
CN111144546B (zh) 评分方法、装置、电子设备及存储介质
CN109902162B (zh) 基于数字指纹的文本相似性的识别方法、存储介质及装置
Oghli et al. Comparison of basic information retrieval models
WO2022019275A1 (ja) 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040430

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110514

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120514

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140514

Year of fee payment: 10

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term