JP2005032193A - 単語間意味関係測定装置、単語間意味関係測定方法、単語間意味関係測定プログラム及びプログラム記録媒体 - Google Patents

単語間意味関係測定装置、単語間意味関係測定方法、単語間意味関係測定プログラム及びプログラム記録媒体 Download PDF

Info

Publication number
JP2005032193A
JP2005032193A JP2003273734A JP2003273734A JP2005032193A JP 2005032193 A JP2005032193 A JP 2005032193A JP 2003273734 A JP2003273734 A JP 2003273734A JP 2003273734 A JP2003273734 A JP 2003273734A JP 2005032193 A JP2005032193 A JP 2005032193A
Authority
JP
Japan
Prior art keywords
word
search
words
behavior model
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003273734A
Other languages
English (en)
Inventor
Noriaki Kawamae
徳章 川前
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003273734A priority Critical patent/JP2005032193A/ja
Publication of JP2005032193A publication Critical patent/JP2005032193A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】汎用性及び経済性に富み、迅速且つ的確にユーザの入力作業を支援可能な単語間意味関係測定装置、単語間意味関係測定方法、単語間意味関係測定プログラム及びプログラム記録媒体を提供する。
【解決手段】ユーザの検索行動をモデリングした検索行動モデルを用いることにより任意の単語間の意味関係を測定し、ユーザにより単語が入力されると、測定の結果に基づいて、入力された単語に対して定義された意味関係毎に関係性が強い単語をユーザに提示する単語提示部13を設ける。
【選択図】図1

Description

本発明は、情報を提示するにあたって、単語間の意味関係を自動的に測定する単語間意味関係測定装置、単語間意味関係測定方法、単語間意味関係測定プログラム及びプログラム記録媒体に関する。
ユーザが必要な情報を検索するためのシステムの多くは、ユーザに自身の要求を単語として入力することを求めている。現実は、情報を探す以前に、多くのユーザは、自身の要求を的確に表現した単語を探す為に、何度も単語を変えて入力するということを行っている。
この自身の要求を的確に表現した単語を探す作業は、ユーザに多大なる負担を強いている。このため、システム側がそのユーザに合った単語を提示することでユーザの入力作業を支援することが望まれる。
その支援を実現する為に、システム側は単語のデータベースとしてシソーラスの構築が提案されてきた。このシソーラスは、単語の関係を概念別に整理した辞書であり、シソーラスの構築により検索質問拡張などの支援が実現する。なお、この検索質問拡張は、ユーザが入力した単語に新たに単語を付加する手法である(例えば、特許文献1参照)。
ただし、シソーラスの構築には、人手と時間を要するというコスト的な問題だけでなく、支援できる情報の分野やユーザの検索行動が限定されているという問題も存在する。
特開2002−92032号公報
このような事情に鑑み、本発明は、汎用性及び経済性に富み、迅速且つ的確にユーザの入力作業を支援可能な単語間意味関係測定装置、単語間意味関係測定方法、単語間意味関係測定プログラム及びプログラム記録媒体を提供することを目的とする。
請求項1に記載の本発明は、ユーザの検索行動をモデリングした検索行動モデルを用いることにより任意の単語間の意味関係を測定し、ユーザにより単語が入力されると、測定の結果に基づいて、入力された単語に対して定義された意味関係毎に関係性が強い単語をユーザに提示する提示手段を有することを要旨とする。
請求項2に記載の本発明は、請求項1に記載の発明において、提示手段は、単語の提示を行うために、ユーザの検索履歴を生成する検索履歴生成手段を有することを要旨とする。
請求項3に記載の本発明は、請求項2に記載の発明において、提示手段は、検索履歴をユーザ単位毎に分類し、且つ時系列順に整理した検索シーケンスを生成する検索シーケンス生成手段を有することを要旨とする。
請求項4に記載の本発明は、請求項3に記載の発明において、検索シーケンスから単語リストを作成する単語リスト作成手段を有することを要旨とする。
請求項5に記載の本発明は、請求項1乃至4のいずれか1項に記載の発明において、単語の其々に対して検索行動モデルを用いることにより、単語間の関係性を示す関係性指標値を算出する関係性指標値算出手段を有し、提示手段は、関係性指標値に基づいて単語間の意味関係を測定することを要旨とする。
請求項6に記載の本発明は、請求項3乃至5のいずれか1項に記載の発明において、検索シーケンスから検索行動モデルを作成する検索行動モデル作成手段を有することを要旨とする。
請求項7に記載の本発明は、請求項6に記載の発明において、検索行動モデル作成手段は、検索シーケンスに含まれる単語の出現順序、出現時間間隔、出現位置間隔、出現回数を組み合わせることにより検索行動モデルを作成することを要旨とする。
請求項8に記載の本発明は、請求項6又は7に記載の発明において、検索行動モデル作成手段は、検索におけるユーザの検索要求の内容を別表現、具体化、同概念及び興味の変化の各項目に分類し、其々に対応する検索行動モデルを作成することを要旨とする。
請求項9に記載の本発明は、請求項5乃至8のいずれか1項に記載の発明において、検索におけるユーザの検索要求の内容を別表現、具体化、同概念及び興味の変化の各項目に分類し、各項目に基づいて単語の其々と検索検索行動モデルとを対応付ける対応付け手段を有することを要旨とする。
請求項10に記載の本発明は、請求項6乃至9のいずれか1項に記載の発明において、検索行動モデル生成手段は、ユーザの検索の巧拙を判断し、判断した巧拙に基づいて検索行動モデルを作成することを要旨とする。
請求項11に記載の本発明は、請求項10に記載の発明において、検索行動モデル生成手段は、検索シーケンスに含まれる隣接した単語が出現した時間との間隔に基づいてユーザの検索の巧拙を判断することを要旨とする。
請求項12に記載の本発明は、請求項10又は11に記載の発明において、ユーザの検索の巧拙を用いてフィルタリングを行うことを要旨とする。
請求項13に記載の本発明は、請求項7乃至12のいずれか1項に記載の発明において、別表現に対応する検索行動モデルを作成するにあたっては、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、単語リストのキーをkey、そのリスト内の単語をwordとして、keyとwordとの間に出現する単語の数の平均値を算出し、平均値の小さい順にkeyに対して別表現に含まれる単語とwordを測定し、具体化に対応する検索行動モデルを作成するにあたっては、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、keyがwordの前に出現する検索シーケンスの数を算出し、検索シーケンスの数の大きい順にkeyに対して具体化に含まれる単語とwordを測定し、抽象化に対応する検索行動モデルを作成するにあたっては、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、keyがwordの前に出現する検索シーケンスの数を算出し、検索シーケンスの数の大きい順にkeyに対して抽象化に含まれる単語とwordを測定し、概念に対応する検索行動モデルを作成するにあたっては、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、keyとwordとの間に出現する単語の数の平均値を算出し、平均値の小さい順にkeyに対して同概念に含まれる単語とwordを測定し、興味の変化に対応する検索行動モデルを作成するにあたっては、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、wordを含む検索シーケンスの数をkeyとwordが同時に出現する検索シーケンスで割り、この値の大きい順にkeyに対して興味の変化に含まれる単語とwordを測定することを要旨とする。
請求項14に記載の本発明は、ユーザの検索行動をモデリングした検索行動モデルを用いることにより任意の単語間の意味関係を測定し、ユーザにより単語が入力されると、測定の結果に基づいて、入力された単語に対して定義された意味関係毎に関係性が強い単語をユーザに提示する提示ステップを有することを要旨とする。
請求項15に記載の本発明は、請求項14に記載の発明において、提示ステップは、単語の提示を行うために、ユーザの検索履歴を生成する検索履歴生成ステップを有することを要旨とする。
請求項16に記載の本発明は、請求項15に記載の発明において、提示ステップは、検索履歴をユーザ単位毎に分類し、且つ時系列順に整理した検索シーケンスを生成する検索シーケンス生成ステップを有することを要旨とする。
請求項17に記載の本発明は、請求項16に記載の発明において、検索シーケンスから単語リストを作成する単語リスト作成ステップを有することを要旨とする。
請求項18に記載の本発明は、請求項14乃至17に記載の発明において、単語の其々に対して検索行動モデルを用いることにより、単語間の関係性を示す関係性指標値を算出する関係性指標値算出ステップを有し、提示ステップは、関係性指標値に基づいて単語間の意味関係を測定することを要旨とする。
請求項19に記載の本発明は、請求項16乃至18に記載の発明において、検索シーケンスから検索行動モデルを作成する検索行動モデル作成ステップを有することを要旨とする。
請求項20に記載の本発明は、請求項19に記載の発明において、検索行動モデル作成ステップは、検索シーケンスに含まれる単語の出現順序、出現時間間隔、出現位置間隔、出現回数を組み合わせることにより検索行動モデルを作成することを要旨とする。
請求項21に記載の本発明は、請求項19又は20に記載の発明において、検索行動モデル作成ステップは、検索におけるユーザの検索要求の内容を別表現、具体化、同概念及び興味の変化の各項目に分類し、其々に対応する検索行動モデルを作成することを要旨とする。
請求項22に記載の本発明は、請求項18乃至21に記載の発明において、検索におけるユーザの検索要求の内容を別表現、具体化、同概念及び興味の変化の各項目に分類し、各項目に基づいて単語の其々と検索検索行動モデルとを対応付ける対応付けステップを有することを要旨とする。
請求項23に記載の本発明は、請求項19乃至22のいずれか1項に記載の発明において、検索行動モデル生成ステップは、ユーザの検索の巧拙を判断し、判断した巧拙に基づいて検索行動モデルを作成することを要旨とする。
請求項24に記載の本発明は、請求項23に記載の発明において、検索行動モデル生成ステップは、検索シーケンスに含まれる隣接した単語が出現した時間との間隔に基づいてユーザの検索の巧拙を判断することを特徴とする請求項23に記載の単語間意味関係測定方法。
請求項25に記載の本発明は、請求項23又は24に記載の発明において、ユーザの検索の巧拙を用いてフィルタリングを行うことを要旨とする。
請求項26に記載の本発明は、請求項20乃至25のいずれか1項に記載の発明において、別表現に対応する検索行動モデルを作成するにあたっては、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、単語リストのキーをkey、そのリスト内の単語をwordとして、keyとwordとの間に出現する単語の数の平均値を算出し、平均値の小さい順にkeyに対して別表現に含まれる単語とwordを測定し、具体化に対応する検索行動モデルを作成するにあたっては、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、keyがwordの前に出現する検索シーケンスの数を算出し、検索シーケンスの数の大きい順にkeyに対して具体化に含まれる単語とwordを測定し、抽象化に対応する検索行動モデルを作成するにあたっては、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、keyがwordの前に出現する検索シーケンスの数を算出し、検索シーケンスの数の大きい順にkeyに対して抽象化に含まれる単語とwordを測定し、概念に対応する検索行動モデルを作成するにあたっては、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、keyとwordとの間に出現する単語の数の平均値を算出し、平均値の小さい順にkeyに対して同概念に含まれる単語とwordを測定し、興味の変化に対応する検索行動モデルを作成するにあたっては、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、wordを含む検索シーケンスの数をkeyとwordが同時に出現する検索シーケンスで割り、この値の大きい順にkeyに対して興味の変化に含まれる単語とwordを測定することを要旨とする。
請求項27に記載の本発明は、コンピュータに請求項14乃至26のいずれか1項に記載の単語間意味関係測定方法を実行させることを要旨とする。
請求項28に記載の本発明は、請求項27に記載の単語間意味関係測定プログラムを記録したことを要旨とする。
本発明は、シソーラスを用いずにユーザの検索行動モデルを用いるため、汎用性及び経済性に富み、迅速且つ的確にユーザの入力作業を支援可能な単語間意味関係測定装置、単語間意味関係測定方法、単語間意味関係測定プログラム及びプログラム記録媒体を提供することが可能となる。
以下の実施例は、あくまでも本発明の説明のためのものであり、本発明の範囲を制限するものではない。したがって、当業者であれば、これらの各要素又は全要素を含んだ各種の実施例を採用することが可能であるが、これらの実施例も本発明の範囲に含まれる。
図1は、本発明の一実施例に係る単語間意味関係測定装置1の構成を示す図である。
単語間意味関係測定装置1は、単語化部11、該当ページ検索部12、単語提示部13、検索履歴生成部14、該当単語リスト検索部15、関係性測定部16、単語リストDB(データベース)17、関係性指標値DB(データベース)18、検索シーケンス生成部19、単語リスト作成部20及び関係性指標値算出部21を有する。
ユーザ2は必要な情報を得るために、その情報を含むと考えられるホームページのインデックスとなる語句を単語間意味関係測定装置1に入力する。
単語間意味関係測定装置1の単語化部11は、インデックスとなる語句を単語化し、該当ページ検索部12は、前記の単語をキーワードとして、該当するホームページのURL(Uniform Resource Locator)を提示する。
また、これに加えて、単語提示部13は、ユーザ2が次に用いると予想される単語を「別表現」、「具体化」、「抽象化」、「同概念」及び「興味の変化」の5種類の基準(項目)毎に提示する。
これらの単語はユーザ2や他のユーザが入力した単語の履歴である検索履歴と検索行動モデルを用いることにより単語間の関係を測定した結果に基づいて提示される。
なお、検索履歴は、検索履歴生成部14により生成され、ユーザのID、使用されたキーワードを含む。
この検索シーケンスの一例を以下に示す。
***.***.***.*** - - [01/Sep/2000:00:00:11 +0900] "GET /?kw=extermination HTTP/1.0" 200 − "http:
***.***.***.*** - - [01/Sep/2000:00:00:11 +0900] "GET /?kw=threatened species HTTP/1.0" 200 − "http:
***.***.***.*** - - [01/Sep/2000:00:00:11 +0900] "GET /?kw=albatross HTTP/1.0" 200 − "http:
***.***.***.*** - - [01/Sep/2000:00:00:11 +0900] "GET /?kw=giant tortoise HTTP/1.0" 200 − "http:
***.***.***.*** - - [01/Sep/2000:00:00:11 +0900] "GET /?kw=Lonesome George HTTP/1.0" 200 − "http:
***.***.***.*** - - [01/Sep/2000:00:00:11 +0900] "GET /?kw=Italy HTTP/1.0" 200 − "http:
また、上記の検索履歴としてサーバ等のログ、クッキー等を用いることもできる。
検索シーケンス生成部19は、上記の検索履歴に基づいて検索シーケンスを生成する。この検索シーケンスは、検索履歴をこれに含まれるユーザID及び時刻に基づいてユーザ毎に時系列順に整理したものである。
この検索シーケンスの一例を以下に示す。
{UID}={extermination, threatened species, albatross, Lonesome George, Italy}
なお、UIDはユーザを識別するためのIDである。
単語リスト作成部20は、上記の検索シーケンスをグルーピングし、単語リストを作成する。上記のグルーピングおいては、各単語をキーとして、その単語と同一の検索シーケンスに出現した単語を、そのキーについての単語リストに格納する。これを全ての単語がキーとなるまで処理を行う。更に同様の処理を全ての検索シーケンスに対して行う。
この検索シーケンスから次のような単語リストが作成される。
WL{extermination}={threatened species, albatross, Lonesome George, Italy}
WL{threatened species}={extermination, albatross, Lonesome George, Italy}
WL{albatross}={extermination, threatened species, Lonesome George, Italy}
WL{Lonesome George}={ extermination, threatened species, albatross, Italy}
WL{Italy}={extermination, threatened species, albatross, Lonesome George}
また、上記の単語リストは、単語リストDB17に記憶される。
関係性指標値算出部21は、前記の単語の其々に対応した検索行動モデルを用いることにより、単語間の関係性を示す関係性指標値を算出する。この関係性指標値が高い単語ほどキーに対し具体的な関係にある単語と判断される。なお、本実施例においては、関係性指標値算出部が検索行動モデルを作成するが、これに限定されない。
上記の検索行動モデルの一例を表1に示す。
Figure 2005032193
表1に示したように、検索行動モデルは、検索シーケンスに含まれる単語の出現順序、出現時間間隔、出現位置間隔(相対的距離)、出現回数を組み合わせることにより構成されており、例えば、具体化の場合は、出現の順序は後で、単語の組み合わせが多いとなっている。また、これに該当するパラメタは表2のAinf{key}{word}である。keyはキーとなる単語、wordはそのキーの単語リストに含まれる単語であり、これを用いてキーに対しての単語の関係性指標値を算出し、算出された関係性指標値は、関係性指標値DB18に記憶される。
なお、上記の出現順序は、ユーザがその単語を用いた順序を指し、時間間隔とは、ユーザがその単語を用いた時間の間隔を指し、出現回数は任意の単語の組み合わせを含む検索シーケンスの数を指す。
また、ユーザの検索要求の内容、つまりユーザが検索要求を変更する動機(別表現、具体化、抽象化、同概念、興味の変化)の其々に対応する検索要求モデルが作成される。
また、表1に示したように、ユーザが単語を変化する動機が別表現、同概念、抽象化の場合、ユーザの情報要求の度合いは高い。
また、上記の対応付けも関係性指標値算出部21が行うが、これに限定されない。
Figure 2005032193
また、関係性指標値算出部21は、ユーザの検索の巧拙を判断し、判断した巧拙に基づいて検索行動モデルを作成する。この巧拙の判断は、検索シーケンスに含まれる隣接した単語が出現した時間との間隔に基づいて行われる。
また、単語リスト内の単語にそれぞれの検索行動モデルを用いる前処理として、単語間の時間間隔に基づいてフィルタリングを行う。
また、関係性指標値算出部21が前記の別表現に対応する検索行動モデルを作成するにあたっては、単語リスト作成部20と連動し、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、単語リストのキーをkey、そのリスト内の単語をwordとして、keyとwordとの間に出現する単語の数の平均値を算出し、平均値の小さい順にkeyに対して別表現に含まれる単語とwordを測定する。
また、関係性指標値算出部21が具体化に対応する検索行動モデルを作成するにあたっては、単語リスト作成部20と連動し、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、keyがwordの前に出現する検索シーケンスの数を算出し、検索シーケンスの数の大きい順にkeyに対して具体化に含まれる単語とwordを測定する。
また、関係性指標値算出部21が抽象化に対応する検索行動モデルを作成するにあたっては、単語リスト作成部20と連動し、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、keyがwordの前に出現する検索シーケンスの数を算出し、検索シーケンスの数の大きい順にkeyに対して抽象化に含まれる単語とwordを測定する。
また、関係性指標値算出部21が概念に対応する検索行動モデルを作成するにあたっては、単語リスト作成部20と連動し、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、keyとwordとの間に出現する単語の数の平均値を算出し、平均値の小さい順にkeyに対して同概念に含まれる単語とwordを測定する。
また、関係性指標値算出部21が興味の変化に対応する検索行動モデルを作成するにあたっては、単語リスト作成部20と連動し、単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、wordを含む検索シーケンスの数をkeyとwordが同時に出現する検索シーケンスで割り、この値の大きい順にkeyに対して興味の変化に含まれる単語とwordを測定する。
該当単語リスト検索部15は、前記のキーワードに基づいて、該当単語リストを単語リストDB17から詠みだし、関係性測定部16に送信する。
関係性測定部16は、受け取った該当単語リストと、関係性指標値DBに記憶された関係性指標値とに基づいて、ユーザ2が用いると予想される単語を「別表現」、「具体化」、「抽象化」、「同概念」及び「興味の変化」の5種類の基準(項目)毎に抽出する。
関係性測定部16により抽出された単語は、前記のとおり、単語提示部3によりユーザ2に提示される。
上記のような単語間意味関係測定装置1を用いることにより、例えば、図2に示すように、ユーザ2が単語「albatross」を入力した場合、前記の情報要求が高いユーザ4、つまり以前に「albatross」若しくはそれと関係性の強い単語を入力したユーザの検索履歴、検索行動モデル、単語リスト、関連性指標値に基づいて、「albatross」をキーワードとし、且つユーザ2が次に用いると予想される単語のリスト「Lonesome, George, gorilla」を提示するといったサービスを提供することが可能となる。
また、ユーザ2の後にユーザ3が単語「albatross」を入力した場合も、ユーザ2とユーザ4の検索履歴、検索行動モデル、単語リスト、関連性指標値に基づいてユーザ3が次に用いると予想される単語のリストがユーザ3に提示される。
以上のとおり、本発明の単語間意味関係測定装置は、其々のユーザが利用した単語の意味関係を示唆する検索履歴を利用する。
また、情報検索においてユーザの入力する単語を変更する動機は、個々のユーザの利用した単語及びそれらの単語の数値化された関係に反映されるため、検索行動モデルにより単語間の数値を算出することで、その単語を用いたユーザの動機を推定し、その動機の下で単語の意味関係を測定することができるようになる。
したがって、従来はユーザ自身が行っていた単語間の意味分析を自動的に行うことが可能となり、時間及びコストを低減することが可能となる。
また、上記の単語間意味関係測定装置としては、CPU(Central Processing Unit)、ハードディスクドライブ、ROM(Read Only Memory)、RAM(Random Access Memory)、キーボード、ディスプレイ、フレキシブルディスクドライブ、通信ネットワークに接続して通信を行うための通信部等を有したコンピュータを用いることが可能である。これにあたっては、コンピュータに前述の各動作を実行させるための単語間意味関係測定プログラムを読み取らせ、実行させる。
したがって、上記の単語間意味関係測定プログラムと、このプログラムを記録したフレキシブルディスク、CD−ROM(Compact Disk Read Only Memory)、PCカード等のコンピュータで読み取り可能なプログラム記録媒体も本発明の範囲に含まれる。また、上記のような単語間意味関係測定装置を用いる単語間意味関係測定方法も本発明の範囲に含まれる。
本発明の一実施例に係る単語間意味関係測定装置の構成を示す図である。 図1の単語間意味関係測定装置による単語の提示を説明するための図である。
符号の説明
1 単語間意味関係測定装置
11 単語化部
12 該当ページ検索部
13 単語提示部
14 検索履歴生成部
15 該当単語リスト検索部
16 関係性測定部
17 単語リストDB(データベース)
18 関係性指標値DB(データベース)
19 検索シーケンス生成部
20 単語リスト作成部
21 関係性指標値算出部

Claims (28)

  1. ユーザの検索行動をモデリングした検索行動モデルを用いることにより任意の単語間の意味関係を測定し、ユーザにより単語が入力されると、前記測定の結果に基づいて、前記入力された単語に対して定義された意味関係毎に関係性が強い単語を前記ユーザに提示する提示手段を有することを特徴とする単語間意味関係測定装置。
  2. 前記提示手段は、前記単語の提示を行うために、ユーザの検索履歴を生成する検索履歴生成手段を有することを特徴とする請求項1に記載の単語間意味関係測定装置。
  3. 前記提示手段は、前記検索履歴をユーザ単位毎に分類し、且つ時系列順に整理した検索シーケンスを生成する検索シーケンス生成手段を有することを特徴とする請求項2に記載の単語間意味関係測定装置。
  4. 前記検索シーケンスから単語リストを作成する単語リスト作成手段を有することを特徴とする請求項3に記載の単語間意味関係測定装置。
  5. 前記単語の其々に対して前記検索行動モデルを用いることにより、単語間の関係性を示す関係性指標値を算出する関係性指標値算出手段を有し、
    前記提示手段は、前記関係性指標値に基づいて前記単語間の意味関係を測定する
    ことを特徴とする請求項1乃至4のいずれか1項に記載の単語間意味関係測定装置。
  6. 前記検索シーケンスから前記検索行動モデルを作成する検索行動モデル作成手段を有することを特徴とする請求項3乃至5のいずれか1項に記載の単語間意味関係測定装置。
  7. 前記検索行動モデル作成手段は、前記検索シーケンスに含まれる単語の出現順序、出現時間間隔、出現位置間隔、出現回数を組み合わせることにより前記検索行動モデルを作成することを特徴とする請求項6に記載の単語間意味関係測定装置。
  8. 前記検索行動モデル作成手段は、前記検索におけるユーザの検索要求の内容を別表現、具体化、同概念及び興味の変化の各項目に分類し、其々に対応する検索行動モデルを作成することを特徴とする請求項6又は7に記載の単語間意味関係測定装置。
  9. 前記検索におけるユーザの検索要求の内容を別表現、具体化、同概念及び興味の変化の各項目に分類し、前記各項目に基づいて前記単語の其々と前記検索検索行動モデルとを対応付ける対応付け手段を有することを特徴とする請求項5乃至8のいずれか1項に記載の単語間意味関係測定装置。
  10. 前記検索行動モデル生成手段は、前記ユーザの検索の巧拙を判断し、該判断した巧拙に基づいて前記検索行動モデルを作成することを特徴とする請求項6乃至9のいずれか1項に記載の単語間意味関係測定装置。
  11. 前記検索行動モデル生成手段は、前記検索シーケンスに含まれる隣接した単語が出現した時間との間隔に基づいて前記ユーザの検索の巧拙を判断することを特徴とする請求項10に記載の単語間意味関係測定装置。
  12. 前記ユーザの検索の巧拙を用いてフィルタリングを行うことを特徴とする請求項10又は11に記載の単語間意味関係測定装置。
  13. 前記別表現に対応する検索行動モデルを作成するにあたっては、前記単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、該単語リストのキーをkey、そのリスト内の単語をwordとして、前記keyと前記wordとの間に出現する単語の数の平均値を算出し、該平均値の小さい順に前記keyに対して前記別表現に含まれる前記単語と前記wordを測定し、前記具体化に対応する検索行動モデルを作成するにあたっては、前記単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、前記keyが前記wordの前に出現する検索シーケンスの数を算出し、該検索シーケンスの数の大きい順に前記keyに対して前記具体化に含まれる前記単語と前記wordを測定し、前記抽象化に対応する検索行動モデルを作成するにあたっては、前記単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、前記keyが前記wordの前に出現する検索シーケンスの数を算出し、該検索シーケンスの数の大きい順に前記keyに対して前記抽象化に含まれる前記単語と前記wordを測定し、前記概念に対応する検索行動モデルを作成するにあたっては、前記単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、前記keyと前記wordとの間に出現する単語の数の平均値を算出し、該平均値の小さい順に前記keyに対して前記同概念に含まれる前記単語と前記wordを測定し、前記興味の変化に対応する検索行動モデルを作成するにあたっては、前記単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、前記wordを含む検索シーケンスの数を前記keyと前記wordが同時に出現する検索シーケンスで割り、この値の大きい順に前記keyに対して興味の変化に含まれる前記単語と前記wordを測定することを特徴とする請求項7乃至12のいずれか1項に記載の単語間意味関係測定装置。
  14. ユーザの検索行動をモデリングした検索行動モデルを用いることにより任意の単語間の意味関係を測定し、ユーザにより単語が入力されると、前記測定の結果に基づいて、前記入力された単語に対して定義された意味関係毎に関係性が強い単語を前記ユーザに提示する提示ステップを有することを特徴とする単語間意味関係測定方法。
  15. 前記提示ステップは、前記単語の提示を行うために、ユーザの検索履歴を生成する検索履歴生成ステップを有することを特徴とする請求項14に記載の単語間意味関係測定方法。
  16. 前記提示ステップは、前記検索履歴をユーザ単位毎に分類し、且つ時系列順に整理した検索シーケンスを生成する検索シーケンス生成ステップを有することを特徴とする請求項15に記載の単語間意味関係測定方法。
  17. 前記検索シーケンスから単語リストを作成する単語リスト作成ステップを有することを特徴とする請求項16に記載の単語間意味関係測定方法。
  18. 前記単語の其々に対して前記検索行動モデルを用いることにより、単語間の関係性を示す関係性指標値を算出する関係性指標値算出ステップを有し、
    前記提示ステップは、前記関係性指標値に基づいて前記単語間の意味関係を測定する
    ことを特徴とする請求項14乃至17のいずれか1項に記載の単語間意味関係測定方法。
  19. 前記検索シーケンスから前記検索行動モデルを作成する検索行動モデル作成ステップを有することを特徴とする請求項16乃至18のいずれか1項に記載の単語間意味関係測定方法。
  20. 前記検索行動モデル作成ステップは、前記検索シーケンスに含まれる単語の出現順序、出現時間間隔、出現位置間隔、出現回数を組み合わせることにより前記検索行動モデルを作成することを特徴とする請求項19に記載の単語間意味関係測定方法。
  21. 前記検索行動モデル作成ステップは、前記検索におけるユーザの検索要求の内容を別表現、具体化、同概念及び興味の変化の各項目に分類し、其々に対応する検索行動モデルを作成することを特徴とする請求項19又は20に記載の単語間意味関係測定方法。
  22. 前記検索におけるユーザの検索要求の内容を別表現、具体化、同概念及び興味の変化の各項目に分類し、前記各項目に基づいて前記単語の其々と前記検索検索行動モデルとを対応付ける対応付けステップを有することを特徴とする請求項18乃至21のいずれか1項に記載の単語間意味関係測定方法。
  23. 前記検索行動モデル生成ステップは、前記ユーザの検索の巧拙を判断し、該判断した巧拙に基づいて前記検索行動モデルを作成することを特徴とする請求項19乃至22のいずれか1項に記載の単語間意味関係測定方法。
  24. 前記検索行動モデル生成ステップは、前記検索シーケンスに含まれる隣接した単語が出現した時間との間隔に基づいて前記ユーザの検索の巧拙を判断することを特徴とする請求項23に記載の単語間意味関係測定方法。
  25. 前記ユーザの検索の巧拙を用いてフィルタリングを行うことを特徴とする請求項23又は24に記載の単語間意味関係測定方法。
  26. 前記別表現に対応する検索行動モデルを作成するにあたっては、前記単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、該単語リストのキーをkey、そのリスト内の単語をwordとして、前記keyと前記wordとの間に出現する単語の数の平均値を算出し、該平均値の小さい順に前記keyに対して前記別表現に含まれる前記単語と前記wordを測定し、前記具体化に対応する検索行動モデルを作成するにあたっては、前記単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、前記keyが前記wordの前に出現する検索シーケンスの数を算出し、該検索シーケンスの数の大きい順に前記keyに対して前記具体化に含まれる前記単語と前記wordを測定し、前記抽象化に対応する検索行動モデルを作成するにあたっては、前記単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、前記keyが前記wordの前に出現する検索シーケンスの数を算出し、該検索シーケンスの数の大きい順に前記keyに対して前記抽象化に含まれる前記単語と前記wordを測定し、前記概念に対応する検索行動モデルを作成するにあたっては、前記単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、前記keyと前記wordとの間に出現する単語の数の平均値を算出し、該平均値の小さい順に前記keyに対して前記同概念に含まれる前記単語と前記wordを測定し、前記興味の変化に対応する検索行動モデルを作成するにあたっては、前記単語の出現した時間との間隔を閾値としてフィルタリングを行うことにより単語リストを作成し、前記wordを含む検索シーケンスの数を前記keyと前記wordが同時に出現する検索シーケンスで割り、この値の大きい順に前記keyに対して興味の変化に含まれる前記単語と前記wordを測定することを特徴とする請求項20乃至25のいずれか1項に記載の単語間意味関係測定方法。
  27. コンピュータに請求項14乃至26のいずれか1項に記載の単語間意味関係測定方法を実行させることを特徴する単語間意味関係測定プログラム。
  28. 請求項27に記載の単語間意味関係測定プログラムを記録したことを特徴とするプログラム記録媒体。
JP2003273734A 2003-07-11 2003-07-11 単語間意味関係測定装置、単語間意味関係測定方法、単語間意味関係測定プログラム及びプログラム記録媒体 Pending JP2005032193A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003273734A JP2005032193A (ja) 2003-07-11 2003-07-11 単語間意味関係測定装置、単語間意味関係測定方法、単語間意味関係測定プログラム及びプログラム記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003273734A JP2005032193A (ja) 2003-07-11 2003-07-11 単語間意味関係測定装置、単語間意味関係測定方法、単語間意味関係測定プログラム及びプログラム記録媒体

Publications (1)

Publication Number Publication Date
JP2005032193A true JP2005032193A (ja) 2005-02-03

Family

ID=34210888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003273734A Pending JP2005032193A (ja) 2003-07-11 2003-07-11 単語間意味関係測定装置、単語間意味関係測定方法、単語間意味関係測定プログラム及びプログラム記録媒体

Country Status (1)

Country Link
JP (1) JP2005032193A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008541220A (ja) * 2005-05-06 2008-11-20 エヌエイチエヌ コーポレーション 個人化検索方法および個人化検索システム
JP2008544377A (ja) * 2005-06-20 2008-12-04 イーベイ インク. 関連した検索クエリを作り出すシステム
JP2012528406A (ja) * 2009-05-27 2012-11-12 マイクロソフト コーポレーション 検索結果のマージ
US8606811B2 (en) 2007-06-08 2013-12-10 Ebay Inc. Electronic publication system
US8712868B2 (en) 2002-10-21 2014-04-29 Ebay Inc. Listing recommendation using generation of a user-specific query in a network-based commerce system
JP2023039158A (ja) * 2021-09-08 2023-03-20 カシオ計算機株式会社 情報処理装置、情報処理方法、及び、情報処理プログラム

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712868B2 (en) 2002-10-21 2014-04-29 Ebay Inc. Listing recommendation using generation of a user-specific query in a network-based commerce system
JP4648455B2 (ja) * 2005-05-06 2011-03-09 エヌエイチエヌ コーポレーション 個人化検索方法および個人化検索システム
JP2008541220A (ja) * 2005-05-06 2008-11-20 エヌエイチエヌ コーポレーション 個人化検索方法および個人化検索システム
US9183309B2 (en) 2005-06-20 2015-11-10 Paypal, Inc. System to generate related search queries
JP2008544377A (ja) * 2005-06-20 2008-12-04 イーベイ インク. 関連した検索クエリを作り出すシステム
JP4813552B2 (ja) * 2005-06-20 2011-11-09 イーベイ インク. 関連した検索クエリを作り出すシステム
US8200687B2 (en) 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US9892156B2 (en) 2005-06-20 2018-02-13 Paypal, Inc. System to generate related search queries
US8606811B2 (en) 2007-06-08 2013-12-10 Ebay Inc. Electronic publication system
US9495460B2 (en) 2009-05-27 2016-11-15 Microsoft Technology Licensing, Llc Merging search results
JP2012528406A (ja) * 2009-05-27 2012-11-12 マイクロソフト コーポレーション 検索結果のマージ
JP2023039158A (ja) * 2021-09-08 2023-03-20 カシオ計算機株式会社 情報処理装置、情報処理方法、及び、情報処理プログラム
JP7359196B2 (ja) 2021-09-08 2023-10-11 カシオ計算機株式会社 情報処理装置、情報処理方法、及び、情報処理プログラム

Similar Documents

Publication Publication Date Title
CN110443571A (zh) 基于知识图谱进行简历评估的方法、装置及设备
CN110795913B (zh) 一种文本编码方法、装置、存储介质及终端
JP2005122295A (ja) 関係図作成プログラム、関係図作成方法、および関係図作成装置
CN109684402A (zh) 一种基于大数据平台元数据血缘关系实现方法
JP4613346B2 (ja) キーワード抽出方法、キーワード抽出プログラムおよびキーワード抽出装置、並びにメタデータ作成方法、メタデータ作成プログラムおよびメタデータ作成装置
JP2008123526A (ja) 情報検索方法及び装置
CN112559691B (zh) 语义相似度的确定方法及确定装置、电子设备
JP2005032193A (ja) 単語間意味関係測定装置、単語間意味関係測定方法、単語間意味関係測定プログラム及びプログラム記録媒体
JP5890385B2 (ja) データ処理装置、及びデータ処理方法
JP2009211280A (ja) オンラインページ分析方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2010092357A (ja) 施設関連情報検索方法および施設関連情報検索システム
JP5461388B2 (ja) Wwwを情報源として記述的な回答が可能な質問応答システム
JP7282014B2 (ja) ワークショップ支援システム及びワークショップ支援方法
JP2010272075A (ja) 感性情報抽出装置、感性検索装置、その方法およびプログラム
JP6521931B2 (ja) モデル生成装置、クリックログ正解尤度算出装置、文書検索装置、方法、及びプログラム
CN109189955A (zh) 一种自动检索关键词的确定方法和装置
JP4428703B2 (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
JP2006293616A (ja) 文書集約方法及び装置及びプログラム
JP5977199B2 (ja) 地域連想語抽出装置、地域連想語抽出方法及び地域連想語抽出プログラム
Toews et al. Determining Domain-Specific Differences of Polysemous Words Using Context Information.
JP2008250409A (ja) 典型文分析装置、その方法及びそのプログラム
JP5199968B2 (ja) キーワードタイプ判定装置、キーワードタイプ判定方法およびキーワードタイプ判定プログラム
JP5277090B2 (ja) リンク作成支援装置、リンク作成支援方法およびプログラム
CN111104485A (zh) 一种产品文本的确定方法、装置、计算机设备和介质
JP2007026116A (ja) 概念検索システム及び概念検索方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090414