JP2009093581A - 類義語検索管理システム - Google Patents
類義語検索管理システム Download PDFInfo
- Publication number
- JP2009093581A JP2009093581A JP2007266107A JP2007266107A JP2009093581A JP 2009093581 A JP2009093581 A JP 2009093581A JP 2007266107 A JP2007266107 A JP 2007266107A JP 2007266107 A JP2007266107 A JP 2007266107A JP 2009093581 A JP2009093581 A JP 2009093581A
- Authority
- JP
- Japan
- Prior art keywords
- synonym
- search
- management database
- search condition
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】多種多様な意味をもつ類義語が検索条件として展開されても、意図した検索結果を的確に得ること。
【解決手段】本発明は、検索語を受け付ける処理受け付け部1と、受け付けた検索語に対応して固有分類と類義語識別符号とを格納するとともに類義語の使用頻度を格納する類義語管理データベース11と、検索語およびこの検索語と論理和で連結された類義語を受け付けた際、類義語管理データベース11に類義語を登録する処理、および類義語が既に登録されている場合にはその類義語の使用頻度の値を更新する処理を行う類義語管理データベース更新処理部4と、検索語と類義語への展開の指示を受け付けた場合、類義語管理データベース11に登録された検索語と対応する類義語を使用頻度の値および固有分類を読み出して検索条件を作成する検索条件拡張部2と、作成した検索条件に基づき情報の検索を行う検索実行部3とを備える類義語検索管理システムである。
【選択図】図1
【解決手段】本発明は、検索語を受け付ける処理受け付け部1と、受け付けた検索語に対応して固有分類と類義語識別符号とを格納するとともに類義語の使用頻度を格納する類義語管理データベース11と、検索語およびこの検索語と論理和で連結された類義語を受け付けた際、類義語管理データベース11に類義語を登録する処理、および類義語が既に登録されている場合にはその類義語の使用頻度の値を更新する処理を行う類義語管理データベース更新処理部4と、検索語と類義語への展開の指示を受け付けた場合、類義語管理データベース11に登録された検索語と対応する類義語を使用頻度の値および固有分類を読み出して検索条件を作成する検索条件拡張部2と、作成した検索条件に基づき情報の検索を行う検索実行部3とを備える類義語検索管理システムである。
【選択図】図1
Description
本発明は、固有分類が付された情報について検索語に適した類義語を利用した検索を行う類義語検索管理システムに関する。
一般に、データベースに蓄積された情報の検索を行う場合、キーワードとなる検索語を指定することで、その検索語を含む情報を抽出する検索システムが用いられる。また、データベースに蓄積される情報には、予め固有の分類が付されており、この固有分類を指定した検索も行うことができるようになっている。
例えば、特許庁が一般に開放しているIPDL(特許電子図書館)や民間が行う有料サービスの「特許検索システム」では、所望する特許文献を探す作業として、既存の特許情報に対して「検索語」を指示して、全文に対して検索を行うことが一般的である。また、データベースとして蓄積される特許文献には、IPCやFI、Fタームといった固有分類が付されており、これらの固有分類を指定した検索も行うことができるようになっている。
この時、単純かつ少ない「検索語」の指定では、膨大な件数がヒットするため、通常「検索語」を論理積(AND)で組み合わせて検索結果を絞り込む。しかし、意味が違う言葉をANDで組み合わせるだけでは、漏れが発生しやすく精度の高い検索ができない。そこで、1つの検索語の同義語を論理和(OR)で展開することも可能である。
ここで、人が類義語を思考しなから導き出すことは困難な作業となる。一般的には、その作業をシステムが「言葉」に対する類似した「言葉」として辞書(類義語辞書またはシソーラス辞書)に登録されたものを参照する技術が用いられる(例えば、特許文献1、2参照。)。
しかしながら、一般的な類義語辞書は、検索語の類似した言葉を展開するものであり、特にアルファベット3文字が類義語として展開された場合、検索結果には意図しない結果が含まれることになる。また、類義語辞書のメンテナンスにおいては、技術分野に特化した精度の高い辞書を提供するために、システム毎、またはユーザ毎の類義語辞書カスタマイズが必要になり、辞書の更新を管理者で行う場合、多大な作業負荷を強いられることになる。
本発明は、多種多様な意味をもつ類義語が検索条件として展開されても、意図した検索結果を的確に得ることができ、また、類義語に関するデータベースの更新を容易に行うことができる技術を提供することを目的とする。
本発明は、このような目的を達成するために成されたものである。すなわち、本発明は、検索語を受け付ける処理受け付け部と、前記処理受け付け部で受け付けた検索語に対応して固有分類と類義語識別符号とを格納する検索キーワードテーブル、および前記類義語識別符号によって対応付けされた類義語と使用頻度とを格納する類義語テーブルを備えた類義語管理データベースと、前記処理受け付け部で検索語およびこの検索語と論理和で連結された類義語を受け付けた際、前記類義語管理データベースにおいて前記検索語の登録された前記類義語識別符号に対応付けして前記類義語を前記類義語テーブルに登録する処理、および前記類義語が既に登録されている場合にはその類義語の前記使用頻度の値を更新する処理を行う類義語管理データベース更新処理部と、前記処理受け付け部で検索語の受け付けおよび類義語への展開の指示を受け付けた場合、前記類義語管理データベースに登録された前記検索語と対応する類義語を前記使用頻度の値に応じて読み出すとともに、前記検索語と対応する前記固有分類を読み出して検索条件を作成する検索条件拡張部と、前記検索条件拡張部で作成した検索条件に基づき情報の検索を行う検索実行部とを備える類義語検索管理システムである。
また、本発明は、上記類義語検索管理システムにおいて、前記検索条件拡張部が、前記使用頻度の値が閾値以上の場合のみ該当する類義語を読み出すものである。
また、本発明は、上記類義語検索管理システムにおいて、前記類義語管理データベースにおける前記類義語テーブルには前記使用頻度が更新された日時情報が格納されており、前記類義語管理データベース更新処理部が、前記日時情報が所定の日時より前となる類義語を前記類義語管理データベースから削除する処理を行うものである。
また、本発明は、上記類義語検索管理システムにおいて、前記類義語管理データベース更新処理部が、前記検索実行部で検索した結果に基づく固有分類の出現頻度から前記検索語に対応した固有分類の抽出を行い、前記類義語管理データベースの前記検索キーワードテーブルに登録するものである。
また、本発明は、上記類義語検索管理システムにおいて、前記類義語管理データベースにおける前記類義語テーブルには前記使用頻度が更新された日時情報が格納されており、前記類義語管理データベース更新処理部が、前記日時情報が所定の日時より前であり、かつ前記使用頻度の値が閾値に満たない類義語を前記類義語管理データベースから削除する処理を行うものである。
また、本発明は、上記類義語検索管理システムにおいて、前記検索条件拡張部が、前記使用頻度の値が閾値以上の場合のみ該当する類義語を読み出す場合、前記処理受け付け部で受け付けた展開レベルに応じて前記閾値を切り替えるものである。
本発明によれば、指定された検索語から多種多様な意味をもつ類義語が検索条件として展開されても、意図した検索結果を的確に得ることが可能となる。また、類義語に関するデータベースの更新を容易に行うことが可能となる。
以下、本発明の実施の形態を図に基づき説明する。
<システム構成>
図1は、本実施形態に係る類義語検索管理システムを説明する構成図である。本実施形態の類義語検索管理システムは、検索条件を指定するクライアントおよび検索対象となるデータベース(ここでは、文書インデックス)を備えるサーバのうち、主としてサーバ内に設けられるものであり、クライアントが指定した検索条件のうち検索語について、的確な類義語を自動的に検索条件として指定できるシステムである。
図1は、本実施形態に係る類義語検索管理システムを説明する構成図である。本実施形態の類義語検索管理システムは、検索条件を指定するクライアントおよび検索対象となるデータベース(ここでは、文書インデックス)を備えるサーバのうち、主としてサーバ内に設けられるものであり、クライアントが指定した検索条件のうち検索語について、的確な類義語を自動的に検索条件として指定できるシステムである。
ここで、本実施形態では、共有リソースとして保持する類義語辞書(類義語管理データベース)に、新たな類義語を追加する場合の類似性判断の1つとして、必ず情報に付与されている固有分類コードを用いる。例えば、特許文献の場合には、固有分類コードとしてIPC、FI、Fターム等が用いられる。そして、類義語辞書には固有分類コードを検索語と共に保持することで、精度の高い検索結果を得ることができるようにする。また、クライアント(ユーザ)が指定した検索語に対応する類義語を展開するにあたり、類義語管理データベースの類義語登録状況とユーザが指定した類義語展開レベルに応じて判断するものである。
クライアントは、ユーザが用いるパーソナルコンピュータによって実現され、ここで実行されるプログラムによって検索画面の表示が行われる。この検索画面を介してユーザから検索条件と類義語展開の有無の入力を受け付ける。検索画面で受け付けた情報は、所定の通信手段(LANやインターネット)を介してサーバへ通知される。
サーバには、処理受け付け部1、検索条件拡張部2、検索実行部3、類義語管理データベース更新処理部4、結果表示部5が設けられている。また、検索対象となる文書インデックス10、類義語に関する情報が格納される類義語管理データベース11、検索結果を格納する検索結果格納部12も設けられている。
(処理受け付け部)
処理受け付け部1は、クライアントの検索画面に入力され、通知された検索語や類義語展開レベル(例えば、「なし」、「狭く」、「広く」)を受け付ける処理を行う。
処理受け付け部1は、クライアントの検索画面に入力され、通知された検索語や類義語展開レベル(例えば、「なし」、「狭く」、「広く」)を受け付ける処理を行う。
(検索条件拡張部)
検索条件拡張部2は、処理受け付け部1で受信したクライアントからの検索条件のなかに類義語展開レベルが指定されていた場合、類義語管理データベース11を参照してクライアントが指定した検索語に適した類義語を自動的に抽出し、新たな検索条件を作成する処理を行う。
検索条件拡張部2は、処理受け付け部1で受信したクライアントからの検索条件のなかに類義語展開レベルが指定されていた場合、類義語管理データベース11を参照してクライアントが指定した検索語に適した類義語を自動的に抽出し、新たな検索条件を作成する処理を行う。
ここで、類義語管理データベース11について説明する。類義語管理データベース11は、図2に示す検索キーワードテーブルと、図3に示す類義語テーブルとで構成される。図2に示す検索キーワードテーブルは、処理受け付け部で受け付けた検索語に対応して固有分類コードと類義語IDとを格納するテーブルである。この検索キーワードテーブルには、いままで検索語として指定された検索語(キーワード)が登録され、各検索語(キーワード)で検索した結果から抽出される固有分類が対応付けされている。また、各検索語(キーワード)について論理和(OR)で指定された検索語(ここではこれを類義語とする)について管理するための類義語IDを登録している。
また、図3に示す類義語テーブルは、類義語IDによって対応付けされた類義語と、その使用頻度と、最終使用日時とを格納するテーブルである。この類義語テーブルでは、類義語IDについて類義語が登録されており、各類義語について使用頻度を示す類義語使用ポイントと最終使用日時を示す類義語最終使用日時とが対応付けされている。
これら検索キーワードテーブルと類義語テーブルとを用いることで、ある検索語(キーワード)についての固有分類コードと、類義語IDに対応付けされた類義語とが参照できるようになる。各テーブルは、後述する類義語管理データベース更新処理部4によって登録、更新される。
検索条件拡張部2は、処理受け付け部1で受信した類義語展開指示があった場合、クライアントが通知した検索条件から検索語(キーワード)を抽出する処理を行う。そして、抽出した検索語(キーワード)を用いて類義語管理データベース11の検索キーワードテーブル(図2)を参照し、検索語(キーワード)が一致するレコードを取得する処理を行う。
また、取得した上記レコードの検索語(キーワード)に対応した類義語IDから類義語テーブル(図3)を参照して、「類義語使用ポイント値」と「類義語最終使用日時」が、ある閾値以上の類義語を取得する。ここで、閾値は、クライアントが通知した類義語展開レベルに応じて決定される。
そして、類義語管理データベース11から取得した上記情報を元に、検索語に対応した固有分類と類義語が展開された検索条件を作成する。作成される検索条件は、例えば、検索語に類義語を論理和(OR)で連結し、固有分類コードを論理積(AND)で連結したものとなる。なお、他の論理式による検索条件でもよいが、検索条件拡張部2は、クライアントが通知した類義語展開レベルに応じて検索語と固有分類と類義語とを所定の演算子で連結し、検索条件を作成することになる。作成された検索条件は、検索実行部3へ渡される。
(検索実行部)
検索実行部3は、検索条件拡張部2で生成された検索条件を用いて文書インデックス10の情報に対する検索を実行して、検索結果を取得する。取得した検索結果は、検索結果格納部12に格納する。
検索実行部3は、検索条件拡張部2で生成された検索条件を用いて文書インデックス10の情報に対する検索を実行して、検索結果を取得する。取得した検索結果は、検索結果格納部12に格納する。
(類義語管理データベース更新処理部)
類義語管理データベース更新処理部4は、検索結果格納部12の検索結果から、各検索キーワードが含まれる文書IDリストを抽出する。
類義語管理データベース更新処理部4は、検索結果格納部12の検索結果から、各検索キーワードが含まれる文書IDリストを抽出する。
また、類義語管理データベース更新処理部4は、検索結果格納部12の検索結果から、入力された検索キーワードの出現率を抽出する。さらに、類義語管理データベース更新処理部4は、検索結果格納部12の検索結果から、固有分類コードを抽出する。そして、上記抽出情報から入力された検索キーワードの類似性を判断する。判断条件は次の通りである。
1.各検索キーワードが含まれる分書IDリストの重なりが一定割合以下であること。この重なりが少ないほど類似語として意味があるためである。
2.各検索キーワードの出現率が10%以下であること。
3.固有分類コードの分布度合いが類似していること。
2.各検索キーワードの出現率が10%以下であること。
3.固有分類コードの分布度合いが類似していること。
上記1〜3の全ての条件を満たしている場合に類似性ありと判断する。この判断によって、類似性ありとなった場合、類義語管理データベース11を参照し、その類似語が類義語テーブルに存在しない場合は、新たな類義語として追加登録する。この時、「類義語使用ポイント値」は「1」、「類義語最終使用日時」は現在日時とする。なお、日時は日付と時間で構成されるが、必要に応じて日付だけで構成してもよい。
一方、その類似語がすでに類義語テーブルに存在している場合には、その類義語の、「類義語使用ポイント値」を1加算し、「類義語最終使用日時」を現在の日時に更新する。さらに、検索条件に固有分類コードが指定されていた場合は、類義語管理データベース11の固有分類コードと比較して、類似性があれば、「類義語使用ポイント値」を1加算する。
また、類義語展開指示なしの場合、類義語管理データベース11の類義語テーブルから「類義語使用ポイント値」と「類義語最終使用日時」を参照して不要な類義語と判断した場合、該当する類義語を類義語テーブルから削除する。判断条件の例としては次の通りである。
1.類義語使用ポイント値が一定値(閾値)以下であること。
2.類義語最終使用日時が一定日時以前であること。
2.類義語最終使用日時が一定日時以前であること。
上記1〜2の全ての条件を満たしている場合に類義語テーブルから該当する類義語を削除する。これにより、類義語として適さないものがデータベースに残ることを防止できる。
(結果表示部)
結果表示部5は、検索結果格納部12の検索結果を成形してクライアントに返す処理を行う。
結果表示部5は、検索結果格納部12の検索結果を成形してクライアントに返す処理を行う。
<システム動作の概要>
次に、本実施形態に係る類義語検索管理システムの動作の概要を説明する。先ず、クライアントから送られた検索条件を処理受け付け部1で受け付け、この検索条件で指定された「検索語」のうち論理和(OR)で連結されている部分の検索語を「類義語候補要素」として抽出する。
次に、本実施形態に係る類義語検索管理システムの動作の概要を説明する。先ず、クライアントから送られた検索条件を処理受け付け部1で受け付け、この検索条件で指定された「検索語」のうち論理和(OR)で連結されている部分の検索語を「類義語候補要素」として抽出する。
類義語管理データベース11の検索キーワードテーブルには、「検索語(キーワード)」に対応した「固有分類コード」、「類義語ID」が登録され、類義語テーブルには、「類義語ID」に対応した「類義語」、「類義語使用ポイント値」、「類義語最終使用日時」が登録されている。
このため、検索条件で指定された、「検索語」により類義語管理データベース11を検索して、類義語展開要素である「類義語」、「固有分類コード」、「類義語使用ポイント値」、「類義語最終使用日時」を検索条件拡張部2が取得する。
検索において、クライアントが検索語から類義語への展開を指定した場合、検索条件拡張部2が検索語から類義語への展開を行う。この展開は、類義語管理データベース11の類義語テーブルにおける「類義語使用ポイント値」が、ある閾値以上であれば展開して検索条件に加え検索を実行する。
次に、検索条件から抽出した「類義語候補要素」の出現率を情報の検索結果から抽出する。また、「類義語候補要素」に対応した情報の検索結果から「固有分類コード」の分布値を算出する。また、新たな類義語候補となる「検索語」が指定された場合、類義語管理データベースに追加する。
既に類義語管理データベース11に存在する類義語候補となる「検索語」が指定された場合は、類義語管理データベース更新処理部4によって該当する「類義語使用ポイント値」を加算する。また、検索条件に固有分類コードが指定された場合は、さらに「類義語使用ポイント値」を加算する。また、「類義語使用ポイント値」を加算した類義語の「類義語最終使用日時」を更新する。
類義語管理データベース更新処理部4は、類義語管理データベース11の「類義語使用ポイント値」と「類義語最終使用日時」を参照して、ある閾値に達していなければ、類義語管理データベースから該当類義語を削除する。
このような動作となる本実施形態の類義語検索管理システムにおいては、類義語管理データベース11を情報検索サービスのシステムにおいて共通リソースとすることが望ましい。
この共有リソースとして保持する類義語辞書(類義語管理データベース11)に、新たな類義語を追加する場合の類似性判断の1つとして、必ず特許情報に付与されている固有分類コードを用いる。類義語辞書には固有分類コードを検索語と共に保持することで、精度の高い検索結果を得ることができる。また、類義語への展開の有無を類義語管理データベースの類義語登録状況とユーザが指定した類義語展開レベルに応じて判断する。
類義語への展開を指定して検索を行う場合、キーワードの類義語展開だけでなく、類義語管理データベース11に保持する展開語と固有分類コードも組みで検索することで、精度の高い検索結果を得る。
また、本実施形態の類義語検索管理システムでは、類義語管理データベース11のメンテナンス(類義語使用ポイント値の加算や類義語最終使用日時の更新、不要な類語義の削除)を自動的に行うために、検索条件で指定された検索語と固有分類コードを使用することで、類義語への展開候補の精度を高めることができる。
ここで、類義語管理データベース11に類義語の有効性として、「類義語使用ポイント値」および「類義語最終使用日時」の値を用いるが、これらの値は、検索語と固有分類コードの入力指示により加算対象となる。
また、ユーザが行う指示に類義語への展開のレベルを備えているため、上記類義語管理データベース11の「類義語使用ポイント値」と「類義語最終使用日時」によって類義語への展開の有無や展開の広さを判断して、ユーザの希望に合致した検索条件を作成することができる。
<具体例>
次に、本実施形態の類義語検索管理システムの動作の具体例を説明する。ここでは、特許情報の検索を行うにあたり、検索語として「自動原稿送り」と「ADF」とを指定する場合を例とする。
次に、本実施形態の類義語検索管理システムの動作の具体例を説明する。ここでは、特許情報の検索を行うにあたり、検索語として「自動原稿送り」と「ADF」とを指定する場合を例とする。
先ず、類義語管理データベースが初期状態となっており、「自動原稿送り」の類義語として「ADF」が登録されていない場合の動作を説明する。
1.検索条件拡張部にて、検索画面で指定された検索条件「自動原稿送り(OR)ADF」と類義語管理データベースから、検索条件の類義語への展開処理を実行する。ここで、類義語管理データベースは初期状態であり、自動原稿送りの類義語が登録されていないことから、類義語への展開を行うことなく検索実行部で検索を実行する。
2.類義語管理データベース更新処理部にて、「自動原稿送り」と「ADF」の類似性を判断するために、検索結果から次の値を抽出する。
(1)「自動原稿送り」が含まれる文書IDのリストをA、「ADF」が含まれる文書IDのリストをBとする。
(2)「自動原稿送り」が含まれる文書群から「自動原稿送り」の出現頻度Cを抽出、また、「ADF」が含まれる文書群から「ADF」の出現頻度Dを抽出する。ここで、出現頻度とは、各文書に含まれる単語を母数としたときの検索単語の比率をいう。
(3)「自動原稿送り」が含まれる文書群の固有分類(FI等)の分布値Eを抽出、また、「ADF」が含まれる固有分類(FI等)の分布値Fを抽出する。
(1)「自動原稿送り」が含まれる文書IDのリストをA、「ADF」が含まれる文書IDのリストをBとする。
(2)「自動原稿送り」が含まれる文書群から「自動原稿送り」の出現頻度Cを抽出、また、「ADF」が含まれる文書群から「ADF」の出現頻度Dを抽出する。ここで、出現頻度とは、各文書に含まれる単語を母数としたときの検索単語の比率をいう。
(3)「自動原稿送り」が含まれる文書群の固有分類(FI等)の分布値Eを抽出、また、「ADF」が含まれる固有分類(FI等)の分布値Fを抽出する。
上記内容をまとめると図4に示すようになる。また、図5は、分布値の算出について説明する図である。このように、各固有分類に対して検索結果の文書における出現文書数を求め、分布値(%)を求める。
3.上記で抽出した、A〜Fの値を使用して、「自動原稿送り」と「ADF」の類義性判断として下記の条件が全て満たされていたら類似性ありと判断する。
(1)A,Bの重なりが閾値(例えば、3%)以下である場合。重なりが少ないほど類似語として意味があるためである。
(2)C,Dそれぞれの値が閾値(例えば、10%)以下である場合。「処理」、「文字」などを排除のためである。
(3)E,Fの分布度合いが類似している場合。
この判断で類似性ありとされた場合は、類義語管理データベースを更新する。
(1)A,Bの重なりが閾値(例えば、3%)以下である場合。重なりが少ないほど類似語として意味があるためである。
(2)C,Dそれぞれの値が閾値(例えば、10%)以下である場合。「処理」、「文字」などを排除のためである。
(3)E,Fの分布度合いが類似している場合。
この判断で類似性ありとされた場合は、類義語管理データベースを更新する。
図6は、更新された類義語管理データベースの例を示す図で、(a)は検索キーワードテーブル、(b)は類義語テーブルである。上記の動作によって、図6(a)に示す検索キーワードテーブルに検索語(キーワード)として「自動原稿送り」が登録され、これに対応して固有分類(IPC)、固有分類(FI)、固有分類(Fターム)が登録され。また、上記類似性の判断で類似性ありとなった場合、類義語IDが登録される。この類義語IDは類義語テーブルのキーとなっており、図6(b)に示す類義語テーブルには「類義語ID」に対応して、「類義語」に「ADF」が登録される。また、これに対応して、「類義語使用ポイント値」、「類義語最終使用日時」が登録される。
次に、類義語管理データベースに自動原稿送り、ADF以外に類義語として「オートフィーダー」が存在する場合の動作を説明する。
1.検索条件拡張部にて、検索画面で指定された検索条件「自動原稿送り(OR)ADF」と類義語管理データベースから、検索条件の類義語への展開処理を実行する。ここで、類義語管理データベースには、自動原稿送りの類義語として「ADF」と「オートフィーダー」が登録されているため、ユーザから指定された類義語展開レベルに応じて、「オートフィーダー」の「類義語使用ポイント値」と「類義語最終使用日時」を参照し、展開の有無を決定する。
図7は、類義語展開レベルに応じた「類義語使用ポイント値」と「類義語最終使用日時」との条件の一例を説明する図である。ここでは、類義語展開レベルとして、「狭い」と「広い」とが設けられており、各レベルに応じた「類義語使用ポイント値」と「類義語最終使用日時」とが設定されている。
例えば、類義語展開レベルが「狭い」の場合、「類義語使用ポイント値」が6ポイント以上、「類義語最終使用日時」が3ヶ月以上経過している類義語を抽出する。また、類義語展開レベルが「広い」の場合、「類義語使用ポイント値」が3ポイント以上、「類義語最終使用日時」が6ヶ月以上経過している類義語を抽出する。なお、この条件は、ユーザの規模やシステムの使用頻度により変更可能なように環境ファイル参照型にしておくことが望ましい。
上記条件が満たされていれば、検索条件を例えば次のように展開する。
((KEYWORD=自動原稿送り) OR (KEYWORD=ADF) OR (KEYWORD=オートフィーダー)) AND (FI= G03G 21/00 OR G03G 15/00 OR H04N 1/00 OR IPC=XX OR Fターム=XX))
2.類義語管理データベースの自動原稿送り類義語として登録されているADFの「類義語使用ポイント値」に1を加算し、「類義語最終使用日時」に現在日付を設定する。
((KEYWORD=自動原稿送り) OR (KEYWORD=ADF) OR (KEYWORD=オートフィーダー)) AND (FI= G03G 21/00 OR G03G 15/00 OR H04N 1/00 OR IPC=XX OR Fターム=XX))
2.類義語管理データベースの自動原稿送り類義語として登録されているADFの「類義語使用ポイント値」に1を加算し、「類義語最終使用日時」に現在日付を設定する。
これにより、検索条件が、当初指定した「自動原稿送り(OR)ADF」から拡張した条件となり、精度の高い検索を行うことが可能となる。
ここで、検索条件の展開について図8を用いて説明する。検索条件の展開は、類義語管理データベースの類義語の登録状態、類義語展開レベルによって入力された検索条件の展開語の条件が変わることになる。
例えば、類義語管理データベースに類義語が登録されていない場合、類義語展開レベルがなしでは、入力された検索条件がそのまま適用され、類義語管理データベースに入力された検索条件にある類義語を登録する。一方、類義語展開レベルがある場合、入力された検索条件に固有分類を加えた検索条件を適用する。
また、類義語管理データベースに検索条件と同じ類義語が登録されている場合、類義語展開レベルがなしでは、入力された検索条件がそのまま適用され、類義語使用ポイント値が加算される。一方、類義語展開レベルがある場合、入力された検索条件に固有分類を加えた検索条件を適用し、類義語使用ポイント値が加算される。
また、類義語管理データベースに検索条件より多くの類義語が登録されている場合、類義語展開レベルがなしでは、入力された検索条件がそのまま適用され、類義語使用ポイント値が加算される。一方、類義語展開レベルがある場合、レベルの狭い、広いに応じた条件によって新たな類義語が検索条件に加わり、さらに固有分類を加えた検索条件を適用し、類義語使用ポイント値が加算される。例えば、類義語管理データベースにA,B,C,Dが登録されている状態で、指定された類義語展開レベルが狭い場合には、入力された検索条件A+Bに対して(A+B+C)*固有分類が選択され、類義語展開レベルが広い場合には、入力された検索条件A+Bに対して(A+B+C+D)*固有分類が選択される。
なお、上記説明した具体例では特許情報の検索を行うシステムへの適用について示したが、上記以外にも、ショッピングサイトなどのリコメンドシステムにおける検索や、ニュースサイトなどで検索を行う場合など、データベースに蓄積される情報に固有分類が付されたものに対して検索を行う場合、検索語と固有分類とを類義情報として扱うことで本発明を適用することが可能となる。
1…処理受け付け部、2…検索条件拡張部、3…検索実行部、4…類義語管理データベース更新処理部、5…結果表示部、10…文書インデックス、11…類義語管理データベース、12…検索結果格納部
Claims (6)
- 検索語を受け付ける処理受け付け部と、
前記処理受け付け部で受け付けた検索語に対応して固有分類と類義語識別符号とを格納する検索キーワードテーブル、および前記類義語識別符号によって対応付けされた類義語と使用頻度とを格納する類義語テーブルを備えた類義語管理データベースと、
前記処理受け付け部で検索語およびこの検索語と論理和で連結された類義語を受け付けた際、前記類義語管理データベースにおいて前記検索語の登録された前記類義語識別符号に対応付けして前記類義語を前記類義語テーブルに登録する処理、および前記類義語が既に登録されている場合にはその類義語の前記使用頻度の値を更新する処理を行う類義語管理データベース更新処理部と、
前記処理受け付け部で検索語の受け付けおよび類義語への展開の指示を受け付けた場合、前記類義語管理データベースに登録された前記検索語と対応する類義語を前記使用頻度の値に応じて読み出すとともに、前記検索語と対応する前記固有分類を読み出して検索条件を作成する検索条件拡張部と、
前記検索条件拡張部で作成した検索条件に基づき情報の検索を行う検索実行部と
を備えることを特徴とする類義語検索管理システム。 - 前記検索条件拡張部は、前記使用頻度の値が閾値以上の場合のみ該当する類義語を読み出す
ことを特徴とする請求項1記載の類義語検索管理システム。 - 前記類義語管理データベースにおける前記類義語テーブルには前記使用頻度が更新された日時情報が格納されており、
前記類義語管理データベース更新処理部は、前記日時情報が所定の日時より前となる類義語を前記類義語管理データベースから削除する処理を行う
ことを特徴とする請求項1記載の類義語検索管理システム。 - 前記類義語管理データベース更新処理部は、前記検索実行部で検索した結果に基づく固有分類の出現頻度から前記検索語に対応した固有分類の抽出を行い、前記類義語管理データベースの前記検索キーワードテーブルに登録する
ことを特徴とする請求項1記載の類義語検索管理システム。 - 前記類義語管理データベースにおける前記類義語テーブルには前記使用頻度が更新された日時情報が格納されており、
前記類義語管理データベース更新処理部は、前記日時情報が所定の日時より前であり、かつ前記使用頻度の値が閾値に満たない類義語を前記類義語管理データベースから削除する処理を行う
ことを特徴とする請求項1記載の類義語検索管理システム。 - 前記検索条件拡張部は、前記使用頻度の値が閾値以上の場合のみ該当する類義語を読み出す場合、前記処理受け付け部で受け付けた展開レベルに応じて前記閾値を切り替える
ことを特徴とする請求項1記載の類義語検索管理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007266107A JP2009093581A (ja) | 2007-10-12 | 2007-10-12 | 類義語検索管理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007266107A JP2009093581A (ja) | 2007-10-12 | 2007-10-12 | 類義語検索管理システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009093581A true JP2009093581A (ja) | 2009-04-30 |
Family
ID=40665479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007266107A Pending JP2009093581A (ja) | 2007-10-12 | 2007-10-12 | 類義語検索管理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009093581A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010110173A1 (ja) | 2009-03-26 | 2010-09-30 | Ntn株式会社 | センサ付車輪用軸受 |
JP2011013896A (ja) * | 2009-07-01 | 2011-01-20 | Mitsubishi Electric Corp | 情報抽出装置、情報抽出方法、およびデジタルテレビ |
JP2012203569A (ja) * | 2011-03-24 | 2012-10-22 | Casio Comput Co Ltd | 類義語リストの生成方法および生成装置、当該類義語リストを用いた検索方法および検索装置、ならびに、コンピュータプログラム |
JP2021086580A (ja) * | 2019-11-29 | 2021-06-03 | 株式会社AI Samurai | 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム |
-
2007
- 2007-10-12 JP JP2007266107A patent/JP2009093581A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010110173A1 (ja) | 2009-03-26 | 2010-09-30 | Ntn株式会社 | センサ付車輪用軸受 |
JP2011013896A (ja) * | 2009-07-01 | 2011-01-20 | Mitsubishi Electric Corp | 情報抽出装置、情報抽出方法、およびデジタルテレビ |
JP2012203569A (ja) * | 2011-03-24 | 2012-10-22 | Casio Comput Co Ltd | 類義語リストの生成方法および生成装置、当該類義語リストを用いた検索方法および検索装置、ならびに、コンピュータプログラム |
US8572082B2 (en) | 2011-03-24 | 2013-10-29 | Casio Computer Co., Ltd | Method and device for generating a similar meaning term list and search method and device using the similar meaning term list |
JP2021086580A (ja) * | 2019-11-29 | 2021-06-03 | 株式会社AI Samurai | 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100996311B1 (ko) | 스팸 ucc를 감지하기 위한 방법 및 시스템 | |
CN106095912B (zh) | 用于生成扩展查询词的方法和装置 | |
JP4160548B2 (ja) | 文書要約作成システム、方法、及びプログラム | |
JP2007334534A (ja) | 文字列入力装置、文字列入力方法、および、プログラム | |
JP4237813B2 (ja) | 構造化文書管理システム | |
JP2006215717A (ja) | 情報検索装置、情報検索方法および情報検索プログラム | |
JP2009093581A (ja) | 類義語検索管理システム | |
JP2006178599A (ja) | 文書検索装置および方法 | |
JP2019153271A5 (ja) | ||
JP6787755B2 (ja) | 文書検索装置 | |
US10572592B2 (en) | Method, device, and computer program for providing a definition or a translation of a word belonging to a sentence as a function of neighbouring words and of databases | |
JP2019121164A (ja) | 文書作成装置、文書作成方法、データベース構築装置、データベース構築方法、およびプログラム | |
JP5228529B2 (ja) | データ検索プログラム、データ検索装置およびデータ検索方法 | |
JP5271526B2 (ja) | 商標検索システム及び商標検索サーバ | |
JP5949034B2 (ja) | 入力支援プログラム、入力支援装置、及び入力支援方法 | |
JP2006072705A (ja) | 文書検索装置および方法 | |
JP5148583B2 (ja) | 機械翻訳装置、方法及びプログラム | |
JP2003108582A (ja) | 類義語抽出方法および文書検索装置 | |
JP2014146076A (ja) | 文字列抽出方法、文字列抽出装置、および文字列抽出プログラム | |
JP2005301855A (ja) | 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置 | |
JP7022789B2 (ja) | 文書検索装置、文書検索方法およびコンピュータプログラム | |
JP2007199987A (ja) | 特許情報検索システム | |
JP2009294768A (ja) | 情報共有装置及び情報共有プログラム | |
JP6447680B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
JP2005234635A (ja) | 文書要約装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20091009 |