JP4511892B2 - 類義語検索装置、その方法、そのプログラム、および、情報検索装置 - Google Patents
類義語検索装置、その方法、そのプログラム、および、情報検索装置 Download PDFInfo
- Publication number
- JP4511892B2 JP4511892B2 JP2004217744A JP2004217744A JP4511892B2 JP 4511892 B2 JP4511892 B2 JP 4511892B2 JP 2004217744 A JP2004217744 A JP 2004217744A JP 2004217744 A JP2004217744 A JP 2004217744A JP 4511892 B2 JP4511892 B2 JP 4511892B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- information
- synonym
- search
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
そして、本発明では、関連単語検索手段により、所定の単語に対応する単語関連情報の関連単語集合情報に対して、関連単語テーブルにおける各単語関連情報の関連単語集合情報の類似状態に関する類似度情報を演算し、この類似度情報に基づいて単語関連情報を検出しているため、関連単語テーブルを利用した簡単な演算により、類似状態に応じた類義語が検出される。
さらに、本発明では、関連単語検索手段における類似度情報の演算として、所定の単語に対応する単語関連情報の関連単語集合情報を構成する関連単語情報と、関連単語テーブルにおける単語関連情報の関連単語集合情報を構成する関連単語情報との文字列が一致する数を一致単語数として、前記関連単語テーブルに複数記憶された単語関連情報の単語情報についての総単語数を前記一致単語数で除算することで重み度情報を演算し、この重み度情報に基づいて演算しているため、関連単語テーブルを利用した類似状態に応じた類義語の検索のための類似度情報の演算が容易で、処理負荷が低減する。
以下、本発明の一実施の形態について図面を参照して説明する。本実施の形態では、本発明の類義語検索装置を備え、産業財産権として、特許、実用新案および意匠に関する文献情報を検索するための情報検索装置としての文献情報検索システムの構成について例示するが、例えば商標などの他の産業財産権に関わる文献情報や、技術文献などいずれの文献情報をも対象とすることができる。さらには、文献情報検索システムに適用する構成に限らず、例えばワードプロセッサなどの文字入力支援装置において類義語検索装置を適用するなどしてもよい。図1は、本実施の形態における文献情報検索システムの概略構成を示す概念図である。図2は、文献情報検索システムを構成する端末装置の概略構成を示すブロック図である。図3は、文献情報検索システムを構成するサーバ装置の概略構成を示すブロック図である。図4は、文献情報記憶領域のテーブル構造を概念的に示す模式図である。図5は、単語出現一覧記憶領域のテーブル構造を概念的な単語出現一覧テーブルを示す模式図である。図6は、関連単語記憶領域のテーブル構造を概念的に示す模式図である。図7は、類義語情報記憶領域のテーブル構造を概念的に示す模式図である。
W(qi,dj,q,d)=Log(総単語数/(qi=djの出現する単語数))
×(qiのキーワードの関連単語集合情報内での出現数)
×(djの単語の関連単語集合情報内での出現数)
S(q,d)=g(ΣW(qi,dj),q,d)
次に、上述した文献情報検索システム100における所定の文献情報341Aを検索する検索処理の動作について図面を参照して説明する。図8は、文献情報を検索する検索処理の動作を示すフローチャートである。
上述したように、上記実施の形態では、単語に関する単語情報342A1にその単語に関連しその単語を特徴付ける単語に関する関連単語情報343A21を複数有する関連単語集合情報343A2を1つのデータ構造として関連付けた単語関連情報343Aを複数記憶するテーブル構造に関連単語記憶領域343を構築する。そして、端末装置200からネットワーク110を介して検索要求情報を検索要求情報取得手段351が取得したことを認識すると、単語関連情報取得手段352により、関連単語記憶領域343に基づいて検索要求情報に含まれるキーワードに対応する単語情報342A1を有した単語関連情報343Aを取得する。この取得した単語関連情報343Aの関連単語集合情報343A2に類似する関連単語集合情報343A2を備えた単語関連情報343Aを、関連単語記憶領域343に基づいて関連単語検索手段353にて検索する。検出した単語関連情報343Aの単語情報342A1を、類義語選出手段354により所定の単語に対する類義語として選出させる。この単語に関連し特徴付ける単語の集合における類似性を判断する構成により、キーワードとの特徴の類似性が判断できるので、関連単語記憶領域343を利用して関連単語集合情報343A2の類似性の判断により、単語にその単語を特徴付ける単語群である関連単語集合情報343A2を関連付けた簡単なテーブル構造を利用して容易に適切な類義語を検索できる。
なお、本発明は、上述した一実施の形態に限定されるものではなく、本発明の目的を達成できる範囲で以下に示される変形をも含むものである。
220…操作手段としての端末入力手段
230…表示手段としての端末表示手段
251…入力支援手段としても機能するキーワード設定手段
254…表示制御手段としても機能する出力制御手段
341…文章記憶手段としての文献情報記憶領域
341A…文献情報
342A1…単語情報
343…関連単語テーブルを構築する関連単語記憶領域
343A…単語関連情報
343A2…関連単語集合情報
343A21…関連単語情報
350…演算手段としての類義語検索装置を構成するサーバ処理手段
351…単語情報取得手段としても機能する検索要求情報取得手段
352…単語関連情報取得手段
353…関連単語検索手段
353A…重み度演算手段
353B…類似度演算手段
354…類義語選出手段
354B1…表示制御手段としての一覧表示制御手段
354B2…単語関連情報設定手段としての単語情報設定手段
354C…類義語情報生成手段
355…検索手段
Claims (20)
- 所定の単語に対する類義語を検索する類義語検索装置であって、
複数の単語にて構成された文章に関する文章情報を複数記憶する記憶手段から抽出した前記単語に関する単語情報を取得する単語情報取得手段と、
前記単語に関する単語情報に、その単語の予め定められた範囲内に出現する前記文章中の他の単語を前記単語情報の単語に関連する関連単語として、該関連単語に関する関連単語情報を複数有する関連単語集合情報が、1つのデータ構造として関連付けられた単語関連情報が複数格納されるテーブル構造の関連単語テーブルに基づき、前記取得した単語情報の所定の単語に対応する単語関連情報を取得する単語関連情報取得手段と、
前記関連単語テーブルにおける前記取得した単語関連情報の関連単語集合情報に類似する関連単語集合情報を備えた単語関連情報を検索する関連単語検索手段と、
この関連単語検索手段にて検索された前記単語関連情報の単語情報を取得して前記所定の単語に対する類義語として選出する類義語選出手段と、を具備し、
前記関連単語検索手段は、前記所定の単語に対応する単語関連情報の関連単語集合情報に対する前記関連単語テーブルにおける単語関連情報の関連単語集合情報の類似状態に関する類似度情報を演算する際、前記所定の単語に対応する単語関連情報の関連単語集合情報を構成する各関連単語情報について、該関連単語情報と文字列が一致する関連単語情報を関連単語集合情報に有する、前記関連単語テーブルにおける前記単語関連情報の単語情報の数を一致単語数として、前記関連単語テーブルに複数記憶された単語関連情報の単語情報についての総単語数を前記一致単語数で除算することで重み度情報を演算し、この重み度情報に基づいて前記類似度情報を演算し、この演算した類似度情報に基づいて前記単語関連情報を検出する
ことを特徴とした類義語検索装置。 - 請求項1に記載の類義語検索装置であって、
前記関連単語テーブルは、文章に関する文章情報を複数記憶する文章記憶手段に基づいて生成された
ことを特徴とした類義語検索装置。 - 請求項2に記載の類義語検索装置であって、
前記文章記憶手段は、前記文章を複数含む文献毎の集合とした前記文章情報を複数有する文献情報を複数記憶するテーブル構造に構築された
ことを特徴とした類義語検索装置。 - 請求項3に記載の類義語検索装置であって、
前記単語情報には、その単語が出現する文章を含む文献に関する前記文献情報が関連付けられ、
前記類義語選出手段にて類義語として選出した単語情報に関連付けられた文献の数を計数し、その計数した数に基づいて演算した文献頻度を単語情報にスコア付けする頻度認識手段を備える
ことを特徴とする類義語検索装置。 - 請求項3または請求項4に記載の類義語検索装置であって、
前記関連単語検索手段は、前記所定の単語が含まれる前記文献の文献情報における前記文章情報の文章に含まれる前記他の単語に対応する単語関連情報から検索する
ことを特徴とした類義語検索装置。 - 請求項3ないし請求項5のいずれかに記載の類義語検索装置であって、
前記文献情報は、前記文献の分類に関する文献分類情報を有し、
前記関連単語検索手段は、前記所定の単語が含まれる前記文献の文献情報の文献分類情報と同一の文献分類情報を有した前記文献情報における前記文章情報の文章に含まれ前記所定の単語の近傍に位置する前記他の単語に対応する単語関連情報から検索する
ことを特徴とした類義語検索装置。 - 請求項3ないし請求項6のいずれかに記載の類義語検索装置であって、
前記文献情報は、前記文献に関する書誌情報を有し、
前記関連単語検索手段は、前記所定の単語が含まれる前記文献の文献情報に関連付けられた書誌情報と同一の書誌情報を有した前記文献情報における前記文章情報の文章に含まれ前記所定の単語の近傍に位置する前記他の単語に対応する単語関連情報から検索する
ことを特徴とした類義語検索装置。 - 請求項1ないし請求項7のいずれかに記載の類義語検索装置であって、
前記単語関連情報の単語情報は、形態素解析により前記文章から抽出した単語に関する情報である
ことを特徴とした類義語検索装置。 - 請求項1に記載の類義語検索装置であって、
前記単語関連情報取得手段は、単語に関する単語情報に、その単語に関する説明文に出現する単語に関する関連単語情報を複数有する関連単語集合情報が1つのデータ構造として関連付けられた単語関連情報が単語毎に複数格納されるテーブル構造の関連単語テーブルに基づいて、前記単語関連情報を取得する
ことを特徴とした類義語検索装置。 - 請求項1に記載の類義語検索装置であって、
前記単語関連情報取得手段は、単語に関する単語情報に、その単語のシソーラス項目となる単語群を構成する各単語に関する関連単語情報を複数有する関連単語集合情報が1つのデータ構造として関連付けられ、単語毎に複数格納されるテーブル構造の関連単語テーブルに基づいて、前記単語関連情報を取得する
ことを特徴とした類義語検索装置。 - 請求項1ないし請求項10のいずれかに記載の類義語検索装置であって、
前記単語情報取得手段にて前記所定の単語に関する単語情報を取得すると、前記関連単語テーブルを作成する関連単語テーブル生成手段を具備した
ことを特徴とした類義語検索装置。 - 請求項1ないし請求項11のいずれかに記載の類義語検索装置であって、
前記関連単語テーブルを記憶する関連単語記憶手段を具備した
ことを特徴とした類義語検索装置。 - 請求項1ないし請求項12のいずれかに記載の類義語検索装置であって、
前記関連単語テーブルの単語関連情報は、前記単語情報の単語の分類に関する単語分類情報を有し、
前記関連単語検索手段は、前記所定の単語に対応する単語関連情報の前記単語分類情報と同一の単語分類情報を有した前記関連単語テーブルにおける単語関連情報から検索する
ことを特徴とした類義語検索装置。 - 請求項1ないし請求項13のいずれかに記載の類義語検索装置であって、
前記類義語選出手段にて類義語として選出した単語情報を、前記所定の単語に対応する単語情報に関連付けて1つのデータ構造とした類義語情報を生成し、各種情報を記憶する記憶手段に複数記憶させる類義語情報生成手段を具備した
ことを特徴とした類義語検索装置。 - 請求項1ないし請求項14のいずれかに記載の類義語検索装置と、
この類義語検索装置にて類義語として選出した前記単語情報および前記単語情報取得手段で取得した単語情報のうちの少なくともいずれか1つを含む文章に関する文章情報の検索を実行する検索手段と、
を具備したことを特徴とした情報検索装置。 - 請求項3ないし請求項7のいずれかに記載の類義語検索装置と、
この類義語検索装置にて類義語として選出した前記単語情報および前記単語情報取得手段で取得した単語情報のうちの少なくともいずれか1つを含む文献情報の検索を実行する検索手段と、
を具備したことを特徴とした情報検索装置。 - 請求項15または請求項16に記載の情報検索装置であって、
前記検索手段は、前記類義語検索装置にて選出した前記単語情報および前記単語情報取得手段で取得した単語情報の単語を、入力操作可能な操作手段における入力操作に応じて選択および変更のうちの少なくともいずれか一方を実施可能に前記表示手段に表示させ、前記入力操作に応じて前記単語の選択および変更のうちの少なくともいずれか一方が実施されて選択された単語および変更された単語のうちの少なくともいずれか一方の単語に関する単語情報に基づいて検索を実行する
ことを特徴とした情報検索装置。 - コンピュータにより、複数の単語にて構成された文章に関する文章情報を複数記憶する記憶手段を利用して所定の単語に対する類義語を検索する類義語検索方法であって、
前記コンピュータは、
所定の単語に関する単語情報を取得すると、単語に関する単語情報に、その単語の予め定められた範囲内に出現する前記文章中の他の単語を前記単語情報の単語に関連する関連単語として、該関連単語に関する関連単語情報を複数有する関連単語集合情報が、1つのデータ構造として関連付けられた単語関連情報を複数記憶するテーブル構造に構築された関連単語記憶領域に基づき、前記取得した所定の単語に対応する前記単語関連情報を取得し、
この取得した単語関連情報の関連単語集合情報に類似する関連単語集合情報を備えた単語関連情報を検索し、
この検索した単語関連情報の単語情報の単語を前記所定の単語に対する類義語として選出する際、
前記所定の単語に対応する単語関連情報の関連単語集合情報に対する前記関連単語テーブルにおける単語関連情報の関連単語集合情報の類似状態に関する類似度情報を演算する時、前記所定の単語に対応する単語関連情報の関連単語集合情報を構成する各関連単語情報について、該関連単語情報と文字列が一致する関連単語情報を関連単語集合情報に有する、前記関連単語テーブルにおける前記単語関連情報の単語情報の数を一致単語数として、前記関連単語テーブルに複数記憶された単語関連情報の単語情報についての総単語数を前記一致単語数で除算することで重み度情報を演算し、この重み度情報に基づいて前記類似度情報を演算し、この演算した類似度情報に基づいて前記単語関連情報を検出する
ことを特徴とする類義語検索方法。 - コンピュータを、請求項1ないし請求項14のいずれかに記載の類義語検索装置、または、請求項15ないし請求項17のいずれかに記載の情報検索装置として機能させる
ことを特徴とした検索プログラム。 - 請求項18に記載の類義語検索方法をコンピュータに実行させる
ことを特徴とした検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004217744A JP4511892B2 (ja) | 2004-07-26 | 2004-07-26 | 類義語検索装置、その方法、そのプログラム、および、情報検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004217744A JP4511892B2 (ja) | 2004-07-26 | 2004-07-26 | 類義語検索装置、その方法、そのプログラム、および、情報検索装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006039871A JP2006039871A (ja) | 2006-02-09 |
JP2006039871A5 JP2006039871A5 (ja) | 2007-08-09 |
JP4511892B2 true JP4511892B2 (ja) | 2010-07-28 |
Family
ID=35904818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004217744A Expired - Fee Related JP4511892B2 (ja) | 2004-07-26 | 2004-07-26 | 類義語検索装置、その方法、そのプログラム、および、情報検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4511892B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101049358B1 (ko) * | 2008-12-08 | 2011-07-13 | 엔에이치엔(주) | 유사어 결정 방법 및 시스템 |
EP2524327B1 (en) | 2010-01-13 | 2017-11-29 | Ab Initio Technology LLC | Matching metadata sources using rules for characterizing matches |
KR101264139B1 (ko) | 2012-02-29 | 2013-05-16 | (주) 다이퀘스트 | 표준화 대상용어 사전을 운영하기 위한 웹 관리 시스템 및 그 구동방법 |
WO2014136173A1 (ja) * | 2013-03-04 | 2014-09-12 | 三菱電機株式会社 | 検索装置 |
CN106156103B (zh) * | 2015-04-02 | 2019-11-26 | 广州爱九游信息技术有限公司 | 一种搜索处理方法及装置 |
JP6555174B2 (ja) * | 2016-04-01 | 2019-08-07 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置及びプログラム |
CN107545013A (zh) * | 2016-06-29 | 2018-01-05 | 百度在线网络技术(北京)有限公司 | 用于提供搜索推荐信息的方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000222427A (ja) * | 1999-02-02 | 2000-08-11 | Mitsubishi Electric Corp | 関連語抽出装置、関連語抽出方法及び関連語抽出プログラムが記録された記録媒体 |
JP2003256447A (ja) * | 2002-02-26 | 2003-09-12 | Kyoji Umemura | 関連語抽出方法および装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0528199A (ja) * | 1991-07-18 | 1993-02-05 | Canon Inc | 文書検索装置 |
-
2004
- 2004-07-26 JP JP2004217744A patent/JP4511892B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000222427A (ja) * | 1999-02-02 | 2000-08-11 | Mitsubishi Electric Corp | 関連語抽出装置、関連語抽出方法及び関連語抽出プログラムが記録された記録媒体 |
JP2003256447A (ja) * | 2002-02-26 | 2003-09-12 | Kyoji Umemura | 関連語抽出方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2006039871A (ja) | 2006-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10156981B2 (en) | User-centric soft keyboard predictive technologies | |
JP5231491B2 (ja) | ターゲットページとは異なる文字セットおよび/または言語で書かれたクエリを使用する検索のためのシステムおよび方法 | |
US7506254B2 (en) | Predictive conversion of user input | |
JP5462001B2 (ja) | 文脈上の入力方法 | |
US11736587B2 (en) | System and method for integrating message content into a target data processing device | |
JP2010267019A (ja) | 文書作成を支援する方法、並びにそのコンピュータ・システム及びコンピュータ・プログラム | |
JP5156047B2 (ja) | キーワード提示装置、方法及びプログラム | |
WO2015139497A1 (zh) | 一种在搜索引擎中确定形近字的方法和装置 | |
JP4937812B2 (ja) | 検索システム | |
JP2014186395A (ja) | 文書作成支援装置、方法およびプログラム | |
JP4511892B2 (ja) | 類義語検索装置、その方法、そのプログラム、および、情報検索装置 | |
US20170075915A1 (en) | Search suggestions using fuzzy-score matching and entity co-occurrence | |
JP5097802B2 (ja) | ローマ字変換を用いる日本語自動推薦システムおよび方法 | |
JP4936650B2 (ja) | 類似単語検索装置、その方法、そのプログラム、および、情報検索装置 | |
JP2009086903A (ja) | 検索サービス装置 | |
JP4615279B2 (ja) | 文献分類認識装置、その方法、文献分類装置、および、それらのプログラム | |
JP2008250625A (ja) | 検索システム | |
JP4783563B2 (ja) | インデックス生成プログラム、検索プログラム、インデックス生成方法、検索方法、インデックス生成装置および検索装置 | |
JP2020021455A (ja) | 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム | |
CN117743640A (zh) | Xml文档的查询方法、装置、介质和计算机设备 | |
NZ760613B2 (en) | System and method for integrating message content into a target data processing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20070208 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070514 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20070514 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070622 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070622 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20070816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090512 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090710 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090915 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100119 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100420 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100507 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4511892 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140514 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |