JP2010225101A - 検索装置、方法及びプログラム - Google Patents
検索装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2010225101A JP2010225101A JP2009074490A JP2009074490A JP2010225101A JP 2010225101 A JP2010225101 A JP 2010225101A JP 2009074490 A JP2009074490 A JP 2009074490A JP 2009074490 A JP2009074490 A JP 2009074490A JP 2010225101 A JP2010225101 A JP 2010225101A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary data
- class
- dictionary
- property
- word element
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】インデックス格納部22は、辞書データ管理部21が辞書データを辞書DB13に登録する際に、当該辞書データに含まれるある種類のアトリビュートを単語解析し、単語要素毎にアトリビュートの種類に応じて重み付けを行って、インデックスを登録する。入力受付部23が入力を受け付けたキーワードを適宜分解した単語要素とインデックスとを用いて、辞書データを検索する。辞書要素ランキング確定部25は、検索された辞書データが、クラスに対応する辞書データ及びプロパティに対応する辞書データの両方ある場合、クラスとプロパティとの対応関係に応じてランキングを確定する。検索結果出力部26は、確定されたランキング順に、各辞書データに含まれる少なくとも推奨名を検索結果として検索者端末12へ送信する。
【選択図】 図3
Description
(1)いくつかのアトリビュートをまとめて部分一致検索する方式。例えば「推奨名」と「別名」と「短縮名」などのアトリビュートに関して入力したキーワードと部分一致するプロパティを出力するという方式(例えば特許文献1,2参照)。
(2)ベクトル空間法によって検索する方式。例えば、全文検索を利用し、文書をN-gram又は形態素解析により単語に分割して、tf-idfに代表されるように特徴ベクトルを抽出し、これをキーワードのベクトルと比較し、類似する辞書データを検索するという方式。
(3)Web上のオントロジーについて「クラス名」や「プロパティ名」などを対象に部分一致検索し、閲覧するOntoSelectという方式。これは上述の(1)の方式と略同等である。
(4)より多くのセマンティックWebコンテンツから参照されているクラスやプロパティが良いオントロジーであるとの前提に立ち、検索結果をランキングするSwoogleにおけるOntoRankやTermRankなどの方式。
まず、本実施の形態にかかる検索システムの構成について図1を用いて説明する。検索システムは、検索装置10は、辞書管理者端末11と有線又は無線により接続され、検索者端末12と有線又は無線により接続される。辞書管理者端末11は、後述する辞書DBへ登録する辞書データを検索装置10に送信する。検索者端末12は、検索者が辞書データを検索するためにキーワードが入力される装置であり、入力されたキーワードを検索装置10に送信する。
次に、本実施の形態にかかる検索装置10の行う処理の手順について説明する。まず、検索装置10が辞書データを辞書DB13に登録すると共にインデックスをインデックステーブルに登録する登録処理の手順について説明する。検索装置10は、辞書管理者端末11から送信された辞書データを受信すると、辞書データ管理部21の機能により、辞書データを辞書DB13に登録する。ここで登録対象の辞書データは図5〜6に示したものとする。このとき、検索装置10は、インデックス格納部22の機能により、当該辞書データのインデックスをインデックステーブルに登録する。図8は、辞書データのインデックスをインデックステーブルに登録する処理の手順を示すフローチャートである。検索装置10は、図5〜6に示した登録対象の辞書データをdicElem(i,j)としてRAM105などの記憶部に記憶する(ステップS1)。但し、iは一番上の行を除く各行に対応する、辞書データのレコードを表し、jは各列に対応するアトリビュートを表している。上述したようにアトリビュートの種類はここでは「推奨名」「定義」「別名」であり、jの値は左から順に「1」,「2」,「3」とする。次に、検索装置10は、dicElem(i,j)の全ての辞書データについて(ステップS2)、対象とするアトリビュートの全てに対して(ステップS3)、アトリビュート値として表される文字列を各々単語解析する(ステップS4)。例えば、図5においてiが「2」でありjが「1」のアトリビュートについては、即ち、図5の2行目のクラス「C2」でアトリビュート「推奨名」については、その文字列は「発光ダイオード」である。この場合、検索装置10は、単語解析により、これを「発光」と「ダイオード」とに分解する。そして、検索装置10は、このように分解した全ての単語(単語要素)に対して、アトリビュートの種類に応じた重み付けを行い、この重みの値(w(j))をBSUコードと共にインデックステーブルに登録する(ステップS5)。
「推奨名」:1.0
「別名」:0.8
「定義」:0.2
P0.def_class=C1
P1.def_class=C3
P2.def_class=C2
P3.def_class= C2
Point^(P0)=0+0=0
Point^(P1)=2.8+0=2.8
Point^(P2)=2.6+1.0=3.6
Point^(P3)=0+1.0 =1.0
なお、本発明は前記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。また、以下に例示するような種々の変形が可能である。
上述した実施の形態において、検索装置10で実行される各種プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また当該各種プログラムを、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成しても良い。
上述した実施の形態において、検索者端末12でキーワードと共に検索の対象となるクラスが入力され検索装置10に送信されるようにしても良い。検索装置10は、キーワードと共にクラスの入力を受け付けると、辞書DB13に記憶された辞書データのうち、当該クラスの辞書データのみを検索の対象として上述の検索処理を行うようにする。このように検索の対象を限定することで、検索処理をより効率的に行うことができる。
上述した実施の形態において、インデックス格納部22は、各クラス及び各プロパティの単語要素毎のインデックスをインデックステーブルに各々登録する際に、助詞や副詞や形容詞などの単語を登録の対象外とし、名詞や未知の単語のみを登録の対象とするようにしても良い。
上述した実施の形態において、重み付けに従って辞書データの得点を計算する方法は、上述の例に限らず、また、クラスとプロパティとの対応関係に応じてランキングを確定する方法も上述の例に限らない。
上述した実施の形態において、検索対象とするクラスを検索者が指定するように構成しても良い。この場合、入力受付部23は、検索者端末12を介して、キーワードの他、検索対象のクラスを識別可能なクラス識別子の入力を受け付ける。クラス識別子は、例えばBSUコードや「推奨名」などの名称である。辞書要素あいまい検索部24は、入力受付部23が入力を受け付けたキーワードを適宜分解した単語要素とインデックステーブルに登録されたインデックスとを用いて、入力受付部23が入力を受け付けた検索対象のクラスの辞書データを検索して、当該辞書データをランキングする。
P0.def_class=C1
P2.def_class=C2
P3.def_class= C2
Point^(P0)=0+0=0
Point^(P2)=2.6+1.0=3.6
Point^(P3)=0+1.0 =1.0
プロパティについてのランキングの順は、「P2>P3>P0」となる。上述の実施の形態の例と比べて、ここでは、プロパティP1及びクラスC3が対象外となっているため、上述の実施の形態の例と異なるランキングとなる。クラスについてのランキングの順は、「C2>C3」となる。このようにランキングを確定した後検索装置10は、ステップS14で、上述の実施の形態と同様にして検索結果を検索者端末12へ送信する。
上述した実施の形態において、表面的に仕様文書上の用語を推奨語に合わせることの他に、辞書データを仕様文書に埋め込むことができる場合には、検索した辞書データ自体又はそのBSUコードを仕様文書に埋め込むようにしても良い。図15は、Office Open XML形式に従い、カスタム定義XMLを利用した時のタグ挿入例を示す図である。図15においては、辞書データのBSUコードがタグTG1により埋め込まれ、「推奨名」がタグTG2により埋め込まれている。図16は、尚、予め定義したカスタムXMLのスキーマを例示する図である。このような構成によれば、ステップS14の検索結果として、例えば、図17に示されるように、タグTG1〜TG2が表示されないものの、このような情報を埋め込むための情報を、検索者端末12に表示させることができる。
11 辞書管理者端末
12 検索者端末
13 辞書DB
21 辞書データ管理部
22 インデックス格納部
23 入力受付部
24 辞書要素あいまい検索部
25 辞書要素ランキング確定部
26 検索結果出力部
101 制御部
102 操作部
103 表示部
107 外部記憶部
108 バス
Claims (8)
- 分類を示すクラス毎のデータであってアトリビュートとプロパティによって記述される辞書データ及びプロパティ毎のデータであってアトリビュートによって記述される辞書データを記憶する第1記憶手段と、
前記辞書データのアトリビュートのうちある種類のアトリビュートの値を単語解析して、前記辞書データ毎に第1単語要素を各々得る第1解析手段と、
前記辞書データ毎の各前記第1単語要素に対して、前記アトリビュートの種類に応じた重み付けを行う重み付け手段と、
前記第1単語要素と、当該第1単語要素に対して付けられた重みとを前記辞書データと対応付けて記憶する第2記憶手段と、
キーワードの入力を受け付ける第1入力受付手段と、
前記キーワードを単語解析して、第2単語要素を得る第2解析手段と、
前記第2単語要素と一致する前記第1単語要素に対応する前記辞書データを検索する検索手段と、
検索された前記辞書データを同一のクラス又は同一のプロパティ毎にグループ化し、前記第1単語要素に対して付けられた重みに従って、グループ毎に前記辞書データをランキングするランキング手段と、
検索された辞書データが、クラスに対応する前記辞書データ及びプロパティに対応する前記辞書データの両方ある場合、クラスとプロパティとの対応関係に応じて、前記グループ毎の前記辞書データのランキングを確定する確定手段と、
確定されたランキングの順に前記辞書データのアトリビュートのうち少なくとも1つを出力する出力手段とを備える
ことを特徴とする検索装置。 - 前記確定手段は、検索された辞書データが、クラスに対応する前記辞書データ及びプロパティに対応する前記辞書データの両方ある場合、クラスと当該クラスで定義されたプロパティとの関係に応じて、前記グループ毎の前記辞書データのランキングを確定する
ことを特徴とする請求項1に記載の検索装置。 - 検索対象となるクラスを識別可能なクラス識別子の入力を受け付ける第2入力受付手段を更に備え、
前記検索手段は、前記クラス識別子によって特定されるクラスに対応する前記辞書データであって前記第2単語要素と一致する前記第1単語要素に対応する前記辞書データを検索する
ことを特徴とする請求項1又は2に記載の検索装置。 - 前記辞書データは、階層付けられており、
前記第1記憶手段は、階層の上位の分類に属する前記プロパティがその下位の分類に継承される前記辞書データを記憶する
ことを特徴とする請求項1乃至3のいずれか一項に記載の検索装置。 - 前記出力手段は、確定されたランキングの順に前記辞書データのアトリビュートのうち少なくとも推奨名を出力する
ことを特徴とする請求項1乃至4のいずれか一項に記載の検索装置。 - 前記第1解析手段は、前記辞書データのうち、アトリビュートの種類である推奨名、別名及び定義のうち少なくとも1つの値を単語解析して、前記辞書データ毎に少なくとも1つの第1単語要素を各々得る
ことを特徴とする請求項1乃至5のいずれか一項に記載の検索装置。 - 分類を示すクラス毎のデータであってアトリビュートとプロパティによって記述される辞書データ及びプロパティ毎のデータであってアトリビュートによって記述される辞書データを記憶する第1記憶手段を備える検索装置で実行される検索方法であって、
前記辞書データのアトリビュートのうちある種類のアトリビュートの値を単語解析して、前記辞書データ毎に少なくとも1つの第1単語要素を各々得る第1解析ステップと、
前記辞書データ毎の各前記第1単語要素に対して、前記アトリビュートの種類に応じた重み付けを行う重み付けステップと、
前記第1単語要素と、当該第1単語要素に対して付けられた重みとを前記辞書データと対応付けて第2記憶手段に記憶させる記憶制御ステップと、
キーワードの入力を受け付ける第1入力受付ステップと、
前記キーワードを単語解析して、少なくとも1つの第2単語要素を得る第2解析ステップと、
前記第2単語要素と一致する前記第1単語要素に対応する前記辞書データを検索する検索ステップと、
検索された前記辞書データを同一のクラス又は同一のプロパティ毎にグループ化し、前記第1単語要素に対して付けられた重みに従って、グループ毎に前記辞書データをランキングするランキングステップと、
検索された辞書データが、クラスに対応する前記辞書データ及びプロパティに対応する前記辞書データの両方ある場合、クラスとプロパティとの対応関係に応じて、前記グループ毎の前記辞書データのランキングを確定する確定ステップと、
確定されたランキングの順に前記辞書データのアトリビュートのうち少なくとも1つを出力する出力ステップとを含む
ことを特徴とする検索方法。 - 請求項7に記載の方法をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009074490A JP5330049B2 (ja) | 2009-03-25 | 2009-03-25 | 検索装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009074490A JP5330049B2 (ja) | 2009-03-25 | 2009-03-25 | 検索装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010225101A true JP2010225101A (ja) | 2010-10-07 |
JP5330049B2 JP5330049B2 (ja) | 2013-10-30 |
Family
ID=43042188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009074490A Expired - Fee Related JP5330049B2 (ja) | 2009-03-25 | 2009-03-25 | 検索装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5330049B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03294963A (ja) * | 1990-04-12 | 1991-12-26 | Ricoh Co Ltd | 文書検索装置 |
JPH11232298A (ja) * | 1998-02-18 | 1999-08-27 | Sharp Corp | データ検索装置及びコンピュータ読み取り可能な記録媒体 |
JP2000311178A (ja) * | 1999-04-28 | 2000-11-07 | Toshiba Corp | 電子カタログ利用装置および電子カタログシステム |
JP2006309446A (ja) * | 2005-04-27 | 2006-11-09 | Toshiba Corp | 分類辞書更新装置、分類辞書更新プログラムおよび分類辞書更新方法 |
JP2007026074A (ja) * | 2005-07-15 | 2007-02-01 | Toshiba Corp | 部品情報表示装置、部品情報表示システム、部品情報表示プログラムおよび部品情報表示方法 |
JP2008242836A (ja) * | 2007-03-27 | 2008-10-09 | Toshiba Corp | 辞書更新装置およびプログラム |
-
2009
- 2009-03-25 JP JP2009074490A patent/JP5330049B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03294963A (ja) * | 1990-04-12 | 1991-12-26 | Ricoh Co Ltd | 文書検索装置 |
JPH11232298A (ja) * | 1998-02-18 | 1999-08-27 | Sharp Corp | データ検索装置及びコンピュータ読み取り可能な記録媒体 |
JP2000311178A (ja) * | 1999-04-28 | 2000-11-07 | Toshiba Corp | 電子カタログ利用装置および電子カタログシステム |
JP2006309446A (ja) * | 2005-04-27 | 2006-11-09 | Toshiba Corp | 分類辞書更新装置、分類辞書更新プログラムおよび分類辞書更新方法 |
JP2007026074A (ja) * | 2005-07-15 | 2007-02-01 | Toshiba Corp | 部品情報表示装置、部品情報表示システム、部品情報表示プログラムおよび部品情報表示方法 |
JP2008242836A (ja) * | 2007-03-27 | 2008-10-09 | Toshiba Corp | 辞書更新装置およびプログラム |
Non-Patent Citations (2)
Title |
---|
CSNH200700041004; 大嶽 康隆 外2名: '"製造業のサービスイノベーションのための知識処理技術 モノビス(モノ+サービス)による顧客と製造業の' 東芝レビュー 第61巻,第12号, 20061201, p.23-26, 株式会社東芝 * |
JPN6013015236; 大嶽 康隆 外2名: '"製造業のサービスイノベーションのための知識処理技術 モノビス(モノ+サービス)による顧客と製造業の' 東芝レビュー 第61巻,第12号, 20061201, p.23-26, 株式会社東芝 * |
Also Published As
Publication number | Publication date |
---|---|
JP5330049B2 (ja) | 2013-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101793222B1 (ko) | 어플리케이션 검색들을 가능하게 하기 위해 사용되는 검색 인덱스의 업데이트 | |
Wache et al. | Ontology-based integration of information-a survey of existing approaches. | |
US9652799B2 (en) | Product recommendation with product review analysis | |
US10783159B2 (en) | Question answering with entailment analysis | |
US9846901B2 (en) | Product recommendation with ontology-linked product review | |
US10565533B2 (en) | Systems and methods for similarity and context measures for trademark and service mark analysis and repository searches | |
US20160179934A1 (en) | Question answering from structured and unstructured data sources | |
US7444325B2 (en) | Method and system for information extraction | |
US20060173753A1 (en) | Method and system for online shopping | |
US20130013580A1 (en) | Optimized ontology based internet search systems and methods | |
JPH11259498A (ja) | 文書処理装置および記録媒体 | |
JP2004501421A (ja) | 文書用メタデータ生成のための方法と装置 | |
WO2015084759A1 (en) | Systems and methods for in-memory database search | |
JPWO2011105606A1 (ja) | 情報処理装置、情報処理方法、情報処理装置用のプログラム、および、記録媒体 | |
JP5237353B2 (ja) | 検索装置、検索システム、検索方法、検索プログラム、及び検索プログラムを記憶するコンピュータ読取可能な記録媒体 | |
US8121970B1 (en) | Method for identifying primary product objects | |
JP5836893B2 (ja) | ファイル管理装置、ファイル管理方法、及びプログラム | |
Jannach et al. | Automated ontology instantiation from tabular web sources—the AllRight system | |
JP2010134709A (ja) | 語彙誤り検出装置及び語彙誤り検出方法 | |
JP2001184358A (ja) | カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体 | |
JP2006343925A (ja) | 関連語辞書作成装置、および関連語辞書作成方法、並びにコンピュータ・プログラム | |
Uçar et al. | A novel algorithm for extracting the user reviews from web pages | |
JP5330049B2 (ja) | 検索装置、方法及びプログラム | |
US11017172B2 (en) | Proposition identification in natural language and usage thereof for search and retrieval | |
Hong et al. | Extracting Web query interfaces based on form structures and semantic similarity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110916 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130402 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130725 |
|
LAPS | Cancellation because of no payment of annual fees |