JP2007072646A - 検索装置、検索方法およびプログラム - Google Patents
検索装置、検索方法およびプログラム Download PDFInfo
- Publication number
- JP2007072646A JP2007072646A JP2005257429A JP2005257429A JP2007072646A JP 2007072646 A JP2007072646 A JP 2007072646A JP 2005257429 A JP2005257429 A JP 2005257429A JP 2005257429 A JP2005257429 A JP 2005257429A JP 2007072646 A JP2007072646 A JP 2007072646A
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- unit
- keywords
- keyword
- evaluation target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】複数のテキストから語句を検索する検索装置を提供する。検索装置は、少なくとも何れか1つのテキストに含まれる予め定められた語句を、注目度を評価する対象となる評価対象語句として予め記録している。そして、複数のキーワードを入力する。検索装置は、各々のキーワードについて、当該キーワードを含むテキストにおいて評価対象語句が使用される頻度である使用頻度を判断する。そして、各々のキーワードについて判断された使用頻度の各々に基づいて、評価対象語句の注目度を評価する。
【選択図】図3
Description
「Google(登録商標)の基本検索」インターネット、ホームページURL「http://www.google.co.jp/intl/ja/help/basics.html」平成17年5月25日検索
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となりうる。
15 ネットワーク
20 利用者端末
100 入力部
110 語句選択部
120 検索エンジン部
125 データベース
130 語句記録部
140 注目度評価部
200 辞書記録部
210 検出部
220 選択部
300 頻度判断部
310 評価部
320 表示部
330 検索部
340 追加部
350 除外部
600 表示領域
610 表示領域
700 情報処理装置
Claims (21)
- 複数のテキストから語句を検索する検索装置であって、
少なくとも何れか1つのテキストに含まれる予め定められた語句を、注目度を評価する対象となる評価対象語句として予め記録している語句記録部と、
複数のキーワードを入力する入力部と、
各々の前記キーワードについて、当該キーワードを含むテキストにおいて前記評価対象語句が使用される頻度である使用頻度を判断する頻度判断部と、
各々の前記キーワードについて判断された使用頻度の各々に基づいて、前記評価対象語句の注目度を評価する評価部と
を備える検索装置。 - 前記評価部は、各々のキーワードについて判断された使用頻度の差がより小さい場合に、当該使用頻度の差がより大きい場合と比較して前記注目度をより高く評価する
請求項1に記載の検索装置。 - 前記評価部は、複数のキーワードの各々について判断された使用頻度の積を前記注目度として評価する
請求項2に記載の検索装置。 - 前記評価部は、各々のキーワードと前記評価対象語句との間の単語間距離に基づく重みを当該キーワードについて判断された使用頻度に乗じることによって重み付き使用頻度を算出し、各々のキーワードについて算出した当該重み付き使用頻度に基づいて前記注目度を評価する
請求項1に記載の検索装置。 - 前記評価対象語句を、前記評価部によって評価された注目度に対応付けて選択可能に表示する表示部と、
前記評価対象語句が利用者によって選択されたことに応じ、前記評価対象語句を含むテキストを前記複数のテキストの中から検索して出力する検索部と
を更に備える請求項1に記載の検索装置。 - 前記検索部は、前記評価対象語句が利用者によって選択されたことに応じ、前記評価対象語句及び前記複数のキーワードの何れもが含まれているテキストを検索して表示する
請求項5に記載の検索装置。 - 前記語句記録部は、複数の前記評価対象語句を記録し、
前記評価部は、第1の前記評価対象語句の注目度を評価し、
前記第1の評価対象語句を、前記評価部によって評価された注目度に対応付けて選択可能に表示する表示部と、
前記第1の評価対象語句が利用者によって選択されたことに応じ、第2の前記評価対象語句を評価するためのキーワードとして前記第1の評価対象語句を追加する追加部と
を更に備える請求項1に記載の検索装置。 - 前記表示部は、前記第1の評価対象語句と、既に評価された他の前記評価対象語句とを、注目度の順に、利用者によって選択され易いように優先して表示する
請求項7に記載の検索装置。 - 前記語句記録部は、複数の前記評価対象語句を記録し、
前記入力部は、評価対象語句毎に、他の評価対象語句を評価するためのキーワードと少なくとも一部が共通な複数のキーワードを入力し、
前記評価部は、入力されたキーワードに基づいて前記複数の評価対象語句を順次評価し、
入力された各々のキーワードを、当該キーワードにより評価された注目度が所定の基準以上である評価対象語句の数の順に、利用者によって選択され易いように優先して表示する表示部と、
利用者によって選択されたキーワードを、前記評価部によって他の評価対象語句の注目度を評価するためのキーワードから除外する除外部と
を更に備える請求項1に記載の検索装置。 - 前記頻度判断部は、少なくとも1つの前記キーワードについて、異なる複数回のタイミングにおいて、当該キーワードを含むテキストにおいて前記評価対象語句が使用される頻度である使用頻度を判断し、
前記評価部は、当該キーワードについて、第1の前記タイミングにおいて当該キーワードについて判断された前記使用頻度に対する、第1の前記タイミングよりも後の第2の前記タイミングにおいて当該キーワードについて判断された前記使用頻度の上昇率がより高い場合に、当該上昇率がより低い場合と比較して前記注目度をより高く評価する
請求項1に記載の検索装置。 - 複数の語句を予め記録している辞書記録部と、
前記複数のキーワードの各々について、当該キーワードを含むテキストに含まれる語句のうち、前記辞書記録部に記録されていない未登録語句を検出する検出部と、
少なくとも2つの前記キーワードについて、何れのキーワードが含まれるテキストからも共通して検出された前記未登録語句を選択する選択部と
を更に備え、
前記語句記録部は、前記選択部により選択された前記未登録語句を前記評価対象語句として記録する請求項1に記載の検索装置。 - 前記検出部は、異なる複数のタイミングにおいて未登録語句を検出し、
前記語句記録部は、未登録語句が検出される毎に、記録している前記評価対象語句を更新し、
前記頻度判断部は、前記検出部が未登録語句を検出する頻度よりも高い頻度で、前記評価対象語句の使用頻度を判断する
請求項11に記載の検索装置。 - 複数のテキストから語句を検索する検索装置であって、
複数の語句を予め記録している辞書記録部と、
複数のキーワードを利用者から入力する入力部と、
前記複数のキーワードの各々について、当該キーワードを含むテキストに含まれる語句のうち、前記辞書記録部に記録されていない未登録語句を検出する検出部と、
少なくとも2つの前記キーワードについて、何れのキーワードが含まれるテキストからも共通して検出された前記未登録語句を選択して出力する選択部と
を備える検索装置。 - 前記検出部は、各々の前記キーワードについて、当該キーワードを含む行に含まれる語句のうち未登録語句を検出し、
前記選択部は、少なくとも2つの前記キーワードについて、何れのキーワードが含まれる行からも共通して検出された前記未登録語句を選択する
請求項13に記載の検索装置。 - 前記検出部は、各々の前記キーワードについて、当該キーワードを含むテキストファイルに含まれる語句のうち未登録語句を検出する
前記選択部は、少なくとも2つの前記キーワードについて、何れのキーワードが含まれるテキストファイルからも共通して検出された前記未登録語句を選択する
請求項13に記載の検索装置。 - 前記検出部は、何れの前記キーワードも含まないテキストから、前記未登録語句を更に検出し、
前記選択部は、少なくとも2つの前記キーワードについて検出された前記未登録語句から、何れの前記キーワードも含まないテキストにおいて検出された前記未登録語句を除外して選択する
請求項13に記載の検索装置。 - 前記選択部は、前記複数のキーワードのうち何れか2つのキーワードについて、何れのキーワードが含まれるテキストからも共通して検出された前記未登録語句を選択する
請求項13に記載の検索装置。 - 複数のテキストから語句を検索する検索方法であって、
少なくとも何れか1つのテキストに含まれる予め定められた語句を、注目度を評価する対象となる評価対象語句として取得する段階と、
複数のキーワードを入力する段階と、
各々の前記キーワードについて、当該キーワードを含むテキストにおいて前記評価対象語句が使用される頻度である使用頻度を判断する段階と、
各々の前記キーワードについて判断された使用頻度の各々に基づいて、前記評価対象語句の注目度を評価する段階と
を備える検索方法。 - 複数のテキストから語句を検索する検索方法であって、
複数のキーワードを利用者から入力する段階と、
前記複数のキーワードの各々について、当該キーワードを含むテキストに含まれる語句のうち、予め辞書に登録された語句とは異なる未登録語句を検出する段階と、
少なくとも2つの前記キーワードについて、何れのキーワードが含まれるテキストからも共通して検出された前記未登録語句を選択して出力する段階と
を備える検索方法。 - 複数のテキストから語句を検索する検索装置として、情報処理装置を機能させるプログラムであって、
前記情報処理装置を、
少なくとも何れか1つのテキストに含まれる予め定められた語句を、注目度を評価する対象となる評価対象語句として予め記録している語句記録部と、
複数のキーワードを入力する入力部と、
各々の前記キーワードについて、当該キーワードを含むテキストにおいて前記評価対象語句が使用される頻度である使用頻度を判断する頻度判断部と、
各々の前記キーワードについて判断された使用頻度の各々に基づいて、前記評価対象語句の注目度を評価する評価部と
して機能させるプログラム。 - 複数のテキストから語句を検索する検索装置として、情報処理装置を機能させるプログラムであって、
前記情報処理装置を、
複数の語句を予め記録している辞書記録部と、
複数のキーワードを利用者から入力する入力部と、
前記複数のキーワードの各々について、当該キーワードを含むテキストに含まれる語句のうち、前記辞書記録部に記録されていない未登録語句を検出する検出部と、
少なくとも2つの前記キーワードについて、何れのキーワードが含まれるテキストからも共通して検出された前記未登録語句を選択して出力する選択部と
して機能させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005257429A JP2007072646A (ja) | 2005-09-06 | 2005-09-06 | 検索装置、検索方法およびプログラム |
US11/515,583 US20070061322A1 (en) | 2005-09-06 | 2006-09-05 | Apparatus, method, and program product for searching expressions |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005257429A JP2007072646A (ja) | 2005-09-06 | 2005-09-06 | 検索装置、検索方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007072646A true JP2007072646A (ja) | 2007-03-22 |
Family
ID=37856520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005257429A Pending JP2007072646A (ja) | 2005-09-06 | 2005-09-06 | 検索装置、検索方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20070061322A1 (ja) |
JP (1) | JP2007072646A (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9489645B2 (en) * | 2004-05-13 | 2016-11-08 | International Business Machines Corporation | Workflow decision management with derived scenarios and workflow tolerances |
US20060155848A1 (en) * | 2005-01-10 | 2006-07-13 | Brown William A | Workflow decision management including identifying user reaction to workflows |
US20060155847A1 (en) * | 2005-01-10 | 2006-07-13 | Brown William A | Deriving scenarios for workflow decision management |
US20060156276A1 (en) * | 2005-01-10 | 2006-07-13 | Brown William A | Workflow decision management with heuristics |
US8155119B2 (en) * | 2005-11-01 | 2012-04-10 | International Business Machines Corporation | Intermediate message invalidation |
US20070100884A1 (en) * | 2005-11-01 | 2007-05-03 | Brown William A | Workflow decision management with message logging |
US7657636B2 (en) * | 2005-11-01 | 2010-02-02 | International Business Machines Corporation | Workflow decision management with intermediate message validation |
US8010700B2 (en) * | 2005-11-01 | 2011-08-30 | International Business Machines Corporation | Workflow decision management with workflow modification in dependence upon user reactions |
US20070100990A1 (en) * | 2005-11-01 | 2007-05-03 | Brown William A | Workflow decision management with workflow administration capacities |
US8145620B2 (en) * | 2008-05-09 | 2012-03-27 | Microsoft Corporation | Keyword expression language for online search and advertising |
WO2015105994A1 (en) * | 2014-01-08 | 2015-07-16 | Callminer, Inc. | Real-time conversational analytics facility |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2729356B2 (ja) * | 1994-09-01 | 1998-03-18 | 日本アイ・ビー・エム株式会社 | 情報検索システム及び方法 |
JP2809341B2 (ja) * | 1994-11-18 | 1998-10-08 | 松下電器産業株式会社 | 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。 |
US5920854A (en) * | 1996-08-14 | 1999-07-06 | Infoseek Corporation | Real-time document collection search engine with phrase indexing |
JP3173411B2 (ja) * | 1997-03-17 | 2001-06-04 | 富士ゼロックス株式会社 | 関連文書検索装置及び関連文書検索プログラムを記録した記録媒体 |
JP3598211B2 (ja) * | 1998-01-13 | 2004-12-08 | 富士通株式会社 | 関連語抽出装置および関連語抽出方法および関連語抽出プログラムが記録されたコンピュータ読取可能な記録媒体 |
US6405188B1 (en) * | 1998-07-31 | 2002-06-11 | Genuity Inc. | Information retrieval system |
US6442545B1 (en) * | 1999-06-01 | 2002-08-27 | Clearforest Ltd. | Term-level text with mining with taxonomies |
JP3918374B2 (ja) * | 1999-09-10 | 2007-05-23 | 富士ゼロックス株式会社 | 文書検索装置および方法 |
US6701310B1 (en) * | 1999-11-22 | 2004-03-02 | Nec Corporation | Information search device and information search method using topic-centric query routing |
JP3573688B2 (ja) * | 2000-06-28 | 2004-10-06 | 松下電器産業株式会社 | 類似文書検索装置及び関連キーワード抽出装置 |
US6711570B1 (en) * | 2000-10-31 | 2004-03-23 | Tacit Knowledge Systems, Inc. | System and method for matching terms contained in an electronic document with a set of user profiles |
US7024400B2 (en) * | 2001-05-08 | 2006-04-04 | Sunflare Co., Ltd. | Differential LSI space-based probabilistic document classifier |
US7269546B2 (en) * | 2001-05-09 | 2007-09-11 | International Business Machines Corporation | System and method of finding documents related to other documents and of finding related words in response to a query to refine a search |
JP4489994B2 (ja) * | 2001-05-11 | 2010-06-23 | 富士通株式会社 | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 |
US20020169872A1 (en) * | 2001-05-14 | 2002-11-14 | Hiroshi Nomiyama | Method for arranging information, information processing apparatus, storage media and program tranmission apparatus |
US20030204496A1 (en) * | 2002-04-29 | 2003-10-30 | X-Mine, Inc. | Inter-term relevance analysis for large libraries |
US7693825B2 (en) * | 2004-03-31 | 2010-04-06 | Google Inc. | Systems and methods for ranking implicit search results |
US20050234881A1 (en) * | 2004-04-16 | 2005-10-20 | Anna Burago | Search wizard |
JP2006215936A (ja) * | 2005-02-07 | 2006-08-17 | Hitachi Ltd | 検索システム及び検索方法 |
US8312034B2 (en) * | 2005-06-24 | 2012-11-13 | Purediscovery Corporation | Concept bridge and method of operating the same |
JP4761460B2 (ja) * | 2006-05-01 | 2011-08-31 | コニカミノルタビジネステクノロジーズ株式会社 | 検索装置による情報検索方法、情報検索装置及び情報検索処理プログラム |
-
2005
- 2005-09-06 JP JP2005257429A patent/JP2007072646A/ja active Pending
-
2006
- 2006-09-05 US US11/515,583 patent/US20070061322A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20070061322A1 (en) | 2007-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007072646A (ja) | 検索装置、検索方法およびプログラム | |
US9075873B2 (en) | Generation of context-informative co-citation graphs | |
KR100815215B1 (ko) | 웹사이트 통합 검색 장치 및 방법 | |
JP4767694B2 (ja) | 不正ハイパーリンク検出装置及びその方法 | |
JP4236057B2 (ja) | 新たな複合語を抽出するシステム | |
US20090248707A1 (en) | Site-specific information-type detection methods and systems | |
EP1887485A2 (en) | Keyword outputting apparatus, keyword outputting method, and keyword outputting computer program product | |
KR20100047221A (ko) | 사전 단어 및 어구 판정 | |
CN103064956A (zh) | 用于搜索电子内容的方法、计算系统和计算机可读介质 | |
KR101523450B1 (ko) | 관련어 등록 장치, 관련어 등록 방법, 기록 매체 및, 관련어 등록 시스템 | |
US20020083045A1 (en) | Information retrieval processing apparatus and method, and recording medium recording information retrieval processing program | |
CN102314452B (zh) | 一种通过输入法平台进行导航的方法及系统 | |
KR20090003739A (ko) | 태그 정보를 이용하여 사용자 취향정보를 수집하는 단말기기, 그 방법 및 기록매체 | |
JPH10275157A (ja) | データ処理装置 | |
JP6533876B2 (ja) | 商品情報表示システム、商品情報表示方法、及びプログラム | |
JP2007310663A (ja) | 情報検索支援システム、情報検索支援方法および情報検索支援プログラム | |
JP2007193697A (ja) | 情報収集装置,情報収集方法およびプログラム | |
JP2008262506A (ja) | 情報抽出システム、情報抽出方法および情報抽出用プログラム | |
JP4143085B2 (ja) | 同義語獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
KR100757951B1 (ko) | 웹페이지의 형태소 분석을 통한 검색 방법 | |
KR101069278B1 (ko) | 청구항 시각화 장치 및 방법 | |
JP5688754B2 (ja) | 情報検索装置及びコンピュータプログラム | |
JP4953440B2 (ja) | 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 | |
JP2006155275A (ja) | 情報抽出方法及び情報抽出装置 | |
JP5187187B2 (ja) | 体験情報検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080118 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20080129 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20080206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080304 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080602 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080715 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20080807 |