JP2002197104A - 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体 - Google Patents

情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体

Info

Publication number
JP2002197104A
JP2002197104A JP2000396764A JP2000396764A JP2002197104A JP 2002197104 A JP2002197104 A JP 2002197104A JP 2000396764 A JP2000396764 A JP 2000396764A JP 2000396764 A JP2000396764 A JP 2000396764A JP 2002197104 A JP2002197104 A JP 2002197104A
Authority
JP
Japan
Prior art keywords
search
information
search key
key extraction
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000396764A
Other languages
English (en)
Inventor
Masao Uchiyama
将夫 内山
Maki Murata
真樹 村田
Hitoshi Isahara
均 井佐原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communications Research Laboratory
Original Assignee
Communications Research Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communications Research Laboratory filed Critical Communications Research Laboratory
Priority to JP2000396764A priority Critical patent/JP2002197104A/ja
Priority to US10/017,316 priority patent/US20020083045A1/en
Priority to CN01145183A priority patent/CN1362681A/zh
Publication of JP2002197104A publication Critical patent/JP2002197104A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 現在読んでいる電子化された文章上で詳細情
報を知りたい部分があった場合に,その詳細情報が記述
されている他の文書情報を手軽に検索し,閲覧できるよ
うにする。 【解決手段】 検索キー抽出範囲認識部11は, 表示した
電子化された文章上でユーザによる検索の範囲を指定す
るための位置情報の入力を受け付け,位置情報から所定
の検索キー抽出範囲を特定する。検索キー抽出部12は,
特定した検索キー抽出範囲からいくつかの検索キーを抽
出する。情報検索実行部13は, 抽出した検索キーにより
情報検索用データベース14を検索し, 検索結果を出力す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,World Wi
de Web,電子百科事典等の電子情報の閲覧または
検索システムにおいて,手軽な情報検索処理方法を実現
する技術に関する。
【0002】
【従来の技術】従来の電子情報の検索技術として,ユー
ザが入力したキーワードを用いて検索するキーワード検
索技術がある。また,現在閲覧中の文書とよく似た文書
を検索するという類似話題検索技術がある。
【0003】参考文献1:新谷 研,角田 達彦,大石
巧,長尾 真「単語の共起頻度と出現位置による新聞
の関連記事の検索手法」,情報処理学会論文誌,1997,
Vol.38,No.4,pp855-862 。
【0004】参考文献2:井佐原 均,小作 浩美,内
元 清貴,村田 真樹,藪田 裕史,三上 宣宏,西俣
憲幸,高橋 誠「話題関連性に基づく情報検索手法を
実装したニュースリーダの開発」,情報処理振興事業協
会第19回技術発表論文集2000年10月 11-12日。
【0005】
【発明が解決しようとする課題】電子化された文章をコ
ンピュータで検索する情報検索技術は,文書の電子化,
情報社会の発展に伴い重要なものとなっている。
【0006】大半の情報検索システムは,ユーザがキー
ワードを入力する必要がある。しかし,キーワード検索
においては,キーワードの入力に手間がかかるうえ,入
力されるキーワードはユーザが思いつく範囲のものに限
られてしまう。したがって,入力するキーワードの重要
性の高低を見誤る場合もあり,あまり重要でないキーワ
ードが選択されて入力されることで検索のノイズが増
え,検索精度が低くなるという問題が生じる。
【0007】また,類似話題検索技術では,文書レベル
の検索しか扱うことができず,文書の一部が示す内容と
類似した文書を検索することができないという限界があ
る。したがって,文書全体の類似と文書の一部が示す内
容の類似とにずれがある場合に,検索精度が低くなると
いう問題が生じる。
【0008】本発明は,上記課題を解決するためになさ
れたものであり,電子情報を検索する際に,表示された
電子化された文章上でユーザがさらに詳しい情報を知り
たい部分を,クリックやドラッグなどによりワンタッチ
で簡単に指定するだけで,キーワード検索を行えるよう
な情報検索手段を提供することを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するた
め,本発明は,電子化された文字情報から検索キーを抽
出し,抽出した検索キーに基づいて情報を検索する方法
において,表示装置に表示された電子化された文字情報
上の検索キー抽出範囲を指定するための位置情報が入力
されると,入力された位置情報を受け付けて,所定の検
索キー抽出範囲を特定し,その特定した検索キー抽出範
囲をもとに情報検索を実行し,検索結果を出力すること
を特徴とする。前記処理過程では,ユーザから入力され
た位置情報の文字およびその位置情報の前,後または前
後の方向の所定の文字数,語数または行数を含む範囲を
検索キー抽出範囲とする。また,ユーザから入力された
位置情報が検索キー抽出範囲の開始位置および終了位置
を指定するものである場合には,入力された開始位置か
ら終了位置までの範囲を検索キー抽出範囲とする。
【0010】従来技術では,検索キーによる情報検索を
行う場合に,ユーザが一または複数の検索キーをキーボ
ードなどから入力しなければならなかったのに対し,本
発明では,現在読んでいる電子化された文章中で,関心
のある単語や話題を含む部分を,マウスなどのポインテ
ィングデバイスによって単にクリックしたりドラッグし
たりするだけで,その部分に関係のある他の電子化され
た情報を手軽に検索・閲覧することができるようにな
る。
【0011】以上の各処理手段をコンピュータによって
実現するためのプログラムは,コンピュータが読み取り
可能な可搬媒体メモリ,半導体メモリ,ハードディスク
などの適当な記録媒体に格納することができる。
【0012】
【発明の実施の形態】以下,本発明の実施の形態を図を
用いて説明する。図1に,本発明に係る情報検索処理装
置の構成例を示す。情報検索処理装置10は,検索キー
抽出範囲認識部11,検索キー抽出部12,情報検索実
行部13,情報検索用データベース14,検索キー抽出
条件設定部15からなる。情報検索用データベース14
は,情報検索処理装置10の外部にあってもよい。ま
た,情報検索実行部13は,ネットワークで接続された
他の装置を利用して検索を実行するように構成すること
もできる。
【0013】本実施の形態における情報検索処理装置1
0は,出力装置としてディスプレイ20を持ち,入力装
置としてマウス等のポインティングデバイス21を持っ
ている。ポインティングデバイス21は,表示画面上の
位置を指定できるものであれば,どのようなものでもよ
い。
【0014】検索キー抽出範囲認識部11は,ディスプ
レイ20に表示された電子化された文字情報上で検索キ
ー抽出範囲を指定するための位置情報を受け付けると,
受け付けた位置情報に基づいて,ディスプレイ20に表
示された文字情報から検索キー抽出範囲を特定する。検
索キー抽出部12は,検索キー抽出範囲認識部11で特
定した検索キー抽出範囲から,一または複数の検索キー
を抽出する。情報検索実行部13は,検索キー抽出部1
2で抽出した検索キーを用いて,情報検索用データベー
ス14を検索し,検索結果を出力する。検索キー抽出条
件設定部15は,事前にユーザからの入力によって,表
示画面上の位置情報から検索キー抽出範囲を特定する抽
出条件を設定する。
【0015】図2に,図1に示す情報検索処理装置10
の処理フローを示す。まず,検索キー抽出範囲認識部1
1により,電子文章上で検索キーを抽出するための範囲
指定の位置情報の入力を受け付け(ステップS1),受
け付けた位置情報をもとに電子文章上での検索キー抽出
範囲を特定する(ステップS2)。
【0016】位置情報は,例えばユーザが表示された電
子文章上で詳細情報を知りたいと思った部分について,
マウス等のポインティングデバイス21でクリックした
箇所またはドラッグした箇所とする。指定範囲の特定方
法として,以下のようなものがある。なお,以下のXは
正の整数である。 (1) クリックした箇所の前,後または前後X文字を範囲
とする。 (2) クリックした箇所の前,後または前後X行を範囲と
する。 (3) クリックした箇所の前,後または前後X個の主要単
語を範囲とする。 (4) クリックした箇所を含む段落またはその前後を空行
で区切られた範囲とする。 (5) クリックした箇所を含む前後を句点または読点で区
切られた範囲とする。 (6) ドラッグした範囲とする。
【0017】例えば,ユーザがクリックした箇所の前後
40字を指定範囲とする場合には,まずユーザがクリッ
クした箇所(位置情報)の入力を受け付け,クリックし
た文字とその前後の文字の合計81字を検索キー抽出範
囲と特定する。また,ユーザがクリックした箇所の前後
20語を指定範囲とする場合には,まずユーザがクリッ
クした箇所の入力を受け付け,形態素解析処理により,
その入力された箇所の前後20語を抽出して検索キー抽
出範囲とする。
【0018】次に,検索キー抽出部12により,特定し
た検索キー抽出範囲の中から検索キーを抽出する。まず
検索キー抽出範囲から,形態素解析処理により,自立語
や付属語を分類し,分類した自立語の中から名詞(必要
に応じて動詞を含んでもよい)を抽出し,抽出した名詞
を検索キーとする。さらに,名詞の中から専門用語等の
重要な名詞のみを検索キーとして抽出してもよい。検索
キーとして重要な単語であるかどうかは,例えば文書の
種類によらずにどの文書にもよく現れる単語は重要では
なく,特定の文書に偏って現れる単語は重要であると判
断する。これは一般の文書における単語の出現頻度に関
する統計情報などが格納された単語辞書を用いて判断す
ることができる。また,固有名詞であるかどうか専門用
語であるかどうかなどの単語属性が格納された単語辞書
を参照して,検索キーとしての重要性を判断してもよ
い。その他既知の単語抽出処理を用いて検索キーの抽出
を実現することが可能である。
【0019】次に,情報検索実行部13により抽出した
検索キーで,情報検索用データベース14を検索し(ス
テップS4),検索結果を出力する(ステップS5)。
情報検索の実行は,ネットワークを介した既存の検索サ
ーバを用いることで実現することもできる。
【0020】また,検索キー抽出部12で抽出した名詞
のすべてを検索キーとして,以下のRobertson
の式を利用した検索処理を用いれば,高精度な解を得る
こともできる。参考文献としては下記の参考文献3があ
る。この参考文献3からRobertsonの文献をた
どることができる。
【0021】S(d)=ΣTF(d,t)/(TF
(d,t)+1)*IDF(t) (Σの部分は,キーワードtで和をとる) S(d):記事dのスコア TF(d,t):記事dでのキーワードtの出現回数 IDF(t):キーワードtが出現する記事数の逆数,
である。
【0022】参考文献3:村田 真樹,馬 青,内元
清貴,小作 浩美,内山将夫,井佐原均「位置情報と分
野情報を用いた情報検索」,自然言語処理(言語処理学
会誌),2000年 4月,7 巻,2 号, p.141 〜 p.160。
【0023】いろいろな記事に現れるキーワードは重要
でないとされるが,いろいろな記事に現れるキーワード
は記事数の逆数のIDF(t)が小さくなり,上の式で
は小さい重みをかけて利用されることになる。得られた
キーワードをtとして,上の式のS(d)の値をすべて
の記事で計算し,S(d)の高い記事から順にユーザに
結果を提示する。
【0024】以下に,具体例として,論文の書誌情報が
登録されているデータベースを,電子化した論文の本文
の一部から検索する場合の処理を説明する。図3に,検
索元となる入力例およびその入力例から抽出した検索結
果の表示例を示す。
【0025】図3(A)に示す入力例は,ディスプレイ
20に表示された電子化された技術論文の一部である。
ユーザは,この表示された論文を見て「照応解析」に興
味を抱いたとする。そこで,表示された文章中の「照応
解析」の付近にカーソルを移動させてクリックする。
【0026】ここで,例えば検索キーの抽出範囲の条件
として,前後20文字(合計41文字)を範囲とするク
リックによる指定方式が設定されていたとする。そうす
ると,検索キー抽出範囲認識部11では,「応」の部分
にカーソルが位置することを検知して,その位置情報を
受け付け,「応」の前後20字(合計41文字)を検索
キー抽出範囲として特定する。特定した範囲は,「処理
の研究は,名詞句の指示現象を扱った照応解析と,文章
の構造をとらえる文章構造解析」となる。
【0027】検索キー抽出部12では,この検索キー抽
出範囲について形態素解析を行い,名詞だけを抽出す
る。抽出する語は,「処理,研究,名詞,句,指示,現
象,照応,解析,文章,構造,文章,構造,解析」であ
り,これら語群を検索キーとする。なお,予め備えた検
索キー抽出用辞書にもとづいて,抽出した語群から,
「名詞」,「指示」,「現象」,「照応」,「解析」を
重要な検索キーと判定し,さらに複合語として,「名詞
句」,「指示現象」も検索キーとするようにしてもよ
い。
【0028】情報検索実行部13では,検索キー抽出部
12から受け取った検索キーを用いて,論文書誌情報デ
ータベース(情報検索用データベース14)に対して検
索処理を行い検索結果を出力する。図3(B)に検索結
果の表示例を示す。検索処理結果として,該当する論文
の書誌情報を一覧で表示する。この例では,検索元のデ
ータが論文であり,検索先が論文の書誌情報であるが,
この例のように,検索キーを抽出するための検索元のデ
ータと検索対象となるデータとが異なる形式のものであ
っても検索を行うことができる。
【0029】なお,検索対象が特定の場所にある情報検
索用データベース14の情報ではなく,World W
ide Web(WWW)上で検索可能な情報でもよ
い。WWW上の情報検索の場合,検索結果が図3(B)
に示すような一覧形式またはもっと簡易な形式で表示さ
れ,これらの検索結果をクリックすることにより,ハイ
パーリンクによって論文の内容にアクセスするができる
ようにすることも可能である。
【0030】上記Robertsonの式を用いた検索
例を,図4の例に従って説明する。入力例は,図3
(A)に示した例と同様であるとする。特定した検索キ
ー抽出範囲の「処理の研究は,名詞句の指示現象を扱っ
た照応解析と,文章の構造をとらえる文章構造解析」に
おいて,「名詞」「指示」「照応」といったところが,
あまりいろいろな文書に出現しないということで,上記
Robertsonの式において高いIDF(t)を持
つことになる。このため,これらの語を含む書誌情報が
高いスコアを得てユーザに提示される。図4(B)にそ
の検索結果の表示例を示す。
【0031】場合によって「文章構造」といったフレー
ズレベルのものもキーワードとして利用することもあ
る。その場合に,「文章構造」はいろいろな記事に出現
しそうになく,IDF(t)が大きくなるであろうか
ら,「文章構造」を含む書誌情報を,誤ってたくさん出
力する可能性もある。しかし,そうであっても,もとも
とユーザが読んでいた文書すべてをキーとして検索する
場合には,「形態素」「構文」といった他のキーワード
も含まれることになって,より多くの不要な記事をとっ
てくる可能性があることを考えると,少々「文章構造」
に関係する記事をとってくる程度のレベルだと,十分精
度よく「照応」に関係する事項を検索できているという
ことができる。
【0032】とはいえ,もっと正確に引きたいという場
合を考えてみる。そのときには,ドラッグによる指定を
使えばよい。ここで興味のある部分をドラッグすると,
ドラッグ範囲は,例えば「名詞句の指示現象を扱った照
応解析」だけとなる。この場合に,形態素解析をして名
詞を取り出すと,「名詞,句,指示,現象,照応,解
析」となり,「文章構造」といったキーワードがなく,
これで検索をかければ,より正確に「照応」関係の論文
を検索することができる。
【0033】図5に,検索キー抽出条件を設定するユー
ザ設定画面の例,図6に検索キー抽出範囲の例を示す。
本実施の形態では,図1の検索キー抽出条件設定部15
が表示する図5に示すようなユーザ設定画面によって,
事前にユーザが検索キー抽出条件を設定することができ
るようになっている。まず,ドラッグによる範囲指定を
行うかどうか,クリックによる範囲指定を行うかどうか
を,チェックボックスをクリックすることによって選択
することができる。
【0034】さらに,ドラッグによる範囲指定の場合,
文字列の並びで指定するか,矩形領域で指定するかを選
択することができる。例えばドラッグによる範囲指定で
文字列の並びが選択されている場合に,図6(A)のよ
うに「形態素解析」から「大別」までドラッグしたとす
ると,検索キー抽出範囲は,「形態素解析,構文解析,
意味解析,文脈解析に大別」となる。また,ドラッグに
よる範囲指定で矩形領域が選択されている場合に,図6
(B)のような「文脈解析」から「照応解析」までのド
ラッグに対して,「文脈解析」を左上角,「照応解析」
を右下角とする矩形領域が検索キー抽出範囲となる。
【0035】クリックによる範囲指定において,「クリ
ック箇所の前後『20』文字」(数字20もユーザ設
定)が選択されていた場合に,図6(C)に示すよう
に,検索元データ中の「応」の文字をクリックすると,
その前後20文字を含めた合計41文字が検索キー抽出
範囲(点線で囲んだ範囲)として認識される。図6
(D)は,クリックによる範囲指定において,「クリッ
ク箇所の前『3』行」が選択されていた場合の検索キー
抽出範囲(点線で囲んだ範囲)の例を示している。他の
設定の場合も同様である。
【0036】検索キー抽出条件設定部15は,ユーザが
必要なときにメニュー等から呼び出すことができる。こ
れにより,検索キー抽出条件設定部15は,図5に示す
ユーザ設定画面を表示し,ユーザが設定した検索キー抽
出条件の設定情報を,検索キー抽出範囲認識部11に通
知する。この設定情報は保存されるので,変更したいと
きだけ図5に示すユーザ設定画面によって設定情報を変
更すればよい。
【0037】従来技術による方法と,本実施の形態によ
る方法との違いについて,WWWなどのインターネット
情報をブラウザによって閲覧している場合の例を用いて
説明する。あるホームページを読んでいるときに,今読
んでいるページのある一部分をより詳しく記述している
ページを探したいとする。
【0038】このとき,従来のキーワード検索の技術で
は,ユーザは,その探したい今読んでいるページの一部
分の箇所からユーザ自身が主要語(内容語)などのキー
ワードを拾って,それを既存のキーワード検索の検索エ
ンジンに入力し検索する必要があった。また,従来の類
似話題検索の技術では,文書単位(ここではホームペー
ジのページ単位)でしか検索ができないので,今読んで
いるページ全体から主要語(内容語)を取り出して検索
することになる。したがって,今読んでいるページの一
部分から取り出すのと異なり,不要なキーワードが含ま
れる可能性が高くなる。
【0039】これに対し,本実施の形態による検索方法
によれば,例えば今読んでいるページの詳細情報を知り
たい箇所をポインティングデバイスによってクリックす
るだけで,その近辺の所定の範囲の自然言語文からだけ
主要語(内容語)等を取り出し,あるいは,詳細情報を
知りたい箇所をポインティングデバイスによってドラッ
グするだけで,そのドラッグされた箇所の自然言語文か
らだけ主要語(内容語)等を取り出して,WWW上の情
報を検索する。したがって,従来のキーワード検索のよ
うにユーザがわざわざキーワードを指定する必要がな
く,ユーザの使い勝手が非常によい。また,従来の類似
話題検索のように文書全体からキーワードを取り出すの
ではなく,注目している一部の部分からのみキーワード
を自動で取り出すため,精度の高い検索が実現できる。
【0040】また,図3に示したような検索を行う場合
に,従来のキーワード検索では,例えば「照応」もしく
は「照応解析」という文字列を検索キーとして入力する
ことになるが,この「照応」や「照応解析」という検索
キーだけでは,ユーザが知りたいと思っている検索結果
を拾いつくすことができないことが多い。このとき,ユ
ーザが他の検索キーを追加したいと思っても,関連する
語についての知識がなければ適切な語を検索キーとして
指定し追加することが難しい。
【0041】これに対し本実施の形態による検索方法に
よれば,単に「照応」の文字の近辺をクリックするだけ
で,文章中で「照応」の近くにある「名詞句」や「指示
現象」というような語も検索キーとして自動抽出され
る。一般に文章中では意味的に関連のある語群が近くに
現れることが多いので,「照応」,「名詞句」,「指示
現象」といった語が検索キーとして選ばれることによ
り,精度のよい検索が実現されることになる。これによ
り,ユーザは「照応」,「名詞句」,「指示現象」とい
った語が意味的に関連のある語かどうかということを知
らなくても,知りたい情報をもらさずに検索結果として
容易に入手できることになる。
【0042】
【発明の効果】以上説明したように,本発明によれば,
検索元となる電子化された文字情報の中からユーザが指
定した位置情報を受け付け,その位置情報から検索キー
を抽出する範囲を特定し,検索元の特定した範囲から自
動的に検索キーを抽出して情報検索を行う。これによ
り,ユーザは電子化された文章中で検索したい情報の表
示画面上の位置を単に指示するだけでよく,ユーザ自身
で検索キーを入力しなければならないという操作労力の
負担を軽減するという効果がある。
【0043】また,文書全体の類似度でなく,文書の一
部の範囲から検索キーを抽出して情報検索を行うため,
検索元としたい文書の一部が文書全体の内容と傾向が異
なる場合にも,精度の高い検索結果を出力することがで
きるという効果がある。
【図面の簡単な説明】
【図1】本発明の実施の形態におけるブロック構成例を
示す図である。
【図2】実施の形態における処理フロー図である。
【図3】入力例および検索結果の表示例を示す図であ
る。
【図4】入力例および検索結果の表示例を示す図であ
る。
【図5】検索キー抽出条件を設定するユーザ設定画面の
例を示す図である。
【図6】検索キー抽出範囲の例を示す図である。
【符号の説明】
10 情報検索処理装置 11 検索キー抽出範囲認識部 12 検索キー抽出部 13 情報検索実行部 14 情報検索用データベース 15 検索キー抽出条件設定部 20 ディスプレイ 21 ポインティングデバイス
───────────────────────────────────────────────────── フロントページの続き (72)発明者 井佐原 均 東京都小金井市貫井北町4−2−1 郵政 省通信総合研究所内 Fターム(参考) 5B075 ND03 NK31 NK37 PP03 PQ02 QP05 5E501 AA02 AC33 BA05 CA02 CB09 EA05 EA12 EB05 EB06 FA23 FB23 FB43

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 電子化された文字情報にもとづいて情報
    を検索する処理装置において,出力装置に表示された電
    子化された文字情報上で検索キーを抽出する範囲を指定
    する位置情報が入力されると,前記位置情報を受け付け
    る手段と,前記位置情報に基づいて,出力装置に表示さ
    れた文字情報からあらかじめ定められた検索キー抽出範
    囲を特定する手段と,特定した検索キー抽出範囲をもと
    に情報検索を実行し,検索結果を出力する手段とを備え
    ることを特徴とする情報検索処理装置。
  2. 【請求項2】 請求項1記載の情報検索処理装置におい
    て,前記検索キー抽出範囲を特定する手段は,前記位置
    情報の前,後もしくは前後の所定の文字数,語数もしく
    は行数を含む範囲,または前記位置情報が示す段落の範
    囲,または前記位置情報の文字を含む句読点で区切られ
    た範囲を,検索キー抽出範囲とすることを特徴とする情
    報検索処理装置。
  3. 【請求項3】 請求項1記載の情報検索処理装置におい
    て,前記検索キー抽出範囲を特定する手段は,前記位置
    情報が前記検索キー抽出範囲の開始位置および終了位置
    を指定するものである場合には,前記開始位置から終了
    位置までの範囲を,検索キー抽出範囲とすることを特徴
    とする情報検索処理装置。
  4. 【請求項4】 請求項1から請求項3までのいずれかに
    記載の情報検索処理装置において,前記検索キー抽出範
    囲を特定する手段が前記位置情報から検索キー抽出範囲
    を特定する抽出条件を,事前にユーザからの入力によっ
    て設定する条件設定手段を備えることを特徴とする情報
    検索処理装置。
  5. 【請求項5】 電子化された文字情報にもとづいて情報
    を検索する方法において,出力装置に表示された電子化
    された文字情報上で検索キーを抽出する範囲を指定する
    位置情報が入力されると,その位置情報を受け付ける処
    理過程と,前記位置情報に基づいて,出力装置に表示さ
    れた文字情報からあらかじめ定められた検索キー抽出範
    囲を特定する処理過程と,特定した検索キー抽出範囲を
    もとに情報検索を実行し,検索結果を出力する処理過程
    とを有することを特徴とする情報検索処理方法。
  6. 【請求項6】 電子化された文字情報にもとづいて情
    報を検索するためのプログラムを記録した記録媒体であ
    って,出力装置に表示された電子化された文字情報上で
    検索キーを抽出する範囲を指定する位置情報が入力され
    ると,その位置情報を受け付ける処理と,前記位置情報
    に基づいて,出力装置に表示された文字情報からあらか
    じめ定められた検索キー抽出範囲を特定する処理と,特
    定した検索キー抽出範囲をもとに情報検索を実行し,検
    索結果を出力する処理とを,コンピュータに実行させる
    ためのプログラムを記録したことを特徴とする情報検索
    処理プログラムを記録した記録媒体。
JP2000396764A 2000-12-27 2000-12-27 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体 Pending JP2002197104A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2000396764A JP2002197104A (ja) 2000-12-27 2000-12-27 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
US10/017,316 US20020083045A1 (en) 2000-12-27 2001-12-18 Information retrieval processing apparatus and method, and recording medium recording information retrieval processing program
CN01145183A CN1362681A (zh) 2000-12-27 2001-12-27 信息检索处理装置和方法,记录信息检索程序的记录媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000396764A JP2002197104A (ja) 2000-12-27 2000-12-27 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2002197104A true JP2002197104A (ja) 2002-07-12

Family

ID=18862001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000396764A Pending JP2002197104A (ja) 2000-12-27 2000-12-27 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体

Country Status (3)

Country Link
US (1) US20020083045A1 (ja)
JP (1) JP2002197104A (ja)
CN (1) CN1362681A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006338142A (ja) * 2005-05-31 2006-12-14 Sharp Corp 電子書籍装置
JP2007102767A (ja) * 2005-09-07 2007-04-19 Ricoh Co Ltd 情報処理装置
JP2007140803A (ja) * 2005-11-17 2007-06-07 Mitsubishi Electric Corp 文書管理システム
JP2007272859A (ja) * 2005-08-30 2007-10-18 Zoo Corp 情報検索支援プログラム、情報検索支援機能を有するコンピュータ、サーバー・コンピュータ、プログラム格納媒体
JP2007272872A (ja) * 2006-03-08 2007-10-18 Ricoh Co Ltd 情報検索方法、情報検索装置、情報検索システム、及び情報検索プログラム
JP2009129098A (ja) * 2007-11-21 2009-06-11 Kddi Corp 情報検索装置およびコンピュータプログラム
JP2011054148A (ja) * 2009-08-04 2011-03-17 Nippon Telegr & Teleph Corp <Ntt> 検索装置及び方法及びプログラム
JP2011138242A (ja) * 2009-12-28 2011-07-14 Hitachi-Ge Nuclear Energy Ltd 情報参照支援システム
WO2013077014A1 (ja) * 2011-11-24 2013-05-30 シャープ株式会社 表示制御装置、表示方法、制御プログラム、および記録媒体
JP2013200800A (ja) * 2012-03-26 2013-10-03 Dainippon Printing Co Ltd 関連情報提示装置、関連情報提示システム、関連情報提示方法、およびプログラム
JP2014191417A (ja) * 2013-03-26 2014-10-06 Dainippon Printing Co Ltd 参照情報提示装置、参照情報提示方法、プログラム、および参照情報提示システム
JP2017517052A (ja) * 2014-04-29 2017-06-22 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 表示内容に対応する検索結果の提供
JP2018538616A (ja) * 2015-11-18 2018-12-27 グーグル エルエルシー モバイルデバイス上での擬似ハイパーリンク

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7467137B1 (en) 1994-09-02 2008-12-16 Wolfe Mark A System and method for information retrieval employing a preloading procedure
US20030221163A1 (en) * 2002-02-22 2003-11-27 Nec Laboratories America, Inc. Using web structure for classifying and describing web pages
CN100437561C (zh) * 2003-12-17 2008-11-26 国际商业机器公司 电子文档的处理方法和装置及其系统
US20050149851A1 (en) * 2003-12-31 2005-07-07 Google Inc. Generating hyperlinks and anchor text in HTML and non-HTML documents
US20070219986A1 (en) * 2006-03-20 2007-09-20 Babylon Ltd. Method and apparatus for extracting terms based on a displayed text
JP2007257369A (ja) * 2006-03-23 2007-10-04 Fujitsu Ltd 情報検索装置
CN102004721A (zh) * 2010-11-10 2011-04-06 无敌科技(西安)有限公司 一种标示词汇习语的装置及方法
JP5185402B2 (ja) * 2011-01-11 2013-04-17 株式会社東芝 文書検索装置、文書検索方法、及び文書検索プログラム
EP2793103A1 (en) * 2013-04-17 2014-10-22 Advanced Digital Broadcast S.A. Method for operating a text input interface
US9811352B1 (en) 2014-07-11 2017-11-07 Google Inc. Replaying user input actions using screen capture images
US10970646B2 (en) 2015-10-01 2021-04-06 Google Llc Action suggestions for user-selected content
CN105592331B (zh) * 2015-12-16 2019-09-27 广州华多网络科技有限公司 一种弹幕消息的处理方法、相关设备和系统
CN111061925B (zh) * 2019-12-16 2021-02-19 珠海格力电器股份有限公司 联系人查找方法、装置、终端设备及可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05181853A (ja) * 1992-01-07 1993-07-23 Hitachi Ltd 文書処理方式
JPH07129587A (ja) * 1993-11-08 1995-05-19 Canon Inc 文書処理装置及び方法
JPH1049549A (ja) * 1996-05-29 1998-02-20 Matsushita Electric Ind Co Ltd 文書検索装置
JPH1145252A (ja) * 1997-07-25 1999-02-16 Just Syst Corp 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11161682A (ja) * 1997-09-29 1999-06-18 Toshiba Corp 情報検索装置、情報検索方法及び記録媒体
JP2000148787A (ja) * 1998-11-18 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> 分散型文書検索装置
JP2000276485A (ja) * 1999-03-25 2000-10-06 Sharp Corp 電子辞書装置及び電子辞書プログラムを記録した記録媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6457004B1 (en) * 1997-07-03 2002-09-24 Hitachi, Ltd. Document retrieval assisting method, system and service using closely displayed areas for titles and topics
US6341306B1 (en) * 1999-08-13 2002-01-22 Atomica Corporation Web-based information retrieval responsive to displayed word identified by a text-grabbing algorithm
US6345273B1 (en) * 1999-10-27 2002-02-05 Nancy P. Cochran Search system having user-interface for searching online information

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05181853A (ja) * 1992-01-07 1993-07-23 Hitachi Ltd 文書処理方式
JPH07129587A (ja) * 1993-11-08 1995-05-19 Canon Inc 文書処理装置及び方法
JPH1049549A (ja) * 1996-05-29 1998-02-20 Matsushita Electric Ind Co Ltd 文書検索装置
JPH1145252A (ja) * 1997-07-25 1999-02-16 Just Syst Corp 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11161682A (ja) * 1997-09-29 1999-06-18 Toshiba Corp 情報検索装置、情報検索方法及び記録媒体
JP2000148787A (ja) * 1998-11-18 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> 分散型文書検索装置
JP2000276485A (ja) * 1999-03-25 2000-10-06 Sharp Corp 電子辞書装置及び電子辞書プログラムを記録した記録媒体

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006338142A (ja) * 2005-05-31 2006-12-14 Sharp Corp 電子書籍装置
JP2007272859A (ja) * 2005-08-30 2007-10-18 Zoo Corp 情報検索支援プログラム、情報検索支援機能を有するコンピュータ、サーバー・コンピュータ、プログラム格納媒体
JP2007102767A (ja) * 2005-09-07 2007-04-19 Ricoh Co Ltd 情報処理装置
JP2007140803A (ja) * 2005-11-17 2007-06-07 Mitsubishi Electric Corp 文書管理システム
JP2007272872A (ja) * 2006-03-08 2007-10-18 Ricoh Co Ltd 情報検索方法、情報検索装置、情報検索システム、及び情報検索プログラム
JP2009129098A (ja) * 2007-11-21 2009-06-11 Kddi Corp 情報検索装置およびコンピュータプログラム
JP2011054148A (ja) * 2009-08-04 2011-03-17 Nippon Telegr & Teleph Corp <Ntt> 検索装置及び方法及びプログラム
JP2011138242A (ja) * 2009-12-28 2011-07-14 Hitachi-Ge Nuclear Energy Ltd 情報参照支援システム
WO2013077014A1 (ja) * 2011-11-24 2013-05-30 シャープ株式会社 表示制御装置、表示方法、制御プログラム、および記録媒体
JP2013114266A (ja) * 2011-11-24 2013-06-10 Sharp Corp 表示制御装置、表示方法、制御プログラム、および記録媒体
JP2013200800A (ja) * 2012-03-26 2013-10-03 Dainippon Printing Co Ltd 関連情報提示装置、関連情報提示システム、関連情報提示方法、およびプログラム
JP2014191417A (ja) * 2013-03-26 2014-10-06 Dainippon Printing Co Ltd 参照情報提示装置、参照情報提示方法、プログラム、および参照情報提示システム
JP2017517052A (ja) * 2014-04-29 2017-06-22 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 表示内容に対応する検索結果の提供
JP2018538616A (ja) * 2015-11-18 2018-12-27 グーグル エルエルシー モバイルデバイス上での擬似ハイパーリンク
US10733360B2 (en) 2015-11-18 2020-08-04 Google Llc Simulated hyperlinks on a mobile device

Also Published As

Publication number Publication date
US20020083045A1 (en) 2002-06-27
CN1362681A (zh) 2002-08-07

Similar Documents

Publication Publication Date Title
JP2002197104A (ja) 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
EP0530993B1 (en) An iterative technique for phrase query formation and an information retrieval system employing same
US6381593B1 (en) Document information management system
US7783644B1 (en) Query-independent entity importance in books
US10552467B2 (en) System and method for language sensitive contextual searching
US20040098385A1 (en) Method for indentifying term importance to sample text using reference text
JPH11161682A (ja) 情報検索装置、情報検索方法及び記録媒体
US7284006B2 (en) Method and apparatus for browsing document content
Sezer TS corpus project: An online Turkish dictionary and TS DIY corpus
JP2007072646A (ja) 検索装置、検索方法およびプログラム
WO2019200699A1 (zh) 政务系统发文方法、装置、计算机设备及存储介质
KR100455439B1 (ko) 인터넷 자원의 도메인화와 확장 사이트맵을 이용한정보검색 및 브라우징방법
JPH09198395A (ja) 文書検索装置
US20050102280A1 (en) Search system, search program, and personal computer
JP2001265774A (ja) 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム
JP2010266971A (ja) 端末装置
Roche et al. AcroDef: A quality measure for discriminating expansions of ambiguous acronyms
JP2002049644A (ja) 情報処理装置、記憶媒体及びコンピュータプログラム
JP4426893B2 (ja) 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置
JP4298342B2 (ja) 重要度算出装置
JP2004157965A (ja) 検索支援装置、検索支援方法、プログラムおよび記録媒体
Baisa et al. Turkic language support in Sketch Engine
KR100885527B1 (ko) 문맥 기반 색인데이터 생성장치와 문맥기반 검색장치 및 그방법
JP2000105769A (ja) 文書表示方法
JP3693734B2 (ja) 情報検索装置およびその情報検索方法