JP2005018218A - Device and method for deploying knowledge information - Google Patents

Device and method for deploying knowledge information Download PDF

Info

Publication number
JP2005018218A
JP2005018218A JP2003179448A JP2003179448A JP2005018218A JP 2005018218 A JP2005018218 A JP 2005018218A JP 2003179448 A JP2003179448 A JP 2003179448A JP 2003179448 A JP2003179448 A JP 2003179448A JP 2005018218 A JP2005018218 A JP 2005018218A
Authority
JP
Japan
Prior art keywords
knowledge information
data
knowledge
basic data
title
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003179448A
Other languages
Japanese (ja)
Inventor
Kyohiko Setogawa
教彦 瀬戸川
Yasubumi Fujii
泰文 藤井
Takahiro Yamanaka
隆博 山中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Systems and Services Ltd
Original Assignee
Hitachi Systems and Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Systems and Services Ltd filed Critical Hitachi Systems and Services Ltd
Priority to JP2003179448A priority Critical patent/JP2005018218A/en
Publication of JP2005018218A publication Critical patent/JP2005018218A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide mechanically discernible knowledge information data generated on the basis of contents data. <P>SOLUTION: A term (basic data) for specifying knowledge information is input into a basic data input means 1101. A knowledge information extracting means 1103 extracts the knowledge information regarding the input term from a knowledge information database 400. A device for deploying knowledge information 1105 outputs the knowledge information extracted from the database 400 by the extracting means 1103 to the outside. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の技術分野】
この発明は、コンテンツデータに基づいて生成した機械利用可能な知識情報データを展開して出力する知識情報展開装置およびその方法に関する。
【0002】
【従来の技術および課題】
従来、例えば、電子的な百科事典の項目を参照していた際に、その項目に関連するWebページを検索しようとした場合、利用者がコンテンツの内容から特徴的であると思われる単語を選択し、インターネット検索エンジンの検索文字列入力欄に手作業で入力する必要があった。その際、人手による単純作業が発生し利便性が悪い。
【0003】
かかる検索の精度を上げるには、項目のタイトル文字列だけでなく、特徴的な単語を複数選択する必要があるが、これは利用者が参照中のコンテンツの内容から文字列をコピーペーストする作業や、単語を連想して入力する作業の必要が生じるため不便である。
【0004】
なお、入力キーワードに対する分野コードを記録しておき、これをキーワード検索時に用いて検索対象を絞り込む技術が知られている(例えば、特許文献1)。
【0005】
【特許文献1】
【0006】
特開平2002−132824号公報
【課題を解決するための手段および発明の効果】
(1)(2)この発明の知識情報展開装置は、
基本データに基づいて、関連する知識情報を展開する知識情報展開装置であって、
基本データを入力するための基本データ入力手段、
当該基本データ入力手段からの基本データを受けて、タイトルを定義するために用いられる用語を当該タイトルに対応付けて知識情報として記録した知識情報データベースから、当該基本データに関する知識情報を抽出する知識情報抽出手段、
前記知識情報抽出手段が抽出した知識情報を出力する知識情報展開手段、
を備えたことを特徴とする。
【0007】
これにより、特定の用語に関連する文字列データを外部装置に出力して提供することが可能になる。なお、この文字列データには、当該用語を定義付ける単語が選ばれているので、例えば、インターネット検索エンジンなどの検索を行う際に検索キーワードとして併せて用いれば、精度の高い結果を得ることができる。
【0008】
(3)この発明の知識情報展開装置は、
前記知識情報提供手段が抽出した知識情報を所定のアプリケーションに出力することを特徴とする。
【0009】
これにより、特定の用語に関連する文字列データを出力することが可能であり、かかる機械認識が可能な文字列データをアプリケーションが利用できる。
【0010】
(4)この発明の知識情報展開装置は、
前記知識情報が、タイトルと内容を関連づけて記録したコンテンツデータからタイトルデータを抽出した知識名、当該コンテンツデータの特徴部分データに含まれる各語の中から抽出した前記知識名に対応付けられる定義語データ、を備えたことを特徴とする。
【0011】
これにより、特定の用語である知識名に関連する定義語データを外部装置に出力して提供することが可能になる。
【0012】
(5)この発明の知識情報展開装置は、
前記定義語データが、前記コンテンツデータの特徴を最もよく表した主定義語データと、前記主定義語データ以外の補助定義語データとから構成されることを特徴とするもの。
【0013】
これにより、特定の用語である知識名に関連する主定義語データ、補助定義語データを外部装置に出力して提供することが可能になる。
【0014】
(6)この発明の知識情報展開装置は、
前記知識情報が、前記コンテンツデータの内容に基づいて前記タイトルに関連する内容を表す関連語データ、を備えたことを特徴とする。
【0015】
これにより、関連語データを含めた知識情報を外部装置に出力して提供することが可能になる。
【0016】
(7)この発明の知識情報展開装置は、
前記特徴部分データが、コンテンツデータの内容を構成する文を形態素解析して得られた語を抽出したものであることを特徴とする。
【0017】
これにより、コンテンツデータの内容から自動的に抽出した語を知識情報として提供することが可能になる。
【0018】
(8)この発明の知識情報展開装置は、
前記主定義語データが、形態素解析の結果、名詞であると決定された特徴部分データの末尾の語であることを特徴とする。
【0019】
これにより、コンテンツデータの内容から自動的に抽出した最も特徴的な表現の語を知識情報として提供することが可能になる。
【0020】
(9)この発明の知識情報展開装置は、
前記主定義語データが、コンテンツデータの内容を構成する文において、知識名を含む係り文節と係り受け関係にある受け文節に含まれる語であることを特徴とする。
【0021】
これにより、コンテンツデータの内容から抽出した最も特徴的な表現の語を知識情報として提供することが可能になる。
【0022】
(10)この発明の知識情報展開装置は、
前記関連語データが、前記コンテンツデータのリンク付けされた語に基づいて抽出されることを特徴とする。
【0023】
これにより、コンテンツデータの内容から抽出した関連性のある語を知識情報として提供することが可能になる。
【0024】
(11)この発明の知識情報展開装置は、
前記タイトルと内容を関連づけて記録したコンテンツデータが、辞書であることを特徴とする。
【0025】
これにより、コンテンツデータの内容から抽出した意味的に信憑性の高い知識情報を提供することが可能になる。
【0026】
【発明の実施の形態】
以下、本発明における一実施形態について、図面を参照して説明する。
【0027】
1.知識情報の作成
まず、本発明で使用する知識情報について説明する。ここで「知識情報」とは、用語や人名等のキーワードを説明するための情報を知識データとして体系的に記録したものである。このような知識情報は、例えば、用語や人名を説明するための情報を有する百科事典に基づいて作成することができる。
【0028】
上述したような百科事典に基づいて、知識情報作成装置を用いて知識情報データの作成を行う場合の例を説明する。
【0029】
1−1.全体構成
図1に、上記の知識情報作成装置の全体構成図を示す。この図において、百科事典コンテンツサーバ1と知識情報作成装置3は、相互に接続されておりそれぞれ通信可能である。
【0030】
百科事典コンテンツサーバ1は、百科事典のコンテンツを記録する記録手段11を備えるコンピュータ装置である。
【0031】
知識情報作成装置3は、百科事典のコンテンツに関する知識情報データを作成するためのコンピュータ装置である。
【0032】
この知識情報作成装置3は、百科事典コンテンツサーバ1の記録手段に記録されたコンテンツを入力する入力手段31、入力手段31が入力したコンテンツに基づいて知識名を抽出する知識名抽出手段33、知識名毎に知識IDを付与する知識ID付与手段35、入力手段31が入力したコンテンツに基づいて特徴部分を抽出する特徴部分抽出手段37、特徴部分抽出手段37が抽出した特徴部分に基づいて主定義語を抽出する主定義語抽出手段39、特徴部分抽出手段37が抽出した特徴部分に基づいて補助定義語を抽出する補助定義語抽出手段41、前記コンテンツに関連する情報である関連語を抽出する関連語抽出手段43および前記定義語および前記補助定義語をコンテンツに関する知識情報データとして記録する知識情報記録手段45を備えている。
【0033】
1−2.ハードウェア構成
図2に、上記知識情報作成装置3におけるハードウェア構成図を示す。このコンピュータ装置は、ディスプレイ201、CPU203、メモリ205、キーボード/マウス207、ハードディスク209、CD−ROMドライブ211および通信回路215を備えている。
【0034】
ハードディスク209は、入力手段31、知識名抽出手段33、知識ID付与手段35、特徴部分抽出手段37、主定義語抽出手段39、補助定義語抽出手段41、関連語抽出手段43および知識情報記録手段45を実現して知識情報作成処理を行うための知識情報作成プログラム250を記憶している。なお、主定義語抽出手段39、補助定義語抽出手段41を合わせて定義語抽出手段40とする。
【0035】
このプログラムは、例えば、CD−ROM213からCD−ROMドライブ211を介してハードディスク209にインストールされたものである。なお、フレキシブルディスクやICカード等のようにCD−ROM以外の記録媒体に記録された処理プログラムからインストールするようにしてもよい。さらに、通信回線を介して他のコンピュータに記録された処理プログラムをインストールするようにしてもよい。
【0036】
通信回路215は、他のコンピュータ装置との通信を行うための回路であって、ここでは百科事典コンテンツサーバ1と接続可能である。
【0037】
なお、百科事典コンテンツサーバ1は、百科事典コンテンツを記録するコンピュータ装置であって、そのハードウェア構成は上述した知識情報作成装置と同様である。なお、百科事典コンテンツサーバ1のハードディスクには、百科事典としてのコンテンツ集合が記録されている。
【0038】
1−3.コンテンツ
以下、百科事典コンテンツについて説明する。知識情報データの作成対象となる百科事典コンテンツは、あらゆる専門分野の言葉について、そのタイトルを示す項目とその内容を示す説明とを記録している。
【0039】
図3に、百科事典コンテンツの例を示す。図に示すように、コンテンツ300は、HTML(HyperText Markup Language)で記述されており、1つのタイトルとこれに対応する内容を表現している。このようなHTMLで記述されたコンテンツが集合することによって、1つの百科事典350を構成している。
【0040】
1−4.知識情報作成処理
上述したような百科事典350のコンテンツ300に基づいて知識情報データの作成を行う場合の例を説明する。図4に、本発明を利用した知識情報作成処理におけるフローチャートを示す。
【0041】
知識情報作成装置3において、ユーザによって知識情報作成プログラム250が起動されると、知識情報作成装置3のCPU203は、百科事典コンテンツサーバ1に百科事典としてのコンテンツ集合を要求する(ステップS411)。
【0042】
要求を受けて、百科事典コンテンツサーバ1は、ハードディスクに記録している百科事典としてのコンテンツ集合を知識情報作成装置3に出力する(ステップS401)。
【0043】
出力を受けて、知識情報作成装置3のCPU203は、コンテンツ集合を入力してハードディスク209に記録する(ステップS412)。
【0044】
CPU203は、百科事典としてのコンテンツ集合から1コンテンツをメモリ205に読み込む(ステップS413)。
【0045】
1−4−1.知識名抽出処理
CPU203は、読み込んだ1コンテンツのデータに基づいて、知識名抽出処理を行う(ステップS415)。図5に、知識名抽出処理におけるフローチャートを示す。
【0046】
CPU203は、読み込んだコンテンツのタイトルデータを検出する(ステップS501)。例えば、図3のHTMLで記述されたコンテンツにおいては、<TITLE>タグ301を検索することによりタイトルデータを検出する。
【0047】
CPU203は、検出したタイトルデータに基づいて、知識名データを決定する(ステップS503)。例えば、図3のコンテンツにおいては、<TITLE>タグ301および</TITLE>タグ303で囲まれたテキスト情報である「大島」を知識名データとして決定する。
【0048】
CPU203は、決定した知識名データをメモリ205に記憶する(ステップS505)。図3のコンテンツの場合、「大島」が知識名データとして記録される。
【0049】
1−4−2.知識IDの付与
CPU203は、知識名抽出処理で抽出した知識名データに対して知識IDを付与する(ステップS417)。知識IDは、各知識情報データを識別するものであって、例えば、連続番号を用いて作成すればよい。
【0050】
1−4−3.特徴部分抽出処理
CPU203は、読み込んだコンテンツに基づいて、特徴部分抽出処理を行う(ステップS419,図4)。図6に、特徴部分抽出処理におけるフローチャートを示す。
【0051】
CPU203は、読み込んだコンテンツの内容部分を検出する(ステップS601)。例えば、図3のHTMLで記述されたコンテンツにおいては、<BODY>タグ305および</BODY>タグ307を検索することにより、これらのタグで囲まれた部分を内容部分として検出する。
【0052】
CPU203は、検出した内容部分の1行目の文を取得する(ステップS603)。図3のコンテンツ31においては、<BODY>タグ305以降であって、最初の「。」が登場するまでのテキスト部分のうち、タグ部分(<P>タグ、<A>タグ等)を除いた部分を1行目の文として取得する。
【0053】
例えば、
”<P><A HREF=”izusyotou.html”>伊豆諸島</A>最北部にある最大の島。”
が<BODY>タグ305以降であって、最初の「。」が登場するまでのテキスト部分であり、これのタグ部分を除くと”伊豆諸島最北部にある最大の島。”が内容部分の1行目の文となる。
【0054】
CPU203は、取得した内容部分の1行目の文に対して形態素解析を行う(ステップS605)。図7に、取得した内容部分の1行目の文を形態素解析して特徴部分を抽出する場合の例を示す。
【0055】
図7において、”伊豆諸島最北部にある最大の島。”701は、抽出した内容部分の1行目の文である。CPU203は、この文を形態素解析し、”|伊豆諸島|最北部|に|ある|最大|の|島|。”703に示すように、最小の言語単位である形態素に分割する。図7aに、このときメモリに格納される処理結果を示す。図7aにおいては、分割された形態素707毎に品詞709が記録されている。
【0056】
CPU203は、形態素に分割した文から名詞のみを抽出し、これを特徴部分データとして決定する(ステップS607)。すなわち、CPU203は、図7aに示す品詞が名詞である形態素のみを抽出し、それぞれの名詞を特徴部分データとして決定する。図7の705は、このとき特徴部分データとして抽出される名詞である。
【0057】
CPU203は、決定した特徴部分をメモリ205に記憶する(ステップS609)。図7の場合、「伊豆諸島」,「最北部」,「最大」,「島」がそれぞれ特徴部分データとして記憶される。
【0058】
1−4−4.主定義語・補助定義語抽出処理
CPU203は、読み込んだコンテンツに基づいて、主定義語・補助定義語抽処理を行う(ステップS421,図4)。図8に、主定義語・補助定義語抽出処理におけるフローチャートを示す。
【0059】
CPU203は、メモリ205に記憶した特徴部分データを読み込む(ステップS801)。例えば、図7の705に示した特徴部分データである「伊豆諸島」,「最北部」,「最大」,「島」が読み込まれる。
【0060】
CPU203は、読み込んだ特徴部分データのうち末尾の特徴部分データを主定義語データとして決定する(ステップS803)。図7の例においては、「島」が末尾の特徴部分であるので、これを主定義語データとして決定する。CPU203は、決定した主定義語である「島」をメモリ205に記憶する(ステップS805)。
【0061】
CPU203は、読み込んだ特徴部分データのうち、主定義語データとして決定した特徴部分データを除く他の特徴部分データを補助定義語データに決定する(ステップS807)。図7の例においては、「伊豆諸島」,「最北部」,「最大」が主定義語データとして決定した特徴部分データを除く他の特徴部分データであるので、これを補助定義語データとして決定する。CPU203は、決定した補助定義語データである「伊豆諸島」,「最北部」,「最大」をメモリ205に記憶する(ステップS809)。
【0062】
1−4−5.関連語抽出処理
CPU203は、読み込んだコンテンツに基づいて、関連語抽処理を行う(ステップS423,図4)。図9に、関連語抽出処理におけるフローチャートを示す。
【0063】
CPU203は、読み込んだコンテンツの内容部分の中からリンク情報を検出する(ステップS901)。図3のHTMLで記述されたコンテンツにおいては、<A〜>タグ309および</A>タグ311を検索することにより、これらのタグで囲まれた部分をリンク情報として検出する。
【0064】
例えば、
”<A HREF=”izusyotou.html”>伊豆諸島</A>”
から検出されるリンク情報は「伊豆諸島」であり、
”<A HREF=”miharayama.html”>三原山</A>”
から検出されるリンク情報は、「三原山」である。
【0065】
CPU203は、検出したリンク情報を関連語データとして決定し(ステップS903)、これらをメモリ205に記憶する(ステップS905)。
【0066】
1−4−6.知識情報データの記録
CPU203は、上記の処理においてメモリ205に記憶した知識名データ、知識ID、主定義語データ、補助定義語データおよび関連語データを知識情報データとして知識情報データベース400に記録する(ステップS425)。
【0067】
図10に、知識情報データベース400の例を示す。このデータベースは、知識名1001、知識ID1003、主定義語1005、補助定義語1007および関連語1009がそれぞれ記録される。上記の例の場合、知識名「大島」、知識ID「001」、主定義語「島」、補助定義語「伊豆諸島,最北部,最大」および関連語「伊豆諸島,三原山」が記録される。
【0068】
1−4−7.処理の終了
読み込んだコンテンツに関する知識情報データを記録すると、CPU203は、知識情報データを作成していない他のコンテンツがあるか否かを判断し、コンテンツがあれば(ステップS427,YES)、ステップS413に戻って新たなコンテンツを読み込み、上記と同様の処理を繰り返すことにより知識情報データを作成する。なお、すべてのコンテンツについて知識情報データを作成したと判断すれば(ステップS427,NO)、当該処理を終了する。
【0069】
1−4−8.まとめ
このように、百科事典であるコンテンツ集合を入力し、それぞれのコンテンツの内容に基づいて、知識名データ、知識ID、主定義語データ、補助定義語データおよび関連語データを抽出してコンテンツの知識情報データとすることにより、百科事典全体の知識情報データを容易に作成することができる。
【0070】
上記においては、コンテンツを記録するコンテンツサーバ1と、知識情報作成処理を行う知識情報作成装置3とに分けて説明しているが、知識情報作成装置3にコンテンツを記録する記録手段を設け、知識情報作成装置3のみで処理を行うように構成してもよい。また、コンテンツサーバ1に知識情報作成プログラム250をインストールして、コンテンツサーバ1において知識情報作成処理を行うように構成してもよい。
【0071】
上記においては、百科事典を構成するコンテンツを例として説明しているが、これに限定されることなく、タイトルおよびその内容を有するコンテンツであれば適用して、知識情報データを作成することができる。
【0072】
上記においては、1行目の文を形態素解析した結果に基づいて特徴部分を抽出するように構成しているが、他の文に基づいて特徴部分を抽出するようにしてもよい。
【0073】
例えば、任意の行の文や最も多く語を含む文に基づいて特徴部分データを抽出するように構成してもよい。また、例えば、タイトルが文の先頭にある文に基づいて特徴部分データを抽出するようにしてもよい。
【0074】
さらに、例えば、タイトルを構成する語がその文の末尾近傍に存在する文に基づいて特徴部分データを抽出するようにしてもよい。なお、末尾近傍とは、当該文における末尾の語のみならず、例えば、当該文を構成する文字列において下位10%以下に存在する語が存在する位置をいう。
【0075】
上記においては、形態素解析の結果から名詞のみを特徴部分の抽出対象としたが、動詞や形容詞等のような他の品詞を抽出対象としてもよい。
【0076】
上記においては、決定した文の特徴部分データの末尾の語を主定義語データを抽出するようにしたが、当該文における知識名データとの係り受け関係に基づいて抽出するようにしてもよい。例えば、「大島は、伊豆諸島最北部にある最大の島である。」という文の場合、「大島は」と「島である」は係り受け関係にあり、「大島は」は係り文節であり、「島である」は受け文節である。したがって、知識名データが「大島」である場合において、この「大島」を含む係り文節と係り受け関係にある文節である「島である」から抽出される語である「島」を主定義語として抽出することができる。
【0077】
上記においては、HTMLで記述されたコンテンツを用いて説明したがコンテンツの記述形式はこれに限定されることはない。例えば、SGMLやXMLなどで記述された文書やその他の構造化文書であってもよい。
【0078】
また、タイトルおよびその内容がコンピュータによって認識可能であれば、通常のテキストのみで記述された文書であってもよい。例えば、タイトルと内容とを別々の行に分けて記述された文書、所定の位置にタイトルと内容が記述された文書またはCSVファイルのように記号で区切られた文書などがこれに該当する。
【0079】
2.知識情報展開装置
以下、本発明における知識情報展開装置について説明する。この知識情報展開装置が、上述した知識情報作成装置において作成した知識情報をアプリケーションなどに出力することにより、コンピュータが認識可能な文字列データを提供することができる。
【0080】
2−0.知識情報展開装置の機能ブロック図
図11に、本発明にかかる知識情報展開装置1100の機能ブロック図を示す。この知識情報展開装置1100は、図11に示すように、基本データ入力手段1101、知識情報抽出手段1103、知識情報DB400、および知識情報出力手段1105を備えている。
【0081】
基本データ入力手段1101には、知識情報を特定するための用語(基本データ)が入力される。知識情報抽出手段1103は、入力された当該用語に関する知識情報を知識情報データベース400から抽出する。知識情報展開手段1105は、知識情報抽出手段1103が知識情報データベース400から抽出した知識情報を外部に出力する。
【0082】
2−1.知識情報展開装置のハードウェア構成
図12に、知識情報展開装置のハードウェア構成を示す。この知識情報展開装置1100は、ディスプレイ1201、CPU1203、メモリ1205、キーボード/マウス1207、ハードディスク1209、およびCD−ROMドライブ1211を備えている。
【0083】
ハードディスク1209には、図12に示すように、知識情報展開プログラム300、知識情報DB400、アプリケーション500、オペレーションシステム(図示せず)などが記憶されている。
【0084】
知識情報DB400には、前述した図10に示す知識情報1010等が記録されており、知識情報展開プログラム300は、アプリケーション500の要求に応じて当該知識情報を出力する処理を行うプログラムである。アプリケーション500は、知識情報DB400に記録された知識情報を利用して所定の処理を行うためのアプリケーションであり、例えば、特許文献などの書類ファイルに、検索のためのキーワード(検索キーワード)を付与する処理を行うものが該当する。
【0085】
これらのプログラム等は、例えば、CD−ROM1213からCD−ROMドライブ1211を介してハードディスク1209にインストールされたものである。なお、フレキシブルディスクやICカード等のようにCD−ROM以外の記録媒体に記録された処理プログラムからインストールするようにしてもよい。さらに、通信回線を介して他のコンピュータに記録された処理プログラムをインストールするようにしてもよい。
【0086】
2−2.知識情報の自動展開処理
以下に、アプリケーション500が特許文献X(図示せず)の書類ファイルに検索キーワードを付与するまでの処理について、図13を用いて説明する。図13は、知識情報展開プログラム300がアプリケーション500の要求に応じて行う処理を示すフローチャートである。
【0087】
アプリケーション500は、特許文献Xの書類ファイルに含まれる用語の中から、予め検索キーワードを付与するために知識情報展開プログラム300に入力する用語を決定している。例えば、この実施形態では、特許文献Xの発明の名称「かな漢字変換装置」の用語「かな漢字変換」を知識情報を要求する用語として決定している。なお、ここでは、発明の名称に含まれる用語を用いたが、その他の内容(特許請求の範囲、要約など)を示す部分に含まれる用語を用いてもよい。
【0088】
アプリケーション500から、決定した文献に含まれる用語(例えば、「かな漢字変換」)の入力を受け付けると(ステップS1101)、知識情報展開装置のCPUは、この文献に含まれる用語を知識名とする知識情報データを知識情報データベース400から抽出する(ステップS1102)。
【0089】
さらに、CPUは、抽出した知識情報データの主定義語および補助定義語を取得して(ステップS1103)、これらを検索キーワードとしてアプリケーション500に出力する(ステップS1105)。
【0090】
例えば、アプリケーション500から用語「かな漢字変換」が入力されると、「かな漢字変換」を知識名とする知識情報データベース400の知識情報データレコード1020(図10に示す)に基づいて、主定義語「入力方式」、補助定義語「漢字」、「読み」、「キーボード」がアプリケーション500に出力される。これらの用語は、アプリケーション500により特許文献Xの書類ファイルに対応づけて検索キーワードとして記録される。つまり、これらの「入力方式」などの用語を検索時にキーワードとして用いれば、特許文献Xを確実にヒットすることができる。
【0091】
なお、上記実施形態においては、特許文献の書類ファイルに検索キーワードを付与するようにしたが、その他の医学論文などの書類ファイルに検索キーワード付与することも可能である。
【0092】
なお、上記においては、知識情報データベースの主定義語および補助定義語を検索キーワードとしたが、さらに関連語(例えば、図10に示す知識名100「かな漢字変換」についての関連語108「FEP」「IM」)を検索キーワードに追加するようにしてもよい。これにより、検索キーワードの範囲が拡大し、文献検索においてヒット率をより向上させることができる。
【0093】
なお、上記実施形態においては、知識情報展開プログラム300が独立して記録されたアプリケーション500に対して知識情報を展開するようにしたが、知識情報展開プログラム300がアプリケーション500の中に含まれており、アプリケーション500内で上記処理を行うようにしてもよい。
【0094】
なお、上記実施形態においては、アプリケーション500が出力された知識データを検索キーワードとして利用したが、分類キーワードとして利用するようにもよい。例えば、図10に示す知識名「かな漢字変換」についての関連語「FEP」を含む書類ファイルを同じグループに属するとみなして書類ファイルを分類するようなアプリケーションでは、知識データは分類キーワードとして用いられることになる。
【0095】
2−3.知識情報展開システムのネットワーク構成
つぎに、図11に示す知識情報処理装置1100を、ネットワーク上におけるサーバ装置として用いた例を、以下に説明する。
【0096】
図14に示すように、知識情報展開サーバ1705は、インターネット17を介して、クライアント端末1701、検索エンジンサーバ1703に通信可能に接続されている。
【0097】
図15に、知識情報展開サーバ1705のハードウェア構成を示す。この知識情報展開サーバ1705は、ディスプレイ1201、CPU1203、メモリ1205、キーボード/マウス1207、ハードディスク1209、CD−ROMドライブ1211、および通信回路1215を備えている。なお、通信回路1215は、他のサーバとの通信を行うための回路である。
【0098】
知識情報展開サーバ1705のハードディスク1209には、図15に示すように、知識情報展開プログラム300、知識情報DB400、オペレーションシステム(図示せず)などが記憶されている。また、Webブラウザにおいて検索Webページ(図18に示すWebページを検索エンジンサーバ1703を利用して検索するための入力フォームページ)を表示するためのHTML文書も記憶されている。
【0099】
知識情報DB400には、前述した図10に示す知識情報1010等が記録されており、知識情報展開プログラム300は、クライアント端末1701からの要求に応じて当該知識情報を出力する処理を行うプログラムである。
【0100】
クライアント端末1701は、基本データである検索キーワードを検索エンジンサーバ1703に送信するための端末である。検索エンジンサーバ1703は、検索キーワードに基づいてWebページの検索サービスを提供するサーバである。
【0101】
なお、クライアント端末1701、検索エンジンサーバ1703のハードウェア構成は、図15に示す知識情報展開サーバ1705のハードウェア構成とほぼ同じである。ただし、クライアント端末1701のハードディスクには、データ化した百科事典を閲覧するための百科事典を閲覧するためのソフトウェアや、Webブラウザ(図示せず)が記録されている点で異なる。また、検索エンジンサーバ1703のハードディスクには、クライアント端末1701のWebページのデータベースや、前述の知識情報展開サーバ1705のハードディスクにも記録されるWebページブラウザにおいて検索Webページを表示するためのHTML文書など(図示せず)が記録されている点で異なる。
【0102】
2−4.ネットワーク上における知識情報の自動展開処理
次に、図14に示すクライアント端末1701において、ユーザが百科事典閲覧ブラウザの「大島」の項目を参照している場合にお、この「大島」を基本データとしてサーバが知識情報を検索し、検索した知識情報を種データとして検索エンジンサーバ1703に出力する処理について、図14および図16〜図18を用いて説明する。
【0103】
図16は、クライアント端末1701、知識情報展開サーバ1705、検索エンジンサーバ1703において行われる処理の流れを示すフローチャートである。図17は、クライアント端末1701における百科事典の閲覧画面を示す図である。図18は、Webブラウザの入力フォームに知識情報を含んだ検索キーワードを自動入力した状態を示す図である。
【0104】
ユーザは、クライアント端末1701において、図17の画面130に示すような百科事典閲覧ソフトを起動し、参照している(ステップS1201)。図17に示す画面130には、百科事典の項目欄131に「大島」が表示され、その説明欄133に「大島」を説明する文が表示されている。また、項目欄131の右には、「大島」を知識名とする知識情報データベース400(図10)の知識IDが表示されている。
【0105】
ユーザが「大島」に関するWebページを検索したいと考えたような場合に、ユーザが画面130の右下にある「Webページ検索」ボタン135(図17に示す)を押下すると、項目「大島」の知識ID「001」(図10に示す、知識ID1003)が知識情報展開サーバ1705に送信される(ステップS1203)。一方、クライアント端末1701では、「Webページ検索」ボタン135の押下に連動して、検索Webページ(Webページを検索するための入力フォームページ)を表示するためのWebブラウザが起動し、表示される(ステップS1211)。
【0106】
知識情報展開サーバ1705のCPU1203は、知識IDを受信し(ステップS1205)、当該知識IDに基づいて知識情報データベース400を検索して、当該知識IDにかかる知識情報(図10に示す各知識ID1003についての主定義語1005、補助定義語1007など)を抽出する(ステップS1207)。さらに、検索Webページの入力フォームに知識情報が入力されるように、抽出した知識情報がHTML文書に合成され、この知識情報を合成したHTML文書がクライアント端末1701に送信される(ステップS1209)。
【0107】
これにより、図18に示すように、クライアント端末1701のWebブラウザにおいて、入力フォームに知識情報が自動的に入力された検索Webページが表示される(S1213)。図18においては、項目「大島」の知識情報である知識名「大島」、主定義語「島」、補助定義語「伊豆諸島」「最北部」「最大」が入力フォームに入力されている。なお、このとき、ユーザは入力欄の検索キーワードを変更することも可能である。
【0108】
さらにユーザが検索ボタン141を押下することにより、検索キーワードが検索エンジンサーバ1703に送信される(ステップS1215)。例えば、URL「http://www.searchxxx.co.jp/search?q=大島+島+伊豆諸島+最北部+最大」のデータとして送信される。
【0109】
以降は、検索エンジンによる一般的なWebページの検索処理が行われる。検索エンジンサーバ1703では、検索キーワード「大島+島+伊豆諸島+最北部+最大」(なお、+記号はand条件を示す。)に基づいてWebページリストの検索が行われ、検索結果がクライアント端末1701に送信される(ステップS1217)。これにより、クライアント端末1701において、知識情報を用いたWebページの検索結果が表示されることになる(ステップS1219)。
【0110】
このように、基本データである項目「大島」に基づく知識情報を用いて、Webページの検索を行うことにより、検索の精度を高めることができる。また、複数の検索キーワードをユーザが入力しなくても最適なWebページを探し当てることができる。
【0111】
なお、上記実施形態においては、図16のステップS1215において「検索ボタン」141を押下するようにしたが、図19のフローチャート(図16に対応)に示すようにかかるユーザの入力を省略することができる。具体的には、図19のフローチャートにおいては、ステップS1209で知識情報をクライアント端末1701に送信せず検索エンジンサーバ1703に送信し、そのままWebページを検索するようにしている。したがって、クライアント端末1701には、図18に示す検索キーワードの入力画面は表示されず、直ちに検索結果が表示されることになる。
【0112】
なお、上記実施形態においては、図16のステップS1203において「大島」の知識IDのみを送信するようにしたが、コンテンツにに含まれる用語(例えば、図17に示す「伊豆諸島」004、「三原山」005)の知識IDを同時に送信するようにしてもよい。これにより、「大島」の知識データだけでなく、「伊豆諸島」「三原山」の知識データも検索エンジンサーバ1703に出力することができる。
【0113】
上記実施形態においては、ユーザが参照している百科事典コンテンツに基づく知識情報を用いて知識情報の展開処理を行っているが、これに限定されず、知識IDを付与した他のコンテンツに基づく知識情報を用いてかかる処理を行うように構成してもよい。
【0114】
3.その他の実施形態
上記実施形態においては、知識情報作成装置3(図1に示す)を用いて作成した知識情報データベースを利用しているが、この方法に限定されることなく、人手による方法やその他の方法で作成された知識情報を利用して構成するようにしてもよい。
【0115】
上記実施形態においては、図1に示す機能を実現する為に、CPUを用い、ソフトウェアによってこれを実現している。しかし、その一部もしくは全てを、ロジック回路等のハードウェアによって実現してもよい。なお、プログラムの一部の処理をさらに、オペレーティングシステム(OS)に行わせるようにしてもよい。
【0116】
なお、上記実施形態においては、展開した知識データを論文、文献などのファイルを検索するためのキーワードを付与するために用いたが、その他、連想ゲームなどのアプリケーションに用いることもできる。
【図面の簡単な説明】
【図1】この発明の一実施形態における知識情報作成装置の全体構成の例を示す図である。
【図2】この発明の一実施形態における知識情報作成装置のハードウェア構成図である。
【図3】この発明の一実施形態におけるコンテンツの例を示す図である。
【図4】この発明の一実施形態における知識情報作成装置のフローチャートの例を示す図である。
【図5】この発明の一実施形態における知識名抽出処理のフローチャートの例を示す図である。
【図6】この発明の一実施形態における特徴部分抽出処理のフローチャートの例を示す図である。
【図7】この発明の一実施形態における文から特徴部分データを抽出する場合の例を示す図である。
【図7a】この発明の一実施形態における文を形態素解析した結果の例を示す図である。
【図8】この発明の一実施形態における主定義語・補助定義語抽出処理のフローチャートの例を示す図である。
【図9】この発明の一実施形態における関連語抽出処理のフローチャートの例を示す図である。
【図10】この発明の一実施形態における知識情報データベースの例を示す図である。
【図11】この発明の知識情報展開装置の機能ブロック図である。
【図12】この発明の知識情報展開装置のハードウェア構成を示す図である。
【図13】この発明の知識情報展開プログラムがアプリケーションの要求に応じて行う処理を示すフローチャートである。
【図14】この発明の知識情報展開システムのネットワーク構成を示す図である。
【図15】この発明の知識情報展開サーバのハードウェア構成を示す図である。
【図16】クライアント端末、知識情報展開サーバ、検索エンジンサーバにおいて行われる処理の流れを示すフローチャートである。
【図17】クライアント端末における百科事典の閲覧画面を示す図である。
【図18】Webブラウザに検索キーワードを自動入力した状態を示す図である。
【図19】他の実施形態において、クライアント端末、知識情報展開サーバ、検索エンジンサーバにおいて行われる処理の流れを示すフローチャートである。
【符号の説明】
1100・・・知識情報展開装置
1101・・・基本データ入力手段
1103・・・知識情報抽出手段
1105・・・知識情報データベース
1107・・・知識情報展開手段
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a knowledge information expanding apparatus and method for expanding and outputting machine usable knowledge information data generated based on content data.
[0002]
[Prior art and problems]
Conventionally, for example, when referring to an electronic encyclopedia item, when trying to search a Web page related to the item, the user selects a word that seems to be characteristic from the contents of the content However, it was necessary to manually enter the search character string input field of the Internet search engine. At this time, a simple manual operation occurs, which is not convenient.
[0003]
In order to improve the accuracy of such searches, it is necessary to select not only the title character string of the item but also a plurality of characteristic words. This is a work of copying and pasting the character string from the contents of the content being referred to by the user. In addition, it is inconvenient because it requires a work of associating and inputting words.
[0004]
A technique is known in which a field code for an input keyword is recorded and used for keyword search to narrow down a search target (for example, Patent Document 1).
[0005]
[Patent Document 1]
[0006]
Japanese Patent Laid-Open No. 2002-132824
[Means for Solving the Problems and Effects of the Invention]
(1) (2) The knowledge information expansion device of the present invention provides:
A knowledge information expansion device that expands related knowledge information based on basic data,
Basic data input means for entering basic data,
Knowledge information that receives basic data from the basic data input means and extracts knowledge information related to the basic data from a knowledge information database in which terms used to define a title are recorded as knowledge information in association with the title Extraction means,
Knowledge information expansion means for outputting the knowledge information extracted by the knowledge information extraction means;
It is provided with.
[0007]
Thereby, it becomes possible to output and provide character string data related to a specific term to an external device. In addition, since the word defining the term is selected for the character string data, for example, when it is used together as a search keyword when performing a search using an Internet search engine or the like, a highly accurate result can be obtained. .
[0008]
(3) A knowledge information expansion device according to the present invention provides:
The knowledge information extracted by the knowledge information providing means is output to a predetermined application.
[0009]
Thus, it is possible to output character string data related to a specific term, and the application can use character string data that can be machine-recognized.
[0010]
(4) A knowledge information expansion device according to the present invention provides:
The knowledge name is a knowledge word obtained by extracting title data from the content data recorded in association with the title and content, and a definition word associated with the knowledge name extracted from each word included in the feature part data of the content data Data.
[0011]
As a result, it is possible to output and provide definition word data related to a knowledge name that is a specific term to an external device.
[0012]
(5) A knowledge information expansion device according to the present invention provides:
The definition word data is composed of main definition word data that best represents the characteristics of the content data and auxiliary definition word data other than the main definition word data.
[0013]
As a result, it is possible to output and provide main definition word data and auxiliary definition word data related to a knowledge name that is a specific term to an external device.
[0014]
(6) A knowledge information expansion device according to the present invention provides:
The knowledge information includes related word data representing contents related to the title based on contents of the contents data.
[0015]
This makes it possible to output and provide knowledge information including related word data to an external device.
[0016]
(7) The knowledge information expansion device of the present invention provides:
The feature portion data is obtained by extracting words obtained by morphological analysis of sentences constituting the content data.
[0017]
This makes it possible to provide words automatically extracted from the contents of the content data as knowledge information.
[0018]
(8) A knowledge information expansion device according to the present invention provides:
The main definition word data is a tail word of feature portion data determined to be a noun as a result of morphological analysis.
[0019]
As a result, it is possible to provide the most characteristic expression word automatically extracted from the content of the content data as knowledge information.
[0020]
(9) The knowledge information expansion device of the present invention provides:
The main definition word data is a word included in a receiving clause having a dependency relationship with a dependency clause including a knowledge name in a sentence constituting the content of the content data.
[0021]
Thereby, it becomes possible to provide the most characteristic expression word extracted from the content of the content data as knowledge information.
[0022]
(10) A knowledge information expansion device according to the present invention provides:
The related word data is extracted based on a linked word of the content data.
[0023]
This makes it possible to provide relevant words extracted from the content data as knowledge information.
[0024]
(11) A knowledge information expansion device according to the present invention provides:
The content data recorded in association with the title and the content is a dictionary.
[0025]
This makes it possible to provide knowledge information with high semantic reliability extracted from the content data.
[0026]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
[0027]
1. Creating knowledge information
First, knowledge information used in the present invention will be described. Here, “knowledge information” is information that systematically records information for explaining keywords such as terms and names as knowledge data. Such knowledge information can be created based on, for example, an encyclopedia having information for explaining terms and names.
[0028]
An example in which knowledge information data is created using a knowledge information creation device based on the encyclopedia as described above will be described.
[0029]
1-1. overall structure
FIG. 1 shows an overall configuration diagram of the knowledge information creating apparatus. In this figure, an encyclopedia content server 1 and a knowledge information creation device 3 are connected to each other and can communicate with each other.
[0030]
The encyclopedia content server 1 is a computer device including recording means 11 for recording encyclopedia content.
[0031]
The knowledge information creation device 3 is a computer device for creating knowledge information data related to encyclopedia content.
[0032]
The knowledge information creation device 3 includes an input unit 31 for inputting content recorded in the recording unit of the encyclopedia content server 1, a knowledge name extraction unit 33 for extracting a knowledge name based on the content input by the input unit 31, and a knowledge Main definition based on knowledge ID providing means 35 for assigning a knowledge ID for each name, feature part extracting means 37 for extracting feature parts based on the content inputted by the input means 31, and feature parts extracted by the feature part extracting means 37 Main definition word extraction means 39 for extracting words, auxiliary definition word extraction means 41 for extracting auxiliary definition words based on the feature portions extracted by the feature portion extraction means 37, and related words that are information related to the contents are extracted. Related word extraction means 43 and knowledge information recording means for recording the definition words and the auxiliary definition words as knowledge information data relating to content It is equipped with a 5.
[0033]
1-2. Hardware configuration
FIG. 2 shows a hardware configuration diagram of the knowledge information creation apparatus 3. This computer apparatus includes a display 201, a CPU 203, a memory 205, a keyboard / mouse 207, a hard disk 209, a CD-ROM drive 211, and a communication circuit 215.
[0034]
The hard disk 209 includes input means 31, knowledge name extraction means 33, knowledge ID assignment means 35, feature portion extraction means 37, main definition word extraction means 39, auxiliary definition word extraction means 41, related word extraction means 43, and knowledge information recording means. 45, a knowledge information creation program 250 for performing knowledge information creation processing is stored. The main definition word extraction means 39 and the auxiliary definition word extraction means 41 are collectively defined as the definition word extraction means 40.
[0035]
This program is installed on the hard disk 209 from the CD-ROM 213 via the CD-ROM drive 211, for example. In addition, you may make it install from the processing program recorded on recording media other than CD-ROM like a flexible disk and an IC card. Furthermore, a processing program recorded in another computer may be installed via a communication line.
[0036]
The communication circuit 215 is a circuit for performing communication with other computer devices, and can be connected to the encyclopedia content server 1 here.
[0037]
The encyclopedia content server 1 is a computer device that records encyclopedia content, and the hardware configuration thereof is the same as that of the knowledge information creation device described above. Note that a set of contents as an encyclopedia is recorded on the hard disk of the encyclopedia content server 1.
[0038]
1-3. content
The encyclopedia content will be described below. The encyclopedia content for which the knowledge information data is created records items indicating titles and descriptions indicating the contents of words in all specialized fields.
[0039]
FIG. 3 shows an example of encyclopedia content. As shown in the figure, the content 300 is described in HTML (HyperText Markup Language), and expresses one title and the content corresponding thereto. One encyclopedia 350 is configured by gathering such contents described in HTML.
[0040]
1-4. Knowledge information creation process
An example of creating knowledge information data based on the content 300 of the encyclopedia 350 as described above will be described. FIG. 4 shows a flowchart in knowledge information creation processing using the present invention.
[0041]
When the knowledge information creation program 250 is activated by the user in the knowledge information creation device 3, the CPU 203 of the knowledge information creation device 3 requests the encyclopedia content server 1 for a content set as an encyclopedia (step S411).
[0042]
In response to the request, the encyclopedia content server 1 outputs the content set as the encyclopedia recorded on the hard disk to the knowledge information creation device 3 (step S401).
[0043]
Upon receiving the output, the CPU 203 of the knowledge information creation device 3 inputs the content set and records it on the hard disk 209 (step S412).
[0044]
The CPU 203 reads one content from the content set as an encyclopedia into the memory 205 (step S413).
[0045]
1-4-1. Knowledge name extraction process
The CPU 203 performs knowledge name extraction processing based on the read content data (step S415). FIG. 5 shows a flowchart in the knowledge name extraction process.
[0046]
The CPU 203 detects title data of the read content (step S501). For example, in the content described in HTML of FIG. 3, the title data is detected by searching for the <TITLE> tag 301.
[0047]
The CPU 203 determines knowledge name data based on the detected title data (step S503). For example, in the content of FIG. 3, “Oshima”, which is text information surrounded by a <TITLE> tag 301 and a </ TITLE> tag 303, is determined as knowledge name data.
[0048]
The CPU 203 stores the determined knowledge name data in the memory 205 (step S505). In the case of the content shown in FIG. 3, “Oshima” is recorded as knowledge name data.
[0049]
1-4-2. Grant of knowledge ID
The CPU 203 assigns a knowledge ID to the knowledge name data extracted by the knowledge name extraction process (step S417). The knowledge ID identifies each piece of knowledge information data, and may be created using, for example, a serial number.
[0050]
1-4-3. Feature part extraction processing
The CPU 203 performs a feature part extraction process based on the read content (step S419, FIG. 4). FIG. 6 shows a flowchart of the feature portion extraction process.
[0051]
The CPU 203 detects the content portion of the read content (step S601). For example, in the content described in HTML of FIG. 3, by searching for the <BODY> tag 305 and the </ BODY> tag 307, the part surrounded by these tags is detected as the content part.
[0052]
The CPU 203 acquires the sentence on the first line of the detected content part (step S603). In the content 31 of FIG. 3, tag portions (<P> tag, <A> tag, etc.) are excluded from the text portion after the <BODY> tag 305 and before the first “.” Appears. The part is acquired as the sentence on the first line.
[0053]
For example,
“<P><A HREF =” izusutoou. html ”> Izu Islands </A> The largest island in the northernmost part.”
Is the text after the <BODY> tag 305 and before the first "." Appears. Excluding this tag, "the largest island in the northernmost part of the Izu Islands." It becomes the sentence of the line.
[0054]
The CPU 203 performs morphological analysis on the sentence in the first line of the acquired content portion (step S605). FIG. 7 shows an example in which a feature part is extracted by morphological analysis of the sentence in the first line of the acquired content part.
[0055]
In FIG. 7, “the largest island in the northernmost part of the Izu Islands.” 701 is a sentence on the first line of the extracted content portion. The CPU 203 morphologically analyzes this sentence and divides it into morphemes which are the smallest language units as shown in “| Izu Islands | the northernmost || FIG. 7a shows the processing result stored in the memory at this time. In FIG. 7 a, a part of speech 709 is recorded for each divided morpheme 707.
[0056]
The CPU 203 extracts only the noun from the sentence divided into morphemes and determines it as feature portion data (step S607). That is, the CPU 203 extracts only morphemes whose part of speech shown in FIG. 7A is a noun, and determines each noun as feature portion data. Reference numeral 705 in FIG. 7 denotes a noun extracted as feature portion data at this time.
[0057]
The CPU 203 stores the determined feature portion in the memory 205 (step S609). In the case of FIG. 7, “Izu Islands”, “Northernmost”, “Maximum”, and “Island” are stored as characteristic portion data.
[0058]
1-4-4. Main definition word / auxiliary definition word extraction processing
The CPU 203 performs main definition word / auxiliary definition word extraction processing based on the read content (step S421, FIG. 4). FIG. 8 shows a flowchart in the main definition word / auxiliary definition word extraction processing.
[0059]
The CPU 203 reads feature portion data stored in the memory 205 (step S801). For example, “Izu Islands”, “Northernmost”, “Maximum”, and “Island”, which are characteristic portion data indicated by reference numeral 705 in FIG. 7, are read.
[0060]
The CPU 203 determines the feature data at the end of the read feature data as main definition word data (step S803). In the example of FIG. 7, since “island” is a feature portion at the end, this is determined as main definition word data. The CPU 203 stores “island”, which is the determined main definition word, in the memory 205 (step S805).
[0061]
The CPU 203 determines, as auxiliary definition word data, other feature part data excluding the feature part data determined as the main definition word data from the read feature part data (step S807). In the example of FIG. 7, since “Izu Islands”, “the northernmost part”, and “maximum” are other feature portion data excluding the feature portion data determined as the main definition word data, these are determined as auxiliary definition word data. To do. The CPU 203 stores the determined auxiliary definition word data “Izu Islands”, “the northernmost”, and “maximum” in the memory 205 (step S809).
[0062]
1-4-5. Related word extraction processing
The CPU 203 performs related word extraction processing based on the read content (step S423, FIG. 4). FIG. 9 shows a flowchart of the related word extraction process.
[0063]
The CPU 203 detects link information from the content portion of the read content (step S901). In the content described in the HTML of FIG. 3, by searching for the <A˜> tag 309 and the </A> tag 311, a portion surrounded by these tags is detected as link information.
[0064]
For example,
“<A HREF =” izusutoou. html "> Izu Islands </A>"
The link information detected from is "Izu Islands"
“<A HREF =” miharayama. html "> Miharayama </A>"
The link information detected from is “Miharayama”.
[0065]
The CPU 203 determines the detected link information as related word data (step S903), and stores these in the memory 205 (step S905).
[0066]
1-4-6. Record of knowledge information data
The CPU 203 records the knowledge name data, knowledge ID, main definition word data, auxiliary definition word data, and related word data stored in the memory 205 in the above processing as knowledge information data in the knowledge information database 400 (step S425).
[0067]
FIG. 10 shows an example of the knowledge information database 400. In this database, a knowledge name 1001, a knowledge ID 1003, a main definition word 1005, an auxiliary definition word 1007, and a related word 1009 are recorded. In the case of the above example, the knowledge name “Oshima”, knowledge ID “001”, main definition word “Island”, auxiliary definition word “Izu Islands, northernmost, maximum” and related terms “Izu Islands, Miharayama” are recorded. The
[0068]
1-4-7. End of processing
When the knowledge information data relating to the read content is recorded, the CPU 203 determines whether there is any other content for which knowledge information data has not been created. If there is content (YES in step S427), the process returns to step S413. Knowledge information data is created by reading new content and repeating the same processing as described above. If it is determined that knowledge information data has been created for all contents (step S427, NO), the process ends.
[0069]
1-4-8. Summary
In this way, content sets that are encyclopedias are input, and based on the contents of each content, knowledge name data, knowledge ID, main definition word data, auxiliary definition word data, and related word data are extracted, and knowledge of the content is extracted. By using information data, knowledge information data of the entire encyclopedia can be easily created.
[0070]
In the above description, the content server 1 that records content and the knowledge information creation device 3 that performs knowledge information creation processing are described separately. However, the knowledge information creation device 3 is provided with recording means for recording content, You may comprise so that a process may be performed only by the information creation apparatus 3. FIG. Alternatively, the knowledge information creation program 250 may be installed in the content server 1 and the content server 1 may be configured to perform knowledge information creation processing.
[0071]
In the above description, the contents constituting the encyclopedia are described as examples. However, the present invention is not limited to this, and any content having a title and its contents can be applied to create knowledge information data. .
[0072]
In the above description, the feature portion is extracted based on the result of the morphological analysis of the sentence on the first line. However, the feature portion may be extracted based on another sentence.
[0073]
For example, the feature portion data may be extracted based on a sentence in an arbitrary line or a sentence including the most words. Further, for example, the feature portion data may be extracted based on a sentence whose title is at the head of the sentence.
[0074]
Further, for example, the feature portion data may be extracted based on a sentence in which a word constituting the title exists near the end of the sentence. Note that the vicinity of the end means not only the end word in the sentence but also a position where a word existing in the lower 10% or less exists in the character string constituting the sentence.
[0075]
In the above description, only nouns are extracted from the morphological analysis results, but other parts of speech such as verbs and adjectives may be extracted.
[0076]
In the above description, the main definition word data is extracted as the last word of the characteristic part data of the determined sentence. However, the word may be extracted based on the dependency relationship with the knowledge name data in the sentence. For example, in the sentence “Oshima is the largest island in the northernmost part of the Izu Islands”, “Oshima is” and “is an island” have a dependency relationship, and “Oshima is” a dependency clause. , “Is an island” is a receiving phrase. Therefore, when the knowledge name data is “Oshima”, “island”, which is a word extracted from “island” which is a clause having a dependency relationship with the dependency clause including this “Oshima”, is the main definition word Can be extracted as
[0077]
In the above, description has been made using content described in HTML, but the content description format is not limited to this. For example, it may be a document described in SGML or XML, or another structured document.
[0078]
Further, if the title and its contents are recognizable by a computer, it may be a document described only with ordinary text. For example, a document in which the title and contents are described in separate lines, a document in which the title and contents are described in a predetermined position, a document that is separated by a symbol such as a CSV file, and the like correspond to this.
[0079]
2. Knowledge information deployment device
Hereinafter, a knowledge information expansion device according to the present invention will be described. This knowledge information expansion device outputs character information that can be recognized by a computer by outputting the knowledge information created by the above-described knowledge information creation device to an application or the like.
[0080]
2-0. Functional block diagram of knowledge information deployment device
FIG. 11 is a functional block diagram of the knowledge information expansion device 1100 according to the present invention. As shown in FIG. 11, the knowledge information expansion device 1100 includes basic data input means 1101, knowledge information extraction means 1103, knowledge information DB 400, and knowledge information output means 1105.
[0081]
The basic data input means 1101 receives terms (basic data) for specifying knowledge information. The knowledge information extraction unit 1103 extracts knowledge information related to the input term from the knowledge information database 400. The knowledge information expansion unit 1105 outputs the knowledge information extracted from the knowledge information database 400 by the knowledge information extraction unit 1103 to the outside.
[0082]
2-1. Hardware configuration of knowledge information deployment device
FIG. 12 shows a hardware configuration of the knowledge information expansion device. This knowledge information expansion device 1100 includes a display 1201, a CPU 1203, a memory 1205, a keyboard / mouse 1207, a hard disk 1209, and a CD-ROM drive 1211.
[0083]
As shown in FIG. 12, the hard disk 1209 stores a knowledge information expansion program 300, a knowledge information DB 400, an application 500, an operation system (not shown), and the like.
[0084]
The knowledge information DB 400 stores the above-described knowledge information 1010 shown in FIG. 10 and the like, and the knowledge information development program 300 is a program that performs processing to output the knowledge information in response to a request from the application 500. The application 500 is an application for performing predetermined processing using the knowledge information recorded in the knowledge information DB 400. For example, a keyword (search keyword) for search is assigned to a document file such as a patent document. Applicable to processing.
[0085]
These programs are installed on the hard disk 1209 from the CD-ROM 1213 via the CD-ROM drive 1211, for example. In addition, you may make it install from the processing program recorded on recording media other than CD-ROM like a flexible disk and an IC card. Furthermore, a processing program recorded in another computer may be installed via a communication line.
[0086]
2-2. Automatic expansion of knowledge information
Hereinafter, processing until the application 500 assigns a search keyword to a document file of Patent Document X (not shown) will be described with reference to FIG. FIG. 13 is a flowchart showing processing performed by the knowledge information development program 300 in response to a request from the application 500.
[0087]
The application 500 determines a term to be input to the knowledge information expansion program 300 in order to assign a search keyword in advance from terms included in the document file of Patent Document X. For example, in this embodiment, the term “kana-kanji conversion” of the name “kana-kanji conversion device” of the invention of Patent Document X is determined as a term for requesting knowledge information. In addition, although the term contained in the name of invention was used here, you may use the term contained in the part which shows the other content (Claims, summary, etc.).
[0088]
When an input of a term (for example, “Kana-Kanji conversion”) included in the determined document is received from the application 500 (step S1101), the CPU of the knowledge information development device uses the term included in the document as knowledge information. Data is extracted from the knowledge information database 400 (step S1102).
[0089]
Further, the CPU acquires the main definition words and auxiliary definition words of the extracted knowledge information data (step S1103), and outputs them to the application 500 as search keywords (step S1105).
[0090]
For example, when the term “kana-kanji conversion” is input from the application 500, the main definition word “input” is based on the knowledge information data record 1020 (shown in FIG. 10) of the knowledge information database 400 having the knowledge name “kana-kanji conversion” System ”, auxiliary definition words“ kanji ”,“ reading ”, and“ keyboard ”are output to the application 500. These terms are recorded as search keywords in association with the document file of Patent Document X by the application 500. That is, if terms such as “input method” are used as keywords at the time of search, Patent Document X can be surely hit.
[0091]
In the above embodiment, the search keyword is assigned to the document file of the patent document. However, the search keyword can also be assigned to the document file such as other medical papers.
[0092]
In the above description, the main definition words and auxiliary definition words in the knowledge information database are used as search keywords. However, the related words (for example, the related words 108 “FEP” and “Kana-Kanji conversion” shown in FIG. IM ") may be added to the search keyword. Thereby, the range of the search keyword is expanded, and the hit rate can be further improved in the document search.
[0093]
In the above-described embodiment, the knowledge information deployment program 300 is deployed to the application 500 recorded independently, but the knowledge information deployment program 300 is included in the application 500. The above processing may be performed in the application 500.
[0094]
In the above embodiment, the knowledge data output by the application 500 is used as a search keyword. However, it may be used as a classification keyword. For example, in an application in which document files including the related word “FEP” for the knowledge name “Kana-Kanji conversion” shown in FIG. 10 are regarded as belonging to the same group and the document files are classified, the knowledge data is used as a classification keyword. become.
[0095]
2-3. Network configuration of knowledge information deployment system
Next, an example in which the knowledge information processing apparatus 1100 shown in FIG. 11 is used as a server apparatus on a network will be described below.
[0096]
As shown in FIG. 14, the knowledge information expansion server 1705 is connected to the client terminal 1701 and the search engine server 1703 via the Internet 17 so as to be communicable.
[0097]
FIG. 15 shows a hardware configuration of the knowledge information development server 1705. This knowledge information expansion server 1705 includes a display 1201, a CPU 1203, a memory 1205, a keyboard / mouse 1207, a hard disk 1209, a CD-ROM drive 1211, and a communication circuit 1215. Note that the communication circuit 1215 is a circuit for performing communication with other servers.
[0098]
As shown in FIG. 15, a knowledge information expansion program 300, a knowledge information DB 400, an operation system (not shown), and the like are stored in the hard disk 1209 of the knowledge information expansion server 1705. In addition, an HTML document for displaying a search Web page (an input form page for searching the Web page shown in FIG. 18 using the search engine server 1703) in the Web browser is also stored.
[0099]
The knowledge information DB 400 stores the above-described knowledge information 1010 shown in FIG. 10 and the like, and the knowledge information expansion program 300 is a program that performs a process of outputting the knowledge information in response to a request from the client terminal 1701. .
[0100]
The client terminal 1701 is a terminal for transmitting a search keyword that is basic data to the search engine server 1703. The search engine server 1703 is a server that provides a Web page search service based on a search keyword.
[0101]
Note that the hardware configurations of the client terminal 1701 and the search engine server 1703 are substantially the same as the hardware configuration of the knowledge information expansion server 1705 shown in FIG. However, the hard disk of the client terminal 1701 is different in that software for browsing an encyclopedia that is converted into data and a Web browser (not shown) are recorded. Further, the hard disk of the search engine server 1703 has a database of Web pages of the client terminal 1701, an HTML document for displaying a search Web page in the Web page browser recorded on the hard disk of the knowledge information expansion server 1705, and the like. (Not shown) is different in that it is recorded.
[0102]
2-4. Automatic deployment of knowledge information on the network
Next, in the client terminal 1701 shown in FIG. 14, when the user refers to the item “Oshima” of the encyclopedia browsing browser, the server searches the knowledge information using this “Oshima” as basic data. A process of outputting the knowledge information as seed data to the search engine server 1703 will be described with reference to FIGS. 14 and 16 to 18.
[0103]
FIG. 16 is a flowchart showing the flow of processing performed in the client terminal 1701, the knowledge information development server 1705, and the search engine server 1703. FIG. 17 is a diagram showing an encyclopedia browsing screen on the client terminal 1701. FIG. 18 is a diagram illustrating a state in which a search keyword including knowledge information is automatically input in the input form of the Web browser.
[0104]
The user activates and refers to the encyclopedia browsing software as shown on the screen 130 in FIG. 17 on the client terminal 1701 (step S1201). On the screen 130 shown in FIG. 17, “Oshima” is displayed in the item column 131 of the encyclopedia, and a sentence explaining “Oshima” is displayed in the description column 133. Also, to the right of the item column 131, the knowledge ID of the knowledge information database 400 (FIG. 10) having “Oshima” as the knowledge name is displayed.
[0105]
When the user wants to search a web page related to “Oshima”, when the user presses the “Web page search” button 135 (shown in FIG. 17) at the lower right of the screen 130, the item “Oshima” is displayed. Knowledge ID “001” (knowledge ID 1003 shown in FIG. 10) is transmitted to knowledge information expansion server 1705 (step S1203). On the other hand, on the client terminal 1701, a Web browser for displaying a search Web page (an input form page for searching a Web page) is activated and displayed in conjunction with the pressing of the “Web page search” button 135. (Step S1211).
[0106]
The CPU 1203 of the knowledge information development server 1705 receives the knowledge ID (step S1205), searches the knowledge information database 400 based on the knowledge ID, and knowledge information related to the knowledge ID (for each knowledge ID 1003 shown in FIG. 10). Main definition word 1005, auxiliary definition word 1007, etc.) are extracted (step S1207). Further, the extracted knowledge information is combined with the HTML document so that the knowledge information is input to the input form of the search Web page, and the HTML document combined with the knowledge information is transmitted to the client terminal 1701 (step S1209).
[0107]
As a result, as shown in FIG. 18, a search Web page in which knowledge information is automatically input in the input form is displayed in the Web browser of the client terminal 1701 (S1213). In FIG. 18, the knowledge name “Oshima”, the main definition word “Island”, and the auxiliary definition words “Izu Islands”, “Northernmost”, and “Maximum”, which are knowledge information of the item “Oshima”, are entered in the input form. At this time, the user can also change the search keyword in the input field.
[0108]
Further, when the user presses the search button 141, the search keyword is transmitted to the search engine server 1703 (step S1215). For example, it is transmitted as data of URL “http://www.searchxxx.co.jp/search?q=Oshima+Island+Izu Islands + Northernmost + Maximum”.
[0109]
Thereafter, a general Web page search process by a search engine is performed. The search engine server 1703 searches the Web page list based on the search keyword “Oshima + island + Izu islands + northernmost + maximum” (where the + symbol indicates an and condition), and the search result is the client terminal. It is transmitted to 1701 (step S1217). As a result, the Web page search result using the knowledge information is displayed on the client terminal 1701 (step S1219).
[0110]
As described above, the search accuracy can be improved by searching the Web page using the knowledge information based on the item “Oshima” as the basic data. In addition, an optimal Web page can be found without the user inputting a plurality of search keywords.
[0111]
In the above embodiment, the “search button” 141 is pressed in step S1215 of FIG. 16, but the user input may be omitted as shown in the flowchart of FIG. 19 (corresponding to FIG. 16). it can. Specifically, in the flowchart of FIG. 19, in step S1209, knowledge information is not transmitted to the client terminal 1701, but is transmitted to the search engine server 1703, and a Web page is searched as it is. Accordingly, the search keyword input screen shown in FIG. 18 is not displayed on the client terminal 1701, and the search result is immediately displayed.
[0112]
In the above embodiment, only the knowledge ID of “Oshima” is transmitted in step S1203 of FIG. 16, but the terms included in the content (for example, “Izu Islands” 004, “Mihara” shown in FIG. The knowledge ID of “mountain” 005) may be transmitted simultaneously. Thereby, not only the knowledge data of “Oshima” but also the knowledge data of “Izu Islands” and “Miharayama” can be output to the search engine server 1703.
[0113]
In the above embodiment, the knowledge information is expanded using the knowledge information based on the encyclopedia content referred to by the user. However, the present invention is not limited to this, and the knowledge based on the other content to which the knowledge ID is assigned. You may comprise so that such a process may be performed using information.
[0114]
3. Other embodiments
In the above-described embodiment, the knowledge information database created using the knowledge information creation device 3 (shown in FIG. 1) is used. However, the method is not limited to this method, and created manually or by other methods. You may make it comprise using the acquired knowledge information.
[0115]
In the above embodiment, the CPU is used to realize the function shown in FIG. 1 and this is realized by software. However, some or all of them may be realized by hardware such as a logic circuit. Note that a part of the processing of the program may be further performed by the operating system (OS).
[0116]
In the above embodiment, the developed knowledge data is used for assigning a keyword for searching a file such as a paper or a document. However, it can also be used for an application such as an associative game.
[Brief description of the drawings]
FIG. 1 is a diagram showing an example of the overall configuration of a knowledge information creating apparatus according to an embodiment of the present invention.
FIG. 2 is a hardware configuration diagram of a knowledge information creating apparatus according to an embodiment of the present invention.
FIG. 3 is a diagram showing an example of content in an embodiment of the present invention.
FIG. 4 is a diagram showing an example of a flowchart of a knowledge information creating apparatus according to an embodiment of the present invention.
FIG. 5 is a diagram showing an example of a flowchart of knowledge name extraction processing in an embodiment of the present invention.
FIG. 6 is a diagram showing an example of a flowchart of feature portion extraction processing in one embodiment of the present invention.
FIG. 7 is a diagram showing an example of extracting feature portion data from a sentence in one embodiment of the present invention.
FIG. 7A is a diagram showing an example of a result of morphological analysis of a sentence in one embodiment of the present invention.
FIG. 8 is a diagram showing an example of a flowchart of main definition word / auxiliary definition word extraction processing in one embodiment of the present invention;
FIG. 9 is a diagram showing an example of a flowchart of related word extraction processing in one embodiment of the present invention.
FIG. 10 is a diagram showing an example of a knowledge information database in one embodiment of the present invention.
FIG. 11 is a functional block diagram of the knowledge information expansion device of the present invention.
FIG. 12 is a diagram showing a hardware configuration of a knowledge information expansion device according to the present invention.
FIG. 13 is a flowchart showing processing performed by a knowledge information expansion program according to the present invention in response to an application request.
FIG. 14 is a diagram showing a network configuration of a knowledge information expansion system according to the present invention.
FIG. 15 is a diagram showing a hardware configuration of a knowledge information expansion server according to the present invention.
FIG. 16 is a flowchart showing a flow of processing performed in a client terminal, a knowledge information development server, and a search engine server.
FIG. 17 is a diagram illustrating an encyclopedia browsing screen on a client terminal.
FIG. 18 is a diagram illustrating a state in which a search keyword is automatically input to a Web browser.
FIG. 19 is a flowchart illustrating a flow of processing performed in a client terminal, a knowledge information expansion server, and a search engine server in another embodiment.
[Explanation of symbols]
1100 ... Knowledge information expansion device
1101... Basic data input means
1103 ... Knowledge information extraction means
1105 ... Knowledge information database
1107 ... Knowledge information expansion means

Claims (14)

基本データに基づいて、関連する知識情報を展開する知識情報展開装置であって、
基本データを入力するための基本データ入力手段、
当該基本データ入力手段からの基本データを受けて、タイトルを定義するために用いられる用語を当該タイトルに対応付けて知識情報として記録した知識情報データベースから、当該基本データに関する知識情報を抽出する知識情報抽出手段、
前記知識情報抽出手段が抽出した知識情報を出力する知識情報展開手段、
を備えたことを特徴とする知識情報展開装置。
A knowledge information expansion device that expands related knowledge information based on basic data,
Basic data input means for entering basic data,
Knowledge information that receives basic data from the basic data input means and extracts knowledge information related to the basic data from a knowledge information database in which terms used to define a title are recorded as knowledge information in association with the title Extraction means,
Knowledge information expansion means for outputting the knowledge information extracted by the knowledge information extraction means;
A knowledge information expansion device characterized by comprising:
コンピュータにおいて、基本データに基づいて、関連する知識情報を展開する知識情報展開装置を実現するためのプログラムであって、コンピュータに以下の手段を構成させることを特徴とするプログラム:
A)基本データを入力するための基本データ入力手段、
B)当該基本データ入力手段からの基本データを受けて、タイトルを定義するために用いられる用語を当該タイトルに対応付けて知識情報として記録した知識情報データベースから、当該基本データに関する知識情報を抽出する知識情報抽出手段、
C)前記知識情報抽出手段が抽出した知識情報を出力する知識情報展開手段。
In a computer, a program for realizing a knowledge information expansion device that expands related knowledge information based on basic data, the computer comprising the following means:
A) Basic data input means for inputting basic data,
B) Receiving basic data from the basic data input means, and extracting knowledge information related to the basic data from a knowledge information database in which terms used to define a title are recorded as knowledge information in association with the title Knowledge information extraction means,
C) Knowledge information expansion means for outputting the knowledge information extracted by the knowledge information extraction means.
請求項1または2の知識情報展開装置またはプログラムにおいて、
前記知識情報提供手段が抽出した知識情報を所定のアプリケーションに出力することを特徴とするもの。
In the knowledge information expansion | deployment apparatus or program of Claim 1 or 2,
The knowledge information extracted by the knowledge information providing means is output to a predetermined application.
請求項1〜3の何れかの知識情報展開装置またはプログラムにおいて、
前記知識情報が、タイトルと内容を関連づけて記録したコンテンツデータからタイトルデータを抽出した知識名、当該コンテンツデータの特徴部分データに含まれる各語の中から抽出した前記知識名に対応付けられる定義語データ、を備えたことを特徴とするもの。
In the knowledge information expansion | deployment apparatus or program in any one of Claims 1-3,
The knowledge name is a knowledge word obtained by extracting title data from the content data recorded in association with the title and contents, and a definition word associated with the knowledge name extracted from each word included in the feature part data of the content data Characterized by having data.
請求項4の知識情報展開装置またはプログラムにおいて、
前記定義語データが、前記コンテンツデータの特徴を最もよく表した主定義語データと、前記主定義語データ以外の補助定義語データとから構成されることを特徴とするもの。
In the knowledge information expansion | deployment apparatus or program of Claim 4,
The definition word data is composed of main definition word data that best represents the characteristics of the content data and auxiliary definition word data other than the main definition word data.
請求項4または5の知識情報展開装置またはプログラムにおいて、
前記知識情報が、前記コンテンツデータの内容に基づいて前記タイトルに関連する内容を表す関連語データ、を備えたことを特徴とするもの。
In the knowledge information expansion | deployment apparatus or program of Claim 4 or 5,
The knowledge information includes related term data representing contents related to the title based on contents of the contents data.
請求項4の知識情報展開装置またはプログラムにおいて、
前記特徴部分データが、コンテンツデータの内容を構成する文を形態素解析して得られた語を抽出したものであることを特徴とするもの。
In the knowledge information expansion | deployment apparatus or program of Claim 4,
The feature portion data is obtained by extracting words obtained by morphological analysis of sentences constituting the contents of content data.
請求項5の知識情報展開装置またはプログラムにおいて、
前記主定義語データが、形態素解析の結果、名詞であると決定された特徴部分データの末尾の語であることを特徴とするもの。
In the knowledge information expansion | deployment apparatus or program of Claim 5,
The main definition word data is a word at the end of feature portion data determined to be a noun as a result of morphological analysis.
請求項5の知識情報展開装置またはプログラムにおいて、
前記主定義語データが、コンテンツデータの内容を構成する文において、知識名を含む係り文節と係り受け関係にある受け文節に含まれる語であることを特徴とするもの。
In the knowledge information expansion | deployment apparatus or program of Claim 5,
The main definition word data is a word included in a receiving clause having a dependency relationship with a dependency clause including a knowledge name in a sentence constituting the content of the content data.
請求項6の知識情報展開装置またはプログラムにおいて、
前記関連語データが、前記コンテンツデータのリンク付けされた語に基づいて抽出されることを特徴とするもの。
In the knowledge information expansion | deployment apparatus or program of Claim 6,
The related word data is extracted based on a linked word of the content data.
請求項4〜10の何れかの知識情報展開装置またはプログラムにおいて、
前記タイトルと内容を関連づけて記録したコンテンツデータが、辞書であることを特徴とするもの。
In the knowledge information expansion | deployment apparatus or program in any one of Claims 4-10,
Content data recorded in association with the title and content is a dictionary.
基本データに基づいて、関連する知識情報を展開する知識情報展開方法であって、
入力される基本データを受けて、タイトルを定義するために用いられる用語を当該タイトルに対応付けて知識情報として記録した知識情報データベースから、当該基本データに関する知識情報を抽出して出力する、
ことを特徴とする知識情報展開方法。
A knowledge information expansion method for expanding related knowledge information based on basic data,
In response to the input basic data, the knowledge information related to the basic data is extracted and output from the knowledge information database in which terms used to define the title are recorded as knowledge information in association with the title.
Knowledge information development method characterized by this.
基本データに基づいて、関連する知識情報を展開する知識情報展開システムであって、
基本データを入力するネットワーク上のクライアント端末、
当該クライアント端末からの基本データを受けて、タイトルを定義するために用いられる用語を当該タイトルに対応付けて知識情報として記録した知識情報データベースから、当該基本データに関する知識情報を抽出して外部に送信する知識情報展開サーバ、
前記知識情報展開サーバから知識情報を受信するネットワーク上の知識情報利用サーバ、
を備えたことを特徴とする知識情報展開システム。
A knowledge information expansion system that expands related knowledge information based on basic data,
A client terminal on the network for entering basic data,
Receives basic data from the client terminal, extracts knowledge information related to the basic data from a knowledge information database in which terms used to define a title are recorded as knowledge information in association with the title, and transmits the data to the outside Knowledge information deployment server,
A knowledge information utilization server on the network for receiving knowledge information from the knowledge information deployment server;
Knowledge information deployment system characterized by having
基本データに基づいて、関連する知識情報を展開する知識情報展開サーバであって、
ネットワーク上のクライアント端末から受信した基本データを入力するための基本データ入力手段、
当該基本データ入力手段からの基本データを受けて、タイトルを定義するために用いられる用語を当該タイトルに対応付けて知識情報として記録した知識情報データベースから、当該基本データに関する知識情報を抽出する知識情報抽出手段、
前記知識情報抽出手段が抽出した知識情報をネットワーク上の検索エンジンサーバに送信する知識情報展開手段、
を備えたことを特徴とする知識情報展開サーバ。
A knowledge information expansion server that expands related knowledge information based on basic data,
Basic data input means for inputting basic data received from a client terminal on the network,
Knowledge information that receives basic data from the basic data input means and extracts knowledge information related to the basic data from a knowledge information database in which terms used to define a title are recorded as knowledge information in association with the title Extraction means,
Knowledge information expansion means for transmitting the knowledge information extracted by the knowledge information extraction means to a search engine server on the network;
A knowledge information expansion server characterized by comprising:
JP2003179448A 2003-06-24 2003-06-24 Device and method for deploying knowledge information Pending JP2005018218A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003179448A JP2005018218A (en) 2003-06-24 2003-06-24 Device and method for deploying knowledge information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003179448A JP2005018218A (en) 2003-06-24 2003-06-24 Device and method for deploying knowledge information

Publications (1)

Publication Number Publication Date
JP2005018218A true JP2005018218A (en) 2005-01-20

Family

ID=34180765

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003179448A Pending JP2005018218A (en) 2003-06-24 2003-06-24 Device and method for deploying knowledge information

Country Status (1)

Country Link
JP (1) JP2005018218A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007032483A1 (en) * 2005-09-16 2007-03-22 Jam Corporation Information search assisting apparatus, computer program, program storing medium, and information searching method
JP2021105607A (en) * 2015-02-10 2021-07-26 モービルアイ ビジョン テクノロジーズ リミテッド System for autonomously navigating autonomous vehicle, autonomous vehicle, and method for navigating autonomous vehicle

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007032483A1 (en) * 2005-09-16 2007-03-22 Jam Corporation Information search assisting apparatus, computer program, program storing medium, and information searching method
JP2021105607A (en) * 2015-02-10 2021-07-26 モービルアイ ビジョン テクノロジーズ リミテッド System for autonomously navigating autonomous vehicle, autonomous vehicle, and method for navigating autonomous vehicle

Similar Documents

Publication Publication Date Title
US7958444B2 (en) Visualizing document annotations in the context of the source document
US8484238B2 (en) Automatically generating regular expressions for relaxed matching of text patterns
Ekbal et al. A web-based Bengali news corpus for named entity recognition
US20070011160A1 (en) Literacy automation software
KR20020058639A (en) A XML Document Retrieval System and Method of it
JP2002197104A (en) Device and method for data retrieval processing, and recording medium recording data retrieval processing program
JP2007193697A (en) Information collection apparatus, information collection method and program
WO2022123637A1 (en) Document processing system and document processing method
JP2005063185A (en) Document retrieval system, question-answering system, and document retrieval method
JP5186165B2 (en) Organization name extraction apparatus, method and program
JP2007011973A (en) Information retrieval device and information retrieval program
JP2021064143A (en) Sentence generating device, sentence generating method, and sentence generating program
JP2005242416A (en) Natural language text search method and device
JP2008077252A (en) Document ranking method, document retrieval method, document ranking device, document retrieval device, and recording medium
JPH08129554A (en) Relation expression extracting device and retrieval device for relation expression
JP7122773B2 (en) DICTIONARY CONSTRUCTION DEVICE, DICTIONARY PRODUCTION METHOD, AND PROGRAM
JP2005018218A (en) Device and method for deploying knowledge information
JP2007200252A (en) Abbreviation generation/validity evaluation method, synonym database generation/update method, abbreviation generation/validity evaluation device, synonym database generation/update device, program, and recording medium
JP2007128224A (en) Document indexing device, document indexing method and document indexing program
JP4148247B2 (en) Vocabulary acquisition method and apparatus, program, and computer-readable recording medium
JPH10307837A (en) Retrieval device and recording medium recording retrieval program
JP4286752B2 (en) Search support server and computer-readable recording medium
JP2008276561A (en) Morpheme analysis device, morpheme analysis method, morpheme analysis program, and recording medium with computer program recorded thereon
JP2004334382A (en) Structured document summarizing apparatus, program, and recording medium
JP2004030021A (en) Document processor and processing method

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050331