JPH08287083A - 辞書未登録語展開方法及び装置 - Google Patents

辞書未登録語展開方法及び装置

Info

Publication number
JPH08287083A
JPH08287083A JP7087100A JP8710095A JPH08287083A JP H08287083 A JPH08287083 A JP H08287083A JP 7087100 A JP7087100 A JP 7087100A JP 8710095 A JP8710095 A JP 8710095A JP H08287083 A JPH08287083 A JP H08287083A
Authority
JP
Japan
Prior art keywords
word
dictionary
expression
unregistered
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7087100A
Other languages
English (en)
Inventor
Tomohiro Tanaka
智博 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP7087100A priority Critical patent/JPH08287083A/ja
Publication of JPH08287083A publication Critical patent/JPH08287083A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 本発明の目的は、辞書に登録されていないた
めに展開できない単語を入力とし、当該単語に対応させ
て展開された語を辞書登録し、再度、当該単語が入力さ
れた場合に検索可能とすることが可能な辞書未登録語展
開装置及び辞書未登録語展開方法を提供することであ
る。 【構成】 本発明は、辞書に登録されていないために展
開できない第1の単語入力する入力手段と、入力された
第1の単語に関連する表現または第2の単語を抽出する
関連語抽出手段と、関連語抽出手段で取得した第1の単
語に関連する別な表現または単語に展開する展開手段を
有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、辞書未登録語展開方法
及び装置に係り、特に、既存の辞書に登録されていない
単語を関連する別な表現または単語に展開する辞書未登
録語展開方法及び装置に関する。
【0002】詳しくは、情報検索システムで用いる辞書
に登録されていない単語がある場合において、当該単語
を辞書に自動的に登録するための辞書未登録語展開方法
及び装置に関する。
【0003】
【従来の技術】日本語処理においては、予め単語が登録
されている辞書を用いて入力文を解析する方法がよく用
いられる。特に、利用者が求める情報を、利用者の入力
した単語又は文に基づいてデータベースから検索する情
報検索の技術として、入力された単語をシソーラスと呼
ばれる辞書を用いて関連する単語に展開し、入力された
単語の表記以外の表記であっても検索を可能にする手法
が知られている。このシステムは、利用者から検索要求
が発行され、データベースを検索した際に、当該検索要
求に合致するデータが検索できない場合に、辞書(シソ
ーラス)を辿って検索キーを緩和してデータベースを検
索する。このシソーラスは検索処理を行う前に予め人手
により、情報検索に使用されるキーワードと他のキーワ
ード間の意味的関係が記述された辞書である。詳しく
は、“谷口訳「情報検索システム」情報の科学と技術4
0巻10号,pp.640−645(1990)”を参
照されたい。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の技術においては、予め人手によりシソーラス等の辞
書を作成しておかなければならないため、情報検索を行
う際に、辞書に登録されていない語には対応できず、検
索するためのキーワードとして辞書に登録されていない
未登録語が入力された場合には、関連する語に展開する
ことができないとう問題がある。
【0005】また、辞書に登録されていない語が出現す
る毎に辞書に人手により登録することは困難であるとい
う問題がある。本発明は、上記の点に鑑みなされたもの
で、既存の情報検索システムにおいて辞書に登録されて
いないために展開できない単語を入力とし、当該単語に
対応させて展開された語を辞書登録し、再度、当該単語
が入力された場合に検索可能とすることが可能な辞書未
登録語展開方法及び装置を提供することを目的とする。
【0006】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明は、情報検索システム
において、辞書に登録されていない単語を展開して登録
する辞書未登録語展開方法において、辞書に登録されて
いないために展開できない第1の単語を抽出し(ステッ
プ1)、第1の単語に関連する表現または第2の単語を
抽出し(ステップ2)、第1の単語を第1の単語と関連
する別な表現または第2の単語に展開する(ステップ
3)。
【0007】また、本発明は、抽出された第1の単語で
テキスト情報を検索し、検索されたデータより第1の単
語に関連する表現、または第2の単語を抽出し、第1の
単語の関連を別な表現または第2の単語に展開する。ま
た、本発明は、展開された第1の単語と関連する別な表
現または第2の単語を保持する。
【0008】本発明は、展開された第1の単語と関連す
る別な表現または第2の単語を辞書に登録する。本発明
は、情報検索システムにおいて、辞書に登録されていな
い単語を展開して登録する辞書未登録語展開装置であっ
て、辞書に登録されていないために展開できない第1の
単語入力する入力手段と、入力された第1の単語に関連
する表現または第2の単語を抽出する関連語抽出手段
と、関連語抽出手段で取得した第1の単語に関連する別
な表現または単語に展開する展開手段を有する。
【0009】また、本発明は、展開手段で展開された第
1の単語に関連する別な表現または第2の単語を保持す
る保持手段を有する。また、本発明は、展開手段で展開
された第1の単語に関連する別な表現または第2の単語
を辞書に登録する登録手段を含む。
【0010】図2は、本発明の原理構成図である。本発
明は、既存の辞書に登録されていない単語を入力する入
力手段1と、抽出された関連する表現または単語と入力
手段1により入力された入力単語を対にして格納する未
登録語展開辞書2と、未登録語展開辞書2に登録された
単語と入力手段1より入力された入力単語とを照合する
未登録語展開辞書照合手段3と、テキスト情報を格納す
るテキスト蓄積手段4と、未登録語展開辞書照合手段3
において、未登録語展開辞書2に登録された単語と照合
しなかった単語を入力し、その単語をキーとしてテキス
ト蓄積手段を検索する検索手段5と、予め、単語と該単
語に関連する表現または単語を記述するための表記形式
が登録されている関連表現テーブル6と、検索手段5に
より検索された検索結果より関連表現テーブル6を参照
して、入力単語と関連する表現または単語を抽出する関
連表現抽出手段7と、関連表現抽出手段7により抽出さ
れた表現または単語と、入力単語を対にして未登録語展
開辞書に登録する辞書登録手段8と、未登録展開辞書照
合手段3において、未登録語展開辞書2と入力単語が照
合した場合には、照合した結果を出力し、照合しなかっ
た場合には、関連表現抽出手段7により抽出された表現
または単語を出力する出力手段9を有する。
【0011】
【作用】本発明は、既存の情報検索システムにおいて、
辞書に登録されていないために展開できない単語を入力
とし、その入力単語により、新聞、雑誌等の新しい情報
が掲載されているデータを検索し、検索されたデータよ
り入力単語に関連する表現または単語を抽出することに
より、入力単語を当該入力単語に関連する別の表現また
は単語に展開することが可能となる。
【0012】また、入力単語に関連する表現または単語
を抽出する際に、入力単語の説明、言い換えの表現、等
価性の各形式を参照することにより、展開時に入力単語
との関連性が保証される。さらに、展開結果を辞書に登
録するため、同じ単語が入力された場合には、当該単語
に対して対応が可能である。
【0013】
【実施例】以下、図面と共に本発明の実施例を詳細に説
明する。図3は、情報検索システム装置の構成を示す。
同図に示す構成は、入力部10、展開部11、展開用辞
書12、検索部13、データベース14、出力部15及
び辞書未登録語展開装置16より構成される。入力部1
0は、日本語単語を入力し、入力された単語を展開部1
1に転送する。展開部11は、入力された日本語単語に
関連する単語を展開用辞書12を用いて展開し、入力さ
れた日本語単語と、展開により得られた単語を検索部1
3に転送する。検索部13は、展開された単語によりデ
ータベース14を検索し、検索結果を出力部15に転送
する。出力部15は、検索結果を出力する。また、入力
された単語が展開用辞書12に登録されていないため
に、展開部11で関連する表現または単語に展開できな
い場合、その入力された単語を辞書未登録語展開装置1
6に送出し、辞書未登録語展開装置16において、展開
された結果(関連する表現、または単語)と元の入力さ
れた単語が、検索部13に転送される。検索部13は、
これらの展開結果、入力単語を用いてデータベース14
を検索する。
【0014】本発明は、図3の構成における辞書未登録
語展開装置16を対象とするものである。以下に、辞書
未登録語展開装置16について詳述する。図4は、本発
明の一実施例の辞書未登録語展開装置の構成を示す。同
図に示す辞書未登録語展開装置16は、入力部1、未登
録語展開辞書2、未登録語展開辞書照合部3、テキスト
データベース4、検索部5、関連表現テーブル6、関連
表現抽出部7、辞書登録部8及び出力部9より構成され
る。
【0015】入力部1は、既存の辞書に登録されていな
い単語が入力される。つまり、図3における展開部11
において展開不可能となった単語が入力される。未登録
語展開辞書2は、本装置により抽出された関連表現、単
語と元の単語(入力された単語)を対にして登録してい
る。図5は、本発明の一実施例の未登録展開辞書の構成
例を示す。同図の例において、未登録展開辞書2は、入
力された元の単語(以下、入力単語)『パソコン』に関
連する関連語として『パーソナルコンピュータ』、『個
人用計算機』を有する。
【0016】未登録語展開辞書照合部3は、入力部1よ
り入力された単語を、未登録語展開辞書2に登録されて
いる単語と照合し、照合一致すれば、未登録語展開辞書
2に登録された関連する表現または単語を入力単語と共
に出力部9に転送する。また、照合不一致の場合には、
入力部1より入力された入力単語を検索部5に転送す
る。
【0017】テキストデータベース4は、新聞、雑誌等
のテキストデータを蓄積したものであり、市販のCD−
ROM化された新聞・雑誌記事等が相当する。検索部5
は、未登録語展開辞書照合部3において未登録語展開辞
書2に登録された単語と照合不一致となった単語を入力
とし、その単語をキーとしてテキストデータベース4を
検索し、検索結果を関連表現抽出部7に転送する。
【0018】関連表現テーブル6は、単語と、当該単語
に関連する表現または単語を記述するための表記形式を
予め人手等により登録したテーブルである。図6は、本
発明の一実施例の関連表現テーブルの例を示す。同図に
おいて、入力された単語Xに関連する表現または単語Y
を用いて、例えば、以下のように表現する。 ・XとはYである …(入力単語の説明) ・X(Y) …(言い換え) ・X(Yともいう) …(言い換え) ・X(Yのこと) …(言い換え) ・YをXという …(等価性) 関連表現抽出部7は、検索部5により検索された検索結
果の文書群から、関連表現テーブル5に記述されている
表記形式に当てはまる表現を抽出し、入力された単語と
関連する表現または単語を抽出する。
【0019】辞書登録部8は、関連表現抽出部7により
抽出された表現または単語と、入力単語を対にして未登
録語展開辞書2に登録する。出力部9は、未登録語展開
辞書照合部3において、未登録語展開辞書2と入力した
単語が照合一致した場合には、未登録語展開辞書照合部
3より転送された結果を出力し、照合不一致の場合には
関連表現抽出部7により抽出された表現または単語を出
力する。
【0020】次に、上記の構成の動作を説明する。図7
は、本発明の一実施例の辞書未登録語展開装置の動作の
フローチャートである。 ステップ101) 入力部1は、既存の辞書に未登録で
ある単語が入力される。
【0021】ステップ102) 未登録語展開辞書照合
部3は、未登録語展開辞書2に登録されている単語と入
力部1より入力された単語とを照合し、未登録語展開辞
書2に入力単語が登録されていれば、ステップ103に
移行し、照合不一致(未登録語展開辞書2に入力単語が
登録されていない)の場合にはステップ106に移行す
る。 ステップ103) ステップ102において、入力単語
が未登録語展開辞書2に登録されている場合には、未登
録語展開辞書2に登録されている入力単語と対応付けて
登録されている関連する表現または単語を抽出する。
【0022】ステップ104) 抽出された表現または
単語を出力部9に転送する。 ステップ105) 出力部9は、抽出された表現または
単語及び入力単語を出力し、処理を終了する。 ステップ106) ステップ102において、照合不一
致の場合には、入力単語を検索部5に転送する。
【0023】ステップ107) 検索部5は、テキスト
データベース4を検索し、複数の文書の集合である検索
結果と入力単語を関連表現抽出部7に転送する。なお、
未登録語展開辞書照合部3から転送された単語をキーと
してテキストデータベース4を検索する方法は、従来よ
り用いられている全文検索手法を用いるものとする。な
お、検索の方法は、この手法に限定されることなく、種
々の手法を使用することが可能である。
【0024】ステップ108) 関連表現抽出部7は、
検索結果の中からランダムに1つの文書を取り出す。 ステップ109) 関連表現抽出部7は、取り出された
文書中に関連表現テーブル6に記述された表現があるか
を判定し、ある場合には、ステップ110に移行し、な
い場合には、ステップ113に移行する。
【0025】ステップ110) 関連表現抽出部7は、
関連表現テーブル6で入力単語と記述された部分に対応
する文字列が入力単語と同じであるかを判定し、同じで
ある場合にはステップ111に移行し、異なる場合に
は、ステップ113に移行する。
【0026】ステップ111) 関連表現抽出部7は、
関連表現テーブル6で関連する表現または単語と記述さ
れた部分に対応する文字列を抽出する。 ステップ112) 関連表現抽出部7は、抽出された関
連する表現または単語と記述された部分に対応する文字
列を保持する。
【0027】ステップ113) 検索結果中にまだ処理
されていない文書がある場合には、ステップ108に移
行し、全ての文書を処理している場合には、ステップ1
14に移行する。 ステップ114) 関連表現抽出部7は、保持している
文字列・入力単語を辞書登録部8に転送し、辞書登録部
8は、それらを登録する。
【0028】ステップ115) 関連表現抽出部7は、
保持している文字列・入力単語を出力部9に転送する。
次に、具体的な例を用いて説明する。以下の説明の前提
として、既存の辞書の未登録の単語として、以下の単語
が入力部1から入力されたものとして説明する。また、
以下の具体例において、未登録語展開辞書2の内容は図
5に示す内容とし、関連表現テーブル6の内容は図6に
示すものとする。
【0029】1. 第1の具体例 入力単語… 単語1:「オペック」 (1) 入力部1から単語1「オペック」が入力され
る。当該単語1を未登録語展開辞書照合部3に転送す
る。
【0030】(2) 未登録語展開辞書照合部3は、単
語1「オペック」が未登録語展開辞書2に登録されてい
るかを判断する。この例では、未登録語展開辞書2には
単語1は登録されていないため、単語1を検索部5に転
送する。 (3) 検索部5は、未登録語展開辞書照合部3から転
送された単語1をキーとしてテキストDB4を検索す
る。図9は、本発明の一実施例の検索結果を示す。同図
において、太字で記載されているのは、入力されたキー
と一致した単語を示す。同図の例では、 a:『“オペック”(石油輸出国機構)では、昨日行わ
れた会合において、……』 b:『現在“オペック”(OPECのこと)には、〜カ
国が参加しており、活発な活動を行っている。』 c:『“オペック”に加盟している〜国では、内政の不
安定から、……』 の3つの検索結果が取得できたものとする。検索部5
は、これらの3つの検索結果を関連表現抽出部7に入力
する。
【0031】(4) 関連表現抽出部7は、入力された
検索結果よりランダムに1つの文書としてa『“オペッ
ク”(石油輸出国機構)では、昨日行われた会合におい
て、……』を取り出す。
【0032】(5) 関連表現抽出部7は、取り出され
た文書aから関連表現テーブル6に記載されている表現
形式があるかを判断する。図10に示す例では、文書a
『“オペック”(石油輸出国機構)では、昨日行われた
会合において、……』は、関連表現テーブルの“X
(Y)(X:入力された単語、Y:関連する表現、単
語)”に対応する表現(「オペック(石油輸出国機
構))が存在するため抽出する。つまり、単語1「オペ
ック」に関連する単語として「石油輸出国機構」が抽出
される。
【0033】(6) 関連表現抽出部7は、抽出された
単語「オペック」と関連する単語「石油輸出国機構」を
対にして保持しておく。 (7) 次に、関連表現抽出部7は、検索部5で検索さ
れた検索結果より文書b『現在“オペック”(OPEC
のこと)には、〜カ国が参加しており、活発な活動を行
っている。』を取り出す。
【0034】(8) 関連表現抽出部7は、取り出され
た文書bから関連表現テーブル6に記載されている表現
形式があるかを判断し、文書bでは、関連表現テーブル
“X(Yのこと)”に対応する表現(「オペック(OP
ECのこと))が存在するため、抽出する。つまり、単
語1「オペック」に関連する単語として「OPEC」が
抽出される。
【0035】(9) 関連表現抽出部7は、抽出された
単語「オペック」と関連する単語「OPEC」を対にし
て保持しておく。 (10) 最後に、関連表現抽出部7は、検索部5で検
索された検索結果より文書c『オペックに加盟している
〜国では、内政の不安定から、……』を取り出す。
【0036】(11) 関連表現抽出部7は、取り出さ
れた文書cか関連表現テーブル6に記載されている表現
形式があるかを判断し、文書cは、関連表現テーブル6
に対応する表現形式が存在しないため、関連する単語と
して抽出されるものはない。 (12) これで検索部5から出力された全ての検索結
果の文書について判断処理が終了しているので、上記の
(6)と(9)で保持されている抽出されている単語と
関連する単語の組 “オペック(石油輸出国機構)” “オペック(OPECのこと)” を辞書登録部8に転送する。
【0037】(13) 辞書登録部8は、図11に示す
ように、未登録展開辞書2に対して転送された単語組を
追加登録する。即ち、辞書登録部8は入力された単語1
「オペック」に対応する関連語として『石油輸出国機
構』と『OPEC』とを未登録展開辞書2に登録する。
【0038】図11において、太線で囲まれている部分
が上記の(1)〜(13)までの処理により登録された
単語である。これにより、「オペック」という単語、及
び関連語「石油輸出国機構」と「OPEC」が未登録展
開辞書2に登録されているため、これらのいずれかの単
語が既存の辞書に未登録であっても、未登録御展開辞書
照合部3において照合一致する。
【0039】2. 第2の具体例 入力単語… 単語2「オフコン」 (1) 未登録語展開辞書照合部3は、入力部1から入
力された入力単語2が未登録語展開辞書2に登録されて
いるかの照合を行う。この例の場合には、図5に示す未
登録語展開辞書2に単語「オフコン」が登録されてい
る。
【0040】(2) 従って、その単語と関連する単語
として未登録展開辞書2に登録されている「オフィスコ
ンピュータ」、「汎用計算機」が取り出される。 (3) その結果、未登録語展開照合部3の出力結果と
して入力された単語2「オフコン」と共に、「オフィス
コンピュータ」、「汎用計算機」が出力部9に出力され
る。
【0041】このように、未登録語展開辞書照合部3に
おいて入力部1より入力された単語が未登録語展開辞書
2中に登録された単語と照合した場合には、未登録語展
開辞書照合部3の出力結果が出力部9を介して出力され
る。なお、上記の実施例により、未登録語展開辞書2に
登録された入力単語と当該入力単語に関連表現または単
語の組を展開用辞書12にも登録する方法がある。即
ち、本発明の辞書未登録語展開装置16で展開された未
登録語に関連する表現または単語を展開用辞書12にも
登録することにより、当該単語は登録語となる。従っ
て、辞書未登録語展開装置16での処理を行わずに、展
開部11が直接展開用辞書12を参照することが可能と
なる。
【0042】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
【0043】
【発明の効果】上述のように、本発明の辞書未登録語展
開装置及び辞書未登録語展開方法によれば、既存の情報
検索システムにおいて、辞書に登録されていないために
展開ができない単語を入力とし、その単語により新聞、
雑誌等の新しい情報が掲載されているデータを検索し、
検索されたデータ中から、その単語に関連する別な表現
または、単語を抽出することにより、元の単語を、その
単語に関連する別な表現、単語に展開することが可能に
なる。
【0044】さらに、展開結果を保持しておくことによ
り、同じ単語が入力された場合に対応することが可能と
なる。例えば、本発明により、流行語、新語、略語とい
った最近新たに作られた単語に関連する情報を検索する
ことができる最新情報検索システムを提供することが可
能になる。その単語が何を表しているのか、従来のどの
ような単語の言い換えであるのか等をユーザ自身が知ら
なくとも、展開された表現または単語を自動的に未登録
であった辞書に登録するため、最初に入力された検索キ
ーで関連する情報を検索することができ、逆に検索結果
からその単語の意味を知ることが可能となる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】情報検索システム装置の構成図である。
【図4】本発明の一実施例の辞書未登録語展開装置の構
成図である。
【図5】本発明の一実施例の未登録語展開辞書の構成例
を示す図である。
【図6】本発明の一実施例の関連表現テーブルの例を示
す図である。
【図7】本発明の一実施例の辞書未登録語展開装置の動
作のフローチャートである。
【図8】本発明の一実施例の辞書未登録展開装置の動作
のフローチャートである。
【図9】本発明の一実施例の検索結果を示す図である。
【図10】本発明の一実施例の関連表現抽出部の具体的
な動作を説明するための図である。
【図11】本発明の一実施例の未登録語展開辞書に登録
された結果を示す図である。
【符号の説明】
1 入力部 2 未登録語展開辞書 3 未登録語展開辞書照合部 4 テキストデータベース 5 検索部 6 関連表現テーブル 7 関連表現抽出部 8 辞書登録部 9 出力部 10 入力部 11 展開部 12 展開用辞書 13 検索部 14 データベース 15 出力部 16 辞書未登録語展開装置

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 情報検索システムにおいて、辞書に登録
    されていない単語を展開して登録する辞書未登録語展開
    方法において、 前記辞書に登録されていないために展開できない第1の
    単語を抽出し、 前記第1の該単語に関連する表現または第2の単語を抽
    出し、 第1の単語を関連する別な表現または第2の単語に展開
    することを特徴とする辞書未登録語展開方法。
  2. 【請求項2】 抽出された前記第1の単語でテキスト情
    報を検索し、 検索されたデータより前記第1の単語に関連する表現、
    または第2の単語を抽出し、 前記第1の単語の関連を別な表現または第2の単語に展
    開する請求項1記載の辞書未登録語展開方法。
  3. 【請求項3】 展開された前記第1の単語と関連する別
    な表現または第2の単語を保持する請求項1記載の辞書
    登録語展開方法。
  4. 【請求項4】 展開された前記第1の単語と関連する別
    な表現または第2の単語を前記辞書に登録する請求項1
    記載の辞書登録語展開方法。
  5. 【請求項5】 情報検索システムにおいて、辞書に登録
    されていない単語を展開して登録する辞書未登録語展開
    装置であって、 前記辞書に登録されていないために展開できない第1の
    単語を入力する入力手段と、 前記入力手段により入力された前記第1の単語に関連す
    る表現または第2の単語を抽出する関連語抽出手段と、 前記関連語抽出手段で取得した前記第1の単語に関連す
    る別な表現または第2の単語に展開する展開手段を有す
    ることを特徴とする辞書未登録語展開装置。
  6. 【請求項6】 前記展開手段で展開された前記第1の単
    語に関連する別な表現または第2の単語を保持する保持
    手段を有する請求項5記載の辞書未登録語展開装置。
  7. 【請求項7】 前記展開手段で展開された前記第1の単
    語に関連する別な表現または第2の単語を前記辞書に登
    録する登録手段を含む請求項5記載の辞書未登録語展開
    装置。
  8. 【請求項8】 既存の辞書に登録されていない単語を入
    力する入力手段と、 抽出された関連する表現または単語と前記入力手段によ
    り入力された入力単語を対にして格納する未登録語展開
    辞書と、 前記未登録語展開辞書に登録された単語と前記入力手段
    より入力された入力単語とを照合する未登録語展開辞書
    照合手段と、 テキスト情報を格納するテキスト蓄積手段と、 前記未登録語展開辞書照合手段において、前記未登録語
    展開辞書に登録された単語と照合しなかった単語を入力
    し、その単語をキーとして前記テキスト蓄積手段を検索
    する検索手段と、 予め、単語と該単語に関連する表現または単語を記述す
    るための表記形式が登録されている関連表現テーブル
    と、 前記検索手段により検索された検索結果より前記関連表
    現テーブルを参照して、前記入力単語と関連する表現ま
    たは単語を抽出する関連表現抽出手段と、 前記関連表現抽出手段により抽出された表現または単語
    と、前記入力単語を対にして前記未登録語展開辞書に登
    録する辞書登録手段と、 前記未登録展開辞書照合手段において、前記未登録語展
    開辞書と前記入力単語照合した場合には、照合した結果
    を出力し、照合しなかった場合には、前記関連表現抽出
    手段により抽出された表現または単語を出力する出力手
    段を有することを特徴とする辞書未登録語展開装置。
  9. 【請求項9】 前記関連表現テーブルは、 前記入力単語の説明、言い換え、等価性を有する形式を
    有する請求項8記載の辞書未登録語展開装置。
JP7087100A 1995-04-12 1995-04-12 辞書未登録語展開方法及び装置 Pending JPH08287083A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7087100A JPH08287083A (ja) 1995-04-12 1995-04-12 辞書未登録語展開方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7087100A JPH08287083A (ja) 1995-04-12 1995-04-12 辞書未登録語展開方法及び装置

Publications (1)

Publication Number Publication Date
JPH08287083A true JPH08287083A (ja) 1996-11-01

Family

ID=13905538

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7087100A Pending JPH08287083A (ja) 1995-04-12 1995-04-12 辞書未登録語展開方法及び装置

Country Status (1)

Country Link
JP (1) JPH08287083A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004110633A (ja) * 2002-09-20 2004-04-08 Ricoh Co Ltd 異表記辞書作成装置および異表記辞書作成方法およびその方法をコンピュータに実行させるためのプログラム
JP2009157643A (ja) * 2007-12-26 2009-07-16 Mizuho Information & Research Institute Inc 説明表示システム、説明表示方法及び説明表示プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004110633A (ja) * 2002-09-20 2004-04-08 Ricoh Co Ltd 異表記辞書作成装置および異表記辞書作成方法およびその方法をコンピュータに実行させるためのプログラム
JP2009157643A (ja) * 2007-12-26 2009-07-16 Mizuho Information & Research Institute Inc 説明表示システム、説明表示方法及び説明表示プログラム

Similar Documents

Publication Publication Date Title
JP4544674B2 (ja) 選択文字列に関連する情報を提供するシステム
US6167370A (en) Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
US10296584B2 (en) Semantic textual analysis
US8027966B2 (en) Method and system for searching a multi-lingual database
WO2020155749A1 (zh) 构建个人知识图谱的方法、装置、计算机设备和存储介质
JP3123836B2 (ja) テキスト型データベース装置
JPH05324719A (ja) 文書検索システム
JPH08171569A (ja) 文書検索装置
JPH09198396A (ja) 文書検索装置
KR100659370B1 (ko) 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법
JPH08287083A (ja) 辞書未登録語展開方法及び装置
JPH0944506A (ja) 文書検索装置
KR100452024B1 (ko) 자연어 질의 응답 검색 엔진 및 검색 방법
JPH10149370A (ja) 文脈情報を用いた文書検索方法および装置
JPH06195371A (ja) 未登録語獲得方式
JPH10171815A (ja) 統合化検索装置
JP3358100B2 (ja) 日本語質問メッセージ解析方法及び装置
JPH0934897A (ja) 図書管理システム
JPH04123264A (ja) 関連語テーブル作成装置及び文書検索装置
JPS60247756A (ja) デ−タベ−ス装置
JP3161660B2 (ja) キーワード検索方法
JPH05165889A (ja) 文書検索装置
JPH0540783A (ja) 自然言語解析装置
JPH08249341A (ja) 文書データベースの文書格納・検索装置
JPH04330565A (ja) 自然言語処理システム