JPH08221427A - シソーラス登録支援装置及びシソーラス登録支援方法 - Google Patents

シソーラス登録支援装置及びシソーラス登録支援方法

Info

Publication number
JPH08221427A
JPH08221427A JP7026955A JP2695595A JPH08221427A JP H08221427 A JPH08221427 A JP H08221427A JP 7026955 A JP7026955 A JP 7026955A JP 2695595 A JP2695595 A JP 2695595A JP H08221427 A JPH08221427 A JP H08221427A
Authority
JP
Japan
Prior art keywords
registration
word
thesaurus
descriptor
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7026955A
Other languages
English (en)
Inventor
Hiroshi Matsuo
比呂志 松尾
Haruo Kimoto
晴夫 木本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP7026955A priority Critical patent/JPH08221427A/ja
Publication of JPH08221427A publication Critical patent/JPH08221427A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 本発明の目的は、大規模なシソーラスであっ
ても、人手で上位・下位関係を辿って登録位置を辿って
登録位置を探すことなく、容易にシソーラスの構築が可
能となるシソーラス登録支援装置及びシソーラス登録支
援方法を提供することである。 【構成】 本発明は、 登録対象語と登録済み語とを単
語分割して得られる各単位語の意味的一致や上位・下位
関係に基づいて登録候補位置の手がかりとなる語を抽出
する登録候補位置抽出手段100と、手がかりとなる語
を構成する単語のシソーラス辞書1上の位置関係により
登録位置を決定し、登録対象語をシソーラス辞書1の登
録位置に登録する登録手段200とを有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、シソーラス登録支援装
置及びシソーラス登録支援方法に係り、特に、情報検索
処理におけるキーワード検索、自然語検索または、日本
語処理における意味解析処理等で用いるシソーラス辞書
を構築するためのシソーラス登録支援装置及びシソーラ
ス登録支援方法に関する。
【0002】
【従来の技術】情報検索処理におけるキーワード検索や
自然語検索や日本語処理における意味解析処理等では、
語と語の意味関係として、同義語関係や上位・下位関係
を登録したシソーラス辞書を用いる。
【0003】従来シソーラス辞書を作成するには、図1
4に示すようなシソーラス辞書登録装置を用いている。
図14は、従来のシソーラス辞書登録装置の構成を示
す。シソーラス辞書91を作成するためのシソーラス辞
書登録装置は、表示や登録等の指示を受け付ける動作指
示部92、登録対象語を登録する位置を指定するための
登録位置指定部93、利用者が登録対象語を入力するた
めの登録対象語入力部94、指定された登録位置に登録
対象語を登録するシソーラス辞書登録部95、カレント
ノードを変更するためのカレントノード変更部96、及
び登録されているシソーラスを表示するシソーラス表示
部97より構成される。
【0004】シソーラス辞書91には、同義語関係にあ
る複数の語のうち、1つの語をディスクリプタ語とし、
残りの語を非ディスクリプタ語として表した同義語関係
と、ディスクリプタ語間の上位・下位関係とが記述され
ている。図15は、シソーラス辞書の例を示す。同図に
おいて、各ノードの1番目の文字列は、語の文字列、2
番目の数字はノード番号、3番目の記号は“D”がディ
クリプタ語、“N”が非ディスクリプタ語であることを
表す。1つのノードには、ディスクリプタ語を1語登録
し、さらに、複数の非ディスクリプタ語を登録できる。
同じノード上の語は全て互いに同義関係にあり、ディス
クリプタ語がその代表となる。
【0005】図15の例では、最上位の語として、『食
品』が登録され、『食品』は、ノード番号「1」であ
り、「ディスクリプタ語」であることを示している。
『食品』の下位語には、『青果物』、『油』、『飲み
物』、『加工食品』がある。さらに、『青果物』の下位
語には、『果物』、『やさい』がある。『果物』と『フ
ルーツ』は同義語である。
【0006】シソーラスの規模が大きい場合には、1画
面で全てを表示することができないため、カレントノー
ドを定め、シソーラス表示部97で、その周囲を表示す
る。初期状態では、最上位のノードがカレントノードと
なっている。カレントノードを変更するには、動作指示
部92に対して上位ノードや下位ノードを指定すること
により、カレントノード変更部96における操作でカレ
ントノードを移動することができる。
【0007】シソーラス構築者は、登録しようとする語
をどこにおけばよいかを、カレントノード変更部96で
カレントノードを移動させて、シソーラス辞書91に登
録されている語と登録しようとする語(登録対象語)を
比較して、適切な登録位置を決める。登録位置の指定
は、カレントノードの同義語として登録するか、子ノー
ドとして登録するかを指定する。登録位置指定部93
は、これにより、登録指定位置を得、登録対象語入力部
94を起動する。シソーラスの構築者が登録対象語を入
力すると、シソーラス辞書登録部95により、登録位置
指定部93により指定されたシソーラス辞書91の位置
に登録される。
【0008】
【発明が解決しようとする課題】しかしながら、上記の
従来のシソーラスの登録において、シソーラス構築者
は、カレントノード付近の情報と登録しようとする語と
を比較検討しながら、現在表示されている子ノードのい
ずれに属するかを考えて、カレントノードを移動すると
いう操作を複数回繰り返えさないと、適切な登録位置へ
辿り着かないという問題がある。
【0009】例えば、「メロン果汁」を図15のシソー
ラス辞書に登録しようとする場合、シソーラス構築者
は、以下の操作を行わなければならない。ここで、シソ
ーラスの表示は、カレントノードとその子ノードのみと
する。シソーラスが大きい場合は、さらに、下位のノー
ドも表示したとしても階層が異なるだけで、これと同等
の状況が起こり得るので、このような設定で説明を行
う。
【0010】(1) 初期状態では、カレントノードは
「食品」にある。その子ノードの「青果物」、「油」、
「飲物」、「加工食品」のうち、シソーラス構築者は、
「メロン果汁」がどれに属する可能性があるかあるい
は、同義語があるかを考え、カレントノードを「飲物」
に変更する。
【0011】(2) 「飲物」の子ノード「茶」、「コ
ーヒー」、「ジュース」のいずれに属するか、或いは、
同義語があるかを考え、カレントノードを「ジュース」
に変更する。 (3) 「ジュース」の子ノード「アップルジュー
ス」、「ミカンジュース」のいずれに属するかあるい
は、同義語があるかを考え、カレントノードを「フルー
ツジュース」に変更する。
【0012】(4) 「フルーツジュース」の子ノード
「アップルジュース」、「みかんジュース」のいずれに
属するか或いは、同義語があるかを考える。この場合
は、いずれにも属さず、しかも同義語も存在しないの
で、「フルーツジュース」の子ノードとして「メロン果
汁」を登録する。
【0013】このように、適切な登録位置にたどり着く
までにシソーラス構築者自身による判断と操作を必要と
する。上の例では、「フルーツジュース」というノード
があることをシソーラス構築者が知っていれば、直接
「フルーツジュース」と入力して、カレントノードを
「フルーツジュース」へ直接移動させるよう構成するこ
とも可能であるが、シソーラスが大規模になると、その
情報をシソーラス構築者が全て記憶しておくことは現実
的に不可能であり、1段ずつ選択してカレントノードを
移動するという操作が必要となる。
【0014】本発明は、上記の点に鑑みなされたもの
で、大規模なシソーラスであっても、人手で上位・下位
関係を辿って登録位置を辿って登録位置を探すことな
く、容易にシソーラスの構築が可能となるシソーラス登
録支援装置及びシソーラス登録支援方法を提供すること
を目的とする。
【0015】
【課題を解決するための手段】図1は、本発明の原理構
成図である。本発明は、上位語と下位語の関係、及び同
義語関係を記述したシソーラス辞書1に、入力された登
録対象語を登録するための支援を行うシソーラス登録支
援装置において、登録対象語と登録済み語とを単語分割
して得られる各単位語の意味的一致や上位・下位関係に
基づいて登録候補位置の手がかりとなる語を抽出する登
録候補位置抽出手段100と、手がかりとなる語を構成
する単語のシソーラス辞書1上の位置関係により登録位
置を決定し、登録対象語をシソーラス辞書1の登録位置
に登録する登録手段200とを有する。
【0016】また、登録候補位置抽出手段100は、シ
ソーラス辞書上の各々の語を短単位のディスクリプタ語
の列で表したディスクリプタ展開テーブルと、登録対象
語をシソーラス辞書1を参照して短単位の語に分割する
単語分割手段と、分割された語がシソーラス辞書1上に
存在しない場合には、分割された語をディスクリプタ語
とし、分割された語がシソーラス辞書上に存在する場合
には、ディスクリプタ展開テーブルを参照して、分割さ
れた語を短単位のディスクリプタ語の列に変換してディ
スクリプタ展開列を生成するディスクリプタ展開手段
と、登録対象語のディスクリプタ展開列と、既にディス
クリプタ展開テーブルに登録されている登録済みのディ
スクリプタ展開列を比較して、各々の構成要素のディス
クリプタ語の一致及び、上位・下位関係に基づいて同義
語候補、上位語候補、下位語候補、兄弟語候補として抽
出する手がかり語抽出手段とを有する。
【0017】また、登録手段200は、手がかり語抽出
手段で抽出された各候補からシソーラス辞書1上の登録
候補位置を抽出する登録位置候補抽出手段と、登録位置
候補抽出手段で得られた登録候補位置をシソーラス辞書
1上の階層の深さに応じて順位付けして表示する登録候
補位置表示手段と、登録候補位置表示手段により表示さ
れた登録候補位置を利用者に選択させることにより登録
位置を決定する登録位置決定手段と、登録位置決定手段
により決定されたシソーラス辞書1の登録位置に、登録
対象語を登録し、ディスクリプタ展開手段で生成された
ディスクリプタ展開列をディスクリプタ展開テーブルへ
格納するシソーラス登録手段とを有する。
【0018】また、登録候補位置抽出手段100は、シ
ソーラス辞書1上の各々の語を短単位のディスクリプタ
語の列で表したディスクリプタ展開テーブルと、登録対
象語をシソーラス辞書1を参照して短単位の語に分割す
る単語分割手段と、分割された単語がシソーラス辞書1
上に存在しない場合には、分割された単語をディスクリ
プタ語とし、分割された単語がシソーラス辞書1上に存
在する場合には、ディスクリプタ展開テーブルを参照し
て、短単位のディスクリプタ語の列に変換してディスク
リプタ展開列を生成するディスクリプタ展開手段と、登
録対象語のディスクリプタ展開列と、既にディスクリプ
タ展開テーブルに登録されている登録済みのディスクリ
プタ展開列を比較して、各々の構成要素のディスクリプ
タ語の一致及び、上位・下位関係に基づいて同義語候
補、上位語候補、下位語候補、兄弟語候補を抽出し、各
候補の評価値を算出する手がかり語抽出・評価値算出手
段とを有する。
【0019】また、登録手段200は、手がかり語抽出
・評価値算出手段で抽出された各候補からシソーラス辞
書1上の登録候補位置を抽出する登録位置候補抽出手段
と、登録位置候補抽出手段で得られた登録候補位置を評
価値の順に表示し、評価値が同じ場合には、シソーラス
辞書上の階層の深さに応じて順位付けして表示する登録
候補位置表示手段と、登録候補位置表示手段により表示
された登録候補位置を利用者に選択させることにより登
録位置を決定する登録位置決定手段と、登録位置決定手
段により決定されたシソーラス辞書上の登録位置に登録
対象語を登録し、ディスクリプタ展開手段で生成された
ディスクリプタ展開列をディスクリプタ展開テーブルへ
格納するシソーラス登録手段とを有する。
【0020】また、登録手段200において、シソーラ
ス登録手段は、登録位置決定手段により前記シソーラス
辞書への登録位置が決定した後、操作モードを自動支援
モードからマニュアルモードに切り換えて、登録位置に
登録できる登録対象語を登録するマニュアル登録手段を
更に有する。
【0021】また、登録手段200において、登録位置
決定手段は、入力された前記登録対象語で登録位置が決
定されなかった場合に、操作モードを自動支援モードか
らマニュアルモードに切り換えて、関連する他の語を登
録対象語に変更して、登録候補位置を再度取得・表示し
て、表示された登録候補位置のカレントノードの周囲を
探索して、登録位置を決定するマニュアル登録位置決定
手段を更に有する。
【0022】図2は、本発明の原理を説明するための図
である。本発明は、登録対象語が入力される(ステップ
1)と、上位語と下位語の関係、及び同義語関係を記述
したシソーラス辞書に、登録辞書を登録するための支援
を行うシソーラス登録支援方法において登録対象語と登
録済み語とを単語分割して得られる各単位語の意味的一
致や上位・下位関係に基づいて登録候補位置の手がかり
となる語を抽出し(ステップ2)、手がかりとなる語を
構成する単語のシソーラス辞書上の位置関係により登録
候補位置を出力し(ステップ3)、利用者により選択さ
れた登録候補位置の位置に、登録対象語を登録する(ス
テップ4)。
【0023】また、本発明は、ステップ2において、登
録候補位置の手がかりとなる語を抽出する際に、入力さ
れた登録対象語を、シソーラス辞書に基づいて短単位の
語に分割し、分割された語がシソーラス辞書上に存在し
ない場合にはディスクリプタ語とし、存在する場合に
は、シソーラス辞書上の語をディスクリプタ語の列で表
現した第1のディスクリプタ展開列からなるディスクリ
プタ展開テーブルを参照して分割された語を、ディスク
リプタ語の列に変換して、第2のディスクリプタ展開列
を生成し、第2のディスクリプタ展開列と第1のディス
クリプタ展開列とを比較し、各々の構成要素のディスク
リプタ語の一致及び、上位・下位関係に基づいて同義語
候補、上位語候補、下位語候補、兄弟語候補として、手
がかり語を抽出する。
【0024】また、本発明の上記ステップ3及び4にお
いて、登録対象語を登録する際に、手がかり語からシソ
ーラス辞書上の登録候補位置を抽出し、登録候補位置を
シソーラス辞書上の深さに応じて順位を付与して表示
し、シソーラス辞書上の利用者に選択された登録候補位
置の位置に登録対象語を登録し、第2のディスクリプタ
展開列をディスクリプタ展開テーブルに格納する。
【0025】また、本発明の上記ステップ4において、
登録対象語を登録する際に、登録候補位置毎に評価値を
計算し、登録候補位置が重複する場合には、評価値が最
大の登録候補位置を選択し、登録候補位置を表示する際
には、評価値の大きい順に表示し、評価値が同じ場合に
は、シソーラス辞書上の階層の深さが深い順に表示す
る。
【0026】また、本発明の上記ステップ4において、
登録対象語を登録する際に、シソーラス辞書への登録位
置が決定した後、操作モードを自動支援モードからマニ
ュアルモードに切り換えて、該登録位置に登録できる登
録対象語を登録する。また、本発明の上記ステップ4に
おいて、登録対象語を登録する際に、入力された登録対
象語で登録位置が決定されなかった場合に、操作モード
を自動支援モードからマニュアルモードに切り換えて、
関連する他の語を登録対象語に変更して、登録候補位置
を再度取得・表示して、表示された登録候補位置のカレ
ントノードの周囲を探索して、登録位置を決定する。
【0027】
【作用】本発明のシソーラス登録支援装置及びシソーラ
ス登録支援方法では、まず、入力された登録対象語が、
シソーラス辞書を参照して単語に分割される。ディスク
リプタ展開テーブルを参照して、分割された短単位の語
を、短単位のディスクリプタ語に展開され、ディスクリ
プタ展開列を生成する。これにより、同じ意味の単語
は、1つのディスクリプタ語に置き替わる。
【0028】さらに、登録対象語のディスクリプタ展開
列の各要素と、シソーラス辞書上に登録済みの語のディ
スクリプタ展開列の各要素とを比較し、一致や上位・下
位関係に基づいて、同義語候補、上位語候補、下位語候
補、兄弟語候補となる手がかり語をシソーラス辞書から
抽出する。なお、登録済み語のディスクリプタ展開列
は、ディスクリプタ展開テーブルから得ることができ
る。
【0029】また、同義語候補、上位語候補、下位語候
補、兄弟語候補の手がかり語から登録候補位置を決定し
て、取得した候補をシソーラス上の深さに応じて順位付
けをして表示する。この表示された候補位置をシソーラ
ス構築者に選択させることにより、適切な登録位置に登
録対象語を登録することができる。
【0030】また、本発明は、ディスクリプタ展開列を
取得した後、手がかり語をシソーラス辞書から抽出する
と共に評価値を算出しておく。手がかり語から登録候補
位置を決定し、登録位置が重複する場合には、最大の評
価値を先頭として評価値の高い順に表示し、また、評価
値が同じ場合には、シソーラス上の深さが深い順に表示
する。このように、本発明は、ディスクリプタ展開列に
基づいて、登録対象語に対する登録候補位置をシソーラ
ス構築者に提示するため、シソーラス登録を容易に行う
ことが可能となる。
【0031】
【実施例】以下、本発明の実施例を図面と共に説明す
る。 [第1の実施例]図3は、本発明の第1の実施例のシソ
ーラス登録試験装置の構成を示す。同図に示すシソーラ
ス登録試験装置は、シソーラス辞書1、ディスクリプタ
展開テーブル2、登録対象語入力部3、単語分割部4、
ディスクリプタ展開部5、手がかり語抽出部6、登録候
補位置決定部7、登録候補位置表示部8、登録位置決定
部9、及びシソーラス登録部10より構成される。
【0032】図4は、本発明の第1の実施例のシソーラ
ス登録支援装置の概要動作を示すフローチャートであ
る。 ステップ1001) 登録対象語入力部3は、登録対象
語の入力を受け付け、単語分割部4に入力する。
【0033】ステップ1002) 単語分割部4は、シ
ソーラス辞書1を参照して、登録対象語を単語に分解す
る。 ステップ1003) ディスクリプタ展開部5は、ディ
スクリプタ展開テーブル2を参照して、短単位(分割さ
れた単語の単位)のディスクリプタ語列で表す。未知語
部分に関しては、それ自身をディスクリプタ語と見做
す。
【0034】ステップ1004) 手がかり語抽出部6
は、登録対象語のディスクリプタ展開列の各要素と、シ
ソーラス辞書1上の登録済み語のディスクリプタ展開列
の各要素と比較し、同義語候補、上位語候補、下位語候
補、兄弟語候補となる手がかり語をシソーラス辞書1か
ら抽出する。
【0035】ステップ1005) 登録候補位置決定部
7は、同義語候補、上位語候補、下位語候補、兄弟語候
補の手がかり語から登録候補位置を決定する。 ステップ1006) 登録候補位置表示部8は、登録候
補位置をシソーラス辞書1上の深さに応じて順位付けし
て表示する。
【0036】ステップ1007) 登録位置決定部9
は、表示された登録候補位置を、利用者に選択させ、登
録位置を決定する。 ステップ1008) シソーラス登録部10は、決定さ
れた登録位置に登録対象語を登録する。
【0037】ステップ1009) シソーラス辞書1に
登録すべき全ての登録対象語の処理が終了したら、処理
を終了し、未処理の登録対象語がある場合にはステップ
1001に移行する。 以下に、本実施例の各構成要素について説明する。
【0038】〈シソーラス辞書〉シソーラス辞書1は、
同義語関係にある複数の語のうち、1つをディスクリプ
タ語とし、残りの語を非ディスクリプタ語として表した
同義語関係と、ディスクリプタ語間の上位・下位関係と
が記述され、新たに登録する登録対象語もここに登録さ
れる。シソーラス辞書1は、従来の装置のシソーラス辞
書と同様の構成である。従って、以下の説明では、従来
の技術の説明で用いた図15に基づいて説明するものと
する。
【0039】〈ディスクリプタ展開テーブル〉図5は、
本発明の第1の実施例のディスクリプタ展開テーブルの
例を示す。ディスクリプタ展開テーブル2は、シソーラ
ス辞書1上にある短単位のディスクリプタ語の列で表し
た情報(以下、ディスクリプタ展開列と呼ぶ)を保存し
ている。例えば、ノード番号15「野菜ジュース」は、
“8”「やさい」と“14”「ジュース」に展開されて
いる。このディスクリプタ展開列は、人手で構築するこ
とも勿論可能であるが、各々の単語に対して、自分より
文字数が少ない語で単語分割し、各々の単語のディスク
リプタ語に置き換えることによって、シソーラス辞書1
から自動構築することが可能である。
【0040】〈登録対象語入力部〉登録対象語入力部3
は、登録対象語を入力する。登録対象語の入力は、キー
ボードで直接入力する構成にしてもよいし、予めファイ
ルに格納した登録対象語を順次入力するような構成であ
ってもよい。
【0041】〈単語分割部〉単語分割部4は、入力され
た登録対象語をシソーラス辞書1に基づいて短単位の語
に分割する。例えば、以下の方法により単語分割が行わ
れる。 (1) 登録対象語の最後の文字からシソーラス辞書1
上にある語と照合を行う。
【0042】(2) シソーラス辞書1上にある語と一
致した文字列を1単語として取り出し、残りの文字列に
ついて(1)、(2)を繰り返す。 (3) 一致する単語が複数ある場合には、文字数が長
い方を単語として取り出す(最長一致)。
【0043】(4) 一致しなければ、残りの文字列を
未知語として纏めて1単語とする。この方法の場合、
「メロン果汁」、「パイン果汁」の単語分割は、各々以
下のようになる。 例1)「メロン果汁」 シソーラス辞書1には、「ジュース」の同義語として登
録された「果汁」が存在する。さらに、「果物」の下位
語として、「メロン」が存在する。このため、「メロン
果汁」は、(メロン25)(果汁21)に分割される。
ここで、単語分割結果は、1単語を()で括り、その単
語の表記とノード番号を記述して表している。
【0044】例2) 「パイン果汁』 シソーラス辞書1には、「果汁」は存在するが、「パイ
ン」に一致する語は存在しないため、この部分「パイ
ン」は未知語となり、(パイン 0)(果汁 21)に
分割される。未知語に関しては、ノード番号“0”で記
述する。
【0045】〈ディスクリプタ展開部〉ディスクリプタ
展開部5は、単語分割部4で分割された語が未知語、即
ち、シソーラス辞書1上にない場合には、これをディス
クリプタ語として扱い、分割された語がシソーラス辞書
1上にある語の場合には、分割された各々の語をディス
クリプタ展開テーブル2を参照して、短単位のディスク
リプタ語の列に変換してディスクリプタ展開列を得る。
【0046】例1) 「メロン果汁」 ディスクリプタ展開テーブル2によれば、(メロン 2
5)のディスクリプタ展開列は(メロン 25)であ
り、(果汁 21)のディスクリプタ展開列は(ジュー
ス14)である。従って、「メロン果汁」のディスクリ
プタ展開列は、(メロン 25)(ジュース 14)と
なる。
【0047】例2) 「パイン果汁」 (パイン 0)の部分はそのままで、(果汁 21)の
部分は「メロン果汁」と同様に(ジュース 14)に変
換され、ディスクリプタ展開列は(パイン 0)(ジュ
ース 14)となる。
【0048】〈手がかり語抽出部〉手がかり語抽出部6
は、登録対象語のディスクリプタ展開列とシソーラス辞
書1上に既に登録されている登録済み語のディスクリプ
タ展開列とを比較し、各々の構成要素のディスクリプタ
語の一致及び上位・下位関係に基づいて、同義語候補、
上位語候補、下位語候補、兄弟語候補として手がかり語
を抽出する。ここでは、以下の条件により、各候補を決
定して手がかり語を抽出する場合について説明する。
【0049】条件1: 登録対象語のディスクリプタ展
開列と同じディスクリプタ展開列を持つ登録済み語を同
義語候補する。 条件2: 登録対象語のディスクリプタ展開列の後方か
らの連続列が、登録済み語のディスクリプタ展開列と一
致する登録済み語を上位語候補とする。
【0050】条件3: 登録対象語のディスクリプタの
展開列が、登録済み語のディスクリプタ展開列の後方か
らの連続列と一致する登録済み語を下位語候補とする。 条件4: 登録対象語のディスクリプタ展開列の後方が
一致し、残りの前方の列が上位関係にある登録済み語を
上位語候補とする。
【0051】条件5: 登録対象語のディスクリプタ展
開列の後方が一致し、残りの前方の列が下位関係にある
登録済み語を下位語候補する。 条件6: 登録対象語のディスクリプタ展開列の後方が
一致し、残りの前方の列が上位・下位関係にない登録済
み語を兄弟語候補とする。
【0052】登録対象語のディスクリプタ列を0
(1),0(2),…,0(no)とし、登録済み語の
ディスクリプタ展開列をA(1),A(2),…,A
(na)とすると、上記の各条件は、以下のように判定
できる。 条件1: no = na かつ A(na−k+1)=0(no−k+1) (k=1,2,…,no) 条件2: no > na かつ A(na−k+1)=0(no−k+1) (k=1,2,…,na) 条件3: no < na かつ A(na−k+1)=0(no−k+1) (k=1,2,…,no) 条件4: A(na−k+1)=0(no−k+1) (k=1,2,…,m) で、1≦m≦na−1 かつ m≦no−1なるmが存
在し、かつ A(na−m)が0(no−m)の上位語 条件5: A(na−k+1)=0(no−k+1) (k=1,2,…,m) で、1≦m≦na−1 かつ m≦no−1なるmが存
在し、かつ A(na−m)が0(no−m)の下位語 条件6: A(na−k)=0(no−k) (k=1,2,…,m−1) で、1≦m≦na−1 かつ m≦no−1なるmが存
在し、かつ A(na−m)が0(no−m)の上位語
でも下位語でもなくかつ A(na−m)≠0(na−
m) これらの条件判定は、シソーラス辞書1にある全ての語
に対して1つ1つ照合を行うことによっても実現できる
が、ディスクリプタ展開列の最右端のディスクリプタ語
(これを主要語と呼び、残りの語を修飾語と呼ぶ)をキ
ーとするインデックステーブル(これを主要語インデッ
クステーブルと呼ぶ)を予め生成しておけば、高速に条
件判定を行うことができる。ここでは、主要語のノード
暗号と同じ主要語のノード番号と、同じ主要語を持つノ
ードのノード番号からなるインデックステーブルを用い
た方法について説明する。
【0053】図6は、本発明の第1の実施例の主要語イ
ンデックステーブルの例を示す。この主用語インデック
ステーブルには、主要語とその主要語をもつ登録済みの
ディスクリプタ語との関係が記述されている。ここで
は、同義語の関係にある語は、同じディスクリプタ展開
列を持つ場合について示しており、この場合には、ディ
スクリプタ語のみを記述すればよく、非ディスクリプタ
語を記述しなくてもよい。
【0054】主要語インデックステーブルを参照して登
録対象語と同じ主用語を持つ語を取り出し、取り出した
語についてのみ条件判定処理を行う。登録対象語が「メ
ロン果汁」の場合には、ディスクリプタ展開列は、 no=2,0(1)=(メロン 25),0(2)=
(ジュース 14) であり、最右端に位置するディスクリプタ語である主要
語(ジュース 14)を持つ語が主要語インデックステ
ーブル2から取り出される。つまり、主要語インデック
ステーブル中の主要語のノード番号“14”に対応する
同じ主要語を『ジュース』を有するノードのノード番号
は“14、15、15、17、18”であるので、この
結果、以下のディスクリプタ語が抽出される。
【0055】(ジュース 14) (野菜ジュース 15) (フルーツジュース16) (アップルジュース17) (ミカンジュース 18) ディスクリプタ展開列は、ディスクリプタ展開テーブル
2から取り出され、各々以下のディスクリプタ展開列を
持つ。 (ジュース 14) na=1, A(1)=(ジュース 14) (野菜ジュース 15): na=2,A(1)=(やさい 8),A(2)=(ジ
ュース 14) (フルーツジュース 16) na=2,A(1)=(果物 3),A(2)=(ジュ
ース 14) (アップルジュース 17) na=2,A(1)=(りんご 6),A(2)=(ジ
ュース 14) (みかんジュース 18) na=2,A(1)=(みかん 7),A(2)=(ジ
ュース 14) 次に、それぞれについて、条件を満足するかの判定を行
う。
【0056】図7は、本発明の第1の実施例の条件判定
処理のフローチャートである。抽出されたディスクリプ
タ語の各々について説明する。但し、登録対象語のディ
スクリプタ展開列を0(1),0(2),…,(no)
とし、登録対象語と主要語が同じ登録済み語をA
(1),A(2),…,A(na)とする。このとき、
A(na)=0(no)である。
【0057】1. (ジュース 14)の場合: (1) 最後尾の修飾語から照合を行う。つまり最後尾
をk=1とする。(ステップ101)。 (2) 次に、1つ前の段に判定の対象を移す。即ち、
k=2(k=k+1)とする(ステップ102)。 (3) 着目中の登録済み語の比較が終了したかを判定
する。na=1であるので、na−k+1=0となり、
ステップ104に移行する(ステップ104)。 (4) 登録対象語の先頭語の比較が終了したかを判定
する。no=2なので、no−k+1=1となり、ステ
ップ110に移行する(ステップ104)。 (5) 上位語候補とする(ステップ110)。
【0058】2.(野菜ジュース 15)の場合: (1) k=1に設定される(ステップ101)。 (2) k=2(k=k+1)とする(ステップ10
2)。 (3) na=2であるので、つまり、着目中の登録済
み語の先頭語の比較は終了していないので、na−k+
1=1となり、ステップ105に移行する(ステップ1
03)。 (4) no=2であるので、登録対象語の先頭単語の
比較は、終了していないので、no−k+1=1とな
り、ステップ106に移行する(ステップ105)。 (5) 短単位のディスクリプタ語が一致しているかを
調べる。A(na−k+1)=A(1)=(やさい
8)であり、0(no−k+P1)=0(1)=(メロ
ン 25)であるので、一致していないため、ステップ
107に移行する(ステップ106)。 (6) (やさい 8)“A(na−k+1)”は、
(メロン 25)“0(no−k+1)の上位語ではな
いので、ステップ108に移行する。 (7) (やさい 8)“A(na−k+1)”は、
(メロン 25)“0(no−k+1)”の下位語では
ないので、ステップ114に移行する。 (8) 兄弟候補とする(ステップ114)。
【0059】3.(フルーツジュース 16)の場合: (1) k=1に設定される(ステップ101)。 (2) k=2とする(ステップ102)。 (3) na=2であるので、na−k+1=1とな
り、ステップ105に移行する(ステップ103)。 (4) no=2であるので、no−k+1=1とな
り、ステップ106に移行する(ステップ105)。 (5) A(na−k+1)=A(1)=(果物 3)
で、 0(no−k+1)=0(1)=(メロン25) であるので、ステップ107に移行する(ステップ10
6)。 (6) (果物 3)は、(メロン 25)の上位語で
あるので、ステップ112に移行する(ステップ10
7)。 (7) 上位語候補とする(ステップ112)。
【0060】4.(アップルジュース 17)の場合:
(野菜ジュース 15)と同様に兄弟語候補となる。 5.(みかんジュース 18)の場合:(野菜ジュース
15)と同様に兄弟語候補となる。
【0061】以上の結果をまとめると「メロン果汁」に
対する手がかり語として以下の語が抽出される。 (ジュース 14) … 上位語候補 (野菜ジュース 15) … 兄弟語候補 (フルーツジュース 16) … 上位語候補 (アップルジュース 17) … 兄弟語候補 (みかんジュース 18) … 兄弟語候補 〈登録候補位置決定部〉登録候補位置決定部7は、同義
語候補、上位語候補、下位語候補、兄弟語候補の手がか
り語から登録候補位置を決定する(図4のステップ10
05)。
【0062】ここで、同じ登録位置になるものは、1つ
に纏める。例えば、語Aが語Bの上位語の場合、語Aが
上位語になる場合と、語Bが兄弟語になる場合は、語A
の下位語として登録する場合であり、同じ登録位置を表
している。ここでは、兄弟語候補は、登録位置が同じと
なる上位候補に以下のように変換する。 「野菜ジュース」 → 「ジュース」 「アップルジュース」 → 「フルーツジュース」 「みかんジュース」 → 「フルーツジュース」 以上から重複を除くと、上位語候補として、「ジュー
ス」と「フルーツジュース」が得られる。登録位置とし
ては、「ジュース」の下位語として登録する候補と「フ
ルーツジュース」の下位語として登録する候補が得られ
る。
【0063】〈登録候補位置表示部〉登録候補位置表示
部8は、登録候補位置決定部7で得られた候補をシソー
ラス上の深さに応じて順位付けして表示する(図4のス
テップ1006)。・「メロン果汁」の場合には、「フ
ルーツジュース」の方が「ジュース」よりシソーラス上
では深い位置にあるので、以下のような候補が出力され
る。
【0064】1位 「フルーツジュース」の下位語 2位 「ジュース」の下位語 ・「りんご果汁」が登録対象語の場合には、同義語候補
の順位が最も高く、以下のように出力される。
【0065】1位 「アップルジュース」の同義語 2位 「フルーツジュース」の下位語 3位 「ジュース」の下位語 ・「パイン果汁」の場合のディスクリプタ展開列は、
(パイン 0)(ジュース 14)となり、未知語を前
方に含む。この例について、手がかり語抽出部6以降で
行われる処理の例について説明する。
【0066】(1) 主要語インデックステーブルから
抽出されるディスクリプタ語は「メロン果汁」と同様
で、以下のディスクリプタ語が抽出される。 (ジュース 14) (野菜ジュース 15) (フルーツジュース 16) (アップルジュース 17) (みかんジュース 18) (2) 手がかり語抽出部6で、以下の候補が手がかり
語として抽出される。
【0067】 (ジュース 14) … 上位語候補 (野菜ジュース 15) … 兄弟語候補 (フルーツジュース 16) … 兄弟語候補 (アップルジュース 17) … 兄弟語候補 (みかんジュース 18) … 兄弟語候補 「メロン果汁」の場合とは、(フルーツジュース 1
6)が兄弟語候補となっている点が異なる。
【0068】(3) 登録候補位置決定部7により、
「ジュース」の下位語として登録する候補と「フルーツ
ジュース」の下位語として登録する候補が得られる。 (4) 登録候補位置表示部8により、以下のように表
示される。 1位 「フルーツジュース」の下位語 2位 「ジュース」の下位語 〈登録位置決定部〉登録位置決定部9は、表示された登
録候補位置の選択肢の中から、利用者に選択させて登録
位置を決定する(図4のステップ1007)。例えば、
登録対象語「メロン果汁」に対して、1位の選択肢が選
択された場合には、登録位置は、「フルーツジュース」
の下位語の位置、即ち、「アップルジュース」や「みか
んジュース」の兄弟語の位置となる。
【0069】〈シソーラス登録部〉シソーラス登録部1
0は、登録対象語をシソーラス辞書1上の決定された登
録位置に保存し、ディスクリプタ展開結果をディスクリ
プタ展開テーブル2へ保存する(図4のステップ100
8)。
【0070】上記の例では、「メロン果汁」を「フルー
ツジュース」の下位語としてノード番号26でシソーラ
ス辞書1に登録し、ディスクリプタ展開テーブル2に
は、26番のレコードが追加され、その展開列は(25
/21)となる。「メロン果汁」の場合には、登録位置
決定部9で1位の “「フルーツジュース」の下位語” が選択されたとすると、「フルーツジュース」の下位語
として、シソーラス辞書1に登録されるのは、「メロン
果汁」の場合と同様であるが、ディスクリプタ展開列に
未知語「パイン」を含んでいるので、ディスクリプタ展
開テーブル2への登録内容が異なる。未知語に対する処
理として、 その文字列をそのまま登録する構成; 元の語の登録位置を利用して、未知語の登録位置を
推定し、推定した場所へ登録してノード番号を割り当て
る構成; シソーラス辞書1上に保留項目ノードを設けてお
き、保留項目ノードの下位語として登録してノード番号
を割り当てる構成; を用いる。
【0071】上記のの構成の場合には、ディスクリプ
タ展開テーブル2へは(“パイン”/21)のように登
録される。ここでは、上記のとの構成を組み合わせ
た場合の処理について説明する。図8は、本発明の第1
の実施例のシソーラス登録処理のフローチャートであ
る。
【0072】ステップ201) シソーラス辞書1上の
指定登録位置へ登録対象語を登録する。 ステップ202) 登録対象語のディスクリプタ展開列
を0(1),0(2),…,0(no)とする。
【0073】ステップ203) 0(1)は未知語かを
判断し、未知語である場合には、ステップ205に移行
し、未知語でない場合には、ステップ204に移行す
る。 ステップ204) ディスクリプタ展開部5で得られた
ディスクリプタ展開列をディスクリプタ展開テーブル2
へ登録する。つまり、0(1),0(2),…,0(n
o)とする。
【0074】ステップ205) シソーラス辞書1とデ
ィスクリプタ展開テーブル2を参照して、登録対象語の
ディスクリプタ展開列を取り出し、それを、A(1),
A(2),…,A(na)とする。 ステップ206) k=1,2,…,no+1の全てに
おいて、 A(na−k+1)=0(no−k+1) である場合には、ステップ208に移行し、 A(na−k+1)≠0(no−k+1) である場合には、ステップ207に移行する。
【0075】ステップ207) 0(1)を保留項目の
下位語として登録し、そのノード番号でディスクリプタ
展開テーブル2へ登録して処理を終了する。 ステップ208) 0(1)をA(na−no+1)の
下位語として登録してよいかを利用者に確認し、登録し
てもよい場合には、ステップ209に移行し、登録して
はならない場合にはステップ207に戻る。
【0076】ステップ209) 0(1)をa(na−
no+1)の下位語として登録し、そのノード番号でデ
ィスクリプタ展開テーブル2へ登録する。 未知語の推定処理は、「主要語が一致しているならば、
上位語の修飾語は、下位語の修飾語の上位である可能性
が高い」という性質を用いる。ここでは、登録した語の
ディスクリプタ展開列の先頭のディスクリプタ語(未知
語)0(1)を修飾語とし、その上位語のディスクリプ
タ展開列の後方からみて同じ位置にあるディスクリプタ
語を修飾語A(na−no+1)とし、修飾語より後方
にある語を主要語とする。「パイン果汁」の場合には、
“パイン”が修飾語であり、「パイン果汁」の上位語で
ある「フルーツジュース」の修飾語は、(果物 3)で
あり、主要語である(ジュース 14)が一致している
(ステップ206)。従って、“果物”は、パインの上
位語である可能性が高い。これを利用者に確認し、登録
位置を決定した(ステップ208)後、“パイン”を
“果物”の下位ノードとしてシソーラス辞書1に登録
し、ノード番号27を得る。そして、「パイン」のディ
スクリプタ展開列として(27)を、「パイン果汁」の
ディスクリプタ展開列として(27/14)をディスク
リプタ展開テーブル2へ登録する(ステップ209)。
以上の処理を登録対象語の各々について行う。
【0077】上記のように本実施例によれば、シソーラ
ス辞書1、ディスクリプタ展開テーブル2、登録対象語
入力部3、単語分割部4、ディスクリプタ展開部5、手
がかり語抽出部6、登録候補位置決定部7、登録候補位
置表示部8、登録位置決定部9及びシソーラス登録部1
0を有し、登録対象語を短単位のディスクリプタ語の列
(ディスクリプタ展開列)へ展開し、登録済み語のディ
スクリプタ展開列と比較して、ディスクリプタ語の一致
や上位・下位関係に基づいて、登録対象語の登録候補位
置を提示し、利用者によりその中から登録を行うために
最適な候補を選択させることで、シソーラス辞書上の適
切な登録位置へ登録することが可能となる。
【0078】[第2の実施例]次に、本発明の第2の実
施例を説明する。図9は、本発明の第2の実施例のシソ
ーラス登録支援装置の構成を示す。図3と同一構成部分
には、同一符号を付し、その説明を省略する。本実施例
では、図3の構成に、支援・マニュアル切り換え部1
1、カレントノード変更部12、シソーラス表示部13
及び登録位置指定部14が付加された構成である。
【0079】図10は、本発明の第2の実施例のシソー
ラス登録支援装置の概要動作を示すフローチャートであ
る。 ステップ2001) 支援/マニュアル切り換え部11
は、支援処理を使用するか、マニュアル登録するかを指
定する。利用者は、任意の時点で指定することが可能で
ある。ここで、“支援”が指定された場合には、ステッ
プ2002に移行する。“マニュアル”が指定された場
合には、ステップ2003に移行する。
【0080】ステップ2002) “支援”が指定され
た場合には、前述の第1の実施例と同様の処理を実施す
る。即ち、登録対象語入力部3の処理の後、単語分割部
4が起動され、登録位置決定部9の処理の後、シソーラ
ス登録部10が起動される。 ステップ2003) “マニュアル”が指定されている
場合には、登録対象語入力部3により、登録対象語の入
力を受け付ける。
【0081】ステップ2004) カレントノードが表
示される。 ステップ2005) 利用者は、表示されたカレントノ
ードを変更するか、登録位置指定部14による自動処理
を行うかを決定する。 ステップ2006) ここで、登録位置指定部14によ
る処理を選択した場合には、ステップ2007に移行す
る。また、カレントノードを変更する処理を選択した場
合には、ステップ2011に移行する。
【0082】ステップ2007) 登録位置指定部14
による処理が選択された場合には、登録位置指定部14
は、登録対象語をカレントノードの同義語して登録する
か、子ノードとして登録するかを利用者が指定できる。 ステップ2008) 現時点が登録位置指定部14によ
る処理が終了した後であれば、ステップ2009に移行
し、登録位置決定部9の処理が終了した後であれば、ス
テップ2013に移行する。
【0083】ステップ2009) 現時点が登録位置指
定部14が起動された後であれば、登録対象語のディス
クリプタ展開部5によるディスクリプタ展開処理は行わ
れていないので、この時点でディスクリプタ展開処理が
行われる。ディスクリプタ展開処理は、単語分割部4、
ディスクリプタ展開部5が起動されて行われ、ディスク
リプタ展開テーブル2へ保存される。
【0084】ステップ2010) 引き続いて、第1の
実施例の図4のフローチャートのステップ1004から
ステップ1008までの処理を行い、ステップ2013
に移行する。 ステップ2011) ステップ2006において、カレ
ントノードの変更が指定された場合には、利用者により
指定されたカレントの周辺のシソーラスを表示し、利用
者は、当該シソーラス表示画面を参照して、カレントノ
ードの移動の指示等を行う。
【0085】ステップ2012) 利用者は、登録対象
語を登録するための所望の登録位置を決定する。 ステップ2013) シソーラス登録部10が起動さ
れ、登録処理によりシソーラス辞書1に登録対象語を登
録する。登録処理は、前述の第1の実施例のステップ1
008と同様の処理を行うものとする。
【0086】また、本実施例は、以下のような処理を選
択することが可能である。 (1) 第1の実施例の支援処理(自動処理)におい
て、登録候補位置が得られなかった場合には、マニュア
ル登録へ移行することができる(上記、ステップ200
1において、マニュアル選択時)。
【0087】(2) 第1の実施例において、1つの登
録対象語に対して支援モードを指定して、登録位置を決
定して登録を行った後に、“マニュアル”モードに移行
して、登録対象語を同じ登録位置であると判断できる登
録対象語を次々に登録することが可能である。
【0088】(3) 登録対象語そのものでは、適切な
登録候補位置が得られなかった場合には、関連する他の
語を登録対象語として、登録候補位置を得て、カレント
ノードを定め、そのカレントノードに基づいて、“マニ
ュアル”モードでその周囲を探索して、登録位置を決定
することが可能である。
【0089】上記のうち、(2)、(3)について具体
例を用いて以下に説明する。 (2)の具体例:「メロン果汁」を“支援”モードで登
録した後、“マニュアル”モードで「パイン果汁」、
「いちご果汁」等を登録する。例えば、図15に示すシ
ソーラス辞書1を用いた場合に、これは、「メロン果
汁」を“支援”モードで登録済みとなっているため、そ
の時点で“マニュアル”モードに切り換えることによ
り、シソーラス表示部13には、当該「メロン果汁」の
カレントノード(フルーツジュース 16)を表示し、
その子ノードに対応する位置を登録位置として、「パイ
ン果汁」、「いちご果汁」等を登録する。
【0090】(3)の具体例:図15のシソーラス辞書
1の例において、「ミルクティー」を登録しようとする
場合、“支援”モードでは登録候補位置が取得できな
い。そこで、登録対象語として、「お茶」と入力する。
すると、「茶」(茶 12)の子ノードが候補として取
得でき、カレントノードが「茶」となる。図15に示す
シソーラスでは、「茶」が終端ノードとなっているが、
「茶」の子ノードとして、「紅茶」、「日本茶」が存在
する場合に、“マニュアル”モードに切り換え、「紅
茶」をカレントノードにして、「ミルクティー」を登録
する。
【0091】このように、本実施例では、第1の実施例
の構成に支援・マニュアル切り換え部11、カレントノ
ード変更部12、シソーラス表示13及び登録位置指定
部14が付加され、登録位置候補を取得した後、マニュ
アルモードで利用者自身がシソーラス辞書1に登録対象
語を登録することが可能となる。
【0092】[第3の実施例]次に、本発明の第3の実
施例を説明する。本実施例は、第1の実施例の構成に評
価値を算出して候補位置を評価値の高い順に表示する機
能を付加したものである。
【0093】図11は、本発明の第3の実施例のシソー
ラス登録支援装置の構成を示す。同図に示すシソーラス
登録支援装置は、シソーラス辞書1、ディスクリプタ展
開テーブル2、登録対象語入力部3、単語分割部4、デ
ィスクリプタ展開部5、手がかり語抽出・評価値算出部
26、登録候補位置決定部27、登録候補位置表示部2
8、登録位置決定部9及びシソーラス登録部10より構
成される。
【0094】図3に示す前述の第1の実施例とは、手が
かり語抽出部6において、各候補の評価値を計算するよ
うに構成した手がかり語抽出・評価値算出部26を用い
て、登録候補位置決定部7において、登録候補位置が重
複する場合には、最大の評価値を使用するように構成し
た登録候補位置決定部27を用いて、登録候補位置表示
部8において、評価値の順に表示する。評価値が同じ場
合には、シソーラス上の深さが深い順に表示するように
構成した登録候補位置表示部28を有する点において異
なる。
【0095】図12は、本発明の第3の実施例のシソー
ラス登録支援装置の概要動作を示すフローチャートであ
る。 ステップ3001) 登録対象語入力部3は、登録対象
語の入力を受け付け、単語分割部4に入力する。
【0096】ステップ3002) 単語分割部4は、シ
ソーラス辞書1を参照して、登録対象語を単語に分解す
る。 ステップ3003) ディスクリプタ展開部5は、ディ
スクリプタ展開テーブル2を参照して、短単位(分割さ
れた単語の単位)のディスクリプタ語列で表す。未知語
部分に関しては、それ自身をディスクリプタ語と見做
す。
【0097】ステップ3004) 手がかり語抽出・評
価値算出部26は、登録対象語のディスクリプタ展開列
の各要素とシソーラス辞書1上の登録済み語のディスク
リプタ展開列の各要素とを比較し、同義語候補、上位語
候補、下位語候補、兄弟語候補となる手がかり語をシソ
ーラス辞書1から抽出すると共に、評価値を算出する。
【0098】ステップ3005) 登録候補位置決定部
27は、同義語候補、上位語候補、下位語候補、兄弟語
候補の手がかり語から登録候補位置を決定する。登録候
補位置が重複する場合には、最大の評価値を使用する。 ステップ3006) 登録候補位置表示部28は、登録
候補位置を評価値の順に表示し、評価値が同じ場合に
は、シソーラス上の深さに応じて順位付けして表示す
る。
【0099】ステップ3007) 登録位置決定部9
は、表示された登録候補位置を、利用者に選択させ、登
録位置を決定する。 ステップ3008) シソーラス登録部10は、シソー
ラス辞書1上の決定された登録位置に登録対象語を登録
する。
【0100】ステップ3009) 全ての登録対象語の
処理が終わるまで、上記の一連の処理を繰り返す。 上記のフローチャートにおいて、第1の実施例の図4の
処理に評価値算出の処理が付加されている点が異なる。
【0101】図13は、本発明の第3の実施例の手がか
り語抽出・評価値算出部の条件判定及び評価値算出処理
のフローチャートである。同図において、登録対象語の
ディスクリプタ展開列を0(1),0(2),…,0
(no)とする。また、登録対象語と主要語が同じ登録
済み語をA(1),A(2),…,A(na)とする。
このとき、A(na)=0(no)であるものとする。
【0102】ステップ301) ディスクリプタ展開列
の最後尾の修飾語から照合を行う。k=1とする。 ステップ302) k=k+1とし、ディスクリプタ展
開列上の1つ前の語へ移る。
【0103】ステップ303) 着目中の登録済み語の
先頭語の比較が終了したか(na−k+1=0?)を調
べ、終了した場合には、ステップ304に移行する。比
較が終了していない場合にはステップ305に移行す
る。 ステップ304) 登録対象語の先頭語の比較が終わっ
たか(no−k+1=0?)を調べ、比較が終了したら
(no−k+1=0)ステップ309に移行し、終了し
ていない場合(no−k+1≠0)には、ステップ31
0に移行する。
【0104】ステップ305) ステップ303におい
て、na−k+1≠0であれば、登録対象語の先頭語の
比較が終了したか(na−k+1=0?)を調べ、終了
している場合(no−k+1=0)には、ステップ31
1に移行し、終了していない場合(no−k+1≠0)
には、ステップ306に移行する。
【0105】ステップ306) 短単位のディスクリプ
タ語が一致しているか(A(na−k+1)=0(no
−k+1)?)を調べ、一致している場合には、ステッ
プ302に移行し、一致していない場合(A(na−k
+1)≠0(no−k+1))にはステップ307に移
行する。
【0106】ステップ307) A(na−k+1)が
0(no−k+1)のn(=1,2,3)段上の上位語
であるかを判断して、上位語である場合には、ステップ
312に移行し、該当しない場合にはステップ308に
移行する。 ステップ308) A(na−k+1)が0(no−k
+1)のn(=1,2,3)段上の下位語であるかを判
断し、下位語である場合にはステップ313に移行し、
該当しない場合には、ステップ314に移行する。
【0107】ステップ309) 同義語候補とし、評価
値を0.9とする。 ステップ310) 上位語候補とし、評価値を0.5/
(no−k+1)とする。 ステップ311) 下位語候補とし、評価値を0.5/
(no−k+1)とする。
【0108】ステップ312) 上位語候補とし、評価
値を(0.8のn乗)/(no−k+1)とする。 ステップ313) 下位語候補とし、評価値を(0.8
のn乗)/(no−k+1)とする。
【0109】ステップ314) 兄弟語候補とし、評価
値を0.5/(no−k+1)とする。 このように、上記の図13に示すフローチャートにおい
て、第1の実施例の図7と比較して、評価値算出処理
(ステップ309〜ステップ314)と、n段上下の上
位語、下位語を検査する処理(ステップ307〜ステッ
プ308)が異なる。
【0110】上記のフローチャートを具体例と共に説明
する。 (1) ステップ309において、同義語候補の場合、
評価値は0.9となり、ディスクリプタ展開が全て一致
するという厳しい条件であるので、より可能性が高いと
判断し、高い評価値を与えている。
【0111】(2) ステップ310の上位語候補の場
合は、評価値として0.5/(no−k+1)を与えて
いる。この場合は、主要語のみが一致しているので、比
較的低い評価値を与えている。なお、(no−k+1)
は、登録対象語のディスクリプタ展開列の要素の個数か
ら後方から一致したディスクリプタ語の個数を除いた数
であり、これで割っているのは、判定に寄与しなかった
要素の数が少ないほど評価値を高くするためである。
【0112】(3) ステップ311の下位語候補の場
合は、ステップ310と同様である。 (4) ステップ312の上位語候補の場合は、0.8
n /(no−k+1)を評価値として与えている。n乗
の部分は、段数が離れるほど評価値を低くするためであ
る。
【0113】(5) ステップ313の下位語候補の場
合は、ステップ312と同様である。 (6) ステップ314の兄弟語候補の場合は、0.5
/(no−k+1)を評価値として与えている。
【0114】以下に具体的にシソーラス辞書1に登録対
象語として、「トマトジュース」を登録する例を説明す
る。 (1) 単語分割部4で、(トマト 9)(ジュース
14)の分割結果が得られる。
【0115】(2) ディスクリプタ展開部5で、(ト
マト 9)(ジュース 14)が得られる。 (3) 手がかり語抽出・評価部26において、 (3−1) 主要語インデックステーブルを用いて以下
の語が抽出される。
【0116】(ジュース 14) (野菜ジュース 15) (フルーツジュース 16) (アップルジュース 17) (みかんジュース 18) (3−2) 図13のフローに従って、 (ジュース 14):no=2,na=2,k=2で、
ステップ310が起動され、上位語候補として、評価値
0.5が得られる。
【0117】(野菜ジュース 15):no=2,na
=2,k=2,n=1で、ステップ312が起動され、
上位語候補として評価値0.8が得られる。 (フルーツジュース 16):no=2,na=2,k
=2で、ステップ314が起動され、兄弟語候補として
評価値0.5が得られる。
【0118】(アップルジュース 17):no=2,
na=2,k=2でステップ314が起動され、兄弟語
候補として評価値0.5が得られる。 (みかんジュース 18):no=2,na=2,k=
2で、ステップ314が起動され、兄弟語候補として評
価値0.5が得られる。
【0119】(4) 登録候補位置決定部27におい
て、兄弟語候補を以下のように上位語候補に変換する。 (フルーツジュース 16) → (ジュース 14) 評価値0.5 (アップルジュース 17) → (フルーツジュース 16) 評価値0.5 (みかんジュース 18) → (フルーツジュース 16) 評価値0・5 その結果、以下の登録候補位置が決定される。
【0120】 (ジュース 14) 上位語候補 評価値0.5 (野菜ジュース 15) 上位語候補 評価値0.8 (フルーツジュース 16) 上位語候補 評価値0.5 (5) 登録候補位置表示部28では以下ように表示さ
れる。
【0121】 1位 評価値0.8 「野菜ジュース」の下位語 2位 評価値0.5 「フルーツジュース」の下位語 3位 評価値0.5 「ジュース」の下位語 第1の実施例の場合には、「アップルジュース」や「み
かんジュース」が兄弟語候補、即ち、「フルーツジュー
ス」が上位語候補で、「野菜ジュース」が上位語候補と
なるが、この2つはシソーラス上の階層の深さが同じな
ので、同位順位として扱われる。これに対して、本実施
例では、上記のように表示される。
【0122】このように本実施例では、第1の実施例に
比べて評価値算出の時間を必要とするが、評価値を有す
ることにより、より適切な候補順位で表示される。な
お、本発明は、上記の実施例に限定されることなく、特
許請求の範囲内で種々変更・応用が可能である。
【0123】
【発明の効果】上述のように、本発明によれば、登録対
象語を短単位のディスクリプタ語の列(ディスクリプタ
展開列)へ展開し、登録済み語のディスクリプタ展開列
とを比較して、ディスクリプタ語の一致や、上位・下位
関係に基づいて登録対象語の登録候補位置を提示し、利
用者は、それを選択することにより、シソーラス辞書上
へ登録できる。このため、大規模なシソーラスであって
も人手で上位・下位関係を辿って登録位置を探す労力が
削減されるため、従来に比べて簡単にシソーラスの構築
が可能となる。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の原理を説明するためのフローチャート
である。
【図3】本発明の第1の実施例のシソーラス登録支援装
置の構成図である。
【図4】本発明の第1の実施例のシソーラス登録支援装
置の概要動作を示すフローチャートである。
【図5】本発明の第1の実施例のディスクリプタ展開テ
ーブルの例を示す図である。
【図6】本発明の第1の実施例の主要語インデックステ
ーブルの例を示す図である。
【図7】本発明の第1の実施例の条件判定処理のフロー
チャートである。
【図8】本発明の第1の実施例のシソーラス登録処理の
フローチャートである。
【図9】本発明の第2の実施例のシソーラス登録支援装
置の構成図である。
【図10】本発明の第2の実施例のシソーラス登録支援
装置の概要動作を示すフローチャートである。
【図11】本発明の第3の実施例のシソーラス登録支援
装置の構成図である。
【図12】本発明の第3の実施例のシソーラス登録支援
装置の概要動作を示す図である。
【図13】本発明の第3の実施例の手がかり語抽出・評
価値算出部の条件判定及び評価値算出処理のフローチャ
ートである。
【図14】従来のシソーラス辞書登録装置の構成図であ
る。
【図15】シソーラス辞書の例を示す図である。
【符号の説明】
1 シソーラス辞書 2 ディスクリプタ展開テーブル 3 登録対象入力部 4 単語分割部 5 ディスクリプタ展開部 6 手がかり語抽出部 7 登録候補位置決定部 8 登録候補位置表示部 9 登録位置決定部 10 シソーラス登録部 11 支援/マニュアル切り換え部 12 カレントノード変更部 13 シソーラス表示部 14 登録位置指定部 26 手がかり語抽出・評価値算出部 27 登録候補位置決定部 28 登録候補位置表示部 100 登録候補位置抽出手段 200 登録手段

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 上位語と下位語の関係、及び同義語関係
    を記述したシソーラス辞書に、入力された登録対象語を
    登録するための支援を行うシソーラス登録支援装置にお
    いて、 登録対象語と登録済み語とを単語分割して得られる各単
    位語の意味的一致や上位・下位関係に基づいて登録候補
    位置の手がかりとなる語を抽出する登録候補位置抽出手
    段と、 前記手がかりとなる語を構成する単語のシソーラス辞書
    上の位置関係により登録位置を決定し、前記登録対象語
    を前記シソーラス辞書の該登録位置に登録する登録手段
    とを有することを特徴とするシソーラス登録支援装置。
  2. 【請求項2】 前記登録候補位置抽出手段は、 前記シソーラス辞書上の各々の語を短単位のディスクリ
    プタ語の列で表したディスクリプタ展開テーブルと、 前記登録対象語を前記シソーラス辞書を参照して短単位
    の語に分割する単語分割手段と、 分割された単語が前記シソーラス辞書上に存在しない場
    合には、該分割された語をディスクリプタ語とし、該分
    割された語が前記シソーラス辞書上に存在する場合に
    は、前記ディスクリプタ展開テーブルを参照して、該分
    割された語を短単位のディスクリプタ語の列に変換して
    ディスクリプタ展開列を生成するディスクリプタ展開手
    段と、 前記登録対象語のディスクリプタ展開列と、既に前記デ
    ィスクリプタ展開テーブルに登録されている登録済みの
    ディスクリプタ展開列を比較して、各々の構成要素のデ
    ィスクリプタ語の一致及び、上位・下位関係に基づいて
    同義語候補、上位語候補、下位語候補、兄弟語候補とし
    て抽出する手がかり語抽出手段とを有する請求項1記載
    のシソーラス登録支援装置。
  3. 【請求項3】 前記登録手段は、 前記手がかり語抽出手段で抽出された前記各候補から前
    記シソーラス辞書上の登録候補位置を抽出する登録位置
    候補抽出手段と、 前記登録位置候補抽出手段で得られた登録候補位置を前
    記シソーラス辞書上の階層の深さに応じて順位付けして
    表示する登録候補位置表示手段と、 前記登録候補位置表示手段により表示された登録候補位
    置を利用者に選択させることにより登録位置を決定する
    登録位置決定手段と、 前記登録位置決定手段により決定された前記シソーラス
    辞書の登録位置に、前記登録対象語を登録し、前記ディ
    スクリプタ展開手段で生成された前記ディスクリプタ展
    開列を前記ディスクリプタ展開テーブルへ格納するシソ
    ーラス登録手段とを有する請求項1記載のシソーラス登
    録支援装置。
  4. 【請求項4】 前記登録候補位置抽出手段は、 前記シソーラス辞書上の各々の語を短単位のディスクリ
    プタ語の列で表したディスクリプタ展開テーブルと、 前記登録対象語を前記シソーラス辞書を参照して短単位
    の語に分割する単語分割手段と、 分割された単語が前記シソーラス辞書上に存在しない場
    合には、該分割された単語をディスクリプタ語とし、該
    分割された単語が前記シソーラス辞書上に存在する場合
    には、前記ディスクリプタ展開テーブルを参照して、短
    単位のディスクリプタ語の列に変換してディスクリプタ
    展開列を生成するディスクリプタ展開手段と、 前記登録対象語のディスクリプタ展開列と、既に前記デ
    ィスクリプタ展開テーブルに登録されている登録済みの
    ディスクリプタ展開列を比較して、各々の構成要素のデ
    ィスクリプタ語の一致及び、上位・下位関係に基づいて
    同義語候補、上位語候補、下位語候補、兄弟語候補を抽
    出し、該各候補の評価値を算出する手がかり語抽出・評
    価値算出手段とを有する請求項1記載のシソーラス登録
    支援装置。
  5. 【請求項5】 前記登録手段は、 前記手がかり語抽出・評価値算出手段で抽出された前記
    各候補から前記シソーラス辞書上の登録候補位置を抽出
    する登録位置候補抽出手段と、 前記登録位置候補抽出手段で得られた登録候補位置を前
    記評価値の順に表示し、前記評価値が同じ場合には、前
    記シソーラス辞書上の深さに応じて順位付けして表示す
    る登録候補位置表示手段と、 前記登録候補位置表示手段により表示された登録候補位
    置を利用者に選択させることにより登録位置を決定する
    登録位置決定手段と、 前記登録位置決定手段により決定された前記シソーラス
    辞書上の前記登録位置に、前記登録対象語を登録し、前
    記ディスクリプタ展開手段で生成された前記ディスクリ
    プタ展開列を前記ディスクリプタ展開テーブルへ格納す
    るシソーラス登録手段とを有する請求項1及び4記載の
    シソーラス登録支援装置。
  6. 【請求項6】 前記登録手段において、 前記シソーラス登録手段は、 前記登録位置決定手段により前記シソーラス辞書への登
    録位置が決定した後、操作モードを自動支援モードから
    マニュアルモードに切り換えて、該登録位置に登録でき
    る登録対象語を登録するマニュアル登録手段を更に有す
    る請求項3又は5記載のシソーラス登録支援装置。
  7. 【請求項7】 前記登録手段において、 前記登録位置決定手段は、 入力された前記登録対象語で登録位置が決定されなかっ
    た場合に、操作モードを自動支援モードからマニュアル
    モードに切り換えて、関連する他の語を登録対象語に変
    更して、登録候補位置を再度取得・表示して、表示され
    た登録候補位置のカレントノードの周囲を探索して、登
    録位置を決定するマニュアル登録位置決定手段を更に有
    する請求項3又は5記載のシソーラス登録支援装置。
  8. 【請求項8】 登録対象語が入力されると、上位語と下
    位語の関係、及び同義語関係を記述したシソーラス辞書
    に、該登録辞書を登録するための支援を行うシソーラス
    登録支援方法において、 登録対象語と登録済み語とを単語分割して得られる各単
    位語の意味的一致や上位・下位関係に基づいて登録候補
    位置の手がかりとなる語を抽出し、 前記手がかりとなる語を構成する単語の前記シソーラス
    辞書上の位置関係により登録候補位置を出力し、 利用者により選択された前記シソーラス辞書上の登録候
    補位置の位置に、前記登録対象語を登録することを特徴
    とするシソーラス登録支援方法。
  9. 【請求項9】 前記登録候補位置の手がかりとなる語を
    抽出する際に、 入力された前記登録対象語を、前記シソーラス辞書に基
    づいて短単位の語に分割し、 分割された語が前記シソーラス辞書上に存在しない場合
    にはディスクリプタ語とし、存在する場合には、前記シ
    ソーラス辞書上の語をディスクリプタ語の列で表現した
    第1のディスクリプタ展開列からなるディスクリプタ展
    開テーブルを参照して分割された語を、ディスクリプタ
    語の列に変換して、第2のディスクリプタ展開列を生成
    し、 前記第2のディスクリプタ展開列と前記第1のディスク
    リプタ展開列とを比較し、各々の構成要素のディスクリ
    プタ語の一致及び、上位・下位関係に基づいて同義語候
    補、上位語候補、下位語候補、兄弟語候補として、手が
    かり語を抽出する請求項8記載のシソーラス登録支援方
    法。
  10. 【請求項10】 前記登録対象語を登録する際に、 前記手がかり語から前記シソーラス辞書上の登録候補位
    置を抽出し、 前記登録候補位置を前記シソーラス辞書上の階層の深さ
    に応じて順位を付与して表示し、 前記シソーラス辞書上の利用者に選択された登録候補位
    置の位置に前記登録対象語を登録し、 前記第2のディスクリプタ展開列を前記ディスクリプタ
    展開テーブルに格納する請求項8及び9記載のシソーラ
    ス登録支援方法。
  11. 【請求項11】 前記登録対象語を登録する際に、 前記登録候補位置毎に評価値を計算し、 前記登録候補位置が重複する場合には、評価値が最大の
    登録候補位置を選択し、 前記登録候補位置を表示する際には、前記評価値の大き
    い順に表示し、前記評価値が同じ場合には、前記シソー
    ラス辞書上の深さが深い順に表示する請求項10記載の
    シソーラス登録支援方法。
  12. 【請求項12】 前記登録対象語を登録する際に、 前記シソーラス辞書への登録位置が決定した後、操作モ
    ードを自動支援モードからマニュアルモードに切り換え
    て、該登録位置に登録できる登録対象語を登録する請求
    項10記載のシソーラス登録支援方法。
  13. 【請求項13】 前記登録対象語を登録する際に、 入力された前記登録対象語で登録位置が決定されなかっ
    た場合に、操作モードを自動支援モードからマニュアル
    モードに切り換えて、関連する他の語を登録対象語に変
    更して、登録候補位置を再度取得・表示して、表示され
    た登録候補位置のカレントノードの周囲を探索して、登
    録位置を決定する請求項10記載のシソーラス登録支援
    方法。
JP7026955A 1995-02-15 1995-02-15 シソーラス登録支援装置及びシソーラス登録支援方法 Pending JPH08221427A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7026955A JPH08221427A (ja) 1995-02-15 1995-02-15 シソーラス登録支援装置及びシソーラス登録支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7026955A JPH08221427A (ja) 1995-02-15 1995-02-15 シソーラス登録支援装置及びシソーラス登録支援方法

Publications (1)

Publication Number Publication Date
JPH08221427A true JPH08221427A (ja) 1996-08-30

Family

ID=12207585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7026955A Pending JPH08221427A (ja) 1995-02-15 1995-02-15 シソーラス登録支援装置及びシソーラス登録支援方法

Country Status (1)

Country Link
JP (1) JPH08221427A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100308011B1 (ko) * 1998-06-09 2001-11-14 구자홍 시소러스컴파일방법
CN104462063A (zh) * 2014-12-12 2015-03-25 武汉大学 基于语义位置模型的位置信息结构化提取方法及系统
US20210349888A1 (en) * 2020-05-11 2021-11-11 Dropbox, Inc. Personalized Spelling Correction

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100308011B1 (ko) * 1998-06-09 2001-11-14 구자홍 시소러스컴파일방법
CN104462063A (zh) * 2014-12-12 2015-03-25 武汉大学 基于语义位置模型的位置信息结构化提取方法及系统
CN104462063B (zh) * 2014-12-12 2016-08-17 武汉大学 基于语义位置模型的位置信息结构化提取方法及系统
US20210349888A1 (en) * 2020-05-11 2021-11-11 Dropbox, Inc. Personalized Spelling Correction

Similar Documents

Publication Publication Date Title
JP2000082067A (ja) 文書検索装置および文書検索方法
JPH06309362A (ja) 情報検索方法
JP3178421B2 (ja) テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体
CN112765977B (zh) 一种基于跨语言数据增强的分词方法及装置
JPH10134042A (ja) ハイパーテキスト構造における地図表示装置
US7937411B2 (en) Finite-state machine augmented for multiple evaluations of text
JPH08221427A (ja) シソーラス登録支援装置及びシソーラス登録支援方法
JP6305630B2 (ja) 文書検索装置、方法及びプログラム
JP2004220081A (ja) 形状モデル簡略化装置
JP2007164727A (ja) 料理レシピの検索表示システム
JPH09319767A (ja) 類義語辞書登録方法
JP2004046438A (ja) テキスト検索方法及び装置及びテキスト検索プログラム及びテキスト検索プログラムを格納した記憶媒体
JP5505028B2 (ja) 翻訳支援装置、方法及びプログラム
JPH03286371A (ja) 文書情報検索装置
JPH11224254A (ja) 事例検索システム及び事例検索方法
JP3240364B2 (ja) 辞書検索方法および辞書検索装置
JP2019153056A (ja) 情報処理装置、及び情報処理プログラム
JP2019008477A (ja) 判別プログラム、判別装置及び判別方法
JP3444223B2 (ja) データベース登録装置
JP2002342373A (ja) 文書検索方法、装置、プログラム、同プログラムを記録した記録媒体
JPH08249356A (ja) データベース検索システム
US20030110451A1 (en) Practical chinese classification input method
JPH08137841A (ja) 文書処理装置及び方法
JP2003178057A (ja) フレーズ生成装置、フレーズ生成方法、及びプログラム
JP2006184951A (ja) ネーミング発想支援装置及び方法、プログラム、記憶媒体、並びにネーミング発想支援システム