JP2000163433A - 同意語登録管理システム - Google Patents

同意語登録管理システム

Info

Publication number
JP2000163433A
JP2000163433A JP10336756A JP33675698A JP2000163433A JP 2000163433 A JP2000163433 A JP 2000163433A JP 10336756 A JP10336756 A JP 10336756A JP 33675698 A JP33675698 A JP 33675698A JP 2000163433 A JP2000163433 A JP 2000163433A
Authority
JP
Japan
Prior art keywords
synonym
synonyms
level
user
identification level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10336756A
Other languages
English (en)
Inventor
Haruyoshi Kitaguchi
治義 北口
Kenji Takenaga
憲治 竹永
Hiroshi Okawa
浩志 大川
Tatsuto Araki
達人 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JFE Engineering Corp
Original Assignee
NKK Corp
Nippon Kokan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NKK Corp, Nippon Kokan Ltd filed Critical NKK Corp
Priority to JP10336756A priority Critical patent/JP2000163433A/ja
Publication of JP2000163433A publication Critical patent/JP2000163433A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 初心者とともに熟練者にも使いやすく、ネッ
トワークでの情報共有化を損なわずに利用者による同意
語の登録ができるシステムを提供する。 【解決手段】 キーワードおよびそれに対応する同意語
を蓄積する同意語データベース2と、同意語をデータベ
ース2に登録する同意語登録手段3と、同意語を抽出す
る同意語抽出手段5とを備え、同意語データベース2
は、同意語の範囲を限定する情報として識別レベルを蓄
積し、同意語登録手段3は、登録する同意語に対して前
記識別レベルを付与する機能4を有し、同意語抽出手段
5は、同意語について付与されている識別レベルと、情
報検索の行われている状況に基づき決定される識別レベ
ルとを比較判定する機能6を有し、その比較判定の結果
を用いて限定された同意語を抽出することを特徴とする
同意語登録管理システム。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、同意語辞書によ
る同意語の抽出および登録・改廃の作業を支援するため
の同意語登録管理システムに関する。
【0002】
【従来の技術】一般に、同意語辞書の登録・改廃の作業
は、検索に使用するキーワードが専門用語に偏ってお
り、業務経験が未熟な新人には使用しづらい。そこで、
この作業を自動化するためのいくつかの技術が提案され
ている。
【0003】例えば、特開平2−82354号公報に
は、シソーラス変換手段を用いて、類語等の検索語を自
動生成する検索戦略作成方式が提案されている。このシ
ソーラス変換手段としては、入力された自然言語につい
て、同義語を求める同義シソーラス、上位・下位、全体
・部分、類似概念等の関係を用いて検索語を求める概念
シソーラス、得られた複数の検索語から最適な検索語を
求める複合シソーラスを用いている。
【0004】この技術では、これらのシソーラスを必要
に応じて使い分けて、検索戦略を作成している。ここ
で、同義シソーラスにない入力語が入力された場合は、
登録機能により受け付ける。登録機能では、類義語入力
により入力された類義語が、登録可能であるか判別して
登録する。
【0005】また、特開平6−208589号公報に
は、光ディスク等の電子ファイリング装置の検索におい
て検索指定語に対して、かな漢字・英字・数字等の表記
(コード体系)の異なる同義語を参照して、検索指定語
を増やす異表記展開の方法が提案されている。
【0006】この技術では、コード体系ごとに同義語辞
書を持つのではなく、複数のコード体系に属する同義語
を1つのコード体系にまとめている。従って、各コード
体系ごとに同義語辞書を持つ場合と比べて、辞書容量の
削減、保守管理の容易化が図れるというものである。
【0007】特開平6−266770号公報には、検索
入力の際の読みを利用して、同義語を生成する検索装置
が提案されている。これは、かな漢字変換を用いた検索
入力の際、読みを入力することを利用しており、変換後
の検索語とその読みとの組合せにより、同義語を絞り込
む技術である。
【0008】またこの技術は、かな漢字変換ソフトの代
わりに、自動翻訳ソフトを用いた場合も、原語と訳語と
の組合せにより、かな漢字変換ソフトの場合と同様、同
義語を絞り込むこともできる。さらに、同義語辞書とは
別に、利用者別あるいは文書別の同義語辞書を作成し、
利用することもできるとしている。
【0009】
【発明が解決しようとする課題】しかし、これらの従来
技術では、同義語の登録、およびネットワークでの情報
共有化の観点から、次のような問題点がある。
【0010】特開平2−82354号公報記載の技術で
は、登録機能により、登録可能であるか判別して登録す
ると記載されている。しかしこの登録可能の判別につい
ては、その実現方法について何ら開示されていない。同
義語として適当かどうかを判断するには、その判断のた
めの別の判断資料が必要であり、これは結局新たな同義
語辞書を必要とするということである。もし、この判別
が利用者の判断に任されるならば、単独で使用する場合
はともかく、ネットワークでの使用、即ち複数の利用者
による使用には耐えないシステムとなる。
【0011】特開平6−208589号公報記載の技術
では、同義語の登録については何ら触れられていない。
またこの技術では、同義語を1つのコード体系にまとめ
て辞書容量の削減、および保守管理の容易化を図るとい
うものであるが、これは必ずしも正しくない。例えば、
通常のコードは1バイト文字(英数字)で表現される
が、これを自然言語(かな漢字)と同じ体系に合せる
と、2バイト文字で表現することになり容量が倍増す
る。
【0012】さらに、同義語辞書のレコードフォーマッ
トが固定長の場合、必要なフィールド長さは、コードだ
けであればコード長さと等しい長さでよく、効率的に格
納できるが、自然言語と同じ体系の場合は、通常のコー
ド長さの数倍の長さのフィールドを使うことになり、容
量が大幅に増加する。従って、これらを1つのコード体
系にまとめることが、果たして辞書容量の削減に繋がる
かどうか甚だ疑問である。
【0013】また、この技術による同義語辞書は、種
別、種別コード、型式、その他、属性の異なる内容を含
むことになる。このような雑多な内容から構成されるコ
ード体系が、保守管理において管理し易いとは考え難
い。
【0014】特開平−266770号公報記載の技術で
は、かな漢字変換等の変換後の語句とその入力文字列と
の組合せにより、同義語を絞り込むという点に特色があ
る。しかし、同義語登録に関しては、同義語辞書とは別
に利用者別あるいは文書別の同義語辞書を利用できる、
と記載されているのみである。このことは、あくまでも
システム機器を共同利用できるということに過ぎず、む
しろ、情報の共有化には逆行するという問題がある。
【0015】また、以上の従来技術では、初心者への配
慮は殆どなされていない。いずれの技術においても、検
索語を入力すると、利用者の習熟度に関係なく同義語の
候補のリストが表示される。この場合、同義語の候補が
少ないと、初心者にとっては適切な同義語が見つからな
い。反対に、同義語の候補を増やすと、熟練者にとって
は不要な同義語の候補が出て来て煩わしい。このよう
に、従来技術においては、初心者と熟練者の双方にとっ
て使い易くすることは困難という問題があった。
【0016】この発明は、これらの問題点を解決し、初
心者への配慮をするとともに熟練者にとっても使いやす
く、ネットワークでの情報共有化を損なわずに利用者に
よる同意語の登録ができる、同意語登録管理システムを
提供することを目的とする。
【0017】
【課題を解決するための手段】この発明は、キーワード
およびそれに対応する同意語を蓄積する同意語データベ
ースと、同意語を前記同意語データベースに登録する同
意語登録手段と、与えられたキーワードに対応する同意
語を抽出する同意語抽出手段とを備えた同意語登録管理
システムであって、(イ)同意語データベースは、キー
ワードに対応する個々の同意語について、同意語の範囲
を限定する情報として識別レベルを蓄積し、(ロ)同意
語登録手段は、前記データベースに登録する同意語に対
して前記識別レベルを付与する機能を有しており、
(ハ)同意語抽出手段は、抽出した同意語について付与
されている識別レベルと、情報検索の行われている状況
に基づき決定される識別レベルとを比較判定する機能を
有し、その比較判定の結果を用いて限定された同意語を
抽出することを特徴とする同意語登録管理システムであ
る。
【0018】この発明では、データベースに登録される
同意語には、識別レベルを付与しているので、この識別
レベルにより1つのキーワードに対する同意語の範囲を
限定し、同意語の抽出数を制限することができる。この
場合、識別レベルの範囲は、情報検索の行われる状況に
より決定される。ここで、情報検索の行われる状況と
は、情報検索の行われる環境や前提条件等、検索内容以
外の関連情報であり、情報検索の利用者、目的、対象、
その他必要に応じて選択することができる。
【0019】例えば、情報検索の行われる状況として利
用者情報を用いれば、検索作業の習熟度(スキルレベ
ル)、所属部署、役職等の管理レベルなどがある。ま
た、作業内容を用いれば、情報検索を行う目的、情報検
索の要求元(報告書等の種類)などがある。これらの情
報検索の行われる状況に対して、識別レベルの範囲を予
め決めておけば、利用者あるいは作業内容により、所定
の範囲の同意語のみを抽出することが可能となる。
【0020】利用者情報による識別レベルは、スキルレ
ベル(初級〜上級)、所属(部門、部、室、チーム)、
専門分野(大分類、中分類、小分類)等、目的に応じて
種々設定することができる。例えば、習熟度の向上に伴
い同意語の抽出範囲を絞り、また所属や専門分野の細分
化に伴い同意語の抽出範囲を絞る。作業内容による識別
レベルは、検索対象(データベースの種類)、検索目的
(参照、傾向調査、統計データ作成)、検索の精度(ノ
イズや漏れの大小)、報告方法・提出先等の検索結果の
扱い(報告書の種類)、その他種々の観点から設定でき
る。
【0021】このようにこの発明では、データベースの
同意語に識別レベルを付与することにより、利用者ある
いは作業内容等、情報検索の行われる状況に応じて適切
な範囲の同意語を抽出することができる。また、識別レ
ベルで同意語の範囲を管理することにより、同意語デー
タベース(同意語辞書)を個人別、文書別に作成する必
要がなくなる。
【0022】特に、利用者のスキルレベル等の利用者情
報に連動させて識別レベルを付与すれば、スキルレベル
の低い利用者により登録された同意語は、スキルレベル
の高い利用者には抽出されないように設定できる。従っ
て、同意語の登録作業を利用者に開放することが可能と
なり、初心者から熟練者まで使いやすいシステムを構築
できる。その結果、同意語データベースをサーバ等で一
括管理できるので、ネットワークでの情報共有化の推進
にも効果的である。
【0023】
【発明の実施の形態】発明の実施の形態の1例を図1に
示す。同意語登録管理システム1は、情報検索システム
7から、あるキーワードに対して同意語抽出の要求があ
ると、同意語抽出手段5に同意語データベース2の検索
を指示する。同意語抽出手段5は、データベース2を検
索して同意語を抽出する。
【0024】次いで、識別レベルを比較判定する機能、
即ち識別レベル比較判定手段6が、抽出された同意語に
付与されている識別レベルと、基準となる識別レベルと
を比較判定する。前述のように、基準の識別レベルは、
情報検索の行われている状況に基づき決められる。識別
レベル比較判定手段6の判定により、その同意語が基準
の識別レベルを満たしていれば、同意語抽出手段5は、
そのデータを情報検索システム7に送信する。情報検索
システム7では、そのデータを検索するキーワードの同
意語として、情報検索対象となるデータベース8の検索
に用いる。
【0025】同意語登録手段3は、同意語が抽出されな
い場合や抽出された同意語が不適切あるいは数が少ない
場合、同意語を入力して登録するための手段である。登
録の際、この発明では、識別レベルを付与する機能によ
り、個々の同意語に識別レベルを付与するが、識別レベ
ル付与手段4はそのために設けられている。ここでは、
利用者情報その他を識別情報に変換して、個々の同意語
に付与している。
【0026】ここで、同意語データベース2に蓄積され
ているレコードの1例を図2に示す。この例では、キー
ワードおよび同意語とともに、識別レベルが同一レコー
ドに格納されており、個々の同意語に対して識別レベル
が対応付けられている。その他、使用頻度、ID(レコ
ード番号)等のフィールドは、通常の辞書データベース
と同様、必要に応じて設ければ良い。
【0027】次にこのシステムを用いて、同意語の登録
等を行う手順のフロー図を図3に示す。ここでは、利用
者情報により識別レベルを設定する場合について説明す
る。まず、ステップS1で、検索するキーワードを入力
する。
【0028】ステップS2では、利用者情報を、入力あ
るいは選択により設定する。次に、ステップS3では、
設定された利用者情報に基づき、検索するキーワードに
識別レベルを付加する。識別レベルとしては、利用者の
その分野における知識等を表すレベル(以下、スキルレ
ベルとよぶ)等を用いることができる。
【0029】ステップS4では、入力されたキーワード
に対して、同意語を検索する。ここでは、検索された同
意語の中から、ステップS3で付加された識別レベルに
より、同意語を抽出する。例えば、「熱延」というキー
ワードに対して検索された同意語の中で、「Hot」、
「熱延」のスキルレベルが8、「熱間圧延」が同6、
「圧延」が同3の場合については、利用者のスキルレベ
ルにより次のようになる。
【0030】例えば、利用者のスキルレベルが5であれ
ば、これらの同意語の中でスキルレベルが利用者のスキ
ルレベルより低い同意語「圧延」は、同意語として表示
しない。利用者のスキルレベルがこれより高く、例えば
7であれば、スキルレベルが利用者より低い同意語「熱
間圧延」が表示されず、表示される同意語としては、
「Hot」、「熱延」が残る。
【0031】ステップS5で該当する同意語の有無を判
定し、無かった場合はステップS9にジャンプする。ス
テップS6では同意語を使用頻度順にソートし、ステッ
プS7で同意語が選択されると、ステップS8で同意語
の使用頻度の更新処理を行う。この更新処理の際、同意
語のスキルレベルの更新を行うことも可能であり、その
詳細を後述する。
【0032】ステップS9では、同意語の追加入力の有
無を利用者に問い合わせる。追加入力が無い場合は、ス
テップS13にジャンプし、検索を実行する。ステップ
S10で同意語が追加入力されると、ステップS11で
はその同意語に利用者情報を付加する。ステップS12
では、その同意語が同意語辞書に既に登録されているか
否かを判定し、登録されていなければ登録を行う。その
後、ステップS9に戻り、ステップS10〜S12の処
理を繰返す。
【0033】ここまでのステップで、既にあるいは新規
にデータベースに登録された同意語が抽出される。ステ
ップS13では、以上の結果抽出された同意語を、検索
用のキーワードとして、検索を実行する。この登録処理
の際についても、同意語のスキルレベルの更新を行うこ
とが可能であり、その詳細を後述する。
【0034】ステップS8の同意語の使用頻度の更新処
理の際、同意語のスキルレベルを更新する場合につい
て、図4に示す。ここでは、まずステップS21で同意
語が選択されたかどうかを判断し、次の2つの場合に分
けて処理を行う。
【0035】同意語が選択された場合(第1の場合)
は、さらにステップS22でスキルレベルの比較を行
う。利用者のスキルレベルが選択された同意語のスキル
レベルより高い場合は、次のステップS23で、その同
意語のスキルレベルを、利用者のスキルレベルと同じレ
ベルに更新する。利用者のスキルレベルが選択された同
意語のスキルレベルと同じか低い場合は、このステップ
S23をスキップする。その後、S24で、その同意語
の使用頻度を更新(1回分加算)し、この処理(ステッ
プS8)を終了する。
【0036】これとは逆に、同意語として選択されなか
った場合(第2の場合)は、今度はステップS25でス
キルレベルの比較を行う。利用者のスキルレベルが同意
語のスキルレベルより低い場合は、次のステップS26
で、その同意語のスキルレベルを、利用者のスキルレベ
ルと同じレベルに更新する。利用者のスキルレベルが同
意語のスキルレベルと同じか高い場合は、このステップ
S26をスキップし、この処理(ステップS8)を終了
する。
【0037】ステップS12の同意語辞書への登録処理
の際、同意語のスキルレベルを更新する場合について、
図5に示す。ここでは、まずステップS31でキーワー
ドが同意語辞書に未登録かどうかを判断し、次の2つの
場合に分けて処理を行う。
【0038】キーワードが同意語辞書に未登録の場合
(第1の場合)は、ステップS32でそのキーワードの
スキルレベルを、利用者のスキルレベルと同じレベルに
設定する。その後、S33で、そのキーワードを同意語
として同意語辞書に登録し、この処理(ステップS1
2)を終了する。
【0039】これとは逆に、キーワードが同意語辞書に
登録済の場合(第2の場合)は、今度はステップS34
でスキルレベルの比較を行う。利用者のスキルレベルが
その同意語(ここではキーワードに同じ)のスキルレベ
ルより高い場合は、次のステップS35で、その同意語
のスキルレベルを、利用者のスキルレベルと同じレベル
に更新する。利用者のスキルレベルが同意語のスキルレ
ベルと同じか低い場合は、このステップS35をスキッ
プし、この処理(ステップS12)を終了する。
【0040】
【発明の効果】この発明では、データベースの同意語に
識別レベルを付与することにより、状況に応じて適切な
範囲の同意語を抽出することができる。また、識別レベ
ルで同意語の範囲を管理することにより、同意語データ
ベースを個人別、文書別に作成する必要がなくなる。ま
た、利用者のスキルレベルに応じて同意語が抽出される
ように設定できるので、同意語の登録作業を利用者に開
放することが可能となる。さらに、同意語データベース
をサーバ等で一括管理できるので、ネットワークでの情
報共有化の推進にも効果的である。
【図面の簡単な説明】
【図1】実施の形態の1例を示すブロック図である。
【図2】同意語データベースのレコード構造の1例を示
す図である。
【図3】発明の1実施例を示すフロー図である。
【図4】同意語の使用頻度の更新処理の詳細を示すフロ
ー図である。
【図5】同意語辞書への登録処理の詳細を示すフロー図
である。
【符号の説明】
1 同意語登録管理システム1 2 同意語データベース 3 同意語登録手段 4 識別レベル付与手段 5 同意語抽出手段 6 識別レベル比較判定手段 7 情報検索システム 8 データベース(情報検索対象)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 大川 浩志 東京都千代田区丸の内一丁目1番2号 日 本鋼管株式会社内 (72)発明者 荒木 達人 東京都千代田区丸の内一丁目1番2号 日 本鋼管株式会社内 Fターム(参考) 5B075 ND03 ND24 NK02 NK25 NK54 PP03 PP12 PP22 PQ46 PR04

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 キーワードおよびそれに対応する同意語
    を蓄積する同意語データベースと、同意語を前記同意語
    データベースに登録する同意語登録手段と、与えられた
    キーワードに対応する同意語を抽出する同意語抽出手段
    とを備えた同意語登録管理システムであって、(イ)同
    意語データベースは、キーワードに対応する個々の同意
    語について、同意語の範囲を限定する情報として識別レ
    ベルを蓄積し、(ロ)同意語登録手段は、前記データベ
    ースに登録する同意語に対して前記識別レベルを付与す
    る機能を有しており、(ハ)同意語抽出手段は、抽出し
    た同意語について付与されている識別レベルと、情報検
    索の行われている状況に基づき決定される識別レベルと
    を比較判定する機能を有し、その比較判定の結果を用い
    て限定された同意語を抽出することを特徴とする同意語
    登録管理システム。
JP10336756A 1998-11-27 1998-11-27 同意語登録管理システム Pending JP2000163433A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10336756A JP2000163433A (ja) 1998-11-27 1998-11-27 同意語登録管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10336756A JP2000163433A (ja) 1998-11-27 1998-11-27 同意語登録管理システム

Publications (1)

Publication Number Publication Date
JP2000163433A true JP2000163433A (ja) 2000-06-16

Family

ID=18302433

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10336756A Pending JP2000163433A (ja) 1998-11-27 1998-11-27 同意語登録管理システム

Country Status (1)

Country Link
JP (1) JP2000163433A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010015354A (ja) * 2008-07-03 2010-01-21 Konica Minolta Medical & Graphic Inc データベースシステム
WO2019167281A1 (ja) * 2018-03-02 2019-09-06 富士通株式会社 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010015354A (ja) * 2008-07-03 2010-01-21 Konica Minolta Medical & Graphic Inc データベースシステム
WO2019167281A1 (ja) * 2018-03-02 2019-09-06 富士通株式会社 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム
JPWO2019167281A1 (ja) * 2018-03-02 2020-12-03 富士通株式会社 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム

Similar Documents

Publication Publication Date Title
JP2832988B2 (ja) データ検索システム
US20060095426A1 (en) System and method for creating document abstract
JPH11203294A (ja) 情報検索システム、装置、方法及び記録媒体
JPH09218881A (ja) 追加検索語候補提示方法、文書検索方法およびそれらの装置
US20030055819A1 (en) Information retrieving method
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
JP2002230037A (ja) 検索システム、方法及びプログラム
JP4185399B2 (ja) 顧客データ管理装置、顧客データ管理方法および顧客データ管理用プログラムならびに顧客データ管理用プログラムを格納した記録媒体
JPH0773197A (ja) 異表記語辞書作成支援装置
JP2000163433A (ja) 同意語登録管理システム
JPH11231998A (ja) ヘルプ表示装置及びヘルプ表示プログラムを記録した媒体
JPH06325091A (ja) 類似度評価型データベース検索装置
JPH03286371A (ja) 文書情報検索装置
JPS63228326A (ja) キ−ワ−ド自動抽出方式
JP2001067378A (ja) 文字列類似度算出方法、装置及び記録媒体
JP2002117043A (ja) 文書検索装置、文書検索方法およびその方法を実施するためのプログラムを記録した記録媒体
JPH07210565A (ja) 情報検索方法及び装置
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JP2008203997A (ja) 文書検索装置及びプログラム
JP2000076254A (ja) キーワード抽出装置、このキーワード抽出装置を用いた類似文献検索装置、キーワード抽出方法及び記録媒体
JP4105301B2 (ja) データ検索システム及び方法並びにプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0844750A (ja) 文書検索装置及び同装置に適用される検索結果の異文献判別方法
JPH07296005A (ja) 日本語テキスト登録・検索装置
JP2002366567A (ja) 代替キーワードのフリー設定による検索システム
JPH0934897A (ja) 図書管理システム