JPH08287080A - 関連語辞書作成装置 - Google Patents
関連語辞書作成装置Info
- Publication number
- JPH08287080A JPH08287080A JP7109135A JP10913595A JPH08287080A JP H08287080 A JPH08287080 A JP H08287080A JP 7109135 A JP7109135 A JP 7109135A JP 10913595 A JP10913595 A JP 10913595A JP H08287080 A JPH08287080 A JP H08287080A
- Authority
- JP
- Japan
- Prior art keywords
- record
- notation
- word
- storage means
- definition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】関連語辞書を、比較的高速に、効率的に作成す
る関連語辞書作成装置を提供すること。 【構成】一般的な編集装置で定義可能な形式を持つ関連
語定義情報記憶手段の内容から、関連語情報設定手段に
より、関連語辞書を作成する。関連語辞書は、複数のレ
コードからなり、各レコードは、見出し語情報と他の見
出し語のレコードへのリンク情報を有している。ある見
出し語に対する関連語は、リンク情報によるリンクによ
って定義される。関連語情報設定手段は、関連語定義情
報記憶手段の各関連語定義情報からその要素である語と
要素間の関係を表す情報を抽出し、各語を見出し語情報
として関連語辞書記憶手段のレコードに設定し、前記要
素間の関係を表す定義情報に応じてリンクを設定する。
る関連語辞書作成装置を提供すること。 【構成】一般的な編集装置で定義可能な形式を持つ関連
語定義情報記憶手段の内容から、関連語情報設定手段に
より、関連語辞書を作成する。関連語辞書は、複数のレ
コードからなり、各レコードは、見出し語情報と他の見
出し語のレコードへのリンク情報を有している。ある見
出し語に対する関連語は、リンク情報によるリンクによ
って定義される。関連語情報設定手段は、関連語定義情
報記憶手段の各関連語定義情報からその要素である語と
要素間の関係を表す情報を抽出し、各語を見出し語情報
として関連語辞書記憶手段のレコードに設定し、前記要
素間の関係を表す定義情報に応じてリンクを設定する。
Description
【0001】
【産業上の利用分野】本発明は、大量のデータを登録し
て検索するデータベースシステムにおける関連語辞書装
置にかかわり、特に1対多の関係を有する関連語(同義
語、上位語、下位語)をコンパクトに格納可能な関連語
辞書作成装置および表記方法の違いによる検索漏れをな
くすのに適した関連語辞書作成装置に関する。
て検索するデータベースシステムにおける関連語辞書装
置にかかわり、特に1対多の関係を有する関連語(同義
語、上位語、下位語)をコンパクトに格納可能な関連語
辞書作成装置および表記方法の違いによる検索漏れをな
くすのに適した関連語辞書作成装置に関する。
【0002】
【従来の技術】データベースのテキスト情報の登録と検
索において、ユーザが入力する検索文字列と検索される
テキスト中の文字列との差異を吸収するために、語と語
の関係(例えば、同義関係、上位下位関係)を保持した
関連語辞書が用いられている。関連語どうしの関係は、
通常1対多の関係にある。
索において、ユーザが入力する検索文字列と検索される
テキスト中の文字列との差異を吸収するために、語と語
の関係(例えば、同義関係、上位下位関係)を保持した
関連語辞書が用いられている。関連語どうしの関係は、
通常1対多の関係にある。
【0003】この語と語の関係は、意味上の関係を反映
したシソーラスとして定められる場合もあるが、ユーザ
や検索システムの要望に応じて自由に作られるケースも
ある。その概念的な内容例を図2に示す。図2の例にお
いて、「=」で始まる行中の単語は、それらが同義語で
あることを意味する。「>」で始まる行中の2単語は、
前の単語が後ろの単語の上位語であることを意味する。
「<」で始まる行中の2単語は、前の単語が後ろの単語
の単語の下位語であることを意味する。
したシソーラスとして定められる場合もあるが、ユーザ
や検索システムの要望に応じて自由に作られるケースも
ある。その概念的な内容例を図2に示す。図2の例にお
いて、「=」で始まる行中の単語は、それらが同義語で
あることを意味する。「>」で始まる行中の2単語は、
前の単語が後ろの単語の上位語であることを意味する。
「<」で始まる行中の2単語は、前の単語が後ろの単語
の単語の下位語であることを意味する。
【0004】従来の関連語辞書において、ある表記の語
とある語の表記とを対応づけて登録し、検索する技術と
して、従来より次のような技術が知られている。
とある語の表記とを対応づけて登録し、検索する技術と
して、従来より次のような技術が知られている。
【0005】例えば、特開平3−172967公報で
は、検索語とシソーラスへのアドレスを示したポインタ
テーブルを参照して見出し語のポインタを得て、取得さ
れたポインタによってシソーラスファイルを検索して検
索語の上位語、下位語、同義語を得て、これらを表示す
る装置が開示されている。
は、検索語とシソーラスへのアドレスを示したポインタ
テーブルを参照して見出し語のポインタを得て、取得さ
れたポインタによってシソーラスファイルを検索して検
索語の上位語、下位語、同義語を得て、これらを表示す
る装置が開示されている。
【0006】また、例えば、特開平3−15980公報
では、変換ルールによる異表記の展開、同義語の展開を
組み合せた異表記および同義語展開方法が開示されてい
る。変換ルールとしては、「新旧字体、カタカナ表記、
ローマ字といった」文字列を展開するもの、アルファベ
ット文字列を3種類の記法のいずれか一つに展開するも
のがある。同義語の展開では、同義語辞書を参照してい
る。その同義語辞書は、他の語との関係はそれらの語の
レコード番号で指定し、同義語の数だけそのレコード番
号を指定するものである。
では、変換ルールによる異表記の展開、同義語の展開を
組み合せた異表記および同義語展開方法が開示されてい
る。変換ルールとしては、「新旧字体、カタカナ表記、
ローマ字といった」文字列を展開するもの、アルファベ
ット文字列を3種類の記法のいずれか一つに展開するも
のがある。同義語の展開では、同義語辞書を参照してい
る。その同義語辞書は、他の語との関係はそれらの語の
レコード番号で指定し、同義語の数だけそのレコード番
号を指定するものである。
【0007】しかしながら、上記した従来技術(特開平
3−172967公報)の装置では、ポインタテーブル
とシソーラスファイルに見出し語の表記が重複して出現
するので、辞書サイズが大きくなるという問題がある。
また、カタカナ・英数字等表記の一部がばらつく表記も
検索漏れをなくするためにはすべて同義語として登録し
なければならないといった問題がある。
3−172967公報)の装置では、ポインタテーブル
とシソーラスファイルに見出し語の表記が重複して出現
するので、辞書サイズが大きくなるという問題がある。
また、カタカナ・英数字等表記の一部がばらつく表記も
検索漏れをなくするためにはすべて同義語として登録し
なければならないといった問題がある。
【0008】また、従来技術(特開平3−15980公
報)の展開方法では、異表記に展開して辞書を参照する
ので辞書の検索回数が増えるという問題がある。また、
関連語の関係を関連語の数だけレコード番号を指定する
ので、レコードが可変長になり、関連語が複数・膨大に
なるとレコード番号も複数・膨大になるといったサイズ
上の問題がある。
報)の展開方法では、異表記に展開して辞書を参照する
ので辞書の検索回数が増えるという問題がある。また、
関連語の関係を関連語の数だけレコード番号を指定する
ので、レコードが可変長になり、関連語が複数・膨大に
なるとレコード番号も複数・膨大になるといったサイズ
上の問題がある。
【0009】本発明者らは、上記従来技術の問題を解決
するための関連語辞書装置を先の出願(特願平6−23
8579号「関連語辞書装置」)により提案した。その
発明の基本的な構成は、「検索文字列を入力する入力手
段と、複数のレコードからなり、その各レコードは1つ
の見出し語情報とその見出し語情報に関連する他の見出
し語情報を持つレコードへのリンク情報を1つ有するも
のであり、前記リンク情報によるレコード間のリンクに
よって関連語が定義された関連語辞書を記憶する関連語
辞書記憶手段と、前記関連語辞書記憶手段に対して、前
記入力手段により入力された検索文字列と一致する見出
し語を持つレコードを検索する検索手段と、前記検索手
段の検索の結果得られたレコードのリンク情報に基づい
てリンク関係にあるレコードを抽出する抽出手段と、前
記抽出手段により抽出したレコードの見出し語を前記入
力手段により入力され検索文字列の関連語として出力す
る出力手段とを備えたことを特徴とする関連語辞書装
置」である。
するための関連語辞書装置を先の出願(特願平6−23
8579号「関連語辞書装置」)により提案した。その
発明の基本的な構成は、「検索文字列を入力する入力手
段と、複数のレコードからなり、その各レコードは1つ
の見出し語情報とその見出し語情報に関連する他の見出
し語情報を持つレコードへのリンク情報を1つ有するも
のであり、前記リンク情報によるレコード間のリンクに
よって関連語が定義された関連語辞書を記憶する関連語
辞書記憶手段と、前記関連語辞書記憶手段に対して、前
記入力手段により入力された検索文字列と一致する見出
し語を持つレコードを検索する検索手段と、前記検索手
段の検索の結果得られたレコードのリンク情報に基づい
てリンク関係にあるレコードを抽出する抽出手段と、前
記抽出手段により抽出したレコードの見出し語を前記入
力手段により入力され検索文字列の関連語として出力す
る出力手段とを備えたことを特徴とする関連語辞書装
置」である。
【0010】
【発明が解決しようとする課題】本発明は、上記先の出
願の関連語辞書装置の関連語辞書に類する関連語辞書を
作成するための関連語辞書作成装置を提供することを目
的とするものである。また、関連語辞書を、比較的高速
に、効率的に作成する関連語辞書作成装置を提供するこ
とを目的とする。
願の関連語辞書装置の関連語辞書に類する関連語辞書を
作成するための関連語辞書作成装置を提供することを目
的とするものである。また、関連語辞書を、比較的高速
に、効率的に作成する関連語辞書作成装置を提供するこ
とを目的とする。
【0011】
【課題を解決するための手段】本発明(請求項1)は、
関連する語の集合とその要素間の関係を示す関連語の定
義情報を記憶する関連語定義情報記憶手段(関連語マス
ター記憶手段)と、複数のレコードからなり、その各レ
コードは1つの見出し語情報とその見出し語情報に関連
する他の見出し語情報を持つレコードへのリンク情報を
1つ有するものであり、前記リンク情報によるレコード
間のリンクによって関連語が定義された関連語辞書を記
憶する関連語辞書記憶手段と、前記関連語定義情報記憶
手段から1つずつ定義情報を読み込み、定義情報中の各
語に対して見出し語の表記を関連語辞書記憶手段のレコ
ードの見出しに設定し、さらに要素間の関係が同義関係
のものに対しては閉環連鎖となるようにリンク情報を設
定し、要素間の関係が上位下位関係のものに対しては上
位方向のリンク情報を設定する関連語情報設定手段とを
備えたものである。
関連する語の集合とその要素間の関係を示す関連語の定
義情報を記憶する関連語定義情報記憶手段(関連語マス
ター記憶手段)と、複数のレコードからなり、その各レ
コードは1つの見出し語情報とその見出し語情報に関連
する他の見出し語情報を持つレコードへのリンク情報を
1つ有するものであり、前記リンク情報によるレコード
間のリンクによって関連語が定義された関連語辞書を記
憶する関連語辞書記憶手段と、前記関連語定義情報記憶
手段から1つずつ定義情報を読み込み、定義情報中の各
語に対して見出し語の表記を関連語辞書記憶手段のレコ
ードの見出しに設定し、さらに要素間の関係が同義関係
のものに対しては閉環連鎖となるようにリンク情報を設
定し、要素間の関係が上位下位関係のものに対しては上
位方向のリンク情報を設定する関連語情報設定手段とを
備えたものである。
【0012】また、本発明(請求項2)は、前記構成に
おいて、前記関連語辞書記憶手段中のレコードを見出し
でソートし、ソート前のリンク情報をソート後のものに
付け替えるソート手段をさらに備え、関連語辞書記憶手
段中のレコードを見出しでソートすることを特徴とす
る。
おいて、前記関連語辞書記憶手段中のレコードを見出し
でソートし、ソート前のリンク情報をソート後のものに
付け替えるソート手段をさらに備え、関連語辞書記憶手
段中のレコードを見出しでソートすることを特徴とす
る。
【0013】また、本発明(請求項3)は、前記構成に
おいて、与えられた文字列の表記を標準表記に変換する
標準表記手段と、標準表記の見出しと前記関連語辞書記
憶手段のレコードの対応を保持したインデックス手段
と、をさらに備え、関連語辞書記憶手段の見出しを標準
表記に変換し標準表記とレコードの対応関係をインデッ
クス手段に保持することを特徴とする。
おいて、与えられた文字列の表記を標準表記に変換する
標準表記手段と、標準表記の見出しと前記関連語辞書記
憶手段のレコードの対応を保持したインデックス手段
と、をさらに備え、関連語辞書記憶手段の見出しを標準
表記に変換し標準表記とレコードの対応関係をインデッ
クス手段に保持することを特徴とする。
【0014】また、本発明(請求項4)は、次の構成要
素を備えたものである。 (1)関連する語の集合とその要素間の関係を示す関連
語の定義情報を記憶する関連語定義情報記憶手段。 (2)下記の表記記憶手段aと定義体記憶手段bとを備
えた関連語辞書記憶手段。 a.複数の見出し語の表記を記憶する表記記憶手段。 b.複数の固定長のレコードからなり、その各レコード
は1つの見出し語の表記を指示する表記指示子と、その
見出し語と同義の他の見出し語に関するレコードを1つ
だけ指示する同義語指示子とその見出し語に対して上位
の他の見出し語のレコードを1つだけ指示する上位語指
示子を含み、複数のレコードの同義語指示子による指示
関係の閉環連鎖によって見出し語の同義関係が定義され
た定義体と複数のレコードの上位語指示子による指示関
係の連鎖によって見出し語の上位下位関係が定義された
定義体を記憶する定義体記憶手段。 (3)複数のレコードからなり、その各レコードは、見
出し語の表記とレコード番号と同義語指示子と上位語指
示子を有する作業用記憶手段。 (4)前記関連語定義情報記憶手段から関連語定義情報
を一つずつ読み込み、その関連語定義情報中の各語に対
して見出し語の表記とレコード番号を前記作業用記憶手
段のレコードに設定し、さらに要素間の関係が同義関係
のものに対しては閉環連鎖となるように同義語指示子に
レコード番号を設定し、要素間の関係が上位下位関係の
ものに対しては下位語のレコードの上位語指示子に上位
語のレコードの番号を設定する関連語情報設定手段。 (5)前記作業用記憶手段のレコードの表記を前記表記
記憶手段に重複なく登録し、前記表記記憶手段における
表記の位置を示す表記指示子と同義語指示子と上位語指
示子とを定義体記憶手段に登録する登録手段。
素を備えたものである。 (1)関連する語の集合とその要素間の関係を示す関連
語の定義情報を記憶する関連語定義情報記憶手段。 (2)下記の表記記憶手段aと定義体記憶手段bとを備
えた関連語辞書記憶手段。 a.複数の見出し語の表記を記憶する表記記憶手段。 b.複数の固定長のレコードからなり、その各レコード
は1つの見出し語の表記を指示する表記指示子と、その
見出し語と同義の他の見出し語に関するレコードを1つ
だけ指示する同義語指示子とその見出し語に対して上位
の他の見出し語のレコードを1つだけ指示する上位語指
示子を含み、複数のレコードの同義語指示子による指示
関係の閉環連鎖によって見出し語の同義関係が定義され
た定義体と複数のレコードの上位語指示子による指示関
係の連鎖によって見出し語の上位下位関係が定義された
定義体を記憶する定義体記憶手段。 (3)複数のレコードからなり、その各レコードは、見
出し語の表記とレコード番号と同義語指示子と上位語指
示子を有する作業用記憶手段。 (4)前記関連語定義情報記憶手段から関連語定義情報
を一つずつ読み込み、その関連語定義情報中の各語に対
して見出し語の表記とレコード番号を前記作業用記憶手
段のレコードに設定し、さらに要素間の関係が同義関係
のものに対しては閉環連鎖となるように同義語指示子に
レコード番号を設定し、要素間の関係が上位下位関係の
ものに対しては下位語のレコードの上位語指示子に上位
語のレコードの番号を設定する関連語情報設定手段。 (5)前記作業用記憶手段のレコードの表記を前記表記
記憶手段に重複なく登録し、前記表記記憶手段における
表記の位置を示す表記指示子と同義語指示子と上位語指
示子とを定義体記憶手段に登録する登録手段。
【0015】また、本発明(請求項5)は、前記構成に
おいて、前記作業用記憶手段中のレコードを見出しでソ
ートし、ソート前の指示子をソート後のものに付け替え
るソート手段をさらに備え、ソート手段にソートした前
記作業用記憶手段のレコードの内容を前記登録手段によ
り登録することを特徴とする。
おいて、前記作業用記憶手段中のレコードを見出しでソ
ートし、ソート前の指示子をソート後のものに付け替え
るソート手段をさらに備え、ソート手段にソートした前
記作業用記憶手段のレコードの内容を前記登録手段によ
り登録することを特徴とする。
【0016】また、本発明(請求項6)は、前記構成に
おいて、前記定義体記憶手段は表記指示子と同義語指示
子のみを含み、前記登録手段は表記指示子と同義語指示
子を定義体記憶手段に登録することを特徴とする。
おいて、前記定義体記憶手段は表記指示子と同義語指示
子のみを含み、前記登録手段は表記指示子と同義語指示
子を定義体記憶手段に登録することを特徴とする。
【0017】また、本発明(請求項7)は、前記構成に
おいて、前記定義体記憶手段は表記指示子と上位語指示
子のみを含み、前記登録手段は表記指示子と上位語指示
子を定義体記憶手段に登録することを特徴とする。
おいて、前記定義体記憶手段は表記指示子と上位語指示
子のみを含み、前記登録手段は表記指示子と上位語指示
子を定義体記憶手段に登録することを特徴とする。
【0018】また、本発明(請求項8)は、前記構成に
おいて、与えられた文字列の表記を標準表記に変換する
標準表記手段と、標準表記の見出しと定義体記憶手段の
レコードの対応を保持したインデックス手段をさらに備
え、前記定義体記憶手段の表記指示子が指示する表記を
標準表記に変換した標準表記と前記定義体記憶手段のレ
コードの対応関係を前記インデックス手段に保持するこ
とを特徴とする。
おいて、与えられた文字列の表記を標準表記に変換する
標準表記手段と、標準表記の見出しと定義体記憶手段の
レコードの対応を保持したインデックス手段をさらに備
え、前記定義体記憶手段の表記指示子が指示する表記を
標準表記に変換した標準表記と前記定義体記憶手段のレ
コードの対応関係を前記インデックス手段に保持するこ
とを特徴とする。
【0019】
【作用】本発明(請求項1)は、一般的な編集装置で定
義可能な形式を持つ関連語定義情報記憶手段の内容か
ら、関連語情報設定手段により、コンパクトで検索に適
した関連語辞書記憶手段に記憶される関連語辞書を作成
する。関連語辞書は、複数のレコードからなっている。
各レコードは、見出し語情報と他の見出し語のレコード
へのリンク情報を有している。ある見出し語に対する関
連語は、リンク情報によるリンクによって定義される。
例えば、関連語のタイプが同義の場合、同義である各語
は関連語マスター記憶手段では「=」で始まる行に列挙
され、関連語辞書記憶手段では、同義である各語はそれ
ぞれ一つのレコードに対応し、それらの一つのレコード
はリンク情報として同義を保持した他の一つのレコード
へのリンク情報を有し、そのレコードにはさらに他の一
つのレコードへのリンク情報が設定されている。図4の
例においてレコード番号1、2、14のレコードの見出
し語は同義語であり、それらは同義語のレコードのフィ
ールドによって次の同義語を順次指定する。このリンク
構造によって定義されていることになる。関連語情報設
定手段は、関連語定義情報記憶手段の各関連語定義情報
からその要素である語と要素間の関係を表す情報を抽出
し、各語を見出し語情報として関連語辞書記憶手段のレ
コードに設定し、前記要素間の関係を表す情報に応じて
関連語の関連の関係を他のレコードへのリンクによって
表すような関連語辞書を生成する。本発明によれば、関
連語辞書作成のために用意する関連語定義情報は、一般
的な編集装置で容易に作成可能な形式でよく、また関連
語辞書の構造が従来技術のような見出し語の表記を重複
して格納する無駄のないものであるので、比較的高速に
関連語辞書を自動作成することができる。
義可能な形式を持つ関連語定義情報記憶手段の内容か
ら、関連語情報設定手段により、コンパクトで検索に適
した関連語辞書記憶手段に記憶される関連語辞書を作成
する。関連語辞書は、複数のレコードからなっている。
各レコードは、見出し語情報と他の見出し語のレコード
へのリンク情報を有している。ある見出し語に対する関
連語は、リンク情報によるリンクによって定義される。
例えば、関連語のタイプが同義の場合、同義である各語
は関連語マスター記憶手段では「=」で始まる行に列挙
され、関連語辞書記憶手段では、同義である各語はそれ
ぞれ一つのレコードに対応し、それらの一つのレコード
はリンク情報として同義を保持した他の一つのレコード
へのリンク情報を有し、そのレコードにはさらに他の一
つのレコードへのリンク情報が設定されている。図4の
例においてレコード番号1、2、14のレコードの見出
し語は同義語であり、それらは同義語のレコードのフィ
ールドによって次の同義語を順次指定する。このリンク
構造によって定義されていることになる。関連語情報設
定手段は、関連語定義情報記憶手段の各関連語定義情報
からその要素である語と要素間の関係を表す情報を抽出
し、各語を見出し語情報として関連語辞書記憶手段のレ
コードに設定し、前記要素間の関係を表す情報に応じて
関連語の関連の関係を他のレコードへのリンクによって
表すような関連語辞書を生成する。本発明によれば、関
連語辞書作成のために用意する関連語定義情報は、一般
的な編集装置で容易に作成可能な形式でよく、また関連
語辞書の構造が従来技術のような見出し語の表記を重複
して格納する無駄のないものであるので、比較的高速に
関連語辞書を自動作成することができる。
【0020】また、レコードに保持する見出し語情報は
直接にその表記を保持しても、あるいは見出し語の表記
を記憶した記憶部へのポインタを保持し間接的に指示す
るものであってもよい。間接的に指示するようにした場
合(請求項4、請求項6、請求項7)には、後述するよ
うに関連語辞書のレコードを固定長にして辞書をさらに
簡潔に構成することが可能となる。本発明は、そのよう
な関連語辞書を容易に自動作成することができる。
直接にその表記を保持しても、あるいは見出し語の表記
を記憶した記憶部へのポインタを保持し間接的に指示す
るものであってもよい。間接的に指示するようにした場
合(請求項4、請求項6、請求項7)には、後述するよ
うに関連語辞書のレコードを固定長にして辞書をさらに
簡潔に構成することが可能となる。本発明は、そのよう
な関連語辞書を容易に自動作成することができる。
【0021】また、標準表記手段インデックス手段を設
けた本発明の態様(請求項3、請求項8)において、標
準表記手段は、英数字やカタカナなどの表記方法にばら
つきがあるものから標準的な一つの表記を生成する。イ
ンデックス手段は標準表記を見出しにして、この標準表
記に変換される見出しを持つレコードの番号が格納され
ている。検索時には、検索文字列を標準表記に変換して
得られた標準表記をもとにインデックス手段を検索し、
関連語のレコード番号を得る。従って、表記方法にばら
つきがあっても、それを標準表記に変換し、検索するの
で、漏れのない検索を行うことができる。本発明は、そ
のような関連語辞書を容易に自動作成することができ
る。
けた本発明の態様(請求項3、請求項8)において、標
準表記手段は、英数字やカタカナなどの表記方法にばら
つきがあるものから標準的な一つの表記を生成する。イ
ンデックス手段は標準表記を見出しにして、この標準表
記に変換される見出しを持つレコードの番号が格納され
ている。検索時には、検索文字列を標準表記に変換して
得られた標準表記をもとにインデックス手段を検索し、
関連語のレコード番号を得る。従って、表記方法にばら
つきがあっても、それを標準表記に変換し、検索するの
で、漏れのない検索を行うことができる。本発明は、そ
のような関連語辞書を容易に自動作成することができ
る。
【0022】本発明(請求項2、請求項5)は、関連語
のレコードを見出しでソートすることにより二分探索を
可能にする配置にレコードを並びかえる。関連語のレコ
ードがソートされていない場合の検索は逐次探索とな
り、その逐次探索の計算量(時間)は、比較回数に比例
する。レコードの総数をnとすると、計算量はO(n)
になる。二分探索では、1回の探索するたびに探索の対
象となるレコードの個数は半分になるので、たかだかl
og2n回の比較で探索は完了する。このように関連語
のレコードを見出しによりソートすることにより該当す
る見出しを持つレコードを検索する時間を短縮すること
ができるので、本発明は、関連語辞書の作成を高速に行
うことができる。
のレコードを見出しでソートすることにより二分探索を
可能にする配置にレコードを並びかえる。関連語のレコ
ードがソートされていない場合の検索は逐次探索とな
り、その逐次探索の計算量(時間)は、比較回数に比例
する。レコードの総数をnとすると、計算量はO(n)
になる。二分探索では、1回の探索するたびに探索の対
象となるレコードの個数は半分になるので、たかだかl
og2n回の比較で探索は完了する。このように関連語
のレコードを見出しによりソートすることにより該当す
る見出しを持つレコードを検索する時間を短縮すること
ができるので、本発明は、関連語辞書の作成を高速に行
うことができる。
【0023】本発明(請求項4)は、関連語として同義
語と上位語や下位語を対象とし、また見出し語情報を前
述のようにポインタにより間接的に求める構成の辞書を
作成する。この発明において、作成の対象となる関連語
辞書における定義体記憶手段は、複数の固定長のレコー
ドで構成される同義語関係の定義体を記憶する。この定
義体は複数のレコードの同義語指示子による指示関係の
閉環連鎖によって見出し語の同義語関係と、複数のレコ
ードの上位語指示子による指示関係の連鎖によって見出
し語の上位関係を定義している。例えば、図5(a)の
例において、レコード番号1、2、14はある同義を定
義するものであるが、レコード番号1のレコードは同義
語指示子(53)の値2によってレコード番号2のレコ
ードを指示しており、そのレコード番号2のレコードは
同義語指示子の値14によってレコード番号14のレコ
ードを指示しており、そのレコード番号14のレコード
は同義語指示子の値1によってレコード番号1のレコー
ドを指示しており、これらの指示関係の連鎖は閉じた環
状となっている。また、見出し語情報は、表記記憶手段
(図5(b)の55)に記憶された見出し語の表記と、
定義体記憶手段に記憶された表記指示子(52)とから
なっており、この例では表記指示子は見出し語の表記が
記憶されている表記記憶手段のアドレスである。例え
ば、図5(a)の例において、レコード番号7と8は上
位下位語を定義するものであるが、レコード番号7のレ
コードは上位語指示子(54)に値8によってレコード
番号8のレコードを上位語として指示しており、そのレ
コード番号8のレコードは上位語指示子の値0によって
上位語がもうないことを指示している。関連語情報設定
手段は、関連語定義情報記憶手段の定義された関連語を
抽出し、その関係に応じて各語を作業用記憶手段のレコ
ードに対応づけ、登録手段は、作業用記憶手段のレコー
ドの情報を定義体記憶手段と表記記憶手段に登録する。
見出し語情報を見出し語の表記と表記指示子によって構
成し、定義体記憶手段には見出し語情報における表記指
示子を記憶し、可変長となる見出し語の表記は表記記憶
手段に記憶するので、レコードをコンパクトな固定長デ
ータとすることができた。レコードが固定長であるため
に、定義体記憶手段に記憶されたレコードのアドレスを
計算するのが容易となり、レコードの検索を高速化する
ことができる。本発明は、関連語辞書の構造が従来技術
のような見出し語の表記を重複して格納する無駄のない
ものであるので、比較的高速に関連語辞書を自動作成す
ることができる。また、作業用記憶手段を用いて関連語
辞書の見出し語の表記を含むレコードを一旦作成し、そ
れを基に関連語辞書の定義体記憶手段と表記記憶手段に
登録するようにしたので、作成が効率的である。
語と上位語や下位語を対象とし、また見出し語情報を前
述のようにポインタにより間接的に求める構成の辞書を
作成する。この発明において、作成の対象となる関連語
辞書における定義体記憶手段は、複数の固定長のレコー
ドで構成される同義語関係の定義体を記憶する。この定
義体は複数のレコードの同義語指示子による指示関係の
閉環連鎖によって見出し語の同義語関係と、複数のレコ
ードの上位語指示子による指示関係の連鎖によって見出
し語の上位関係を定義している。例えば、図5(a)の
例において、レコード番号1、2、14はある同義を定
義するものであるが、レコード番号1のレコードは同義
語指示子(53)の値2によってレコード番号2のレコ
ードを指示しており、そのレコード番号2のレコードは
同義語指示子の値14によってレコード番号14のレコ
ードを指示しており、そのレコード番号14のレコード
は同義語指示子の値1によってレコード番号1のレコー
ドを指示しており、これらの指示関係の連鎖は閉じた環
状となっている。また、見出し語情報は、表記記憶手段
(図5(b)の55)に記憶された見出し語の表記と、
定義体記憶手段に記憶された表記指示子(52)とから
なっており、この例では表記指示子は見出し語の表記が
記憶されている表記記憶手段のアドレスである。例え
ば、図5(a)の例において、レコード番号7と8は上
位下位語を定義するものであるが、レコード番号7のレ
コードは上位語指示子(54)に値8によってレコード
番号8のレコードを上位語として指示しており、そのレ
コード番号8のレコードは上位語指示子の値0によって
上位語がもうないことを指示している。関連語情報設定
手段は、関連語定義情報記憶手段の定義された関連語を
抽出し、その関係に応じて各語を作業用記憶手段のレコ
ードに対応づけ、登録手段は、作業用記憶手段のレコー
ドの情報を定義体記憶手段と表記記憶手段に登録する。
見出し語情報を見出し語の表記と表記指示子によって構
成し、定義体記憶手段には見出し語情報における表記指
示子を記憶し、可変長となる見出し語の表記は表記記憶
手段に記憶するので、レコードをコンパクトな固定長デ
ータとすることができた。レコードが固定長であるため
に、定義体記憶手段に記憶されたレコードのアドレスを
計算するのが容易となり、レコードの検索を高速化する
ことができる。本発明は、関連語辞書の構造が従来技術
のような見出し語の表記を重複して格納する無駄のない
ものであるので、比較的高速に関連語辞書を自動作成す
ることができる。また、作業用記憶手段を用いて関連語
辞書の見出し語の表記を含むレコードを一旦作成し、そ
れを基に関連語辞書の定義体記憶手段と表記記憶手段に
登録するようにしたので、作成が効率的である。
【0024】関連語には、同義語、上位語、下位語等が
あるが、関連語辞書はそれらをすべて含んでいなければ
ならない訳ではなく、用途によっては、同義語のみ、あ
るいは上位語のみでもよい態様がある。そのような態様
の関連語辞書の作成では、関連語辞書の定義体には、そ
れらの一種のみの関連を設定すればよい(請求項6、請
求項7)。
あるが、関連語辞書はそれらをすべて含んでいなければ
ならない訳ではなく、用途によっては、同義語のみ、あ
るいは上位語のみでもよい態様がある。そのような態様
の関連語辞書の作成では、関連語辞書の定義体には、そ
れらの一種のみの関連を設定すればよい(請求項6、請
求項7)。
【0025】
(実施例1)図1は、この発明の実施例1による関連語
辞書作成装置の概略構成図である。本実施例1の関連語
辞書作成装置は、関連語マスター記憶手段11と、表記
記憶手段12と、定義体記憶手段13と、作業用記憶手
段14と、関連語情報設定手段15と、登録手段16
と、ソート手段17と、標準表記手段18と、インデッ
クス手段19を備えている。
辞書作成装置の概略構成図である。本実施例1の関連語
辞書作成装置は、関連語マスター記憶手段11と、表記
記憶手段12と、定義体記憶手段13と、作業用記憶手
段14と、関連語情報設定手段15と、登録手段16
と、ソート手段17と、標準表記手段18と、インデッ
クス手段19を備えている。
【0026】関連語マスター記憶手段11は、関連する
語の集合と要素間の関係を示す情報を記憶するものであ
る。その内容例を図2、図3、図4に示す。図2におい
て、「=」で始まる行中の単語はそれらが同義語である
ことを意味する。「>」で始まる行中の2単語は、前の
単語が後ろの単語の上位語であることを意味する。
「<」で始まる行中の2単語は、前の単語が後ろの単語
の単語の下位語であることを意味する。図3は、図2の
概念的な構造を示したものである。同義関係にある語
は、ポインタによって輪をなすように連結されている。
また、上位下位の関係は、上位語の関係のみによって連
結されており、破線で示されている。
語の集合と要素間の関係を示す情報を記憶するものであ
る。その内容例を図2、図3、図4に示す。図2におい
て、「=」で始まる行中の単語はそれらが同義語である
ことを意味する。「>」で始まる行中の2単語は、前の
単語が後ろの単語の上位語であることを意味する。
「<」で始まる行中の2単語は、前の単語が後ろの単語
の単語の下位語であることを意味する。図3は、図2の
概念的な構造を示したものである。同義関係にある語
は、ポインタによって輪をなすように連結されている。
また、上位下位の関係は、上位語の関係のみによって連
結されており、破線で示されている。
【0027】図4は、図2、図3の関連語の関係をレコ
ード番号の連結として表現した概念図である。各レコー
ドはレコード番号41、見出し部42、同義語のレコー
ド番号43、上位語のレコード番号44の各フィールド
からなっている。見出し部42のフィールドには図5で
用いる文字コードも示した。表記記憶手段12は、関連
語の表記の文字コード列を格納するものである。各文字
コード列は、0で終端されている。その内容例を図5
(b)に示す。同図において文字コード列の一部を示し
ているが、これらは、図4の見出しである「U.S.
A」「USA」「よみとり」の文字コード列に対応して
いる。
ード番号の連結として表現した概念図である。各レコー
ドはレコード番号41、見出し部42、同義語のレコー
ド番号43、上位語のレコード番号44の各フィールド
からなっている。見出し部42のフィールドには図5で
用いる文字コードも示した。表記記憶手段12は、関連
語の表記の文字コード列を格納するものである。各文字
コード列は、0で終端されている。その内容例を図5
(b)に示す。同図において文字コード列の一部を示し
ているが、これらは、図4の見出しである「U.S.
A」「USA」「よみとり」の文字コード列に対応して
いる。
【0028】定義体記憶手段13は、表記指示子52、
同義語指示子53、上位語指示子54のフィールドを含
む固定長のレコードを複数記憶するものである。その内
容例を図5(a)に示す。表記指示子52は、表記記憶
部12に格納された文字コード列の開始位置(addr
_1,addr_1,…,addr_14)を格納す
る。開始位置の先頭は0である。同義語指示子53は、
同義関係にあるレコードの番号51を保持し、同義関係
にあるレコード群が閉環連鎖をなすようになっている。
同義語がない場合には0を保持する。上位語指示子54
は、上位語のレコード番号を保持している。上位語がな
ければ上位語指示子は0を保持する。例えば、図5
(a)の1番目のレコードでは、表記指示子はaddr
_1であり、これは図5(b)の文字コード列「55,
2e,53,2e,41,2e」の開始位置を保持し、
同義語指示子は、2番目の定義体記憶部のレコード(U
SAに対応)の番号を保持している。上位語指示子は、
対応する上位語が定義されていないので0を保持してい
る。2番目のレコードの同義体指示子は、14番目のレ
コード(米国に対応)番号を保持し、14番目のレコー
ドの同義体指示子は、1番目のレコード(U.S.A.
に対応)の番号を保持している。これらの指示関係の連
鎖は、閉じた環状となっており、レコード番号1、2、
14は関連語マスター記憶手段の1番目のレコードで定
義された同義語を定義している。
同義語指示子53、上位語指示子54のフィールドを含
む固定長のレコードを複数記憶するものである。その内
容例を図5(a)に示す。表記指示子52は、表記記憶
部12に格納された文字コード列の開始位置(addr
_1,addr_1,…,addr_14)を格納す
る。開始位置の先頭は0である。同義語指示子53は、
同義関係にあるレコードの番号51を保持し、同義関係
にあるレコード群が閉環連鎖をなすようになっている。
同義語がない場合には0を保持する。上位語指示子54
は、上位語のレコード番号を保持している。上位語がな
ければ上位語指示子は0を保持する。例えば、図5
(a)の1番目のレコードでは、表記指示子はaddr
_1であり、これは図5(b)の文字コード列「55,
2e,53,2e,41,2e」の開始位置を保持し、
同義語指示子は、2番目の定義体記憶部のレコード(U
SAに対応)の番号を保持している。上位語指示子は、
対応する上位語が定義されていないので0を保持してい
る。2番目のレコードの同義体指示子は、14番目のレ
コード(米国に対応)番号を保持し、14番目のレコー
ドの同義体指示子は、1番目のレコード(U.S.A.
に対応)の番号を保持している。これらの指示関係の連
鎖は、閉じた環状となっており、レコード番号1、2、
14は関連語マスター記憶手段の1番目のレコードで定
義された同義語を定義している。
【0029】作業用記憶手段14は、見出し語の表記と
レコード番号と同義語指示子と上位語指示子を記憶する
ものである。その内容例を図6に示す。見出し61は、
関連語マスター記憶手段11に定義された関連語の見出
しを記憶し、レコード番号62は格納された順番に応じ
て1から順に番号を記憶する。同義語指示子63は、同
義語レコード番号を用いて閉環連鎖を構成するように次
の同義語のレコード番号を記憶する。次の同義語がない
レコードの同義語指示子は、自分自身のレコード番号を
記憶する。上位語指示子64は、上位語のレコード番号
を記憶する。上位語がなければ0である。
レコード番号と同義語指示子と上位語指示子を記憶する
ものである。その内容例を図6に示す。見出し61は、
関連語マスター記憶手段11に定義された関連語の見出
しを記憶し、レコード番号62は格納された順番に応じ
て1から順に番号を記憶する。同義語指示子63は、同
義語レコード番号を用いて閉環連鎖を構成するように次
の同義語のレコード番号を記憶する。次の同義語がない
レコードの同義語指示子は、自分自身のレコード番号を
記憶する。上位語指示子64は、上位語のレコード番号
を記憶する。上位語がなければ0である。
【0030】関連語情報設定手段15は、関連語マスタ
ー記憶手段11からレコードを一つずつ読み込みレコー
ド中の各語に対して見出し語の表記とレコード番号を作
業用記憶手段14のレコードに設定し、さらに、要素間
の関係が同義関係のものに対しては閉環連鎖となるよう
に同義語指示子にレコード番号を設定し、要素間の関係
が上位下位関係のものに対しては下位語のレコードの上
位語指示子に上位語のレコードの番号を設定する。
ー記憶手段11からレコードを一つずつ読み込みレコー
ド中の各語に対して見出し語の表記とレコード番号を作
業用記憶手段14のレコードに設定し、さらに、要素間
の関係が同義関係のものに対しては閉環連鎖となるよう
に同義語指示子にレコード番号を設定し、要素間の関係
が上位下位関係のものに対しては下位語のレコードの上
位語指示子に上位語のレコードの番号を設定する。
【0031】登録手段16は、作業用記憶手段14のレ
コードの表記を表記記憶手段12に重複なく登録し、表
記記憶手段12における表記の位置を示す表記指示子と
同義語指示子と上位語指示子とを定義体記憶手段13に
登録する。
コードの表記を表記記憶手段12に重複なく登録し、表
記記憶手段12における表記の位置を示す表記指示子と
同義語指示子と上位語指示子とを定義体記憶手段13に
登録する。
【0032】ソート手段17は、作業用記憶手段14中
のレコードを見出しでソートし、ソート前の指示子をソ
ート後のものに付け替える。具体的には、ソート手段1
7により、図6のレコードは、図12に示すような順序
にソートされる。
のレコードを見出しでソートし、ソート前の指示子をソ
ート後のものに付け替える。具体的には、ソート手段1
7により、図6のレコードは、図12に示すような順序
にソートされる。
【0033】標準表記手段18は、英数字やカタカナな
どの表記方法にバラツキがあるものから標準的な1つの
表記を生成し、標準表記とレコード番号との対応をイン
デックス手段19に登録する。例えば、英字について
は、ASCIIの小文字に変換し、数字についてはAS
CIIの数字に変換し、ピリオドは削除する。カタカナ
については、図7(a)(b)に示すような変換ルール
を適用して標準表記を生成する。同義関係の連鎖に含ま
れるレコード群から2つ以上の共通な標準表記が得られ
る場合、小さいレコード番号と標準表記の対応を登録す
る。例えば、図4のレコード番号5とレコード番号6
は、同義関係の連鎖に含まれるレコードである。これら
の見出し語の標準表記は、(後述するように図7(a)
(b)の変換ルールを適用して)共に「インタフエス」
となる。この場合、図7(c)に示すようにレコード番
号5と標準表記「インタフエス」との対応をインデック
ス手段19に登録する。
どの表記方法にバラツキがあるものから標準的な1つの
表記を生成し、標準表記とレコード番号との対応をイン
デックス手段19に登録する。例えば、英字について
は、ASCIIの小文字に変換し、数字についてはAS
CIIの数字に変換し、ピリオドは削除する。カタカナ
については、図7(a)(b)に示すような変換ルール
を適用して標準表記を生成する。同義関係の連鎖に含ま
れるレコード群から2つ以上の共通な標準表記が得られ
る場合、小さいレコード番号と標準表記の対応を登録す
る。例えば、図4のレコード番号5とレコード番号6
は、同義関係の連鎖に含まれるレコードである。これら
の見出し語の標準表記は、(後述するように図7(a)
(b)の変換ルールを適用して)共に「インタフエス」
となる。この場合、図7(c)に示すようにレコード番
号5と標準表記「インタフエス」との対応をインデック
ス手段19に登録する。
【0034】インデックス手段19は、標準表記を見出
しにして、この標準表記に変換される見出しを持つレコ
ードの番号を格納する。インデックス部の内容例を図7
(c)に示す。図7(c)に示すように、U.S.Aか
らはusaという標準表記が生成され、インターフェー
スからは、図14(a)のNo5から長音「ー」が削除
され図14(b)の「フェ→フエ」からインタフエスが
生成される。それぞれのレコード番号は、1と5とな
る。
しにして、この標準表記に変換される見出しを持つレコ
ードの番号を格納する。インデックス部の内容例を図7
(c)に示す。図7(c)に示すように、U.S.Aか
らはusaという標準表記が生成され、インターフェー
スからは、図14(a)のNo5から長音「ー」が削除
され図14(b)の「フェ→フエ」からインタフエスが
生成される。それぞれのレコード番号は、1と5とな
る。
【0035】次に、以上のように構成した本実施例1の
動作について図8から図12を適宜参照しながら、説明
する。
動作について図8から図12を適宜参照しながら、説明
する。
【0036】図8は、上記実施例1の関連語辞書作成装
置全体の動作を説明するためのフローチャートである。
まず、関連語情報設定手段15は、作業用記憶手段14
のレコード番号を格納する変数recordNoを1に
設定し、作業用記憶手段14の領域を初期化する(ステ
ップS1)。次のステップS2において、関連語マスタ
ー記憶手段11から1行読み込み、ステップS3におい
て、行の先頭が「=」かどうかを判定する。「=」であ
れば、ステップS4に処理をすすめ、「=」でなければ
S5に処理を進める。ステップS4では「=」に続く行
中の単語が同義関係にあり、これらから同義のレコード
を作業用記憶手段14に作成する。ステップ4の詳しい
動作を図9のフローチャートに示す。
置全体の動作を説明するためのフローチャートである。
まず、関連語情報設定手段15は、作業用記憶手段14
のレコード番号を格納する変数recordNoを1に
設定し、作業用記憶手段14の領域を初期化する(ステ
ップS1)。次のステップS2において、関連語マスタ
ー記憶手段11から1行読み込み、ステップS3におい
て、行の先頭が「=」かどうかを判定する。「=」であ
れば、ステップS4に処理をすすめ、「=」でなければ
S5に処理を進める。ステップS4では「=」に続く行
中の単語が同義関係にあり、これらから同義のレコード
を作業用記憶手段14に作成する。ステップ4の詳しい
動作を図9のフローチャートに示す。
【0037】ステップS5では、読み込んだ行の先頭が
「>」であるか否かを判定する。そうであれば、ステッ
プS6に処理を進め、そうでなければS7に処理を進め
る。S6では、「>」か「<」に続く行中の単語は上位
下位関係にあり、これらから上位下位のレコードを作業
用記憶手段14に作成する。ステップS6の詳しい動作
を図10のフローチャートに示す。
「>」であるか否かを判定する。そうであれば、ステッ
プS6に処理を進め、そうでなければS7に処理を進め
る。S6では、「>」か「<」に続く行中の単語は上位
下位関係にあり、これらから上位下位のレコードを作業
用記憶手段14に作成する。ステップS6の詳しい動作
を図10のフローチャートに示す。
【0038】ステップS7では行の先頭の文字が「=」
「>」「<」のいずれでもないのでフォーマットエラー
のメッセージを出力してステップS8へ処理を進める。
ステップS8では、関連語マスター記憶手段11のすべ
てのレコードを読み込み処理したかどうかを判定する。
判定結果がNoであればステップS2に処理を戻し、Y
esであればステップS9に処理を進める。
「>」「<」のいずれでもないのでフォーマットエラー
のメッセージを出力してステップS8へ処理を進める。
ステップS8では、関連語マスター記憶手段11のすべ
てのレコードを読み込み処理したかどうかを判定する。
判定結果がNoであればステップS2に処理を戻し、Y
esであればステップS9に処理を進める。
【0039】ステップS9においてソート手段17は、
作業用辞書記憶手段14のレコードを見出しの表記の降
順にならびかえ、ステップS10においてならびかえた
レコードの同義語指示子と上位語指示子のレコード番号
をソート後のレコード番号に置換する。ステップS11
において、登録手段16は、作業用記憶手段14のレコ
ードの情報を表記記憶手段12と定義体記憶手段13に
格納する。ステップ11の詳しい動作を図11に示す。
作業用辞書記憶手段14のレコードを見出しの表記の降
順にならびかえ、ステップS10においてならびかえた
レコードの同義語指示子と上位語指示子のレコード番号
をソート後のレコード番号に置換する。ステップS11
において、登録手段16は、作業用記憶手段14のレコ
ードの情報を表記記憶手段12と定義体記憶手段13に
格納する。ステップ11の詳しい動作を図11に示す。
【0040】ステップS12では定義体記憶手段13の
各レコードの表記(表記指示子が指し示す位置から0と
なるまでの文字コード列)を標準表記に変換し、標準表
記の見出しと定義体記憶手段のレコードとの対応関係を
インデックス手段19に登録する。
各レコードの表記(表記指示子が指し示す位置から0と
なるまでの文字コード列)を標準表記に変換し、標準表
記の見出しと定義体記憶手段のレコードとの対応関係を
インデックス手段19に登録する。
【0041】図9は、読み込んだ行の先頭が「=」の場
合の関連語情報設定手段15の動作を示したものであ
る。まず、現在のレコード番号(recordNoの
値)を変数StartRecordNoにセットする
(ステップS41)。次のステップS42において、読
み込んだ行の2番目以降の文字列を文字列配列に入れ、
文字列配列の内容を文字列の降順にソートする。なお、
ステップ9と10でソートするのでS42のソートはな
くてもよいのだが、ステップS42がないと図4や図5
の同義語の閉環連鎖と異なる順番の閉環連鎖ができるの
で、このステップを入れている。たとえば、読み込んだ
行が「= よみとり 読み取り 読取り」の場合、文字
列配列には、「よみとり」「読み取り」「読取り」が格
納され、ソートした結果もソート前と同じである。読み
込んだ行が「= 米国 USA U.S.A.」の場
合、文字列配列には「米国」「USA」「U.S.
A.」が格納され、ソートした結果、文字列配列の内容
は、「U.S.A.」「USA」「米国」となる。
合の関連語情報設定手段15の動作を示したものであ
る。まず、現在のレコード番号(recordNoの
値)を変数StartRecordNoにセットする
(ステップS41)。次のステップS42において、読
み込んだ行の2番目以降の文字列を文字列配列に入れ、
文字列配列の内容を文字列の降順にソートする。なお、
ステップ9と10でソートするのでS42のソートはな
くてもよいのだが、ステップS42がないと図4や図5
の同義語の閉環連鎖と異なる順番の閉環連鎖ができるの
で、このステップを入れている。たとえば、読み込んだ
行が「= よみとり 読み取り 読取り」の場合、文字
列配列には、「よみとり」「読み取り」「読取り」が格
納され、ソートした結果もソート前と同じである。読み
込んだ行が「= 米国 USA U.S.A.」の場
合、文字列配列には「米国」「USA」「U.S.
A.」が格納され、ソートした結果、文字列配列の内容
は、「U.S.A.」「USA」「米国」となる。
【0042】次のステップS43では文字列配列中のす
べての文字列を処理したかどうかを判定する。処理して
いれば、ステップS47に処理を進める。そうでなけれ
ば、ステップS44に処理を進める。
べての文字列を処理したかどうかを判定する。処理して
いれば、ステップS47に処理を進める。そうでなけれ
ば、ステップS44に処理を進める。
【0043】ステップS44では、文字列配列中の現在
の文字列を変数recordNoの指す作業用記憶手段
14のレコードの見出しにセットする。次のステップS
45では、変数recordNoの指す作業用記憶手段
14のレコードの同義語指示子にrecordNo+1
の値をセットする。次のステップS46ではrecor
dNoの内容を1だけ増やし、ステップS43に処理を
進める。ステップS47では、recordNo−1の
指すレコードの同義語指示子にStartRecord
Noの値をセットし、閉環連鎖をなすように直前の同義
のレコードの同義語指示子を変更する。
の文字列を変数recordNoの指す作業用記憶手段
14のレコードの見出しにセットする。次のステップS
45では、変数recordNoの指す作業用記憶手段
14のレコードの同義語指示子にrecordNo+1
の値をセットする。次のステップS46ではrecor
dNoの内容を1だけ増やし、ステップS43に処理を
進める。ステップS47では、recordNo−1の
指すレコードの同義語指示子にStartRecord
Noの値をセットし、閉環連鎖をなすように直前の同義
のレコードの同義語指示子を変更する。
【0044】図10は、読み込んだ行の先頭が、
「>」、「<」の場合の関連語情報設定手段15の動作
(ステップS6)の動作を示したものである。まず、
「>」「<」に後続する2つの文字列のうち、1番目の
文字列を変数str1にセットし、2番目の文字列を変
数str2にセットする(ステップS601)。次のス
テップS602では、読み込んだ行の先頭が「<」かど
うかを判定する。そうであれば、ステップS603に進
み、変数str1とstr2の内容を交換し、ステップ
S604に処理を進める。そうでなければステップS6
04に処理を進める。
「>」、「<」の場合の関連語情報設定手段15の動作
(ステップS6)の動作を示したものである。まず、
「>」「<」に後続する2つの文字列のうち、1番目の
文字列を変数str1にセットし、2番目の文字列を変
数str2にセットする(ステップS601)。次のス
テップS602では、読み込んだ行の先頭が「<」かど
うかを判定する。そうであれば、ステップS603に進
み、変数str1とstr2の内容を交換し、ステップ
S604に処理を進める。そうでなければステップS6
04に処理を進める。
【0045】ステップS604では、変数str1にセ
ットされた文字列と等しい見出しを持つレコードを作業
用記憶手段14から検索し、検索できればそのレコード
番号を変数rec1にセットし、検索できなければ0を
rec1にセットする。ステップS605では変数re
c1の内容が0か(検索できなかったか)を判定する。
0でなければ(検索できていれば)処理をステップS6
08に進め、0であればステップS606に処理を進め
る。ステップS606において、変数recordNo
の指す作業用記憶手段14のレコードの見出しに変数s
tr1にセットされた内容を設定し、このレコードの同
義語指示子にrecordNoの値をセットする。ステ
ップS607では、recordNoの内容をrec1
にセットし、recordNoの内容を1だけ増やし、
ステップS608に処理を進める。
ットされた文字列と等しい見出しを持つレコードを作業
用記憶手段14から検索し、検索できればそのレコード
番号を変数rec1にセットし、検索できなければ0を
rec1にセットする。ステップS605では変数re
c1の内容が0か(検索できなかったか)を判定する。
0でなければ(検索できていれば)処理をステップS6
08に進め、0であればステップS606に処理を進め
る。ステップS606において、変数recordNo
の指す作業用記憶手段14のレコードの見出しに変数s
tr1にセットされた内容を設定し、このレコードの同
義語指示子にrecordNoの値をセットする。ステ
ップS607では、recordNoの内容をrec1
にセットし、recordNoの内容を1だけ増やし、
ステップS608に処理を進める。
【0046】ステップS608では、変数str2にセ
ットされた文字列と等しい見出しを持つレコードを作業
用記憶手段14から検索し、検索できればそのレコード
番号を変数rec2にセットし、検索できなければ0を
rec2にセットする。ステップS609では変数re
c2の内容が0か(検索できなかったか)を判定する。
0でなければ(検索できていれば)処理をステップS6
12に進め、0であればステップS610に処理を進め
る。ステップS610において、変数recordNo
の指す作業用記憶手段14のレコードの見出しに変数s
tr2にセットされた内容を設定し、このレコードの同
義語指示子にrecordNoの値をセットする。ステ
ップS611では、recordNoの内容をrec2
にセットし、recordNoの内容を1だけ増やし、
ステップS612に処理を進める。
ットされた文字列と等しい見出しを持つレコードを作業
用記憶手段14から検索し、検索できればそのレコード
番号を変数rec2にセットし、検索できなければ0を
rec2にセットする。ステップS609では変数re
c2の内容が0か(検索できなかったか)を判定する。
0でなければ(検索できていれば)処理をステップS6
12に進め、0であればステップS610に処理を進め
る。ステップS610において、変数recordNo
の指す作業用記憶手段14のレコードの見出しに変数s
tr2にセットされた内容を設定し、このレコードの同
義語指示子にrecordNoの値をセットする。ステ
ップS611では、recordNoの内容をrec2
にセットし、recordNoの内容を1だけ増やし、
ステップS612に処理を進める。
【0047】ステップS612では、rec2の指すレ
コードの上位指示子が0かどうかを判定する。0であれ
ば処理をステップS613に進め、0でなければ、すな
わち、すでに上位指示子がセットされていれば処理をS
614に進める。ステップS613では、rec2の指
す作業用記憶手段14のレコードの上位語指示子にre
c1の内容をセットし、上位下位の関係を上位語指示子
を用いたレコードの連鎖で表現する。ステップS614
では、rec2の指すレコードの見出しを持つレコード
を設定するために変数recordNoの指す作業用記
憶手段14のレコードの見出しにrec2の指すレコー
ドの見出しを設定し、このレコードの同義語指示子にr
ecordNoの値をセットする。ステップS615で
は、recordNoの内容をrec2にセットし、r
ecordNoの内容を1だけ増やし、ステップS61
3に処理を進める。
コードの上位指示子が0かどうかを判定する。0であれ
ば処理をステップS613に進め、0でなければ、すな
わち、すでに上位指示子がセットされていれば処理をS
614に進める。ステップS613では、rec2の指
す作業用記憶手段14のレコードの上位語指示子にre
c1の内容をセットし、上位下位の関係を上位語指示子
を用いたレコードの連鎖で表現する。ステップS614
では、rec2の指すレコードの見出しを持つレコード
を設定するために変数recordNoの指す作業用記
憶手段14のレコードの見出しにrec2の指すレコー
ドの見出しを設定し、このレコードの同義語指示子にr
ecordNoの値をセットする。ステップS615で
は、recordNoの内容をrec2にセットし、r
ecordNoの内容を1だけ増やし、ステップS61
3に処理を進める。
【0048】図11は、作業用記憶手段14のレコード
の情報を表記記憶手段12と定義体記憶手段13に格納
する登録手段16の動作を示すフローチャートである。
まず、作業用記憶手段14や定義体記憶手段13のレコ
ード番号を保持する変数recordNoに1をセット
し、表記記憶手段12における表記の開始位置(すなわ
ち表記指示子)を保持する変数startに0をセット
し、表記記憶手段12における表記の次の格納位置を保
持する変数nextに0をセットし、直前の表記を保持
する変数strに空白の文字列””をセットする(ステ
ップS1101)。
の情報を表記記憶手段12と定義体記憶手段13に格納
する登録手段16の動作を示すフローチャートである。
まず、作業用記憶手段14や定義体記憶手段13のレコ
ード番号を保持する変数recordNoに1をセット
し、表記記憶手段12における表記の開始位置(すなわ
ち表記指示子)を保持する変数startに0をセット
し、表記記憶手段12における表記の次の格納位置を保
持する変数nextに0をセットし、直前の表記を保持
する変数strに空白の文字列””をセットする(ステ
ップS1101)。
【0049】ステップS1102において、recor
dNoの値が作業用記憶手段14のレコード数を越えた
かどうかを判定する。越えていれば、処理を終了する。
越えていなければ処理をステップS1103に進める。
ステップS1103において、recordNoの値が
指す作業用記憶手段14のレコードの同義語指示子と上
位語指示子のそれぞれの値をrecordNoの値が指
す定義体記憶手段13のレコードの同義語指示子と上位
語指示子の値にセットする。次のステップS1104に
おいてrecordNoの値が指す作業用記憶手段14
のレコードの表記が変数strの値と等しいかどうか判
定する。等しければ(すなわち表記の重複が起こった
ら)処理をステップS1109に進め、等しくなければ
処理をステップS1105に進める。
dNoの値が作業用記憶手段14のレコード数を越えた
かどうかを判定する。越えていれば、処理を終了する。
越えていなければ処理をステップS1103に進める。
ステップS1103において、recordNoの値が
指す作業用記憶手段14のレコードの同義語指示子と上
位語指示子のそれぞれの値をrecordNoの値が指
す定義体記憶手段13のレコードの同義語指示子と上位
語指示子の値にセットする。次のステップS1104に
おいてrecordNoの値が指す作業用記憶手段14
のレコードの表記が変数strの値と等しいかどうか判
定する。等しければ(すなわち表記の重複が起こった
ら)処理をステップS1109に進め、等しくなければ
処理をステップS1105に進める。
【0050】ステップS1105では、nextの値を
startにセットする。次のステップS1106で
は、recordNoの指す作業用記憶手段のレコード
の見出しの文字列をstrにセットする。ステップS1
107では、strの内容である見出しの文字コード列
を表記記憶手段12のstartの位置より複写し、文
字コード列の直後に0をセットする。ステップS110
8では、startの値と文字列の長さと1を加えた値
を変数nextにセットする。ステップS1109で
は、recordNoの指す定義体記憶手段13のレコ
ードの表記指示子にstartの値をセットする。ステ
ップS1110では、recordNoの値を1つ増や
し、処理をステップS1102に進める。
startにセットする。次のステップS1106で
は、recordNoの指す作業用記憶手段のレコード
の見出しの文字列をstrにセットする。ステップS1
107では、strの内容である見出しの文字コード列
を表記記憶手段12のstartの位置より複写し、文
字コード列の直後に0をセットする。ステップS110
8では、startの値と文字列の長さと1を加えた値
を変数nextにセットする。ステップS1109で
は、recordNoの指す定義体記憶手段13のレコ
ードの表記指示子にstartの値をセットする。ステ
ップS1110では、recordNoの値を1つ増や
し、処理をステップS1102に進める。
【0051】次に、上記の実施例1の動作を具体例によ
りさらに説明する。例えば、図2に示す関連語マスター
記憶手段11の内容を図5(a)(b)に示す定義体記
憶手段13と表記記憶手段12に変換する動作を説明す
る。ステップS1において、recordNoに1をセ
ットし、作業用記憶手段の領域を獲得し内容を初期化す
る。ステップS2において1行目の「= よみとり 読
み取り 読取り」をステップS2で読み込むと、行の先
頭は「=」であるのでステップS3において処理をステ
ップS4に進める。
りさらに説明する。例えば、図2に示す関連語マスター
記憶手段11の内容を図5(a)(b)に示す定義体記
憶手段13と表記記憶手段12に変換する動作を説明す
る。ステップS1において、recordNoに1をセ
ットし、作業用記憶手段の領域を獲得し内容を初期化す
る。ステップS2において1行目の「= よみとり 読
み取り 読取り」をステップS2で読み込むと、行の先
頭は「=」であるのでステップS3において処理をステ
ップS4に進める。
【0052】ステップS41でStartRecord
NoにrecordNoの値(=1)をセットし、ステ
ップS42で、読み込んだ行の2番目以降の文字列を文
字列配列入れ、文字列配列の内容を文字列の降順にソー
トする。文字列配列には、「よみとり」「読み取り」
「読取り」が格納される。ステップS43からステップ
S46の処理を文字列配列中の各語に対して行い、ステ
ップS43の判定がYesとなり、ステップS47を行
った直後での作業用記憶手段14には、図6(a)のレ
コード番号1から3に対応する3つのレコードが作成さ
れることになる。処理をステップS8に進め、ステップ
S8では関連語マスター記憶手段の全ての行を処理した
かどうかを判定し、処理をステップS2に戻す。
NoにrecordNoの値(=1)をセットし、ステ
ップS42で、読み込んだ行の2番目以降の文字列を文
字列配列入れ、文字列配列の内容を文字列の降順にソー
トする。文字列配列には、「よみとり」「読み取り」
「読取り」が格納される。ステップS43からステップ
S46の処理を文字列配列中の各語に対して行い、ステ
ップS43の判定がYesとなり、ステップS47を行
った直後での作業用記憶手段14には、図6(a)のレ
コード番号1から3に対応する3つのレコードが作成さ
れることになる。処理をステップS8に進め、ステップ
S8では関連語マスター記憶手段の全ての行を処理した
かどうかを判定し、処理をステップS2に戻す。
【0053】2行目の「= 米国 USA U.S.
A」をステップS2で読み込むと、行の先頭は「=」で
あるのでステップS3において処理をステップS4に進
める。ステップS41でStartRecordNoに
recordNoの値(=4)をセットし、ステップS
42で、読み込んだ行の2番目以降の文字列を文字列配
列に入れ、文字列配列の内容を文字列の降順にソートす
る。文字列配列には、「U.S.A.」「USA」「米
国」が格納される。ステップS43からステップS46
の処理を文字列配列中の各語に対して行い、ステップS
43の判定がYesとなり、ステップS47を行った直
後での作業用記憶手段14には、図6(a)のレコード
番号4から6に対応する3つのレコードが作成されるこ
とになる。処理をステップS8に進め、ステップS8で
は関連語マスター記憶手段の全ての行を処理したかどう
かを判定し、処理をステップS2に戻す。
A」をステップS2で読み込むと、行の先頭は「=」で
あるのでステップS3において処理をステップS4に進
める。ステップS41でStartRecordNoに
recordNoの値(=4)をセットし、ステップS
42で、読み込んだ行の2番目以降の文字列を文字列配
列に入れ、文字列配列の内容を文字列の降順にソートす
る。文字列配列には、「U.S.A.」「USA」「米
国」が格納される。ステップS43からステップS46
の処理を文字列配列中の各語に対して行い、ステップS
43の判定がYesとなり、ステップS47を行った直
後での作業用記憶手段14には、図6(a)のレコード
番号4から6に対応する3つのレコードが作成されるこ
とになる。処理をステップS8に進め、ステップS8で
は関連語マスター記憶手段の全ての行を処理したかどう
かを判定し、処理をステップS2に戻す。
【0054】以下同様に行い、3行目の「= インター
フェース インターフェイス」からは図6(a)のレコ
ード番号7から8に対応する2つのレコードが作成さ
れ、4行目の「= 東京大学 東大」からは図6(a)
のレコード番号9から10に対応する2つのレコードが
作成され、5行目の「= 大阪大学 阪大」からは図6
(a)のレコード番号11から12に対応する2つのレ
コードが作成され6行目の「= 米国 アメリカ」から
は図6(a)のレコード番号13から14に対応する2
つのレコードが作成される。処理をステップS8に進
め、ステップS8では関連語マスター記憶手段の全ての
行を処理したかどうかを判定し、処理をステップS2に
戻す。
フェース インターフェイス」からは図6(a)のレコ
ード番号7から8に対応する2つのレコードが作成さ
れ、4行目の「= 東京大学 東大」からは図6(a)
のレコード番号9から10に対応する2つのレコードが
作成され、5行目の「= 大阪大学 阪大」からは図6
(a)のレコード番号11から12に対応する2つのレ
コードが作成され6行目の「= 米国 アメリカ」から
は図6(a)のレコード番号13から14に対応する2
つのレコードが作成される。処理をステップS8に進
め、ステップS8では関連語マスター記憶手段の全ての
行を処理したかどうかを判定し、処理をステップS2に
戻す。
【0055】7行目の「< 阪大 大学」をステップS
2で読み込むと、行の先頭は「<」であるのでステップ
5において処理をステップS6に進める。ステップS6
01で1番目の文字列の「阪大」をstr1にセット
し、2番目の文字列の「大学」をstr2にセットす
る。ステップ602で行の先頭が「<」であるので、ス
テップS603でstr1とstr2の内容を交換し、
str1には「大学」が、str2には「阪大」がセッ
トされる。ステップS604でstr1の内容を持つレ
コード番号を作業用記憶手段14から検索するが、図6
(a)に示すように「大学」は登録されていないので、
rec1には0がセットされる。ステップS605で、
rec1の内容は0なので、ステップS606において
recordNo(=15)の指す作業用記憶手段14
のレコードの見出しに変数str1にセットされた内容
を設定し、このレコードの同義語指示子にrecord
Noの値をセットする。その結果、図6(b)の15番
目のレコードの値が設定される。ステップS607でr
ecordNoの値(=15)をrec1にセットし、
recordNoの値を1つ増やして16とする。ステ
ップS608でstr2の内容を持つレコード番号を作
業用記憶手段14から検索するが、図6(a)に示すよ
うに「阪大」が11番目のレコードに登録されているの
で、rec2には11がセットされる。ステップS60
9においてrec2の内容は0でないので、ステップS
612に処理を進める。ステップS612では、rec
2(=11)の指すレコードの上位指示子が0かどうか
を判定する。0であるのでステップS613において、
rec2(=11)の指す作業用記憶手段14のレコー
ドの上位指示子にrec1(=15)の内容をセットす
る。その結果、図6(b)の11番目のレコードの上位
指示子が15に変わる。処理をステップS8に進め、処
理をステップS2に戻す。
2で読み込むと、行の先頭は「<」であるのでステップ
5において処理をステップS6に進める。ステップS6
01で1番目の文字列の「阪大」をstr1にセット
し、2番目の文字列の「大学」をstr2にセットす
る。ステップ602で行の先頭が「<」であるので、ス
テップS603でstr1とstr2の内容を交換し、
str1には「大学」が、str2には「阪大」がセッ
トされる。ステップS604でstr1の内容を持つレ
コード番号を作業用記憶手段14から検索するが、図6
(a)に示すように「大学」は登録されていないので、
rec1には0がセットされる。ステップS605で、
rec1の内容は0なので、ステップS606において
recordNo(=15)の指す作業用記憶手段14
のレコードの見出しに変数str1にセットされた内容
を設定し、このレコードの同義語指示子にrecord
Noの値をセットする。その結果、図6(b)の15番
目のレコードの値が設定される。ステップS607でr
ecordNoの値(=15)をrec1にセットし、
recordNoの値を1つ増やして16とする。ステ
ップS608でstr2の内容を持つレコード番号を作
業用記憶手段14から検索するが、図6(a)に示すよ
うに「阪大」が11番目のレコードに登録されているの
で、rec2には11がセットされる。ステップS60
9においてrec2の内容は0でないので、ステップS
612に処理を進める。ステップS612では、rec
2(=11)の指すレコードの上位指示子が0かどうか
を判定する。0であるのでステップS613において、
rec2(=11)の指す作業用記憶手段14のレコー
ドの上位指示子にrec1(=15)の内容をセットす
る。その結果、図6(b)の11番目のレコードの上位
指示子が15に変わる。処理をステップS8に進め、処
理をステップS2に戻す。
【0056】8行目の「> 大学 東京大学」をステッ
プS2で読み込むと、行の先頭は「>」であるのでステ
ップ5において処理をステップS6に進める。ステップ
S601で1番目の文字列の「大学」をstr1にセッ
トし、2番目の文字列の「東京大学」をstr2にセッ
トする。ステップ602で行の先頭が「>」であるの
で、処理をステップS604に進める。ステップS60
4でstr1の内容を持つレコード番号を作業用記憶手
段14から検索するが、図6(b)に示すように「大
学」が15番目のレコードに登録されているので、re
c1には15がセットされる。ステップS605で、r
ec1の内容は0でないので処理をステップS608に
進める。ステップS608でstr2の内容を持つレコ
ード番号を作業用記憶手段14から検索するが、図6
(b)に示すように「東京大学」が9番目のレコードに
登録されているので、rec2には9がセットされる。
ステップS609においてrec2の内容は0でないの
で、ステップS612に処理を進める。ステップS61
2では、rec2(=9)の指すレコードの上位指示子
が0かどうかを判定する。0であるのでステップS61
3でrec2(=9)の指す作業用記憶手段14のレコ
ードの上位指示子にrec1(=15)の内容をセット
する。その結果、図6(b)の9番目のレコードの上位
指示子が15に変わる。処理をステップS8に進める。
ステップS8において、関連語マスター記憶手段14の
内容を全て処理したので、処理をステップS9に進め
る。
プS2で読み込むと、行の先頭は「>」であるのでステ
ップ5において処理をステップS6に進める。ステップ
S601で1番目の文字列の「大学」をstr1にセッ
トし、2番目の文字列の「東京大学」をstr2にセッ
トする。ステップ602で行の先頭が「>」であるの
で、処理をステップS604に進める。ステップS60
4でstr1の内容を持つレコード番号を作業用記憶手
段14から検索するが、図6(b)に示すように「大
学」が15番目のレコードに登録されているので、re
c1には15がセットされる。ステップS605で、r
ec1の内容は0でないので処理をステップS608に
進める。ステップS608でstr2の内容を持つレコ
ード番号を作業用記憶手段14から検索するが、図6
(b)に示すように「東京大学」が9番目のレコードに
登録されているので、rec2には9がセットされる。
ステップS609においてrec2の内容は0でないの
で、ステップS612に処理を進める。ステップS61
2では、rec2(=9)の指すレコードの上位指示子
が0かどうかを判定する。0であるのでステップS61
3でrec2(=9)の指す作業用記憶手段14のレコ
ードの上位指示子にrec1(=15)の内容をセット
する。その結果、図6(b)の9番目のレコードの上位
指示子が15に変わる。処理をステップS8に進める。
ステップS8において、関連語マスター記憶手段14の
内容を全て処理したので、処理をステップS9に進め
る。
【0057】ステップS9においてソート手段17は、
作業用辞書記憶手段14のレコードを見出しの表記の降
順にソートする。ソートした結果を図12(a)に示
す。図12(a)の各レコードのレコード番号フィール
ドにはソート前のレコード番号がセットされている。ソ
ート後のレコード番号は、先頭のレコードを1として順
々にカウントしていけば分かる。
作業用辞書記憶手段14のレコードを見出しの表記の降
順にソートする。ソートした結果を図12(a)に示
す。図12(a)の各レコードのレコード番号フィール
ドにはソート前のレコード番号がセットされている。ソ
ート後のレコード番号は、先頭のレコードを1として順
々にカウントしていけば分かる。
【0058】ステップS10においてならびかえたレコ
ードの同義語指示子と上位語指示子のレコード番号をソ
ート後のレコード番号に置換する。置換の方法の一つ
は、同義語指示子や上位語指示子のレコード番号を持つ
レコードのソート後のレコード番号を求め、求めた番号
で同義語指示子や上位語指示子のレコード番号に置換す
るものである。例えば、同義語指示子5は、ソート前の
レコード番号が5(見出しがUSAの)レコードの、ソ
ート後のレコード番号の2に置換される。置換の結果、
図12(a)に示す作業用辞書記憶手段14の内容は、
図12(b)に示すようになる。
ードの同義語指示子と上位語指示子のレコード番号をソ
ート後のレコード番号に置換する。置換の方法の一つ
は、同義語指示子や上位語指示子のレコード番号を持つ
レコードのソート後のレコード番号を求め、求めた番号
で同義語指示子や上位語指示子のレコード番号に置換す
るものである。例えば、同義語指示子5は、ソート前の
レコード番号が5(見出しがUSAの)レコードの、ソ
ート後のレコード番号の2に置換される。置換の結果、
図12(a)に示す作業用辞書記憶手段14の内容は、
図12(b)に示すようになる。
【0059】ステップS11において、登録手段16
は、作業用記憶手段14のレコードの情報を表記記憶手
段12と定義体記憶手段13に格納する。図12(b)
の内容を登録する場合のステップ11の詳しい動作を図
11に示す。
は、作業用記憶手段14のレコードの情報を表記記憶手
段12と定義体記憶手段13に格納する。図12(b)
の内容を登録する場合のステップ11の詳しい動作を図
11に示す。
【0060】ステップS1101で変数recordN
oに1をセットし、変数startと変数nextに0
をセットし、変数strに空白の文字列””をセットす
る。ステップ1102において、recordNo(=
1)の値が作業用記憶手段14のレコード数(=15)
を越えたかどうかを判定するが、越えていないので処理
をステップS1103に進める。ステップS1103に
おいて、recordNo(=1)の値が指す作業用記
憶手段14のレコードの同義語指示子(=2)と上位語
指示子(=0)のそれぞれの値をrecordNo(=
1)の値が指す同義体記憶手段13のレコードの同義語
指示子と上位語指示子の値にセットする。その結果、図
5(a)の1番目のレコードの同義語指示子53と上位
語指示子54がそれぞれ2と0にセットされる。次のS
ステップ1104においてrecordNo(=1)の
値が指す作業用記憶手段14のレコードの表記が変数s
trの値と等しいかどうか判定するが、等しくないので
処理をステップS1105に進める。ステップS110
5では、next(=0)の値をstartにセットす
る。次のステップS1106では、recordNo
(=1)の指す作業用記憶手段14のレコードの見出し
の文字列「U.S.A.」をstrにセットする。ステ
ップS1107では、strの内容である見出しの文字
コード列「552e 53 2e 41 2e」を表記
記憶手段12のstart(=0)の位置より複写し、
文字コード列の直後に0をセットする。その結果、図5
(b)の先頭より「55 2e 53 2e 41 2
e 0」というコード列がセットされる。ステップS1
108では、startの値(=0)と文字列の長さ
(=6)と1を加えた値(=7)を変数nextにセッ
トする。ステップS1109では、recordNo
(=1)の指す定義体記憶手段13のレコードの表記指
示子にstart(=0)の値をセットする。その結
果、図5(a)の1番目のレコードの表記指示子(5
2)の値addr_1には0がセットされる。ステップ
S1110では、recordNoの値を1つ増やし2
にして、処理をステップS1102に進める。
oに1をセットし、変数startと変数nextに0
をセットし、変数strに空白の文字列””をセットす
る。ステップ1102において、recordNo(=
1)の値が作業用記憶手段14のレコード数(=15)
を越えたかどうかを判定するが、越えていないので処理
をステップS1103に進める。ステップS1103に
おいて、recordNo(=1)の値が指す作業用記
憶手段14のレコードの同義語指示子(=2)と上位語
指示子(=0)のそれぞれの値をrecordNo(=
1)の値が指す同義体記憶手段13のレコードの同義語
指示子と上位語指示子の値にセットする。その結果、図
5(a)の1番目のレコードの同義語指示子53と上位
語指示子54がそれぞれ2と0にセットされる。次のS
ステップ1104においてrecordNo(=1)の
値が指す作業用記憶手段14のレコードの表記が変数s
trの値と等しいかどうか判定するが、等しくないので
処理をステップS1105に進める。ステップS110
5では、next(=0)の値をstartにセットす
る。次のステップS1106では、recordNo
(=1)の指す作業用記憶手段14のレコードの見出し
の文字列「U.S.A.」をstrにセットする。ステ
ップS1107では、strの内容である見出しの文字
コード列「552e 53 2e 41 2e」を表記
記憶手段12のstart(=0)の位置より複写し、
文字コード列の直後に0をセットする。その結果、図5
(b)の先頭より「55 2e 53 2e 41 2
e 0」というコード列がセットされる。ステップS1
108では、startの値(=0)と文字列の長さ
(=6)と1を加えた値(=7)を変数nextにセッ
トする。ステップS1109では、recordNo
(=1)の指す定義体記憶手段13のレコードの表記指
示子にstart(=0)の値をセットする。その結
果、図5(a)の1番目のレコードの表記指示子(5
2)の値addr_1には0がセットされる。ステップ
S1110では、recordNoの値を1つ増やし2
にして、処理をステップS1102に進める。
【0061】同様に、図12(b)のレコード番号14
のレコードの内容をそれぞれ表記記憶手段12と定義体
記憶手段13に登録する。最後のレコード番号15のレ
コードの内容を表記記憶手段12と定義体記憶手段13
に登録する場合、ステップS1104において、str
の内容は直前のレコード番号14の見出し「米国」と保
持しているので、その判定結果はYesとなり、処理を
ステップS1109に進める。ステップS1109で、
recordNo(=15)の指す定義体記憶手段13
のレコードの表記指示子に更新されていないstart
の値をセットする。すなわち、「米国」という表記は、
表記記憶手段12に登録されているので、レコード番号
15の定義体記憶手段14のレコードの表記指示子に
は、レコード番号14と同じものを使う。その結果、図
5(a)の15番目のレコードの表記指示子(52)に
は、14番目のレコードの表記指示子addr_14を
セットする。ステップS1110でrecordNoの
値が16に変更され、ステップS1102において判定
結果がYesとなるので、処理をS12に進める。
のレコードの内容をそれぞれ表記記憶手段12と定義体
記憶手段13に登録する。最後のレコード番号15のレ
コードの内容を表記記憶手段12と定義体記憶手段13
に登録する場合、ステップS1104において、str
の内容は直前のレコード番号14の見出し「米国」と保
持しているので、その判定結果はYesとなり、処理を
ステップS1109に進める。ステップS1109で、
recordNo(=15)の指す定義体記憶手段13
のレコードの表記指示子に更新されていないstart
の値をセットする。すなわち、「米国」という表記は、
表記記憶手段12に登録されているので、レコード番号
15の定義体記憶手段14のレコードの表記指示子に
は、レコード番号14と同じものを使う。その結果、図
5(a)の15番目のレコードの表記指示子(52)に
は、14番目のレコードの表記指示子addr_14を
セットする。ステップS1110でrecordNoの
値が16に変更され、ステップS1102において判定
結果がYesとなるので、処理をS12に進める。
【0062】ステップS12では、定義体記憶手段13
の各レコードの表記(表記指示子が指し示す位置から0
となるまでの文字コード列)を標準表記に変換し、標準
表記の見出しと定義体記憶手段のレコードとの対応関係
をインデックス手段19に登録する。英字については、
ASCIIの小文字に変換し、数字についてはASCI
Iの数字に変換し、ピリオドは削除する。カタカナにつ
いては、図7(a)(b)に示すような変換ルールを適
用して短縮表記を生成する。図5(a)(b)に記憶さ
れたレコードに関しては、「U.S.A」と「USA」
が「usa」に変換され、「インターフェース」と「イ
ンターフェイス」が「インタフエス」に変換される。こ
れらは、同義語の閉環連鎖に含まれるので、レコード番
号の小さいほうの番号1と5をインデックス手段19に
短縮表記と対応づけて登録する。その結果、インデック
ス手段19の内容は図7(c)に示すような内容にな
る。
の各レコードの表記(表記指示子が指し示す位置から0
となるまでの文字コード列)を標準表記に変換し、標準
表記の見出しと定義体記憶手段のレコードとの対応関係
をインデックス手段19に登録する。英字については、
ASCIIの小文字に変換し、数字についてはASCI
Iの数字に変換し、ピリオドは削除する。カタカナにつ
いては、図7(a)(b)に示すような変換ルールを適
用して短縮表記を生成する。図5(a)(b)に記憶さ
れたレコードに関しては、「U.S.A」と「USA」
が「usa」に変換され、「インターフェース」と「イ
ンターフェイス」が「インタフエス」に変換される。こ
れらは、同義語の閉環連鎖に含まれるので、レコード番
号の小さいほうの番号1と5をインデックス手段19に
短縮表記と対応づけて登録する。その結果、インデック
ス手段19の内容は図7(c)に示すような内容にな
る。
【0063】(実施例2)図13(a)は、一つの語に
複数の上位語を定義した時の関連語マスター記憶手段1
1の内容を示した図で、「東京大学」に「大学」「To
kyo」の2つの上位語を関連づけたものであり、図1
3(b)は、同図(a)の関連語辞書の内容の概念的な
構造を示す図である。以下図14から図17を参照しな
がら実施例2を説明する。
複数の上位語を定義した時の関連語マスター記憶手段1
1の内容を示した図で、「東京大学」に「大学」「To
kyo」の2つの上位語を関連づけたものであり、図1
3(b)は、同図(a)の関連語辞書の内容の概念的な
構造を示す図である。以下図14から図17を参照しな
がら実施例2を説明する。
【0064】図14は、図13(a)(b)の関連語の
関係をレコード番号の連結とした概念図である。図15
は、図14の関連語辞書のレコードの物理的な構造の一
例を示す図である。図8、図9、図10のフローチャー
トに従って処理を進め、図13(a)の7行目の「>
大学 東京大学」までを処理した時の作業用記憶手段1
4の内容を図16(a)に示す。
関係をレコード番号の連結とした概念図である。図15
は、図14の関連語辞書のレコードの物理的な構造の一
例を示す図である。図8、図9、図10のフローチャー
トに従って処理を進め、図13(a)の7行目の「>
大学 東京大学」までを処理した時の作業用記憶手段1
4の内容を図16(a)に示す。
【0065】ステップS2で図13の8行目の「> T
okyo 東京大学」を読み込んだ時、行の先頭が
「>」であるので処理をステップS6に進める。ステッ
プS601で1番目の文字列の「Tokyo」をstr
1にセットし、2番目の文字列の「東京大学」をstr
2にセットする。ステップ602で行の先頭が「>」で
あるので、処理をステップS604に進める。ステップ
S604でstr1の内容を持つレコード番号を作業用
記憶手段14から検索するが、図16(a)に示すよう
に「Tokyo」は登録されていないので、rec1に
は0がセットされる。ステップS605で、rec1の
内容は0なので、ステップS606においてrecor
dNo(=14)の指す作業用記憶手段14のレコード
の見出しに変数str1にセットされた内容を設定し、
このレコードの同義語指示子にrecordNoの値を
セットする。その結果、図16(b)の14番目のレコ
ードの値が設定される。ステップS607でrecor
dNoの値(=14)をrec1にセットし、reco
rdNoの値を1つ増やして15とする。
okyo 東京大学」を読み込んだ時、行の先頭が
「>」であるので処理をステップS6に進める。ステッ
プS601で1番目の文字列の「Tokyo」をstr
1にセットし、2番目の文字列の「東京大学」をstr
2にセットする。ステップ602で行の先頭が「>」で
あるので、処理をステップS604に進める。ステップ
S604でstr1の内容を持つレコード番号を作業用
記憶手段14から検索するが、図16(a)に示すよう
に「Tokyo」は登録されていないので、rec1に
は0がセットされる。ステップS605で、rec1の
内容は0なので、ステップS606においてrecor
dNo(=14)の指す作業用記憶手段14のレコード
の見出しに変数str1にセットされた内容を設定し、
このレコードの同義語指示子にrecordNoの値を
セットする。その結果、図16(b)の14番目のレコ
ードの値が設定される。ステップS607でrecor
dNoの値(=14)をrec1にセットし、reco
rdNoの値を1つ増やして15とする。
【0066】ステップS608でstr2の内容を持つ
レコード番号を作業用記憶手段14から検索するが、図
16(a)に示すように「東京大学」が9番目のレコー
ドに登録されているので、rec2には9がセットされ
る。ステップS609においてrec2の内容は0でな
いので、ステップS612に処理を進める。ステップS
612では、rec2(=9)の指すレコードの上位指
示子が0かどうかを判定する。この上位指示子には13
がセットされているので、処理をステップS614に処
理を進める。ステップS614では、recordNo
(=15)の指す作業用記憶手段14のレコードの見出
しにrec2(=9)の指すレコードの見出し「東京大
学」を設定し、このレコードの同義語指示子にreco
rdNo(=15)の値をセットする。その結果、図1
6(b)の15番目のレコードの値がセットされる。ス
テップS615では、recordNo(=15)の内
容をrec2にセットし、recordNoの内容を1
だけ増やし、ステップS613に処理を進める。ステッ
プS613では、S613でrec2(=15)の指す
作業用記憶手段14のレコードの上位指示子にrec1
の内容(=14)をセットする。その結果、図16
(b)の15番目のレコードの上位指示子に14がセッ
トされる。
レコード番号を作業用記憶手段14から検索するが、図
16(a)に示すように「東京大学」が9番目のレコー
ドに登録されているので、rec2には9がセットされ
る。ステップS609においてrec2の内容は0でな
いので、ステップS612に処理を進める。ステップS
612では、rec2(=9)の指すレコードの上位指
示子が0かどうかを判定する。この上位指示子には13
がセットされているので、処理をステップS614に処
理を進める。ステップS614では、recordNo
(=15)の指す作業用記憶手段14のレコードの見出
しにrec2(=9)の指すレコードの見出し「東京大
学」を設定し、このレコードの同義語指示子にreco
rdNo(=15)の値をセットする。その結果、図1
6(b)の15番目のレコードの値がセットされる。ス
テップS615では、recordNo(=15)の内
容をrec2にセットし、recordNoの内容を1
だけ増やし、ステップS613に処理を進める。ステッ
プS613では、S613でrec2(=15)の指す
作業用記憶手段14のレコードの上位指示子にrec1
の内容(=14)をセットする。その結果、図16
(b)の15番目のレコードの上位指示子に14がセッ
トされる。
【0067】ステップS9において図16(b)の示す
作業用記憶手段のレコードをソートした結果を図17
(a)に示す。ステップS10において図17(c)の
レコードの同義語指示子と上位語指示子のレコード番号
をソード後のレコード番号で置換した結果を図17
(b)に示す。
作業用記憶手段のレコードをソートした結果を図17
(a)に示す。ステップS10において図17(c)の
レコードの同義語指示子と上位語指示子のレコード番号
をソード後のレコード番号で置換した結果を図17
(b)に示す。
【0068】ステップS11において、登録手段17
は、作業用記憶手段14のレコードの情報を表記記憶手
段12と定義体記憶手段13に格納する。その結果の表
記記憶手段12と定義体記憶手段13の内容を図15
(a)(b)に示す。図14の10番目と11番目のレ
コードの表記は「東京大学」であるので、図15(a)
の10番目と11番目のレコードの表記指示子には、共
通のaddr_10を設定する。
は、作業用記憶手段14のレコードの情報を表記記憶手
段12と定義体記憶手段13に格納する。その結果の表
記記憶手段12と定義体記憶手段13の内容を図15
(a)(b)に示す。図14の10番目と11番目のレ
コードの表記は「東京大学」であるので、図15(a)
の10番目と11番目のレコードの表記指示子には、共
通のaddr_10を設定する。
【0069】ステップS12では、定義体記憶手段13
の各レコードの表記(表記指示子が指し示す位置から0
となるまでの文字コード列)を標準表記に変換し、標準
表記の見出しと定義体記憶手段のレコードとの対応関係
をインデックス手段19に登録する。その結果、インデ
ックス手段19の内容は図17(c)に示すような内容
になる。実施例1の場合と比較すると「Tokyo」の
標準表記「tokyo」が追加されている。
の各レコードの表記(表記指示子が指し示す位置から0
となるまでの文字コード列)を標準表記に変換し、標準
表記の見出しと定義体記憶手段のレコードとの対応関係
をインデックス手段19に登録する。その結果、インデ
ックス手段19の内容は図17(c)に示すような内容
になる。実施例1の場合と比較すると「Tokyo」の
標準表記「tokyo」が追加されている。
【0070】
【発明の効果】以上、詳細に説明したように、本発明
(請求項1)によれば、一般的な編集装置で作成可能な
簡単に入力できる形式で表された関連語から、関連語の
要素となるそれぞれの語が見出し語となる一つのレコー
ドに保持され、関連語に対する関連の関係を他の一つの
レコードへのリンク情報によって表すようにし、関連語
はリンク情報によるレコードの連鎖によって定義される
ように辞書を作成する。従って従来技術のような見出し
語の表記を重複して格納する無駄を防ぐことができ、辞
書のサイズをコンパクトにすることができる。また、上
位下位の関係を同義語群の一つの語に設定すればよいよ
うに辞書を構成しておりさらに辞書のサイズを小さくで
きる。本発明によれば、関連語辞書作成の元となる関連
語定義情報は、一般的な編集装置で作成可能な簡単な形
式のものでよく、また作成される関連語辞書の構造がコ
ンパクトなものであるので、比較的高速にかつ容易に関
連語の辞書を作成することができる。
(請求項1)によれば、一般的な編集装置で作成可能な
簡単に入力できる形式で表された関連語から、関連語の
要素となるそれぞれの語が見出し語となる一つのレコー
ドに保持され、関連語に対する関連の関係を他の一つの
レコードへのリンク情報によって表すようにし、関連語
はリンク情報によるレコードの連鎖によって定義される
ように辞書を作成する。従って従来技術のような見出し
語の表記を重複して格納する無駄を防ぐことができ、辞
書のサイズをコンパクトにすることができる。また、上
位下位の関係を同義語群の一つの語に設定すればよいよ
うに辞書を構成しておりさらに辞書のサイズを小さくで
きる。本発明によれば、関連語辞書作成の元となる関連
語定義情報は、一般的な編集装置で作成可能な簡単な形
式のものでよく、また作成される関連語辞書の構造がコ
ンパクトなものであるので、比較的高速にかつ容易に関
連語の辞書を作成することができる。
【0071】また、本発明(請求項4、請求項6、請求
項7)によれば、前記発明(請求項1)と同様の効果を
奏するとともに、さらに、作業用記憶手段を用いて関連
語辞書の見出し語の表記を含むレコードを一旦作成し、
それを基に関連語辞書の定義体記憶手段と表記記憶手段
に登録するようにしたので、作成が効率的である。な
お、レコードの見出し語情報に見出し語の表記を記憶す
る表記記憶部への表記指示子(ポインタ)を設定し、レ
コードを固定長としたので、本発明によって作成される
関連語辞書装置は、関連語検索時のアドレス計算が容易
となり関連語の検索を高速化することができる。
項7)によれば、前記発明(請求項1)と同様の効果を
奏するとともに、さらに、作業用記憶手段を用いて関連
語辞書の見出し語の表記を含むレコードを一旦作成し、
それを基に関連語辞書の定義体記憶手段と表記記憶手段
に登録するようにしたので、作成が効率的である。な
お、レコードの見出し語情報に見出し語の表記を記憶す
る表記記憶部への表記指示子(ポインタ)を設定し、レ
コードを固定長としたので、本発明によって作成される
関連語辞書装置は、関連語検索時のアドレス計算が容易
となり関連語の検索を高速化することができる。
【0072】また、本発明(請求項2、請求項5)によ
れば、関連語のレコードを見出しによりソートすること
により二分探索を可能にする配置にレコードを並びか
え、検索をより高速化することができ、従って関連語辞
書も比較的高速に作成することができる。
れば、関連語のレコードを見出しによりソートすること
により二分探索を可能にする配置にレコードを並びか
え、検索をより高速化することができ、従って関連語辞
書も比較的高速に作成することができる。
【0073】また、本発明(請求項3、請求項8)によ
れば、定義体記憶手段には表記記憶手段への表記指示子
を設定し、表記記憶手段には表記の内容を重複なく設定
できるので、それらを基に作成する標準表記のインデッ
クス手段の作成は効率的となる。
れば、定義体記憶手段には表記記憶手段への表記指示子
を設定し、表記記憶手段には表記の内容を重複なく設定
できるので、それらを基に作成する標準表記のインデッ
クス手段の作成は効率的となる。
【図1】 本発明の実施例1にかかわる装置の概略構成
図である。
図である。
【図2】 実施例1にかかわる関連語辞書のマスターの
内容を示す図である。
内容を示す図である。
【図3】 図2の関連語辞書の内容の概念的な構造を示
す図である。
す図である。
【図4】 図2、図3の関連語の関係をレコード番号の
連結とした概念図である。
連結とした概念図である。
【図5】 図4の関連語辞書のレコードの物理的な構造
の一例を示す図である。
の一例を示す図である。
【図6】(a)は実施例1において同義語のレコードを
作成した時の作業用記憶手段の内容を示す図、(b)は
実施例1において同義語のレコードの作成語に上位語の
レコードの情報を設定した時の作業用記憶手段の内容を
示す図である。
作成した時の作業用記憶手段の内容を示す図、(b)は
実施例1において同義語のレコードの作成語に上位語の
レコードの情報を設定した時の作業用記憶手段の内容を
示す図である。
【図7】(a)(b)は、実施例1のカタカナ表記の変
換ルールを示す図、(c)はインデックス手段の内容例
を示す図である。
換ルールを示す図、(c)はインデックス手段の内容例
を示す図である。
【図8】 実施例1の動作を説明するフローチャートで
ある。
ある。
【図9】 実施例1における同義語のレコード情報を作
業用記憶手段に設定する動作を説明するフローチャート
である。
業用記憶手段に設定する動作を説明するフローチャート
である。
【図10】 実施例1における上位下位の情報を作業用
記憶手段に設定する動作を説明するフローチャートであ
る。
記憶手段に設定する動作を説明するフローチャートであ
る。
【図11】 実施例1における登録手段の登録動作を説
明するフローチャートである。
明するフローチャートである。
【図12】(a)実施例1においてソート手段でソート
された直後の作業用記憶手段の内容を示す図、(b)は
同義語指示子と上位語指示子のレコード番号をソート後
のレコード番号で置換した時の作業用記憶手段の内容を
示す図である。
された直後の作業用記憶手段の内容を示す図、(b)は
同義語指示子と上位語指示子のレコード番号をソート後
のレコード番号で置換した時の作業用記憶手段の内容を
示す図である。
【図13】(a)は実施例2にかかわる関連語のマスタ
ーの内容を示した図、(b)は(a)の関連語辞書の内
容の概念的な構造を示す図である。
ーの内容を示した図、(b)は(a)の関連語辞書の内
容の概念的な構造を示す図である。
【図14】 図13(a)(b)の関連語の関係をレコ
ード番号の連結とした概念図である。
ード番号の連結とした概念図である。
【図15】 図14の関連語辞書のレコードの物理的な
構造の一例を示す図である。
構造の一例を示す図である。
【図16】 (a)(b)は実施例2における作業用記
憶手段の内容を示す図である。
憶手段の内容を示す図である。
【図17】 (a)は実施例2においてソート手段でソ
ートされた直後の作業用記憶手段の内容を示す図、
(b)は同義語指示子と上位語指示子のレコード番号を
ソート後のレコード番号で置換した時の作業用記憶手段
の内容を示す図、(c)は実施例2におけるインデック
ス手段の内容例を示す図である。
ートされた直後の作業用記憶手段の内容を示す図、
(b)は同義語指示子と上位語指示子のレコード番号を
ソート後のレコード番号で置換した時の作業用記憶手段
の内容を示す図、(c)は実施例2におけるインデック
ス手段の内容例を示す図である。
11…関連語マスター記憶手段(関連語定義情報記憶手
段)、12…表記記憶手段、13…定義体記憶手段、1
4…作業用記憶手段、15…関連語情報設定手段、16
…登録手段、17…ソート手段、18…標準表記手段、
19…インデックス手段。
段)、12…表記記憶手段、13…定義体記憶手段、1
4…作業用記憶手段、15…関連語情報設定手段、16
…登録手段、17…ソート手段、18…標準表記手段、
19…インデックス手段。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 山口 浩 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&Dビジネスパークビル 富 士ゼロックス株式会社内 (72)発明者 喜多 辰臣 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&Dビジネスパークビル 富 士ゼロックス株式会社内 (72)発明者 川本 真司 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&Dビジネスパークビル 富 士ゼロックス株式会社内 (72)発明者 相原 一雄 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&Dビジネスパークビル 富 士ゼロックス株式会社内 (72)発明者 松尾 裕子 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&Dビジネスパークビル 富 士ゼロックス株式会社内 (72)発明者 平岡 直美 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&Dビジネスパークビル 富 士ゼロックス株式会社内
Claims (8)
- 【請求項1】 関連する語の集合と要素間の関係を示す
関連語の定義情報を記憶する関連語定義情報記憶手段
と、 複数のレコードからなり、その各レコードは1つの見出
し語情報とその見出し語情報に関連する他の見出し語情
報を持つレコードへのリンク情報を1つ有するものであ
り、前記リンク情報によるレコード間のリンクによって
関連語が定義された関連語辞書を記憶する関連語辞書手
段と、 前記関連語定義情報記憶手段から1つずつ定義情報を読
み込み定義情報中の各語に対して見出し語の表記を関連
語辞書記憶手段のレコードの見出しに設定し、さらに要
素間の関係が同義関係のものに対しては閉環連鎖となる
ようにリンク情報を設定し、要素間の関係が上位下位関
係のものに対しては上位方向のリンク情報を設定する関
連語情報設定手段とを備えたことを特徴とする関連語辞
書作成装置。 - 【請求項2】 前記関連語辞書記憶手段中のレコードを
見出しでソートしソート前のリンク情報をソート後のも
のに付け替えるソート手段をさらに備えたことを特徴と
する請求項1記載の関連語辞書作成装置。 - 【請求項3】 与えられた文字列の表記を標準表記に変
換する標準表記手段と、 標準表記の見出しと前記関連語辞書記憶手段のレコード
の対応を保持するインデックス手段と、 をさらに備えたことを特徴とする請求項1または請求項
2記載の関連語辞書作成装置。 - 【請求項4】 関連する語の集合と要素間の関係を示す
関連語の定義情報を記憶する関連語定義情報記憶手段
と、 複数の見出し語の表記を記憶する表記記憶手段と、 複数の固定長のレコードからなり、その各レコードは1
つの見出し語の表記を指示する表記指示子と、その見出
し語と同義の他の見出し語に関するレコードを1つだけ
指示する同義語指示子とその見出し語に対して上位の他
の見出し語のレコードを1つだけ指示する上位語指示子
を含み、複数のレコードの同義語指示子による指示関係
の閉環連鎖によって見出し語の同義関係が定義された定
義体と複数のレコードの上位語指示子による指示関係の
連鎖によって見出し語の上位下位関係が定義された定義
体を記憶する定義体記憶手段と、 複数のレコードからなり、その各レコードは、見出し語
の表記とレコード番号と同義語指示子と上位語指示子を
有する作業用記憶手段と、 前記関連語定義情報記憶手段から定義情報を一つずつ読
み込み、定義情報中の各語に対して見出し語の表記とレ
コード番号を前記作業用記憶手段のレコードに設定し、
さらに要素間の関係が同義関係のものに対しては閉環連
鎖となるように同義語指示子にレコード番号を設定し、
要素間の関係が上位下位関係のものに対しては下位語の
レコードの上位語指示子に上位語のレコードの番号を設
定する関連語情報設定手段と、 前記作業用記憶手段のレコードの表記を前記表記記憶手
段に重複なく登録し、前記表記記憶手段における表記の
位置を示す表記指示子と同義語指示子と上位語指示子と
を定義体記憶手段に登録する登録手段とを備えたことを
特徴とする関連語辞書作成装置。 - 【請求項5】 前記作業用記憶手段中のレコードを見出
しでソートし、ソート前の指示子をソート後のものに付
け替えるソート手段をさらに備え、前記登録手段はソー
ト手段によりソートした前記作業用記憶手段のレコード
の内容を登録することを特徴とする請求項4記載の関連
語辞書作成装置。 - 【請求項6】 前記定義体記憶手段は表記指示子と同義
語指示子のみを含み、前記登録手段は表記指示子と同義
語指示子を定義体記憶手段に登録することを特徴とする
請求項4または請求項5の関連語辞書作成装置。 - 【請求項7】 前記定義体記憶手段は表記指示子と上位
語指示子のみを含み、前記登録手段は表記指示子と上位
語指示子を定義体記憶手段に登録することを特徴とする
請求項4または請求項5の関連語辞書作成装置。 - 【請求項8】 与えられた文字列の表記を標準表記に変
換する標準表記手段と、標準表記の見出しと定義体記憶
手段のレコードの対応を保持したインデックス手段をさ
らに備え、前記定義体記憶手段の表記指示子が指示する
表記を標準表記に変換した標準表記と前記定義体記憶手
段のレコードの対応関係を前記インデックス手段に保持
することを特徴とする請求項4、請求項5、請求項6、
または請求項7のいずれか1項に記載の関連語辞書作成
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7109135A JPH08287080A (ja) | 1995-04-11 | 1995-04-11 | 関連語辞書作成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7109135A JPH08287080A (ja) | 1995-04-11 | 1995-04-11 | 関連語辞書作成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08287080A true JPH08287080A (ja) | 1996-11-01 |
Family
ID=14502480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7109135A Pending JPH08287080A (ja) | 1995-04-11 | 1995-04-11 | 関連語辞書作成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08287080A (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5924379A (ja) * | 1982-07-30 | 1984-02-08 | Canon Inc | 電子機器 |
JPH02244380A (ja) * | 1989-03-17 | 1990-09-28 | Nec Corp | データベースシステム |
JPH06266769A (ja) * | 1993-03-15 | 1994-09-22 | Toshiba Corp | 同義語情報作成装置 |
-
1995
- 1995-04-11 JP JP7109135A patent/JPH08287080A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5924379A (ja) * | 1982-07-30 | 1984-02-08 | Canon Inc | 電子機器 |
JPH02244380A (ja) * | 1989-03-17 | 1990-09-28 | Nec Corp | データベースシステム |
JPH06266769A (ja) * | 1993-03-15 | 1994-09-22 | Toshiba Corp | 同義語情報作成装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
USRE48030E1 (en) | Computer-implemented system and method for tagged and rectangular data processing | |
US5778400A (en) | Apparatus and method for storing, searching for and retrieving text of a structured document provided with tags | |
JP2020080025A (ja) | 質問応答データ生成装置および質問応答データ生成方法 | |
JP3028738B2 (ja) | 文書共通論理情報編集装置 | |
Furuta et al. | Automatically transforming regularly structured linear documents into hypertext. | |
JP3337161B2 (ja) | 構造化文書を編集するための方法 | |
Gephart et al. | Qualitative Data Analysis: Three Microcomputer-Supported Approaches. | |
JPH08287080A (ja) | 関連語辞書作成装置 | |
JPH09282218A (ja) | Html文書本型整形方法及びその装置 | |
JPS60100223A (ja) | 索引自動作成機能を有する文書作成・管理装置 | |
JPH08263521A (ja) | 文書登録検索システム | |
JPH0877196A (ja) | 文書情報抽出装置 | |
Roberts | Help: a question answering system | |
JP2000090083A (ja) | 文書処理装置および明細書処理装置 | |
Johnson | Computer aids for comparative dictionaries | |
Milosavljevic et al. | XML schema of UNIMARC format variant and bibliographic record in BISIS software system | |
JP2003288365A (ja) | 付加情報管理方法及び付加情報管理システム | |
JPH08115340A (ja) | 文書検索装置およびそれに用いるインデックスファイルの作成装置 | |
JPH1153400A (ja) | 構造化文書検索装置及びプログラムを記録した機械読み取り可能な記録媒体 | |
JPH0362128A (ja) | データ内容の出力方式 | |
JPH04211868A (ja) | Cd―romデータの検索用キーワードの作成方法 | |
JPS6366665A (ja) | 文書解析整形装置 | |
Casey | Euronet‐DIANE: a study on the harmonisation of user manuals | |
JPH08314958A (ja) | 議会議事録検索システムにおけるデータ登録方法 | |
JP4334450B2 (ja) | 構造化文書検索装置及び構造化文書検索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040309 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050614 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050830 |