JPH096789A - 分野別シソーラス生成装置 - Google Patents
分野別シソーラス生成装置Info
- Publication number
- JPH096789A JPH096789A JP7155882A JP15588295A JPH096789A JP H096789 A JPH096789 A JP H096789A JP 7155882 A JP7155882 A JP 7155882A JP 15588295 A JP15588295 A JP 15588295A JP H096789 A JPH096789 A JP H096789A
- Authority
- JP
- Japan
- Prior art keywords
- thesaurus
- word
- field
- unit
- specific
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 特定分野を定義する入力文から、汎用シソー
ラスに基づき特定分野に関係しない不適切な語を取り除
いた分野別シソーラスを構築する。 【構成】 特定分野に関する複数の文を入力する文入力
部11と単語辞書17を用い形態素解析を行なう形態素
解析部12と、構文解析を行なう構文解析部13と、前
記構文解析部による解析結果を蓄積する構文解析結果蓄
積部14と、単語の出現頻度に応じて単語ごとの得点を
算出する単語得点算出部15と、前記単語得点算出部1
5により算出された結果を基に、汎用シソーラス18か
ら分野別シソーラス19を生成する分野別シソーラス生
成部19により構成される。
ラスに基づき特定分野に関係しない不適切な語を取り除
いた分野別シソーラスを構築する。 【構成】 特定分野に関する複数の文を入力する文入力
部11と単語辞書17を用い形態素解析を行なう形態素
解析部12と、構文解析を行なう構文解析部13と、前
記構文解析部による解析結果を蓄積する構文解析結果蓄
積部14と、単語の出現頻度に応じて単語ごとの得点を
算出する単語得点算出部15と、前記単語得点算出部1
5により算出された結果を基に、汎用シソーラス18か
ら分野別シソーラス19を生成する分野別シソーラス生
成部19により構成される。
Description
【0001】
【産業上の利用分野】本発明は、汎用シソーラスから分
野別シソーラスを生成する分野別シソーラス生成装置に
関するものである。
野別シソーラスを生成する分野別シソーラス生成装置に
関するものである。
【0002】
【従来の技術】従来、汎用シソーラスから自動的に分野
別のシソーラスを生成する際、不適切な語までもが混入
するという問題があり、その不適切な語を取り除くため
に人手による作業が必要とされその生成が大変であっ
た。
別のシソーラスを生成する際、不適切な語までもが混入
するという問題があり、その不適切な語を取り除くため
に人手による作業が必要とされその生成が大変であっ
た。
【0003】
【発明が解決しようとする課題】本発明は汎用シソーラ
スからの分野別シソーラス生成における上記のような欠
点に対して、特定分野に関する複数の文を単語辞書によ
り形態素解析および構文解析した結果をもとに、各単語
の出現頻度に応じて単語得点算出を行い単語得点算出結
果を利用して分野別シソーラスを生成することにより、
不適切な単語が混入しない分野別シソーラスを構築する
事を可能にする。
スからの分野別シソーラス生成における上記のような欠
点に対して、特定分野に関する複数の文を単語辞書によ
り形態素解析および構文解析した結果をもとに、各単語
の出現頻度に応じて単語得点算出を行い単語得点算出結
果を利用して分野別シソーラスを生成することにより、
不適切な単語が混入しない分野別シソーラスを構築する
事を可能にする。
【0004】
【課題を解決するための手段】不適切な語が混入しない
分野別シソーラスを構築するために本発明では、特定分
野に関する複数の文を形態素解析および構文解析結果か
ら各単語の出現頻度に応じて単語得点算出する手段を有
する。
分野別シソーラスを構築するために本発明では、特定分
野に関する複数の文を形態素解析および構文解析結果か
ら各単語の出現頻度に応じて単語得点算出する手段を有
する。
【0005】
【作用】本発明の構成によれば、汎用シソーラスから自
動的に分野別のシソーラスを構築する際、不適切な単語
が混入しない分野別シソーラスを構築する事を可能にす
る。
動的に分野別のシソーラスを構築する際、不適切な単語
が混入しない分野別シソーラスを構築する事を可能にす
る。
【0006】
(実施例1)以下、本発明の実施例について説明する。
図1は本発明の一実施例における分野別シソーラス生成
装置の全体構成の中核を示すブロック図である。
図1は本発明の一実施例における分野別シソーラス生成
装置の全体構成の中核を示すブロック図である。
【0007】本発明の分野別シソーラス生成装置は、特
定分野に関する複数の文を入力する文入力部11と単語
辞書17を用い形態素解析を行なう形態素解析部12
と、構文解析を行なう構文解析部13と、前記構文解析
部による解析結果を蓄積する構文解析結果蓄積部14
と、単語の出現頻度に応じて単語ごとの得点を算出する
単語得点算出部15と前記単語得点算出部15により算
出された結果を基に汎用シソーラス18から分野別シソ
ーラス19を生成する分野別シソーラス生成部16をを
有する。
定分野に関する複数の文を入力する文入力部11と単語
辞書17を用い形態素解析を行なう形態素解析部12
と、構文解析を行なう構文解析部13と、前記構文解析
部による解析結果を蓄積する構文解析結果蓄積部14
と、単語の出現頻度に応じて単語ごとの得点を算出する
単語得点算出部15と前記単語得点算出部15により算
出された結果を基に汎用シソーラス18から分野別シソ
ーラス19を生成する分野別シソーラス生成部16をを
有する。
【0008】以下、本発明の第1の実施例について詳細
を説明する。まず、分野別のシソーラスを得るために特
定分野に関する複数の文を入力する。図2の例では分野
「鳥」に関する文1、2、3、4を用意しこれらを文入
力部11から入力し、単語辞書17を用いて形態素解析
部12により形態素解析し、さらに構文解析部13によ
り構文解析を行い、その結果を構文解析蓄積部14に格
納する。
を説明する。まず、分野別のシソーラスを得るために特
定分野に関する複数の文を入力する。図2の例では分野
「鳥」に関する文1、2、3、4を用意しこれらを文入
力部11から入力し、単語辞書17を用いて形態素解析
部12により形態素解析し、さらに構文解析部13によ
り構文解析を行い、その結果を構文解析蓄積部14に格
納する。
【0009】すべての文について上記手順を繰り返す。
結果、構文解析結果蓄積部14に格納されたデータを用
い、単語得点算出部15において単語の得点を算出す
る。図2の例では「カラス」という単語が3回出現して
いる。よって、単語「カラス」に3点なる得点を与え
る。同様の手順を出現した全ての単語に関して行う。
結果、構文解析結果蓄積部14に格納されたデータを用
い、単語得点算出部15において単語の得点を算出す
る。図2の例では「カラス」という単語が3回出現して
いる。よって、単語「カラス」に3点なる得点を与え
る。同様の手順を出現した全ての単語に関して行う。
【0010】次に、分野別シソーラス生成部16によ
り、単語得点算出部により算出された得点に基づいて、
特定分野特徴を表す単語を同定し、汎用シソーラス18
から分野別シソーラス19を生成する。図2の例では、
単語得点算出部15により算出された得点に基づいて、
単語「鳥」、「カラス」、「スズメ」が特定分野「鳥」
に関する特徴を表す単語として同定され、分野別シソー
ラス生成部16により、単語、「飛ぶ」、「写真」など
の適切でない単語を含まない分野別シソーラスを生成す
ることができる。
り、単語得点算出部により算出された得点に基づいて、
特定分野特徴を表す単語を同定し、汎用シソーラス18
から分野別シソーラス19を生成する。図2の例では、
単語得点算出部15により算出された得点に基づいて、
単語「鳥」、「カラス」、「スズメ」が特定分野「鳥」
に関する特徴を表す単語として同定され、分野別シソー
ラス生成部16により、単語、「飛ぶ」、「写真」など
の適切でない単語を含まない分野別シソーラスを生成す
ることができる。
【0011】(実施例2)以下、本発明の第2の実施例
について詳細を説明する。まず、分野別のシソーラスを
得るために特定分野に関する複数の文を入力する。図3
の例では分野「鳥」に関する文1、2、3、4を用意し
これらを文入力部11から入力し、単語辞書17を用い
て形態素解析部12により形態素解析し、さらに構文解
析部13により構文解析を行い、その結果を構文解析結
果蓄積部14に格納する。
について詳細を説明する。まず、分野別のシソーラスを
得るために特定分野に関する複数の文を入力する。図3
の例では分野「鳥」に関する文1、2、3、4を用意し
これらを文入力部11から入力し、単語辞書17を用い
て形態素解析部12により形態素解析し、さらに構文解
析部13により構文解析を行い、その結果を構文解析結
果蓄積部14に格納する。
【0012】すべての文について上記手順を繰り返す。
結果、構文解析結果蓄積部14に格納されたデータを用
い、単語得点算出部15において単語の得点を算出す
る。図2の例では「カラス」という単語が3回出現して
いる。よって、単語「カラス」に3点なる得点を与え
る。同様の手順を出現した全ての単語に関して行う。さ
らに、単語の共出パターンを用いて単語得点の算出を行
い、算出された得点に基づいて、特定分野特徴を表す単
語を同定し、汎用シソーラス18から分野別シソーラス
19を生成する。
結果、構文解析結果蓄積部14に格納されたデータを用
い、単語得点算出部15において単語の得点を算出す
る。図2の例では「カラス」という単語が3回出現して
いる。よって、単語「カラス」に3点なる得点を与え
る。同様の手順を出現した全ての単語に関して行う。さ
らに、単語の共出パターンを用いて単語得点の算出を行
い、算出された得点に基づいて、特定分野特徴を表す単
語を同定し、汎用シソーラス18から分野別シソーラス
19を生成する。
【0013】図3の例では、頻出する単語「カラス」、
「スズメ」と共出する単語にそれぞれα、βなる得点を
加算することにより、単語「鳥」、「カラス」、「スズ
メ」が特定分野「鳥」に関する特徴を表す単語として同
定され、分野別シソーラス生成部16により、分野別シ
ソーラスを生成することができる。
「スズメ」と共出する単語にそれぞれα、βなる得点を
加算することにより、単語「鳥」、「カラス」、「スズ
メ」が特定分野「鳥」に関する特徴を表す単語として同
定され、分野別シソーラス生成部16により、分野別シ
ソーラスを生成することができる。
【0014】(実施例3)以下、本発明の第3の実施例
について詳細を説明する。まず、分野別のシソーラスを
得るために特定分野に関する複数の文を入力する。図3
の例では分野「鳥」に関する文1、2、3、4を用意し
これらを文入力部11から入力し、単語辞書17を用い
て形態素解析部12により形態素解析し、さらに構文解
析部13により構文解析を行い、その結果を構文解析結
果蓄積部14に格納する。すべての文について上記手順
を繰り返す。結果、構文解析蓄積部15に格納されたデ
ータを用い、単語得点算出部15において単語の得点を
算出する。
について詳細を説明する。まず、分野別のシソーラスを
得るために特定分野に関する複数の文を入力する。図3
の例では分野「鳥」に関する文1、2、3、4を用意し
これらを文入力部11から入力し、単語辞書17を用い
て形態素解析部12により形態素解析し、さらに構文解
析部13により構文解析を行い、その結果を構文解析結
果蓄積部14に格納する。すべての文について上記手順
を繰り返す。結果、構文解析蓄積部15に格納されたデ
ータを用い、単語得点算出部15において単語の得点を
算出する。
【0015】図2の例では「カラス」という単語が3回
出現している。よって、単語「カラス」に3点なる得点
を与える。同様の手順を出現した全ての単語に関して行
う。さらに、シソーラスの階層構造を用いて単語得点の
算出を行い、算出された得点に基づいて、特定分野特徴
を表す単語を同定し、汎用シソーラス18から分野別シ
ソーラス19を生成する。
出現している。よって、単語「カラス」に3点なる得点
を与える。同様の手順を出現した全ての単語に関して行
う。さらに、シソーラスの階層構造を用いて単語得点の
算出を行い、算出された得点に基づいて、特定分野特徴
を表す単語を同定し、汎用シソーラス18から分野別シ
ソーラス19を生成する。
【0016】図4の例では、単語「カラス」、「スズ
メ」の得点を、上位概念である単語「鳥」に得点を加算
することにより、単語「鳥」、「カラス」、「スズメ」
が特定分野「鳥」に関する特徴を表す単語として同定さ
れ、分野別シソーラスを生成することができる。
メ」の得点を、上位概念である単語「鳥」に得点を加算
することにより、単語「鳥」、「カラス」、「スズメ」
が特定分野「鳥」に関する特徴を表す単語として同定さ
れ、分野別シソーラスを生成することができる。
【0017】
【発明の効果】以上、本発明が提供する手段によれば、
一般的に入手できる汎用シソーラスから、特定分野に関
する複数の文を用い、出現する単語の頻度、シソーラス
の階層構造、出現する単語の供出パターンを用いて単語
得点を算出することにより不適切な語を含まない分野別
シソーラスを自動的に生成することができる。
一般的に入手できる汎用シソーラスから、特定分野に関
する複数の文を用い、出現する単語の頻度、シソーラス
の階層構造、出現する単語の供出パターンを用いて単語
得点を算出することにより不適切な語を含まない分野別
シソーラスを自動的に生成することができる。
【0018】また、実施例1から3で説明した手段を任
意に組み合わせて、単語得点化の算出をすることは実施
例の説明からも明らかである。
意に組み合わせて、単語得点化の算出をすることは実施
例の説明からも明らかである。
【0019】また、本発明の各装置をソフトウェアによ
り実現し、計算機上で実現できることは実施例の説明か
らも明らかである。
り実現し、計算機上で実現できることは実施例の説明か
らも明らかである。
【図1】本発明の一実施例における分野別シソーラス生
成装置の構成を示すブロック図
成装置の構成を示すブロック図
【図2】本発明の第1の実施例1における分野別シソー
ラス生成を示す概念図
ラス生成を示す概念図
【図3】本発明の第2の実施例1における分野別シソー
ラス生成を示す概念図
ラス生成を示す概念図
【図4】本発明の第3の実施例1における分野別シソー
ラス生成を示す概念図
ラス生成を示す概念図
11 文入力装置 12 形態素解析部 13 構文解析部 14 構文解析結果蓄積部 15 単語得点算出部 16 分野別シソーラス生成部 17 単語辞書 18 汎用シソーラス 19 分野別シソーラス
Claims (3)
- 【請求項1】 特定分野に関する複数の文を入力する文
入力部と、単語辞書を用い形態素解析を行なう形態素解
析部と、構文解析を行なう構文解析部と、前記構解析部
による解析結果を蓄積する構文解析結果蓄積部と、前記
構文解析結果蓄積部に格納された単語に基づいて汎用シ
ソーラスから分野別シソーラスを生成する分野別シソー
ラス生成部とを有する分野別シソーラス生成装置におい
て、 前記構文解析結果蓄積部に格納された単語の出現頻度に
応じて単語ごとに得点を算出する単語得点算出部を有す
ることにより、前記特定分野を定義する単語を同定し、
不適切な語を含まない分野別特徴を持つシソーラスを生
成することを特徴とする分野別シソーラス生成装置。 - 【請求項2】 単語得点算出部が出現する単語の共出パ
ターンを用いて単語得点算出を行うことを特徴とする請
求項1記載の分野別シソーラス生成装置。 - 【請求項3】 単語得点算出部がシソーラスの階層構造
を用いて単語得点算出を行うことを特徴とする請求項1
記載の分野別シソーラス生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7155882A JPH096789A (ja) | 1995-06-22 | 1995-06-22 | 分野別シソーラス生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7155882A JPH096789A (ja) | 1995-06-22 | 1995-06-22 | 分野別シソーラス生成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH096789A true JPH096789A (ja) | 1997-01-10 |
Family
ID=15615572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7155882A Pending JPH096789A (ja) | 1995-06-22 | 1995-06-22 | 分野別シソーラス生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH096789A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6282509B1 (en) | 1997-11-18 | 2001-08-28 | Fuji Xerox Co., Ltd. | Thesaurus retrieval and synthesis system |
WO2003042869A1 (fr) * | 2001-11-14 | 2003-05-22 | Jam Corporation | Appareil de support de recherche d'informations, programme informatique et support contenant ledit programme |
-
1995
- 1995-06-22 JP JP7155882A patent/JPH096789A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6282509B1 (en) | 1997-11-18 | 2001-08-28 | Fuji Xerox Co., Ltd. | Thesaurus retrieval and synthesis system |
WO2003042869A1 (fr) * | 2001-11-14 | 2003-05-22 | Jam Corporation | Appareil de support de recherche d'informations, programme informatique et support contenant ledit programme |
JPWO2003042869A1 (ja) * | 2001-11-14 | 2005-03-10 | 株式会社ジャム | 情報検索支援装置、コンピュータプログラム、プログラム格納媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Schubert et al. | From English to logic: Context-free computation of ‘conventional’logical translation | |
Bharati et al. | Parsing free word order languages in the Paninian framework | |
US5528491A (en) | Apparatus and method for automated natural language translation | |
Thompson et al. | REL: A rapidly extensible language system | |
Ballard et al. | Semantic acquisition in TELI: A transportable, user-customized natural language processor | |
JP2609173B2 (ja) | 用例主導型機械翻訳方法 | |
Androutsopoulos et al. | Database interfaces | |
Tomita et al. | Sentence disambiguation by asking | |
McRoy et al. | YAG: A template-based generator for real-time systems | |
Jacobs | Generation in a Natural Language Interface. | |
JPH096789A (ja) | 分野別シソーラス生成装置 | |
Nirenburg et al. | Interlingua design for TRANSLATOR | |
McRoy et al. | Creating natural language ouput for real-time applications | |
Kaji | 4.3 HICATS/JE: A Japanese-to-English Machine Translation System Based on Semantics | |
Bateman | Towards Meaning-Based Machine Translation: using abstractions from text generation for preserving meaning | |
JP3113257B2 (ja) | 機械翻訳装置 | |
Sinowitz | DATAPLUS: A Language for Real Time Information Retrieval from Hierarchical Data Bases | |
JP3892227B2 (ja) | 機械翻訳システム | |
JPH0157829B2 (ja) | ||
TROST et al. | VIE-LANG: a German language dialogue system | |
Friedman et al. | Evaluating English Sentences in a Logical Model | |
Eeg-Olofsson | Software Systems for Computational Morphology—An Overview | |
JPS61260367A (ja) | 機械翻訳システム | |
JPS63182775A (ja) | 機械翻訳装置 | |
Lonsdale | A Categorial Grammar fragment for Lushootseed |