JPH10124527A - 用語対応付け方法及び装置 - Google Patents

用語対応付け方法及び装置

Info

Publication number
JPH10124527A
JPH10124527A JP8284136A JP28413696A JPH10124527A JP H10124527 A JPH10124527 A JP H10124527A JP 8284136 A JP8284136 A JP 8284136A JP 28413696 A JP28413696 A JP 28413696A JP H10124527 A JPH10124527 A JP H10124527A
Authority
JP
Japan
Prior art keywords
term
mapping
controlled
terms
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8284136A
Other languages
English (en)
Inventor
Masahiro Oku
雅博 奥
Ryosuke Noda
良輔 野田
Tomosada Hayashi
智定 林
Yoshifumi Nagai
良史 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8284136A priority Critical patent/JPH10124527A/ja
Publication of JPH10124527A publication Critical patent/JPH10124527A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 自由用語と統制用語を1対1で記述していな
くとも、統制用語への変換を行うことができる用語対応
付け方法及び装置を提供する。 【解決手段】 本発明は、無限の可能性のある自由用語
を入力し、入力された自由用語毎にマッピング用語を求
め、求められたマッピング用語で有限個の用語である統
制用語に一致する組み合わせを選択し、当該組み合わせ
に優先度を付与して統制用語を出力する。また、マッピ
ング用語が求められない場合には、単語単位にマッピン
グを行い統制用語に一致する組み合わせを選択し、当該
組み合わせに優先度を付与して統制用語を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、用語対応付け方法
及び装置に係り、特に、ある用語を当該用語に関係する
複数の用語に対応付ける際に、無限の可能性のある入力
用語(以下、自由用語と記す)を有限個の用語(以下、
統制用語と記す)に対応付ける用語対応付け方法及び装
置に関する。
【0002】
【従来の技術】有限個の用語からなる統語用語をキーと
して有するデータベースを検索する際には、利用者から
の入力を統制用語に対応させる必要が生じる。この対応
付けのために以下の2つの方法が用いられている。
【0003】(1) 統制用語の一覧を用意しておき、
利用者からの入力を統制用語に限定する。 (2) 統制用語に対する同義語、類義語を集めた辞書
を用意しておき、入力された用語でこの辞書を検索する
ことによって、入力された用語を統制用語に対応付け
る。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
ような方法では以下のような問題が生じる。上記の
(1)の方法については、統制用語の一覧を確認してか
らでないと、入力ができないため、利用者の負担が大き
く、また、利用者が意図している入力に対応する統制用
語を見いだすのが困難な場合がある。
【0005】また、上記の(2)の方法については、同
義語、類義語のみならず、上位概念の用語等への対応付
けが必要な場合には対応できない。また、対応付けは、
用語単位であるので、用語を構成する単語毎の統制用語
(あるいは、統制用語の一部)への変換は不可能ある。
さらに、全ての用語に対する統制用語を辞書に記述する
ことは不可能である。
【0006】本発明は、上記の点に鑑みなされたもの
で、自由用語と統制用語を1対1で記述していなくと
も、統制用語への変換を行うことができる用語対応付け
方法及び装置を提供することを目的とする。
【0007】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明は、ある用語を当該用
語に関係する複数の用語に対応づける用語対応付け方法
において、無限の可能性のある自由用語を入力し(ステ
ップ1)、入力された自由用語毎にマッピング用語を求
め(ステップ2)、求められたマッピング用語で有限個
の用語である統制用語に一致する組み合わせを選択し
(ステップ3)、統制用語を出力する(ステップ4)。
【0008】また、本発明は、マッピング用語を求める
際に(ステップ2)、入力された自由用語に基づいて、
自由用語、マッピング後用語と該自由用語、該マッピン
グ後用語の用語が意味の上でどのような関係にあるかを
表すマッピング関係と、それらの結び付きの強さを表す
結合指数を取得し、マッピング後用語を出力候補とす
る。
【0009】また、本発明は、マッピング用語を求めら
れない場合に(ステップ2)、入力された自由用語を形
態素解析し、形態素解析により取得した単語単位に、マ
ッピング後用語と該自由用語、該マッピング後用語の用
語が意味の上でどのような関係にあるかを表すマッピン
グ関係と、それらの結び付きの強さを表す結合指数を取
得し、単語単位に得られたマッピング後用語から元の自
由用語に対応する用語列を再構成し、再構成された用語
列を出力候補とする。
【0010】また、本発明は、用語列を再構成する際
に、元の単語数、及び単語の語順に関係なく、用語列を
生成する。また、本発明は、マッピング用語で統制用語
に一致する組み合わせを選択する際に(ステップ3)、
マッピング用語または、単語単位の用語列が統制用語で
あるか否かを、統制用語一覧を参照することにより判定
し、統制用語のみを選択する。
【0011】本発明は、統制用語を出力する際に(ステ
ップ4)、統制用語に優先度を付与する条件を参照し
て、該統制用語の優先度を決定する。また、本発明は、
決定された優先度の高い順に統制用語を出力する。図2
は、本発明の原理構成図である。
【0012】本発明は、ある用語を当該用語に関係する
複数の用語に対応づける用語対応付け装置であって、無
限の可能性のある自由用語を入力する自由用語入力手段
1と、入力された自由用語毎にマッピング用語を求める
マッピング手段60と、マッピング手段60により求め
られたマッピング用語で有限個の用語である統制用語に
一致する組み合わせを選択する統制用語確認手段5と、
統制用語を出力する統制用語出力手段7とを有する。
【0013】また、上記のマッピング手段60は、自由
用語、マッピング後用語と該自由用語、該マッピング後
用語の用語が意味の上でどのような関係にあるかを表す
マッピング関係と、それらの結び付きの強さを表す結合
指数が設定されたマッピング表20と、マッピング表を
入力された自由用語に基づいて、検索し、マッピング後
用語を出力候補とする出力候補取得手段2とを含む。
【0014】また、上記のマッピング手段60は、出力
候補取得手段において、出力候補を求められない場合
に、入力された自由用語を形態素解析する形態素解析手
段4と、形態素解析手段4により取得した単語単位に、
マッピング表を参照し、単語単位にマッピング後用語を
出力候補として取得する単語単位出力候補取得手段3を
含む。
【0015】上記の単語単位出力候補取得手段3は、元
の単語数、及び単語の語順に関係なく、用語列を生成す
る用語列生成手段を含む。また、上記の統制用語確認手
段5は、統制単語の意味に基づいて構成される統制単語
一覧40と、統制単語一覧40を参照してマッピング用
語または、単語単位の用語列が統制用語であるか否か
を、統制用語一覧を参照することにより判定し、統制用
語のみを選択する統制単語選択手段を含む。
【0016】また、所定の条件に基づいて統制用語毎の
優先度が設定されている制御表50と、制御表50を参
照して統制用語に優先度を付与して、統制用語出力手段
に転送する優先度付与手段6とを更に有する。
【0017】また、上記の統制用語出力手段は、優先度
が高い統制用語の順に出力する。上記のように、本発明
は、制限を受けない無限の用語である自由用語の入力を
受け付け、当該自由用語によって、マッピング前用語
(自由用語)とマッピング後用語と、それらのマッピン
グ関係と意味的関係の結合の強さである結合指数が設定
されているマッピング表を検索し、マッピング後用語と
マッピング関係と結合指数を取得し、マッピング後用語
が統制用語であるかを統制用語一覧を参照して判断す
る。また、統制用語にマッピングできなかった場合に
は、入力文字列を単語毎に区切り、それらの単語に品詞
を付与する形態素解析を行い、再度マッピング処理を行
うことにより、単語単位にマッピング後用語へのマッピ
ングを行うことが可能である。これらの処理により、統
制用語のみを最終候補とし、当該最終候補(複数の統制
用語)に対して、優先度を付与し、統制用語を出力す
る。優先度を付与することにより、出力時に、優先度の
高い統制用語から順に出力することが可能となる。
【0018】
【発明の実施の形態】図3は、本発明の用語対応付け装
置の構成を示す。同図に示す用語対応付け装置は、入力
部1、マッピング部2、構成語マッピング部3、形態素
解析部4、統制用語確認部5、優先度付与部6、出力部
7、マッッピング表20、日本語辞書30、統制用語一
覧表40、制御表50から構成される。
【0019】入力部1は、利用者から入力された文字列
である自由用語(マッピング前用語)を取得し、マッピ
ング部2に転送する。マッピング部2は、自由用語によ
ってマッピング表20を検索することによって、統制用
語、または、統制用語が複合語である場合に、当該統制
用語を構成する単語であるマッピング後用語、マッピン
グ前用語とマッピング後用語とが意味の上でどのような
関係であるかを表すマッピング関係と、マッピング前用
語とマッピング後用語との結び付きの強さを表す結合指
数とを取得し、得られたマッピング語用語を出力候補と
する。
【0020】構成語マッピング部3は、マッピング部2
において、統制用語にマッピングできなかった際に、入
力文字列を形態素解析部4によって単語単位に分割し、
さらに、単語単位にマッピング表20を検索することに
よって、単語単位にマッピング後用語へのマッピングを
行い、単語単位に得られたマッピング後用語から元の入
力文字列に対応する用語列を再構成し、当該再構成され
た用語列を出力候補とする。
【0021】形態素解析部4は、日本語辞書30を参照
して、入力文字列を単語単位に区切り、それらの単語に
品詞を付与し、構成語マッピング部3に転送する。統制
用語確認部5は、構成語マッピング部3で取得した出力
候補をキーとして統制用語一覧表40を検索することに
よって出力候補が統制用語であるか否かを判断し、統制
用語のみを最終候補(複数存在することもある)とす
る。
【0022】優先度付与部6は、制御表50を参照する
ことによって統制用語確認部5において取得した最終候
補に対して優先度付けを行う。出力部7は、利用者に対
して優先度が付与された最終候補(統制用語)を提供す
る。
【0023】マッピング表20は、入力文字列の一部を
統制用語または、統制用語の一部に対応づけるもので、
マッピング前用語、マッピング後用語、マッピング関
係、結合指数から構成され、マッピング部2及び構成語
マッピング部3により参照される。
【0024】日本語辞書30は、表記、読み、品詞によ
り構成され、形態素解析部4により参照される。統制用
語一覧表40は、統制用語をその意味に基づいて階層的
に整理したものである。
【0025】制御表50は、マッピングの優先度を決定
するための表であり、マッピングの単位、優先条件から
構成され、優先度付与部6により参照される。次に、上
記の構成における動作を説明する。図4は、本発明の用
語対応付けの一連の動作を示すフローチャートである。
【0026】ステップ101) 入力部1では、利用者
から入力された文字列を取得し、入力文字列をマッピン
グ部2に転送する。 ステップ102) マッピング部2は、入力部1で入力
された入力文字列をキーとしてマッピング表20を検索
することにより、マッピング後用語とマッピング関係
と、結合指数とを取得することを試みる。なお、結合指
数の他にマッピング関係の尤度を用いることも可能であ
るが、以下の説明では、結合指数を用いるものとする。
【0027】ステップ103) さらに、マッピング部
2では、マッピング表20に入力文字列が存在するか否
かによって処理を分ける。存在する場合には、ステップ
105に移行し、存在しない場合には、構成語マッピン
グ部3に制御を移行する。 ステップ104) 構成語マッピング部3は、形態素解
析部4によって、入力文字列を形態素解析し、入力文字
列を構成する単語列を取得する。
【0028】ステップ105) ステップ102におい
て得られたマッピング語用語の全てを出力候補とした
後、これらの出力候補を統制用語確認部5に転送する。 ステップ106) 構成語マッピング部3では、ステッ
プ104で得られた入力文字列を構成する単語1つ1つ
をキーとして、マッピング表20を検索し、当該入力文
字列を構成する単語がマッピング表20に存在する場合
には、該当するレコードの情報を取得する。
【0029】ステップ107) 構成語マッピング部3
では、入力文字列を構成する単語がマッピング表20に
存在するか否かで処理を分ける。存在する場合には、ス
テップ108に移行し、存在しない場合には、その旨を
優先度付与部6に転送し、ステップ117に移行する。
【0030】ステップ108) マッピング表20に入
力文字列を構成する単語がある場合には、構成語マッピ
ング部3では、当該入力文字列の単語の順序を保持した
まま、元の単語とマッピング後単語とを組み合わせ(複
数生成)、得られた文字列全てを出力候補として統制用
語確認部5に転送する。例えば、入力文字列がABCの
3つの単語から構成されており、それぞれのマッピング
後用語がA’,B’とB”,C’であったとする。この
とき、構成語マッピング部3は出力候補として、AB
C’,AB’C,AB’C’,AB”C,AB”C’,
A’BC,A’BC’,A’B’C,A’B’C’,
A’B”C,A’B”C’の11個を統制用語確認部5
に転送する。
【0031】ステップ109) 統制用語確認部5は、
マッピング部2または、構成語マッピング部3で得られ
た出力候補(複数)の1つ1つについて処理を行う。 ステップ110) 統制用語確認部5では、出力候補の
文字列をキーとして統制用語一覧表40を検索し、当該
出力候補文字列が統制用語一覧表40に存在するか否か
をチェックする。
【0032】ステップ111) 統制用語確認部5は、
さらに、出力候補が統制用語一覧表40に存在するか否
かで処理を分ける。存在する場合には、ステップ112
へ移行し、存在しない場合にはステップ113に移行す
る。 ステップ112) 統制用語確認部5では、統制用語一
覧表40に存在する出力候補を最終候補として保存す
る。
【0033】ステップ113) 統制用語確認部5にお
いて、統制用語一覧表40に存在しない出力候補を候補
から除外する。 ステップ114) 統制用語確認部5は、全ての候補に
ついての処理が終了したか否かで処理を分ける。未処理
の候補が存在する場合にはステップ115に移行し、全
ての処理が終了している場合には、最終候補として保存
した全ての候補を優先度付与部6に転送し、ステップ1
16に移行する。
【0034】ステップ115) 統制用語確認部5で
は、出力候補のうち未処理の候補について処理し、ステ
ップ110に移行する。 ステップ116) 優先度付与部6は、最終候補が存在
するか否かで、処理を分ける。存在する場合には、ステ
ップ118に移行し、存在しない場合にはステップ11
7に移行する。
【0035】ステップ117) 優先度付与部6は、マ
ッピング部2や構成語マッピング部3において、統制用
語が得られなかった場合、最終候補なしの情報を出力部
6に転送する。 ステップ118) 優先度付与部6は、最終候補1つ1
つをキーとして制御表50を検索し、最終候補に優先度
付けを行う。そして、優先度が付与された最終候補を出
力部7に転送する。
【0036】ステップ119) 出力部7は、優先度付
与部6から得られた最終候補(最終候補がない場合には
最終候補なしの情報)を利用者に提供し、処理を終了す
る。
【0037】
【実施例】以下、図面と共に本発明の実施例を説明す
る。図5は、本発明の一実施例のマッピング表の例を示
す。同図に示すマッピング表20は、マッピング表を検
索する際のキーとなるマッピング前用語21、マッピン
グ後用語22、マッピング前用語21とマッピング後用
語22との間のマッピング関係23、マッピングの結合
の強さである結合指数24から構成される。
【0038】図6は、本発明の一実施例の日本語辞書の
例を示す。同図に示す日本語辞書30は、日本語辞書3
0を検索する際のキーとなる表記31、表記31の読み
32、表記31の品詞33より構成される。図7は、本
発明の一実施例の統制用語一覧表の一部の例である。
【0039】図8は、本発明の一実施例の制御表の例を
示す。制御表50は、送られてきた最終候補がマッピン
グ部2において、出力候補とされたものなのか、あるい
は構成語マッピング部3において出力候補とされたのか
によって優先条件を変えるためのマッピング単位51、
最初に優先度を付与する際に使用する第1優先条件5
2、同一の第1優先条件を有する最終候補に対して優先
度を付与するための第2優先条件53から構成される。
【0040】以下に具体的な例を用いて図4のフローチ
ャートに基づいて本実施例を説明する。 [入力文字列が「うどん屋」の場合]入力文字列「うど
ん屋」は、入力部1において取得され、マッピング部2
に転送される(ステップ101)。
【0041】マッピング部2では、入力文字列「うどん
屋」をキーとしてマッピング表20を検索する。マッピ
ング表20の内容は、図5に示すとおりである。従っ
て、「うどん屋」に対して(マッピング後用語、マッピ
ング関係、結合指数)の3つ組として(うどん・そば
店、同義、1.0)と(日本料理店、上位概念、0.
5)の2つが得られる(ステップ102)。
【0042】マッピング表20から情報が得られたの
で、この2つの情報を出力候補として統制用語確認部5
に転送する(ステップ103、105)。統制用語確認
部5では、それぞれの出力候補について処理を行う(ス
テップ109)。
【0043】まず、(うどん・そば店、同義、1.0)
について処理を行う。「うどん・そば店」をキーにし
て、統制用語一覧表40を検索する。統制用語一覧表4
0の内容は、図7に示すとおりである。従って、「うど
ん・そば店」が統制用語一覧表10に存在することがわ
かる(ステップ110)。
【0044】さらに、統制用語確認部5では、「うどん
・そば店」が統制用語一覧表40に存在したので、当該
出力候補(うどん・そば店、同義、1.0)を最終候補
として保存する(ステップ111、112)。次に、
(日本料理店、上位概念、0.5)について処理を行う
(ステップ114、115)。「日本料理店」をキーと
して統制用語一覧表40を検索する。統制用語一覧表4
0の内容は、図7に示す通りであるので、「日本料理
店」が統制用語一覧表40に存在することがわかる(ス
テップ110)。
【0045】さらに、統制用語確認部5では、「日本料
理店」が統制用語一覧表40に存在したので、当該出力
候補(日本料理店,上位概念,0.5)を最終候補とし
て保存する(ステップ110、120)。すべての出力
候補を処理したので、最終候補として保存した(うどん
・そば店,同義,1.0)と(日本料理店,上位概念,
0.5)を優先度付与部6に転送する(ステップ11
4)。
【0046】優先度付与部6では、最終候補が2つ存在
するので、これらの優先度付与を制御表50に基づいて
行う。制御表50の内容は、図8に示すとおりであるの
で、この具体例では、マッピング部2において得られた
出力候補が最終候補として残っているので、第1優先条
件としてマッピング関係によって優先付けを行う。(う
どん・そば店,同義,1.0)のマッピング関係は同義
であり、(日本料理店,上位概念,0.5)のマッピン
グ関係は上位概念である。
【0047】図8の制御表50の内容から前者の(うど
ん・そば店,同義,1.0)の優先度を高くする。即
ち、優先度の高い順に(うどん・そば店,同義,1.
0)、(日本料理店,上位概念,0.5)となる。これ
らの優先付けされた最終候補を出力部7に転送する(ス
テップ118)。
【0048】出力部7では、優先度付き最終候補(うど
ん・そば店,同義,1.0)、(日本料理店,上位概
念,0.5)を利用者に提示し、処理を終了する(ステ
ップ119)。以上の処理により、統制用語一覧表40
に存在しない入力文字列「うどん屋」に対して、統制用
語一覧表40に存在する「うどん・そば店」及び「日本
料理店」の2つを優先度と共に利用者に提供することが
できる。
【0049】[入力文字列が「パン屋」の場合]入力文
字列「パン屋」は入力部1において取得され、マッピン
グ部2に転送される(ステップ101)。マッピング部
2では、入力文字列「パン屋」をキーとしてマッピング
表20を検索する。マッピング表20の内容は図5に示
す通りであるので、マッピング表20には「パン屋」が
存在しないことがわかる(ステップ102)。
【0050】マッピング表に「パン屋」が存在しないの
で、構成語マッピング部3に制御を移行する(ステップ
103)。構成語マッピング部3では、形態素解析4に
よって入力文字列「パン屋」は、「パン(名詞)/屋
(接尾辞)」に分割される(ステップ104)。
【0051】分割された単語毎にマッピング表20を検
索する。まず「パン」でマッピング表20を検索する
と、マッピング表20の内容は図5のようになっている
ので、(菓子,上位概念,0.8)が得られる。また、
「屋」でマッピング表20を検索すると、(店,同義,
1.0)、(製造業,類義,0.8)、(卸,類義,
0.5)の3つが得られる(ステップ106)。
【0052】情報がマッピング表20に存在したので、
これらの単語から出力候補を構成する(ステップ10
7)。今、元の単語の並びは「パン」、「屋」であり、
それぞれから得られた用語は「菓子」、「店」と「製造
業」と「卸」である。これらから、(パン店,同義,
1.0)、(パン製造業,類義,0.8)、(パン卸,
類義,0.5)、(菓子屋,上位概念+類義,0.8+
0.8)、(菓子店、上位概念+同義,0.8+1.
0)、(菓子製造業、上位概念+類義、0.8+0.
8) (菓子卸、上位概念+類義、0.8+0.5)の7個が
出力候補として得られる。これら7個の出力候補は、統
制用語確認部5に送られる(ステップ108)。
【0053】統制用語確認部5では、それぞれの出力候
補について処理を行う(ステップ109)。まず、(パ
ン店,同義,1.0)について処理を行う。「パン店」
をキーとして統制用語一覧表40を検索する。統制用語
一覧表40の内容は図7に示すとおりであるので、「パ
ン店」が統制用語一覧表40に存在することがわかる
(ステップ110)。
【0054】さらに、統制用語確認部5では、「パン
店」が統制用語一覧表40に存在しているので、出力候
補(パン店,同義,1.0)を最終候補として保存する
(ステップ111、112)。同様にして(パン製造
業、類義、0.8)、(パン卸,類義,0.5)、(菓
子屋,上位概念,0.8)、(菓子店,上位概念+類
義,0.8+1.0)、(菓子製造業、上位概念+類
義、0.8+0.8)、(菓子卸、上位概念+類義,
0.8+0.5)についても処理を行う(ステップ11
0〜115)。統制用語一覧表40の内容は、図7に示
すとおりであるので、(パン製造業,類義,0.8)、
(菓子店、上位概念+同義,0.8+1.0)、(菓子
製造業,上位概念+類義,0.8+0.8)の3つも最
終候補となる。
【0055】優先度付与部6は、最終候補が2つの存在
するので、これらの優先度付けを制御表50に基づいて
行う(ステップ116)。制御表50の内容は、図8に
示すとおりであるので、この具体例では、マッピング部
3において得られた出力候補が最終候補として残ってい
るので、第1優先条件として、元の単語を多く含む候補
を最優先し、次にどのマッピング関係を多く含むかによ
って優先度を付与する。(パン店,同義,1.0)、
(パン製造業,類義,0.8)、(菓子店、上位概念+
同義,0.8+1.0)、(菓子製造業,上位概念+類
義,0.8+0.8)の4つの最終候補のうち、(パン
店,同義,1.0)、(パン製造業,類義,0.8)
は、元の単語を1つ含むので、元の単語を含まない(菓
子店,上位概念+同義,0.8+1.0)、(菓子製造
業,上位概念+類義,0.8+0.8)の2つよりも優
先度を高くする。
【0056】(パン店,同義,1.0)、(パン製造
業,類義,0.8)の2つでは、図8に示す制御表50
の第1優先条件である“マッピング関係=同義”を多く
含む順位が適用され、(パン店,同義,1.0)を、
(パン製造業,類義,0.8)よりも優先度を高くす
る。
【0057】また、(菓子店,上位概念+同義,0.8
+1.0)、(菓子製造業,上位概念+類義,0.8+
0.8)の2つについても同様に、マッピング関係に同
義を含む(菓子店,上位概念+同義,0.8+1.0)
の優先度を高くする。以上のことから、4つの最終候補
は高い順に(パン店,同義,1.0)、(パン製造業,
類義,0.8)、(菓子店,上位概念+同義,0.8+
1.0)、(菓子製造業,上位概念+類義,0.8+
0.8)となる。これらの、優先度が付与された4つの
最終候補を出力部7に転送する(ステップ118)。
【0058】出力部7では、優先度付きの最終候補(パ
ン店,同義,1.0)、(パン製造業,類義,0.
8)、(菓子店,上位概念+同義,0.8+1.0)、
(菓子製造業,上位概念+類義,0.8+0.8)、を
利用者に提示し、処理を終了する(ステプ119)。
【0059】以上の処理により、統制用語一覧表40も
マッピング表20にも存在しない入力文字列「パン屋」
に対して、統制用語一覧表10に存在する「パン店」、
「パン製造業」、「菓子店」及び「菓子製造業」の4つ
を優先度と共に利用者に提供することができる。
【0060】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
【0061】
【発明の効果】上記のように、本発明の用語対応付け方
法及び装置によれば、以下のような効果を奏する。 (1) 利用者に対して自由用語の入力を許容するの
で、利用者は、統制用語の一覧を確認する必要がなく、
利用者の負担を軽減することができる。
【0062】(2) 利用者が意図している入力に対応
する統制用語を自動的に見いだすことが可能である。 (3) 同義語、類義語だけでなく、上位概念の用語等
への対応付けがマッピング表、制御表を用いることによ
って可能であり、さらに、得られた統制用語に対して優
先度を付与することができる。
【0063】(4) 対応付けを単語単位に行うことが
できるので、単語毎の統制用語(あるいは、統制用語の
一部)への変換が可能である。 (5) すべての用語に対する統制用語を辞書に記述す
ることは不可能であるが、用語の一部が統制用語である
ような場合にも対処することが可能であり、従来の統制
用語に対する同義語、類義語を集めた辞書を用意してお
き、入力された用語でこの辞書を検索することによっ
て、入力された用語を統制用語に対応付ける方法に比較
して、広い範囲をカバーすることが可能である。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の用語対応付け装置の構成図である。
【図4】本発明の用語対応付けの一連の動作を示すフロ
ーチャートである。
【図5】本発明の一実施例のマッピング表の例である。
【図6】本発明の一実施例の日本語辞書の例である。
【図7】本発明の一実施例の統制用語一覧表の一部の例
である。
【図8】本発明の一実施例の制御表の例である。
【符号の説明】
1 入力部、自由用語入力手段 2 マッピング部、出力候補取得手段 3 構成語マッピング部、単語単位出力候補取得手段 4 形態素解析部、形態素解析手段 5 統制用語確認部、統制用語確認手段 6 優先度付与部、優先度付与手段 7 出力部、統制用語出力手段 20 マッピング表 21 マッピング前用語 22 マッピング後用語 23 マッピング関係 24 結合指数 30 日本語辞書 31 表記 32 読み 33 品詞 40 統制用語一覧表、統制単語一覧 50 制御表 51 マッピングの単位 52 第1優先条件 53 第2優先条件 60 マッピング手段
フロントページの続き (72)発明者 永井 良史 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 ある用語を当該用語に関係する複数の用
    語に対応づける用語対応付け方法において、 無限の可能性のある自由用語を入力し、 入力された前記自由用語毎にマッピング用語を求め、 求められたマッピング用語で有限個の用語である統制用
    語に一致する組み合わせを選択し、 前記統制用語を出力することを特徴とする用語対応付け
    方法。
  2. 【請求項2】 前記マッピング用語を求める際に、 入力された前記自由用語に基づいて、自由用語、マッピ
    ング後用語と該自由用語、該マッピング後用語の用語が
    意味の上でどのような関係にあるかを表すマッピング関
    係と、それらの結び付きの強さを表す結合指数を取得
    し、 前記マッピング後用語を出力候補とする請求項1記載の
    用語対応付け方法。
  3. 【請求項3】 前記マッピング用語を求められない場合
    に、 入力された前記自由用語を形態素解析し、 形態素解析により取得した単語単位に、マッピング後用
    語と該自由用語、該マッピング後用語の用語が意味の上
    でどのような関係にあるかを表すマッピング関係と、そ
    れらの結び付きの強さを表す結合指数を取得し、 単語単位に得られたマッピング後用語から元の前記自由
    用語に対応する用語列を再構成し、 再構成された用語列を出力候補とする請求項1記載の用
    語対応付け方法。
  4. 【請求項4】 前記用語列を再構成する際に、 元の単語数、及び単語の語順に関係なく、用語列を生成
    する請求項3記載の用語対応付け方法。
  5. 【請求項5】 前記マッピング用語で前記統制用語に一
    致する組み合わせを選択する際に、 前記マッピング用語または、前記単語単位の用語列が前
    記統制用語であるか否かを、統制用語一覧を参照するこ
    とにより判定し、統制用語のみを選択する請求項1また
    は、4記載の用語対応付け方法。
  6. 【請求項6】 前記統制用語を出力する際に、 前記統制用語に優先度を付与する条件を参照して、該統
    制用語の優先度を決定する請求項1記載の用語対応付け
    方法。
  7. 【請求項7】 前記統制用語を出力する際に、 前記優先度の高い順に出力する請求項6記載の用語対応
    付け方法。
  8. 【請求項8】 ある用語を当該用語に関係する複数の用
    語に対応づける用語対応付け装置であって、 無限の可能性のある自由用語を入力する自由用語入力手
    段と、 入力された前記自由用語毎にマッピング用語を求めるマ
    ッピング手段と、 前記マッピング手段により求められたマッピング用語で
    有限個の用語である統制用語に一致する組み合わせを選
    択する統制用語確認手段と、 前記統制用語を出力する統制用語出力手段とを有するこ
    とを特徴とする用語対応付け装置。
  9. 【請求項9】 前記マッピング手段は、 自由用語、マッピング後用語と該自由用語、該マッピン
    グ後用語の用語が意味の上でどのような関係にあるかを
    表すマッピング関係と、それらの結び付きの強さを表す
    結合指数が設定されたマッピング表と、 前記マッピング表を入力された前記自由用語に基づい
    て、検索し、マッピング後用語を出力候補とする出力候
    補取得手段とを含む請求項8記載の用語対応付け装置。
  10. 【請求項10】 前記マッピング手段は、 前記出力候補取得手段において、出力候補を求められな
    い場合に、入力された前記自由用語を形態素解析する形
    態素解析手段と、 前記形態素解析手段により取得した単語単位に、前記マ
    ッピング表を参照し、単語単位にマッピング後用語を出
    力候補として取得する単語単位出力候補取得手段を含む
    請求項8及び9記載の用語対応付け装置。
  11. 【請求項11】 前記単語単位出力候補取得手段は、 元の単語数、及び単語の語順に関係なく、用語列を生成
    する用語列生成手段を含む請求項10記載の用語対応付
    け装置。
  12. 【請求項12】 前記統制用語確認手段は、 統制単語の意味に基づいて構成される統制単語一覧と、 前記統制単語一覧を参照して前記マッピング用語また
    は、前記単語単位の用語列が前記統制用語であるか否か
    を、統制用語一覧を参照することにより判定し、統制用
    語のみを選択する統制単語選択手段を含む請求項8記載
    の用語対応付け装置。
  13. 【請求項13】 所定の条件に基づいて前記統制用語毎
    の優先度が設定されている制御表と、 前記制御表を参照して前記統制用語に優先度を付与し
    て、前記統制用語出力手段に転送する優先度付与手段と
    を更に有する請求項8記載の用語対応付け装置。
  14. 【請求項14】 前記統制用語出力手段は、 前記優先度が高い統制用語の順に出力する請求項13記
    載の用語対応付け装置。
JP8284136A 1996-10-25 1996-10-25 用語対応付け方法及び装置 Pending JPH10124527A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8284136A JPH10124527A (ja) 1996-10-25 1996-10-25 用語対応付け方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8284136A JPH10124527A (ja) 1996-10-25 1996-10-25 用語対応付け方法及び装置

Publications (1)

Publication Number Publication Date
JPH10124527A true JPH10124527A (ja) 1998-05-15

Family

ID=17674640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8284136A Pending JPH10124527A (ja) 1996-10-25 1996-10-25 用語対応付け方法及び装置

Country Status (1)

Country Link
JP (1) JPH10124527A (ja)

Similar Documents

Publication Publication Date Title
CN109408526A (zh) Sql语句生成方法、装置、计算机设备及存储介质
CN110532347A (zh) 一种日志数据处理方法、装置、设备和存储介质
JP3849318B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体
CN109710951A (zh) 基于翻译历史的辅助翻译方法、装置、设备及存储介质
US20170220650A1 (en) Patent searching method in connection to matching degree
JPH07295994A (ja) 情報検索装置
US20010032077A1 (en) Compare
CN112162982A (zh) 数据查询方法、装置、设备及介质
CN110196952A (zh) 程序代码的搜索处理方法、装置、设备及存储介质
JPH09212517A (ja) 情報代行検索方法及び装置
US7474807B2 (en) System and method for generating usable images
JPH10124527A (ja) 用語対応付け方法及び装置
JPH11338873A (ja) 再検索方法及び装置及び再検索プログラムを格納した記憶媒体及び追加検索語候補提示方法及び装置及び追加検索語候補提示プログラムを格納した記憶媒体
JPH07234879A (ja) 情報処理装置及びデータベース検索方法
CN112632945B (zh) 一种报表构建方法及装置
RU2004127924A (ru) Способ перевода данных и устройство для осуществления этого способа
KR930000593B1 (ko) 입력문자열과 키워드와의 근사적 합치(Match)를 이용한 정보 검색 시스템 및 그 합치 방법
JP4387324B2 (ja) プロパティ変換装置
JP2759123B2 (ja) かな漢字変換装置
JPH05233696A (ja) データベース検索方法
JP3065151B2 (ja) 標準名付与システム
KR100594180B1 (ko) 온라인을 이용한 통합 검색 방법
EP4220475A1 (en) Dialog flow inference based on weighted finite state automata
JP3210842B2 (ja) 情報処理装置
JPH10214271A (ja) 用語対応付け方法及び装置及び用語対応付けプログラムを格納した記憶媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031224