JPH04111167A - 電子化辞書のメンテナンスシステム - Google Patents
電子化辞書のメンテナンスシステムInfo
- Publication number
- JPH04111167A JPH04111167A JP2228421A JP22842190A JPH04111167A JP H04111167 A JPH04111167 A JP H04111167A JP 2228421 A JP2228421 A JP 2228421A JP 22842190 A JP22842190 A JP 22842190A JP H04111167 A JPH04111167 A JP H04111167A
- Authority
- JP
- Japan
- Prior art keywords
- information
- dictionary
- maintenance
- maintenance information
- electronic dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 143
- 230000014509 gene expression Effects 0.000 claims abstract description 15
- 230000007246 mechanism Effects 0.000 claims description 52
- 238000000034 method Methods 0.000 claims description 29
- 238000004891 communication Methods 0.000 claims description 12
- 238000013519 translation Methods 0.000 claims description 11
- 230000008531 maintenance mechanism Effects 0.000 claims description 10
- 238000009826 distribution Methods 0.000 abstract description 2
- 239000000284 extract Substances 0.000 abstract description 2
- 238000012545 processing Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 9
- 230000008520 organization Effects 0.000 description 8
- 238000003860 storage Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概 要〕
機械翻訳システム等における電子化辞書のメンテナンス
方式に関し、 システム固有部分を除去して単語単位に独立させたメン
テナンス情報を使用して以上の問題点を解決するととも
に、電子化辞書のメンテナンス情報をネットワークを通
して多くのシステム間で相互に再利用可能とすると共に
メンテナンス情報を一元管理して、必要に応して各シス
テムに集配信することによりメンテナンス情報の流通を
も可能とすることを目的とし、 電子化辞書を有するシステムにおいて、該電子化辞書中
の単語情報から自システムに固有の情報を除去し、該単
語情報を標準表現に変換して、他システムとの間で流通
可能なメンテナンス情報を生成するメンテナンス情報生
成手段と、他システムから受信したメンテナンス情報を
標準表現から自システムの内部表現に変換し、自システ
ムに固有の情報を付加して電子化辞書に登録するメンテ
ナンス情報登録手段と、他システムとの間でメンテナン
ス情報を送受信する通信手段を備えるように構成する。
方式に関し、 システム固有部分を除去して単語単位に独立させたメン
テナンス情報を使用して以上の問題点を解決するととも
に、電子化辞書のメンテナンス情報をネットワークを通
して多くのシステム間で相互に再利用可能とすると共に
メンテナンス情報を一元管理して、必要に応して各シス
テムに集配信することによりメンテナンス情報の流通を
も可能とすることを目的とし、 電子化辞書を有するシステムにおいて、該電子化辞書中
の単語情報から自システムに固有の情報を除去し、該単
語情報を標準表現に変換して、他システムとの間で流通
可能なメンテナンス情報を生成するメンテナンス情報生
成手段と、他システムから受信したメンテナンス情報を
標準表現から自システムの内部表現に変換し、自システ
ムに固有の情報を付加して電子化辞書に登録するメンテ
ナンス情報登録手段と、他システムとの間でメンテナン
ス情報を送受信する通信手段を備えるように構成する。
〔産業上の利用分野]
本発明は電子化辞書に依存するシステムに係り、さらに
詳しくは機械翻訳システム等における電子化辞書のメン
テナンス方式に関する。
詳しくは機械翻訳システム等における電子化辞書のメン
テナンス方式に関する。
近年機械翻訳システムの実用化が進みつつあるが、機械
翻訳の性能はそのチューニングの良し悪しに大きく左右
される。このためユーザ自身によるチューニングが必要
であるが、このチューニングの中でも最もコストがかか
り、システムの性能を左右する作業が電子化辞書のメン
テナンスである。
翻訳の性能はそのチューニングの良し悪しに大きく左右
される。このためユーザ自身によるチューニングが必要
であるが、このチューニングの中でも最もコストがかか
り、システムの性能を左右する作業が電子化辞書のメン
テナンスである。
また複数のシステムを運用する場合には、システム間の
メンテナンス状態の差がシステム性能の差となることか
ら、複数システムの間でメンテナンス状態を均一に保つ
必要があり、さらにシステム毎に保守されている情報を
相互に矛盾無く利用することにより、効率的なメンテナ
ンスを行えることが望まれる。
メンテナンス状態の差がシステム性能の差となることか
ら、複数システムの間でメンテナンス状態を均一に保つ
必要があり、さらにシステム毎に保守されている情報を
相互に矛盾無く利用することにより、効率的なメンテナ
ンスを行えることが望まれる。
そこで電子化辞書のメンテナンスを容易にする機能とし
て、新規入力を最小限にするためにシステム間でメンテ
ナンス情報を相互に利用することにより辞書メンテナン
スのコストを押さえ、システム間で均一なメンテナンス
を可能とすることが求められている。
て、新規入力を最小限にするためにシステム間でメンテ
ナンス情報を相互に利用することにより辞書メンテナン
スのコストを押さえ、システム間で均一なメンテナンス
を可能とすることが求められている。
〔従来の技術と発明が解決しようとする課題〕従来の機
械翻訳システムにおける電子化辞書のメンテナンス、例
えば単語の新規登録にあたっては、各システム毎に備え
られた辞書保守機構を利用して各システムのユーザが随
時システム毎にメンテナンスを行っていた。最近では同
一機種に限って、フロッピーヘースの一括単語情報を用
いて複数システムに同じ単語の一括登録を行ったり、他
のシステムの辞書情報を利用する機能も提供されている
。
械翻訳システムにおける電子化辞書のメンテナンス、例
えば単語の新規登録にあたっては、各システム毎に備え
られた辞書保守機構を利用して各システムのユーザが随
時システム毎にメンテナンスを行っていた。最近では同
一機種に限って、フロッピーヘースの一括単語情報を用
いて複数システムに同じ単語の一括登録を行ったり、他
のシステムの辞書情報を利用する機能も提供されている
。
第13図は従来の電子化辞書メンテナンス方式の例であ
る。同図(a、)は単語の一括登録方式を示し、自シス
テム1と他システム2とにおいて一括登録が行われる。
る。同図(a、)は単語の一括登録方式を示し、自シス
テム1と他システム2とにおいて一括登録が行われる。
すなわちフロンピー3内の一括単語登録情報が、各シス
テム内の辞書保守機構4および5を介して電子化辞書6
および7に登録される。
テム内の辞書保守機構4および5を介して電子化辞書6
および7に登録される。
第13図(b)では辞書保守機構4及び5によって、電
子化辞書6の辞書情報がフロッピー3に抽出されて電子
化辞書7に登録され、また逆に電子化辞書7内の辞書情
報がフロッピー9に抽出されて電子化辞書6に登録され
る。
子化辞書6の辞書情報がフロッピー3に抽出されて電子
化辞書7に登録され、また逆に電子化辞書7内の辞書情
報がフロッピー9に抽出されて電子化辞書6に登録され
る。
従来の電子化辞書のメンテナンス方式においてシステム
毎にメンテナンスを行う場合には、複数システム間でメ
ンテナンス状態に差が生し、システム間の性能の差が大
きくなるという問題点がある。また単語情報の再利用が
難しいために重複してメンテナンスが行われ、全体とし
てメンテナンスコストが増大するという問題点もある。
毎にメンテナンスを行う場合には、複数システム間でメ
ンテナンス状態に差が生し、システム間の性能の差が大
きくなるという問題点がある。また単語情報の再利用が
難しいために重複してメンテナンスが行われ、全体とし
てメンテナンスコストが増大するという問題点もある。
さらに他のシステムの単語情報を再利用することを考え
た場合、抽出情報かシステム固有情報を含んでいるので
自システムの電子化辞書内で矛盾が発生しないようにす
ることが難しい。
た場合、抽出情報かシステム固有情報を含んでいるので
自システムの電子化辞書内で矛盾が発生しないようにす
ることが難しい。
また、抽出情報が単語単位に独立でないので必要な単語
のみを選んで登録することができないという問題がある
。
のみを選んで登録することができないという問題がある
。
フロンピー3内スの一括登録を行う場合にも再利用の範
囲は一般に限定されており、また、1方向の登録である
ために、単語の再利用という意味での効果は小さいとい
う問題点がある。
囲は一般に限定されており、また、1方向の登録である
ために、単語の再利用という意味での効果は小さいとい
う問題点がある。
本発明はシステム開存部分を除去して単語単位に独立さ
せたメンテナンス情報を使用して以上の問題点を解決す
るとともに、電子化辞書のメンテナンス情報をネ・ノド
ワークを通じて多くのシステム間で相互に再利用可能と
すると共にメンテナンス情報を一元管理しで、必要に応
じて各システムに集配信することによりメンテナンス情
報の流通をも可能とすることを目的とする。
せたメンテナンス情報を使用して以上の問題点を解決す
るとともに、電子化辞書のメンテナンス情報をネ・ノド
ワークを通じて多くのシステム間で相互に再利用可能と
すると共にメンテナンス情報を一元管理しで、必要に応
じて各システムに集配信することによりメンテナンス情
報の流通をも可能とすることを目的とする。
第1図は本発明の原理ブロック図である。同図は、例え
ば機械翻訳システムのような電子化辞書IOを有するシ
ステムにおける電子化辞書のメンテナンス方式の原理ブ
ロンク図である。
ば機械翻訳システムのような電子化辞書IOを有するシ
ステムにおける電子化辞書のメンテナンス方式の原理ブ
ロンク図である。
第1図において、メンテナンス情報生成手段11は、後
述のメンテナンス情報登録手段12と共に、例えば第1
3図内の辞書保守機構を構成し、電子化辞書10内の単
語情報から自システムに固有の情報、例えば単語の頻度
情報等を除去し、その単語情報を標準化表現に変換して
、他システムとの間で流通可能なメンテナンス情報を生
成する。
述のメンテナンス情報登録手段12と共に、例えば第1
3図内の辞書保守機構を構成し、電子化辞書10内の単
語情報から自システムに固有の情報、例えば単語の頻度
情報等を除去し、その単語情報を標準化表現に変換して
、他システムとの間で流通可能なメンテナンス情報を生
成する。
メンテナンス情報登録手段12は例えばネットワークを
介して、他システムから受信したメンテナンス情報を自
システムの内部表現に変換し、自システムに固有の情報
を付加して電子化辞書10に登録する。また通信手段1
3は、他システムおよび例えばメンテナンス情報を一元
管理するメンテナンス情報センターとの間で、ネットワ
ークを介してメンテナンス情報の送受信を行う。
介して、他システムから受信したメンテナンス情報を自
システムの内部表現に変換し、自システムに固有の情報
を付加して電子化辞書10に登録する。また通信手段1
3は、他システムおよび例えばメンテナンス情報を一元
管理するメンテナンス情報センターとの間で、ネットワ
ークを介してメンテナンス情報の送受信を行う。
本発明においては、電子化辞書のメンテナンス情報を多
くのシステム間で相互に再利用可能とするために、標準
形式のメンテナンス情報が定義される。あるシステムに
おいて新しい単語が登録された場合に、その単語情報が
標準形式のメンテナンス情報に変換されて、例えばネッ
トワークを介して他のシステムに送信され、そのシステ
ム内の内部表現に変換され、さらに固有情報が付加され
てそのシステム内の電子化辞書に登録される。
くのシステム間で相互に再利用可能とするために、標準
形式のメンテナンス情報が定義される。あるシステムに
おいて新しい単語が登録された場合に、その単語情報が
標準形式のメンテナンス情報に変換されて、例えばネッ
トワークを介して他のシステムに送信され、そのシステ
ム内の内部表現に変換され、さらに固有情報が付加され
てそのシステム内の電子化辞書に登録される。
あるいは各システムで生成された標準形式のメンテナン
ス情報は、ネットワークを介して、例えばメンテナンス
情報センターに集められ、全てのメンテナンス情報がメ
ンテナンス情報センターによって一元管理される。そし
て必要に応じてメンテナンス情報センターに管理されて
いる情報はネットワークを介して各システムに送信され
、そのシステム内の電子化辞書に登録される。
ス情報は、ネットワークを介して、例えばメンテナンス
情報センターに集められ、全てのメンテナンス情報がメ
ンテナンス情報センターによって一元管理される。そし
て必要に応じてメンテナンス情報センターに管理されて
いる情報はネットワークを介して各システムに送信され
、そのシステム内の電子化辞書に登録される。
以上のように、本発明においては電子辞書のメンテナン
ス情報が標準化されて、多くのシステムにおいて再利用
可能となる。
ス情報が標準化されて、多くのシステムにおいて再利用
可能となる。
(実 施 例〕
第2図は本発明のメンテナンス方式を用いるメンテナン
ス情報−元管理システムの実施例の全体構成ブロック図
である。同図において、自システム20、他システム2
1、メンテナンス情報センター22はネットワーク23
を介して相互に接続されている。部システム20の内部
には電子化辞書24、辞書保守機構25、通信機構26
が備えられ、また他システムにおいても同様に電子化辞
書27、辞書保守機構28、および通信機構29が備え
られている。
ス情報−元管理システムの実施例の全体構成ブロック図
である。同図において、自システム20、他システム2
1、メンテナンス情報センター22はネットワーク23
を介して相互に接続されている。部システム20の内部
には電子化辞書24、辞書保守機構25、通信機構26
が備えられ、また他システムにおいても同様に電子化辞
書27、辞書保守機構28、および通信機構29が備え
られている。
電子化辞書24および27は機械翻訳の言語辞書に代表
されるような電子化された辞書であり、単一のシステム
で複数の電子化辞書、例えば日本語辞書と英語辞書とを
有する場合もある。これらの電子化辞書は単語の頻度情
報等のシステム内における固有情報を持ち、閉じた単一
システム全体では重複や矛盾のないように調整されてお
り、辞書保守機構25および28を通してメンテナンス
が行われる。
されるような電子化された辞書であり、単一のシステム
で複数の電子化辞書、例えば日本語辞書と英語辞書とを
有する場合もある。これらの電子化辞書は単語の頻度情
報等のシステム内における固有情報を持ち、閉じた単一
システム全体では重複や矛盾のないように調整されてお
り、辞書保守機構25および28を通してメンテナンス
が行われる。
辞書保守機構25および28は一般的には電子化辞書の
内容に対して、検索/参照/追加/削除/修正/抽出/
印刷等の機能を実現するものであるが、本発明において
はさらにメンテナンス情報生成機能とメンテナンス情報
登録機能とを備えている。
内容に対して、検索/参照/追加/削除/修正/抽出/
印刷等の機能を実現するものであるが、本発明において
はさらにメンテナンス情報生成機能とメンテナンス情報
登録機能とを備えている。
メンテナンス情報生成機能は電子化辞書内の情報を抽出
して標準化された辞書メンテナンス情報を生成するもの
であり、自システム内の電子化辞書から指定された情報
を検索し、その情報に対してそのシステム固有部分を削
除し、情報を内部形式から標準形式に変換することによ
り、辞書メンテナンス情報を生成する。
して標準化された辞書メンテナンス情報を生成するもの
であり、自システム内の電子化辞書から指定された情報
を検索し、その情報に対してそのシステム固有部分を削
除し、情報を内部形式から標準形式に変換することによ
り、辞書メンテナンス情報を生成する。
またメンテナンス情報登録機能は標準化された辞書メン
テナンス情報を用いて電子化辞書に情報を登録するもの
であり、例えば他システムから受信した標準化された辞
書メンテナンス情報を読み込み、自システムの内部形式
情報に変換し、自システム内で矛盾や重複が生じないよ
うに自システム固有の情報を付加して自システムの情報
として電子化辞書に登録するものであり、必要があれば
すでに存在する辞書情報やシステム情報を修正すること
によって自システム全体の矛盾を解除する機能をもって
いる。さらにシステムによっては自システム内の複数の
電子化辞書に対して情報の登録を行う。
テナンス情報を用いて電子化辞書に情報を登録するもの
であり、例えば他システムから受信した標準化された辞
書メンテナンス情報を読み込み、自システムの内部形式
情報に変換し、自システム内で矛盾や重複が生じないよ
うに自システム固有の情報を付加して自システムの情報
として電子化辞書に登録するものであり、必要があれば
すでに存在する辞書情報やシステム情報を修正すること
によって自システム全体の矛盾を解除する機能をもって
いる。さらにシステムによっては自システム内の複数の
電子化辞書に対して情報の登録を行う。
通信機構26および29は、ネットワーク23を介して
他システム21またはメンテナンス情報センター22と
の間で標準化された辞書メンテナンス情報を送受信する
機構であって、その送受信に際して、必要に応じて送受
信システムの識別番号、情報の分類情報、処理依願事項
、日付・時間情報等が付加される。
他システム21またはメンテナンス情報センター22と
の間で標準化された辞書メンテナンス情報を送受信する
機構であって、その送受信に際して、必要に応じて送受
信システムの識別番号、情報の分類情報、処理依願事項
、日付・時間情報等が付加される。
またメンテナンス情報センター22は各システムから送
られてくる辞書メンテナンス情報を分類・整理して蓄積
し、あるシステムから情報の送信依願を受けた時には依
願された情報を検索して、依頬元システムに送信するも
のである。この時受信したメンテナンス情報の正当性の
チエツク、セキュリティチエツク、課金処理等を必要に
応して実行する。情報の集配信のみでよい場合には、般
のパソコン通信センター等がメンテナンス情報センター
として利用可能である。
られてくる辞書メンテナンス情報を分類・整理して蓄積
し、あるシステムから情報の送信依願を受けた時には依
願された情報を検索して、依頬元システムに送信するも
のである。この時受信したメンテナンス情報の正当性の
チエツク、セキュリティチエツク、課金処理等を必要に
応して実行する。情報の集配信のみでよい場合には、般
のパソコン通信センター等がメンテナンス情報センター
として利用可能である。
第3図はメンテナンス情報の実施例である。同図におい
て、日本語の単語表記である■日本語表記、英語の単語
表記(■の訳語)である■英語表記、単語の品詞分類(
名詞/す変名詞/動詞/副詞/形容詞/他)を示す■品
詞、単語の意味上の分類(名詞の場合:人名/企業名/
物質名/理論/道具/属性/他)であって品詞によって
分類方法が規定される■意味属性、および文法上の性質
(名詞の場合:英語の複数形変化指定/冠詞の有無/他
)を記述するものであり、品詞によって分類方法が規定
される■文法属性までが辞書メンテナンス情報として標
準化される単語情報である。
て、日本語の単語表記である■日本語表記、英語の単語
表記(■の訳語)である■英語表記、単語の品詞分類(
名詞/す変名詞/動詞/副詞/形容詞/他)を示す■品
詞、単語の意味上の分類(名詞の場合:人名/企業名/
物質名/理論/道具/属性/他)であって品詞によって
分類方法が規定される■意味属性、および文法上の性質
(名詞の場合:英語の複数形変化指定/冠詞の有無/他
)を記述するものであり、品詞によって分類方法が規定
される■文法属性までが辞書メンテナンス情報として標
準化される単語情報である。
第3図(a)において、単語の性質を表わすキーワード
(雑誌/政治/企業/−船釣/他)としての■分類情報
、単語情報の出典等の権利情報(独自調査/開放/他)
を示す■出典、情報が生成された日付情報である■登録
月日、情報を登録した人/会社名/団体名/グループ名
/他を示す■登録者、および自由欄としての[相]備考
はセンター登録用付加情報、すなわち単語の管理のため
に付加される情報である。
(雑誌/政治/企業/−船釣/他)としての■分類情報
、単語情報の出典等の権利情報(独自調査/開放/他)
を示す■出典、情報が生成された日付情報である■登録
月日、情報を登録した人/会社名/団体名/グループ名
/他を示す■登録者、および自由欄としての[相]備考
はセンター登録用付加情報、すなわち単語の管理のため
に付加される情報である。
自システム内の電子化辞書から、後述する処理によって
第3図(a)の■日本語表記から■の文法属性までの標
準化された単語情報が、日本語表記が「中央処理装置」
である単語に対して作成され、第3図■)に示すように
メンテナンス情報とされ、さらに同図(C)に示すよう
にセンター登録用付加情報が付加されて、センター登録
用のメンテナンス情報となる。
第3図(a)の■日本語表記から■の文法属性までの標
準化された単語情報が、日本語表記が「中央処理装置」
である単語に対して作成され、第3図■)に示すように
メンテナンス情報とされ、さらに同図(C)に示すよう
にセンター登録用付加情報が付加されて、センター登録
用のメンテナンス情報となる。
第4図はメンテナンス情報生成方式の説明図である。同
図において、電子化辞書は日本語辞書と英語辞書とから
構成されるものとして、メンテナンス情報生成方式を説
明する。前述のようにセンター登録用付加情報を除くメ
ンテナンス情報は第3図(a)における■日本語表記か
ら■文法属性までであるが、■の日本語表記は日本語辞
書30内の日本語表記がそのまま、また■英語表記は英
語辞書31内の英語表記がそのままメンテナンス情報3
2として用いられる。
図において、電子化辞書は日本語辞書と英語辞書とから
構成されるものとして、メンテナンス情報生成方式を説
明する。前述のようにセンター登録用付加情報を除くメ
ンテナンス情報は第3図(a)における■日本語表記か
ら■文法属性までであるが、■の日本語表記は日本語辞
書30内の日本語表記がそのまま、また■英語表記は英
語辞書31内の英語表記がそのままメンテナンス情報3
2として用いられる。
日本語辞書30内の中間言語表記から管理情報まで、お
よび英語辞書31内の中間言語表記から管理情報までは
それぞれ機種固有部分、すなわちシステムによってこと
なる部分であるが、日本語辞書30および英語辞書31
内の中間言語表記は両辞書内で全く同一のものであり、
例えば日本語辞書内の中間言語表記から英語辞書内の対
応する単語を検索することが可能である。中間言語表記
はシステム内でのみ有効な言語表現であり、メンテナン
ス情報には不要のものである。ただし中間言語まで標準
化して、中間言語を用いてシステム間で通信等を行うシ
ステムにおいては、中間言語もそのままメンテナンス情
報に含められる場合がある。
よび英語辞書31内の中間言語表記から管理情報までは
それぞれ機種固有部分、すなわちシステムによってこと
なる部分であるが、日本語辞書30および英語辞書31
内の中間言語表記は両辞書内で全く同一のものであり、
例えば日本語辞書内の中間言語表記から英語辞書内の対
応する単語を検索することが可能である。中間言語表記
はシステム内でのみ有効な言語表現であり、メンテナン
ス情報には不要のものである。ただし中間言語まで標準
化して、中間言語を用いてシステム間で通信等を行うシ
ステムにおいては、中間言語もそのままメンテナンス情
報に含められる場合がある。
第4図において、品詞標準化機構33によって日本語辞
書30内の品詞と英語辞書31内の品詞の情報が統合さ
れ、標準化された品詞分類情報が作成される。異なった
言語間では品詞は微妙に異なる場合があり、これを考慮
して標準化が行われる。また意味分類標準化機構34に
より、2つの辞書内の意味情報が統合され、標準化され
た意味分類情報が作成される。さらに文法属性標準化機
構35によって2つの辞書内の文法属性が統合され、標
準化された文法属性情報が作成される。2つの辞書内の
生成頻度、解析頻度、および管理情報は全てシステム固
有の情報であり、メンテナンス情報としては不要となる
。
書30内の品詞と英語辞書31内の品詞の情報が統合さ
れ、標準化された品詞分類情報が作成される。異なった
言語間では品詞は微妙に異なる場合があり、これを考慮
して標準化が行われる。また意味分類標準化機構34に
より、2つの辞書内の意味情報が統合され、標準化され
た意味分類情報が作成される。さらに文法属性標準化機
構35によって2つの辞書内の文法属性が統合され、標
準化された文法属性情報が作成される。2つの辞書内の
生成頻度、解析頻度、および管理情報は全てシステム固
有の情報であり、メンテナンス情報としては不要となる
。
第5図はメンテナンス情報生成処理の実施例のフローチ
ャートである。同図においてJWDは日本語辞書の単語
、EWDは英語辞書の単語、MWDはメンテナンス情報
の単語を意味する。第5図で処理が開始されると、まず
336で中間言語表記が同一であり相互に翻訳可能な日
本語と英語の単語対が得られ、337でJWDの表記が
MWDの日本語表記とされ、S38でEWDの表記がM
WDの英語表記とされる。
ャートである。同図においてJWDは日本語辞書の単語
、EWDは英語辞書の単語、MWDはメンテナンス情報
の単語を意味する。第5図で処理が開始されると、まず
336で中間言語表記が同一であり相互に翻訳可能な日
本語と英語の単語対が得られ、337でJWDの表記が
MWDの日本語表記とされ、S38でEWDの表記がM
WDの英語表記とされる。
その後S39で第4図の品詞標準化機構33によってJ
WDとEWDの品詞情報からMWDの品詞が決定され、
340で意味分類標準化機構34によってJWDとEW
Dの意味情報からMWDの意味分類が決定され、またS
41で文法属性標準化機構35によりJWDとEWDの
文法属性からMWDの文法属性が決定され、さらにS4
2でMWDに管理情報、すなわちセンター登録用付加情
報として分類情報、出典、登録月日、登録者、備考が入
れられて、メンテナンス情報が完成する。
WDとEWDの品詞情報からMWDの品詞が決定され、
340で意味分類標準化機構34によってJWDとEW
Dの意味情報からMWDの意味分類が決定され、またS
41で文法属性標準化機構35によりJWDとEWDの
文法属性からMWDの文法属性が決定され、さらにS4
2でMWDに管理情報、すなわちセンター登録用付加情
報として分類情報、出典、登録月日、登録者、備考が入
れられて、メンテナンス情報が完成する。
第6図は品詞標準化機構、意味分類標準化機構、および
文法属性標準化機構の実施例のブロック図である。同図
において品詞標準化機構33、意味分類標準化機構34
、および文法属性標準化機構35は標準化ルールを使用
して構成されている。
文法属性標準化機構の実施例のブロック図である。同図
において品詞標準化機構33、意味分類標準化機構34
、および文法属性標準化機構35は標準化ルールを使用
して構成されている。
3つの機構において処理部45は同一であり、品詞標準
化機構33に対しては品詞標準化用ルール集合46、意
味分類標準化機構34に対しては意味分類標準化用ルー
ル集合47、および文法属性標準化機構35に対しては
文法属性標準化用ルール集合48が用いられ、処理が行
われる。
化機構33に対しては品詞標準化用ルール集合46、意
味分類標準化機構34に対しては意味分類標準化用ルー
ル集合47、および文法属性標準化機構35に対しては
文法属性標準化用ルール集合48が用いられ、処理が行
われる。
第7図は品詞標準化機構、意味分類標準化機構、および
文法属性標準化機構内の処理部の処理実施例のフローチ
ャートである。同図において処理部の処理が開始される
と、S50でルール集合内のルールが1つ取り出され、
551てルールの条件部がチエ・ツタされ、S52で条
件部が真、すなわち条件が満足されているか否かが判定
され、条件部が真の場合にはS53でルールの実行部が
実行される。
文法属性標準化機構内の処理部の処理実施例のフローチ
ャートである。同図において処理部の処理が開始される
と、S50でルール集合内のルールが1つ取り出され、
551てルールの条件部がチエ・ツタされ、S52で条
件部が真、すなわち条件が満足されているか否かが判定
され、条件部が真の場合にはS53でルールの実行部が
実行される。
その後、S54で指定個の解が得られたか否かが判定さ
れ、まだ得られていない場合にはS55で全てのルール
に対して処理が終了したか否かが判定され、処理が終了
していない場合にはS50からの処理が繰り返される。
れ、まだ得られていない場合にはS55で全てのルール
に対して処理が終了したか否かが判定され、処理が終了
していない場合にはS50からの処理が繰り返される。
S52であるルールの条件部が真でない場合には、その
ルールの実行部を実行することなく355で全てのルー
ルに対する処理が終了したか否かが判定され、終了して
いない場合には350以降の処理が繰り返される。S5
4で指定個の解が得られた場合、およびS55で全ての
ルールに対する処理が終了した場合に処理部の処理は終
了する。
ルールの実行部を実行することなく355で全てのルー
ルに対する処理が終了したか否かが判定され、終了して
いない場合には350以降の処理が繰り返される。S5
4で指定個の解が得られた場合、およびS55で全ての
ルールに対する処理が終了した場合に処理部の処理は終
了する。
第8図はメンテナンス情報生成方式の実施例である。同
図は第4図の生成方式を日本語表記が「中央処理装置j
、英語表記が’central processing
unit Jである単語に対して通用したものであり
、品詞は名詞、意味分類は標準化された分類番号として
の15、文法属性は標準化された属性番号としての1が
メンテナンス情報として用いられている。
図は第4図の生成方式を日本語表記が「中央処理装置j
、英語表記が’central processing
unit Jである単語に対して通用したものであり
、品詞は名詞、意味分類は標準化された分類番号として
の15、文法属性は標準化された属性番号としての1が
メンテナンス情報として用いられている。
第9図は日本語辞書と、英語辞書の単語情報格納形式の
実施例である。同図(a)は日本語辞書の単語情報格納
形式を示し、第4図で説明したように先頭の日本語表記
以外は機種固有部分、すなわちシステムにより異なる部
分である。同図(b)は日本語単語「中央処理装置」に
対する単語情報であり、同図(C)は日本語単語「中央
処理装置」に対する英語の訳語情報の格納形式を示す。
実施例である。同図(a)は日本語辞書の単語情報格納
形式を示し、第4図で説明したように先頭の日本語表記
以外は機種固有部分、すなわちシステムにより異なる部
分である。同図(b)は日本語単語「中央処理装置」に
対する単語情報であり、同図(C)は日本語単語「中央
処理装置」に対する英語の訳語情報の格納形式を示す。
この訳語情報は(b)の中央処理装置に対する中間言語
表記を用いて英語辞書から検索されるものである。
表記を用いて英語辞書から検索されるものである。
第10図はメンテナンス情報センター登録用メンテナン
ス情報の実施例である。同図(a)は、第8図において
生成された標準化形式のメンテナンス情報であり、同図
(b)に示すようにセンター登録用の情報が付加されて
センターに登録される。
ス情報の実施例である。同図(a)は、第8図において
生成された標準化形式のメンテナンス情報であり、同図
(b)に示すようにセンター登録用の情報が付加されて
センターに登録される。
このような形式のメンテナンス情報を受信したメンテナ
ンス情報センターはその情報をいろいろな角度から分類
整理して格納し、各システムからの要求によってすでに
登録されている情報の検索/参照/集配信等の処理を行
う。分類項目としては言語対、品詞、日本語表記順、英
語表記類、キーワード、出典、登録月日、登録者等が考
えられる。また前述のように、センターでは正式ユーザ
以外のアクセスや、特定グループ専用単語の他グループ
による参照等をチェンクするセキュリティーチェンクや
課金処理等を行う場合もある。
ンス情報センターはその情報をいろいろな角度から分類
整理して格納し、各システムからの要求によってすでに
登録されている情報の検索/参照/集配信等の処理を行
う。分類項目としては言語対、品詞、日本語表記順、英
語表記類、キーワード、出典、登録月日、登録者等が考
えられる。また前述のように、センターでは正式ユーザ
以外のアクセスや、特定グループ専用単語の他グループ
による参照等をチェンクするセキュリティーチェンクや
課金処理等を行う場合もある。
あるシステムがメンテナンス情報センターに登録されて
いるメンテナンス情報を必要とする場合には、その情報
の検索を情報センターに依較し、検索結果を必要な単語
情報として受信し、自システム内の電子化辞書に登録す
ることになる。第11図はメンテナンス情報センターか
らの送信情報の実施例である。同図は「中央処理装置」
という日本語表記のメンテナンス情報の送信例であり、
情報センター側ではすでに登録しであるメンテナンス情
報を検索して要求システムに送信するが、この送信に際
して不必要な情報の削除が行われることがある。第11
図では、第10図と比較して出典、登録者、および備考
欄の情報が削除されている。
いるメンテナンス情報を必要とする場合には、その情報
の検索を情報センターに依較し、検索結果を必要な単語
情報として受信し、自システム内の電子化辞書に登録す
ることになる。第11図はメンテナンス情報センターか
らの送信情報の実施例である。同図は「中央処理装置」
という日本語表記のメンテナンス情報の送信例であり、
情報センター側ではすでに登録しであるメンテナンス情
報を検索して要求システムに送信するが、この送信に際
して不必要な情報の削除が行われることがある。第11
図では、第10図と比較して出典、登録者、および備考
欄の情報が削除されている。
メンテナンス情報センターから情報を受信したシステム
は受信情報を標準形式からシステムの内部形式に変換し
、システム固有情報部分を付加して、電子化辞書に格納
する。
は受信情報を標準形式からシステムの内部形式に変換し
、システム固有情報部分を付加して、電子化辞書に格納
する。
第12[mは単語の登録方式の実施例の構成を示すブロ
ック図である。同図において、受信されたメンテナンス
情報は日英名詞登録機構60に入力される。そして日本
語表記61はそのまま日本語名詞登録機167に、また
英語表記62はそのまま英語名詞登録機構68に出力さ
れる。
ック図である。同図において、受信されたメンテナンス
情報は日英名詞登録機構60に入力される。そして日本
語表記61はそのまま日本語名詞登録機167に、また
英語表記62はそのまま英語名詞登録機構68に出力さ
れる。
また本発明シこおいては、第9図に示したように中間言
語表記として英語表記をそのまま用いるものとすると、
中間言語生成機構63によって中間言語表記rcent
ral processing unit、 Jが日本
語名詞登録機構67、英語名詞登録機構68に与えられ
る。
語表記として英語表記をそのまま用いるものとすると、
中間言語生成機構63によって中間言語表記rcent
ral processing unit、 Jが日本
語名詞登録機構67、英語名詞登録機構68に与えられ
る。
その後意味分類生成機構64によって意味分類情報が生
成される。意味分類生成機構64は第6図の意味分類標
準化機構の逆変換機構であり、同一機構を用いて、ルー
ル集合を意味分類生成用ルールと入れ換えることによっ
て実現される。
成される。意味分類生成機構64は第6図の意味分類標
準化機構の逆変換機構であり、同一機構を用いて、ルー
ル集合を意味分類生成用ルールと入れ換えることによっ
て実現される。
第11図のメンテナンス情報例では品詞情報の「名詞」
と意味属性の「15」から意味分類「装置」が導出され
、日本語単語及び英語単語の意味属性として日本語名詞
登録機構67、英語名詞登録機構68に送られる。
と意味属性の「15」から意味分類「装置」が導出され
、日本語単語及び英語単語の意味属性として日本語名詞
登録機構67、英語名詞登録機構68に送られる。
英語表記に対しは、複数形指定生成機構65と冠詞指定
生成機構66によって複数変化形と冠詞指定が生成され
る。
生成機構66によって複数変化形と冠詞指定が生成され
る。
複数形指定生成機構65と冠詞指定生成機構66は文法
属性生成機構の1つの機能として実現できる。
属性生成機構の1つの機能として実現できる。
同一機構を用いて、文法属性生成用ルールと入れ換える
ことによって実現される。
ことによって実現される。
第11図のメンテナンス情報例では品詞情報の「名詞」
と文法属性の「1」から複数形指定「Sを付けるコと冠
詞指定「aをとる」が生成され、英語単語の複数形指定
と冠詞指定として英語名詞登録機構68に送られる。こ
れらの結果を用いて日本語名詞登録機構67によって日
本語辞書69への登録、英語名詞登録機構68によって
英語辞書70への登録が行われる。
と文法属性の「1」から複数形指定「Sを付けるコと冠
詞指定「aをとる」が生成され、英語単語の複数形指定
と冠詞指定として英語名詞登録機構68に送られる。こ
れらの結果を用いて日本語名詞登録機構67によって日
本語辞書69への登録、英語名詞登録機構68によって
英語辞書70への登録が行われる。
(発明の効果〕
以上詳細に説明したように、本発明によれば複数のシス
テム間における単語登録性能の均一化、必要な単語だけ
を選択して登録機能、および電子化辞書のメンテナンス
情報の流通が可能となり、電子化辞書のメンテナンス効
率を格段に増大させることができるだけでなく、電子化
辞書に依存するシステム全体の利用効率向上に寄与する
ところが大きい。
テム間における単語登録性能の均一化、必要な単語だけ
を選択して登録機能、および電子化辞書のメンテナンス
情報の流通が可能となり、電子化辞書のメンテナンス効
率を格段に増大させることができるだけでなく、電子化
辞書に依存するシステム全体の利用効率向上に寄与する
ところが大きい。
第1回は本発明の原理ブロック図、
第2図はメンテナンス情報−元管理システムの実施例の
全体構成を示すブロック図、 第3回はメンテナンス情報の実施例を示す図、第4図は
メンテナンス情報生成方式を示す図、第5図はメンテナ
ンス情報生成処理の実施例のフローチャート、 第6回は品詞標準化機構、意味分類標準化機構、および
文法属性標準化機構の実施例の構成を示すブロック図、 第7図は品詞標準化機構、意味分類標準化機構、および
文法属性標準化機構の処理実施例のフローチャート、 第8図はメンテナンス情報生成方式の実施例を示す図、 第9図は日本語辞書と英語辞書の単語情報格納形式の実
施例を示す図、 第10図はメンテナンス情報センター登録情報の実施例
を示す図、 第11図はメンテナンス情報センターからの送信情報の
実施例を示す図、 第12図は単語登録方式の実施例の構成を示すブロック
図、 第13図は電子化辞書メンテナンス方式の従来例を示す
図である。 10.24.27・・・電子化辞書、 11・・・メンテナンス情報生成手段、12・・・メン
テナンス情報登録手段 13・・・通信手段、 20・・・自システム、 21・・・他システム、 22・・・メンテナンス情報センター 23・・・ネットワーク、 25.28・・・辞書保守機構、 26.29・・・通信機構、 33・・・品詞標準化機構、 ・意味分類標準化機構、 35 ・ ・文法属性標準化機構。
全体構成を示すブロック図、 第3回はメンテナンス情報の実施例を示す図、第4図は
メンテナンス情報生成方式を示す図、第5図はメンテナ
ンス情報生成処理の実施例のフローチャート、 第6回は品詞標準化機構、意味分類標準化機構、および
文法属性標準化機構の実施例の構成を示すブロック図、 第7図は品詞標準化機構、意味分類標準化機構、および
文法属性標準化機構の処理実施例のフローチャート、 第8図はメンテナンス情報生成方式の実施例を示す図、 第9図は日本語辞書と英語辞書の単語情報格納形式の実
施例を示す図、 第10図はメンテナンス情報センター登録情報の実施例
を示す図、 第11図はメンテナンス情報センターからの送信情報の
実施例を示す図、 第12図は単語登録方式の実施例の構成を示すブロック
図、 第13図は電子化辞書メンテナンス方式の従来例を示す
図である。 10.24.27・・・電子化辞書、 11・・・メンテナンス情報生成手段、12・・・メン
テナンス情報登録手段 13・・・通信手段、 20・・・自システム、 21・・・他システム、 22・・・メンテナンス情報センター 23・・・ネットワーク、 25.28・・・辞書保守機構、 26.29・・・通信機構、 33・・・品詞標準化機構、 ・意味分類標準化機構、 35 ・ ・文法属性標準化機構。
Claims (1)
- 【特許請求の範囲】 1)電子化辞書(10)を有するシステムにおいて、 該電子化辞書(10)中の単語情報から自システムに固
有の情報を除去し、該単語情報を標準表現に変換して、
他システムとの間で流通可能なメンテナンス情報を生成
するメンテナンス情報生成手段(11)と、 他システムから受信したメンテナンス情報を標準表現か
ら自システムの内部表現に変換し、自システムに固有の
情報を付加して電子化辞書(10)に登録するメンテナ
ンス情報登録手段(12)と、他システムとの間でメン
テナンス情報を送受信する通信手段(13)を備えたこ
とを特徴とする電子化辞書のメンテナンス方式。 2)前記メンテナンス情報生成手段(11)とメンテナ
ンス情報登録手段(12)とが辞書保守機構に相当し、
前記通信手段(13)が通信機構に相当し、 該辞書保守機構、通信機構、および電子化辞書をそれぞ
れ備えた複数のシステムと、 該複数のシステムとネットワークを介して接続され、メ
ンテナンス情報の一元管理を行い、各システムに対して
メンテナンス情報の集配信を行うメンテナンス情報セン
ターとを備えたことを特徴とする請求項1記載の電子化
辞書のメンテナンス方式。 3)前記電子化辞書が日本語辞書と英語辞書とから成る
ことを特徴とする請求項1または2記載の電子化辞書の
メンテナンス方式。 4)前記電子化辞書(10)が日本語辞書と英語辞書と
から成り、 前記メンテナンス情報が、前記単語辞書の該日本語辞書
内の日本語表記と該英語辞書内の英語表記、該単語の品
詞、該単語の意味上の分類を示す意味属性、および該単
語の文法上の性質を示す文法属性とを標準化単語情報と
して含むことを特徴とする請求項1または2記載の電子
化辞書のメンテナンス方式。 5)前記電子化辞書(10)が日本語辞書と英語辞書と
から成り、 前記メンテナンス情報生成手段(11)が、該日本語辞
書および英語辞書内の品詞表現を用いてシステム内部の
品詞表現を標準表現に変換する品詞標準化機構と、 該日本語辞書および英語辞書内の意味情報を用いてシス
テム内部の意味分類情報を標準表現に変換する意味分類
標準化機構と、 該日本語辞書および英語辞書内の文法属性を用いてシス
テム内部の文法属性情報を標準表現に変換する文法属性
標準化機構とを備えたことを特徴とする請求項1または
2記載の電子化辞書のメンテナンス方式。 6)前記電子化辞書が機械翻訳システムの原言語辞書と
訳言語辞書とからなることを特徴とする請求項1または
2記載の電子化辞書のメンテナンス方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2228421A JP2901015B2 (ja) | 1990-08-31 | 1990-08-31 | 電子化辞書のメンテナンスシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2228421A JP2901015B2 (ja) | 1990-08-31 | 1990-08-31 | 電子化辞書のメンテナンスシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04111167A true JPH04111167A (ja) | 1992-04-13 |
JP2901015B2 JP2901015B2 (ja) | 1999-06-02 |
Family
ID=16876213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2228421A Expired - Fee Related JP2901015B2 (ja) | 1990-08-31 | 1990-08-31 | 電子化辞書のメンテナンスシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2901015B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10269201A (ja) * | 1997-03-25 | 1998-10-09 | Toshiba Corp | 辞書流通方法および辞書流通システム |
-
1990
- 1990-08-31 JP JP2228421A patent/JP2901015B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10269201A (ja) * | 1997-03-25 | 1998-10-09 | Toshiba Corp | 辞書流通方法および辞書流通システム |
Also Published As
Publication number | Publication date |
---|---|
JP2901015B2 (ja) | 1999-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11741309B2 (en) | Templated rule-based data augmentation for intent extraction | |
US5802504A (en) | Text preparing system using knowledge base and method therefor | |
JP3114181B2 (ja) | 異言語交信用翻訳方法およびシステム | |
US7409400B2 (en) | Applications of an appliance in a data center | |
JPH0869470A (ja) | 自然言語処理装置及びその方法 | |
KR20030094632A (ko) | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 | |
US20220245353A1 (en) | System and method for entity labeling in a natural language understanding (nlu) framework | |
US20220245361A1 (en) | System and method for managing and optimizing lookup source templates in a natural language understanding (nlu) framework | |
JP3015223B2 (ja) | 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置 | |
US20220229986A1 (en) | System and method for compiling and using taxonomy lookup sources in a natural language understanding (nlu) framework | |
US20220229990A1 (en) | System and method for lookup source segmentation scoring in a natural language understanding (nlu) framework | |
JPH04111167A (ja) | 電子化辞書のメンテナンスシステム | |
US20220229998A1 (en) | Lookup source framework for a natural language understanding (nlu) framework | |
US20220245352A1 (en) | Ensemble scoring system for a natural language understanding (nlu) framework | |
EP1080424B1 (en) | A method and arrangement for translation of information | |
Shah et al. | Constructing a knowledge-based quality attributes relationship matrix to identify conflicts in non-functional requirements | |
JP3311957B2 (ja) | ユーザ辞書構築方法およびユーザ辞書構築装置および翻訳方法および翻訳装置 | |
JPH10207896A (ja) | 検索用語拡張方法及び装置及び情報検索方法及び装置 | |
US20240176962A1 (en) | CROSS-LINGUAL NATURAL LANGUAGE UNDERSTANDING MODEL FOR MULTI-LANGUAGE NATURAL LANGUAGE UNDERSTANDING (mNLU) | |
JPH10171815A (ja) | 統合化検索装置 | |
Devgade et al. | The Natural Language Query Using NLP by Generation of SQL Query | |
Shi et al. | Negation Triplet Extraction with Syntactic Dependency and Semantic Consistency | |
Shen | Research on the Application of Computer Big Data Technology in English Online Translation | |
JPH1021264A (ja) | 知識共有システム | |
WO2022113142A1 (en) | Method for word processing and for generating a text document |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080319 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090319 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100319 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |