JP3464881B2 - 辞書構築装置および方法 - Google Patents

辞書構築装置および方法

Info

Publication number
JP3464881B2
JP3464881B2 JP07222397A JP7222397A JP3464881B2 JP 3464881 B2 JP3464881 B2 JP 3464881B2 JP 07222397 A JP07222397 A JP 07222397A JP 7222397 A JP7222397 A JP 7222397A JP 3464881 B2 JP3464881 B2 JP 3464881B2
Authority
JP
Japan
Prior art keywords
dictionary
user
public
registered
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07222397A
Other languages
English (en)
Other versions
JPH10269201A (ja
Inventor
顕司 小野
明 熊野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP07222397A priority Critical patent/JP3464881B2/ja
Publication of JPH10269201A publication Critical patent/JPH10269201A/ja
Application granted granted Critical
Publication of JP3464881B2 publication Critical patent/JP3464881B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば、例えば、
かな漢字変換や機械翻訳などの自然言語処理に用いられ
る言語知識辞書の構築支援および、その構築された辞書
の利用を促進する辞書流通システムに関する。
【0002】
【従来の技術】インターネットなどのネットワーク環境
の普及に伴い、ネットワークを利用してユーザから文書
を受信し、その内容を機械翻訳して訳文をユーザに返送
する翻訳サービスが提供され始めている。
【0003】しかし、これらの多くは、ユーザから送ら
れてくる原文を、いくつかのパラメータ(訳文の文体、
使用する専門用語分野、など)に基づいて翻訳した結果
をそのままユーザに返送するものである。このため、ユ
ーザが原文を一部修正して翻訳しようとする際、あるい
は、パラメータを一部変更して翻訳しようとする際に
は、新たに原文、パラメータなどの全情報を送信する必
要があった。
【0004】また、一部の翻訳サービスでは、テキスト
中の用語に対してユーザが予め訳語を指定して翻訳でき
るものもある。しかし、これも訳語の指定内容は翻訳サ
ービスへのアクセス毎にまったく独立であり、用語と訳
語の管理はユーザに任されたままであった。
【0005】
【発明が解決しようとする課題】このような翻訳サービ
スを提供するための翻訳システムにおいては、各ユーザ
はシステムの翻訳機能をただ利用するだけでなく、自分
の有する特定の分野の文書の翻訳のために、各種用語の
訳語や文体の規定などの翻訳のための情報を自らの個別
辞書に登録する。
【0006】これらユーザが個別辞書に登録した訳語や
翻訳のための情報は同じ分野の文書の翻訳を試みる他の
ユーザにとってきわめて価値のあるものである。
【0007】しかし現在のサービスシステムではこれら
の個人が登録した情報は公開されず、有効に活用されて
いない。
【0008】このような問題は、ネットワークを介した
翻訳サービスの場合に限られず、何らかの汎用の知識や
情報を用いるネットワーク上のサービスシステム一般に
通じるものである。
【0009】そこで、本発明は、あるユーザがその個別
辞書に登録した知織や情報を他のユーザにも利用可能に
して、辞書データの有効利用が図れる辞書流通方法およ
び辞書流通装置を提供することを目的とする。
【0010】
【課題を解決するための手段】本発明の辞書流通方法
は、言語処理に用いられる各ユーザ個別のユーザ辞書に
登録された辞書データから予め定められた条件を満たす
辞書データを抽出し、この抽出された辞書データを、前
記ユーザ辞書に分配する辞書データが登録された公開辞
書に登録することにより、あるユーザがそのユーザ辞書
に登録した知織や情報が他のユーザにも公開されて利用
可能になり、複数のユーザ間で有効に活用されるように
なる。また、公開辞書の構築が容易に行える。
【0011】また、本発明の辞書流通方法は、言語処理
に用いられる各ユーザ個別のユーザ辞書に登録された辞
書データから予め定められた条件を満たす辞書データを
抽出し、この抽出された辞書データを、前記ユーザ辞書
に分配する辞書データが登録された公開辞書に登録し、
必要に応じて前記公開辞書を利用したユーザに対する課
金を行うことにより、あるユーザがそのユーザ辞書に登
録した知織や情報が他のユーザにも公開されて利用可能
になり、複数のユーザ間で有効に活用されるようにな
る。また、精度の高い公開辞書の構築が容易に行える。
【0012】また、本発明の辞書流通方法は、言語処理
に用いられる各ユーザ個別のユーザ辞書に登録された辞
書データから予め定められた条件を満たす辞書データを
抽出し、この抽出された辞書データを、前記ユーザ辞書
に分配する辞書データが登録された公開辞書に登録し、
必要に応じて前記公開辞書を利用したユーザに対する課
金を行い、さらに、前記公開辞書に登録された辞書デー
タ利用頻度に基づき、その辞書データの提供者に対する
課金を減額することにより、あるユーザがそのユーザ辞
書に登録した知織や情報が他のユーザにも公開されて利
用可能になり、複数のユーザ間で有効に活用されるよう
になる。
【0013】ここで、課金とは、これらの辞書が利用さ
れる前記翻訳サービス等のネットワーク上のサービスシ
ステムの利用料金のことである。
【0014】また、精度の高い公開辞書の構築が容易に
行える。
【0015】本発明の辞書流通システムは、言語処理に
用いられる各ユーザ個別のユーザ辞書と、このユーザ辞
書に分配する辞書データを登録する公開辞書と、前記ユ
ーザ辞書に登録された辞書データから予め定められた条
件を満たす辞書データを抽出する抽出手段と、この抽出
手段で抽出された辞書データを前記公開辞書に登録する
登録手段と、を具備することにより、あるユーザがその
ユーザ辞書に登録した知織や情報が他のユーザにも公開
されて利用可能になり、複数のユーザ間で有効に活用さ
れるようになる。また、精度の高い公開辞書の構築が容
易に行える。
【0016】また、本発明の辞書流通システムは、言語
処理に用いられる各ユーザ個別のユーザ辞書と、このユ
ーザ辞書に分配する辞書データを登録する公開辞書と、
前記ユーザ辞書に登録された辞書データから予め定めら
れた条件を満たす辞書データを抽出する抽出手段と、こ
の抽出手段で抽出された辞書データを前記公開辞書に登
録する登録手段と、必要に応じて前記公開辞書を利用し
たユーザに対する課金を行う課金手段と、を具備するこ
とにより、あるユーザがそのユーザ辞書に登録した知織
や情報が他のユーザにも公開されて利用可能になり、複
数のユーザ間で有効に活用されるようになる。また、精
度の高い公開辞書の構築が容易に行える。
【0017】また、本発明の辞書流通システムは、言語
処理に用いられる各ユーザ個別の辞書と、このユーザ辞
書に分配する辞書データを登録する公開辞書と、前記ユ
ーザ辞書に登録された辞書データから予め定められた条
件を満たす辞書データを抽出する抽出手段と、この抽出
手段で抽出された辞書データを前記公開辞書に登録する
登録手段と、必要に応じて前記公開辞書を利用したユー
ザに対する課金を行う課金手段と、を具備し、前記登録
手段で前記公開辞書に登録された辞書データの利用頻度
に基づき、その辞書データの提供者に対する課金を減額
することにより、あるユーザがそのユーザ辞書に登録し
た知織や情報が他のユーザにも公開されて利用可能にな
り、複数のユーザ間で有効に活用されるようになる。ま
た、精度の高い公開辞書の構築が容易に行える。
【0018】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照して説明する。
【0019】なお、以下の説明では、ネットワークを介
した翻訳サービスの場合を例にとり説明する。
【0020】図1は、本発明の実施形態に係る辞書流通
システムを適用した翻訳システムの構成例を概略的に示
した図である。
【0021】図1において、受信部101は、ネットワ
ークを介してユーザの端末からの翻訳要求情報を受け付
けて、それを管理部102に渡すためのもので、具体的
には、例えば、cgiデコーダ、メールデコーダなどが
用いられる。ユーザからの翻訳要求情報の内容は、例え
ば、図2に示すように、ユーザの識別情報等を含むユー
ザ情報200、翻訳環境を設定するためのパラメータ情
報201、翻訳時に訳語を指定したい見出し語と訳語の
対のリストおよび過去の翻訳要求時に指定した訳語指定
情報のうち取り消したい見出し語と訳語の対のリスト
(訳語指定情報)202、翻訳対象の原文に関する情報
203等が含まれていてもよい。
【0022】管理部102は、翻訳要求を管理するもの
である。より具体的には、受信部101で受け付けられ
た翻訳要求情報を1つのジョブとするジョブ管理、文書
管理などを行う。
【0023】翻訳エンジン103は、管理部102から
送られてくる内容にしたがって、ユーザ辞書データベー
ス112に登録されている、ユーザ辞書、公開辞書デー
タベース113に登録されている公開辞書を参照しなが
ら原文を翻訳してその結果を出力するものである。すな
わち、機械翻訳を行なうようになっている。機械翻訳の
方法は特に限定するものではなく、現在知られている方
法のいずれを用いてもよい。
【0024】翻訳サービスデータベース104は、翻訳
要求情報に含まれる翻訳対象の原文、その翻訳結果の訳
文などが、一次的あるいは長期的に保存される。また、
各ユーザ毎の履歴情報も記録される。
【0025】図3は、履歴情報の内容の一例を示したも
ので、各ユーザ識別情報(図3において、「A」、
「B」)に対応して、翻訳要求を受け付けた(あるい
は、翻訳処理を実行した、あるいは、その両方の)日
時、原文書の識別ID、その翻訳文の識別ID等が含ま
れる。このとき、翻訳量を示す値(例えば、翻訳文のワ
ード数等)があってもよい。原文書およびその訳文その
ものが記憶されている記憶領域へのポインタ値が記録さ
れていてもよい。また、予めユーザにより翻訳対象の原
文を翻訳する際に用いる辞書の分野が指示されていると
き(環境パラメータにて指定されているとき)、あるい
は、原文を解析することによりその分野が判定されたと
きは、その分野に関する情報を原文、翻訳文に対応させ
て履歴情報の一部として記録するようにしてもよいし、
その分野の公開辞書の利用頻度に関する情報(例えば、
図3では、累積値)も記録されていてもよい。
【0026】このような履歴情報は、例えば、後述する
決済処理部115でユーザの課金計算を行う際に目安と
して利用される。
【0027】送信部105は、翻訳サービスデータベー
ス104に蓄えられた翻訳結果を取り出してユーザに送
信するものである。
【0028】図1に示した翻訳システムの構成部のう
ち、辞書流通システムは、主に、ユーザ辞書データベー
ス112、公開辞書データベース113、辞書抽出部1
14、決済処理部115から構成され、さらに、翻訳サ
ービスデータベース104に記録される履歴情報を参照
しながら所定の処理を実行するようになっている。
【0029】ユーザ辞書データベース112は、各ユー
ザ個別に設けられた翻訳用のユーザ辞書が登録されてい
る。
【0030】ユーザ辞書とは、各ユーザが自分の有する
特定の分野の文書の翻訳のために、各種用語の訳語や文
体の規定などの翻訳のための情報(辞書データ)を登録
したものである。
【0031】辞書抽出部114は、後述する方法により
ユーザ辞書データベース112の中の利用価値の高いユ
ーザ辞書を判定して、あるいは各ユーザ辞書の中から利
用価値の高い辞書データ(例えば、見出し語とその訳語
の組)あるいは、複数の辞書データが登録されてなるユ
ーザ辞書のうちの一部、あるいはユーザ辞書そのものを
抽出して公開辞書に登録するようになっている。
【0032】公開辞書データベース113は、例えば、
LANあるいはインターネットやパソコン通信のような
広域ネットワークに接続されていてもよく、公開辞書に
登録されている辞書の概要をこのネットワークを介して
各ユーザに公示している。公示内容として、例えば、公
開辞書として登録されている専門辞書の分野や登録され
ている単語数、いくつかの辞書見出しの例示などであ
る。
【0033】公開辞書データベース113は、各ユーザ
からの利用申請に応じてユーザ辞書データベースに申請
された辞書を登録する。あるいは申請された辞書のダウ
ンロードをユーザに可能にする。またその処理に伴っ
て、翻訳サービスデータベース104に履歴情報の記録
を行うようになっている。
【0034】決済処理部115は、各ユーザ毎の課金計
算と明細書や請求書の発行と送付、また実際の決済処理
を行う。明細書や請求書の送付は電子メイルなどを利用
する。実決済は、銀行や信販会社とのオンラインシステ
ムなどを利用するようになっている。
【0035】ここで、課金とは、辞書が利用される翻訳
サービス等のネットワーク上のサービスシステムの利用
料金のことである。
【0036】なお、各ユーザ毎に課せられる料金は、翻
訳サービスデータベース104に記録されている履歴情
報に基づき、例えば、各ユーザの翻訳要求に対する翻訳
量、公開辞書の利用頻度等に基づき算出されるようにな
っている。
【0037】次に、図4に示すフローチャートを参照し
て辞書抽出部114の処理動作について説明する。
【0038】辞書抽出部114は、まず、ユーザ辞書デ
ータベース112に登録されたユーザ辞書のなかで、公
開すべきユーザ辞書を判定する(ステップS1)。単純
には単語数が一定数以上のものを選べばよい。完全な自
動処理でなく、単語数が一定数以上のものを人がチェッ
クするという方法が現実的である。
【0039】また、ユーザが自ら作成したユーザ辞書を
価値ありと判断して公開するように提案してきた場合、
その辞書を公開辞書の候補として選択することも考えら
れる。具体的には、あらかじめあるフォーマットを規定
しておき、そのフォーマットに従った辞書公開提案の電
子メイルを受信部101で受理すると、それを辞書抽出
部114で解析し、提案されたユーザ辞書を自動的に公
開辞書候補として追加するような処理を辞書抽出部11
4に付加するとよい。提案されたユーザ辞書を無条件に
公開すべき辞書として登録することも考えられるが、他
のユーザ辞書にも登録されているか否か(例えば所定数
以上のユーザ辞書に同じ語が登録されているか否か)な
どの条件を設けたり、単に人手によるチェックの候補と
して登録することも考えられる。
【0040】次にその辞書の分野を推定する(ステップ
S2)。翻訳サービスデータベース104に記憶された
履歴情報の中に分野に関する情報があれば、それを利用
できる。また翻訳サービスデータベース104に登録さ
れているユーザの文書を解析してその文書が属する分野
を判定することもできる。もちろん人手による判定を行
ってもよい。
【0041】ユーザ辞書に登録された単語が複数の分野
にまたがるものであったり、一般的な単語と専門分野の
単語とが混ざっていたりしたときは、これを分離してそ
れぞれ別の公開辞書として整理することも考えられる。
この方法を以下に示す。
【0042】まず、翻訳サービスデータベース104に
登録されているユーザの文書を解析して各文書が属する
分野を判定する。次に、ユーザ辞書の見出し語のなか
で、分野の判明したユーザの各文書と一致する単語を抽
出する。抽出された単語はその文書の分野の用語である
と判断できるので、その分野の辞書としてそれぞれ別に
集積すれば、分野毎の辞書として分割できる。
【0043】ある分野に関して多くのユーザ辞書があ
り、辞書登録された単語に共通するものが多いときは、
以下に述べる処理によって辞書データを抽出し、精度の
高い公開辞書の構築を行うことができる。
【0044】図5を参照してこの処理の説明を行う。図
5は、単語「mobile agent」、「mult
i−modal」、「proxy server」につ
いて、4つのユーザ辞書に訳語登録があり、その登録訳
語を示したものである。空欄部分は、その単語に対応す
る訳語が登録されていないことを示す。この例の場合、
単語「mobile agent」の訳語として頻度の
もっとも高い「モーバイルエージェント」を抽出する。
また単語「multi−modal」の訳語として頻度
のもっとも高い「マルチモーダル」を抽出する。また単
語「proxyserver」の訳語として頻度のもっ
とも高い「プロキシーサーバー」を抽出することができ
る。
【0045】このようにして複数のユーザ辞書に登録さ
れている抽出された辞書データ(見出し語(単語)と訳
語の組)はまとめられて公開辞書に登録される。
【0046】ある単語について十分な数の訳語登録がな
いときは、抽出した訳語を辞書に登録する際に、その訳
語の信頼度が低いことを示すプロパティを付加するよう
なことも考えられる。
【0047】この処理は、故意に悪品質の辞書を作成し
てそれを公開することによってなんらかの害をもくろむ
不逞のユーザの行為や、ユーザの入力誤りが他人に悪影
響を及ぼす事態を防ぐ効果がある。
【0048】図4の説明に戻る。
【0049】ユーザ辞書の分野が判明したら、次に、そ
のユーザ辞書の所有者であるユーザに辞書公開の可否に
ついて問い合わせる(ステップS3)。
【0050】複数のユーザ辞書を統合して辞書抽出した
場合は、各ユーザ辞書の所有者のすべてに問い合わせ
る。これはメイル等によって行う。このメイルには公開
に伴う支払いの額やその条件などを記載する。後述する
公開辞書の推薦処理を利用してそのユーザにとって価値
があるであろう公開辞書を判定し、その辞書の利用権と
交換条件として、ユーザに公開を求めるといったバータ
ー取引的な条件を記載することも考えられる。
【0051】また、ユーザ辞書に登録されている辞書デ
ータのうち、公開辞書に登録するために抽出された辞書
データがどれだけ存在するかに応じて、そのユーザに課
せられる料金の条件を変更することも考えられる。複数
のユーザ辞書を統合して辞書抽出した場合は、その貢献
度に応じて金額を傾斜配分する。
【0052】問い合わせ先のユーザから公開可である旨
のリプライメイルがあった場合(ステップS4)、その
辞書の概要を作成して、ユーザ辞書とともに公開辞書デ
ータベース113に登録する(ステップS5)。また、
公開に伴う料金計算のための情報を履歴情報として、翻
訳サービスデータベース104に登録する(ステップS
6)。
【0053】次に、図6に示すフローチャートを参照し
て、公開辞書データベース113の動作について説明す
る。
【0054】公開辞書データベース113は、公開辞書
の概要をウェブページなどを用いて公示し、ユーザから
の利用要求に応じた処理を行う(ステップS11)。
【0055】例えば、ユーザからメールやウェブアクセ
スを介して特定の公開辞書についての利用申請(あるい
はダウンロード要求)があったとき(ステップS1
2)、ユーザ辞書データベース112に対しアクセスし
て、そのユーザのユーザ辞書に申請された公開辞書のフ
ァイルを追加登録する(ステップS13)。以降そのユ
ーザは翻訳システムによる翻訳サービスを利用する際
に、そのユーザ辞書を利用することができるようにな
る。
【0056】次に、履歴情報を翻訳サービスデータベー
ス104に登録する(ステップS14)。このとき登録
される履歴情報の内容は、そのユーザの個別辞書に登録
(追加)された公開辞書の識別情報と、その公開辞書の
提供時期(例えば、ダウンロードされた日時)などであ
る。これは後に、決済処理部115の料金計算処理の際
に利用される。
【0057】次に、公開辞書データベース113は、ス
テップS12でユーザから要求のあった公開辞書の利用
頻度情報をインクリメントする(ステップS15)。
【0058】公開情報の利用頻度情報は、公開辞書デー
タベース113の所定の記憶領域に例えば、各専門辞書
(の識別情報)あるいはユーザ辞書を公開して公開辞書
構築に貢献した各ユーザ(の識別情報)に対応して記憶
するようになっていてもよい。
【0059】公開辞書の利用頻度に応じて、その該当す
る公開辞書に辞書データを提供して公開辞書の構築に貢
献したユーザに例えば報償金として、システム側から料
金を支払う方式を適用する場合、決済処理部115は、
公開辞書データベース113に記憶される利用頻度情報
に応じて、その辞書データの提供者であるユーザに金額
を支払うか、あるいはそのユーザが翻訳システムを利用
する料金から減額するよう料金計算を行うようになって
いる。
【0060】以上の説明では、ユーザが自ら公開辞書デ
ータベース113にアクセスして所望する公開辞書を選
ぶ形式であったが、翻訳サービスデータベース104に
登録される履歴情報を参照して、公開辞書を必要とする
ユーザを判定し、メールなどによって公開辞書の情報を
通知するといった方式も考えられる。この処理は、公開
辞書データベース113が行ってもよいが、翻訳システ
ム(例えば、辞書抽出部114)の方で行うことも考え
られる。後者の場合の動作について、図7に示すフロー
チャートを参照して説明する。
【0061】まず、ユーザ辞書データベース112に登
録されているユーザ辞書を1つ取り出す(ステップS2
1)。この取り出されたユーザ辞書のユーザの履歴情報
を参照して、公開辞書(例えば、公開辞書の1つとして
登録されている専門辞書)に含まれる単語(辞書デー
タ)がどれだけユーザの文書に含まれるかカウントする
(ステップS22)。
【0062】次に、そのカウント値からユーザ辞書に登
録されている単語数(辞書データの数)を差し引く(ス
テップS23)。その差が予め定められた値以上である
とき、その公開辞書をそのユーザにとって必要な辞書で
あると判定し(ステップS24)、当該ユーザに対し、
その公開辞書の利用を薦めるためのメールを送信部10
5を介して送出する(ステップS25)。
【0063】以上ステップS21からステップS25ま
での処理をユーザ辞書データベース112に登録されて
いる全てのユーザ辞書に対して実行する(ステップS2
6)。
【0064】図7に示すフローチャートとは異なる処理
動作を以下に述べる。
【0065】まず、翻訳サービスデータベース104か
ら各ユーザ毎の履歴情報を取り出し、その履歴情報に記
録されているユーザの分野情報と、辞書抽出部114に
おける辞書抽出処理の際に決定された分野情報とが一致
する公開辞書を選択し、その公開辞書に登録されている
単語数から当該ユーザのユーザ辞書に登録されている単
語数を差し引き、その数が所定値以上である場合、その
公開辞書をそのユーザに推薦すべき辞書であると判定す
る。
【0066】このようにして、どのユーザにどの公開辞
書を推薦すべきかについての情報を決定する。次に、送
信部105を介して公開辞書の概要をユーザにメールで
連絡し、推薦する。あるいは、そのユーザが次に翻訳シ
ステムを利用したときに、その推薦情報を告げる。
【0067】以上説明したように、上記実施形態によれ
ば、辞書抽出部114は、言語処理に用いられる各ユー
ザ個別のユーザ辞書に登録された辞書データから予め定
められた条件を満たす辞書データを抽出し、この抽出さ
れた辞書データを、前記ユーザ辞書に分配する辞書デー
タが登録された公開辞書に登録することにより、あるユ
ーザがそのユーザ辞書に登録した知織や情報が他のユー
ザにも公開されて利用可能になり、複数のユーザ間で有
効に活用されるようになる。また、公開辞書の構築が容
易に行える。
【0068】また、公開辞書に登録するユーザ辞書から
抽出された辞書データは、予め定められた条件を満たす
もの(例えば、他のユーザ個別の辞書に重複して登録さ
れている等の条件を持たすもの)であるため、故意に悪
品質の辞書を作成してそれを公開することによってなん
らかの害をもくろむ不逞のユーザの行為や、ユーザの入
力誤りが他人に悪影響を及ぼす事態を防ぐことができ
る。
【0069】また、決済処理部115では、前記公開辞
書を利用したユーザに対する課金を行い、その際、前記
公開辞書に登録された辞書データの利用頻度に応じて、
その辞書データの提供者に対する課金を減額する。すな
わち、ユーザ辞書から抽出された辞書データを登録する
ことにより公開辞書が構築されるわけであるが、このよ
うな公開辞書構築のためにどれだけの辞書データを提供
したかを1つの目安とした、その辞書データを提供した
ユーザの公開辞書構築ための貢献度からそのユーザへの
課金を減額することにより、ユーザの公開辞書構築への
貢献意欲の高まりが期待できるとともに、公開辞書の利
用が促進される。また、公開辞書は、ユーザ辞書から抽
出された辞書データを登録することにより、随時アップ
デートされるので、辞書作成に要するコストの低減が図
れる。従って公開辞書の構築が容易に行える。
【0070】なお、上記実施形態では翻訳システムの場
合を例にとり辞書流通方法および辞書流通システムにつ
いて説明したが、この場合に限らず、機械翻訳以外の他
の自然言語処理を実行するシステムに適用されていても
よいし、また、単独の辞書流通システムとしても構成で
きることは明らかであろう。
【0071】この場合の辞書流通システムとしては、例
えば、各ユーザが作成した仮名漢字変換の為の辞書をネ
ットワークを介して収集し、それに対して上述したよう
な処理を経て公開辞書に登録することも考えられる。
【0072】また、上記実施形態に記載した手法は、コ
ンピュータに実行させることのできるプログラムとし
て、磁気ディスク(フロッピーディスク、ハードディス
クなど)、光ディスク(CD−ROM、DVDなど)、
半導体メモリなどの記録媒体に格納して頒布することも
できる。
【0073】さらに、上記実施形態では、図1に示した
構成の翻訳システムがネットワークを介してユーザから
の翻訳要求を受け取る場合について説明したが、この場
合に限らず、ユーザ端末に図1に示した構成の翻訳シス
テムが実装されて、複数のユーザ間で使用する形態も上
記同様実施可能である。
【0074】また、図1の各構成部は、ネットワーク上
に分散されて互いに通信を行うことによって、全体とし
て前述の翻訳システムの機能を呈するものであってもよ
い。
【0075】
【発明の効果】以上説明したように本発明によれば、あ
るユーザがその個別の辞書に登録した知織や情報を他の
ユーザにも利用可能にして、複数のユーザ間で辞書デー
タの有効利用が図れるとともに、辞書の構築が容易に行
える。
【図面の簡単な説明】
【図1】本発明の実施形態に係る辞書流通システムを適
用した翻訳システムの構成例を概略的に示した図。
【図2】翻訳要求情報の内容の一例を示した図。
【図3】履歴情報の内容の一例を示した図。
【図4】辞書抽出部の動作を説明するためのフローチャ
ート。
【図5】複数のユーザ辞書に同じ語(見出し語)が登録
されている場合にその訳語としてより正確なものを選択
する際の処理方法を説明するための図。
【図6】公開辞書データベースの動作を説明するための
フローチャート。
【図7】履歴情報を参照して、公開辞書を必要とするユ
ーザを判定し、メールなどによって公開辞書の情報を通
知するための辞書抽出部の動作を説明するためのフロー
チャート。
【符号の説明】
101…受信部 102…管理部 103…翻訳エンジン 104…翻訳サービスデータベース 105…送信部 112…ユーザ辞書データベース 113…公開辞書データベース 114…辞書抽出部 115…決済処理部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 596 G06F 17/28

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】 第1の語とそれに対応する第2の語で構
    成される複数の辞書データからなる、言語処理に用いら
    れる各ユーザ個別のユーザ辞書を記憶する第1の記憶手
    段と、 前記言語処理に用いるとともに、前記第1の記憶手段に
    記憶された前記ユーザ辞書に分配するための複数の前記
    辞書データからなる公開辞書を記憶する第2の記憶手段
    と、 前記第1の記憶手段から、前記辞書データが所定数以上
    登録されているユーザ辞書の辞書データを抽出する抽出
    手段と、 この抽出手段で抽出された前記第1の語がそれぞれ異な
    る辞書データを前記公開辞書に登録するとともに、前記
    第1の語が同じである複数の辞書データが抽出されたと
    きは、当該複数の辞書データのうち出現頻度の最も高い
    第2の語を当該第1の語に対応する第2の語とする辞書
    データを前記第2の記憶手段に記憶された前記公開辞書
    に登録する登録手段と、 を具備したことを特徴とする辞書構築装置。
  2. 【請求項2】 前記公開辞書を利用したユーザに対し、
    当該公開辞書の利用頻度に応じて課金を行う課金手段を
    さらに具備したこと特徴とする辞書構築装置。
  3. 【請求項3】 前記課金手段は、前記公開辞書に登録さ
    れた辞書データのうち利用頻度の高い辞書データの提供
    元であるユーザ辞書のユーザに対する課金を減額するこ
    とを特徴とする請求項2記載の辞書構築装置。
  4. 【請求項4】 前記抽出手段で抽出された辞書データの
    分野を、当該辞書データを用いて翻訳を行った文書の分
    野から判定し、この判定された分野の公開辞書に当該辞
    書データを登録することを特徴とする請求項1記載の辞
    書構築装置。
  5. 【請求項5】 前記公開辞書に登録されている前記辞書
    データの数と前記ユーザ辞書に登録されている辞書デー
    タの数との差が所定値以上であるとき、当該ユーザ辞書
    に対応するユーザに前記公開辞書の利用を促す情報を通
    知する通知手段をさらに具備したことを特徴とする請求
    項1記載の辞書構築装置。
  6. 【請求項6】 前記公開辞書へ登録するために提供され
    た辞書データを受付け、当該辞書データの前記第1の語
    が所定数以上の前記ユーザ辞書にも登録されていると
    き、当該辞書データを前記公開辞書へ登録することを特
    徴とする請求項1記載の辞書構築装置。
  7. 【請求項7】 第1の記憶手段に記憶された、第1の語
    とそれに対応する第2の語で構成される複数の辞書デー
    タからなる、言語処理に用いられる各ユーザ個別のユー
    ザ辞書から、前記辞書データが所定数以上登録されてい
    るユーザ辞書の辞書データを抽出する抽出するステップ
    と、 第2の記憶手段に記憶された、前記言語処理に用いると
    ともに前記第1の記憶手段に記憶された各ユーザ辞書に
    分配するための複数の前記辞書データからなる公開辞書
    に、抽出された前記第1の語がそれぞれ異なる辞書デー
    タを登録するとともに、前記第1の語が同じである複数
    の辞書データが抽出されたときは、当該複数の辞書デー
    タのうち出現頻度の最も高い第2の語を当該第1の語に
    対応する第2の語とする辞書データを登録するステップ
    と、 を有する辞書構築方法。
  8. 【請求項8】 前記公開辞書を利用したユーザに対し、
    当該公開辞書の利用頻度に応じて課金を行うこと特徴と
    する請求項7記載の辞書構築方法。
  9. 【請求項9】 前記公開辞書に登録された辞書データの
    うち利用頻度の高い辞書データの提供元であるユーザ辞
    書のユーザに対する課金を減額することを特徴とする請
    求項8記載の辞書構築方法。
  10. 【請求項10】 前記抽出された辞書データの分野を、
    当該辞書データを用いて翻訳を行った文書の分野から判
    定し、この判定された分野の前記公開辞書に当該辞書デ
    ータを登録することを特徴とする請求項7記載の辞書構
    築方法。
  11. 【請求項11】 前記公開辞書に登録されている前記辞
    書データの数と前記ユーザ辞書に登録されている前記辞
    書データの数との差が所定値以上であるとき、当該ユー
    ザ辞書のユーザに前記公開辞書の利用を促す情報を通知
    することを特徴とする請求項7記載の辞書構築方法。
  12. 【請求項12】 前記公開辞書へ登録するために提供さ
    れた辞書データを受付け、当該辞書データの前記第1の
    語が所定数以上の前記ユーザ辞書にも登録されていると
    き、当該辞書データを前記公開辞書へ登録することを特
    徴とする請求項7記載の辞書構築方法。
JP07222397A 1997-03-25 1997-03-25 辞書構築装置および方法 Expired - Fee Related JP3464881B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07222397A JP3464881B2 (ja) 1997-03-25 1997-03-25 辞書構築装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07222397A JP3464881B2 (ja) 1997-03-25 1997-03-25 辞書構築装置および方法

Publications (2)

Publication Number Publication Date
JPH10269201A JPH10269201A (ja) 1998-10-09
JP3464881B2 true JP3464881B2 (ja) 2003-11-10

Family

ID=13483052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07222397A Expired - Fee Related JP3464881B2 (ja) 1997-03-25 1997-03-25 辞書構築装置および方法

Country Status (1)

Country Link
JP (1) JP3464881B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9575953B2 (en) 2006-09-07 2017-02-21 Nec Corporation Natural-language processing system and dictionary registration system

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011154718A (ja) * 2000-03-01 2011-08-11 Masanobu Kujirada 語句入力システム、方法、プログラム
JP2002279349A (ja) * 2001-03-21 2002-09-27 Ricoh Co Ltd 自動文字認識に用いる辞書の提供方法
JP2003051095A (ja) * 2001-08-07 2003-02-21 Mazda Motor Corp 自動車の制御ゲイン変更用サーバ、自動車の制御ゲイン変更方法、及び、自動車の制御ゲイン変更用プログラム
JP5470715B2 (ja) * 2008-02-27 2014-04-16 日本電気株式会社 新語辞書生成シンクライアントシステム、新語辞書生成方法及びサーバ
JP5731998B2 (ja) * 2012-03-21 2015-06-10 株式会社東芝 対話支援装置、対話支援方法および対話支援プログラム
US9508339B2 (en) * 2015-01-30 2016-11-29 Microsoft Technology Licensing, Llc Updating language understanding classifier models for a digital personal assistant based on crowd-sourcing
JP6707814B2 (ja) * 2015-07-08 2020-06-10 日本電気株式会社 複合語検索装置、複合語検索方法及びプログラム
JP6759638B2 (ja) * 2016-03-15 2020-09-23 オムロン株式会社 文字変換装置、情報端末、文字変換システム、変換候補登録方法、および、変換候補登録プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2901015B2 (ja) * 1990-08-31 1999-06-02 富士通株式会社 電子化辞書のメンテナンスシステム
JPH07182333A (ja) * 1993-12-24 1995-07-21 Sharp Corp 日本語処理装置
WO1996016374A1 (fr) * 1994-11-21 1996-05-30 Omron Corporation Systeme de base de donnees partage par une pluralite d'appareils clients, procede de mise a jour de donnees et application a un processeur de caracteres

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9575953B2 (en) 2006-09-07 2017-02-21 Nec Corporation Natural-language processing system and dictionary registration system

Also Published As

Publication number Publication date
JPH10269201A (ja) 1998-10-09

Similar Documents

Publication Publication Date Title
US7672994B2 (en) Data relay method and information processing method
US9692739B1 (en) Search engine system, method, and device
CN101014954B (zh) 信息搜索提供装置及信息搜索提供系统
US8600814B2 (en) Structured analysis and organization of documents online and related methods
KR100911014B1 (ko) 스폰서 매치 광고 서비스 방법 및 그 시스템
KR20110032878A (ko) Sns 프로그램에서 구현되는 키워드 광고방법 및 시스템
JP2011170490A (ja) SaaS型汎用会計処理システム
US7840578B2 (en) Method for determining validity of command and system thereof
US20200334369A1 (en) Article management system
JP3464881B2 (ja) 辞書構築装置および方法
KR20140017489A (ko) 국가별 요금을 계산하기 위한 컴퓨터 시스템
KR100366772B1 (ko) 인터넷을 이용한 지식/정보 제공 서비스 방법
Saffady Integrated library systems for microcomputers and mainframes: a vendor study
JP2002099613A (ja) 税金申告相談装置
CA2345093A1 (en) Management method and management apparatus for business data
KR20110110788A (ko) 복수의 어플리케이션 사이에서의 데이터 제휴를 지원하는 장치, 방법 및 컴퓨터 프로그램
JP2009053761A (ja) 翻訳コンテンツ提供方法、翻訳コンテンツ提供サーバ、および翻訳コンテンツ提供プログラム
CN105264563B (zh) 门户网站系统
JP4141099B2 (ja) 情報提供装置及び情報提供プログラムを格納する記憶媒体
JP2006139577A (ja) 翻訳サービス装置、翻訳サービス方法
Ojennus Open access and the humanities: the case of classics journals
CN113849731A (zh) 基于自然语言处理的信息推送方法、装置、设备及介质
US20030110091A1 (en) Information delivering service system
JP4460978B2 (ja) 情報検索システム、情報提供装置、情報検索方法、並びに、プログラムおよび記録媒体
Kull et al. Compatibility of business models of Estonian language technology entrepreneurs with regulatory framework on the use of digital content

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070822

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080822

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090822

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100822

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100822

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110822

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120822

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120822

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130822

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees