JP2002091965A - Dictionary device - Google Patents

Dictionary device

Info

Publication number
JP2002091965A
JP2002091965A JP2000283038A JP2000283038A JP2002091965A JP 2002091965 A JP2002091965 A JP 2002091965A JP 2000283038 A JP2000283038 A JP 2000283038A JP 2000283038 A JP2000283038 A JP 2000283038A JP 2002091965 A JP2002091965 A JP 2002091965A
Authority
JP
Japan
Prior art keywords
dictionary
user
technical term
dictionaries
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000283038A
Other languages
Japanese (ja)
Other versions
JP3838857B2 (en
Inventor
Tatsuya Sukehiro
達哉 介弘
Makoto Torigoe
真 鳥越
Yasuhiro Kawakita
泰広 川北
Satoshi Nakagawa
聰 中川
Satohiko Matsunaga
聡彦 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000283038A priority Critical patent/JP3838857B2/en
Priority to US09/948,935 priority patent/US20040205671A1/en
Publication of JP2002091965A publication Critical patent/JP2002091965A/en
Application granted granted Critical
Publication of JP3838857B2 publication Critical patent/JP3838857B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a dictionary device capable of enriching a dictionary, its structure, etc. SOLUTION: This dictionary device is provided in a natural language processor utilized by a plurality of users. The dictionary device has a dictionary main body that hierarchizes a plurality of technical term dictionaries of each category with a tree structure with a termini generales dictionary as a root node, a user dictionary registering means for setting a user dictionary while making the user dictionary correspond to an optional technical term dictionary, and an application dictionary deciding means for deciding the whole technical term dictionaries existing on the path of the tree structure from the technical term dictionary of a natural language processing object up to the termini generales dictionary and the whole user dictionaries of a processing request user, which is made to correspond to the technical term dictionaries as dictionaries to be applied, when the category is indicated.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、自然言語処理装置
で利用される辞書装置に関し、例えば、インターネット
のように不特定多数のユーザがアクセスできるネットワ
ークのサーバ上に設けられている機械翻訳装置の辞書に
適用し得るものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a dictionary device used in a natural language processing device. For example, the present invention relates to a machine translation device provided on a server of a network accessible by an unspecified number of users such as the Internet. It can be applied to dictionaries.

【0002】[0002]

【従来の技術】インターネットの普及により、海外の情
報に容易にアクセスできるようになり、また、海外へ容
易に情報を発信できるようになってきた。そのため、外
国語の文書を日本語に機械翻訳したり、日本語の文書を
外国語に機械翻訳したりすることに対する要求は非常に
高くなってきた。
2. Description of the Related Art With the spread of the Internet, overseas information can be easily accessed and information can be easily transmitted overseas. Therefore, there has been an increasing demand for machine translation of a foreign language document into Japanese or machine translation of a Japanese document into a foreign language.

【0003】このような要求に鑑み、インターネットの
ように不特定多数のユーザがアクセスできるネットワー
クのサーバ上に機械翻訳装置を搭載することが研究、開
発されている。
In view of such demands, research and development of mounting a machine translation apparatus on a server of a network accessible by an unspecified number of users such as the Internet has been conducted.

【0004】機械翻訳装置には、一般的には、どのよう
な分野においても広く使用される単語などを格納した一
般用語辞書と、ユーザが任意に単語などを登録したユー
ザ辞書とが設けられている。さらには、特定の専門分野
において広く使用される単語などを格納した専門用語辞
書を有する機械翻訳装置もある。
In general, a machine translation device is provided with a general term dictionary storing words widely used in any field and a user dictionary in which a user arbitrarily registers words and the like. I have. Further, there is also a machine translation device having a technical term dictionary storing words widely used in a specific specialty field.

【0005】インターネットのサーバ上に設けられる機
械翻訳装置は、様々な文書が対象となるので、そのよう
な装置のために用いられる辞書は、一般用語辞書、ユー
ザ辞書及び専門用語辞書の3種類の辞書構成となり、特
に、訳質を考慮した場合、専門用語辞書のウェイトが大
きくなるであろう。
[0005] Since a machine translation device provided on a server on the Internet targets various documents, there are three types of dictionaries used for such a device: a general term dictionary, a user dictionary, and a technical term dictionary. It becomes a dictionary structure, and the weight of the technical term dictionary will be particularly large when the translation quality is considered.

【0006】インターネットから入手した文書の翻訳結
果として、良好な訳質のものを、できるだけ時間を掛け
ずに得る方法として、特開平10−21222号公報に
記載されたものがある。
[0006] As a method for obtaining a good translation result as a translation result of a document obtained from the Internet without taking as much time as possible, there is a method described in Japanese Patent Application Laid-Open No. Hei 10-21222.

【0007】この公報記載の方法は、翻訳対象となる文
書(Webページ)を入手する際に用いたURLなどの
文書識別情報から、専門分野を特定し、専門用語辞書を
自動的に設定することによって、ユーザに複雑な設定を
強いることなく、高品質の翻訳結果を得ようとしたもの
である。
According to the method described in this publication, a technical field is specified from document identification information such as a URL used when a document (Web page) to be translated is obtained, and a technical term dictionary is automatically set. Thus, it is intended to obtain a high-quality translation result without forcing the user to make complicated settings.

【0008】[0008]

【発明が解決しようとする課題】しかしながら、文書識
別情報はその文書を一意に表すためのものであって分野
やジャンルを表す文字にする必要はないので、文書識別
情報では、文書の分野やジャンルを特定することが難し
い。特に、インターネットから入手できる文書の分野や
ジャンルは多種多様であるため、全ての分野やジャンル
を特定することが難しい。
However, since the document identification information is for uniquely representing the document and does not need to be a character representing the field or genre, the document identification information uses the field or genre of the document. Difficult to identify. In particular, since fields and genres of documents available from the Internet are various, it is difficult to specify all fields and genres.

【0009】仮に特定できたとしても、インターネット
から入手できる文書の分野はジャンルは多種多様である
ため、多種多様な専門用語辞書がないと、正しく理解で
きるような翻訳結果を得ることができない。
Even if it can be specified, since the fields of documents available from the Internet are of various genres, a translation result that can be correctly understood cannot be obtained without a wide variety of technical term dictionaries.

【0010】多種多様な専門用語辞書を、機械翻訳装置
の開発者や提供側で全て用意することは実際上困難であ
る。
[0010] It is practically difficult for a developer or a provider of a machine translation apparatus to prepare various technical term dictionaries.

【0011】そのため、専門用語辞書として、大分類の
少数のものを用意し、その専門用語辞書で対応できない
部分をユーザ辞書に委ねることも考えられる。
For this reason, it is also conceivable to prepare a small number of technical terms in a large category as a technical term dictionary, and leave a part which cannot be handled by the technical term dictionary to a user dictionary.

【0012】しかしながら、インターネットのサーバ上
に設けられる機械翻訳装置の場合、ユーザ数が多数に上
り、ユーザ辞書に委ねる部分が多いと、サーバでの記憶
容量が膨大になってしまう。また、多くのユーザが同一
の単語を登録することもあり得、システムとしての無駄
が大きい。
However, in the case of a machine translator provided on a server on the Internet, the number of users is large, and if there are many parts left to a user dictionary, the storage capacity of the server becomes enormous. Also, many users may register the same word, which is wasteful as a system.

【0013】また、専門用語辞書に、その分野やジャン
ルの知識が豊富なユーザの知識を反映させることが考え
られる。しかし、あるユーザが登録、編集した内容が他
のユーザに不満足なこともあり得、極端な場合には、ユ
ーザがいたずら等によって、不適当な登録を行う恐れも
高い。
Further, it is conceivable that the technical term dictionary reflects the knowledge of a user who is rich in the field and genre. However, the contents registered and edited by a certain user may be unsatisfactory to other users. In an extreme case, there is a high possibility that the user will perform improper registration due to mischief or the like.

【0014】そのため、多数のユーザが利用する自然言
語処理装置において、良好な処理結果を得ることができ
る辞書装置が求められている。
Therefore, there is a need for a dictionary device that can obtain good processing results in a natural language processing device used by many users.

【0015】[0015]

【課題を解決するための手段】第1の本発明の辞書装置
は、複数のユーザが利用する自然言語処理装置に設けら
れる辞書装置であって、専門分野やジャンルを分類した
カテゴリー毎の複数の専門用語辞書を、一般用語辞書を
ルートノードとしたツリー構造で階層化している辞書本
体と、任意の上記専門用語辞書に関連付けて、ユーザ辞
書を設定させるユーザ辞書登録手段とを有することを特
徴とする。
A dictionary device according to a first aspect of the present invention is a dictionary device provided in a natural language processing device used by a plurality of users. The dictionary device includes a plurality of specialized fields and genres. A dictionary body in which a technical term dictionary is hierarchized in a tree structure with a general term dictionary as a root node; and a user dictionary registering means for setting a user dictionary in association with any of the technical term dictionaries. I do.

【0016】第2の本発明の辞書装置は、複数のユーザ
が利用する自然言語処理装置に設けられる辞書装置であ
って、ユーザが編集可能なユーザ毎のユーザ辞書と、全
ユーザに共通な共通辞書と、同一の辞書情報が所定条件
を満たす数の上記ユーザ辞書に格納されているときに、
その辞書情報を上記共通辞書に登録する共通辞書充実化
手段とを有することを特徴とする。
A dictionary device according to a second aspect of the present invention is a dictionary device provided in a natural language processing device used by a plurality of users, and includes a user dictionary for each user that can be edited by a user, and a common dictionary common to all users. When the same dictionary information as the dictionary is stored in a number of the user dictionaries satisfying a predetermined condition,
A common dictionary enriching means for registering the dictionary information in the common dictionary.

【0017】第3の本発明の辞書装置は、階層構造で上
位の上位辞書と、上記上位辞書の下位に位置している複
数の下位辞書と、同一の辞書情報が所定条件を満たす数
の上記下位辞書に格納されているときに、その辞書情報
を上記上位辞書に登録する辞書情報統合手段とを有する
ことを特徴とする。
According to a third aspect of the present invention, there is provided a dictionary device having an upper-level dictionary in a hierarchical structure, a plurality of lower-level dictionaries positioned below the upper-level dictionary, and a number of the same dictionary information satisfying a predetermined condition. A dictionary information integrating unit that registers the dictionary information in the upper dictionary when stored in the lower dictionary.

【0018】第4の本発明の辞書装置は、複数のユーザ
が利用する自然言語処理装置に設けられる辞書装置であ
って、ユーザが編集可能なユーザ毎のユーザ辞書と、全
ユーザに共通な共通辞書と、少なくとも上記各ユーザ辞
書の格納内容に基づき、上記共通辞書の下位に下位辞書
を設定する辞書分割・生成手段とを有することを特徴と
する。
The fourth dictionary apparatus of the present invention is a dictionary apparatus provided in a natural language processing apparatus used by a plurality of users. The dictionary apparatus has a user dictionary that can be edited by each user and a common dictionary common to all users. It is characterized by having a dictionary and dictionary dividing / generating means for setting a lower dictionary below the common dictionary based on at least the stored contents of each user dictionary.

【0019】[0019]

【発明の実施の形態】(A)第1の実施形態 以下、本発明による辞書装置を、インターネットのサー
バ上に設けられる機械翻訳機能に適用した第1の実施形
態を図面を参照しながら説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS (A) First Embodiment A first embodiment in which a dictionary device according to the present invention is applied to a machine translation function provided on an Internet server will be described below with reference to the drawings. .

【0020】(A−1)第1の実施形態の構成 図2は、第1の実施形態が適用されている機械翻訳ネッ
トワークシステムの構成を示すブロック図である。
(A-1) Configuration of First Embodiment FIG. 2 is a block diagram showing a configuration of a machine translation network system to which the first embodiment is applied.

【0021】図2において、この機械翻訳ネットワーク
システム1は、インターネット2上のサーバ3が、イン
ターネット2を介してユーザ端末4に接続し得る構成と
なっている。図2では示していないが、サーバ3は、イ
ンターネット2を介して他のサーバ等にも接続され得
る。
In FIG. 2, the machine translation network system 1 has a configuration in which a server 3 on the Internet 2 can connect to a user terminal 4 via the Internet 2. Although not shown in FIG. 2, the server 3 can be connected to another server or the like via the Internet 2.

【0022】サーバ3は、HTTPデーモン10、ログ
解析部11、アクセスログ格納部12、Webサーバ1
3、機械翻訳システム14、辞書データベース15、辞
書コンバータ16、HTMLパーザ17及び入出力装置
18を有する。
The server 3 includes an HTTP daemon 10, a log analysis unit 11, an access log storage unit 12, and a Web server 1.
3. It has a machine translation system 14, a dictionary database 15, a dictionary converter 16, an HTML parser 17, and an input / output device 18.

【0023】ここで、Webサーバ13は、機能的に
は、コミュニケーションツール13a、Web翻訳処理
部13b、辞書編集部13c、ユーザ登録・認証部13
d及びコミュニティ管理部13eを有する。また、機械
翻訳システム14は、翻訳エンジン14a及び辞書部1
4bを有する。さらに、辞書データベース15は、辞書
情報部15a、ユーザ情報部15b及びコミュニティ情
報部15cを有する。
Here, the Web server 13 functionally includes a communication tool 13a, a Web translation processing unit 13b, a dictionary editing unit 13c, a user registration / authentication unit 13
d and a community management unit 13e. The machine translation system 14 includes a translation engine 14a and a dictionary unit 1
4b. Further, the dictionary database 15 has a dictionary information section 15a, a user information section 15b, and a community information section 15c.

【0024】ユーザ端末4は、インターネット2側に対
して、ホームページやWebページ(以下ではこれらを
まとめてWebページと呼ぶ)5の検索を指示するもの
である。ここで、サーバ3の運営者との間で翻訳サービ
スの提供契約を締結しているユーザは、検索されたWe
bページを所定言語に翻訳して送信することを、ユーザ
端末4を用いてサーバ3に指示することができる。ユー
ザは、例えば、サーバ3が提供するホームページ上の翻
訳指示入力フィールドに入力したり、サーバ3に与える
Webページを規定する文書識別情報に翻訳を指示する
コードを導入したり、リンク先情報として翻訳結果の文
書を指定したりすることにより、検索されたWebペー
ジを所定言語に翻訳して送信することを指示することが
できる。
The user terminal 4 instructs the Internet 2 to search for a home page or a Web page (hereinafter, these are collectively referred to as a Web page) 5. Here, the user who has concluded the translation service provision contract with the operator of the server 3 is the retrieved We
Using the user terminal 4, the server 3 can be instructed to translate the page b into a predetermined language and transmit it. For example, the user can input a translation instruction input field on a homepage provided by the server 3, introduce a code for instructing translation into document identification information that specifies a Web page given to the server 3, or translate as link destination information. By designating the resulting document, it is possible to instruct that the searched Web page be translated into a predetermined language and transmitted.

【0025】サーバ3において、HTTPデーモン10
は、検索されたWebページ(HTML文書)を所定の
転送プロトコルに従って転送させるものである。
In the server 3, the HTTP daemon 10
Is to transfer the searched Web page (HTML document) according to a predetermined transfer protocol.

【0026】ログ解析部11は、ユーザ端末4からの検
索したいWebページやユーザ端末4を規定する通信情
報から、アクセスログを得てアクセスログ格納部12に
格納させたりすると共に、Webサーバ13をログイン
させたりログアウトさせたりするものである。なお、ロ
グインさせる際には、ユーザの認証などが必要となる。
The log analysis unit 11 obtains an access log from a Web page to be searched from the user terminal 4 and communication information defining the user terminal 4 and stores the access log in the access log storage unit 12. Log in and log out. When logging in, user authentication or the like is required.

【0027】Webサーバ13におけるコミュニケーシ
ョンツール13aは、Webページの検索のための通信
機能や、ユーザ端末4との通信機能等を担うものであ
る。
The communication tool 13a in the Web server 13 has a communication function for searching for a Web page, a communication function with the user terminal 4, and the like.

【0028】Webサーバ13における他の機能部、す
なわち、Web翻訳処理部13b、辞書編集部13c、
ユーザ登録・認証部13d及びコミュニティ管理部13
eは、Webページの翻訳に関係する機能部である。
The other functional units in the Web server 13, that is, the Web translation processing unit 13b, the dictionary editing unit 13c,
User registration / authentication unit 13d and community management unit 13
“e” is a functional unit related to translation of a Web page.

【0029】Web翻訳処理部13bは、検索されたW
ebページが翻訳を必要な場合に、HTMLパーザ17
を介して、機械翻訳システム14に検索されたWebペ
ージを与えてそのWebページの翻訳を実行させるもの
である。
The Web translation processing unit 13b sends the retrieved W
HTML parser 17 when eb page needs translation
The retrieved web page is provided to the machine translation system 14 via the web browser and the translation of the web page is executed.

【0030】ここで、HTMLパーザ17は、タグ情報
等に基づいて、検索されたWebページ(HTML文
書)における翻訳が必要な部分(文章部分)だけを取り
出して機械翻訳システム14に与え、また、翻訳結果に
タグ情報を復帰させてWebページ(HTML文書)に
戻すものである。また、機械翻訳システム14におい
て、翻訳エンジン14aは機械翻訳を実行する部分であ
り、辞書部14bは翻訳エンジン14aが機械翻訳する
際に利用する辞書情報が格納されている。なお、後述す
る辞書情報部15aに格納されている辞書情報が、辞書
コンバータ16によって、翻訳エンジン14a向けに変
換されて辞書部14bに格納される。
Here, the HTML parser 17 takes out only a portion (sentence portion) of the retrieved Web page (HTML document) which needs to be translated, based on the tag information and the like, and gives it to the machine translation system 14. The tag information is returned to the translation result, and is returned to a Web page (HTML document). Further, in the machine translation system 14, the translation engine 14a is a part that executes machine translation, and the dictionary unit 14b stores dictionary information used when the translation engine 14a performs machine translation. The dictionary information stored in the dictionary information unit 15a described later is converted by the dictionary converter 16 for the translation engine 14a and stored in the dictionary unit 14b.

【0031】なお、以上のような検索されたWebペー
ジ(HTML文書)に対する翻訳起動や翻訳したものの
出力方法などは、同一出願人に係る特開平7−2027
21号公報や特開平7−202734号公報に記載の方
法を適用できる。
Note that the translation activation for the retrieved Web page (HTML document) and the method of outputting the translated version are described in Japanese Patent Application Laid-Open No. 7-2027 by the same applicant.
No. 21 and Japanese Patent Application Laid-Open No. 7-202734 can be applied.

【0032】この第1の実施形態や後述する各実施形態
は、Webサーバ13の辞書編集部13c、ユーザ登録
・認証部13d及びコミュニティ管理部13eや、辞書
データベース15や、入出力装置18に関係する部分に
特徴を有するものである。
The first embodiment and each embodiment described below relate to the dictionary editing unit 13c, the user registration / authentication unit 13d, the community management unit 13e, the dictionary database 15, and the input / output device 18 of the Web server 13. It has features in the part to be performed.

【0033】辞書データベース15における辞書情報部
15aは、各種の辞書情報を格納しているものである。
辞書情報部15aの辞書構成は、一般用語辞書、専門用
語辞書及びユーザ辞書である。
The dictionary information section 15a in the dictionary database 15 stores various types of dictionary information.
The dictionary configuration of the dictionary information section 15a is a general term dictionary, a technical term dictionary, and a user dictionary.

【0034】一般的には、優先順位が、高い方から、ユ
ーザ辞書、専門用語辞書、一般用語辞書の順に、翻訳時
の適用の階層化がなされているが、この第1の実施形態
では、図1に示すような階層化を行っており、第1の実
施形態は、この階層化に大きな特徴を有している。
In general, hierarchies of application at the time of translation are made in the order of user dictionary, technical term dictionary, and general term dictionary in descending order of priority. In the first embodiment, Hierarchy as shown in FIG. 1 is performed, and the first embodiment has a great feature in this hierarchization.

【0035】図1において、第1の実施形態での辞書構
成は基本的にはツリー構造の階層化構造をしている。
In FIG. 1, the dictionary configuration in the first embodiment basically has a hierarchical structure of a tree structure.

【0036】そして、一般用語辞書D0をルートノード
としており、その次の階層には、専門分野やジャンルを
大分類した場合の専門用語辞書D11〜D1xが設けら
れている。それより下位の階層には、上位の階層の専門
分野やジャンルをさらに分類した場合の専門用語辞書が
設けられており、終端ノードに至る枝数(階層の深さ)
は一律である必要はない。
The general term dictionary D0 is used as a root node, and the next hierarchical level is provided with specialized term dictionaries D11 to D1x in a case where a specialized field or genre is largely classified. A technical term dictionary for further classifying specialized fields and genres of the higher layer is provided in the lower layers, and the number of branches to the terminal node (depth of the layer)
Need not be uniform.

【0037】図1の例では、コンピュータに係る専門用
語辞書D11の下位階層には、コンピュータハードウェ
ア専門用語辞書D111及びコンピュータソフトウェア
専門用語辞書D112が設けられている。一方、料理に
係る専門用語辞書D1xの下位階層には、和食専門用語
辞書D1x1、中華専門用語辞書D1x2及び洋食専門
用語辞書D1x3が設けられており、洋食専門用語辞書
D1x3の下位階層には、フランス料理専門用語辞書D
1x31及びイタリア料理専門用語辞書D1x32が設
けられている。
In the example of FIG. 1, a computer technical term dictionary D111 and a computer software technical term dictionary D112 are provided at a lower level of the computer related term dictionary D11. On the other hand, a Japanese technical term dictionary D1x1, a Chinese technical term dictionary D1x2, and a Western technical term dictionary D1x3 are provided at a lower level of the cooking-related technical term dictionary D1x. Culinary Terminology Dictionary D
A 1x31 and an Italian cuisine technical term dictionary D1x32 are provided.

【0038】なお、ある専門用語辞書の直下の下位の専
門用語辞書が1個だけ存在していても良い。例えば、ス
ポーツ辞書の下位階層の辞書としてゴルフ辞書だけが設
けられていても良い。
Note that only one technical term dictionary immediately below a technical term dictionary may exist. For example, only a golf dictionary may be provided as a dictionary in a lower hierarchy of the sports dictionary.

【0039】また、この第1の実施形態の場合、ユーザ
辞書にも特徴を有する。各ユーザは、任意の専門用語辞
書に関連付けてユーザ辞書を設けることができ、しか
も、ユーザ辞書を設ける専門用語辞書の数は限定されな
い。勿論、ユーザは、関連付けられた専門用語辞書に係
る分野やジャンルの単語をそのユーザ辞書に登録するこ
とになる。
In the case of the first embodiment, the user dictionary also has a feature. Each user can provide a user dictionary in association with an arbitrary technical term dictionary, and the number of technical term dictionaries providing user dictionaries is not limited. Of course, the user registers words in the field or genre related to the associated technical term dictionary in the user dictionary.

【0040】図1の例では、ユーザAは、コンピュータ
専門用語辞書D11及びコンピュータハードウェア専門
用語辞書D111に関連付けてユーザ辞書UA11、U
A111を設けている。
In the example of FIG. 1, user A associates user dictionaries UA11, U11 with computer technical term dictionary D11 and computer hardware technical term dictionary D111.
A111 is provided.

【0041】なお、分野やジャンルに関係しない単語の
ユーザ登録のため、一般用語辞書D0に関連付けてユー
ザ辞書を設けることもできる。
It should be noted that a user dictionary can be provided in association with the general term dictionary D0 for user registration of words not related to the field or genre.

【0042】以下では、関連付けられたユーザ辞書も含
め、専門用語辞書のツリー構造部分(D11〜D1x3
2)は、後述する他の実施形態から明らかなように、専
門用語辞書にユーザの知識が反映されるので、以下で
は、コミュニティ辞書と呼ぶことにする。
In the following, the tree structure portion (D11 to D1x3) of the technical term dictionary including the associated user dictionary will be described.
In the case of 2), as will be apparent from other embodiments described later, since the user's knowledge is reflected in the technical term dictionary, it will be referred to as a community dictionary below.

【0043】辞書データベース15のユーザ情報部15
bには、当該サーバ3の運営者との間でサーバ3を利用
する契約の締結ユーザの情報が格納されている。また、
ユーザ情報部15bには、その登録されているユーザ
が、機械翻訳サービスを受けることができるか否かや、
また、そのユーザに関するユーザ辞書が設定されている
か否かなどの情報も格納されている。
User information section 15 of dictionary database 15
In b, information on a user who has made a contract with the operator of the server 3 to use the server 3 is stored. Also,
The user information section 15b indicates whether the registered user can receive the machine translation service,
Also, information such as whether or not a user dictionary for the user has been set is stored.

【0044】辞書データベース15のコミュニティ情報
部15cには、図1に示す辞書構造でのコミュニティ辞
書部分に関する構造の情報などが格納されている。
The community information section 15c of the dictionary database 15 stores information on the structure related to the community dictionary portion in the dictionary structure shown in FIG.

【0045】Webサーバ13の辞書編集部13cは、
辞書情報部15aを編集するものである。
The dictionary editing unit 13c of the Web server 13
This is for editing the dictionary information section 15a.

【0046】Webサーバ13のユーザ登録・認証部1
3dは、ユーザ登録したり、当該サーバ3にアクセスし
てきた者が正規のユーザかを認証したり、機械翻訳サー
ビスが求められた場合にサービスを提供し得る者かを確
認したり、ユーザ辞書の操作を実行できる者かを確認し
たりするものである。
User registration / authentication unit 1 of Web server 13
3d performs user registration, authenticates whether a person who accesses the server 3 is a legitimate user, confirms whether a machine translation service can be provided when a machine translation service is requested, and checks a user dictionary. For example, to confirm whether the person can execute the operation.

【0047】Webサーバ13のコミュニティ管理部1
3eは、コミュニティ情報部15cの情報を管理するも
のである。例えば、翻訳に供するWebページの分野や
ジャンルが定まったときに、コミュニティ情報部15c
の情報に基づいて、機械翻訳で使用する辞書を定めるも
のである。
The community management unit 1 of the Web server 13
3e manages information of the community information section 15c. For example, when the field or genre of the Web page to be provided for translation is determined, the community information unit 15c
The dictionary used in the machine translation is determined based on the above information.

【0048】より具体的に言えば、今、ユーザAから翻
訳要求があるWebページの分野、ジャンルがコンピュ
ータハードウェアであれば、ユーザ辞書UA111、コ
ンピュータハードウェア専門用語辞書D111、ユーザ
辞書UA11及びコンピュータ専門用語辞書D11を使
用する辞書に決定すると共に、しかも、上述の順序で適
用優先度が高いようにする(一般用語辞書D0は常に対
象となる)。
More specifically, if the field and genre of the Web page for which a translation request is made by the user A is computer hardware, the user dictionary UA111, the computer hardware technical term dictionary D111, the user dictionary UA11, and the computer The terminology dictionary D11 is determined as a dictionary to be used, and the application priority is set to be higher in the order described above (the general term dictionary D0 is always a target).

【0049】すなわち、Webページの分野、ジャンル
に係る専門用語辞書から一般用語辞書に至るツリー構造
の経路上にある全ての専門用語辞書と、それら専門用語
辞書に関連付けられているユーザ辞書の全てを使用する
辞書に決定する。
That is, all the technical term dictionaries on the path of the tree structure from the technical term dictionary relating to the field and genre of the Web page to the general term dictionary, and all the user dictionaries associated with the technical term dictionaries are obtained. Decide which dictionary to use.

【0050】入出力装置18は、サーバ3の運営者側が
辞書の編集を起動したり、辞書を編集したりなどする際
に用いるものである。
The input / output device 18 is used when the operator of the server 3 starts editing a dictionary or edits a dictionary.

【0051】なお、第1の実施形態が適用されている機
械翻訳ネットワークシステム1は、複数のユーザからの
同時の翻訳要求に対応できるものである。例えば、1組
の機械翻訳システム14やHTMLパーザ17などを時
分割で用いて、複数の翻訳要求に対応するようにしても
良く、また、機械翻訳システム14やHTMLパーザ1
7を予め複数組用意して、複数の翻訳要求に対応するよ
うにしても良い。後者の場合において、オリジナルの機
械翻訳プログラムなどを、翻訳を求められる毎に複数個
用意されているCPUの主メモリなどにローディングし
て、複数の翻訳要求に同時に対応できるようにしても良
い。
The machine translation network system 1 to which the first embodiment is applied is capable of responding to simultaneous translation requests from a plurality of users. For example, one set of the machine translation system 14 and the HTML parser 17 may be used in a time-division manner to respond to a plurality of translation requests, and the machine translation system 14 and the HTML parser 1 may be used.
7 may be prepared in advance to respond to a plurality of translation requests. In the latter case, an original machine translation program or the like may be loaded into a main memory or the like of a plurality of CPUs prepared each time a translation is requested, so that a plurality of translation requests can be simultaneously handled.

【0052】翻訳要求したユーザ毎に、機械翻訳システ
ム14やHTMLパーザ17などの組を設定する場合に
おいて、機械翻訳システム14の辞書部14bに、We
bページの分野、ジャンルに従って使用することが決ま
った辞書の情報だけを、辞書データベース15から設定
するようにしても良い。
When a set such as the machine translation system 14 or the HTML parser 17 is set for each user who has requested translation, the dictionary unit 14b of the machine translation system 14
Only dictionary information determined to be used according to the field and genre of page b may be set from the dictionary database 15.

【0053】(A−2)第1の実施形態の動作 (A−2−1)ユーザ辞書登録 次に、ユーザがユーザ辞書に単語を登録する際のサーバ
3での動作を、図3のフローチャートを参照しながら説
明する。なお、この処理時において、ユーザ端末4及び
サーバ3で授受する情報は、HTML文書の形式の情報
である。
(A-2) Operation of First Embodiment (A-2-1) User Dictionary Registration Next, the operation of the server 3 when the user registers a word in the user dictionary will be described with reference to the flowchart of FIG. This will be described with reference to FIG. At the time of this processing, the information exchanged between the user terminal 4 and the server 3 is information in the form of an HTML document.

【0054】例えば、ユーザはユーザ端末4を用いて、
サーバ3が提供する所定のWebページを表示させ、単
語のユーザ登録モードを指示する。
For example, the user uses the user terminal 4 to
A predetermined Web page provided by the server 3 is displayed, and a word user registration mode is instructed.

【0055】このとき、サーバ3は、図3に示すユーザ
辞書登録処理を開始し、まず、サーバ3(ユーザ登録・
認証部13d)は、そのユーザが単語のユーザ登録を実
行し得る者であるか否かを判別する(ステップS1)。
At this time, the server 3 starts the user dictionary registration process shown in FIG.
The authentication unit 13d) determines whether or not the user is a person who can perform word user registration (step S1).

【0056】そのユーザが単語のユーザ登録を実行し得
る者でないと、サーバ3はその旨を返信して、ユーザ辞
書登録処理を終了する(ステップS2)。
If the user is not a person who can execute the user registration of the word, the server 3 returns that fact and terminates the user dictionary registration processing (step S2).

【0057】一方、ユーザが単語のユーザ登録を実行し
得る者であると、サーバ3(コミュニティ管理部13
e)は、コミュニティ情報部13eから一般用語辞書及
び専門用語辞書のツリー構造を取り出し、そのツリー構
造の情報を含むユーザ辞書登録入力画面をユーザ端末4
に送信し(ステップS3)、ユーザ端末4からの登録単
語情報を待ち受ける(ステップS4)。
On the other hand, if the user is a person who can execute user registration of words, the server 3 (community management unit 13
e) extracts the tree structure of the general term dictionary and the technical term dictionary from the community information section 13e, and displays a user dictionary registration input screen including the information of the tree structure on the user terminal 4
(Step S3), and waits for registered word information from the user terminal 4 (step S4).

【0058】ユーザ辞書登録入力画面が表示された際に
は、ユーザは、登録したい単語情報を入力し、また、表
示された一般用語辞書及び専門用語辞書のツリー構造に
基づいて、その登録単語情報に、関連付けたい辞書の情
報を付与してサーバ3に送信する。なお、複数の登録単
語情報をまとめて送信するできるようにしても良い。以
下では、説明の簡単化のため、1個の登録単語情報を送
信するものとする。
When the user dictionary registration input screen is displayed, the user inputs word information to be registered, and based on the displayed general term dictionary and technical term dictionary tree structure, the registered word information is displayed. And the information of the dictionary to be associated is transmitted to the server 3. Note that a plurality of registered word information may be transmitted together. In the following, it is assumed that one piece of registered word information is transmitted for simplification of the description.

【0059】サーバ3(ユーザ登録・認証部13d)
は、登録単語情報が与えられると、それに含まれている
一般用語辞書又は専門用語辞書に基づき、かつ、ユーザ
情報部15bやコミュニティ情報部15cの格納情報を
参照して、当該ユーザについて、今回の登録単語情報に
係るユーザ辞書(一般用語辞書又は専門用語辞書に関連
付けられたユーザ辞書)が既に設定されているか否かを
判別する(ステップS5)。
Server 3 (user registration / authentication unit 13d)
Given the registered word information, based on the general term dictionary or technical term dictionary included therein, and referring to the storage information in the user information section 15b and the community information section 15c, It is determined whether a user dictionary (user dictionary associated with a general term dictionary or a technical term dictionary) related to the registered word information has already been set (step S5).

【0060】ユーザ辞書が設定されていない場合には、
そのようなユーザ辞書を設定した後(ステップS6)、
既に設定されている場合には直ちに、ユーザ端末4から
与えられた登録単語情報を登録し(ステップS7)、一
連のユーザ辞書登録処理を終了する。
If no user dictionary has been set,
After setting such a user dictionary (step S6),
If it has already been set, the registered word information provided from the user terminal 4 is immediately registered (step S7), and the series of user dictionary registration processing ends.

【0061】ここで、辞書情報部15aは、辞書種類毎
に、格納領域が明確に分かれているものであっても良い
が、多くのユーザ辞書などを考慮すると、単語情報に辞
書種類の識別コードを付与して格納するものが好まし
く、この場合、ユーザ辞書の設定は、識別コードの割当
を意味する。
Here, the dictionary information section 15a may have a storage area which is clearly divided for each dictionary type. However, considering many user dictionaries, the dictionary information includes a dictionary type identification code. In this case, setting of the user dictionary means assignment of an identification code.

【0062】(A−2−2)機械翻訳処理 次に、Webページの機械翻訳処理について、図4のフ
ローチャートを参照しながら説明する。
(A-2-2) Machine Translation Processing Next, machine translation processing of a Web page will be described with reference to the flowchart of FIG.

【0063】サーバ3(Web翻訳処理部13b)は、
Webページの翻訳の必要性が生じると、図4に示す機
械翻訳処理を開始する。
The server 3 (Web translation processing unit 13b)
When the need to translate the Web page arises, the machine translation process shown in FIG. 4 is started.

【0064】Webページの翻訳の必要性が生じる場合
としては、例えば、(1)ユーザが検索したWebペー
ジを翻訳して届けることを指示した場合、(2)ユーザ
が一旦表示されたWebページを見てその翻訳を望んだ
場合、(3)ユーザがインターネットを介して発信しよ
うとするWebページの他の言語のWebページを欲し
た場合などである。
When the necessity of translating a web page arises, for example, (1) when the user instructs to translate and deliver the retrieved web page, (2) the user displays the web page once displayed (3) When the user wants a Web page in another language to be transmitted via the Internet, for example.

【0065】サーバ3(Web翻訳処理部13b)は、
図4に示す機械翻訳処理を開始すると、まず、今回の機
械翻訳に使用する機械翻訳システム14などの割当てを
行い(時分割でのタイムスロットの決定などを含む;ス
テップS10)、その後、翻訳対象のWebページの分
野、ジャンルを認識する(ステップS11)。
The server 3 (Web translation processing unit 13b)
When the machine translation process shown in FIG. 4 is started, first, the machine translation system 14 and the like to be used for the current machine translation are allocated (including determination of a time slot in time division; step S10). The field and genre of the Web page are recognized (step S11).

【0066】ここで、ユーザがWebページの分野やジ
ャンルをユーザ端末4から指定するようにしても良く、
また、サーバ3(Web翻訳処理部13b)がWebペ
ージの分野やジャンルを自動的に認識するようにしても
良い。分野やジャンルを自動的に認識する方法として
は、従来の技術の項で言及した公報記載の方法を適用で
きるだけでなく、分野やジャンル毎に、分野やジャンル
を規定する1又は複数のキーワードを予め定めておいて
Webページでのキーワードの出現数などから定める方
法など、既存の各種の方法を適用できる。なお、認識分
野やジャンルの候補が複数生じた場合には、例えば、コ
ミュニティ辞書での最も階層が低いものにする。
Here, the user may specify the field or genre of the Web page from the user terminal 4,
Further, the server 3 (Web translation processing unit 13b) may automatically recognize the field or genre of the Web page. As a method of automatically recognizing a field or genre, not only the method described in the gazette described in the section of the related art can be applied, but also one or a plurality of keywords defining the field or genre can be specified in advance for each field or genre. Various existing methods can be applied, such as a method that is determined and determined from the number of appearances of keywords on a Web page. When a plurality of candidates for the recognition field and the genre occur, for example, the lowest rank in the community dictionary is set.

【0067】以上のようにして、翻訳対象のWebペー
ジの分野、ジャンルを認識すると、サーバ3(Web翻
訳処理部13b)は、機械翻訳で使用する辞書種類を決
定し、その種類の辞書が使用できる状態に設定する(ス
テップS12)。上述したように、Webページの分
野、ジャンルに係る専門用語辞書から一般用語辞書に至
る、コミュニティ辞書のツリー構造の経路上にある全て
の専門用語辞書と、それら専門用語辞書に関連付けられ
ているユーザ辞書の全てを使用する辞書に決定し、決定
した辞書の情報を辞書情報部13aから辞書部14bに
転送したり、また、辞書部14bに全種類の辞書情報が
設定されている場合であれば、決定された種類の辞書の
情報だけをアクセスし得るようにする。
As described above, when recognizing the field and genre of the Web page to be translated, the server 3 (Web translation processing unit 13b) determines the dictionary type to be used in the machine translation, and the dictionary of that type is used. A state is set (step S12). As described above, all the technical term dictionaries on the path of the tree structure of the community dictionary from the technical term dictionary relating to the field and genre of the Web page to the general term dictionary, and the user associated with the technical term dictionary If all of the dictionaries are determined to be used, and the information of the determined dictionaries is transferred from the dictionary information unit 13a to the dictionary unit 14b, or if all types of dictionary information are set in the dictionary unit 14b, , So that only the information of the determined type of dictionary can be accessed.

【0068】その後、サーバ3(HTMLパーザ17)
は、Webページから翻訳可能な文章部分だけを分離す
る(ステップS13)。そして、サーバ3(翻訳エンジ
ン14a)が翻訳を実行し(ステップS14)、得られ
た翻訳結果に対し、サーバ3(HTMLパーザ17)が
タグなどを復帰させ(ステップS15)、翻訳結果のW
ebページを得て、一連の機械翻訳処理を終了する。
Thereafter, the server 3 (HTML parser 17)
Separates only a translatable sentence portion from the Web page (step S13). Then, the server 3 (the translation engine 14a) executes the translation (step S14), and the server 3 (the HTML parser 17) returns the tag and the like to the obtained translation result (step S15), and the translation result W
The eb page is obtained, and a series of machine translation processing ends.

【0069】なお、当該サーバ3の登録ユーザが作成し
たWebページを、他の人間が検索して翻訳を求める場
合には(Webページの発信時翻訳)、登録ユーザに係
るユーザ辞書を翻訳に使用するようにしても良い。
When a web page created by a registered user of the server 3 is searched for translation by another person (translation at the time of transmitting the web page), a user dictionary relating to the registered user is used for translation. You may do it.

【0070】(A−3)第1の実施形態の効果 以上のように、第1の実施形態によれば、大分類、中分
類、…というように分類の大きさを変えた複数種類の専
門用語辞書を一般用語辞書をトップノードとするツリー
構造で階層化して用意しておくと共に、各専門用語辞書
に関連付けてユーザ辞書を設定可能とし、翻訳対象文書
の分類、ジャンルに応じ、その分野、ジャンルに係る専
門用語辞書から一般用語辞書に至る、ツリー構造の経路
上にある全ての専門用語辞書と、それら専門用語辞書に
関連付けられているユーザ辞書の全てを使用して、機械
翻訳するようにしたので、翻訳対象文書の分類、ジャン
ルに拘わらず、訳質が良好な翻訳結果を、平均的に見て
時間をかけずに得ることができる。
(A-3) Effects of the First Embodiment As described above, according to the first embodiment, a plurality of types of specialty with different classification sizes such as large classification, middle classification,. The term dictionary is prepared in a hierarchical structure with a tree structure with the general term dictionary as the top node, and a user dictionary can be set in association with each technical term dictionary. Depending on the classification and genre of the document to be translated, the field, Machine translation is performed by using all the technical term dictionaries on the tree-structured path from the technical term dictionary relating to the genre to the general term dictionary and all the user dictionaries associated with those technical term dictionaries. Therefore, regardless of the classification and genre of the translation target document, a translation result with good translation quality can be obtained without taking much time on average.

【0071】すなわち、専門性やジャンルの特殊性が高
ければ、それに応じた下位階層の専門用語辞書や、それ
に関連付けられているユーザ辞書の情報も翻訳に利用さ
れ、訳質を高めることができる。逆に、専門性やジャン
ルの特殊性が低ければ、それに応じた上位側の階層の専
門用語辞書や、それに関連付けられているユーザ辞書の
情報だけが翻訳に利用され、短時間のうちに、十分な訳
質の翻訳結果を得ることができる。
That is, if the specialty or the specialty of the genre is high, the technical term dictionary of the lower hierarchy corresponding thereto and the information of the user dictionary associated therewith are used for translation, and the translation quality can be improved. Conversely, if the specialty or genre is low, only the information in the higher-level technical term dictionary and the user dictionary associated with it is used for translation. It is possible to obtain a translation result of a high quality.

【0072】インターネットで入手できる文書は多種多
様であり、専門性やジャンルの特殊性が高いものから低
いものまで幅広くあるが、このような多種多様な文書の
翻訳に、上記第1の実施形態は有効に機能するものであ
る。
There are a wide variety of documents available on the Internet, ranging from those with a high degree of specialty and genre to low-specificity. It works effectively.

【0073】(B)第2の実施形態 次に、本発明による辞書装置を、インターネットのサー
バ上に設けられる機械翻訳機能に適用した第2の実施形
態を図面を参照しながら説明する。
(B) Second Embodiment Next, a second embodiment in which a dictionary device according to the present invention is applied to a machine translation function provided on a server on the Internet will be described with reference to the drawings.

【0074】(B−1)第2の実施形態の構成 第2の実施形態が適用されている機械翻訳ネットワーク
システムも、上述した第1の実施形態に係る図2のブロ
ック図で表すことができる。
(B-1) Configuration of the Second Embodiment A machine translation network system to which the second embodiment is applied can also be represented by the block diagram of FIG. 2 according to the first embodiment. .

【0075】しかし、以下では、図5を用いて、第2の
実施形態の機能的構成を説明する。なお、図5は、図2
以上に機能を整理し、第2の実施形態で特徴的な機能を
盛り込んで示した機能ブロック図である。
However, the functional configuration of the second embodiment will be described below with reference to FIG. Note that FIG.
FIG. 9 is a functional block diagram showing functions arranged in the above manner and incorporating characteristic functions in the second embodiment.

【0076】図5において、第2の実施形態に係る機械
翻訳ネットワークシステム21は、インターネット22
上の検索・翻訳サーバ23が、インターネット22を介
して閲覧・入力手段24に接続されて構築されている。
In FIG. 5, a machine translation network system 21 according to the second embodiment
The above search / translation server 23 is connected to the browsing / input means 24 via the Internet 22 and is constructed.

【0077】閲覧・入力手段24は、第1の実施形態に
係るユーザ端末4が相当するものであり、インターネッ
ト22側に、文書の検索を依頼したり、検索文書の翻訳
を依頼したり、検索文書や、それを翻訳した翻訳文書な
どを表示したり、ユーザ辞書への登録を依頼したりなど
するものである。
The browsing / input means 24 corresponds to the user terminal 4 according to the first embodiment. The browsing / input means 24 requests the Internet 22 to search for a document, request translation of a search document, search for a search document, It is used to display a document, a translated document obtained by translating the document, request a registration in a user dictionary, and the like.

【0078】検索・翻訳サーバ23は、文書の検索や、
文書の機械翻訳などを実行するものであって、通信制御
手段31、機械翻訳手段32、辞書管理手段33、辞書
データベース34及び専門用語辞書充実化手段35など
を有する。
The search / translation server 23 searches for a document,
It executes machine translation of a document, and has a communication control unit 31, a machine translation unit 32, a dictionary management unit 33, a dictionary database 34, a technical term dictionary enrichment unit 35, and the like.

【0079】通信制御手段31は、図示しない外部のイ
ンターネット要素(文書格納手段)や、閲覧・入力手段
との通信を制御するものである。外部のインターネット
要素(文書格納手段)との通信は、所定の文書を取り出
すための通信である。
The communication control means 31 controls communication with an external Internet element (document storage means), not shown, and with the browsing / input means. Communication with an external Internet element (document storage means) is communication for extracting a predetermined document.

【0080】機械翻訳手段32は、検索文書に対して機
械翻訳が必要な場合に、どの辞書を使用するかなどの制
御を行ない、検索文書を他の言語に翻訳するものであ
る。
The machine translation means 32 controls which dictionary is used when machine translation is required for the search document, and translates the search document into another language.

【0081】辞書管理手段33は、辞書データベース3
4内の辞書の作成や、辞書単語情報の取り出しや編集な
どを行うものである。例えば、辞書管理手段33は、機
械翻訳手段32から指示された辞書の単語情報を辞書デ
ータベース34から取り出して機械翻訳手段32に与え
たりする。また例えば、辞書管理手段33は、専門用語
辞書充実化手段35から要求された辞書の単語情報を辞
書データベース34から取り出して与え、専門用語辞書
充実化手段35がある辞書へ追加する単語情報と決定し
たものを、辞書データベース34内の該当する辞書に追
加させるものである。
The dictionary management means 33 stores the dictionary database 3
4 for creating a dictionary, extracting and editing dictionary word information, and the like. For example, the dictionary management unit 33 extracts word information of the dictionary specified by the machine translation unit 32 from the dictionary database 34 and gives the word information to the machine translation unit 32. Also, for example, the dictionary management unit 33 takes out the word information of the dictionary requested from the technical term dictionary enriching unit 35 from the dictionary database 34 and gives the word information, and determines that the word information is to be added to a certain dictionary. Is added to the corresponding dictionary in the dictionary database 34.

【0082】辞書データベース34は、各種の辞書を格
納しているデータベースである。この第2の実施形態に
おいても、辞書データベース34に格納されている複数
の辞書は、第1の実施形態で説明した図1に示すツリー
構造のものと同様である。すなわち、一般用語辞書をル
ートノードとし、その次の階層には、専門分野やジャン
ルを大分類した場合の専門用語辞書が設けられ、それよ
り下位の階層には、上位の階層の専門分野やジャンルを
さらに分類した場合の専門用語辞書が設けられ、終端ノ
ードに至る枝数(階層の深さ)は一律ではなく、また、
各専門用語辞書に関連付けてユーザ辞書を設けられてい
るものである。
The dictionary database 34 is a database that stores various dictionaries. Also in the second embodiment, the plurality of dictionaries stored in the dictionary database 34 are the same as those in the tree structure illustrated in FIG. 1 described in the first embodiment. In other words, a general term dictionary is used as a root node, and a technical term dictionary for a case where a specialty field or genre is roughly classified is provided in the next layer, and a special field or genre of a higher layer is provided in a lower layer. Is provided, and the number of branches (depth of the hierarchy) reaching the terminal node is not uniform.
A user dictionary is provided in association with each technical term dictionary.

【0083】なお、図5では、この第2の実施形態の特
徴を理解し易くすべく、ある1個の専門用語辞書Dm
と、この専門用語辞書Dmに関連付けられている複数の
ユーザ辞書Dm1〜DmNとを示している。
In FIG. 5, in order to make it easier to understand the features of the second embodiment, a certain technical term dictionary Dm
And a plurality of user dictionaries Dm1 to DmN associated with this technical term dictionary Dm.

【0084】専門用語辞書充実化手段35は、ユーザ辞
書Dm1〜DmNの単語情報から、専門用語辞書Dmに
登録した方がよいと思われる情報を自動的に抽出して専
門用語辞書Dmに登録するものである。
The technical term dictionary enriching means 35 automatically extracts, from the word information of the user dictionaries Dm1 to DmN, information that is considered better to be registered in the technical term dictionary Dm and registers the information in the technical term dictionary Dm. Things.

【0085】ここで、専門用語辞書充実化手段35の処
理は、1日1回(例えば午前2時)ずつなどの定期的に
起動されるものであっても良く、また、検索・翻訳サー
バ23の運営者が図示しない入出力装置(図2の入出力
装置18参照)を用いて起動するものでも良い。さらに
は、いずれかのユーザ辞書に単語登録がなされる毎に、
起動されるものであっても良い。
Here, the processing of the technical term dictionary enrichment means 35 may be periodically started, for example, once a day (for example, at 2:00 am). May be started using an input / output device (not shown) (see input / output device 18 in FIG. 2). Furthermore, every time a word is registered in any of the user dictionaries,
It may be activated.

【0086】(B−2)第2の実施形態の動作 次に、第2の実施形態の特徴を構成している専門用語辞
書充実化手段35の動作を、図6のフローチャートを用
いて説明する。
(B-2) Operation of the Second Embodiment Next, the operation of the technical term dictionary enriching means 35 constituting the feature of the second embodiment will be described with reference to the flowchart of FIG. .

【0087】なお、図6は、定期的に起動された場合、
又は、サーバ運営者によって起動された場合に対応する
ものである。また、図6は、ある1個の専門用語辞書が
対象となった場合の処理を示しており、全ての専門用語
辞書に対して、図6に示す処理がそれぞれ実行される。
FIG. 6 shows a case where the program is started periodically.
Or, it corresponds to the case where the server is started by the server operator. FIG. 6 shows a process when a certain technical term dictionary is targeted, and the process shown in FIG. 6 is executed for all the technical term dictionaries.

【0088】専門用語辞書充実化手段35は、図6に示
す処理を開始すると、全てのユーザ辞書の情報を、辞書
データベース34から、関連する専門用語辞書毎に同一
の単語情報を集計しながら取り出してバッファリングす
る(ステップS31)。
When the processing shown in FIG. 6 is started, the technical term dictionary enriching means 35 extracts information of all the user dictionaries from the dictionary database 34 while summing up the same word information for each related technical term dictionary. Buffering (step S31).

【0089】図7は、集計しながら取り出した例を示し
ている。左から、異なる辞書データ毎に番号付けした情
報(辞書データID)、見出し語、訳語、登録されてい
る数を示している。なお、辞書データIDは、0から連
番が付されているとしている。
FIG. 7 shows an example in which data is taken out while counting. From the left, information (dictionary data ID) numbered for each different dictionary data, headwords, translations, and registered numbers are shown. It is assumed that the dictionary data IDs are sequentially numbered from 0.

【0090】集計しながらの取り出しが終了すると、専
門用語辞書充実化手段35は、辞書データIDを0(初
期値)にセットする(ステップS32)。
When the retrieval while summing up is completed, the technical term dictionary enriching means 35 sets the dictionary data ID to 0 (initial value) (step S32).

【0091】そして、全ての辞書データについて充実化
処理が終了するまで、ステップS33〜S37での処理
ループを繰り返す。
Then, the processing loop of steps S33 to S37 is repeated until the enrichment processing is completed for all dictionary data.

【0092】専門用語辞書充実化手段35は、登録され
た数が、その専門用語辞書に関連付けられたユーザ辞書
の数の過半数以上の単語情報が存在するか否かを判別す
る(ステップS33、S34)。
The technical term dictionary enriching means 35 determines whether or not there is word information whose registered number is a majority of the number of user dictionaries associated with the technical term dictionary (steps S33, S34). ).

【0093】そのような単語情報が1個でも存在すれ
ば、専門用語辞書に、それらの単語情報を全て追加登録
する(ステップS35)。なお、この際には、その専門
用語辞書にその単語情報が存在しないことを確認して登
録する。
If there is at least one such word information, all the word information is additionally registered in the technical term dictionary (step S35). In this case, it is confirmed that the word information does not exist in the technical term dictionary and registered.

【0094】このような単語情報の専門用語辞書への追
加登録が終了すると、又は、登録数がユーザ辞書数の過
半数以上の単語情報が1個も存在しないと、辞書データ
IDを1インクリメントした後(ステップS36)、未
処理の辞書データがが残っているか否かを判別する(ス
テップS37)。
If the additional registration of such word information in the terminology dictionary is completed, or if there is no word information whose registration number is a majority of the number of user dictionaries, the dictionary data ID is incremented by one. (Step S36), it is determined whether or not unprocessed dictionary data remains (Step S37).

【0095】未処理の辞書データが残っていれば、上述
したステップS33に戻り、全ての辞書データについて
充実化処理が終了したならば、図6に示す一連の処理を
終了する。
If unprocessed dictionary data remains, the process returns to step S33, and if the enrichment process has been completed for all dictionary data, a series of processes shown in FIG. 6 is completed.

【0096】図7の例において、専門用語辞書に関連付
けられているユーザ辞書の数が5個だとすると、単語情
報「pencil;鉛筆」はユーザ辞書登録数が3個で
あって過半数以上であるので、図6の処理を通じて、対
象となっている専門用語辞書に登録される。
In the example of FIG. 7, if the number of user dictionaries associated with the technical term dictionary is five, the word information “pencil; pencil” has three user dictionary registrations, which is more than a majority. Through the processing in FIG. 6, the information is registered in the target technical term dictionary.

【0097】上記説明では、専門用語辞書への登録条件
をユーザ辞書数の過半数以上としたが、他の割合を閾値
とする登録要件であっても良い。また、ユーザ辞書数に
よって、登録要件を規定する閾値を異なるようにしても
良い。
In the above description, the condition for registration in the technical term dictionary is set to a majority or more of the number of user dictionaries. However, a registration requirement using another ratio as a threshold may be used. Further, the threshold value that defines the registration requirement may be different depending on the number of user dictionaries.

【0098】また、上記説明では、専門用語辞書に追加
登録した後も、ユーザ辞書にその単語情報を残すものを
示したが、専門用語辞書に追加登録した単語情報をユー
ザ辞書から消去するようにしても良い。
In the above description, the word information remains in the user dictionary even after it is additionally registered in the technical term dictionary. However, the word information additionally registered in the technical term dictionary is deleted from the user dictionary. May be.

【0099】さらに、上記説明においては、専門用語辞
書への登録を、その専門用語辞書に関連付けられた全て
のユーザ辞書での登録状況から判断するものを示した
が、一部のユーザ辞書での登録状況から専門用語辞書へ
の登録可否を決定するようにしても良い。インターネッ
ト上のサーバに設けられている場合、ユーザ辞書数が多
数になることも考えられ、処理の簡便化を期して、一部
(例えば100個)のユーザ辞書での登録状況から専門
用語辞書への登録可否を決定するようにしても良い。こ
こで、一部のユーザ辞書として、ユーザ登録数が多い方
から所定個数のユーザ辞書を定めたものでも良く、ユー
ザ登録された単語情報数が所定数以上のユーザ辞書に定
めたものでも良く、乱数などを利用して複数のユーザ辞
書を定めたものでも良く、さらには、これらを組合せて
定めても良い。
Further, in the above description, the registration in the technical term dictionary is determined based on the registration status in all the user dictionaries associated with the technical term dictionary. Whether to register in the technical term dictionary may be determined based on the registration status. When provided in a server on the Internet, the number of user dictionaries may be large, and in order to simplify the processing, the registration status of some (for example, 100) user dictionaries is changed to a technical term dictionary. May be determined. Here, as a part of the user dictionaries, a predetermined number of user dictionaries may be determined from a user having a large number of registered users, or a user dictionary having a predetermined number or more of word information registered by the user may be used. A plurality of user dictionaries may be determined using random numbers or the like, or may be determined in combination.

【0100】さらにまた、上記では、専門用語辞書への
登録を完全に自動化したものを示したが、サーバ運営者
などに専門用語辞書に追加登録したい単語情報を表示し
て確認させた上で、専門用語辞書に追加登録するように
しても良い。
Further, in the above description, the registration in the technical term dictionary is completely automated. However, after the server operator or the like displays and confirms the word information to be additionally registered in the technical term dictionary, You may make it register additionally in a technical term dictionary.

【0101】なお、一般用語辞書に関連付けられてユー
ザ辞書が存在するのであれば、上記処理と同様にして一
般用語辞書を充実化させても良い。
If a user dictionary exists in association with the general term dictionary, the general term dictionary may be expanded in the same manner as the above processing.

【0102】(B−3)第2の実施形態の効果 以上のように、第2の実施形態によれば、多くのユーザ
が使っているような専門用語を専門用語辞書に自動的に
取り込むようにしたので、専門用語辞書を充実化させる
ことができ、訳質の向上を期待できる。特に、ユーザ登
録を行っていない者にとっては、第2の実施形態の専門
用語充実化機能による恩恵は大きい。
(B-3) Effect of Second Embodiment As described above, according to the second embodiment, technical terms used by many users are automatically imported into the technical term dictionary. Therefore, the technical term dictionary can be enriched and the translation quality can be improved. In particular, those who have not performed user registration benefit greatly from the technical term enrichment function of the second embodiment.

【0103】また、システム運営者(サーバ運営者)か
ら見ても、当初から完璧な専門用語辞書の作成を期する
と、時間、工数、コスト共に膨大になるが、専門用語辞
書の上記充実化機能を前提とすれば、システムの立ち上
がり時における専門用語辞書の完璧性は緩和され、辞書
の作成時間、工数、コストをある程度押さえることがで
きる。
Also, from the viewpoint of the system operator (server operator), it is enormous in time, man-hour, and cost to create a perfect technical term dictionary from the beginning. As a prerequisite, the perfection of the technical term dictionary at the start of the system is relaxed, and the dictionary creation time, man-hour, and cost can be reduced to some extent.

【0104】(C)第3の実施形態 次に、本発明による辞書装置を、インターネットのサー
バ上に設けられる機械翻訳機能に適用した第3の実施形
態を図面を参照しながら説明する。
(C) Third Embodiment Next, a third embodiment in which the dictionary device according to the present invention is applied to a machine translation function provided on a server on the Internet will be described with reference to the drawings.

【0105】(C−1)第3の実施形態の構成 第3の実施形態が適用されている機械翻訳ネットワーク
システムも、上述した第1の実施形態に係る図2のブロ
ック図で表すことができる。
(C-1) Configuration of Third Embodiment A machine translation network system to which the third embodiment is applied can also be represented by the block diagram of FIG. 2 according to the first embodiment. .

【0106】しかし、以下では、図8を用いて、第3の
実施形態の機能的構成を説明する。なお、図8は、図2
以上に機能を整理し、第3の実施形態で特徴的な機能を
盛り込んで示した機能ブロック図であり、上述した第2
の実施形態に係る図5との同一、対応部分には同一符号
を付して示している。
However, the functional configuration of the third embodiment will be described below with reference to FIG. Note that FIG.
FIG. 14 is a functional block diagram showing functions arranged in the above manner and incorporating characteristic functions in the third embodiment.
The same and corresponding parts as those in FIG. 5 according to the embodiment are denoted by the same reference numerals.

【0107】図8において、第3の実施形態に係る機械
翻訳ネットワークシステム21Aも、インターネット2
2上の検索・翻訳サーバ23Aが、インターネット22
を介して閲覧・入力手段24に接続されて構築されてい
る。
Referring to FIG. 8, the machine translation network system 21A according to the third embodiment also has the Internet 2
Search and translation server 23A on the Internet 22
And is connected to the browsing / input means 24 via the.

【0108】第3の実施形態は、第2の実施形態に比較
すると、検索・翻訳サーバ23Aの機能的構成が多少異
なっている。すなわち、第3の実施形態では、第2の実
施形態の専門用語充実化手段27に代え、辞書情報統合
手段36が設けられている。
The third embodiment is slightly different from the second embodiment in the functional configuration of the search / translation server 23A. That is, in the third embodiment, a dictionary information integration unit 36 is provided instead of the technical term enrichment unit 27 of the second embodiment.

【0109】なお、辞書データベース34は、第2の実
施形態と同様であるが、第3の実施形態との特徴との関
係から、図8では、専門用語辞書の階層化を明確化させ
て示している。
Although the dictionary database 34 is the same as that of the second embodiment, FIG. 8 clarifies the hierarchies of the technical term dictionary in relation to the features of the third embodiment. ing.

【0110】第3の実施形態の特徴を構成する辞書情報
統合手段36は、ある専門用語辞書の直下の階層の複数
の専門用語辞書に同一の単語情報が存在する場合に、そ
の単語情報を上位の専門用語辞書に登録するものであ
る。例えば、図8の辞書データベース34の表記におい
て、政治辞書Dn1及び経済辞書Dn2に同じ単語情報
が登録されている場合に、その上位の政治経済辞書Dn
にその単語情報を登録するものである。
When the same word information is present in a plurality of technical term dictionaries immediately below a certain technical term dictionary, the dictionary information integrating means 36 constituting the feature of the third embodiment ranks the word information higher. Is registered in the terminology dictionary. For example, when the same word information is registered in the political dictionary Dn1 and the economic dictionary Dn2 in the notation of the dictionary database 34 in FIG.
Is registered in the word information.

【0111】ここで、辞書情報統合手段36の処理も、
1日1回(例えば午前2時)ずつなどの定期的に起動さ
れるものであっても良く、また、検索・翻訳サーバ23
の運営者が図示しない入出力装置(図2の入出力装置1
8参照)を用いて起動するものでも良い。さらには、第
2の実施形態のようにして、専門用語辞書に対する追加
登録がなされる毎に、起動されるものであっても良い。
Here, the processing of the dictionary information integrating means 36 is also
It may be activated periodically, for example, once a day (for example, at 2:00 am).
The input / output device not shown by the operator (input / output device 1 in FIG. 2)
8)). Further, as in the second embodiment, each time an additional registration is made in the technical term dictionary, the program may be started.

【0112】(C−2)第3の実施形態の動作 次に、第3の実施形態の特徴を構成している辞書情報統
合手段36の動作を、図9のフローチャートを用いて説
明する。
(C-2) Operation of the Third Embodiment Next, the operation of the dictionary information integrating means 36 constituting a feature of the third embodiment will be described with reference to the flowchart of FIG.

【0113】なお、図9は、定期的に起動された場合、
又は、サーバ運営者によって起動された場合に対応する
ものである。また、図9は、ある1個の専門用語辞書が
対象となった場合の処理を示しており、全ての専門用語
辞書に対して、図9に示す処理がそれぞれ実行される。
FIG. 9 shows a case where the program is started periodically.
Or, it corresponds to the case where the server is started by the server operator. FIG. 9 shows a process in the case where a certain technical term dictionary is targeted, and the process shown in FIG. 9 is executed for all the technical term dictionaries.

【0114】辞書情報統合手段36は、図9に示す処理
を開始するとまず、対象となっている専門用語辞書の下
位の全ての専門用語辞書に登録されている単語情報を取
り出し(ステップS41)、辞書データIDを0(初期
値)にセットする(ステップS42)。
When the processing shown in FIG. 9 is started, the dictionary information integrating means 36 first extracts word information registered in all technical term dictionaries below the subject technical term dictionary (step S41). The dictionary data ID is set to 0 (initial value) (step S42).

【0115】そして、下位の専門用語辞書の数の過半数
以上に登録されている単語情報が存在するか否かを判別
する(ステップS43、S44)。
Then, it is determined whether or not there is word information registered in a majority of the number of lower level technical term dictionaries (steps S43, S44).

【0116】そのような単語情報が1個でも存在すれ
ば、上位の専門用語辞書に、それらの単語情報を全て追
加登録すると共に、下位の専門用語辞書からそれらの単
語情報を削除する(ステップS35)。なお、この際に
は、上位の専門用語辞書にその単語情報が存在しないこ
とを確認してから追加登録するようにしても良い。
If there is at least one such word information, all the word information is additionally registered in the higher-level technical term dictionary, and the word information is deleted from the lower-level technical term dictionary (step S35). ). At this time, additional registration may be performed after confirming that the word information does not exist in the higher-level technical term dictionary.

【0117】以上の処理が終了した後、辞書データID
を1インクリメントし(ステップS46)、未処理の辞
書データが残っているか否かを判別する(ステップS4
7)。
After the above processing is completed, the dictionary data ID
Is incremented by 1 (step S46), and it is determined whether or not unprocessed dictionary data remains (step S4).
7).

【0118】未処理の辞書データが残っていれば、上述
したステップS42に戻り、全ての辞書データについて
統合処理が終了したならば、図9に示す一連の処理を終
了する。
If unprocessed dictionary data remains, the process returns to step S42, and if the integration process has been completed for all dictionary data, a series of processes shown in FIG. 9 ends.

【0119】ここで、吸い上げ処理(統合処理)を、階
層が低い方の専門用語辞書から階層が高い方の専門用語
辞書への順で行うことにより、吸い上げられたばかりの
単語情報がさらに上位の専門用語辞書に吸い上げられる
こともある。
Here, the siphoning process (integration process) is performed in the order from the technical term dictionary with the lower hierarchy to the technical term dictionary with the higher hierarchy, so that the word information that has just been siphoned is further higher in the specialty dictionary. It is sometimes picked up in the term dictionary.

【0120】上記説明では、上位の専門用語辞書への登
録条件を下位の専門用語辞書数の過半数以上で登録され
ていることにしたが、他の割合を閾値とする登録要件で
あっても良い。また、下位の専門用語辞書数によって、
上位への登録要件を規定する閾値を異なるようにしても
良い。さらには、各専門用語辞書で単語情報の使用頻度
や使用率などを管理し、複数の下位の専門用語辞書で、
ある程度使用されている単語情報であることをも上位の
専門用語辞書への登録要件に含めるようにしても良い。
In the above description, the condition for registration in the higher-level technical term dictionary is registered with a majority of the number of lower-level technical term dictionaries. However, a registration requirement using another ratio as a threshold may be used. . Also, depending on the number of subordinate terminology dictionaries,
The threshold value that defines the registration requirement for higher ranks may be different. In addition, each term dictionary manages the usage frequency and usage rate of word information, and multiple terminology term dictionaries,
The fact that the word information is used to some extent may be included in the registration requirements for the higher-level technical term dictionary.

【0121】また、上記説明では、上位の専門用語辞書
に追加登録すると、下位の専門用語辞書からその単語情
報を削除するものを示したが、上位の専門用語辞書に追
加登録した単語情報を下位の専門用語辞書に残すように
しても良い。
Also, in the above description, the word information is deleted from the lower-level technical term dictionary when it is additionally registered in the higher-level technical term dictionary. May be left in the terminology dictionary.

【0122】さらに、上記では、上位の専門用語辞書へ
の登録を完全に自動化したものを示したが、サーバ運営
者などに上位の専門用語辞書に追加登録したい単語情報
を表示して確認させた上で、上位の専門用語辞書に追加
登録するようにしても良い。
Further, in the above description, the registration in the higher-level technical term dictionary is completely automated, but the server operator or the like displays and confirms word information to be additionally registered in the higher-level technical term dictionary. Above, you may make it register additionally in a high-level technical term dictionary.

【0123】なお、大分類の複数の専門用語辞書に登録
されている単語情報を、一般用語辞書に登録させるよう
にしても良い。
Note that word information registered in a plurality of technical terms dictionaries of a large category may be registered in a general term dictionary.

【0124】(C−3)第3の実施形態の効果 以上のように、第3の実施形態によれば、上位の専門用
語辞書への下位の専門用語辞書からの単語情報の吸い上
げ機能を設けたので、上位の専門用語辞書が充実し、細
分された分野、ジャンルに属していない文書の訳質を向
上させることが質の向上を期待できる。
(C-3) Effect of Third Embodiment As described above, according to the third embodiment, a function of siphoning word information from a lower-level technical term dictionary to a higher-level technical term dictionary is provided. Therefore, a higher-level technical term dictionary is enriched, and improvement in the translation quality of documents that do not belong to a subdivided field or genre can be expected to improve the quality.

【0125】(D)第4の実施形態 次に、本発明による辞書装置を、インターネットのサー
バ上に設けられる機械翻訳機能に適用した第4の実施形
態を図面を参照しながら説明する。
(D) Fourth Embodiment Next, a fourth embodiment in which the dictionary device according to the present invention is applied to a machine translation function provided on a server on the Internet will be described with reference to the drawings.

【0126】(D−1)第4の実施形態の構成 第4の実施形態が適用されている機械翻訳ネットワーク
システムも、上述した第1の実施形態に係る図2のブロ
ック図で表すことができる。
(D-1) Configuration of the Fourth Embodiment A machine translation network system to which the fourth embodiment is applied can also be represented by the block diagram of FIG. 2 according to the first embodiment. .

【0127】しかし、以下では、図10を用いて、第4
の実施形態の機能的構成を説明する。なお、図10は、
図2以上に機能を整理し、第4の実施形態で特徴的な機
能を盛り込んで示した機能ブロック図であり、上述した
第2や第3の実施形態に係る図5や図8との同一、対応
部分には同一符号を付して示している。
However, in the following, referring to FIG.
The functional configuration of the embodiment will be described. In addition, FIG.
FIG. 12 is a functional block diagram showing functions arranged in FIG. 2 and above and incorporating characteristic functions in the fourth embodiment, and is the same as FIG. 5 and FIG. 8 according to the second and third embodiments described above. , Corresponding parts are denoted by the same reference numerals.

【0128】図10において、第4の実施形態に係る機
械翻訳ネットワークシステム21Bも、インターネット
22上の検索・翻訳サーバ23Bが、インターネット2
2を介して閲覧・入力手段24に接続されて構築されて
いる。
In FIG. 10, a machine translation network system 21B according to the fourth embodiment also has a search / translation server 23B on the
2 and is connected to the browsing / input means 24 via the network.

【0129】第4の実施形態は、第2や第3の実施形態
に比較すると、検索・翻訳サーバ23Bの機能的構成が
多少異なっている。すなわち、第4の実施形態では、第
2の実施形態の専門用語充実化手段27や第3の実施形
態の辞書情報統合手段36に代え、辞書分割・生成手段
37が設けられている。
The fourth embodiment differs slightly from the second and third embodiments in the functional configuration of the search / translation server 23B. That is, in the fourth embodiment, a dictionary division / generation unit 37 is provided instead of the terminology enrichment unit 27 of the second embodiment and the dictionary information integration unit 36 of the third embodiment.

【0130】なお、辞書データベース34は、第2や第
3の実施形態と同様であるが、第4の実施形態との特徴
との関係から、図10では、専門用語辞書とそれに関連
付けられているユーザ辞書との階層化を明確化させて示
している。
The dictionary database 34 is the same as in the second and third embodiments, but is related to the technical term dictionary in FIG. 10 because of the relationship with the features of the fourth embodiment. The hierarchy with the user dictionary is clearly shown.

【0131】第4の実施形態の特徴を構成する辞書分割
・生成手段37は、専門用語辞書に関連付けられている
複数のユーザ辞書の単語情報に基づいて、その専門用語
辞書に下位の専門用語辞書を生成させたり、下位の専門
用語辞書に単語情報を降格させたりするものである。
The dictionary dividing / generating means 37 constituting the feature of the fourth embodiment is based on the word information of a plurality of user dictionaries associated with the technical term dictionary, and adds the technical term dictionary at a lower level to the technical term dictionary. , Or demote word information to a lower level technical term dictionary.

【0132】例えば、図10の辞書データベース34の
表記において、スポーツ辞書Dsの下位にゴルフ辞書D
s1や野球辞書Ds2などを生成させるものである。
For example, in the notation of the dictionary database 34 of FIG. 10, the golf dictionary D
s1 and a baseball dictionary Ds2 are generated.

【0133】ここで、辞書分割・生成手段37の処理
も、1月1回(例えば月初め)ずつなどの定期的に起動
されるものであっても良く、また、検索・翻訳サーバ2
3の運営者が図示しない入出力装置(図2の入出力装置
18参照)を用いて起動するものでも良い。
Here, the processing of the dictionary division / generation means 37 may be started periodically, such as once a month (for example, at the beginning of the month).
3 may be started by using an input / output device (not shown) (see the input / output device 18 in FIG. 2).

【0134】(D−2)第4の実施形態の動作 次に、第4の実施形態の特徴を構成している辞書分割・
生成手段37の動作を、図11のフローチャートを用い
て説明する。なお、図11の処理は、ある1個の専門用
語辞書を対象とした処理を示しており、全ての専門用語
辞書に対して、それぞれ図11の処理が実行される。
(D-2) Operation of the Fourth Embodiment Next, the dictionary division / composition which is a feature of the fourth embodiment will be described.
The operation of the generation unit 37 will be described with reference to the flowchart of FIG. Note that the process of FIG. 11 shows a process for one technical term dictionary, and the process of FIG. 11 is executed for all the technical term dictionaries.

【0135】辞書分割・生成手段37は、図11に示す
処理を開始すると、関連するユーザ辞書の情報を、辞書
データベース34から、同一の単語情報を集計しながら
取り出してバッファリングする(ステップS51)。
When the process shown in FIG. 11 is started, the dictionary dividing / generating means 37 extracts and buffers related user dictionary information from the dictionary database 34 while counting the same word information (step S51). .

【0136】図12は、スポーツ辞書に関連するユーザ
辞書から集計しながら取り出した例を示している。左か
ら、辞書データID、見出し語(キー)、訳語、ユーザ
辞書に登録されている数を示している。
FIG. 12 shows an example in which data is taken out from the user dictionary related to the sports dictionary while counting. From the left, the dictionary data ID, the headword (key), the translation, and the number registered in the user dictionary are shown.

【0137】集計しながらの取り出しが終了すると、辞
書分割・生成手段37は、辞書データIDを0(初期
値)にセットする(ステップS52)。
When the retrieval while counting is completed, the dictionary dividing / generating means 37 sets the dictionary data ID to 0 (initial value) (step S52).

【0138】そして、全ての辞書データについて、ステ
ップS53〜S58での処理ループを繰り返す。
The processing loop of steps S53 to S58 is repeated for all dictionary data.

【0139】辞書分割・生成手段37は、専門用語辞書
に関連付けられているユーザ辞書の登録単語情報中にお
いて、同じ見出し語(キー)で訳語(値)が異なる単語
情報があるか否かを確認し、ある場合には、それぞれの
単語情報を登録しているユーザ辞書数が、専門用語辞書
に関連付けられている全ユーザ辞書数の2割(なお、割
合はこれに限定されない)以上であるか否かを判別する
(ステップS53、S54)。
The dictionary dividing / generating means 37 checks whether or not there is word information having the same headword (key) but different translation (value) in the registered word information of the user dictionary associated with the technical term dictionary. In some cases, whether the number of user dictionaries in which each word information is registered is equal to or more than 20% of the total number of user dictionaries associated with the technical term dictionary (the ratio is not limited to this). It is determined whether or not it is (steps S53, S54).

【0140】同じ見出し語(キー)で訳語(値)が異な
るユーザ登録の単語情報が存在し、それぞれの単語情報
の登録割合が2割以上であると、辞書分割・生成手段3
7は、専門用語辞書に対し、下位の専門用語辞書が存在
するかを判別する(ステップS55)。
If there is user-registered word information with the same headword (key) but a different translated word (value), and the registration ratio of each word information is 20% or more, the dictionary division / generation means 3
7 determines whether there is a lower-level technical term dictionary with respect to the technical term dictionary (step S55).

【0141】下位の専門用語辞書が存在しない場合に
は、辞書分割・生成手段37は、同じ見出し語(キー)
で訳語(値)が異なる、登録割合が2割以上の単語情報
の種類数だけ下位の専門用語辞書を作成して、それぞれ
の単語情報を登録する(ステップS56)。ここで、そ
のような単語情報を含むユーザ辞書は、辞書データID
が規定する専門用語辞書にそのまま関連付けても良く、
自己の登録単語情報が登録された、新たに作成された専
門用語辞書に関連付けるようにしても良い。
If there is no lower-level terminology dictionary, the dictionary dividing / generating means 37 outputs the same headword (key).
Then, a terminology dictionary lower in the number of types of word information having different translation words (values) and a registration ratio of 20% or more is created, and each word information is registered (step S56). Here, the user dictionary including such word information is a dictionary data ID.
May be directly associated with the terminology dictionary specified by
You may make it associate with the newly created technical term dictionary in which the registered word information of the self is registered.

【0142】なお、ここでの下位の専門用語辞書の作成
は、完全なる作成ではなく、仮作成であっても良い。
The creation of the lower-level technical term dictionary here may be a temporary creation instead of a complete creation.

【0143】これに対して、下位の専門用語辞書が存在
する場合には、辞書分割・生成手段37は、同じ見出し
語(キー)で訳語(値)が異なる、登録割合が2割以上
の単語情報を、下位の専門用語辞書に移動させる(ステ
ップS57)。ここで、そのような単語情報を含むユー
ザ辞書は、辞書データIDが規定する専門用語辞書にそ
のまま関連付けても良く、移動させた下位の専門用語辞
書に関連付けるようにしても良い。
On the other hand, if there is a lower level technical term dictionary, the dictionary dividing / generating means 37 uses the same headword (key) but a different translation word (value) and a word whose registration ratio is 20% or more. The information is moved to a lower level technical term dictionary (step S57). Here, the user dictionary including such word information may be directly associated with the technical term dictionary specified by the dictionary data ID, or may be associated with the moved lower-level technical term dictionary.

【0144】単語情報を移動させる下位の専門用語辞書
の種類の決定は、例えば、訳語側を見出し語としている
逆方向用の辞書データベースの内容を参照して分野やジ
ャンルを認識して行う。また例えば、今回の単語情報の
訳語での文字列の一部や全てを訳語の文字列に含む単語
情報が存在する側の下位の専門用語辞書に移動させる。
The determination of the type of the lower-level terminology dictionary for moving the word information is performed, for example, by recognizing the field or genre with reference to the contents of the backward dictionary database having the translated word as a headword. In addition, for example, a part or all of the character string in the translated word of the current word information is moved to a lower-level terminology dictionary on the side where the word information including the translated word character string exists.

【0145】なお、ここでの下位の専門用語辞書への単
語情報の移動は、完全なる移動ではなく、仮移動であっ
ても良い。
Here, the movement of the word information to the lower level technical term dictionary may be not a complete movement but a temporary movement.

【0146】辞書分割・生成手段37は、上述のような
下位の専門用語辞書の新規作成や下位の専門用語辞書へ
の所定単語情報の移動が終了すると、又は、同じ見出し
語(キー)で訳語(値)が異なるユーザ登録の単語情報
が存在しないと、若しくは、存在しても、いずれかの単
語情報の登録割合が2割未満であると、辞書データID
を1インクリメントした後(ステップS58)、辞書デ
ータが残っているか否かを判別する(ステップS5
9)。
The dictionary dividing / generating means 37 completes the creation of the lower-level technical term dictionary and the transfer of the predetermined word information to the lower-level technical term dictionary as described above, or the translation of the terminology with the same headword (key). If there is no word information of user registration with different (value), or if there is, if the registration ratio of any word information is less than 20%, the dictionary data ID
Is incremented by 1 (step S58), and it is determined whether or not dictionary data remains (step S5).
9).

【0147】辞書データが残っていれば、上述したステ
ップS53に戻り、全ての辞書データについて辞書分割
・生成処理が終了したならば、図11に示す一連の処理
を終了する。
If dictionary data remains, the process returns to step S53, and if dictionary division / generation processing has been completed for all dictionary data, a series of processing shown in FIG. 11 ends.

【0148】なお、辞書分割・生成処理では、完全な自
動化処理は難しく、図11の処理の終了時に、サーバ運
営者側のオペレータ(以下、システムオペレータと呼
ぶ)によって後処理を行うことを要する。例えば、新規
に作成された専門用語辞書に対する分野やジャンルのネ
ーミング付与や、ステップ56による作成が仮作成であ
れば本作成が必要か否かの判断や、ステップ57による
移動が仮移動であれば本移動が必要か否かの判断や、新
規に下位の専門用語辞書を作成した場合における他の単
語情報の上位の専門用語辞書からの移動処理などを行う
ことを要する。
In the dictionary dividing / generating process, it is difficult to completely automate the process, and it is necessary to perform post-processing by an operator on the server operator side (hereinafter, referred to as a system operator) at the end of the process in FIG. For example, naming of a field or genre to a newly created technical term dictionary, determination of whether or not this creation is necessary if the creation in step 56 is provisional creation, and determination of whether or not the creation in step 57 is temporary movement It is necessary to determine whether or not this movement is necessary, and to perform a process of moving other word information from a higher-level technical term dictionary when a lower-level technical term dictionary is newly created.

【0149】例えば、図12の例において、スポーツ辞
書に関連付けられているユーザ辞書数が10個だとする
と、見出し語が「Pitcher」で訳語が「投手」及
び「7番アイアン」という2種類の単語情報は、どちら
もユーザ登録数が3であるので、下位の専門用語辞書の
新規作成要件、又は、下位の専門用語要件の単語情報の
移動要件を満足している。
For example, in the example of FIG. 12, if the number of user dictionaries associated with the sports dictionary is ten, two types of word information, the headword being “Pitcher” and the translated words being “pitcher” and “seventh iron”. Since both have three user registrations, they satisfy the requirement of newly creating a lower-level technical term dictionary or the requirement of moving word information of the lower-level technical term requirement.

【0150】この場合において、スポーツ辞書に下位の
専門用語辞書が存在しない場合であれば、2個の下位の
専門用語辞書が作成され、一方に単語情報「Pitch
er;7番アイアン」が登録され、他方に単語情報「P
itcher;投手」が登録される。なお、システムオ
ペレータによる後処理で、前者にゴルフ辞書、後者に野
球辞書というネーミングが付与されるであろう。
In this case, if there is no lower-level technical term dictionary in the sports dictionary, two lower-level technical term dictionaries are created, and one of the word information “Pitch”
er; 7 iron "is registered, and the other word information" P
"itcher;pitcher" is registered. In the post-processing by the system operator, the former will be given the name of a golf dictionary and the latter will be named a baseball dictionary.

【0151】これに対して、スポーツ辞書の下位にゴル
フ辞書及び野球辞書が存在する場合には、単語情報「P
itcher;7番アイアン」がゴルフ辞書に登録さ
れ、単語情報「Pitcher;投手」が野球辞書に登
録される。これは、例えば、ゴルフ辞書に、訳語が「ア
イアン」という他の単語情報が存在しているとすると、
今回の訳語「7番アイアン」との共通文字列が存在する
ためである。また、例えば、野球辞書に、訳語が「右翼
手」という他の単語情報が存在しているとすると、今回
の訳語「投手」との共通文字列が存在するためである。
On the other hand, if the golf dictionary and the baseball dictionary exist below the sports dictionary, the word information “P
"itcher; 7 iron" is registered in the golf dictionary, and the word information "Pitcher;pitcher" is registered in the baseball dictionary. This means that, for example, if there is another word information whose translated word is “iron” in the golf dictionary,
This is because there is a common character string with the translated word "7 iron". Further, for example, if there is another word information whose translated word is "right hand" in the baseball dictionary, there is a common character string with the translated word "pitcher" this time.

【0152】図13は、このようなスポーツ辞書だけが
用意されていた状態から、図11の処理を通じて、スポ
ーツ辞書の下位にゴルフ辞書及び野球辞書が新規作成さ
れた場合のコミュニティ辞書の変化の状態を示したもの
である。
FIG. 13 shows the state of the change of the community dictionary when a golf dictionary and a baseball dictionary are newly created under the sports dictionary through the processing of FIG. 11 from a state where only such a sports dictionary is prepared. It is shown.

【0153】なお、上記説明においては、ユーザ辞書の
登録情報からのみ、下位の専門用語辞書の作成有無など
を判断するものを示したが、ユーザ辞書の登録情報及び
専門用語辞書の登録情報から、下位の専門用語辞書の作
成有無などを判断するようにしても良い。例えば、専門
用語辞書の登録情報と同じ見出し語で訳語が異なるユー
ザ登録の単語情報が、所定数以上又は所定割合以上のユ
ーザ辞書で登録されている場合には、下位の専門用語辞
書の作成などを行うようにしても良い。
In the above description, the determination of the presence / absence of a lower level technical term dictionary is made only from the registered information of the user dictionary. However, based on the registered information of the user dictionary and the registered information of the technical term dictionary, It may be determined whether or not a lower-level technical term dictionary is created. For example, when word information of user registration that is the same as the registered information of the technical term dictionary but has a different translation is registered in a user dictionary of a predetermined number or more or a predetermined ratio or more, creation of a lower level technical term dictionary, etc. May be performed.

【0154】また、上記説明では、下位の専門用語辞書
が存在しない場合にのみ、下位の専門用語辞書を作成す
るものを示したが、下位の専門用語辞書が存在していて
も、それと同列(同階層)の下位の専門用語辞書を作成
するようにしても良い。すなわち、下位の専門用語辞書
の存在有無に拘わらず、条件を満たせば、他の下位の専
門用語辞書を作成するようにしても良い(言い換える
と、下位への移動処理を無くしても良い)。例えば、ス
ポーツ辞書の下位に柔道辞書や陸上辞書があっても、上
述したようにスポーツ辞書に関連して「Pitche
r;7番アイアン」や「Pitcher;投手」がユー
ザ登録されることもあり、この場合には、ゴルフ辞書や
野球辞書(ネーミングは後でなされる)を下位の専門用
語辞書として作成する。
In the above description, a case where a lower-level technical term dictionary is created only when a lower-level technical term dictionary does not exist has been described. A technical term dictionary at a lower level of the same hierarchy may be created. That is, irrespective of the presence or absence of the lower-level technical term dictionary, if the condition is satisfied, another lower-level technical term dictionary may be created (in other words, the process of moving to a lower-level technical term dictionary may be eliminated). For example, even if there are a judo dictionary and a land dictionary below the sports dictionary, as described above, the “Pitche
r; 7-iron "and"Pitcher; pitcher "may be registered as a user. In this case, a golf dictionary or a baseball dictionary (naming will be performed later) is created as a lower-level terminology dictionary.

【0155】(D)第4の実施形態の効果 以上のように、第4の実施形態によれば、ユーザ辞書の
登録状況に応じて、新たな専門用語辞書を作成するよう
にしたので、多種多様な分野やジャンルに応じた多様な
専門用語辞書を設けることができ、翻訳対象のWebペ
ージの分野やジャンルに対する適切な専門用語辞書を機
械翻訳に使用することができ、翻訳対象のWebページ
の分野やジャンルを問わず、訳質を向上させることがで
きる。
(D) Effects of Fourth Embodiment As described above, according to the fourth embodiment, a new technical term dictionary is created according to the registration status of the user dictionary. Various technical term dictionaries corresponding to various fields and genres can be provided, and appropriate technical term dictionaries for the fields and genres of the translation target Web page can be used for machine translation. Regardless of field or genre, translation quality can be improved.

【0156】(E)他の実施形態 上記各実施形態の説明においても、種々変形した実施形
態について言及したが、さらに、以下に例示するような
変形実施形態を挙げることができる。
(E) Other Embodiments In the description of each of the above-described embodiments, various modified embodiments have been referred to, but further modified embodiments as exemplified below can be cited.

【0157】上記各実施形態で示した、過半数、2割な
どの閾値は自由に変更することができるだけでなく、割
合閾値だけでなく、5個以上などの絶対数を閾値として
も良い。
The thresholds such as the majority and 20% shown in the above embodiments can be freely changed, and not only the ratio threshold but also an absolute number such as 5 or more may be used as the threshold.

【0158】また、上記第2及び第3の実施形態におい
ては、ある辞書の単語情報を自動的に他の辞書(専門用
語辞書)に登録するものを示したが、ユーザやシステム
オペレータの判断を処理の一部で利用するようにしても
良い。例えば、第2の実施形態に関し、ユーザ登録数が
多くて専門用語辞書に登録しようとする単語情報を検出
したとき、専門用語辞書への登録可否をユーザやシステ
ムオペレータに判断させるようにしても良い。ユーザに
判断させる場合において、その専門用語辞書に関連して
ユーザ辞書を設けているユーザの多数決で決定しても良
い。多数決の情報収集方法としては、例えば、ユーザへ
のeメール発送及びその回収や、掲示板を利用した告知
に対するユーザの自主投票などを挙げることができる。
In the second and third embodiments, the word information of a dictionary is automatically registered in another dictionary (technical term dictionary). It may be used in part of the processing. For example, in the second embodiment, when the number of registered users is large and word information to be registered in the technical term dictionary is detected, the user or the system operator may be allowed to determine whether or not to register in the technical term dictionary. . In the case where the user makes a judgment, the decision may be made by a majority decision of the users who provide the user dictionary in association with the technical term dictionary. Examples of the majority information collection method include sending and collecting e-mails to the user, voluntary voting of the user for notification using a bulletin board, and the like.

【0159】なお、第4の実施形態においても、ユーザ
の判断を一部に利用することもできる。
In the fourth embodiment, the user's judgment can be partially used.

【0160】また、専門用語辞書に対する直接の操作を
ユーザに認めるようにしても良い。なお、勿論、システ
ムオペレータは、専門用語辞書に対する直接の操作を行
うことができる。
Further, the user may be allowed to directly operate the technical term dictionary. Note that, of course, the system operator can directly operate the technical term dictionary.

【0161】さらに、上記各実施形態の特徴構成を、適
宜組み合わせても良いことは勿論である。
Further, it goes without saying that the features of the above embodiments may be appropriately combined.

【0162】上記各実施形態においては、本発明の辞書
装置をインターネット上のサーバに設けられている機械
翻訳機能で利用する場合を示したが、本発明の辞書装置
の適用対象は、これに限定されるものではない。
In each of the above embodiments, the case where the dictionary device of the present invention is used for the machine translation function provided in the server on the Internet has been described, but the application target of the dictionary device of the present invention is not limited to this. It is not done.

【0163】例えば、1台の機械翻訳装置を複数の人が
利用する場合の辞書装置にも本発明を適用できる。ま
た、機械翻訳用の辞書以外の辞書についても、本発明の
辞書装置を適用できる。例えば、音声認識等で利用され
るかな漢字変換用の辞書にも本発明の辞書装置を適用で
きる。
For example, the present invention can be applied to a dictionary device when one machine translation device is used by a plurality of persons. Also, the dictionary device of the present invention can be applied to dictionaries other than the dictionary for machine translation. For example, the dictionary device of the present invention can be applied to a kana-kanji conversion dictionary used for voice recognition or the like.

【0164】[0164]

【発明の効果】以上のように、本発明の辞書装置によれ
ば、辞書やその構造等を容易に充実させることができ、
本発明の辞書装置を利用して得た自然言語処理結果の質
を高めることができる。
As described above, according to the dictionary device of the present invention, the dictionary and its structure can be easily enhanced.
The quality of the natural language processing result obtained by using the dictionary device of the present invention can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】第1の実施形態の辞書装置に係る各種辞書の階
層化の説明図である。
FIG. 1 is an explanatory diagram of hierarchies of various dictionaries according to the dictionary device of the first embodiment.

【図2】各実施形態の辞書装置が適用される機械翻訳ネ
ットワークシステムの概略構成を示すブロック図であ
る。
FIG. 2 is a block diagram showing a schematic configuration of a machine translation network system to which the dictionary device of each embodiment is applied.

【図3】第1の実施形態の専門用語辞書に関連したユー
ザ辞書への登録動作を示すフローチャートである。
FIG. 3 is a flowchart showing an operation of registering in a user dictionary related to the technical term dictionary of the first embodiment.

【図4】第1の実施形態のコミュニティ辞書を利用した
機械翻訳動作を示すフローチャートである。
FIG. 4 is a flowchart illustrating a machine translation operation using a community dictionary according to the first embodiment.

【図5】第2の実施形態での機能的構成を示すブロック
図である。
FIG. 5 is a block diagram illustrating a functional configuration according to a second embodiment.

【図6】第2の実施形態での専門用語辞書の充実化動作
を示すフローチャートである。
FIG. 6 is a flowchart illustrating an operation of enriching a technical term dictionary according to the second embodiment.

【図7】第2の実施形態で専門用語辞書へ登録されるユ
ーザ登録の単語情報の説明図である。
FIG. 7 is an explanatory diagram of user-registered word information registered in a technical term dictionary in the second embodiment.

【図8】第3の実施形態での機能的構成を示すブロック
図である。
FIG. 8 is a block diagram illustrating a functional configuration according to a third embodiment.

【図9】第3の実施形態での上位の専門用語辞書への統
合動作を示すフローチャートである。
FIG. 9 is a flowchart illustrating an operation of integrating a higher-level terminology dictionary according to the third embodiment.

【図10】第4の実施形態での機能的構成を示すブロッ
ク図である。
FIG. 10 is a block diagram illustrating a functional configuration according to a fourth embodiment.

【図11】第4の実施形態での下位の専門用語辞書の分
割・生成動作を示すフローチャートである。
FIG. 11 is a flowchart showing a division / generation operation of a lower-level terminology dictionary in the fourth embodiment.

【図12】第4の実施形態で下位の専門用語辞書が生成
されるユーザ登録の単語情報の説明図である。
FIG. 12 is an explanatory diagram of word information of a user registration in which a lower-level technical term dictionary is generated in the fourth embodiment.

【図13】第4の実施形態での下位の専門用語辞書が生
成される前後の辞書構造を示す説明図である。
FIG. 13 is an explanatory diagram showing a dictionary structure before and after a lower-level terminology dictionary is generated in the fourth embodiment.

【符号の説明】[Explanation of symbols]

21、21A、21B…機械翻訳ネットワークシステ
ム、22…インターネット、23、23A、23B…検
索・翻訳サーバ、24…閲覧・入力手段、31…通信制
御手段、32…機械翻訳手段、33…辞書管理手段、3
4…辞書データベース、35…専門用語辞書充実化手
段、36…辞書情報統合手段、37…辞書分割・生成手
段。
21, 21A, 21B: Machine translation network system, 22: Internet, 23, 23A, 23B: Search / translation server, 24: Browsing / input means, 31: Communication control means, 32: Machine translation means, 33: Dictionary management means , 3
4 ... Dictionary database, 35 ... Technical term dictionary enrichment means, 36 ... Dictionary information integration means, 37 ... Dictionary division / generation means.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 川北 泰広 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内 (72)発明者 中川 聰 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内 (72)発明者 松永 聡彦 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内 Fターム(参考) 5B091 CC02 CC14 CC15 CC17 CD03 EA17  ────────────────────────────────────────────────── ─── Continued on the front page (72) Inventor Yasuhiro Kawakita 1-7-12 Toranomon, Minato-ku, Tokyo Oki Electric Industry Co., Ltd. (72) Inventor Satoshi Nakagawa 1-7-12 Toranomon, Minato-ku, Tokyo Offshore Inside Electric Industry Co., Ltd. (72) Inventor Toshihiko Matsunaga 1-7-12 Toranomon, Minato-ku, Tokyo Oki Electric Industry Co., Ltd. F-term (reference) 5B091 CC02 CC14 CC15 CC17 CD03 EA17

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 複数のユーザが利用する自然言語処理装
置に設けられる辞書装置において、 専門分野やジャンルを分類したカテゴリー毎の複数の専
門用語辞書を、一般用語辞書をルートノードとしたツリ
ー構造で階層化している辞書本体と、 任意の上記専門用語辞書に関連付けて、ユーザ辞書を設
定させるユーザ辞書登録手段とを有することを特徴とす
る辞書装置。
1. A dictionary device provided in a natural language processing device used by a plurality of users, wherein a plurality of technical term dictionaries for each category in which specialized fields and genres are classified are formed in a tree structure using a general term dictionary as a root node. A dictionary device comprising: a hierarchical dictionary main body; and a user dictionary registration unit for setting a user dictionary in association with an arbitrary technical term dictionary.
【請求項2】 自然言語処理対象のカテゴリーが指示さ
れた際に、そのカテゴリーの専門用語辞書から一般用語
辞書に至るツリー構造の経路上にある全ての専門用語辞
書と、それら専門用語辞書に関連付けられている、処理
依頼ユーザに係るユーザ辞書の全てを適用する辞書に決
定する適用辞書決定手段をさらに有することを特徴とす
る請求項1に記載の辞書装置。
2. When a category to be subjected to natural language processing is designated, all the technical term dictionaries on a tree-structured path from a technical term dictionary of the category to a general term dictionary are associated with the technical term dictionaries. 2. The dictionary apparatus according to claim 1, further comprising an applied dictionary determining unit that determines a dictionary to which all of the user dictionaries of the process requesting user are applied.
【請求項3】 複数のユーザが利用する自然言語処理装
置に設けられる辞書装置において、 ユーザが編集可能なユーザ毎のユーザ辞書と、 全ユーザに共通な共通辞書と、 同一の辞書情報が所定条件を満たす数の上記ユーザ辞書
に格納されているときに、その辞書情報を上記共通辞書
に登録する共通辞書充実化手段とを有することを特徴と
する辞書装置。
3. A dictionary device provided in a natural language processing device used by a plurality of users, wherein a user dictionary for each user editable by the user, a common dictionary common to all users, and the same dictionary information are provided under a predetermined condition. And a common dictionary enrichment means for registering the dictionary information in the common dictionary when the number of the user dictionaries satisfying the condition is satisfied.
【請求項4】 階層構造で上位の上位辞書と、 上記上位辞書の下位に位置している複数の下位辞書と、 同一の辞書情報が所定条件を満たす数の上記下位辞書に
格納されているときに、その辞書情報を上記上位辞書に
登録する辞書情報統合手段とを有することを特徴とする
辞書装置。
4. An upper-level dictionary in a hierarchical structure, a plurality of lower-level dictionaries located below the upper-level dictionary, and when the same dictionary information is stored in a number of the lower-level dictionaries satisfying a predetermined condition. And a dictionary information integrating means for registering the dictionary information in the upper dictionary.
【請求項5】 複数のユーザが利用する自然言語処理装
置に設けられる辞書装置において、 ユーザが編集可能なユーザ毎のユーザ辞書と、 全ユーザに共通な共通辞書と、 少なくとも上記各ユーザ辞書の格納内容に基づき、上記
共通辞書の下位に下位辞書を設定する辞書分割・生成手
段とを有することを特徴とする辞書装置。
5. A dictionary device provided in a natural language processing device used by a plurality of users, a user dictionary for each user editable by the user, a common dictionary common to all users, and at least storage of each of the user dictionaries. A dictionary device comprising: a dictionary division / generation unit configured to set a lower dictionary below the common dictionary based on contents.
【請求項6】 上記辞書分割・生成手段は、同一の辞書
情報が所定条件を満たす数の上記ユーザ辞書に格納され
ており、上記辞書情報とキーが同じで値が異なる他の辞
書情報が、所定条件を満たす数の上記ユーザ辞書に格納
されているときに、上記共通辞書の下位にそれら辞書情
報をそれぞれ格納した下位辞書を設定することを特徴と
する請求項5に記載の辞書装置。
6. The dictionary dividing / generating means, wherein the same dictionary information is stored in a number of the user dictionaries satisfying a predetermined condition, and the other dictionary information having the same key and a different value as the dictionary information is: 6. The dictionary device according to claim 5, wherein when the number of user dictionaries satisfying a predetermined condition is stored, lower dictionaries each storing the dictionary information are set below the common dictionary.
JP2000283038A 2000-09-13 2000-09-19 Dictionary device Expired - Fee Related JP3838857B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000283038A JP3838857B2 (en) 2000-09-19 2000-09-19 Dictionary device
US09/948,935 US20040205671A1 (en) 2000-09-13 2001-09-10 Natural-language processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000283038A JP3838857B2 (en) 2000-09-19 2000-09-19 Dictionary device

Publications (2)

Publication Number Publication Date
JP2002091965A true JP2002091965A (en) 2002-03-29
JP3838857B2 JP3838857B2 (en) 2006-10-25

Family

ID=18767456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000283038A Expired - Fee Related JP3838857B2 (en) 2000-09-13 2000-09-19 Dictionary device

Country Status (1)

Country Link
JP (1) JP3838857B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165415A (en) * 2006-12-27 2008-07-17 Oki Electric Ind Co Ltd Document processor, document processing method, and program
JP2010033139A (en) * 2008-07-25 2010-02-12 Nec Corp Information processor, electronic dictionary providing method, and program
US8676564B2 (en) 2011-03-08 2014-03-18 International Business Machines Corporation Method, program and system for finding correspondence between terms
JP2014142951A (en) * 2007-11-26 2014-08-07 Daniel Child Warren Modular system and method for managing chinese, japanese and korean linguistic data in electronic form
US9075793B2 (en) 2005-10-26 2015-07-07 Nhn Corporation System and method of providing autocomplete recommended word which interoperate with plurality of languages

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9075793B2 (en) 2005-10-26 2015-07-07 Nhn Corporation System and method of providing autocomplete recommended word which interoperate with plurality of languages
JP2008165415A (en) * 2006-12-27 2008-07-17 Oki Electric Ind Co Ltd Document processor, document processing method, and program
JP2014142951A (en) * 2007-11-26 2014-08-07 Daniel Child Warren Modular system and method for managing chinese, japanese and korean linguistic data in electronic form
JP2010033139A (en) * 2008-07-25 2010-02-12 Nec Corp Information processor, electronic dictionary providing method, and program
US8676564B2 (en) 2011-03-08 2014-03-18 International Business Machines Corporation Method, program and system for finding correspondence between terms
US8682641B2 (en) 2011-03-08 2014-03-25 International Business Machines Corporation Method, program and system for finding correspondence between terms

Also Published As

Publication number Publication date
JP3838857B2 (en) 2006-10-25

Similar Documents

Publication Publication Date Title
RU2501078C2 (en) Ranking search results using edit distance and document information
US8694680B2 (en) Methods and apparatus for enabling use of web content on various types of devices
US7415469B2 (en) Method and apparatus for searching network resources
US9940398B1 (en) Customization of search results for search queries received from third party sites
CN102043833B (en) Search method and device based on query word
CN102368262B (en) Method and equipment for providing searching suggestions corresponding to query sequence
US5857187A (en) Information management apparatus providing efficient management of multimedia titles in a client-server network
US20070050335A1 (en) Information searching apparatus and method with mechanism of refining search results
JP4445509B2 (en) Structured document retrieval system and program
CN102341800B (en) Search processing method and apparatus
US8972458B2 (en) Systems and methods for comments aggregation and carryover in word pages
JP5147947B2 (en) Method and system for generating search collection by query
CN101599089B (en) Method and system for automatically searching and extracting update information on content of video service website
US20040103371A1 (en) Small form factor web browsing
KR20060017765A (en) Concept network
JP2009059353A (en) Device and method for retrieving information selectively and enabling display of information after that
WO2004023341A1 (en) Search system, search server, client, search method, program, and recording medium
JP2002091965A (en) Dictionary device
KR20050074058A (en) System for automatically sending to other web site news automatically classified on internet, and control method thereof
KR101494862B1 (en) Method for Providing Expert's Recommendation Search Result
AbuJarour et al. Dynamic tags for dynamic data web services
KR20140047219A (en) Contents providing method and contents server thereof
JP2003157257A (en) Dictionary device and natural language processing system
KR101485592B1 (en) Method for Making Searching Result
JP2000322167A (en) Data management system and method for displaying data attribute

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060801

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090811

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100811

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees