JP2007026155A - Distributed development system of word information - Google Patents

Distributed development system of word information Download PDF

Info

Publication number
JP2007026155A
JP2007026155A JP2005208238A JP2005208238A JP2007026155A JP 2007026155 A JP2007026155 A JP 2007026155A JP 2005208238 A JP2005208238 A JP 2005208238A JP 2005208238 A JP2005208238 A JP 2005208238A JP 2007026155 A JP2007026155 A JP 2007026155A
Authority
JP
Japan
Prior art keywords
word
information
creator
dictionary
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005208238A
Other languages
Japanese (ja)
Inventor
Yuichi Kojima
裕一 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2005208238A priority Critical patent/JP2007026155A/en
Publication of JP2007026155A publication Critical patent/JP2007026155A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a distributed development system of word information capable of providing a flexible dictionary development environment. <P>SOLUTION: A unique word ID is generated for each word, and with it as a key, information individually required for each application accompanying the word such as a reading, a translation and word constitution is managed. Thus, the word can be registered even without filling the entire information of the word. Also, since the word information can be shared through a network, the base of a distributed user dictionary development environment which can be utilized in common by the plurality of applications is provided. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、入力文書を言語解析し、解析結果を所定の目的のために加工して出力する言語解析システムと、ネットワークを介して前記言語解析システムと接続し、当該言語解析システムに対して単語情報を提供する単語情報サーバからなる単語情報の分散開発システムに関する。   The present invention relates to a language analysis system that performs language analysis on an input document, processes and outputs an analysis result for a predetermined purpose, and connects to the language analysis system via a network. The present invention relates to a word information distributed development system including word information servers that provide information.

コンピュータシステムにおいて、ユーザが入力した入力文書などを処理する言語解析処理を自分なりにアレンジして用いるしくみとしてユーザ辞書がある。   In a computer system, there is a user dictionary as a mechanism for arranging and using language analysis processing for processing input documents input by a user.

このユーザ辞書では、通常、ユーザが個人の好みや利用形態に応じて語彙を追加する。   In this user dictionary, the user usually adds vocabulary according to personal preferences and usage patterns.

しかしながら、ひとりでの辞書開発には限界があり、たとえばユーザAが追加した語彙をユーザBもユーザCも使いたいという要望は存在する。   However, there is a limit to the development of a dictionary alone, and for example, there is a desire for both user B and user C to use the vocabulary added by user A.

これらに対応するため、辞書のフォーマットが広く公開され、そのフォーマットに沿ったテキスト形式のデータなどがネットワーク上では公開されている。例えば、いわゆるpdic形式などである。   In order to deal with these problems, the dictionary format is widely disclosed, and text data and the like in accordance with the format are disclosed on the network. For example, the so-called pdic format.

また、特許文献1では、辞書の開発を会員制で実施し、それぞれの会員の活躍の度合いなどに応じた特典を与えることによって開発のモチベーションアップを図っている。
特開2003−173409
Further, in Patent Document 1, the development of a dictionary is carried out by a membership system, and the development is motivated by giving privileges according to the degree of activity of each member.
JP 2003-173409 A

しかしながら、これら従来技術では、特定のアプリケーションに向けた辞書情報の共有を考慮しているのみであり、たとえばアプリケーションXに向けた辞書の語彙追加が、わずかな情報の追加でアプリケーションYでも利用できるようなケースに対応することは困難である。また、この結果、ひとつの辞書開発環境に広範囲の自主的な辞書開発者をひきつけることが困難であった。   However, these conventional techniques only consider sharing dictionary information for a specific application. For example, dictionary vocabulary addition for application X can be used by application Y with a slight addition of information. It is difficult to deal with a special case. As a result, it was difficult to attract a wide range of independent dictionary developers to one dictionary development environment.

本発明は、かかる実情に鑑みてなされたものであり、柔軟な辞書開発環境を提供できる単語情報の分散開発システムを提供すること目的とする。   The present invention has been made in view of such circumstances, and an object thereof is to provide a distributed development system for word information that can provide a flexible dictionary development environment.

本発明は、入力文書を言語解析し、解析結果を所定の目的のために加工して出力する言語解析システムと、ネットワークを介して前記言語解析システムと接続し、当該言語解析システムに対して単語情報を提供する単語情報サーバからなる単語情報の分散開発システムにおいて、前記言語解析システムは、文書情報を入力し、形態素解析を行なう形態素解析処理手段と、前記形態素解析処理手段に利用され、単語ごとに、少なくとも単語ID、表記、品詞情報、および、複数の単語付随情報を保持する単語辞書手段と、前記形態素解析処理手段から受け取った単語ID列を用いて単語ごとに取得した表記、品詞情報、および、単語付随情報を用いて、出力情報を生成する出力情報生成手段と、単語辞書に対する単語の登録、削除、および、更新を行なう辞書編集手段と、前記辞書編集手段から呼び出され、前記単語情報サーバに対して表記や品詞情報、単語ID、および、単語付随情報を組み合わせた検索要求を送り、条件に一致した単語の情報を、当該単語情報サーバより取得する単語情報取得手段と、前記辞書編集手段から呼び出され、前記単語情報サーバから単語IDを取得する単語ID取得手段と、前記辞書編集部から呼び出され、前記単語情報サーバに対して、単語IDと関連づけて表記、品詞情報、および、単語付随情報を送る単語情報登録部を備え、前記単語情報サーバは、単語ごとの情報として、単語ID、表記、品詞情報、複数の単語付随情報を保持する単語データベース手段と、前記言語解析システムからの要求に応じて新規に単語IDを発効する単語ID付与手段と、前記言語解析システムからの要求に応じて、前記単語データベース手段へ、単語IDをキーとした表記、品詞情報、単語付随情報の登録、削除および更新、および、単語ID、表記、品詞情報、および、単語付随情報の組み合わせを検索条件とした検索を行なう単語データベース管理手段を備えるようにしたものである。   The present invention relates to a language analysis system that performs language analysis on an input document, processes and outputs an analysis result for a predetermined purpose, and connects to the language analysis system via a network. In a distributed development system of word information comprising word information servers that provide information, the language analysis system is used for morpheme analysis processing means for inputting document information and performing morpheme analysis, and for each morpheme analysis processing means. And word dictionary means for holding at least word ID, notation, part of speech information, and a plurality of word associated information, and notation acquired for each word using the word ID string received from the morpheme analysis processing means, part of speech information, And output information generation means for generating output information using word-accompanying information, and registration, deletion, and update of words in the word dictionary. A dictionary editing unit that performs a search, sends a search request that combines notation, part-of-speech information, word ID, and word incidental information to the word information server, and information on words that match the condition Is obtained from the word information server, the word editing unit is called from the word editing server, the word ID obtaining unit is obtained from the word information server, and is called from the dictionary editing unit. A word information registration unit that sends notation, part-of-speech information, and word-accompanying information in association with a word ID to the server, and the word information server includes word ID, notation, part-of-speech information, plural A word database means for storing the word-accompanying information and a word ID that is newly activated in response to a request from the language analysis system In response to a request from the language analysis system, the word database means, the notation using the word ID as a key, part-of-speech information, registration, deletion and update of word-associated information, and word ID, notation, part-of-speech information And a word database management means for performing a search using a combination of word accompanying information as a search condition.

また、前記言語解析システムは、前記単語付随情報として、単語IDで示される語の同義語の単語IDを有するものである。   The language analysis system has a word ID of a synonym of a word indicated by a word ID as the word-accompanying information.

また、前記言語解析システムは、前記単語付随情報として、単語IDで示される語の語構成の単語IDを有するものである。   Further, the language analysis system has a word ID of a word structure of a word indicated by a word ID as the word accompanying information.

また、前記言語解析システムは、あらかじめ定められたクリエータIDのリストを保持したクリエータIDリスト保持手段と、あらかじめ定められた時間ごとに前記単語情報取得手段を呼び出し、クリエータIDリストを用いて単語情報の取得を行い、その結果を前記辞書編集手段に送る自動交信手段をさらに備え、前記辞書編集手段は前記自動更新手段から受け取った単語情報の単語辞書への登録を行なうようにしたものである。   In addition, the language analysis system calls a creator ID list holding unit that holds a list of predetermined creator IDs, and calls the word information acquisition unit every predetermined time, and uses the creator ID list to store the word information. The system further comprises automatic communication means for obtaining the result and sending the result to the dictionary editing means, and the dictionary editing means registers the word information received from the automatic updating means in the word dictionary.

また、前記単語情報サーバは、単語ごとの情報として保持する表記、品詞情報、および、複数の単語付随情報のそれぞれに、さらにクリエータIDを設定し、前記言語解析システムからの要求に応じて新規にクリエータIDを発行するクリエータID付与手段を、さらに備えたものである。   The word information server further sets a creator ID for each of the notation, part-of-speech information, and a plurality of word-accompanying information held as information for each word, and newly responds to a request from the language analysis system. Creator ID giving means for issuing a creator ID is further provided.

したがって、本発明によれば、各単語ごとにユニークな単語IDを発生させ、これをキーとして、ふりがな、訳語、語構成など単語に付随し、アプリケーションごとに個別に必要とされる情報を管理しているので、単語の全情報を埋めずとも単語の登録を可能であり、また、ネットワークを介して単語情報を共有可能としているので、これらにより複数のアプリケーションで共通に利用できる分散ユーザ辞書開発環境の基盤が提供できるという効果を得る。   Therefore, according to the present invention, a unique word ID is generated for each word, and this is used as a key to manage information that is attached to the word, such as a phonetic, a translation, and a word structure, and is individually required for each application. Therefore, it is possible to register words without filling in all the word information, and since word information can be shared via a network, a distributed user dictionary development environment that can be used in common by multiple applications The effect that the base of can be provided is obtained.

以下、添付図面を参照しながら、本発明の実施の形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

図1は、本発明の一実施例にかかるネットワークシステムの一例を示している。このネットワークシステムは、複数のユーザ端末装置TM1〜TMnと、単語情報を管理するための単語情報サーバ装置ST、検索情報を管理するための検索サーバ装置SK、および、検索対象となる文書を蓄積管理する文書データベース装置SDが、ローカルエリアネットワークLANを介して接続されている。   FIG. 1 shows an example of a network system according to an embodiment of the present invention. This network system stores and manages a plurality of user terminal devices TM1 to TMn, a word information server device ST for managing word information, a search server device SK for managing search information, and a document to be searched. A document database device SD is connected via a local area network LAN.

また、おのおののユーザ端末装置TM1〜TMnは、検索サーバ装置SKに対して検索サービスを要求するための検索クライアント、および、検索クライアントにユーザが入力した検索対象情報(文書情報、検索条件等)を、検索サーバ装置SKが検索時に適用する情報に変換するための言語解析システムを備えており、この言語解析システムは、単語情報サーバ装置STから種々の情報を取得する。   Each of the user terminal devices TM1 to TMn receives a search client for requesting a search service from the search server device SK, and search target information (document information, search conditions, etc.) input by the user to the search client. The search server device SK includes a language analysis system for converting into information applied at the time of search, and the language analysis system acquires various information from the word information server device ST.

図2は、言語解析システムの構成の一例を示している。   FIG. 2 shows an example of the configuration of the language analysis system.

同図において、入力文書バッファ1は、ユーザが検索クライアントに入力した文字列を保存し、形態素解析処理部2へ出力するためのものである。形態素解析処理部2は、単語辞書部3を参照し、入力された文書情報を構成する単語に分割し、単語IDの列に変換するためのものである。ここで、形態素解析方法は、周知のものを適用することができる。例えば、対象文字列に含まれる自立語数が最小になる単語分割結果を採用する手法を適用することができる。この単語分割の結果得られた単語列は、それぞれ単語IDを持つため、形態素解析結果(単語列)は、単語IDの列に置き換えることができる。   In the figure, an input document buffer 1 stores a character string input by a user to a search client and outputs it to a morpheme analysis processing unit 2. The morpheme analysis processing unit 2 refers to the word dictionary unit 3 and divides the input document information into words constituting the document information and converts them into word ID strings. Here, a well-known morphological analysis method can be applied. For example, it is possible to apply a method that employs a word division result that minimizes the number of independent words included in the target character string. Since each word string obtained as a result of this word division has a word ID, the morphological analysis result (word string) can be replaced with a word ID string.

単語辞書部3は、単語ごとに少なくとも単語ID(単語ごとにユニークに付与された番号)、表記、品詞情報、および、複数の単語付随情報(ふりがなや対応する訳語など当該単語に付随した情報)を保持するものである。   The word dictionary unit 3 includes at least a word ID (a number uniquely assigned to each word), notation, part-of-speech information, and a plurality of word-accompanying information (information associated with the word such as a furigana and a corresponding translation) Is to hold.

出力情報生成部4は、形態素解析処理部2から受け取った単語ID列を用いて単語ごとに取得した表記、品詞情報、および、単語付随情報を用いて、出力情報を生成するためのものであり、その出力情報は、出力情報バッファ5を介して、検索クライアントへ出力される。   The output information generation unit 4 is for generating output information using the notation, part-of-speech information, and word associated information acquired for each word using the word ID string received from the morphological analysis processing unit 2. The output information is output to the search client via the output information buffer 5.

辞書編集部6は、単語辞書部3に対して、単語の登録、削除、更新を行なうためのものであり、単語ID取得部7は、辞書編集部6から呼び出され、ローカルエリアネットワークLANを介して、単語情報サーバ装置STから単語IDを取得するためのものである。   The dictionary editing unit 6 is for registering, deleting, and updating words in the word dictionary unit 3, and the word ID acquisition unit 7 is called from the dictionary editing unit 6 and is connected via the local area network LAN. Thus, the word ID is obtained from the word information server device ST.

単語情報登録部8は、辞書編集部3から呼び出され、ローカルエリアネットワークLANを介し、単語情報サーバ装置STに対して、単語IDと関連づけて表記、品詞情報、および、単語付随情報を送るためのものである。   The word information registration unit 8 is called from the dictionary editing unit 3 and transmits notation, part-of-speech information, and word associated information to the word information server device ST in association with the word ID via the local area network LAN. Is.

単語情報取得部9は、自動更新部10により起動され、ローカルエリアネットワークLANを介し、単語情報サーバ装置STから、指定したクリエータIDリストに含まれるクリエータIDが登録されている単語情報を取得するためのものである。また、単語情報取得部9は、新しい単語IDの発行を、ローカルエリアネットワークLANを介して単語情報サーバ装置STへ送り、単語情報サーバ装置STから得られた単語IDを取得するためのものである。   The word information acquisition unit 9 is activated by the automatic update unit 10 and acquires word information in which creator IDs included in the specified creator ID list are registered from the word information server device ST via the local area network LAN. belongs to. Further, the word information acquisition unit 9 is for issuing a new word ID to the word information server device ST via the local area network LAN and acquiring the word ID obtained from the word information server device ST. .

自動更新部10は、所定時間周期で、クリエータIDリスト保持部11に保持されるクリエータIDを持つ単語の情報を単語情報取得部9を用いて取得する。また、その単語情報のうち、語構成および同義語の情報を保持する単語の情報を単語辞書部3に格納する。   The automatic updating unit 10 acquires information on a word having a creator ID held in the creator ID list holding unit 11 by using the word information acquisition unit 9 at a predetermined time period. In addition, of the word information, word information that holds information on the word structure and synonyms is stored in the word dictionary unit 3.

クリエータIDリスト保持部11は、おのおののユーザにユニークに割り当てられているクリエータIDの一覧を保持するためのものであり、ユーザは、ユーザインタフェースを介し、クリエータIDリスト保持部11に任意のクリエータIDを保存することができる。   The creator ID list holding unit 11 is for holding a list of creator IDs uniquely assigned to each user, and the user can input any creator ID to the creator ID list holding unit 11 via the user interface. Can be saved.

通信制御部12は、単語ID取得部7、単語情報登録部8、および、単語情報取得部9が、ローカルエリアネットワークLANを介して行う単語情報サーバ装置STとの間の通信を司るためのものである。   The communication control unit 12 is for the word ID acquisition unit 7, the word information registration unit 8, and the word information acquisition unit 9 to manage communication with the word information server device ST performed via the local area network LAN. It is.

図3は、単語情報サーバ装置STの構成の一例を示している。   FIG. 3 shows an example of the configuration of the word information server device ST.

同図において、単語データベース部21は、所定形式で、単語ごとの情報として、単語ID、表記、品詞情報、および、複数の単語付随情報を保持するためのものであり、単語データベース管理部22は、言語解析システムからの要求に応じて、単語データベース部21へ、単語IDをキーとした表記、品詞情報、および、単語付随情報の登録、削除および更新、および、単語ID、表記、品詞情報、および、単語付随情報の組み合わせを検索条件とした検索を行なうためのものである。   In the figure, a word database unit 21 is for holding a word ID, notation, part-of-speech information, and a plurality of word-accompanying information as information for each word in a predetermined format. In response to a request from the language analysis system, the word database unit 21 is registered with the word ID as a key, part-of-speech information, and registration, deletion and update of word-accompanying information, and word ID, notation, part-of-speech information, In addition, the search is performed using a combination of word-accompanying information as a search condition.

単語ID付与部23は、ネットワークを通して単語IDの発行要求を受け、新しい単語IDを作成し、これを発行要求元へ応答するものである。例えば、要求を受け取ると、初期値1から順にカウントアップして単語IDを生成する。   The word ID assigning unit 23 receives a word ID issue request through the network, creates a new word ID, and responds to the issue request source. For example, when a request is received, a word ID is generated by counting up from the initial value 1 in order.

また、クリエータID付与部24は、ネットワークを通してクリエータIDの発行要求を受け、新しいクリエータIDを作成し、これを発行要求元へ応答するものである。例えば、要求を受け取ると、初期値1から順にカウントアップして、クリエータIDを形成する。   The creator ID assigning unit 24 receives a request for issuing a creator ID through the network, creates a new creator ID, and responds to the issue request source. For example, when a request is received, the creator ID is formed by counting up from the initial value 1 in order.

単語データベース管理部は、表2に示すような単語ID、クリエータID、プロパティ名、プロパティ値の4組からなるデータを管理し、通常のデータベース管理と同様にデータベースの内容の削除・更新・検索機能を提供する。この動作は一般のデータベースと同じである。   The word database management unit manages data consisting of four sets of word IDs, creator IDs, property names, and property values as shown in Table 2, and functions for deleting / updating / retrieving database contents in the same way as normal database management I will provide a. This operation is the same as a general database.

通信制御部26は、単語データベース管理部22、単語ID付与部23、および、クリエータID付与部24が、ローカルエリアネットワークLANを介して行う、他の端末との間の通信を司るためのものである。   The communication control unit 26 is for the word database management unit 22, the word ID assigning unit 23, and the creator ID assigning unit 24 to manage communication with other terminals performed via the local area network LAN. is there.

また、ユーザ情報管理部25へのユーザ情報の登録は、クリエータID付与部24が行うとともに、図示しない管理者ユーザからの指令により行うことができる。   Registration of user information in the user information management unit 25 is performed by the creator ID adding unit 24 and can be performed by a command from an administrator user (not shown).

また、図4は、単語辞書の構成の一例を示している。この単語辞書は、単語辞書部3、および、単語データベース部21に登録される。通常、単語登録部3には、当該言語解析システムが含まれるユーザ端末装置TM1〜TMnを使用するユーザが登録した単語についての情報のみが登録され、また、単語情報サーバ装置STの単語データベース部21には、全てのユーザが登録した単語情報が登録される。   FIG. 4 shows an example of the configuration of the word dictionary. This word dictionary is registered in the word dictionary unit 3 and the word database unit 21. Usually, only the information about the word registered by the user using the user terminal devices TM1 to TMn including the language analysis system is registered in the word registration unit 3, and the word database unit 21 of the word information server device ST. The word information registered by all users is registered.

この単語辞書に登録される1つの単語情報は、それぞれの単語を識別するための単語ID、当該単語を登録したユーザをあらわすクリエータID、当該単語を構成する文字列をあらわす表記、当該単語の品詞、当該単語について同義語がある場合にはその同義語の単語IDをあらわす同義語単語ID、および、当該単語が複数の他の単語の表記を並べたものである場合にはその語を構成する他の単語の単語IDを、表記の順序に並べてなる語構成単語IDからなる。   One word information registered in the word dictionary includes a word ID for identifying each word, a creator ID representing a user who has registered the word, a notation representing a character string constituting the word, and a part of speech of the word. If there is a synonym for the word, the synonym word ID that represents the word ID of the synonym, and if the word is a combination of notations of a plurality of other words, constitute the word It consists of word constituent word IDs in which word IDs of other words are arranged in the order of description.

以上の構成で、いずれかのユーザ端末装置TM1〜TMnのユーザが、文書データベース装置SDに登録されている文書を、自端末の検索クライアントを利用して検索する際、例えば、ユーザから示された検索条件が、「プロレス」かつ「東京」であった場合、検索クライアントは「プロレス」を言語解析システムに渡し、{プロ,レスリング}と{プロレス}の2つの単語列を得る。また、「東京」を言語解析システムに渡し{東京}を得る。   With the above configuration, when a user of any one of the user terminal devices TM1 to TMn searches for a document registered in the document database device SD using the search client of the own terminal, for example, the user indicates When the search condition is “pro-wrestling” and “Tokyo”, the search client passes “pro-wrestling” to the language analysis system, and obtains two word strings {pro, wrestling} and {pro-wrestling}. Also, “Tokyo” is passed to the language analysis system to obtain {Tokyo}.

ここで、検索サーバ装置SKで利用可能な演算子としてAND演算子、OR演算子、NOT演算子、および任意の1単語あるいは0単語にマッチする「?」が利用可能とする。   Here, as operators that can be used in the search server device SK, an AND operator, an OR operator, a NOT operator, and “?” That matches any one word or zero word can be used.

この場合は、検索クライアントは前述の単語列から、
((プロ??レスリング)ORプロレス)AND東京
の検索式を生成し、これを検索サーバ装置SKに渡す。
In this case, the search client uses the above word string,
((Pro ?? Wrestling) OR Pro Wrestling) A search expression for AND Tokyo is generated and passed to the search server device SK.

この結果、検索サーバ装置SKは、渡された検索式に基づいて文書データベース装置SDを検索し、例えば、「これがプロのレスリングだ in 東京ドーム」のような文書がヒットする。   As a result, the search server device SK searches the document database device SD based on the passed search expression, and hits a document such as “This is a professional wrestling in Tokyo Dome”.

ここで、言語解析システムでは、「プロレスリング」が入力文書バッファ1に格納された場合、形態素解析処理部2は、「プロ/スリング」「プロレス/リング」「プロレスリング」の3つの単語分割結果を比較し、自立語数最小の観点から、「プロレスリング」を選択する。従って、出力情報生成部4には、単語ID「1234567」(図4参照)が渡される。   Here, in the language analysis system, when “pro-wrestling” is stored in the input document buffer 1, the morpheme analysis processing unit 2 performs the three word division results of “pro / sling”, “pro-wrestling / ring”, and “pro-wrestling”. And select “Pro Wrestling” from the viewpoint of minimizing the number of independent words. Accordingly, the word ID “1234567” (see FIG. 4) is passed to the output information generation unit 4.

出力情報生成部4は、渡された単語IDの列を用いて、まず可能な同義語の組み合わせを複数の単語IDの列として生成する。仮に「プロレスリングプロレスリング」が解析された単語ID列{1234567,1234567}が出力情報生成部4に渡された場合、複数の単語IDの列としては、{1234567,1234567},{1234567,2345673},{2345673,1234567},{2345673,2345673}がそれぞれ得られる。   The output information generation unit 4 first generates possible synonym combinations as a sequence of a plurality of word IDs using the passed sequence of word IDs. If a word ID sequence {1234567, 1234567} obtained by analyzing “pro-wrestling pro-wrestling” is passed to the output information generation unit 4, {1234567, 1234567}, {1234567, 2345673, }, {2345673, 1234567}, {2345673, 2345673} are obtained respectively.

次に、それぞれの単語について、語構成に置き換えられるものを、語構成に置き換える。この場合、前述の例は次のようになる。{1274567,0006712,1274567,0006712},{1274567,0006712,2345673},{2345673,1274567,0006712},{2345673,2345673}。   Next, for each word, what is replaced with the word structure is replaced with the word structure. In this case, the above example is as follows. {1274567, 0006712, 1274567, 0006712}, {127567, 0006712, 2345673}, {2345673, 1274567, 0006712}, {2345673, 2345673}.

最後に出力情報生成部4は、それぞれの単語IDを用いて表記の情報を取得し、取得した表記列を出力情報バッファ5に格納する。   Finally, the output information generation unit 4 acquires notation information using each word ID, and stores the acquired notation string in the output information buffer 5.

この場合の処理の一例を図5に示す。   An example of processing in this case is shown in FIG.

まず、ユーザが単語W(start)...W(end)および演算子O(start)...O(end)からなる検索条件を検索クライアントに入力すると(処理101)、検索クライアントはこの検索条件に含まれる単語W(start)...W(i)...W(end)をそれぞれ言語解析システムに送る。   First, the user moves the word W (start). . . W (end) and operator O (start). . . When a search condition consisting of O (end) is input to the search client (process 101), the search client uses the word W (start). . . W (i). . . Each W (end) is sent to the language analysis system.

言語解析システムは、個別の単語W(i)について形態素解析を行い、単語列M(i,start)..M(i,j)...M(i,end)を得る(処理102,103)。また、M(i,j)は同義語表記群への置き換えプロセスにより、複数の表記群SW(i,j,n,m)に置き換えられる(処理104)。   The language analysis system performs morphological analysis on individual words W (i), and generates a word string M (i, start). . M (i, j). . . M (i, end) is obtained (processing 102, 103). Further, M (i, j) is replaced with a plurality of notation groups SW (i, j, n, m) by the replacement process with the synonym notation group (process 104).

言語解析システムは、このSW(i,j,n,m)を検索クライアントに送り返し、検索クライアントでは、この表記群を用いて検索条件を構成するW(i)を{(SW(i,j,start,start)??SW(i,j,start,1)??...)OR(SW(i,j,1,start)??SW(i,j,1,1)??...)OR...(SW(i,j,end,start)??SW(i,j,end,end))}なる形に書き換える(処理105)。   The language analysis system sends this SW (i, j, n, m) back to the search client, and the search client uses this notation group to change W (i) constituting the search condition {(SW (i, j, start (start, start) ??? SW (i, j, start, 1) ???) OR (SW (i, j, 1, start) ??? SW (i, j, 1,1) ??? .) OR. . . (SW (i, j, end, start) ?? SW (i, j, end, end))} is rewritten (process 105).

これは、単語W(i)の構成語を文字列「??」で連結することにより近接演算の代替とし、それぞれの構成語に関して、その同義語を「OR」で連結し、同義語を構成する下位構成語についても、「??」で連結したものである。   This replaces the proximity operation by concatenating the constituent words of the word W (i) with the character string “??”, and synonyms are formed by concatenating the synonyms with “OR” for each constituent word. The subordinate constituent words are also concatenated with “??”.

検索クライアントでは、すべての単語についてこの書き換えを行なった後(判断106のNOループ)、その書き換え結果に基づいて検索式を作成する(処理107)。この場合の検索式としては、(RW(start)O(start)RW(1)O(1)...O(end)RW(end))となる。   The search client performs this rewriting on all the words (NO loop of decision 106), and then creates a search expression based on the rewriting result (process 107). The retrieval formula in this case is (RW (start) O (start) RW (1) O (1)... O (end) RW (end)).

そして、その検索式を検索サーバ装置SKに渡し(処理108)、検索サーバ装置SKより検索結果を取得し(処理109)、検索結果をユーザに提示する(処理110)。   Then, the search expression is passed to the search server device SK (process 108), the search result is acquired from the search server device SK (process 109), and the search result is presented to the user (process 110).

図6は、M(i,j)をSW(i,j,n,m)に展開する処理の一例を示している。   FIG. 6 shows an example of processing for expanding M (i, j) to SW (i, j, n, m).

まず、M(i,j)を示す単語ID:Xを受け取り(処理201)、Xの複数の同義語ID:Y(start)...Y(end)を単語辞書より取得する(処理202)。   First, a word ID: X indicating M (i, j) is received (process 201), and a plurality of synonym IDs of X: Y (start). . . Y (end) is acquired from the word dictionary (process 202).

次に、それぞれのY(n)について、さらにその語構成SY(n,start)...SY(n,end)を単語辞書より取得する(処理203,204、判断205のNOループ)。   Next, for each Y (n), the word structure SY (n, start). . . SY (n, end) is acquired from the word dictionary (NO loop of processes 203 and 204 and determination 205).

そして、これら取得したSY(n,m)を用いて単語辞書から表記を取得し(処理206)、これをSW(n,m)として上位の処理に応答する(処理207)。   The notation is acquired from the word dictionary using these acquired SY (n, m) (process 206), and this is used as SW (n, m) to respond to the upper process (process 207).

さて、本実施例では、ユーザ端末装置TM1〜TMnのユーザは、単語辞書部3に登録している単語辞書を適宜に編集することができる。また、その編集結果は、単語情報サーバ装置STの単語データベース部21の内容に反映される。   In the present embodiment, the users of the user terminal devices TM1 to TMn can appropriately edit the word dictionary registered in the word dictionary unit 3. The editing result is reflected in the contents of the word database unit 21 of the word information server device ST.

まず、ユーザによる新語の追加、語情報の追加、自動更新を例に辞書編集部6の動作を説明する。   First, the operation of the dictionary editing unit 6 will be described by taking as an example the addition of new words, addition of word information, and automatic updating by the user.

ユーザが仮に「アルティメットレスリング」なる語を追加したいとする。ユーザは辞書編集部6を操作し、一般名詞「アルティメットレスリング」および語構成情報「アルティメット」「レスリング」を登録単語として入力する。   Suppose the user wants to add the word “ultimate wrestling”. The user operates the dictionary editing unit 6 to input the general noun “ultimate wrestling” and the word composition information “ultimate” “wrestling” as registered words.

まず、辞書編集部6は「アルティメットレスリング」「アルティメット」「レスリング」を単語情報取得部9に渡す。これにより、単語情報取得部9は、単語情報サーバ装置よりそれぞれの単語情報を得る。この場合、それぞれ「アルティメットレスリング−該当単語なし」「レスリング−0006712」「アルティメット−4445566」が得られる。   First, the dictionary editing unit 6 passes “ultimate wrestling”, “ultimate”, and “wrestling” to the word information acquisition unit 9. Thereby, the word information acquisition part 9 acquires each word information from a word information server apparatus. In this case, “ultimate wrestling—no corresponding word”, “wrestling-0006712”, and “ultimate-44445566” are obtained.

次いで、辞書編集部6は、単語ID:0006712,4445566を順に用いて単語情報取得部9を呼び出し、これをユーザに提示する。ユーザはこれを用いて、「アルティメットレスリング」の分割結果である「アルティメット−4445566」が正しい構成単語か否かを判断し、正しければ「OK」を、正しくなければ次候補の提示要求を辞書編集部に送る。次候補がなければ、後述する新語の登録の扱いとなる。   Next, the dictionary editing unit 6 calls the word information acquisition unit 9 using the word IDs: 0006712, 4445566 in order, and presents this to the user. The user uses this to determine whether or not “Ultimate-44444566”, which is the division result of “Ultimate Wrestling”, is a correct constituent word. If it is correct, “OK” is determined. Send to department. If there is no next candidate, it will be handled as new word registration described later.

「アルティメット」が決定すると、同様の手順を「レスリング」についても適用し、すべての語構成を取得する。ここでは前述の語構成4445566−0006712は正しかったものとする。   When “ultimate” is determined, the same procedure is applied to “wrestling” to acquire all word configurations. Here, it is assumed that the above-mentioned word structure 444556-0006712 was correct.

次に辞書編集部6は、さらに語構成情報の単語ID:0006712と4445566を単語情報取得部9に渡し、これらを語構成単語IDとして保持する単語を検索するが、ここでは前述の2つの単語IDを同時に語構成として保持する単語は存在しない。   Next, the dictionary editing unit 6 further passes the word IDs 0006712 and 4445566 of the word configuration information to the word information acquisition unit 9 and searches for words that hold these as word configuration word IDs. Here, the two words described above are used. There is no word that holds ID as a word structure at the same time.

この結果、辞書編集部6は、「アルティメット・レスリング」や「レスリングアルティメット」など同義語の可能性のある語は存在しないと判断し、「アルティメットレスリング」をまったくの新語として扱う。具体的には単語ID取得部7を呼び出し、単語情報サーバ装置STより新たな単語IDを取得する。そして、得られた単語ID(たとえば9934121)をアルティメットレスリングに付与する。   As a result, the dictionary editing unit 6 determines that there is no word that may have a synonym such as “ultimate wrestling” or “wrestling ultimate”, and treats “ultimate wrestling” as a completely new word. Specifically, the word ID acquisition unit 7 is called to acquire a new word ID from the word information server device ST. Then, the obtained word ID (for example, 9934121) is assigned to the ultimate wrestling.

また、辞書編集部6は、9934121と表記「アルティメットレスリング」、品詞「一般名詞」、語構成「0006712,4445566」を単語情報登録部に渡し、単語情報登録部は、これをネットワーク上の単語情報サーバに単語登録要求として渡す。単語情報登録部は、また、固有のクリエータIDを管理し、このクリエータIDの初期値は「−1」である。   Further, the dictionary editing unit 6 passes 9934121 and the notation “ultimate wrestling”, the part of speech “general noun”, and the word configuration “0006712, 4455566” to the word information registration unit, and the word information registration unit passes this to the word information on the network. Pass it to the server as a word registration request. The word information registration unit also manages a unique creator ID, and the initial value of this creator ID is “−1”.

クリエータIDが「−1」の場合、単語情報登録部8は単語情報サーバ装置STにクリエータIDの発行要求を出し、取得したクリエータIDによって初期値を置き換える。単語登録要求には、常にクリエータIDを添付する。クリエータIDが「C11243」であるとすれば、単語登録要求は図7(a)のようになる。   When the creator ID is “−1”, the word information registration unit 8 issues a creator ID issuance request to the word information server device ST, and replaces the initial value with the acquired creator ID. A creator ID is always attached to a word registration request. If the creator ID is “C11243”, the word registration request is as shown in FIG.

ユーザが仮に既登録単語である「ウルティメット」なる語と、既登録単語である「アルティメット」なる語は同義語であると追加したい場合、ユーザは辞書編集部6に「アルティメット」および同義語情報「ウルティメット」を追加情報として入力する。   If the user wants to add the word “Ultimate”, which is a registered word, and the word “Ultimate”, which is a registered word, the user wants to add “Ultimate” and synonym information “ Enter "Ultimate" as additional information.

「アルティメット」、および、「ウルティメット」の両者の単語情報が取得できた場合、辞書編集部6は図7(b)に示したような単語情報追加要求を発行する。なお、ここでは異なったクリエータが追加を実施したとし、新たなクリエータIDを付与した。   When the word information of both “ultimate” and “ultimate” can be acquired, the dictionary editing unit 6 issues a word information addition request as shown in FIG. In this case, it is assumed that different creators add the new creator ID.

一方、単語辞書部3の自動更新時には、自動更新部10は、クリエータIDリスト保持部11を利用する。   On the other hand, when the word dictionary unit 3 is automatically updated, the automatic update unit 10 uses the creator ID list holding unit 11.

ユーザは、あらかじめクリエータIDリスト保持部11に、自分と同じ観点の興味分野を持つクリエータ(ユーザ)のクリエータIDや、信用のおける単語情報を作成するクリエータのクリエータIDを登録している。   The user registers in advance in the creator ID list holding unit 11 the creator ID of the creator (user) who has the same field of interest as that of himself or the creator ID of the creator who creates reliable word information.

クリエータIDリスト保持部11に保持されるクリエータIDリストは、単なるクリエータIDの羅列であり、例えば、{C11243,C17212,C00001,C00007}という内容を持つ。   The creator ID list held in the creator ID list holding unit 11 is simply a list of creator IDs, and has, for example, the contents {C11243, C17212, C00001, C00007}.

自動更新時、自動更新部10は、クリエータIDリスト保持部11に保持されているクリエータID「C11243」あるいは「C17212」あるいは「C00001」あるいは「C00007」を持つ単語情報を単語情報取得部9を用いて、単語情報サーバ装置STから検索し、得られた単語ID群のうち、プロパティ名として「語構成」「同義語」を持つ単語IDのみを選択し、これらを検索結果として単語情報を辞書編集部3に送る。なお、同義語や語構成のない単語については値「NULL(空値)」が設定されているものとする。   At the time of automatic update, the automatic update unit 10 uses the word information acquisition unit 9 for word information having the creator ID “C11243”, “C17212”, “C00001”, or “C00007” held in the creator ID list holding unit 11. Then, from the word information server device ST, only word IDs having “word structure” and “synonyms” as property names are selected from the obtained word ID group, and the word information is edited as a search result. Send to part 3. It is assumed that the value “NULL (null value)” is set for words having no synonyms or word structures.

辞書編集部6では、単語IDも含めたすべての情報が完備した状態で単語情報を得たため、これを単語辞書部3に登録する。ただし、重複する単語情報は登録しない。   In the dictionary editing unit 6, the word information is obtained in a state where all the information including the word ID is complete, and this is registered in the word dictionary unit 3. However, duplicate word information is not registered.

この結果、前述のクリエータIDリストを用いたシステムでは、図7(b)に示したような「アルティメットレスリング」なるボキャブラリと、「ウルティメット」と「アルティメット」の同義語関係を利用可能になる。   As a result, in the system using the creator ID list described above, the vocabulary “ultimate wrestling” as shown in FIG. 7B and the synonym relationship between “ultimate” and “ultimate” can be used.

このようにして、ユーザは、単語情報を適宜に登録したり、登録されている単語情報を適宜に修正したり、更新することができる。   In this way, the user can register word information as appropriate, or correct or update the registered word information as appropriate.

また、各単語ごとにユニークな単語IDを発生させ、これをキーとして、ふりがな、訳語、語構成など単語に付随し、アプリケーションごとに個別に必要とされる情報を管理しているので、単語の全情報を埋めずとも単語の登録を可能であり、また、ネットワークを介して単語情報を共有可能としているので、これらにより複数のアプリケーションで共通に利用できる分散ユーザ辞書開発環境の基盤が提供できる。   In addition, a unique word ID is generated for each word, and this is used as a key to accompany the word such as phonetics, translations, word structure, and so on. Words can be registered without filling in all information, and word information can be shared via a network, thereby providing a base for a distributed user dictionary development environment that can be shared by a plurality of applications.

また、単語ごとにユニークな単語IDの付与、これによる同義語情報の管理を可能としたことにより、同義語に関して正確な語の指定を可能とすることができる   In addition, it is possible to assign a unique word ID for each word and to manage synonym information by this, so that it is possible to specify an accurate word for the synonym.

また、単語ごとにユニークな単語IDの付与、これによる語構成情報の検索を可能としたことにより、同義語に関して正確な語の指定を可能とすることができる   In addition, by assigning a unique word ID for each word and enabling the search of word configuration information thereby, it is possible to specify an exact word for a synonym.

また、クリエータIDを取り扱い可能としてことにより、特定の分野に偏った、あるいはある一定レベル以上の技量を持ったクリエータ群を指定可能とし、これにより、ユーザの好みや要望を反映した単語情報の取得を可能とすることができる。   In addition, by making it possible to handle creator IDs, it is possible to specify a group of creators that are biased to a specific field or have a certain level of skill, thereby obtaining word information that reflects user preferences and requests Can be made possible.

また、クリエータIDのリストを保持し、これを利用したアップデートを可能とすることにより、自動的に単語辞書を更新することが可能となる。   Further, the word dictionary can be automatically updated by maintaining a list of creator IDs and enabling update using the list.

なお、本発明は、検索システムや、翻訳システムについても、同様にして適用することができる。   It should be noted that the present invention can be similarly applied to a search system and a translation system.

本発明の一実施例にかかるネットワークシステムの一例を示したブロック図。The block diagram which showed an example of the network system concerning one Example of this invention. 言語解析システムの構成の一例を示したブロック図。The block diagram which showed an example of the structure of the language analysis system. 単語情報サーバ装置STの構成の一例を示したブロック図。The block diagram which showed an example of the structure of word information server apparatus ST. 単語辞書の構成の一例を示した概略図。Schematic which showed an example of the structure of a word dictionary. ユーザ端末装置の処理の一例を示したフローチャート。The flowchart which showed an example of the process of a user terminal device. M(i,j)をSW(i,j,n,m)に展開する処理の一例を示したフローチャート。The flowchart which showed an example of the process which expand | deploys M (i, j) to SW (i, j, n, m). 更新情報の一例を示した概略図。Schematic which showed an example of update information.

符号の説明Explanation of symbols

TM1〜TMn ユーザ端末装置
ST 単語サーバ装置
SK 検索サーバ装置
SD 文書データベース装置
1 入力文書バッファ
2 形態素解析処理部
3 単語辞書部
4 出力情報生成部
5 出力情報バッファ
6 辞書編集部
7 単語ID取得部
8 単語情報登録部
9 単語情報取得部
10 自動更新部
11 クリエータIDリスト保持部
12、26 通信制御部
21 単語データベース部
22 単語データベース管理部
23 単語ID付与部
24 クリエータID付与部
TM1 to TMn User terminal device ST Word server device SK Search server device SD Document database device 1 Input document buffer 2 Morphological analysis processing unit 3 Word dictionary unit 4 Output information generation unit 5 Output information buffer 6 Dictionary editing unit 7 Word ID acquisition unit 8 Word information registration part 9 Word information acquisition part 10 Automatic update part 11 Creator ID list holding part 12, 26 Communication control part 21 Word database part 22 Word database management part 23 Word ID provision part 24 Creator ID provision part

Claims (5)

入力文書を言語解析し、解析結果を所定の目的のために加工して出力する言語解析システムと、ネットワークを介して前記言語解析システムと接続し、当該言語解析システムに対して単語情報を提供する単語情報サーバからなる単語情報の分散開発システムにおいて、
前記言語解析システムは、
文書情報を入力し、形態素解析を行なう形態素解析処理手段と、
前記形態素解析処理手段に利用され、単語ごとに、少なくとも単語ID、表記、品詞情報、および、複数の単語付随情報を保持する単語辞書手段と、
前記形態素解析処理手段から受け取った単語ID列を用いて単語ごとに取得した表記、品詞情報、および、単語付随情報を用いて、出力情報を生成する出力情報生成手段と、
単語辞書に対する単語の登録、削除、および、更新を行なう辞書編集手段と、
前記辞書編集手段から呼び出され、前記単語情報サーバに対して表記や品詞情報、単語ID、および、単語付随情報を組み合わせた検索要求を送り、条件に一致した単語の情報を、当該単語情報サーバより取得する単語情報取得手段と、
前記辞書編集手段から呼び出され、前記単語情報サーバから単語IDを取得する単語ID取得手段と、
前記辞書編集部から呼び出され、前記単語情報サーバに対して、単語IDと関連づけて表記、品詞情報、および、単語付随情報を送る単語情報登録部を備え、
前記単語情報サーバは、
単語ごとの情報として、単語ID、表記、品詞情報、複数の単語付随情報を保持する単語データベース手段と、
前記言語解析システムからの要求に応じて新規に単語IDを発効する単語ID付与手段と、
前記言語解析システムからの要求に応じて、前記単語データベース手段へ、単語IDをキーとした表記、品詞情報、単語付随情報の登録、削除および更新、および、単語ID、表記、品詞情報、および、単語付随情報の組み合わせを検索条件とした検索を行なう単語データベース管理手段を備えることを特徴とする単語情報の分散開発システム。
A language analysis system that analyzes the input document, processes and outputs the analysis result for a predetermined purpose, and connects to the language analysis system via a network to provide word information to the language analysis system In the distributed development system of word information consisting of word information servers,
The language analysis system includes:
Morphological analysis processing means for inputting document information and performing morphological analysis;
Word dictionary means that is used in the morphological analysis processing means and holds at least a word ID, a notation, a part-of-speech information, and a plurality of word-accompanying information for each word;
Output information generating means for generating output information using notation, part-of-speech information acquired for each word using the word ID string received from the morphological analysis processing means, and word accompanying information;
A dictionary editing means for registering, deleting, and updating words in the word dictionary;
It is called from the dictionary editing means, sends a search request that combines notation, part-of-speech information, word ID, and word incidental information to the word information server, and information on the word that matches the condition is sent from the word information server. Word information acquisition means to acquire;
A word ID acquisition unit that is called from the dictionary editing unit and acquires a word ID from the word information server;
A word information registration unit that is called from the dictionary editing unit and sends the notation, part-of-speech information, and word incidental information in association with the word ID to the word information server;
The word information server
Word database means for holding word ID, notation, part-of-speech information, and a plurality of word-accompanying information as information for each word;
Word ID giving means for newly issuing a word ID in response to a request from the language analysis system;
In response to a request from the language analysis system, to the word database means, notation using word ID as a key, part of speech information, registration of word incidental information, deletion and update, and word ID, notation, part of speech information, and A word information distributed development system comprising word database management means for performing a search using a combination of word accompanying information as a search condition.
前記言語解析システムは、前記単語付随情報として、単語IDで示される語の同義語の単語IDを有することを特徴とした請求項1記載の単語情報の分散開発システム。   2. The distributed development system of word information according to claim 1, wherein the language analysis system has a word ID of a synonym of a word indicated by a word ID as the word accompanying information. 前記言語解析システムは、前記単語付随情報として、単語IDで示される語の語構成の単語IDを有することを特徴とした請求項1記載の単語情報の分散開発システム。 2. The distributed development system of word information according to claim 1, wherein the language analysis system has a word ID of a word structure of a word indicated by a word ID as the word accompanying information. 前記言語解析システムは、
あらかじめ定められたクリエータIDのリストを保持したクリエータIDリスト保持手段と、
あらかじめ定められた時間ごとに前記単語情報取得手段を呼び出し、クリエータIDリストを用いて単語情報の取得を行い、その結果を前記辞書編集手段に送る自動交信手段をさらに備え、
前記辞書編集手段は前記自動更新手段から受け取った単語情報の単語辞書への登録を行なうことを特徴とした請求項1または請求項2または請求項3記載の単語情報の分散開発システム。
The language analysis system includes:
Creator ID list holding means for holding a list of predetermined creator IDs;
Calling the word information acquisition means at predetermined time intervals, obtaining word information using a creator ID list, further comprising an automatic communication means for sending the result to the dictionary editing means,
4. The distributed development system for word information according to claim 1, wherein said dictionary editing means registers word information received from said automatic updating means in a word dictionary.
前記単語情報サーバは、
単語ごとの情報として保持する表記、品詞情報、および、複数の単語付随情報のそれぞれに、さらにクリエータIDを設定し、
前記言語解析システムからの要求に応じて新規にクリエータIDを発行するクリエータID付与手段を、さらに備えたことを特徴とする請求項1または請求項2または請求項3または請求項4記載の単語情報の分散開発システム。
The word information server
Further, a creator ID is set for each of the notation, part-of-speech information, and plural word-accompanying information held as information for each word,
5. The word information according to claim 1, further comprising creator ID giving means for newly issuing a creator ID in response to a request from the language analysis system. Distributed development system.
JP2005208238A 2005-07-19 2005-07-19 Distributed development system of word information Pending JP2007026155A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005208238A JP2007026155A (en) 2005-07-19 2005-07-19 Distributed development system of word information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005208238A JP2007026155A (en) 2005-07-19 2005-07-19 Distributed development system of word information

Publications (1)

Publication Number Publication Date
JP2007026155A true JP2007026155A (en) 2007-02-01

Family

ID=37786808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005208238A Pending JP2007026155A (en) 2005-07-19 2005-07-19 Distributed development system of word information

Country Status (1)

Country Link
JP (1) JP2007026155A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012521608A (en) * 2009-03-25 2012-09-13 マイクロソフト コーポレーション Shareable decentralized dictionary for applications

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012521608A (en) * 2009-03-25 2012-09-13 マイクロソフト コーポレーション Shareable decentralized dictionary for applications

Similar Documents

Publication Publication Date Title
JP3899795B2 (en) File management system and method
CN100416559C (en) Data searching system and method by mere label in whole
JP2006092316A (en) Structured document retrieval device, structured document retrieval method, and storage medium storing data for structured document retrieval
JPWO2004111876A1 (en) Search system and method for reusing search conditions
JP2010282241A (en) File management device, file management system, file management method, and program
JP2002049637A (en) Database management method, device and recording medium
JP2008234215A (en) Workflow management system
JP2010237721A (en) Search system, search method and search program
JP2015204076A (en) Document difference display program and information processor
JP2007026155A (en) Distributed development system of word information
JP2002259387A (en) Document retrieving system
JP2009187401A (en) Document management system, document management apparatus, and document managing method and program
JP2001318942A (en) Information providing system and mediator
JP2013033352A (en) Program creation device, and method and program thereof
JP2013033333A (en) Business process/business rule execution system, business process/business rule execution method and program
JPH10307829A (en) Electronic document retrieving system and recording medium
JP6246626B2 (en) Speech synthesis system, speech conversion support device, and speech conversion support method
JP2002140338A (en) Device and method for supporting construction of dictionary
JP2002116934A (en) Document management system
JP7336869B2 (en) Information processing device, information processing method and program
JP3601869B2 (en) Machine translation system
JP5358981B2 (en) Information processing apparatus, information processing apparatus control method, and information processing apparatus control program
JP2006072705A (en) Document search device and method
JP2008197759A (en) Translation system, translation method, dictionary management system, and dictionary management method
JP2010140163A (en) Dictionary file registration/distribution system with network sharing type authority