JP2004213083A - Dictionary-registering device for natural language processing, registration method of dictionary for natural language processing, and program - Google Patents

Dictionary-registering device for natural language processing, registration method of dictionary for natural language processing, and program Download PDF

Info

Publication number
JP2004213083A
JP2004213083A JP2002378448A JP2002378448A JP2004213083A JP 2004213083 A JP2004213083 A JP 2004213083A JP 2002378448 A JP2002378448 A JP 2002378448A JP 2002378448 A JP2002378448 A JP 2002378448A JP 2004213083 A JP2004213083 A JP 2004213083A
Authority
JP
Japan
Prior art keywords
utilization
natural language
input
language processing
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002378448A
Other languages
Japanese (ja)
Other versions
JP3892806B2 (en
Inventor
Akira Kumano
明 熊野
Satoshi Kinoshita
聡 木下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002378448A priority Critical patent/JP3892806B2/en
Publication of JP2004213083A publication Critical patent/JP2004213083A/en
Application granted granted Critical
Publication of JP3892806B2 publication Critical patent/JP3892806B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a registration device for natural language dictionary which can prevent errors from occurring, when a type of conjugation is selected, and can perform efficient registration work by flexible input operation. <P>SOLUTION: In a GUI, consisting of an input part 1 and an output part 5, if the original form of a phase of a language to be registered is inputted and a selection button for the type of existing conjugational variations is depressed, a conjugational variation module 313 of a conjugation information setting part 31 of a registration processing part 3 generates conjugation, based on the original form and the type of conjugational variations, and displays the conjugation in a conjugational variation display/input column which doubles as a display column and an input column for the result of the conjugational variations. Here, if a user notices an error in conjugation, he or she can correct it by selecting the correct type of conjugation again, but he or she can also directly modify the conjugation displayed in the conjugational variation display/input column. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、自然言語辞書にデータを登録するための自然言語辞書登録装置、自然言語辞書登録方法及びプログラムに関する。
【0002】
【従来の技術】
機械翻訳システムやスペルチェック等の自然言語処理における辞書登録装置では、活用語の活用種類を指定する方法として、一般的に、次のような2つの方法が併用されている(例えば、特許文献1参照)。
【0003】
(1)規則変化する単語の指定のために、選択肢から活用種類を選択する方法
(2)不規則変化する単語の指定のために、活用形を直接入力する方法
ところで、活用語の入力作業では、錯誤等のために、間違った活用語が登録されてしまうことがあるので、従来、(1)の方法においては、入力された単語と選択された活用種類から登録すべき活用形を生成した後に、生成した活用形を表示して、登録者に確認させるようにしている。
【0004】
しかし、登録者が誤りに気がついた際に、それが他の活用種類で規則変化する単語であった場合には、(1)の方法をやり直して正しい活用種類を選択するしかなく、それが不規則変化する単語であった場合には、(2)の方法で活用形を手入力するしかなかった。
【0005】
【特許文献1】
特開平3−108062号公報
【0006】
【発明が解決しようとする課題】
従来の辞書登録装置において、単語の活用形の入力インタフェースでは、煩雑な登録作業におけるミスを防ぐことができ且つ柔軟な入力操作で効率的に登録が行えるようなものがなかった。
【0007】
本発明は、上記事情を考慮してなされたもので、活用種類を選択した場合の誤りを未然に防ぐことができ且つ柔軟な入力操作で効率的な登録作業を行うことができるようにした自然言語辞書登録装置、自然言語辞書登録方法及びプログラムを提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明は、特定の言語を処理するための自然言語処理用辞書に対して、該言語の語句の活用情報を登録するための自然言語処理用辞書登録装置において、登録すべき前記語句について、その原形を入力するための第1の入力手段と、前記原形に対する活用形について、既成の活用変化の種類の選択指示又は直接入力の選択指示を入力するための第2の入力手段と、前記第2の入力手段によりいずれかの前記活用変化の種類の選択指示が入力された場合に、前記原形と前記活用変化の種類に基づいて、前記原形に対する所定の活用形を生成する生成手段と、前記生成手段により生成された前記活用形を表示画面の所定の領域に表示するための表示手段と、前記表示手段により表示された前記活用形を編集するための編集手段とを備えたことを特徴とする。
【0009】
また、本発明は、特定の言語を処理するための自然言語処理用辞書に対して、該言語の語句の活用情報を登録するための自然言語処理用辞書登録装置の自然言語処理用辞書登録方法において、登録すべき前記語句について、その原形を入力するための第1の入力ステップと、前記原形に対する活用形について、既成の活用変化の種類の選択指示又は直接入力の選択指示を入力するための第2の入力ステップと、前記第2の入力ステップによりいずれかの前記活用変化の種類の選択指示が入力された場合に、前記原形と前記活用変化の種類に基づいて、前記原形に対する所定の活用形を生成する生成ステップと、前記生成ステップにより生成された前記活用形を表示画面の所定の領域に表示するための表示ステップと、前記表示ステップにより表示された前記活用形を編集するための編集ステップとを有することを特徴とする。
【0010】
また、本発明は、コンピュータを自然言語処理用辞書登録装置として機能させるためのプログラムであって、特定の言語を処理するための自然言語処理用辞書に対して、該言語の語句の活用情報を登録するための自然言語処理用辞書登録装置において、登録すべき前記語句について、その原形を入力するための第1の入力機能と、前記原形に対する活用形について、既成の活用変化の種類の選択指示又は直接入力の選択指示を入力するための第2の入力機能と、前記第2の入力機能によりいずれかの前記活用変化の種類の選択指示が入力された場合に、前記原形と前記活用変化の種類に基づいて、前記原形に対する所定の活用形を生成する生成機能と、前記生成機能により生成された前記活用形を表示画面の所定の領域に表示するための表示機能と、前記表示機能により表示された前記活用形を編集するための編集とをコンピュータに実現させるためのプログラムである。
【0011】
なお、装置に係る本発明は方法に係る発明としても成立し、方法に係る本発明は装置に係る発明としても成立する。
また、装置または方法に係る本発明は、コンピュータに当該発明に相当する手順を実行させるための(あるいはコンピュータを当該発明に相当する手段として機能させるための、あるいはコンピュータに当該発明に相当する機能を実現させるための)プログラムとしても成立し、該プログラムを記録したコンピュータ読取り可能な記録媒体としても成立する。
【0012】
本発明によれば、活用種類を選択した場合の誤りを未然に防ぐことができ且つ柔軟な入力操作で効率的な登録作業を行うことができるようになる。
【0013】
【発明の実施の形態】
以下、図面を参照しながら発明の実施の形態を説明する。
【0014】
図1に、本発明の一実施形態に係る辞書登録装置の構成例を示す。
【0015】
図1に示されるように、本実施形態の辞書登録装置は、辞書登録に関するデータや指示等を入力するための入力部1、辞書登録の処理を行うための登録処理部3、辞書登録に関するデータや指示の受け付け内容等を出力するための出力部5、辞書を記憶するための辞書記憶部7を備えている。また、登録処理部3は、活用情報設定部31を含み、さらに、登録処理部3の活用情報設定部31は、原形バッファ311、活用種類テーブル312、活用変化モジュール313、活用変化形バッファ314を含む。
【0016】
ここで、辞書記憶部7に記憶される辞書は、自然言語処理用辞書とする。また、本実施形態では、自然言語処理には、活用情報を登録するものを想定する。
【0017】
例えば、自然言語処理が機械翻訳処理である場合には、自然言語処理用辞書は、機械翻訳用辞書である。この場合、機械翻訳用辞書には、例えば、原語とする第1の言語の語句(見出し語)とその品詞等の情報や、訳語とする第2の言語の語句(訳語)とその品詞等の情報が登録される。
【0018】
また、例えば、自然言語処理がスペルチェック処理である場合には、自然言語処理用辞書は、スペルチェック用辞書である。この場合、スペルチェック用辞書には、例えば、ある言語の語句とその品詞等の情報が登録される。
【0019】
もちろん、自然言語処理やその辞書には、上記の他にも種々のものがあり、本実施形態は、活用情報を登録する自然言語処理用辞書であれば、どのようなものでも適用可能である。
【0020】
なお、図1の登録処理部3では、活用形以外の項目の辞書登録を行うための設定処理部の図示を省略している。また、活用形以外の項目の辞書登録を行うための設定処理部は、どのようなものを用いることも可能である(従来からある手段を用いても構わない)。また、以下では、活用形以外の項目の辞書登録に関する説明は省略し、活用形の辞書登録に関してのみ説明する。
【0021】
ここで、例えば、自然言語処理が機械翻訳処理等の複数の言語を扱うものである場合に、第1の言語と第2の言語の両方に、これから説明する本実施形態の活用形登録方法を適用するときは、活用情報設定部31が第1の言語用の部分と第2の言語用の部分を有するか、あるいは登録処理部3が第1の言語用の活用情報設定部と第2の言語用の活用情報設定部を備えればよい(第3の言語以上にわたる場合も同様である)。ただし、その一部の言語のみに本実施形態の活用形登録方法を適用することも可能であり、この場合には、他の言語については従来の活用形登録方法を適用して構わない。以下では、ある1つの言語として英語を例にとって英語に関する語句の活用形の登録処理について説明するが、他の言語についても基本的には同様である。また、以下では、機械翻訳用辞書の第1言語の見出し語の活用形を設定する場合を例にとって説明するが、機械翻訳用辞書の第2言語の訳語の活用形を設定する場合や、スペルチェック用辞書の対象言語の語句の活用形を設定する場合など、他の各種の設定の場合も、基本的には同様である。
【0022】
さて、以下では、辞書登録する活用形を入力してから、情報を選択、表示出力するまでに関する構成・動作について詳しく説明する。
【0023】
辞書記憶部7に記憶される辞書は、本具体例の場合、機械翻訳用辞書である。
【0024】
入力部1は、本具体例の場合、第1言語の見出し語や指示等を入力するためのものである。例えば、キーボード、音声入力装置、マウスなどを用いて構成することができる。
【0025】
登録処理部3は、辞書登録処理(本具体例の場合、機械翻訳用辞書に対する登録処理)を行うためのものであり、その活用情報設定部31は、入力部1から入力された語句(本具体例の場合、第1言語の見出し語)に対して、活用情報を設定するものである。
【0026】
活用情報設定部31の原形バッファ311は、入力部1から入力された原形を保存するバッファである。
【0027】
活用種類テーブル312は、活用語の活用種類をまとめたテーブルである。
【0028】
活用変化モジュール313は、原形バッファ311に保持された言語(本具体例の場合、第1言語の見出し語)に対して、(入力部1から入力された)活用種類テーブル312のうちから選択された値によって活用変化を行うものである。
【0029】
活用変化形バッファ314は、活用変化モジュール313が生成した活用変化形を保存し、出力部5に提供するためのバッファである。
【0030】
表示部5は、原形バッファ111の内容、活用種類テーブル112の選択肢、活用変化形バッファ114の内容を出力するものである。例えば、ディスプレイ装置、音声出力装置などを用いて構成することができる。
【0031】
図2に、活用種類テーブル112の構成例を示す。ここでは、英語の動詞の活用種類を例にとって示している。
【0032】
図2の活用種類テーブルの1行目([a]段)は、三人称単数現在形に関する活用種類で、[a−1]「語尾にsを付与」、[a−2]「語尾にesを付与」、[a−3]「語尾のyをiesに置換」の3種類が既成の活用種類の選択肢として用意されていることを示す。最右欄の「*」は、既成の活用種類の他に、[a−x]新規活用変化形(不規則変化形)を入力できることを示す。なお、選択肢[a−3]には、「原形語尾がy」という活用適用条件が付与されている。
【0033】
また、2行目([b]段)は、現在分詞形に関する活用種類で、[b−1]「語尾にingを付与」、[b−2]「語尾のeをingに置換」、[b−3]「語尾のieをyingに置換」、[b−4]「語尾の子音字を繰り返してingを付与」の4種類が既成の活用種類の選択肢として用意されていることを示す。最右欄の「*」は、既成の活用種類の他に、[b−x]新規活用変化形(不規則変化形)を入力できることを示す。なお、選択肢[b−2]には、「原形語尾がe」という活用適用条件が、選択肢[b−3]には、「原形語尾がie」という活用適用条件が、選択肢[b−4]には、「原形語尾が子音字」という活用適用条件が、それぞれ付与されている。
【0034】
また、3行目([c]段)・4行目([d]段)は、過去形・過去分詞形に関する活用種類で、[c−1][d−1]「語尾にedを付与」、[c−2][d−2]「語尾にdを付与」、[c−3][d−3]「語尾のyをiedに置換」、[c−4][d−4]「語尾の子音字を繰り返してedを付与」の4種類が既成の活用種類の選択肢として用意されていることを示す。最右欄の「*」は、既成の活用種類の他に、[c−x][d−x]新規活用変化形(不規則変化形)を入力できることを示す。なお、選択肢[c−3][d−3]には、「原形語尾がy」という活用適用条件が、選択肢[c−4][d−4]には、「原形語尾が子音字」という活用適用条件が、それぞれ付与されている。
【0035】
本実施形態では、第1言語の見出し語を辞書登録するにあたって、第1言語の見出し語の活用情報を登録するモードとして、次の2種類を想定する。
(1)ユーザは、登録する語句の言語を入力するとともに、既成の活用変化の種類の選択肢のうちから該当する種類を選択入力する。当該システムは、活用変化結果を生成して表示する。ユーザは、表示された活用変化結果を確認するだけでなく、表示された活用変化結果を編集等することができる。ユーザが登録指示を行うと、当該システムは、その時点で保持されている活用変化結果を辞書に登録する。
(2)ユーザは、活用変化形を直接文字入力する。ユーザが登録指示を行うと、当該システムは、その時点で保持されている活用形を辞書に登録する。
【0036】
図3に、本実施形態の辞書登録画面の初期状態の表示例を示す。ここでも、英語の動詞を登録する場合を例にとって示している。
【0037】
図3の例において、最上段の左の欄は、見出し語入力欄である。本具体例では、動詞の原形を入力することができる。
【0038】
最上段の右のボタンは、登録ボタンである。登録ボタンをクリックすることで、現在表示されているデータを辞書に登録する指示を与える。
【0039】
第2段以降は、所望の既成の活用種類(図3の例では、三人称単数現在形(三単現)、現在分詞形、過去形、過去分詞形)又は直接文字入力を選択する選択肢欄(図中の○が選択ボタン)と、実際の活用変化結果の表示欄と入力欄とを兼用する活用変化表示入力欄(最右の空欄)とからなる。
【0040】
なお、選択ボタンは、非選択状態で押すと選択状態になり、選択状態で押すと非選択状態になるものとする。
【0041】
図4に、図3に示した辞書登録装置に、英語の動詞overwriteを登録する例を示す。
【0042】
図3の例において、最上段の見出し語入力欄に「overwrite」を入力し、三人称単数現在形の活用に「語尾にsを付与」、現在分詞形の活用に「語尾のeをingに置換」を選択した(該当する選択ボタンが押された)結果、その選択に応じた活用変化結果「overwrites」、「overwriting」が生成され活用変化表示入力欄に表示されている。
【0043】
他方、過去形・過去分詞形の活用は不規則変化形なので、直接入力を選択し、活用変化表示入力欄に直接「overwrote」「overwritten」を入力したものである。
【0044】
なお、選択ボタンが黒丸になっているのは、実際に選択したことを示している。
【0045】
ここで、各入力欄に表示中の各データが正しいことを確認するなどした後に、登録ボタンをクリックすると、各データが登録される。
【0046】
以上が基本的な操作である。
【0047】
以下では、さらに備えると好ましい機能について説明していく。以下で説明する機能は、全てを備えてもよいし、適宜一部を備えてもよい。
【0048】
(i)図5は、図4の例と同じ内容であるが、原形の表層形と活用適用条件を照合し、両者が矛盾する選択肢は、選択できないようにした例である。選択肢の選択ボタンに該当する部分が○ではなく×になっているのは、それが選択できない状態であることを示す。なお、×を表示するのではなく、例えば、選択ボタンを表示しない、選択ボタンを半透明にして選択できない状態であることを示す、などで他の方法でもよい。
【0049】
ここでは、見出し語原形が「overwrite」なので、三人称単数現在形活用種類の選択肢[a−3]「語尾のyをiesに置換」、現在分詞形活用種類の選択肢[b−3]「語尾のieをyingに置換」、[b−4]「語尾の子音字を繰り返してingを付与」、過去形・過去分詞形活用種類の選択肢[c−3]「語尾のyをiedに置換」、[c−4]「語尾の子音字を繰り返してedを付与」のそれぞれは適用条件と原形が矛盾するため、それらを選択できなくしている。
【0050】
(ii)図6は、図5と同じ状況で、「過去形」の選択を誤った例を示す。過去形の活用種類に、「+d(語尾にdを付与)」を選択したため、活用変化表示入力欄の表示が、「overwrited」になっている。
【0051】
ここで、活用変化表示入力欄を編集可能とする。なお、例えば、活用変化表示入力欄の選択ボタン(直接文字入力の選択ボタン)が選択されていない状態では編集不可で、活用変化表示入力欄の選択ボタンが選択されると編集可能になる(それまで選択状態になっていた他の選択ボタンは非選択状態になる)ようにしてもよいし、活用変化表示入力欄の選択ボタンが選択されていない状態でも編集可能で、活用変化表示入力欄の選択ボタン以外の選択ボタンが選択されている状態で、活用変化表示入力欄が編集されると、活用変化表示入力欄の選択ボタンが選択状態になる(それまで選択状態になっていた他の選択ボタンは非選択状態になる)ようにしてもよい。
【0052】
図7は、図6から活用変化表示入力欄を編集した直後の表示例である。過去形の活用変化表示入力欄を、「overwrited」から「overwrote」に修正すると、「+d(語尾にdを付与)」の選択が取り消され、不規則変化形を選択した状況に変更される。
【0053】
なお、図6及び図7は、図5のように原形の表層形と活用適用条件とが矛盾する選択肢を選択できないようにした場合の例である(もちろん、図4のような場合にも適用可能である)。
【0054】
(iii)図8は、上記の(ii)の場合とは逆に、既成の活用種類の選択ボタンを選択して、活用形を生成した場合には、活用変化表示入力欄の表示結果は編集できないようにしたものである。ここで、選択ボタンが表示されず斜体表示になっている部分は、編集ができないことを示す。三単現と現在分詞の活用を既成の選択肢から選択した結果、その活用変化結果がそれぞれ活用変化表示入力欄に表示されるとともに、活用変化表示入力欄を修正できなくなっている。この場合、ユーザが活用変化表示入力欄の選択ボタンを選択すると、活用変化表示入力欄の表示内容をクリアするようにしてもよい。なお、図8で、図5のように原形の表層形と活用適用条件とが矛盾する選択肢を選択できないようにしてもよい。
【0055】
なお、(ii)のモードと、(iii)のモードを両方備え、ユーザがいずれのモードを使用するかを設定可能にしてもよい。
【0056】
もちろん、上記した操作方法以外にも、ユーザの操作性を向上させる種々のバリエーションが可能である。
【0057】
図9に、本実施形態における処理の流れの一例を示す。
【0058】
ステップS501では、登録すべき語句(本具体例の場合、英単語)の原形の入力を受け付ける。
【0059】
ステップS502で、その内容を原形バッファ111に保存する。
【0060】
ステップS503では、活用種類の選択肢のデータ(例えば図4の選択ボタン)を初期化する。例えば、全ての選択肢が選択されていない状態にしてもよいし、あるいはそれぞれ代表的な活用変化(三人称単数現在形に関する活用種類では「語尾にsを付与」、現在分詞形に関する活用種類では「語尾にingを付与」、過去形・過去分詞形に関する活用種類では「語尾にedを付与」、など)を選択状態にしてもよい。
【0061】
ステップS504では、入力部1からの入力によって処理を分岐する。既成の活用種類の選択肢の選択が入力された場合には、ステップS511へ分岐し、新規活用変化の選択肢が入力された場合には、ステップS521へ分岐し、活用変化表示入力欄への入力・修正の場合には、ステップS531へ分岐し、登録ボタンのクリックの場合には、ステップS541へ分岐する。
【0062】
ステップS511では、原形バッファ111の内容と選択肢の選択結果とをもとに、活用変化モジュール113で活用変化処理を行う。ステップS512では、活用変化処理の結果を、活用変化形バッファ114に保存する。ステップS513では、活用変化形バッファ114の内容を、該当する活用変化表示入力欄に表示する。
【0063】
ステップS521では、活用変化形バッファ114の内容をクリアする。ステップS522では、活用変化表示入力欄の入力を受け付ける。ステップS523では、その文字列を活用変化形バッファ114に保存する。
【0064】
ステップS531では、入力された文字列を活用変化形バッファ114に保存する。ステップS532では、該当する活用変化選択肢の選択を、新規活用変化[*−x]に変更する。
【0065】
ステップS541では、その時点で設定されているデータを、辞書に登録して終了する。
【0066】
なお、これまでの説明では、規則変化形については、既成の活用種類の選択肢を設け、不規則変化形については、既成の活用種類の選択肢を設けない、という構成であったが、例えば、不規則変化形のうちで可能なものについて(例えば、原形と同じ形になる、など)についても、既成の活用種類の選択肢を設け、活用形を自動生成するようにしてもよい。
【0067】
なお、以上の各機能は、ソフトウェアとして実現可能である。
また、本実施形態は、コンピュータに所定の手段を実行させるための(あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるための)プログラムとして実施することもでき、該プログラムを記録したコンピュータ読取り可能な記録媒体として実施することもできる。
【0068】
なお、この発明の実施の形態で例示した構成は一例であって、それ以外の構成を排除する趣旨のものではなく、例示した構成の一部を他のもので置き換えたり、例示した構成の一部を省いたり、例示した構成に別の機能あるいは要素を付加したり、それらを組み合わせたりすることなどによって得られる別の構成も可能である。また、例示した構成と論理的に等価な別の構成、例示した構成と論理的に等価な部分を含む別の構成、例示した構成の要部と論理的に等価な別の構成なども可能である。また、例示した構成と同一もしくは類似の目的を達成する別の構成、例示した構成と同一もしくは類似の効果を奏する別の構成なども可能である。
また、この発明の実施の形態で例示した各種構成部分についての各種バリエーションは、適宜組み合わせて実施することが可能である。
また、この発明の実施の形態は、個別装置としての発明、関連を持つ2以上の装置についての発明、システム全体としての発明、個別装置内部の構成部分についての発明、またはそれらに対応する方法の発明等、種々の観点、段階、概念またはカテゴリに係る発明を包含・内在するものである。
従って、この発明の実施の形態に開示した内容からは、例示した構成に限定されることなく発明を抽出することができるものである。
【0069】
本発明は、上述した実施の形態に限定されるものではなく、その技術的範囲において種々変形して実施することができる。
【0070】
【発明の効果】
本発明によれば、活用種類を選択した場合の誤りを未然に防ぐことができ且つ柔軟な入力操作で効率的な登録作業を行うことができるようになる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る辞書登録装置の構成例を示す図
【図2】活用種類テーブルの構成例を示す図
【図3】操作例並びに制御例及び表示例について説明するための図
【図4】操作例並びに制御例及び表示例について説明するための図
【図5】操作例並びに制御例及び表示例について説明するための図
【図6】操作例並びに制御例及び表示例について説明するための図
【図7】操作例並びに制御例及び表示例について説明するための図
【図8】操作例並びに制御例及び表示例について説明するための図
【図9】同実施形態における辞書登録の処理手順の一例を示すフローチャート
【符号の説明】
1…入力部、3…登録処理部、5…出力部、7…辞書記憶部、31…活用情報設定部、311…原形バッファ、312…活用種類テーブル、313…活用変化モジュール、314…活用変化形バッファ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a natural language dictionary registration apparatus, a natural language dictionary registration method, and a program for registering data in a natural language dictionary.
[0002]
[Prior art]
In a dictionary registration apparatus in natural language processing such as a machine translation system or spell check, generally, the following two methods are used in combination as methods for specifying the utilization type of a utilization word (for example, Patent Document 1). reference).
[0003]
(1) A method of selecting a utilization type from options for designation of a word that changes rule (2) A method of directly inputting a utilization form for designation of a word that changes irregularly Since incorrect usage words may be registered due to errors, etc., conventionally, in the method (1), a usage format to be registered is generated from the input word and the selected usage type. Later, the generated usage form is displayed so that the registrant can confirm it.
[0004]
However, when a registrant notices an error, if the registrant is a word that changes the rule in another usage type, the method of (1) must be redone to select the correct usage type. If the word is a rule-changing word, the only way to use it is to manually enter the usage form using the method (2).
[0005]
[Patent Document 1]
Japanese Unexamined Patent Publication No. 3-108062
[Problems to be solved by the invention]
In the conventional dictionary registration device, there is no word input type input interface that can prevent a mistake in complicated registration work and can perform registration efficiently by a flexible input operation.
[0007]
The present invention has been made in consideration of the above circumstances, and it is possible to prevent an error when selecting a utilization type, and to perform an efficient registration operation with a flexible input operation. An object of the present invention is to provide a language dictionary registration device, a natural language dictionary registration method, and a program.
[0008]
[Means for Solving the Problems]
The present invention provides a natural language processing dictionary registration apparatus for registering utilization information of words / phrases in a natural language processing dictionary for processing a specific language. A first input means for inputting an original form; a second input means for inputting a selection instruction of a type of an existing utilization change or a direct input selection instruction for the utilization form for the original form; and the second Generating means for generating a predetermined utilization form for the original form on the basis of the original form and the type of utilization change when an instruction for selecting any of the utilization change types is input by the input means; Display means for displaying the utilization form generated by the means in a predetermined area of a display screen, and editing means for editing the utilization form displayed by the display means. To.
[0009]
Further, the present invention provides a natural language processing dictionary registration method of a natural language processing dictionary registration device for registering utilization information of words / phrases in a natural language processing dictionary for processing a specific language. In the first input step for inputting the original form of the word to be registered, and for inputting the selection instruction of the existing utilization change type or the direct input selection instruction for the utilization form for the original form When a selection instruction for one of the utilization change types is input in the second input step and the second input step, a predetermined utilization for the original shape is made based on the original shape and the utilization change type. A generation step for generating a shape, a display step for displaying the utilization shape generated in the generation step in a predetermined area of a display screen, and the display step. And having a editing step for editing the indicated the inflected forms.
[0010]
Further, the present invention is a program for causing a computer to function as a natural language processing dictionary registration device, and for the natural language processing dictionary for processing a specific language, utilization information of phrases of the language is provided. In the natural language processing dictionary registration device for registration, a first input function for inputting the original form of the word to be registered, and an instruction for selecting an existing utilization change type for the utilization form for the original form Alternatively, when the second input function for inputting a direct input selection instruction and the selection instruction of any of the utilization change types are input by the second input function, the original shape and the utilization change A generation function for generating a predetermined utilization form for the original form based on the type, and a display for displaying the utilization form generated by the generation function in a predetermined area of a display screen Ability and is a program for realizing the editing for editing the inflections displayed on the computer by the display function.
[0011]
The present invention relating to the apparatus is also established as an invention relating to a method, and the present invention relating to a method is also established as an invention relating to an apparatus.
Further, the present invention relating to an apparatus or a method has a function for causing a computer to execute a procedure corresponding to the invention (or for causing a computer to function as a means corresponding to the invention, or for a computer to have a function corresponding to the invention. It is also established as a program (for realizing) and also as a computer-readable recording medium on which the program is recorded.
[0012]
According to the present invention, it is possible to prevent an error when the utilization type is selected, and to perform an efficient registration operation with a flexible input operation.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the invention will be described with reference to the drawings.
[0014]
FIG. 1 shows a configuration example of a dictionary registration apparatus according to an embodiment of the present invention.
[0015]
As shown in FIG. 1, the dictionary registration apparatus according to the present embodiment includes an input unit 1 for inputting data and instructions related to dictionary registration, a registration processing unit 3 for performing dictionary registration processing, and data about dictionary registration. And an output unit 5 for outputting instruction acceptance contents and the like, and a dictionary storage unit 7 for storing a dictionary. Further, the registration processing unit 3 includes a utilization information setting unit 31, and the utilization information setting unit 31 of the registration processing unit 3 further includes an original form buffer 311, a utilization type table 312, a utilization change module 313, and a utilization change form buffer 314. Including.
[0016]
Here, the dictionary stored in the dictionary storage unit 7 is a natural language processing dictionary. In the present embodiment, it is assumed that natural language processing registers utilization information.
[0017]
For example, when the natural language processing is machine translation processing, the natural language processing dictionary is a machine translation dictionary. In this case, the dictionary for machine translation includes, for example, information such as a first language word (headword) and its part of speech as a source word, and a second language word (translation) as a translated word and its part of speech. Information is registered.
[0018]
For example, when the natural language process is a spell check process, the natural language process dictionary is a spell check dictionary. In this case, for example, information such as a phrase in a certain language and its part of speech is registered in the spell check dictionary.
[0019]
Of course, there are various kinds of natural language processing and its dictionaries in addition to the above, and this embodiment can be applied to any natural language processing dictionary that registers utilization information. .
[0020]
In the registration processing unit 3 in FIG. 1, a setting processing unit for performing dictionary registration for items other than the utilization type is omitted. Further, any setting processing unit for registering a dictionary of items other than the utilization type can be used (a conventional means may be used). Also, in the following description, description of dictionary registration of items other than the usage type is omitted, and only the usage type dictionary registration is described.
[0021]
Here, for example, when the natural language processing deals with a plurality of languages such as machine translation processing, the utilization type registration method of the present embodiment to be described below is applied to both the first language and the second language. When applying, the utilization information setting unit 31 has a first language part and a second language part, or the registration processing unit 3 uses the first language utilization information setting part and the second language part. What is necessary is just to provide the utilization information setting part for languages. However, the utilization type registration method of the present embodiment can be applied to only some of the languages. In this case, the conventional utilization type registration method may be applied to other languages. In the following, description will be given of registration processing of a phrase utilization form related to English, taking English as an example of one language, but basically the same applies to other languages. In the following description, the case of setting the utilization form of the first language entry word of the machine translation dictionary will be described as an example. However, the case of setting the utilization form of the second language translation word of the machine translation dictionary, This is basically the same for other various settings, such as setting the utilization form of the target language in the check dictionary.
[0022]
Now, in the following, a detailed description will be given of the configuration and operation related to the process from inputting a utilization form to be registered in the dictionary to selecting and displaying information.
[0023]
In the case of this example, the dictionary stored in the dictionary storage unit 7 is a machine translation dictionary.
[0024]
In this specific example, the input unit 1 is used for inputting a headword or an instruction in the first language. For example, a keyboard, a voice input device, a mouse, or the like can be used.
[0025]
The registration processing unit 3 is for performing dictionary registration processing (registration processing for the machine translation dictionary in the case of this example), and the utilization information setting unit 31 uses words (books) input from the input unit 1. In the case of a specific example, utilization information is set for a headword of the first language).
[0026]
The original form buffer 311 of the utilization information setting unit 31 is a buffer that stores the original form input from the input unit 1.
[0027]
The utilization type table 312 is a table that summarizes the utilization types of utilization words.
[0028]
The utilization change module 313 is selected from the utilization type table 312 (input from the input unit 1) for the language (in this example, the first language entry word) held in the original buffer 311. Utilization changes depending on the value.
[0029]
The utilization variation buffer 314 is a buffer for storing the utilization variation generated by the utilization variation module 313 and providing it to the output unit 5.
[0030]
The display unit 5 outputs the contents of the original buffer 111, the options of the utilization type table 112, and the contents of the utilization variation buffer 114. For example, it can be configured using a display device, an audio output device, or the like.
[0031]
FIG. 2 shows a configuration example of the utilization type table 112. Here, the usage types of English verbs are shown as examples.
[0032]
The first row ([a] stage) of the utilization type table in FIG. 2 is a utilization type related to the third person singular present tense, [a-1] “add s to the end”, [a-2] “es at the end”. It shows that three types of “granting” and [a-3] “replace y at the end with ies” are prepared as options for the existing utilization types. “*” In the rightmost column indicates that [a−x] new utilization variation (irregular variation) can be input in addition to the existing utilization types. Note that the option [a-3] has a utilization application condition “original ending is y”.
[0033]
The second line (stage [b]) is a utilization type related to the present participle form, [b-1] “giving ending to ending”, [b-2] “replace ending e with ing”, [ b-3] “replace ee at the end of the word with ying” and [b-4] “repeat consonant at the end of the word to give ing” are prepared as options for the existing utilization types. “*” In the rightmost column indicates that [bx] new utilization variation (irregular variation) can be input in addition to the existing utilization types. The option [b-2] has a usage application condition of “original ending is e”, and the option [b-3] has a usage application condition of “original ending is ie”. Each has a usage application condition of “original ending is a consonant”.
[0034]
The third line ([c] stage) and the fourth line ([d] stage) are types of utilization related to the past tense and past participle form, [c-1] [d-1] “add ed to the end of the word” ", [C-2] [d-2]" Append d to end ", [c-3] [d-3]" Replace y at end with ied ", [c-4] [d-4] It shows that four types of “repeated consonant at the end of the word to give ed” are prepared as options for the existing utilization types. The “*” in the rightmost column indicates that [c−x] [d−x] new utilization variation forms (irregular variation forms) can be input in addition to the existing utilization types. It should be noted that the option [c-3] [d-3] has a utilization application condition “original form ending is y”, and the choice [c-4] [d-4] has “original form ending is a consonant”. Utilization application conditions are given respectively.
[0035]
In the present embodiment, the following two types are assumed as modes for registering utilization information of first language headwords when a first language headword is registered in the dictionary.
(1) The user inputs the language of the phrase to be registered, and selects and inputs a corresponding type from the choices of the existing usage change types. The system generates and displays a utilization change result. The user can not only confirm the displayed utilization change result but also edit the displayed utilization change result. When the user gives a registration instruction, the system registers the utilization change result held at that time in the dictionary.
(2) The user directly inputs the utilization variation form. When the user gives a registration instruction, the system registers the utilization form held at that time in the dictionary.
[0036]
FIG. 3 shows a display example of the initial state of the dictionary registration screen of the present embodiment. Here again, an example of registering an English verb is shown.
[0037]
In the example of FIG. 3, the upper left column is a headword input column. In this example, the verb verb can be entered.
[0038]
The upper right button is a registration button. Clicking the registration button gives an instruction to register the currently displayed data in the dictionary.
[0039]
In the second and subsequent levels, a choice field for selecting a desired existing utilization type (in the example of FIG. 3, third person singular present tense (three unit present), present participle, past tense, past participle) or direct character input ( ○ in the figure is a selection button), and a utilization change display input field (the rightmost blank) that doubles as an actual utilization change result display field and an input field.
[0040]
The selection button is selected when pressed in a non-selected state, and is selected when pressed in a selected state.
[0041]
FIG. 4 shows an example of registering an English verb “overwrite” in the dictionary registration apparatus shown in FIG.
[0042]
In the example of FIG. 3, enter “overwrite” in the headword entry field at the top, “send to ending” to use third person singular present tense, “replace e to ing to use current participle form” As a result of the selection (the corresponding selection button is pressed), utilization change results “overwrites” and “overwriting” corresponding to the selection are generated and displayed in the utilization change display input field.
[0043]
On the other hand, since the past tense and past participle forms are irregularly changed, direct input is selected, and “overwrote” and “overwriteten” are directly input in the utilization change display input field.
[0044]
Note that the selection button is a black circle, indicating that it has actually been selected.
[0045]
Here, after confirming that each data being displayed in each input column is correct, each data is registered when the registration button is clicked.
[0046]
The above is the basic operation.
[0047]
In the following, functions that are preferably provided will be described. The functions described below may have all or some of them as appropriate.
[0048]
(I) FIG. 5 shows the same contents as the example of FIG. 4, but is an example in which the original surface layer form and the utilization application conditions are collated so that options that conflict with each other cannot be selected. A portion corresponding to the selection button of the choice is not a circle but a cross means that it cannot be selected. Instead of displaying x, other methods may be used, for example, not displaying the selection button, or indicating that the selection button is semi-transparent and cannot be selected.
[0049]
Here, since the headword original form is “overwrite”, the third person singular current form utilization type option [a-3] “replacement y is replaced with ies”, the present participle form utilization type option [b-3] “end of word ie replace y with ying ”, [b-4]“ repeat consonant at the end of the word to give ing ”, past tense / past participle type choice [c-3]“ replace y at the end with ied ”, [C-4] “Condition of ending consonant characters and assigning ed” is incompatible with the application condition and the original form, so that they cannot be selected.
[0050]
(Ii) FIG. 6 shows an example in which selection of “past tense” is wrong in the same situation as FIG. Since “+ d (add d at the end of the word)” is selected as the past tense utilization type, the utilization change display input field is “overwritten”.
[0051]
Here, the utilization change display input field can be edited. For example, editing is not possible when the selection button for the utilization change display input field (direct character input selection button) is not selected, and editing is possible when the selection button for the utilization change display input field is selected (that is, Other selection buttons that have been in the selected state may be in a non-selected state) or can be edited even if the selection button in the utilization change display input field is not selected. When a selection button other than the selection button is selected, if the utilization change display input field is edited, the selection button in the utilization change display input field becomes the selected state (other selections that were in the selected state until then). The button may be in a non-selected state).
[0052]
FIG. 7 is a display example immediately after editing the utilization change display input field from FIG. When the past form utilization change display input field is corrected from “overwritten” to “overwrote”, the selection of “+ d (add d at the end of the word)” is canceled and changed to the situation in which the irregular change form is selected.
[0053]
FIGS. 6 and 7 are examples in the case where it is not possible to select an option in which the original surface layer form and the utilization application conditions contradict each other as shown in FIG. Is possible).
[0054]
(Iii) Contrary to the case of (ii) above, Fig. 8 shows that when the existing utilization type selection button is selected and the utilization form is generated, the display result of the utilization change display input field is edited. It is something that can not be done. Here, the selection button is not displayed and the italicized part indicates that editing cannot be performed. As a result of selecting the usage of the current simple participle and the present participle from the existing options, the utilization change result is displayed in the utilization change display input field, and the utilization change display input field cannot be modified. In this case, when the user selects the selection button of the utilization change display input field, the display content of the utilization change display input field may be cleared. In FIG. 8, as shown in FIG. 5, it may not be possible to select an option in which the original surface layer form and the utilization application condition contradict each other.
[0055]
Note that both the mode (ii) and the mode (iii) may be provided so that the user can set which mode to use.
[0056]
Of course, in addition to the above-described operation methods, various variations that improve user operability are possible.
[0057]
FIG. 9 shows an example of the flow of processing in this embodiment.
[0058]
In step S501, an input of the original form of a word to be registered (in this example, an English word) is accepted.
[0059]
In step S502, the contents are stored in the original buffer 111.
[0060]
In step S503, utilization type option data (for example, the selection button in FIG. 4) is initialized. For example, all the options may not be selected, or representative usage changes (“send is added to the ending” for the usage type related to the third person singular present tense, “ In the usage type related to the past tense and the past participle, “add ed to the ending”, etc.) may be selected.
[0061]
In step S504, the process branches depending on the input from the input unit 1. If selection of an existing utilization type option is input, the process branches to step S511. If a new utilization change option is input, the process branches to step S521, and the input / input to the utilization change display input field is entered. If it is corrected, the process branches to step S531, and if the registration button is clicked, the process branches to step S541.
[0062]
In step S511, the utilization change module 113 performs utilization change processing based on the contents of the original buffer 111 and the selection results of the options. In step S512, the result of utilization change processing is stored in the utilization change buffer 114. In step S513, the contents of the utilization variation buffer 114 are displayed in the corresponding utilization variation display input field.
[0063]
In step S521, the contents of the utilization variation buffer 114 are cleared. In step S522, an input in the utilization change display input field is accepted. In step S523, the character string is stored in the utilization variation buffer 114.
[0064]
In step S531, the input character string is stored in the utilization variation buffer 114. In step S532, the selection of the corresponding utilization change option is changed to a new utilization change [* -x].
[0065]
In step S541, the data set at that time is registered in the dictionary and the process ends.
[0066]
In the description so far, the configuration has been such that the option of the existing utilization type is provided for the rule variation form, and the option of the existing utilization type is not provided for the irregular variation form. Regarding the possible rule change forms (for example, the same form as the original form, etc.), a choice of an existing utilization type may be provided and the utilization form may be automatically generated.
[0067]
Each function described above can be realized as software.
The present embodiment can also be implemented as a program for causing a computer to execute predetermined means (or for causing a computer to function as predetermined means, or for causing a computer to realize predetermined functions), The present invention can also be implemented as a computer-readable recording medium on which the program is recorded.
[0068]
Note that the configuration illustrated in the embodiment of the present invention is an example, and is not intended to exclude other configurations, and a part of the illustrated configuration may be replaced with another or one of the illustrated configurations. Other configurations obtained by omitting a part, adding another function or element to the illustrated configuration, or combining them are also possible. Also, another configuration that is logically equivalent to the exemplified configuration, another configuration that includes a portion that is logically equivalent to the exemplified configuration, another configuration that is logically equivalent to the main part of the illustrated configuration, and the like are possible. is there. Further, another configuration that achieves the same or similar purpose as the illustrated configuration, another configuration that provides the same or similar effect as the illustrated configuration, and the like are possible.
In addition, various variations of various components illustrated in the embodiment of the present invention can be implemented in appropriate combination.
Further, the embodiment of the present invention is an invention of an invention as an individual device, an invention of two or more related devices, an invention of the entire system, an invention of components within an individual device, or a method corresponding thereto. The invention includes inventions according to various viewpoints, stages, concepts, or categories.
Therefore, the present invention can be extracted from the contents disclosed in the embodiments of the present invention without being limited to the exemplified configuration.
[0069]
The present invention is not limited to the embodiment described above, and can be implemented with various modifications within the technical scope thereof.
[0070]
【The invention's effect】
According to the present invention, it is possible to prevent an error when the utilization type is selected, and to perform an efficient registration operation with a flexible input operation.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration example of a dictionary registration apparatus according to an embodiment of the present invention. FIG. 2 is a diagram showing a configuration example of a utilization type table. FIG. 3 is for explaining an operation example, a control example, and a display example. Fig. 4 is a diagram for explaining an operation example, a control example, and a display example. Fig. 5 is a diagram for explaining an operation example, a control example, and a display example. Fig. 6 is an operation example, a control example, and a display example. FIG. 7 is a diagram for explaining an operation example, a control example, and a display example. FIG. 8 is a diagram for explaining an operation example, a control example, and a display example. Flowchart showing an example of dictionary registration processing procedure [Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ... Input part, 3 ... Registration process part, 5 ... Output part, 7 ... Dictionary memory | storage part, 31 ... Utilization information setting part, 311 ... Original form buffer, 312 ... Utilization type table, 313 ... Utilization change module, 314 ... Utilization change Shape buffer

Claims (16)

特定の言語を処理するための自然言語処理用辞書に対して、該言語の語句の活用情報を登録するための自然言語処理用辞書登録装置において、
登録すべき前記語句について、その原形を入力するための第1の入力手段と、
前記原形に対する活用形について、既成の活用変化の種類の選択指示又は直接入力の選択指示を入力するための第2の入力手段と、
前記第2の入力手段によりいずれかの前記活用変化の種類の選択指示が入力された場合に、前記原形と前記活用変化の種類に基づいて、前記原形に対する所定の活用形を生成する生成手段と、
前記生成手段により生成された前記活用形を表示画面の所定の領域に表示するための表示手段と、
前記表示手段により表示された前記活用形を編集するための編集手段とを備えたことを特徴とする自然言語処理用辞書登録装置。
In a natural language processing dictionary registration device for registering utilization information of words / phrases in a natural language processing dictionary for processing a specific language,
A first input means for inputting the original form of the word to be registered;
A second input means for inputting a selection instruction of a type of an existing utilization change or a direct input selection instruction for the utilization form for the original form;
Generating means for generating a predetermined utilization form for the original form based on the original form and the kind of utilization change when an instruction to select any of the utilization change types is input by the second input means; ,
Display means for displaying the utilization form generated by the generation means in a predetermined area of a display screen;
A natural language processing dictionary registration apparatus comprising: editing means for editing the utilization form displayed by the display means.
前記第2の入力手段により前記直接入力の選択指示が入力された場合に、前記原形に対する活用形を直接入力するための第3の入力手段を更に備えたことを特徴とする請求項1に記載の自然言語処理用辞書登録装置。2. The apparatus according to claim 1, further comprising third input means for directly inputting a utilization form for the original form when the direct input selection instruction is input by the second input means. Dictionary device for natural language processing. 前記活用形を表示する前記表示画面の所定の領域と、前記原形に対する活用形を直接入力するための表示画面の領域とを、前記表示画面の同一の領域とすることを特徴とする請求項2に記載の自然言語処理用辞書登録装置。The predetermined area of the display screen for displaying the utilization form and the area of the display screen for directly inputting the utilization form for the original form are the same area of the display screen. The dictionary registration device for natural language processing described in 1. 前記編集手段は、前記活用形が前記表示画面の所定の領域に表示された後に、該活用形を編集すべき旨の指示が入力された場合に、該活用形を編集可能とすることを特徴とする請求項1ないし3のいずれか1項に記載の自然言語処理用辞書登録装置。The editing means can edit the utilization form when an instruction to edit the utilization form is input after the utilization form is displayed in a predetermined area of the display screen. The dictionary registration device for natural language processing according to any one of claims 1 to 3. 前記編集手段は、前記活用形が前記表示画面の所定の領域に表示された後に、該活用形が編集された場合に、該活用形を編集すべき旨の指示が入力されたものとして扱うことを特徴とする請求項1ないし3のいずれか1項に記載の自然言語処理用辞書登録装置。The editing means treats, as the utilization form is edited after the utilization form is displayed in a predetermined area of the display screen, an instruction to edit the utilization form is input. The dictionary registration device for natural language processing according to any one of claims 1 to 3. 前記活用形を編集すべき旨の指示として、前記第2の入力手段による前記直接入力の選択指示を用いることを特徴とする請求項4または5に記載の自然言語処理用辞書登録装置。6. The natural language processing dictionary registration apparatus according to claim 4, wherein the direct input selection instruction by the second input means is used as an instruction to edit the utilization form. 前記第1の入力手段により入力された際に、該原形につき前記活用変化の種類のうちに取り得ないものがある場合には、該取り得ない活用変化の種類については、前記第2の入力手段により選択できない状態にすることを特徴とする請求項1ないし6のいずれか1項に記載の自然言語処理用辞書登録装置。If there is an irretrievable type of utilization change for the original form when input by the first input means, the second input means may determine the type of utilization change that cannot be obtained. The dictionary registration device for natural language processing according to any one of claims 1 to 6, wherein the dictionary registration device is in a state where it cannot be selected. 前記第1の入力手段により入力された前記原形につき前記取り得ない活用変化の種類を前記第2の入力手段により選択できない状態にする場合には、当該選択できない状態になっている活用変化の種類について、それが選択できない状態になっている旨を所定の方法でユーザに通知することを特徴とする請求項7に記載の自然言語処理用辞書登録装置。When the type of utilization change that cannot be taken for the original form inputted by the first input means is made in a state that cannot be selected by the second input means, the kind of utilization change that is in a state that cannot be selected. The dictionary registration device for natural language processing according to claim 7, wherein the user is notified by a predetermined method that it cannot be selected. 前記第2の入力手段は、前記表示画面の所定の領域に表示した選択ボタンを用いて、前記活用変化の種類の選択指示又は前記直接入力の選択指示を入力することを特徴とする請求項1ないし8のいずれか1項に記載の自然言語処理用辞書登録装置。The second input means inputs a selection instruction for the type of utilization change or a selection instruction for the direct input, using a selection button displayed in a predetermined area of the display screen. 9. The dictionary registration device for natural language processing according to any one of items 8 to 8. 前記選択ボタンのうち、選択されているものについては、選択されている状態に対応する形態で表示し、選択されていないものについては、選択されていない状態に対応する形態で表示することを特徴とする請求項9に記載の自然言語処理用辞書登録装置。Among the selection buttons, a selected button is displayed in a form corresponding to a selected state, and a non-selected button is displayed in a form corresponding to a non-selected state. The dictionary registration device for natural language processing according to claim 9. 前記編集手段は、前記生成手段により生成され前記表示手段により表示された前記活用形を編集可能とする第1のモードと、編集不可とする第2のモードとを有し、該第1及び第2のモードのうちユーザにより指示されたモードを使用することを特徴とする請求項1ないし10のいずれか1項に記載の自然言語処理用辞書登録装置。The editing means has a first mode in which the utilization form generated by the generating means and displayed by the display means can be edited, and a second mode in which editing is not possible. The dictionary registration device for natural language processing according to any one of claims 1 to 10, wherein a mode designated by a user is used out of the two modes. 入力、生成又は編集された前記活用形を前記自然言語処理用辞書に登録すべき旨の指示を入力するための第4の入力手段を更に備えたことをるための編集手段とを備えたことを特徴とする請求項1ないし11のいずれか1項に記載の自然言語処理用辞書登録装置。Editing means for further comprising a fourth input means for inputting an instruction to register the utilization form input, generated or edited in the natural language processing dictionary The dictionary registration device for natural language processing according to any one of claims 1 to 11, wherein: 前記自然言語処理は、機械翻訳処理であり、
前記自然言語処理用辞書は、機械翻訳用辞書であり、
前記活用形の登録は、前記機械翻訳処理における第1の言語の見出し語と第2の言語の訳語のいずれか一方又は双方について行うことを特徴とする請求項1ないし12のいずれか1項に記載の自然言語処理用辞書登録装置。
The natural language processing is machine translation processing,
The natural language processing dictionary is a machine translation dictionary;
The registration of the utilization form is performed for one or both of a headword of the first language and a translation of the second language in the machine translation process. The dictionary registration device for natural language processing described.
前記自然言語処理は、スペルチェックであり、
前記自然言語処理用辞書は、スペルチェック用辞書であり、
前記活用形の登録は、前記スペルチェック処理で対象とする言語の語句について行うことを特徴とする請求項1ないし12のいずれか1項に記載の自然言語処理用辞書登録装置。
The natural language processing is a spell check,
The natural language processing dictionary is a spell check dictionary;
The natural language processing dictionary registration device according to any one of claims 1 to 12, wherein the utilization form registration is performed for a word / phrase of a target language in the spell check process.
特定の言語を処理するための自然言語処理用辞書に対して、該言語の語句の活用情報を登録するための自然言語処理用辞書登録装置の自然言語処理用辞書登録方法において、
登録すべき前記語句について、その原形を入力するための第1の入力ステップと、
前記原形に対する活用形について、既成の活用変化の種類の選択指示又は直接入力の選択指示を入力するための第2の入力ステップと、
前記第2の入力ステップによりいずれかの前記活用変化の種類の選択指示が入力された場合に、前記原形と前記活用変化の種類に基づいて、前記原形に対する所定の活用形を生成する生成ステップと、
前記生成ステップにより生成された前記活用形を表示画面の所定の領域に表示するための表示ステップと、
前記表示ステップにより表示された前記活用形を編集するための編集ステップとを有することを特徴とする自然言語処理用辞書登録方法。
In the natural language processing dictionary registration method of the natural language processing dictionary registration device for registering the utilization information of the phrase of the language with respect to the natural language processing dictionary for processing a specific language,
A first input step for inputting the original form of the word to be registered;
A second input step for inputting a selection instruction of a type of an existing utilization change or a direct input selection instruction for the utilization form for the original form;
A generation step of generating a predetermined utilization form for the original form based on the original form and the kind of utilization change when an instruction to select any of the utilization change types is input in the second input step; ,
A display step for displaying the utilization form generated by the generation step in a predetermined area of a display screen;
A dictionary registration method for natural language processing, comprising: an editing step for editing the utilization form displayed in the display step.
コンピュータを自然言語処理用辞書登録装置として機能させるためのプログラムであって、
特定の言語を処理するための自然言語処理用辞書に対して、該言語の語句の活用情報を登録するための自然言語処理用辞書登録装置において、
登録すべき前記語句について、その原形を入力するための第1の入力機能と、
前記原形に対する活用形について、既成の活用変化の種類の選択指示又は直接入力の選択指示を入力するための第2の入力機能と、
前記第2の入力機能によりいずれかの前記活用変化の種類の選択指示が入力された場合に、前記原形と前記活用変化の種類に基づいて、前記原形に対する所定の活用形を生成する生成機能と、
前記生成機能により生成された前記活用形を表示画面の所定の領域に表示するための表示機能と、
前記表示機能により表示された前記活用形を編集するための編集機能とをコンピュータに実現させるためのプログラム。
A program for causing a computer to function as a natural language processing dictionary registration device,
In a natural language processing dictionary registration apparatus for registering utilization information of words / phrases of a language for a natural language processing dictionary for processing a specific language,
A first input function for inputting the original form of the word to be registered;
A second input function for inputting a selection instruction for a type of an existing utilization change or a direct input selection instruction for the utilization form for the original form;
A generation function for generating a predetermined utilization form for the original form based on the original form and the kind of utilization change when an instruction for selecting any of the utilization change types is input by the second input function; ,
A display function for displaying the utilization form generated by the generation function in a predetermined area of a display screen;
A program for causing a computer to realize an editing function for editing the utilization form displayed by the display function.
JP2002378448A 2002-12-26 2002-12-26 Natural language processing dictionary registration device, natural language processing dictionary registration method and program Expired - Fee Related JP3892806B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002378448A JP3892806B2 (en) 2002-12-26 2002-12-26 Natural language processing dictionary registration device, natural language processing dictionary registration method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002378448A JP3892806B2 (en) 2002-12-26 2002-12-26 Natural language processing dictionary registration device, natural language processing dictionary registration method and program

Publications (2)

Publication Number Publication Date
JP2004213083A true JP2004213083A (en) 2004-07-29
JP3892806B2 JP3892806B2 (en) 2007-03-14

Family

ID=32815298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002378448A Expired - Fee Related JP3892806B2 (en) 2002-12-26 2002-12-26 Natural language processing dictionary registration device, natural language processing dictionary registration method and program

Country Status (1)

Country Link
JP (1) JP3892806B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123577A (en) * 2010-12-07 2012-06-28 Canon Marketing Japan Inc Information processor, information processing method and program
JP2012123576A (en) * 2010-12-07 2012-06-28 Canon Marketing Japan Inc Information processor, information processing method and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123577A (en) * 2010-12-07 2012-06-28 Canon Marketing Japan Inc Information processor, information processing method and program
JP2012123576A (en) * 2010-12-07 2012-06-28 Canon Marketing Japan Inc Information processor, information processing method and program

Also Published As

Publication number Publication date
JP3892806B2 (en) 2007-03-14

Similar Documents

Publication Publication Date Title
US7143350B2 (en) Method and system for character sequence checking according to a selected language
US6631501B1 (en) Method and system for automatic type and replace of characters in a sequence of characters
WO2006055686A9 (en) Global localization and customization system and process
JPH05151260A (en) Method and system for learning translation templet
ITUD20000228A1 (en) SYSTEM AND METHOD OF AUTOMATIC OR SEMI-AUTOMATIC TRANSLATION WITH POSTEDITATION FOR THE CORRECTION OF ERRORS
CA2360067A1 (en) Any-to-any component computing system
JPH08161339A (en) Character string conversion device
JP3892806B2 (en) Natural language processing dictionary registration device, natural language processing dictionary registration method and program
JP2003316775A (en) Specification preparation support device
JP4350566B2 (en) Machine translation system
JP2003178087A (en) Retrieval device and method for electronic foreign language dictionary
JP3569753B2 (en) Dictionary machine for machine translation
JP2004326461A (en) Apparatus and method for recognizing proper name
JPH08287072A (en) Machine translation system
JP2737160B2 (en) Sentence processing equipment
JP2008204446A (en) Source file editing system
JP2001075962A (en) Electronic dictionary and recording medium recording electronic dictionary program
JP3340124B2 (en) Kana-Kanji conversion device
JP2006107261A (en) Translation support system
JP2006268621A (en) Machine translation program and machine translation device
JP2005309832A (en) Automatic translation device and program
JPH0844745A (en) Machine translation device
JP2001337950A (en) Method and device for displaying paginal translation and storage medium storing displaying program for it
JP2004046669A (en) Device and method for registering natural language pattern, device for processing natural language pattern, and recording medium
JP2005309533A (en) Document editing device, document vision method, and program therefor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061207

R151 Written notification of patent or utility model registration

Ref document number: 3892806

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091215

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101215

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101215

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111215

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121215

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131215

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees