JPH10260984A - 辞書管理方法および辞書管理装置および辞書利用システム - Google Patents

辞書管理方法および辞書管理装置および辞書利用システム

Info

Publication number
JPH10260984A
JPH10260984A JP9066874A JP6687497A JPH10260984A JP H10260984 A JPH10260984 A JP H10260984A JP 9066874 A JP9066874 A JP 9066874A JP 6687497 A JP6687497 A JP 6687497A JP H10260984 A JPH10260984 A JP H10260984A
Authority
JP
Japan
Prior art keywords
dictionary
registered
candidate
words
document data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9066874A
Other languages
English (en)
Inventor
Hideki Hirakawa
秀樹 平川
Hiroyasu Nogami
宏康 野上
Yoshimi Saito
佳美 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP9066874A priority Critical patent/JPH10260984A/ja
Publication of JPH10260984A publication Critical patent/JPH10260984A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】かな漢字変換や機械翻訳などの言語知識辞書の
構築支援が容易に行える辞書管理装置およびそれを用い
て自然言語処理の効率化が図れる辞書利用システムを提
供する。 【解決手段】ユーザにより、辞書登録候補語の抽出対象
となる既存および非既存の文書データを同定する情報が
指定されると、対象文書検出部201にて、この指定さ
れた情報を基に文書データを検出し、候補抽出部202
にて、この検出された文書データから辞書登録候補語を
抽出し、候補提示・登録部204にて、この抽出された
辞書登録候補語のうち予め指定された条件に基づき選択
された語、あるいは、抽出された辞書登録候補語を提示
して、これに対しユーザにより選択された語を辞書20
5に登録する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば、かな漢字
変換や機械翻訳など、言語知識辞書を利用して所定の自
然言語処理を行う辞書利用システムおよび辞書の構築支
援を行う辞書管理装置に関する。
【0002】
【従来の技術】最近、計算機への日本語の入力を行うI
ME(Input Method Editor)や、
文書を翻訳する機械翻訳システムなどが広く利用される
ようになってきている。この種のソフトウェアは、種々
の言語情報を含む辞書を利用している。ユーザは、その
ユーザの辞書に、固有の単語を入れることにより、例え
ば、かな漢字変換の変換精度を向上させることができ
る。
【0003】しかし、この辞書への用語の登録は、人手
で行うには煩雑であり、これを簡略化するために、文書
入力時にユーザからのキー入力や選択処理の情報によ
り、自動的に辞書項目を登録する方式や、既存の文書を
指定して、その既存の文書を解析することにより、辞書
データを抽出するという方式が考案されてきた。
【0004】
【発明が解決しようとする課題】ユーザの変換候補の選
択など、ユーザからの入力より辞書を作成するという方
式では、辞書の学習対象がユーザの入力文書のみである
という点から、学習の範囲が制約されるという問題があ
る。また、既存の文書を指定して、その文書より辞書デ
ータを学習するという方式では、この問題を解決できる
が、文書をいちいち指定する必要があるため、文書入力
を行う際に、必ずしも必要な文書に対してデータの抽出
が終了しているというわけでない。このように、従来の
技術では、必要なデータを必要となる時までに用意する
ためのワク組みがない。
【0005】本発明は、このような辞書登録管理システ
ムの課題を解決するためになされたもので、その目的
は、非既存のデータを指定し、データを取得時に辞書デ
ータの抽出処理を行っておき、また、登録すべきデータ
とそうでないデータをそれとなく提示・選択することに
より、簡便に辞書データを登録・管理する(辞書の構築
支援)環境を提供する辞書管理装置を提供することにあ
る。
【0006】また、文書ブラウザなど、ネットワーク上
のサイトやページを訪れたりする場合には、このサイト
より、言語処理に役立つ情報を入手・利用することによ
り、サイトに応じた処理のカスタマイズ化が可能な自然
言語処理装置を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明の辞書管理方法
は、自然言語処理に用いられる辞書の登録語を管理する
辞書管理方法において、予め指定された前記辞書への登
録候補語の抽出対象となる既存および非既存の文書デー
タを同定する情報を基に文書データを検出し、この検出
された文書データから前記登録候補語を抽出し、この抽
出された登録候補語と予め指定された条件に基づき前記
辞書の登録語を更新することにより、辞書構築支援が容
易に行え、自然言語処理の効率化が図れる。
【0008】また、本発明の辞書管理方法は、自然言語
処理に用いられる辞書の登録語を管理する辞書管理方法
において、予め指定された前記辞書への登録候補語の抽
出対象となる既存および非既存の文書データを同定する
情報を基に文書データを検出し、この検出された文書デ
ータから前記登録候補語を抽出し、この抽出された登録
候補語を提示して、この提示された登録候補語に対する
ユーザによる選択結果に応じて前記辞書の登録語を更新
することにより、辞書構築支援が容易に行え、自然言語
処理の効率化が図れる。
【0009】本発明の辞書管理装置は、自然言語処理に
用いられる辞書の登録語を管理する辞書管理装置におい
て、前記辞書への登録候補語の抽出対象となる既存およ
び非既存の文書データを同定する情報を指定する指定手
段と、この指定手段で指定された情報を基に文書データ
を検出する検出手段と、この検出手段で検出された文書
データから前記登録候補語を抽出する抽出手段と、この
抽出手段で抽出された登録候補語と予め指定された条件
に基づき前記辞書の登録語を更新する更新手段と、を具
備したことにより、辞書構築支援が容易に行え、自然言
語処理の効率化が図れる。
【0010】本発明の辞書管理装置は、自然言語処理に
用いられる辞書の登録語を管理する辞書管理装置におい
て、前記辞書への登録候補語の抽出対象となる既存およ
び非既存の文書データを同定する情報を指定する指定手
段と、この指定手段で指定された情報を基に文書データ
を検出する検出手段と、この検出手段で検出された文書
データから前記登録候補語を抽出する抽出手段と、この
抽出手段で抽出された登録候補語を提示する提示手段
と、この提示手段で提示された登録候補語に対するユー
ザによる選択結果に応じて前記辞書の登録語を更新する
更新手段と、を具備したことにより、辞書構築支援が容
易に行え、自然言語処理の効率化が図れる。
【0011】また、本発明の辞書利用システムは、辞書
の登録語を参照して所定の自然言語処理を行う辞書利用
システムにおいて、前記辞書への登録候補語の抽出対象
となる既存および非既存の文書データを同定する情報を
指定する指定手段と、この指定手段で指定された情報を
基に文書データを検出する検出手段と、この検出手段で
検出された文書データから前記登録候補語を抽出する抽
出手段と、この抽出手段で抽出された登録候補語と前記
辞書の登録語を参照して、ユーザにより入力された自然
言語に対し所定の自然言語処理を行い、前記自然言語の
変換候補を生成する自然言語処理手段と、この自然言語
処理手段で生成された変換候補に対するユーザによる選
択結果に応じて前記辞書の登録語を更新する更新手段
と、を具備したことにより、自然言語処理の効率化が図
れる。
【0012】また、本発明の辞書利用システムは、辞書
に登録された語を参照して所定の自然言語処理を行う辞
書利用システムにおいて、所望のサイトとの間を所定の
通信回線を介して接続する接続手段と、この接続手段で
接続されたサイトに具備された辞書の登録語を参照し
て、ユーザにより入力された自然言語に対し所定の自然
言語処理を行う自然言語処理手段と、を具備したことに
より、自然言語処理の効率化が図れる。
【0013】
【発明の実施の形態】以下、本発明の実施形態について
図面を参照して明する。 (第1の実施形態)図1は、本発明の第1の実施形態に
係る、自然言語処理に用いられる辞書の登録語を管理す
る辞書管理装置の構成例を示すブロック図である。
【0014】図1において、101はネットワークより
データを取り出したり、ネットワークへデータを送信し
たりする機能を持つネットワーク入出力部である。10
2は各種データを記憶する機能を有するデータ記憶部、
103はディスプレイなど表示手段を含みユーザへ情報
を提示する機能を有するデータ提示部、104はキーボ
ード、ペン入力など、ユーザの所望するデータを入力す
る機能を有するユーザデータ入力部である。105はデ
ータ収集の対象となるデータの存在を検出する機能を有
する収集対象検出部、106は収集対象データより、デ
ータ登録候補を生成する候補生成部、107は上記各部
を所定の動作を行うように制御する制御部である。
【0015】以下、制御部107の動作を説明する。制
御部107は、ユーザにより指定された抽出対象から登
録すべき候補データの収集、提示等を行う辞書管理エー
ジェントに基づき、図1のハードウエア的な各部を制御
するようになっている。このエージェントの機能を実現
するプログラムは、図1の記憶部102に格納されてい
てもよい。
【0016】図2は、図1の辞書管理装置の起動時の動
作を説明するためのフローチャートである。辞書管理装
置の起動時には、まず、収集対象の文書データを特定す
る情報(特定情報)の指定を行う(ステップS1)。
【0017】図3は、この指定を行うためのインターフ
ェイス画面の例である。図3において、「ウォッチポイ
ント1」は、抽出対象全体に付けられた名前であり、こ
こで定義された複数のエリアは、この名前で参照・指示
される。
【0018】図3において、「抽出対象」とは、登録す
べき候補データを抽出する対象であり、例えば、コンピ
ュータのローカルデータを格納するエリア、ネットワー
クにおけるデータエリア、特定のアプリケーションの指
定するデータエリアを抽出対象ロケーションとして指定
することができる。
【0019】最初に抽出対象として指定された「c:¥
¥mydocuments¥report¥」は、ロー
カルのファイルシステムのディレクトリを指定した例で
ある。「下位エリア」は、この「report」という
ディレクトリのさらに下位にあるディレクトリを抽出対
象に含むか否かを設定するパラメータであり、この場合
は、「含まない」を選択しているため、ディレクトリ
「report」に含まれるファイルが抽出の対象とな
る。また、「対象」の項目において、「*.doc」が
指定されていることにより、このファイル識別子を持つ
ファイルのみが抽出対象となる。ここで、「*」は、全
ての文字列にマッチするワイルドカード文字である。こ
の指定があると、例えば、「abc.txt」というフ
ァイルは、抽出対象とならない。
【0020】2番目に抽出対象として指定された「Ne
tServer1¥¥group_documents
¥」は、「NetServer1」という名前で定義さ
れたネットワーク上に存在し、接続されているコンピュ
ータの有するディレクトリ「group_docume
nts」にある、あるいは、将来的に置かれるファイル
を指示している。この場合、「下位エリア」の項目に
は、「含む」が指定されているため、このディレクトリ
の下位にあるディレクトリに置かれるファイルも抽出対
象となる。さらに、「対象」の項目には、「*.*」が
指定されており、これは、ファイルの名前とその識別子
がいずれもよいという指定になっている。 2番目に抽
出対象として指定された「Ddmail−folde
r」は、アプリケーションソフトの「ddmail」と
いう、メイルシステムのメイルの受け取り口であるディ
レクトリを指定している。この種のアプリケーションの
データ保存場所に関しては、各種アプリケーションの情
報を保存してあるファイルを参照したり、アプリケーシ
ョンに特定のプロトコルで問い合わせたりすることによ
り、その情報を得ることができる。
【0021】図3に指示されるような内容は、システム
があらかじめ用意したデータを、ユーザに提示して選択
したり(既存アプリケーションのファイルなど)、例え
ば、Windows(マイクロソフト社の登録商標)の
エクスプローラのような表示方法で、ユーザにファイル
のディレクトリ構造を示して入力してもらうなどし、こ
れら情報を図1の記憶部102へ記憶しておくことによ
り、随時参照することが可能である。
【0022】辞書管理装置は、図2のステップS1で指
定された抽出対象を監視し、辞書データ収集対象が現れ
ると、それに対して辞書登録候補の収集や提示などを行
うが、次に、図2のステップS2において、その際の振
る舞いに関するパラメータなどを設定する。
【0023】なお、本実施形態に係る辞書管理装置は、
ユーザにより指定された抽出対象から登録すべき候補デ
ータの収集、提示等を行う辞書管理エージェントを複数
定義できるものとする。
【0024】図4に、パラメータ設定画面の一例を示
す。図4において、「DicAgent_RS1」は、
辞書管理エージェントの名前である。本実施形態にかか
る辞書管理装置は、複数の辞書管理エージェントを定義
でき、必要に応じて複数のエージェントを走らせたりす
ることができる。複数エージェントの起動については、
既存OSの複数プロセスの実行の枠組を利用して容易に
実現できるので説明は省略する。
【0025】図4に示した設定画面の「対象」の項目に
指定されている「ウォッチポイント1」は、図3で示し
たデータ抽出の対象となるエリアに対応しており、この
「ウォッチポイント1」の部分を指示・クリックするこ
とにより、図3の画面を呼び出し、再設定なども行え
る。
【0026】「監視インターバル」の項目には、辞書管
理エージェントが「対象」の項目にて指定されたエリア
をどのくらいの時間間隔で新規データがないかをチェッ
クにゆくかを設定するようになっている。ここでは、計
算機を起動した時にのみ行う「起動時のみ」と、特定の
時間インターバルでチェックする2つがあり、後者で
は、時間を設定する。なお、図4では、監視インターバ
ルとして、「5分」が指定されている。また、監視イン
ターバルは、辞書管理エージェントがチェックを行った
時間を記憶しておき、この時間と現在の時間を比較する
ことにより、容易に実現可能である。
【0027】「抽出候補」の項目には、対象文書から抽
出する登録候補を何にするかを設定するようになってい
る。「候補キャッシュ」の項目には、抽出された辞書登
録候補を記憶する記憶域の記憶容量、例えば、記憶する
辞書登録候補の語数を設定するようになっている。これ
らについては後述する。
【0028】「自動登録」の項目には、辞書登録候補が
ファイルなどにより検出された場合に、これを自動的に
辞書に登録するか否かを設定するようになっている。自
動登録先は、通常のユーザによる辞書への登録語と同様
に扱ってもよいが、ここでは、自動登録用の辞書を別途
用意する、あるいは、自動登録されたという識別情報を
入れて登録する。これにより、ユーザが辞書を編集する
などの際に容易に自ら登録した語か否かを判定すること
ができる。
【0029】なお、一般的に、登録した辞書を利用して
言語処理(例えば、かな漢字変換)するソフトウェアに
おいて、辞書の登録語をユーザにより選択/利用(例え
ば、かな漢字変換で登録された語を同音語選択するな
ど)された際にその情報を記憶しておくことができる。
この情報により、ユーザが利用したデータのみを残し
て、他の使用されなかった単語を削除することができ
る。さらに、登録した単語にタイムスタンプ(登録され
た時間)を押せば、所定の時間がたった後に使用されな
かった単語を手動もしくは自動で削除することができ、
これにより登録語が多くなり処理効率が劣化するのを防
止することが可能である。
【0030】本実施形態では、登録語のタイムスタンプ
でなく、候補キャッシュを利用しているので、ユーザに
より指定された所定の候補数までしか記憶せず、それ以
上になる場合には、(利用されなかった)古い候補を削
除してしまうという方法を採用しておりメモリ効率的に
は優れている。
【0031】図4の説明に戻り、「自動登録」の項目に
おいて、「有り」を選択した場合には次に登録の条件を
設定する。「登録条件」の項目には、自動登録される単
語が満たすべき条件を設定するようになっていて、登録
する単語の精度(有用性)をあげるために利用される。
【0032】登録条件としては、例えば、「最低頻
度」、「確信度」がある。「最低頻度」は、対象文書か
ら抽出された候補の頻度に関する条件であり、図4で
は、頻度が2以上のものを自動登録とする指定となって
いる。頻度の詳細については、後述する。「確信度」
は、登録候補抽出において、その候補の最もらしさに対
応する点数である。その詳細は後述するが、図4では、
確信度「1」を設定している。
【0033】「登録候補自動表示」の項目には、抽出さ
れた辞書登録候補を図1の提示部103に提示するか否
かを指定するようになっている。図4に示した表示画面
の下部にある「実行」、「キャンセル」のボタンは、こ
の設定処理の実行およびキャンセルを行うためのもので
ある。
【0034】次に、辞書登録候補語を抽出する対象文書
からの辞書情報の獲得処理に関する辞書管理装置の動
作、すなわち、各辞書管理エージェントの処理動作につ
いて説明する。
【0035】図5は、辞書管理エージェントの処理の流
れを説明するための概念図である。図5において、対象
文書検出部201は、例えば、図4の設定画面から設定
された監視インターバルに基づいて、図3で示したよう
な画面から設定された抽出対象文書データの特定情報を
基に、抽出対象の文書エリア200に新規抽出対象の文
書データが存在するか否かを確認する。
【0036】新規文書データであるか、既に候補抽出を
行った文書データであるかは、そのファイルの作成され
た時間を比較することにより行われる。これは、文書デ
ータファイルの収集を開始した時間t1を所定のメモリ
に記憶し、前回に抽出を開始した時間t2(メモリに記
憶されている)と、ファイルの作成時間t3とが、t1
<t3≦t2の場合に、作成時間の新しい文書データフ
ァイル、すなわち、抽出対象ファイルであるという判定
をする。指定されたディレクトリなどのファイルが走査
され、作成時間の新しい文書データファイルが抽出され
る。この際に、図3の「下位エリア」の項目で指示され
た下位エリアを走査する処理、あるいは「対象」の項目
で指示された対象を限定する処理が行われ、所定の条件
に合うファイルの名前が収集される。最後に収集の開始
の時間t2が記憶され、これは次回の抽出時に利用され
る。このようにして収集された結果、得られる抽出対象
文書データのファイルリストは、候補抽出部202に渡
される。
【0037】候補抽出部202は、渡されたファイルリ
ストのおのおののファイルより、辞書登録候補を抽出
し、これを候補キャッシュ203へ出力する。図6は、
候補抽出部202により抽出され、候補キャッシュ20
3に格納された辞書登録候補レコードの一例を示したも
のである。図6において、セミコロンで区切られたおの
おののフィールドは、読み、綴り、品詞、確信度、頻度
である。辞書登録候補レコードは、候補キャッシュ20
3に基本的に候補抽出部202の出力する辞書登録候補
に対して、FIFO(First in Firsto
ut)で記憶されている。候補キャッシュ203の大き
さは、図4の「候補キャッシュ」の項目で設定される語
数(この場合3000)で決定する。
【0038】図6では、番号「1」の「インターネッ
ト」が最も新しい辞書登録候補であり、番号「300
0」が最も古い辞書登録候補である。この状態で、候補
キャッシュ203に存在しない候補が登録されると、番
号「3000」の候補「きゃぱ」は捨てられることにな
る。
【0039】候補抽出部202から出力される辞書登録
候補が候補キャッシュ203に存在する候補の場合は、
その候補の頻度が「1」加算され、その候補レコード
は、キャッシュの先頭に置かれる。この際、優先度は高
い方が選択される。
【0040】候補レコードの「確信度」は、候補抽出処
理において付与される。この値は、候補抽出に使用され
るパターンもしくは規則に基づくルールにより決定する
ことができる。例えば、漢字2文字あるいはカタカナ列
が句点と格助詞に挟まれているときは、最も確信度の高
い「A」をアサインする。具体的には、「…、インター
ネットに…」という文字列から「インターネット」が辞
書登録候補として抽出された場合には、その確信度は
「A」であり、図6の番号「2」に対応する候補レコー
ドが生成される。また、「する」の前の2文字の漢字列
は、確信度「C」とするという場合には、例えば、「…
外部定検した。」という文字列から、「定検」が取り出
され、図6の番号「80」の候補レコードのようにな
る。なお、「定検」の場合、「定」には、「てい」「じ
ょう」の2つの読みが一般的であるため、「検」の読み
である「けん」と組み合わせて「ていけん、じょうけ
ん」の2つが読みの候補として生成されている。
【0041】次に、図5の候補提示・登録部204の処
理動作について説明する。例えば、図4で「自動登録」
の項目が「有り」に設定されていると、候補提示・登録
部204は、候補キャッシュ203の先頭に追加された
候補に対して、チェックを行い、その候補が「自動登
録」の「登録条件」を満たしていた場合は、それを登録
辞書205へ登録する。登録条件のチェックは、辞書登
録候補レコードの頻度フィールドや確信度フィールドを
参照することにより可能である。
【0042】図4に示した設定画面において、「登録条
件」の項目に変更があった場合には、候補キャッシュ2
03に格納されている変更前の登録条件に該当する候補
を提示し、ユーザに対して登録を行うか否かの問い合わ
せを行った後、必要であれば登録辞書205に対する登
録処理を行う。
【0043】登録辞書205に登録された語は、候補抽
出部202により利用されるため、登録された以降は、
その単語自体は、未知語とならないため、登録候補とし
て抽出されることは通常ない。候補提示・登録部204
が候補を登録する登録辞書205は、あらかじめユーザ
が指定するか、あるいは、デフォルトとなる辞書を利用
するが、自動登録された語に対しては、その旨の情報を
付与して他と区別できるようにする。
【0044】候補提示・登録部204は、上記登録処理
の他に、候補提示処理を行う。これは、例えば、図4に
おける「登録候補自動表示」の項目を「有り」に設定し
てある場合に実行される。候補提示・登録部204は、
候補キャッシュ203に辞書登録候補があると、これを
ユーザに提示する。
【0045】図7は、候補キャッシュ203に格納され
た辞書登録候補の提示画面の一例を示したものである。
図7(a)において、「DicAgent_RS1」
は、辞書管理エージェントの名前であり、これがどのエ
ージェントにより抽出されているかを示す。右上部に表
示される「5/25」は、全体の辞書登録候補が「2
5」あり、このうち5番目を表示していることを示して
いる。「インターネット」以下は、各辞書登録候補の表
示例である。
【0046】この辞書登録候補は、時間とともに表示が
変化し、例えば、図7(a)の画面は、図7(b)の画
面のように変化する。図7(b)では、6番目からの単
語が表示されている。単語の順番は、候補キャッシュ2
03にFIFOを用いているので、新しい候補が1番
目、古い候補ほど大きい番号となる。単語の提示の順番
については、この他に頻度の順に提示するなども考えら
れる。
【0047】他の辞書登録候補の表示方法として、例え
ば、電光掲示板形式で流すなどの方法も考えられる。図
8は、その様子を示したもので、辞書登録候補の各単語
は、右から左へ流れてゆく。この方法の方が表示領域が
狭く、他の仕事をしている最中にでも流しておき、時間
のあいた時に登録処理などを行うというように使用する
ことができる。
【0048】図7、図8に示すように、提示される辞書
登録候補の文字列の後には、括弧で付加情報がつく。基
本的には、登録候補の後の括弧の中には、読みのリスト
と「×」が表示される。カタカナ書き語の辞書登録候補
の場合は、読みの代わりに「○」を表示する。この
「○」をマウスでクリックすると、その候補が登録候補
として認定されたと解釈する。また、複数の読みのうち
特定の読みをクリックすると、その読みでの登録が指示
されたと判定する。例えば、「定検」に対して「ていけ
ん」をクリックすると、「ていけん」という読みで「定
検」を登録するというように解釈される。
【0049】「×」をクリックした場合は、その候補は
登録しないというように判断される。登録しないと判断
された候補は、特定の領域(図示しない)にネガティブ
な例として記憶し、候補抽出部202で候補生成の際に
それの生成を行わない、もしくは候補提示・登録部20
4で登録候補として表示しないなどの仕組みをいれるこ
とができる。この場合、ユーザの「×」の指示自体が誤
っていたりすると、1回の削除操作で以降、候補として
選択することができなくなるので、複数回削除すると候
補としての表示をやめたり、以降候補として生成しない
旨のメッセージを出し、ユーザの確認を得るなどの機能
を付与することにより、こうした不具合は、最小限にお
さえることができる。また、Windows95(マイ
クロソフト社登録商標)の「ゴミ箱」のように、「×」
により削除されたデータは、画面表示からは消すが、別
の領域(図示しない)に保存しておき、復元が可能なよ
うにしておくという構成にすることも容易に可能であ
る。
【0050】ユーザが、図7あるいは図8のように提示
された辞書登録候補の付加情報のうち、「○」あるいは
読みをクリックした際には、例えば、図9に示すような
辞書登録画面が表示される。例えば、「定検」に対して
「ていけん」あるいは「○」がクリックされると、図9
に示すように、見出し「定検」、読み「ていけん」の他
に推定される品詞が表示され、ユーザは、この画面を見
て必要に応じて、この登録データを修正することもでき
る。
【0051】図9において、登録ボタンは辞書の登録
を、削除ボタンは候補表示からの削除を、キャンセル
は、登録操作のキャンセルをそれぞれ行うためのもので
ある。なお、図5において、文書エリア200、候補キ
ャッシュ203、登録辞書205は、図1の記憶部10
2の記憶領域内に設けられることができる。また、辞書
利用処理部206は、例えば、かな変換処理、機械翻訳
等の登録辞書205を用いて所定の自然言語処理を実行
する言語処理エージェントである。
【0052】以上、説明したように、上記第1の実施形
態によれば、ユーザにより、辞書登録候補語の抽出対象
となる既存および非既存の文書データを同定する情報
(図3参照)が指定されると、対象文書検出部201に
て、この指定された情報を基に文書データを検出し、候
補抽出部202にて、この検出された文書データから辞
書登録候補語を抽出し、候補提示・登録部204にて、
この抽出された辞書登録候補語のうち予め指定された条
件に基づき選択された語、あるいは、抽出された辞書登
録候補語を提示して、これに対しユーザにより選択され
た語を辞書205に登録等することにより、ユーザ固有
の文書から、言語処理のための辞書候補情報を、自動的
に抽出しておき、その辞書データを利用することが可能
となり、言語処理システムの効率化が行える。また、得
られた辞書登録候補情報は、ユーザが自然に選択するこ
とにより、テンポラルなものからそうでないものへと変
換することが可能であり、適切なデータの構築が容易に
行える。
【0053】また、辞書抽出対象の文書データが新たに
検出されたり、ある文書データからの辞書登録候補の抽
出が進むにつれて、それらを順次提示したり、この提示
される辞書登録候補に対して、登録/削除/変更の指示
を与えて辞書登録候補の提示形態を変化させることによ
り、辞書構築の支援が容易に行える。
【0054】このように、ユーザにより辞書登録候補の
抽出先の文書データを特定する情報が与えられると、そ
の特定情報を基に文書データを検出して、その後、この
対象より自動的に辞書データを抽出しておくことが可能
となり、適切な時点でユーザの辞書登録・管理が行え、
かな漢字変換などでユーザが辞書を使用する際には、既
に辞書登録が済んでおり、文書作成効率が向上するとい
う効果がある。
【0055】(第2の実施形態)次に、第1の実施形態
で説明した、既存、非既存の文書データから抽出された
語を登録して登録辞書生成する辞書管理装置を適用した
辞書利用システムについて説明する。ここでは、一例と
して、かな漢字変換辞書に関する説明を行うが、本発明
は、機械翻訳、検索など、辞書を利用するシステム全般
に対して適用可能であることは言うまでもない。
【0056】図10は、第2の実施形態に係る辞書利用
システムの構成例を示したものである。図10におい
て、言語処理エージェント303は、既存技術などによ
るかな漢字変換を行う機能を有し、入力部よりかなや英
数字列を入力し、基本的に登録辞書中のかな漢字変換デ
ータを利用して、かな漢字混じり列に入力文字列を変換
して、提示部に提示する制御を司るものである。
【0057】候補生成エージェント301は、第1の実
施形態で説明したような、文書などから辞書情報を抽出
し、辞書登録候補を登録候補キャッシュ302に登録す
る制御を司るものである。
【0058】第2の実施形態に係る辞書利用システムで
は、登録候補キャッシュ302にテンポラルに登録され
た辞書情報も言語処理エージェント303で処理に利用
し、この結果、言語処理エージェント303より得られ
た出力を提示部304に提示し、この情報の中からユー
ザが適切なものを選択し、その情報が入力部305より
得られた場合に、言語処理エージェント303は、選択
された情報を登録候補キャッシュ302から登録辞書3
06に移動する、あるいは、それに準じる処理をして、
他の登録候補とは異なった形態に該登録候補を変形する
処理を行うようになっている。
【0059】なお、候補生成エージェント301、言語
処理エージェント303の機能を実現するプログラム
は、所定のメモリに格納され、CPUがこのプログラム
に基づき提示部304、入力部305、および登録候補
キャッシュ302、登録辞書306を格納するメモリに
アクセスするなどの所定の処理動作を実行するようにな
っていてもよい。
【0060】以下、具体例を用いて説明する。登録候補
キャッシュ302には、例えば、図6に示した形式と内
容の辞書登録候補レコードが格納されるとする。
【0061】登録辞書306に、例えば、「じっこう;
実行;サ変」という辞書項目が登録されているとする。
この状態において、ユーザより、入力部305を介して
「いんたーねっとぶらうざでていけんをじっこうする」
という入力が言語処理エージェント303に送られてき
たとする。
【0062】言語処理エージェント303は、この入力
された文字列に対して、少なくとも、登録辞書306と
登録候補キャッシュ302の2つを用いて辞書引きを行
い、この結果に対して形態素解析などを行い漢字候補を
生成する。このような、かな漢字変換処理については、
既存技術を用いることで実現可能であり、詳細な説明は
省略する。
【0063】この場合、「インターネットブラウザ」が
登録候補キャッシュ302に予め記憶されているので、
かな漢字変換処理の第一次出力結果としては、「インタ
ーネットブラウザで定見を実行する」が得られ、提示部
304に提示される。この段階では、提示された候補
は、未選択の状態であり、ユーザによる選択が可能であ
る。
【0064】出力結果である文字列の「インターネット
ブラウザ」の部分には、ひらがな書き語「いんたーねっ
とぶらうざ」などが候補として存在している。ユーザ
は、提示されている候補が正しい候補であるので、「イ
ンターネットブラウザ」に対して選択・確定キーを押す
などして、選択を行う。
【0065】この操作を検知すると、言語処理エージェ
ント303は、選択された候補が登録候補キャッシュ3
02の辞書項目より生成されたものであるということを
判定し、そうである場合は、この辞書項目を登録候補キ
ャッシュ302から登録辞書306へ移し、いわゆる辞
書登録を行う。あるいは、登録候補キャッシュ302中
の候補にユーザ選択された旨の情報を付与しておく。こ
れにより、後の時点でユーザに登録の可否を確認しなが
ら辞書登録することもできる。
【0066】ユーザにより入力された文字列中の「てい
けん」の部分では、登録辞書306に存在した「定見」
と登録候補キャッシュ302に存在した「定検」などが
選択の候補として保持されている。このとき、ユーザが
「定検」を選択した場合には、上記と同じような処理が
なされ、「定見」の辞書項目が登録辞書306に移動さ
れる。この際に、登録候補キャッシュ302中では、
「定検」に対して、「ていけん」「じょうけん」の2つ
が読みの候補となっているが、ユーザの入力した文字列
が「ていけん」であるため、「じょうけん」の部分は削
除される。これにより、「ていけん」という読みに対し
て「定検」が選択された後は、「じょうけん」という読
みに対して、「定検」という変換候補を出力することは
なくなる。
【0067】このように、ユーザ選択に応じて、登録辞
書306の情報を変化させることにより、適切な候補以
外の候補の出力を制限することが可能である。また、こ
うした、複数の読み候補を持つ語に対しては、非常に的
はずれな変換結果が出る可能性があるため、他の一般辞
書などに同音語があったら、ユーザ選択がなされるまで
は第一候補としては表示しないなどの工夫により、比較
的安全に辞書知識の取り組みを行うことが可能である。
【0068】機械翻訳においても、かな漢字変換と同様
な処理が可能となる。機械翻訳においては、対訳文書か
らの辞書の作成技術が開発されており、対応する対訳文
書から、辞書候補を作成することが可能である。例え
ば、COLING94のプロシーディングにある「Bu
ilding an MT Dictionary F
rom Parallel Textsbased o
n Linguistic and Statisti
cal Information、pp76」では、対
訳テキストから翻訳用辞書の作成について論じている。
こうした技術により抽出可能な辞書候補も例えば訳語に
関して曖昧性を有し、ユーザの訳語の選択などにより、
かな漢字辞書と同様な枠組で処理することが可能であ
る。
【0069】以上説明したように、上記第2の実施形態
によれば、ユーザにより指定された辞書登録候補語の抽
出対象となる既存および非既存の文書データを同定する
情報(図3参照)に基づき、候補生成エージェント30
1にて、文書データを検出して、辞書登録候補語を抽出
し、登録候補キャッシュ302に格納しておき、言語処
理エージェント303では、ユーザにより入力された自
然言語に対し登録候補キャッシュ302に格納された辞
書登録候補語と辞書303に登録された語を参照して所
定の自然言語処理を行って自然言語の変換候補を生成
し、この生成された変換候補に対するユーザによる選択
結果に応じて辞書303の内容を更新することにより、
ユーザ固有の文書から、言語処理のための辞書候補情報
を、自動的に抽出しておき、その辞書データを利用する
ことが可能となり、言語処理システムの効率化が行え
る。また、得られた辞書登録候補情報は、ユーザが自然
に選択することにより、テンポラルなものからそうでな
いものへと変換することが可能であり、適切なデータの
構築が容易に行える。
【0070】(第3の実施形態)次に、辞書に登録され
た語を参照して所定の自然言語処理を行う辞書利用シス
テムが、所定のネットワークを介して接続されたサイト
と互いに通信を行って、このサイトに具備される辞書を
参照して所定の自然言語処理を行う場合ついて説明す
る。すなわち、言語解析などに利用する辞書を具備した
サイトエージェントと所定のネットワークを介して互い
に通信を行って、言語処理に役立つ情報を入手・利用す
ることにより、サイトに応じた言語処理のカスタマイズ
化が可能な言語処理エージェントについて説明する。
【0071】図11は、第3の実施形態に係る辞書利用
システムの構成例を示したものである。ここでの言語処
理エージェントのタスクとしては、例えば、かな漢字変
換を想定している。すなわち、入力部404からのかな
・英数字入力は、辞書407を利用して、言語処理エー
ジェント407により、かな漢字混じり文字列に変換さ
れ、提示部403に提示される。
【0072】言語処理エージェント402とサイトエー
ジェント401は、所定のネットワークを介して互いに
情報のやり取りができるようになっている。このチャネ
ルの設定は、図示されていないが、ユーザの指示によ
り、ネットワーク上のサイトを訪問することにより行わ
れる。これは、例えば、WWWブラウザでインターネッ
ト上のWebページを表示することなどに相当し、ユー
ザが訪問した時にページに関連して置かれたサイトエー
ジェント401と言語処理エージェント402が特定の
プロトコルでやり取りをして情報伝達をすることが現状
の技術でできる。ユーザがWebページのハイパーリン
クをたどって別のWebページにゆくことにより、言語
処理エージェント402は、別のサイトエージェント4
01と情報のやり取りを行うようになる。
【0073】なお、サイトエージェント401、言語処
理エージェント402の機能を実現するプログラムは、
それぞれ、例えばパーソナルコンピュータ等の端末装置
内の所定のメモリに格納され、CPUがこのプログラム
に基づきサイト情報405、サイト辞書406を格納す
るメモリ、あるいは、辞書407を格納するメモリ、提
示部403、入力部404などにアクセスして所定の処
理動作を実行するようになっている。
【0074】図11において、サイト情報405は、W
WWページの表示情報などに相当する情報であり、サイ
ト辞書406は、言語解析などに利用する辞書である。
図12は、ユーザ側端末装置において表示されるサイト
の画面表示例を示したものである。このページは、「リ
ーダースワインセラー」というワイン販売の会社を想定
しており、「会社概要」、「ワインリスト」、「ワイン
あれこれ」などは、それぞれのページへのハイパーリン
クになっている。このサイトには、「お話窓」というと
ころを通して、サイトのエージェントとコミュニケーシ
ョンができる。ユーザは、「お話窓」に文を入力する
と、それが解析され、それに応じた応答が生成され、ユ
ーザに提示されるようになっている。
【0075】図13は、言語処理エージェント402の
かな漢字変換処理の手順の概要を示したフローチャート
である。例えば、図12に示したようなページがユーザ
側の端末装置に表示されている状態(すなわち、ユーザ
側端末と所望のサイトとの間に通信回線が設定された状
態)で、ユーザは、「お話窓」の領域内にキーボード等
の入力部404を介して文字列の入力を行う(ステップ
S11)。このとき、ローマ字入力の場合は、ひらがな
文字列に変換する。今、「とらじぁわいんはあります
か」という文字列をユーザが入力した場合を例にとり説
明する。
【0076】次に、言語処理エージェント402は、辞
書データの要求コマンドとともに、このひらがな列をサ
イトエージェント401に送出する。これを受けるとサ
イトエージェント401は、このひらがな列に含まれる
可能性のある単語の集合をサイト辞書406より検出
し、それを辞書データとして要求元の言語処理エージェ
ント402に送出する(ステップS12)。言語処理エ
ージェント402が受け取る辞書データは、例えば、次
のようなもので、1語毎に読み、綴り、品詞がそれぞれ
含まれている。
【0077】とらじゃわいん;トラジャワイン;固有名
詞;/とらじゃ;トラジャ;固有名詞;/ 言語処理エージェント402は、サイトエージェント4
01から送られてきた辞書データと、独自の持つ辞書4
07の情報を利用して、かな漢字変換処理を行う(ステ
ップS13)。そして、この変換結果をユーザに提示し
て、ユーザにより正解候補の選択が行われる(ステップ
S14)。
【0078】この場合、「トラジャワイン」がサイトエ
ージェント401より提供されるため、かな漢字変換結
果は、「トラジャワインは有りますか」となり、正確な
変換が可能となることにより、コミュニケーションをよ
り円滑に行うことができる。
【0079】また、この例では、辞書データを伝達する
という構成にしているが、かな漢字変換処理の一部をサ
イトエージェント401に代行させてしまい、その結果
を受け取るような構成も可能であるし、また、かな漢字
変換処理の大半をサイトエージェント401側で行い、
言語処理エージェント402側から特定の情報を送ると
いうような構成にすることも可能である。
【0080】また、辞書データではなく、そのサイトに
含まれる文書の情報を利用することにより、そのサイト
の文書に現れる文字列候補を優先するという構成も可能
である。例えば、「トラジャワイン」が、そのページに
含まれている場合には、「とらじゃ」という入力に対し
て、「虎じゃ」ではなく、「トラジャ」を優先して出力
する。これは、基本的に文書を文字列スキャンすること
により可能である。こうした手法を用いた場合には、そ
の文書だけでなく、その文書の関連文書、例えば、ハイ
パーリンクでつながっている文書を対象とするなどが考
えられる。この方法の利点は、サイト側に特殊なエージ
ェントを想定する必要がないことである。特にWWWの
場合は、空き時間でリンク先のページをプリフェッチす
ることにより、リンクをたどる操作が早くなるという利
点がある。文字データだけのプリフェッチは、比較的高
速に実行可能である。
【0081】また、かな漢字変換処理を高速に行うため
には、1文字が入力されるごとに情報を送って、入力と
同時平行的にサイトエージェント401側で辞書検索を
行うなどの工夫が考えられる。
【0082】以上により、個々のサイトに応じた入力の
適応が実現できる。以上説明したように、上記第3の実
施形態によれば、所望のサイト(サイトエージェント4
1)との間を所定の通信回線を介して接続し、言語処理
エージェント402では、ユーザにより入力された自然
言語に対し、所定の通信回線を介して接続されたサイト
に具備された辞書406に登録された語を参照して所定
の自然言語処理を行い、自然言語の変換候補を生成する
ことにより、各サイトに固有の辞書データを利用するこ
とができるため、サイトなどの環境に応じた言語処理の
カスタマイズが可能となり、自然言語処理の効率化が図
れる。
【0083】なお、本発明は上記第1〜第3の実施形態
に限定されるものではなく、翻訳、検索、音声入力など
種々の言語処理アプリケーションに適用することができ
る。また、英語やフランス語など、任意の言語に対して
適用することが可能である。要するに、本発明の主旨を
逸脱しない範囲で種々変形して実施することができる。
【0084】
【発明の効果】以上説明したように本発明によれば、ユ
ーザ固有の文書から、言語処理のための辞書候補情報
を、自動的に抽出しておき、その辞書データを利用する
ことが可能となり、言語処理の効率化が行える。
【0085】また、得られた辞書候補情報は、ユーザが
自然に選択することにより、テンポラルなものからそう
でないものへと変換することが可能であり、適切なデー
タの構築が容易に行える。
【0086】さらに、計算機ネットワークに存在する各
種サイトに接続した場合には、そこに固有のデータを利
用することができるため、サイトなどの環境に応じた言
語処理のカスタマイズが可能となり、言語処理の効率化
がはかれる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る辞書管理装置の
構成例を示した図。
【図2】図1に示した辞書管理装置の起動時の動作を説
明するためのフローチャート。
【図3】収集対象文書データを特定するための情報を指
定するインターフェイス画面の一例を示した図。
【図4】辞書管理エージェントの振る舞いに関するパラ
メータを設定する設定画面の一例を示した図。
【図5】辞書管理エージェントの処理の流れを説明する
ための概念図。
【図6】候補キャッシュに格納された辞書登録候補レコ
ードの一例を示した図。
【図7】辞書登録候補の提示画面の一例を示した図。
【図8】電光掲示板形式で辞書候補情報を提示する合の
提示例を示した図。
【図9】辞書登録画面の一例を示した図。
【図10】本発明の第2の実施形態に係る辞書利用シス
テムの構成例を示した図。
【図11】本発明の第2の実施形態に係る辞書利用シス
テムの構成例を示した図。
【図12】サイトの画面表示例を示した図。
【図13】図11の言語処理エージェントのかな漢字変
換処理の概要を示したフローチャート。
【符号の説明】
101…ネットワーク入出力部 102…データ記憶部 103…データ提示部 104…データ入力部 105…収集対象検出部 106…候補生成部 107…制御部。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 自然言語処理に用いられる辞書の登録語
    を管理する辞書管理方法において、 予め指定された前記辞書への登録候補語の抽出対象とな
    る既存および非既存の文書データを同定する情報を基に
    文書データを検出し、この検出された文書データから前
    記登録候補語を抽出し、この抽出された登録候補語と予
    め指定された条件に基づき前記辞書の登録語を更新する
    ことを特徴とする辞書管理装置。
  2. 【請求項2】 自然言語処理に用いられる辞書の登録語
    を管理する辞書管理方法において、 予め指定された前記辞書への登録候補語の抽出対象とな
    る既存および非既存の文書データを同定する情報を基に
    文書データを検出し、この検出された文書データから前
    記登録候補語を抽出し、この抽出された登録候補語を提
    示して、この提示された登録候補語に対するユーザによ
    る選択結果に応じて前記辞書の登録語を更新することを
    特徴とする辞書管理方法。
  3. 【請求項3】 自然言語処理に用いられる辞書の登録語
    を管理する辞書管理装置において、 前記辞書への登録候補語の抽出対象となる既存および非
    既存の文書データを同定する情報を指定する指定手段
    と、 この指定手段で指定された情報を基に文書データを検出
    する検出手段と、 この検出手段で検出された文書データから前記登録候補
    語を抽出する抽出手段と、 この抽出手段で抽出された登録候補語と予め指定された
    条件に基づき前記辞書の登録語を更新する更新手段と、 を具備したことを特徴とする辞書管理装置。
  4. 【請求項4】 自然言語処理に用いられる辞書の登録語
    を管理する辞書管理装置において、 前記辞書への登録候補語の抽出対象となる既存および非
    既存の文書データを同定する情報を指定する指定手段
    と、 この指定手段で指定された情報を基に文書データを検出
    する検出手段と、 この検出手段で検出された文書データから前記登録候補
    語を抽出する抽出手段と、 この抽出手段で抽出された登録候補語を提示する提示手
    段と、 この提示手段で提示された登録候補語に対するユーザに
    よる選択結果に応じて前記辞書の登録語を更新する更新
    手段と、 を具備したことを特徴とする辞書管理装置。
  5. 【請求項5】 辞書の登録語を参照して所定の自然言語
    処理を行う辞書利用システムにおいて、 前記辞書への登録候補語の抽出対象となる既存および非
    既存の文書データを同定する情報を指定する指定手段
    と、 この指定手段で指定された情報を基に文書データを検出
    する検出手段と、 この検出手段で検出された文書データから前記登録候補
    語を抽出する抽出手段と、 この抽出手段で抽出された登録候補語と前記辞書の登録
    語を参照して、ユーザにより入力された自然言語に対し
    所定の自然言語処理を行い、前記自然言語の変換候補を
    生成する自然言語処理手段と、 この自然言語処理手段で生成された変換候補に対するユ
    ーザによる選択結果に応じて前記辞書の登録語を更新す
    る更新手段と、 を具備したことを特徴とする辞書利用システム。
  6. 【請求項6】 前記更新手段は、ユーザにより選択され
    た変換候補が前記登録候補語であるとき、その登録候補
    語を前記辞書に登録することを特徴とする請求項5記載
    の辞書利用システム。
  7. 【請求項7】 辞書に登録された語を参照して所定の自
    然言語処理を行う辞書利用システムにおいて、 所望のサイトとの間を所定の通信回線を介して接続する
    接続手段と、 この接続手段で接続されたサイトに具備された辞書の登
    録語を参照して、ユーザにより入力された自然言語に対
    し所定の自然言語処理を行う自然言語処理手段と、 を具備したことを特徴とする辞書利用システム。
JP9066874A 1997-03-19 1997-03-19 辞書管理方法および辞書管理装置および辞書利用システム Pending JPH10260984A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9066874A JPH10260984A (ja) 1997-03-19 1997-03-19 辞書管理方法および辞書管理装置および辞書利用システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9066874A JPH10260984A (ja) 1997-03-19 1997-03-19 辞書管理方法および辞書管理装置および辞書利用システム

Publications (1)

Publication Number Publication Date
JPH10260984A true JPH10260984A (ja) 1998-09-29

Family

ID=13328461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9066874A Pending JPH10260984A (ja) 1997-03-19 1997-03-19 辞書管理方法および辞書管理装置および辞書利用システム

Country Status (1)

Country Link
JP (1) JPH10260984A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004078664A (ja) * 2002-08-20 2004-03-11 Nec Saitama Ltd 辞書登録システム及びその端末装置
JP2007310825A (ja) * 2006-05-22 2007-11-29 Microsoft Corp 文字処理装置、その読みおよび表記の取得方法およびプログラムならびに文字処理装置を使用する情報処理システム
WO2008029881A1 (fr) * 2006-09-07 2008-03-13 Nec Corporation Système de traitement du langage naturel et système d'enregistrement de dictionnaire

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004078664A (ja) * 2002-08-20 2004-03-11 Nec Saitama Ltd 辞書登録システム及びその端末装置
JP2007310825A (ja) * 2006-05-22 2007-11-29 Microsoft Corp 文字処理装置、その読みおよび表記の取得方法およびプログラムならびに文字処理装置を使用する情報処理システム
WO2008029881A1 (fr) * 2006-09-07 2008-03-13 Nec Corporation Système de traitement du langage naturel et système d'enregistrement de dictionnaire
JP5239863B2 (ja) * 2006-09-07 2013-07-17 日本電気株式会社 自然言語処理システムおよび辞書登録システム
US9575953B2 (en) 2006-09-07 2017-02-21 Nec Corporation Natural-language processing system and dictionary registration system

Similar Documents

Publication Publication Date Title
US6381593B1 (en) Document information management system
US6564254B1 (en) System and a process for specifying a location on a network
KR100907671B1 (ko) 기록 매체 및 문자 입력 편집 방법
US6338075B2 (en) Hypertext reader which performs a reading process on a hierarchically constructed hypertext
US20010021934A1 (en) Processing device for searching information in one language using search query in another language, and recording medium and method thereof
JP4984670B2 (ja) 情報提供プログラム、該プログラムを記録した記録媒体、情報提供装置、および情報提供方法
JP4830637B2 (ja) 電子文書更新通知装置及び電子文書更新通知方法
JPWO2004111876A1 (ja) 検索条件を再利用する検索システムおよび方法
US7895337B2 (en) Systems and methods of generating a content aware interface
JP2010257392A (ja) 文字入力装置、文字入力方法、コンピュータ読取可能なプログラムおよび記録媒体
JP2001154893A (ja) ファイル検索装置とコンピュータ読取可能な記録媒体
US20020007382A1 (en) Computer having character input function,method of carrying out process depending on input characters, and storage medium
JPH10260984A (ja) 辞書管理方法および辞書管理装置および辞書利用システム
EP0996072A1 (en) A method for sharing data among a plurality of applications in a hand-held device
JP2002099547A (ja) 文字入力機能を持つコンピュータ装置、プログラム記録媒体及びプログラム
JP4752020B2 (ja) 文字列取得方法及び文字列取得システム
JP3450598B2 (ja) 専門用語辞書選択装置
JP3310961B2 (ja) ネットワーク上の場所を指定するためのシステム及び方法
JPH09293072A (ja) フロントエンドプロセッサ
JP2010211530A (ja) 情報検索端末装置、情報検索システム、情報検索方法、および情報検索プログラム
JP2008065577A (ja) 文書検索システム、文書検索プログラム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH04241673A (ja) 文書検索システム
JP3761364B2 (ja) 機械翻訳システム
JP2002015223A (ja) 広告方法及び装置、広告料金算出方法及び装置、利用料金徴収方法及び装置、付加情報表示方法及び装置
JPH08263512A (ja) 文書検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20031212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060912

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070213