JPH11238057A - 自然言語入力処理方法ならびに装置及び同方法がプログラムされ記録される記録媒体 - Google Patents

自然言語入力処理方法ならびに装置及び同方法がプログラムされ記録される記録媒体

Info

Publication number
JPH11238057A
JPH11238057A JP10038991A JP3899198A JPH11238057A JP H11238057 A JPH11238057 A JP H11238057A JP 10038991 A JP10038991 A JP 10038991A JP 3899198 A JP3899198 A JP 3899198A JP H11238057 A JPH11238057 A JP H11238057A
Authority
JP
Japan
Prior art keywords
information
document
input
notation
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10038991A
Other languages
English (en)
Inventor
Yoshimi Saito
佳美 齋藤
Yumi Ichimura
由美 市村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10038991A priority Critical patent/JPH11238057A/ja
Publication of JPH11238057A publication Critical patent/JPH11238057A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 文書作成者が入力し確認した言語情報を保持
し、それを用いて新たに関連文書情報を検索し、そこに
含まれる情報に基づき変換処理を調整することにより、
処理の精度を高め、書き手の意図をより反映した文書入
力を行うことを課題とする。 【解決手段】 本発明は、単語の読みの少なくとも一部
と、表記と品詞を含む単語情報とを対応付けて記憶した
辞書105を参照することにより、入力部101を介し
て入力される読み情報の少なくとも一部を言語表記に変
換し、ユーザーがその表記を確認することにより確認さ
れた言語表記情報を確定文字列保持処理部106に保持
し、文書検索部108にて確認済みの言語表記情報に含
まれる情報に基づいて文書を検索し、検索により得られ
る文書に含まれる情報に基づいて上記の変換処理を調整
することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自然言語入力処理
方法ならびに装置及び同方法がプログラムされ記録され
る記録媒体に関する。
【0002】
【従来の技術】最近、計算機上で文書を作成することは
ー般的となり、ワードプロセッサ等の専用機、もしくは
パーソナルコンピュータ等の汎用機によ文書作成ソフト
ウェアをインストールすることにより簡易に文書を入力
できるようになっている。特に近年は、計算機上での文
書の通信によるコミュニケーンョンが一般化しつつあ
り、計算機上で文書を作成する機会はさらに増大してい
る。
【0003】一方、技術の進歩によりコンピュータを始
めとする綿々の電子装置は小型化し、携帯機器の普及が
著しい。携帯機器等においては、キーボード等の操作部
のサイズが小さいこと等から、文書の入力作業の負担は
大きく、ユーザーの入力に関わる負担を軽減することが
望まれる。しかし、ユーザー個々が作成したい文書の内
容は多岐に渡り、全てのユーザーが満足できるような辞
書をはじめとする変換処理をあらかじめ用意することは
困難である。同一のユーザーであっても様々な内容の文
書を作成する場合がある。このような問題を解決するた
めに、例えば、仮名漢字変換の候補を生成し評価する際
に、単語の共起情報や分野情報などを用いて候補を絞り
込む方法が知られている。このことは、例えば、特開平
6−266701号に開示されている。
【0004】しかしながら上述した従来の方法では、あ
らかじめ辞書に記憶された情報により変換処理を調整す
るため、記憶されていない情報を利用することはできな
かった。また、分野情報等の参考となる情報をあらかじ
めユーザーが指定する方法があるが、この場合、ユーザ
ーがこれから入力する文書について事前に明確な意図を
有している必要があり、入力する内容が未確定であった
り、多岐に渡る可能性がある場合など、システムに対し
適切な指示を与えることは困難であった。
【0005】
【発明が解決しようとする課題】上述したように、従来
の文書入力処理装置では、所望の表記候補を絞り込むた
めに単語の共起情報や分野情報を利用する際、あらかじ
め辞書中に記憶された情報により変換処理を調整するた
め、ユーザーの入力意図に柔軟に対応できないという問
題点があった。
【0006】本発明は上記事情に鑑みてなされたもので
あり、ユーザーの入力中にあらかじめ辞書中に記憶され
ていない情報を補うことにより、書き手の意図に応じた
より柔軟な文書入力を行う自然言語入力処理方法ならび
に装置及び同方法がプログラムされ記録される記録媒体
を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明の自然言語入力処
理方法は、単語の読みの少なくともー部と、表記と品詞
を含む単語情報とを対応付けて記憶した辞書を参照する
ことにより、入力される読み情報の少なくとも一部を言
語表記に変換し、ユーザーがその表記を確認することに
より確認された言語表記情報を保持し、確認済みの言語
表記情報に含まれる情報に基づいて文書を検索し、検索
により得られる文書に含まれる情報に基づいて上記の変
換処理を調整することを特徴とする。また、検索対象と
する文書の範囲、もしくは検索方法の設定情報の入力を
促し、ユーザによる入力を取り込み、文書検索のための
環境設定を行なうことも特徴とする。
【0008】本発明の自然言語処理装置は、読みの少な
くとも一部の情報を入力し、これを取り込む入力手段
と、単語の読みの少なくともー部と、表記と品詞を含む
単語情報とを、対応付けて記憶する辞書手段と、前記入
力手段により入力された読みの少なくともー部の情報
を、前記辞書手段を参照することにより言語表記に変換
する変換手段と、変換の結果ユーザーが表記を確認し、
前記確認された言語表記情報を保持する確認済み言語情
報保持手段と、前記確認済み言語情報保持手段に含まれ
る情報に基づき文書を検索する手段と、前記検索により
得られた文書に含まれる情報に基づき前記変換手段によ
る変換処理を調整する変換処理調整手段とを具備するこ
とを特徴とする。
【0009】本発明の記録媒体は、あらかじめ辞書に記
憶されていない情報を補い変換処理を行なう自然言語入
力処理装置において用いられ、入力される読みの少なく
とも一部の情報を取り込むステップと、入力された読み
の少なくともー部の情報を上記辞書を参照することによ
って言語表記に変換するステップと、変換の結果である
表記を確認し、その確認された言語表記情報を保持する
ステップと、確認済みの言語表記情報に含まれる情報に
基づいて文書を検索するステップと、検索により得られ
た文書に含まれる情報に基づき変換処理を調整するステ
ップとがプログラムされ記録されることを特徴とする。
【0010】上述した構成によれば、文書作成者が入力
する情報により新たに関連文書情報を検索し、そこに含
まれる情報に基づき変換処理を調整するため、処理の精
度が高まり、書き手の意図をより反映した文書入力を行
うことができ、使い勝手の向上がはかれる。
【0011】
【発明の実施の形態】図1は、本発明の自然言語入力処
理システムの実施形態を示すブロック図である。図にお
いて、101は入力部、102は制御部、103は出力
部、104は仮名漢字変換処理部、105は辞書部、1
06は確定文字列保持処理部、107は検索式生成部、
108は文書検索部、109は共起情報抽出部、110
は分野情報抽出部である。
【0012】図1に示す自然言語入力処理システムにお
いて、入力部101を介して読み情報をはじめとする、
ユーザーからの種々の操作情報が入力されシステムに取
り込まれる。取り込まれた情報は制御部102に送られ
て解析された後、各処理部104、106へ情報として
渡される。各処理部による処理結果はまた制御部102
に返され、言語表記情報をはじめとする必要な情報は出
力部103を通して出力される。入力された情報のう
ち、読み情報は仮名漢字変換処理部104に送られて処
理される。
【0013】仮名漢字変換処理部104は、辞書部10
5に保持される情報を参照しながら仮名漢字変換処理を
行なう。仮名漢字変換の方法は広く知られているので、
ここでは言及しないが、このうち辞書部105について
のみ後に詳細を述べる。変換結果は、制御部102を通
して出力部103から出力され、例えばディスプレーに
表示される。ユーザーは表示される情報に従って言語表
記の候補のうち所望のものを選択し、確定操作を行な
う。確定された文字列の情報は、順次確定文字列保持処
理部106により保持される。
【0014】一方、検索式生成部107では、確定文字
列保持処理部106から情報を受け取り、文書検索のた
めの検索式を生成する。文書検索部108は、生成され
た検索式を検索式生成部107から受け取り、制御部1
02を介しシステム内部、あるいは外部の文書検索部1
08を起動し、システム内部あるいは外部の文書データ
にアクセスし、検索された文書を受け取る。受け取った
データは共起情報抽出部109と、分野情報抽出部11
0へ送る。共起情報抽出部109は、文書検索部108
が受け取った被検索文書から共起情報を抽出し、共起辞
書として、辞書部105に追加する。分野情報抽出部1
10は、文書検索部108が受け取った被検索文書から
分野情報を抽出し、かな漢字変換処理部104に渡す。
かな漢字変換処理部104は、以降の変換を分野情報
抽出部110から受け取った分野情報と、共起情報抽出
部109により辞書部105に追加された共起情報を用
いることによりかな漢字変換処理を行なう。このことに
より変換の精度が向上する。以上の説明が本発明システ
ムの処理の流れの概要である。
【0015】次に、辞書部105に保持される辞書情報
について説明する。辞書は単語辞書と共起辞書からな
る。単語辞書には、読み情報、表記情報、品詞情報、頻
度情報等が保持されるほか、各単語の出現しやすい分野
を示す分野情報が保持されている。共起辞書には、単語
間の共起情報が保持されている。単語辞書ならびに共起
辞書に保持される情報、ならびにかな漢字変換処理部1
04における利用手段については、例えば先に挙げた特
開平6−266701号に詳細が述べられているためこ
こでは省略する。共起情報抽出部109での共起情報の
抽出手段も特開平6−52151号に詳細が述べられて
いるためここでの説明を省略する。分野情報抽出部11
0での分野情報の抽出手段であるが、これは先にあげた
特開平6−266701号における分野情報の抽出方法
や、文書分類装置などにおける特徴ベクトルによる処理
方法などが知られているのでここでは省略する。検索式
生成部107での検索式の生成手段であるが、これも特
開平5−79149号に詳細が述べられているのでここ
では省略する。
【0016】確定文字列保持処理部106にかかわる処
理の流れについて、図2に示すフローチャートを用いて
詳細を述べる。最初に、ステップ601では、バッファ
ーWの内容をクリアし、変数Lを0に設定する。ステッ
プ602で、ユーザーが表記を確定すると制御部102
より確定された言語表記の情報を受け取り、バッファー
Wにコピーする。次に、ステップ603で、バッファー
Wにセットされた文字数を調べ、変数Lにセットし、ス
テップ604の処理に進む。ステップ604ではバッフ
ァーWのL文字目の文字列が、句点または改行コードの
いずれにー致するかを調べ、ここで一致した場合には、
ステップ605の処理に進む。一致しない場合にはステ
ップ607の処理に進む。ステップ605では、バッフ
ァーSの1文字目からN文字目までの文字列の後ろにバ
ッファーWの文字列を加えた、N+L文字の文字列の情
報を検索式生成部107に出力し、ステップ606の処
理に進む。ステップ606では、バッファーSの内容を
クリアし、N=0とし、ステップ601の処理に戻る。
一方、ステップ607では、バッファーWの文字列をバ
ッファーSのN文字目の後ろにコピーし、N=N+Lと
して、ステップ601の処理へ進む。
【0017】次に、本発明の自然言語処理方法を実現す
る他の実施形態の動作について図3を用いて説明する。
システム構成は図1に示すブロック図と同じである。図
3は、図1に示す文書検索部108の内部構成を示すブ
ロック図である。図3において、文書検索部108は、
検索対象文書情報記憶部801と、検索方法情報記憶部
802、検索処理制御部本体803から成る。図1にお
ける制御部102では、ユーザーからかな漢字変換処理
の環境設定画面の起動が要求されるとその環境設定画面
を表示し、ここで検索環境設定が選択されると、例え
ば、図4に示すような画面表示を行い、ユーザーに、検
索対象とする文書の範囲や検索方法の指定等の情報の入
力を促す。ユーザーがシステムの指示に従い諸情報を設
定すると、検索対象文書情報記憶部801と検索方法情
報記憶部802にそれらの情報が保持され、かな漢字変
換処理部104を起動する毎にユーザーがこれらの情報
を設定しなくてもー度の設定でユーザーの好む環境設定
が行える。
【0018】以上説明のように、本発明によれば、ユー
ザーが新たに入力し確定した言語表記の情報を保持し、
保持された言語情報を検索式に加工して文書情報を検索
し、検索された文書情報から共起情報や分野情報を学習
することができるので、ユーザーがこれまでに全く入力
したことのないような内容の文書が入力された場合で
も、ユーザーの意図に応じた変換結果が得られやすくな
るため、処理の精度が向上し、ユーザーの負担が軽減さ
れる。
【0019】上述した発明の実施形態では、入力された
読み情報をかな漢字変換するシステムのみ例示して説明
したが、これに制限されるものではなく、例えば、特開
平8−235318号のように、入力された読み情報か
ら次の読み情報を予測した後、変換結果を表示するシス
テムにおいても同様の処理が可能である。その他、本発
明はその主旨を逸脱しない範囲内で様々な応用が可能で
ある。
【0020】
【発明の効果】以上説明のように本発明によれば、文書
作成者が入力し確認した言語情報を確定文字列保持処理
部106により処理し、その情報を用いて検索式生成部
107と文書検索部108により新たに関連文書情報を
検索することにより、検索結果に含まれる情報に基づき
変換処理を調整するため、処理の精度が高まり、書き手
の意図をより反映した文書入力を行うことができる。
【図面の簡単な説明】
【図1】本発明に係わる自然言語入力処理装置の概略構
成を示すブロック図、
【図2】図1における確定文字列保持処理部の処理の流
れを示すフローチャート、
【図3】図1における文書検索部のより詳細な構成を表
すブロック図、
【図4】図1における制御部102による画面表示のー
例を示す図、
【符号の説明】
101…入力部、102…制御部、103…出力部、1
04…仮名漢字変換処理部、105…辞書部、106…
確定文字列保持処理部、107…検索式生成部、108
…文書検索部、109…共起情報抽出部、110…分野
情報抽出部、

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 単語の読みの少なくとも一部と、表記と
    品詞を含む単語情報とを対応付けて記憶した辞書を参照
    することにより、入力される読み情報の少なくとも一部
    を言語表記に変換し、ユーザーがその表記を確認するこ
    とにより確認された言語表記情報を保持し、確認済みの
    言語表記情報に含まれる情報に基づいて文書を検索し、
    検索により得られる文書に含まれる情報に基づいて上記
    の変換処理を調整することを特徴とする自然言語入力処
    理方法。
  2. 【請求項2】 検索対象とする文書の範囲、もしくは検
    索方法の設定情報の入力を促し、ユーザによる入力を取
    り込み、文書検索のための環境設定を行なうことを特徴
    とする請求項1記載の自然言語入力処理方法。
  3. 【請求項3】 読みの少なくとも一部の情報を入力し、
    これを取り込む入力手段と、単語の読みの少なくとも一
    部と、表記と品詞を含む単語情報とを、対応付けて記憶
    する辞書手段と、前記入力手段により入力された読みの
    少なくとも一部の情報を、前記辞書手段を参照すること
    により言語表記に変換する変換手段と、変換の結果ユー
    ザーが表記を確認し、前記確認された言語表記情報を保
    持する確認済み言語情報保持手段と、前記確認済み言語
    情報保持手段に含まれる情報に基づき文書を検索する手
    段と、前記検索により得られた文書に含まれる情報に基
    づき前記変換手段による変換処理を調整する変換処理調
    整手段とを有することを特徴とする自然言語入力処理装
    置。
  4. 【請求項4】 検索対象とする文書の範囲、もしくは検
    索方法の設定入力を促す手段と、設定入力を取り込み文
    書検索のための環境設定を行なう手段とを具備すること
    を特徴とする請求項3記載の自然言語入力処理装置。
  5. 【請求項5】 あらかじめ辞書に記憶されていない情報
    を補い変換処理を行なう自然言語入力処理装置において
    用いられ、入力される読みの少なくとも一部の情報を取
    り込むステップと、入力された読みの少なくとも一部の
    情報を上記辞書を参照することによって言語表記に変換
    するステップと、変換の結果である表記を確認し、その
    確認された言語表記情報を保持するステップと、確認済
    みの言語表記情報に含まれる情報に基づいて文書を検索
    するステップと、検索により得られた文書に含まれる情
    報に基づき変換処理を調整するステップとがプログラム
    され記録されるコンピュータ読み取り可能な記録媒体。
  6. 【請求項6】 検索対象とする文書の範囲、もしくは検
    索方法の設定入力を促すステップと、設定入力を取り込
    み文書検索のための環境設定を行なうステップとがプロ
    グラムされ記録されるコンピュータ読み取り可能な請求
    項5記載の記録媒体。
  7. 【請求項7】 確定文字列の情報を第1のバッファに複
    写するステップと、バッファに複写された文字列の数を
    調べ変数Lとして設定するステップと、バッファのL文
    字目に、句点、もしくは改行コードが出現するまで第1
    のバッファの文字列を第2のバッファのN文字目の後ろ
    に複写するステップと、バッファのL文字目に、句点、
    もしくは改行コードが出現したときに上記第2のバッフ
    ァの1文字目からN文字目までの文字列の後ろに第1の
    バッファの文字列を追加したデータを検索式とし文書検
    索に反映させるステップとがプログラムされ記録される
    コンピュータ読み取り可能な請求項5記載の記録媒体。
JP10038991A 1998-02-20 1998-02-20 自然言語入力処理方法ならびに装置及び同方法がプログラムされ記録される記録媒体 Pending JPH11238057A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10038991A JPH11238057A (ja) 1998-02-20 1998-02-20 自然言語入力処理方法ならびに装置及び同方法がプログラムされ記録される記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10038991A JPH11238057A (ja) 1998-02-20 1998-02-20 自然言語入力処理方法ならびに装置及び同方法がプログラムされ記録される記録媒体

Publications (1)

Publication Number Publication Date
JPH11238057A true JPH11238057A (ja) 1999-08-31

Family

ID=12540614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10038991A Pending JPH11238057A (ja) 1998-02-20 1998-02-20 自然言語入力処理方法ならびに装置及び同方法がプログラムされ記録される記録媒体

Country Status (1)

Country Link
JP (1) JPH11238057A (ja)

Similar Documents

Publication Publication Date Title
AU2004200638B2 (en) Methods and systems for language translation
US5526259A (en) Method and apparatus for inputting text
JPH03268062A (ja) 機械翻訳電子メール装置における私用単語の登録装置
JPH11184855A (ja) 翻訳方法およびシステム
JPH11238057A (ja) 自然言語入力処理方法ならびに装置及び同方法がプログラムされ記録される記録媒体
JP2004318441A (ja) かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム
JP2000339310A (ja) 文書分類方法、文書分類装置、およびプログラムを記録する記録媒体
JP4054353B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JPS6151265A (ja) 日本語ワ−ドプロセツサ
JP2007171275A (ja) 言語処理装置及び現後処理方法
JP2000242464A (ja) 音声情報処理装置及び方法並びに音声情報処理プログラムを記憶した記憶媒体
JPH01214963A (ja) 辞書引き装置
JPH09185629A (ja) 機械翻訳方法
US6768990B2 (en) Information processing apparatus and method using a conceptual database
JP2001067375A (ja) 名称検索装置、キーボード及び名称検索プログラムを記録した記録媒体
JPH06266765A (ja) 文章検索装置
JP5343812B2 (ja) 特許文書中の単語または単語の組み合わせの例示装置、プログラム、及び方法
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPH0981555A (ja) 文書処理装置及びその方法
JPH09153038A (ja) 文書作成装置
JPH07319908A (ja) 文書検索方法及び文書検索装置
JPS61156465A (ja) 文書作成方式
JPS60204063A (ja) 漢字訂正方式
JPH04205545A (ja) 文書作成装置
JPH08180057A (ja) 文書検索方法および装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees