JP3768597B2 - 文字処理方法およびその装置 - Google Patents
文字処理方法およびその装置 Download PDFInfo
- Publication number
- JP3768597B2 JP3768597B2 JP13319496A JP13319496A JP3768597B2 JP 3768597 B2 JP3768597 B2 JP 3768597B2 JP 13319496 A JP13319496 A JP 13319496A JP 13319496 A JP13319496 A JP 13319496A JP 3768597 B2 JP3768597 B2 JP 3768597B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- semantic
- dictionary
- semantic classification
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の属する技術分野】
本発明は文字処理方法およびその装置に関し、特に入力された読み列を漢字かな混じり文字列に変換する文字処理方法およびその装置に関する。
【0002】
【従来の技術】
従来、日本語ワードプロセッサなどの文字処理装置では漢字かな混じり文の入力をかな漢字変換を使って行なうことが一般的である。
【0003】
かな漢字変換は単語辞書を参照することにより、入力された読み列を漢字かな混じりに変換するものである。単語辞書中では、各単語に対して名詞、サ変名詞、副詞、形容詞、形容動詞等の品詞情報が記述されており、かな漢字変換は読み列を解析して構成可能な文節候補を作成し、それらを組み合わせて変換候補を決定し、尤もらしい順に出力表示する。そして、出力表示された変換候補の中からオペレータが希望する変換候補を選択する。
【0004】
たとえば、読み列「しゅしょうのせいさく」に対しては「種」、「朱書」、「首相」、「首相の」、「書」、「賞」、「賞の」、「卯」、「宇野」、「野」、「乗せ」、「背」、「姓」、「政策」、「製作」などの文節候補が作成され、これらを組み合わせた「首相の政策」、「首相の製作」などが変換候補として出力表示される。「政策」、「製作」のうちでどちらが尤もらしいかは一概には言い切れないので、どちらが第1変換候補として出力表示されるかは予想できない。
そこで、変換効率を高めるために用例変換という手法が提案されている。用例変換は、共起する(特定の関係にある)単語のペア(個別用例)を予め用例辞書中に登録しておき、変換時に用例辞書を参照して変換候補を用例辞書中の用例に基づいて変更する手法である。たとえば、「首相の/政策」という個別用例を用例辞書に登録しておけば、「しゅしょうのせいさく」という読み列に対して「首相の政策」が第1変換候補として出力表示され、効率良く正しい変換を行うことができる。
【0005】
上記の例は単語と単語の特定の関係を記述した個別用例の例であるが、意味分類と単語との関係を記述した意味用例というものも提案されている。たとえば、「〈〜〉のせいさく」という連続した二文節において、〈〜〉が政治家を表わすときには「政策」という表記が尤もらしく、〈〜〉が家具などを表わすときには「製作」という表記が尤もらしい。
【0006】
そこでこの変換を正しく行なうために、「〈政治家〉の/政策」、「〈家具〉の/製作」という意味用例を用例辞書に予め登録しておくことが提案されている。なお、〈政治家〉は「首相」を、〈家具〉は「机」をそれぞれ上位概念で表したもので、〈政治家〉、〈家具〉などは「首相」、「机」などを含む意味分類であり、単語辞書には単語を含む意味分類が〈政治家〉であるか〈家具〉であるかを記述しておく。このように意味用例を登録しておくことにより、「首相の政策」、「机の製作」などを効率良く正しく変換することができるものと考えられる。
【0007】
ところが、日本語文として出現するこのような用例を予めすべて網羅して登録することは現実的に不可能であり、一般的な日本語文中で使用頻度が高いものを標準に登録した用例辞書を用いてかな漢字変換を行う文字処理装置がユーザに提供されていた。
【0008】
【発明が解決しようとする課題】
しかしながら、上記のような従来の文字処理装置では、一般的に使用頻度は低いが個々のユーザにとって使用頻度が高いものはユーザごとに各自で登録する必要があり、登録作業は繁雑であるためユーザにとって手間がかかるという課題があった。
【0009】
また、従来は個別用例のみが登録可能であり、意味用例を登録することが提案されてはいるものの、意味分類を指定する手段が存在しなかったために実際には意味用例は登録不可能であった。このため、個別用例のみを登録しておく場合には、たとえば「政策」と「製作」を区別するために、「机の製作」、「椅子の製作」、「本棚の製作」、「首相の政策」、「幹事長の政策」、「蔵相の政策」、「与党の政策」、「野党の政策」、「アメリカの政策」、「日本の政策」、「フランスの政策」等々、多数の個別用例を登録しておく必要があった。したがって、ユーザの手間がかかるうえに、登録する多数の個別用例のために多くのメモリ容量が大量に必要になるという課題もあった。
【0010】
本発明は上述の点に鑑みてなされたものであって、本発明の目的は、多数の個別用例を登録する手間をユーザから省くと共に、ユーザが必要とするメモリ容量を減らすことのできる文字処理方法およびその装置を提供することにある。
【0017】
【課題を解決するための手段】
上記目的を達成するために、本発明によれば、単語の読みと表記と意味分類とを対応付けた単語辞書と、共起する単語同士を対応付けた個別用例と共起する単語の意味分類と単語とを対応付けた意味用例とが登録された用例辞書と、プログラムに基づいて各種処理を実行する処理手段とを備えた文字処理装置により、入力された読み列を漢字かな混じり文字列に変換する文字処理方法において、共起する第1及び第2の単語を前記処理手段により取得する単語取得ステップと、取得された前記第1の単語の意味分類を前記単語辞書から前記処理手段により検索する検索ステップと、前記単語辞書において前記第1の単語と意味分類の一致する全ての単語について、前記用例辞書から、当該意味分類の一致する単語と前記第2の単語とを対応付けた個別用例を前記処理手段により検索する用例検索ステップと、前記用例検索ステップにおいて前記第1の単語と意味分類の一致する全ての単語に対して該当する個別用例が検索された場合に、当該一致する意味分類と前記第2の単語とを対応付けた意味用例を、前記処理手段により前記用例辞書に登録する登録ステップと、前記用例検索ステップにおいて検索された該当する個別用例を前記処理手段により前記用例辞書から削除する削除ステップとを含んでなる構成とした。
【0018】
また、本発明の他の態様によれば、単語の読みと表記と意味分類とを対応付けた単語辞書および共起する単語同士を対応付けた個別用例と共起する単語の意味分類と単語とを対応付けた意味用例とが登録された用例辞書に基づいて、入力された読み列を漢字かな混じり文字列に変換する文字処理装置において、共起する第1及び第2の単語を取得する単語取得手段と、取得された前記第1の単語の意味分類を前記単語辞書から検索する検索手段と、前記単語辞書において前記第1の単語と意味分類の一致する全ての単語について、前記用例辞書から、当該意味分類の一致する単語と前記第2の単語とを対応付けた個別用例を検索する用例検索手段と、前記用例検索手段により前記第1の単語と意味分類の一致する全ての単語に対して該当する用例が検索された場合に、当該一致する意味分類と前記第2の単語とを対応付けた意味用例を前記用例辞書に登録する登録手段と、前記用例検索手段により検索された該当する個別用例を前記用例辞書から削除する削除手段とを具備してなる構成とした。
【0041】
【発明の実施の形態】
以下、図面を参照しながら本発明の実施の形態を詳細に説明する。
【0042】
(第1の実施の形態)
図1は本発明を適用した文字処理装置の第1の実施の形態の構成を示すブロック図である。
【0043】
図1に示す文字処理装置1は、システムバス2を介して、CPU(Central Processing Unit)3,ROM4,RAM5,キーボード6,カーソルレジスタ7,表示用バッファメモリ8,表示装置コントローラ9,表示装置10,キャラクタジェネレータ11,および外部ディスクメモリ12を互いに接続する構成とされている。また、表示装置コントローラ9はカーソルレジスタ7およびキャラクタジェネレータ11と直接接続されている。
【0044】
CPU3は演算部と制御部とを含んで構成されており、文字処理のための演算、論理判断等を行なう。またCPU3は、システムバス2中のアドレスバス2a,データバス2b,コントロールバス2cを介して、これらの各バスに接続された各ブロックを制御する。アドレスバス2aを介して、CPU3の制御の対象となるブロックを指示するアドレス信号が転送される。データバス2bを介して、各ブロック相互間のデータ転送が行われる。コントロールバス2cを介して、CPU3の制御の対象となる各ブロックのコントロール信号が転送され、制御対象ブロックに印加される。
【0045】
ROM(リードオンリメモリ)4は読み出し専用の記憶媒体である。ROM4内に設けられているプログラムエリア41には、後にフローチャートを参照して詳述するとおりCPU3により実行される本発明に係る制御プログラムを予め記憶させてある。この制御プログラムは読み出し可能とされている。なお、ROM4に代えて、ハードディスク、フロッピィディスク、CD−ROM等の記憶媒体に制御プログラムを記憶させて、これらから読み出す装置(ハードディスクドライブ装置、フロッピィディスクドライブ装置、CD−ROMドライブ装置等)を設けてもよい。
【0046】
RAM5は1ワード16ビットの構成の書込み読み出し可能なランダムアクセスメモリであり、上述した各ブロックからの各種データを一時的に記憶するために使用される。RAM5内には、入力バッファ51,かな漢字変換を行うための単語辞書52,用例辞書53,意味辞書54,用例一覧表示用バッファ55,およびテキストバッファ56が構成されている。単語辞書52には単語を含む意味分類が記述されており、用例辞書53には単語と単語間あるいは単語と意味分類間の共起関係が記述されている。また、意味辞書54には意味分類に関する情報が記述されている。テキストバッファ56には、入力編集中のテキストデータが格納される。
【0047】
図2は単語辞書52の構成を示す説明図である。
【0048】
単語辞書52の各レコードは、「読み」、「表記」、「品詞」、「単語尤度」、「意味分類」の各フィールドから構成される。読みフィールド52aには単語の読みが、表記フィールド52bには単語の表記が、品詞フィールド52cには単語の品詞が登録される。
【0049】
単語尤度フィールド52dには頻度情報としてその単語自体の尤もらしさを示す尤度値が1〜5の値で登録される。尤度値5は最も尤もらしいという意味であり、値が大きいほど尤もらしく、値が小さいほど疑わしいと解釈される。尤度値0は全く考えられないということを意味するので単語尤度の値としては存在しない。
【0050】
意味分類フィールド52eには、その単語を含む意味分類が登録される。図2において、各意味分類は分かりやすさのためにその意味分類の表記が登録されるものとして〈意味分類の表記〉で図示しているが、実際には意味分類コードが登録される。さらに各意味分類のそれぞれに対応して、その単語がその意味分類に含まれると解釈した場合の尤もらしさの値(優先度)が1〜5の値で登録される。
【0051】
優先度5は最も尤もらしいという意味であり、値が大きいほど尤もらしく、値が小さいほど疑わしいと解釈される。ただし、優先度5は個別単語と同程度の優先度を持つことになるので普通は付与されない。また、優先度0は全く考えられないということを意味するので優先度の値としては存在しない。
【0052】
たとえば単語52fに関しては、読みとして「しゅしょう」が、表記として「首相」が、品詞として「名詞」が、単語尤度の値として「5」が、意味分類として〈政治家〉および〈役職〉が、意味分類〈政治家〉および〈役職〉に対応する優先度の値としてそれぞれ「4」および「3」が登録される。このように、意味分類フィールド52eにはその単語を含む意味分類が、一般には一個の単語に対して複数個登録され得る。
【0053】
図3は用例辞書53の構成を示す説明図である。
【0054】
用例辞書53の各レコードは、「係り単語」、「助詞」、「受け単語」、「優先度」の各フィールドから構成される。
【0055】
係り単語フィールド53aおよび受け単語フィールド53cには、共起する(特定の関係にある)単語のペアを対応させて記述する。もし、個別用例ではなくて意味用例であるときは一方の単語の代わりに意味分類を記述する。助詞フィールド53bには単語と単語のペアまたは意味分類と単語のペアを結び付ける助詞を記述する。
【0056】
優先度フィールド53dにはその用例の尤もらしさを示す尤度値が1〜5の値で登録される。尤度値5は最も尤もらしいという意味であり、値が小さくなるにつれて疑わしいと解釈される。尤度値0は全く考えられないということを意味するので優先度の値としては存在しない。
【0057】
たとえば意味用例53eに関しては、係り単語として意味分類「〈政治家〉」が、助詞として「の」が、受け単語として「政策」が、優先度の値として「5」が登録される。
【0058】
図3中に一例として示される他の意味用例は、「〈政治家〉の/政策」(優先度5)、「〈政治家〉を/追及する」(優先度3)、「〈政党〉の/政策」(優先度5)、「〈家具〉の/製作」(優先度3)となる。また個別用例は、「政策の/間違い」(優先度5)、「政策の/実現性」(優先度3)、「政策を/立案する」(優先度5)となる。
【0059】
図4は意味辞書54の構成を示す説明図である。
【0060】
意味辞書54の各レコードは、「意味分類」、「定義文」、「語例」の各フィールドから構成され、意味分類コードの順に登録される。
【0061】
意味分類フィールド54aにはその意味分類の表記が登録される。定義文フィールド54bにはその意味分類を定義する定義文が登録される。語例フィールド54cにはその意味分類に含まれる単語の語例が、一般には複数例登録される。各フィールドに登録されたこれらの情報は、意味分類の一覧を表示する際に使用される。たとえば意味分類54dに関しては、意味分類の表記として「〈政党〉」が、その定義文として「政党や政治界の派閥」が、その語例としてそれぞれ「党」および「新党」および「与党」が登録される。オペレータはこれらの情報に基づき、自分が登録したい意味用例にどの意味分類を使用すれば良いかを把握することができる。
【0062】
ここで図1に戻って説明するに、キーボード6は、アルファベット、ひらがな、カタカナ、数字、記号兼用の入力キー等の文字入力キー、カーソル移動を指示するカーソル移動キーや、その他の各種ファンクションキーを備えた一般的な構成である。ファンクションキーとしては、用例登録キー、意味分類一覧キー、実行キー、登録キー、削除キー、用例一覧キー、絞り込みキー、変換キー、終了キー、次画面キー等を備えている。
【0063】
CPU3によってカーソルのアドレスをカーソルレジスタ7に書き込むことができ、またカーソルレジスタ7に格納されたアドレスを読み出すことができる。表示装置コントローラ9は、たとえば陰極線管(CRT)等を用いた表示装置10の、カーソルレジスタ7に格納されたアドレスに応じた画面上の位置にカーソルを表示するように制御する。さらに、表示装置10におけるドット構成の表示パターンを制御する。
【0064】
表示用バッファメモリ8には、表示すべきデータのパターンが一時的に格納される。表示装置コントローラ9はさらに、表示用バッファメモリ8に格納されたデータパターンを表示装置10に表示するように制御する。
【0065】
キャラクタジェネレータ11は、表示装置10に表示する文字、記号のパターンを生成し、記億しておくものである。
【0066】
外部ディスクメモリ12はテキストファイル上にテキストデータ等を記憶するための外部記憶装置であり、後述する一括用例登録/削除ファイルおよび一括用例登録ファイルを格納する。テキストデータ等は必要に応じて外部ディスクメモリ12に格納され、また格納されたデータは、必要に応じてキーボード6からの指示入力により読み出される。
【0067】
上記した各ブロックからなる本発明の文字処理装置1は、キーボード6からの各種のキー入力に応じて動作する。キーボード6からキー入力データが供給されるとまずインタラプト信号がCPU3に送られ、ROM4内に記憶してある各種の制御信号をCPU3が読み出し、これらの制御信号に従って各種の制御が行なわれる。
【0068】
次に、図5は意味用例登録を行う際の操作手順の一例を示す説明図である。
【0069】
まず用例登録キーを打鍵すると、表示装置10の画面には、(a)で示すように用例登録/削除ダイアログ21が表示される。用例登録/削除ダイアログ21には、係り単語表記入力部22,係り単語品詞入力部23,助詞入力部24,受け単語表記入力部25,受け単語品詞入力部26,および優先度入力部27が設けられている。なお、図中で黒塗りの部分はカーソルを示す。
【0070】
そして、係り単語(単語または意味分類)の表記、品詞、受け単語の表記、品詞、係り単語が受け単語に係る際の助詞、およびこの用例自体の優先度を、各入力部にカーソルを移動させてキーボード6から入力することで指定することができる。
【0071】
まず、助詞として「の」、受け単語の表記として「政策」(品詞は名詞)、優先度として「5」を入力すると、用例登録/削除ダイアログ21は(b)で示すように係り単語の入力待ち状態になる。ここで、係り単語として意味分類を指定するために意味分類一覧キーを打鍵すると、(c)で示すように単語指定ダイアログ28が表示され、意味分類一覧を表示する基になる単語を入力可能な状態となる。
【0072】
この状態でキーボード6から「しゅしょう」と打鍵してかな漢字変換し「首相」を入力すると、(d)で示すように単語指定ダイアログ28内の指定単語入力部29に「首相」が入力される。次に、実行キーを打鍵すると(e)で示すように単語指定ダイアログ28の表示が消去されて意味分類一覧ウインドウ30が表示される。意味分類一覧ウインドウ30には、意味辞書54を検索して得られた指定単語「首相」を含む意味分類の一覧が表示される。この図から分かるように各意味分類の表記に対してその定義文と例単語(指定単語「首相」が含まれている)が同時に表示されるので、どの意味分類を指定すれば良いかオペレータに分かり易いようになっている。
【0073】
なおここでは、意味分類の一覧は意味分類コードの順にソートされている例を示したが、別の順にソートされている方が便利な場合もある。使い方に応じて意味分類の読みのあいうえお順、意味分類の漢字コードのJISコード順などでソートしてもよい。
【0074】
ここで、意味分類一覧ウインドウ30内の指定を希望する意味分類〈政治家〉のところにカーソルを合わせて実行キーを打鍵すると、(f)で示すように意味分類一覧ウインドウ30の表示が消去されて、用例登録/削除ダイアログ21の係り単語表記入力部22に指定した意味分類の表記〈政治家〉が入力される。この状態で登録キーを打鍵すると、用例登録/削除ダイアログ21で指定された意味用例「〈政治家〉の/政策」が用例辞書53に登録される。一方、この状態で削除キーを打鍵すると、この意味用例「〈政治家〉の/政策」は用例辞書53から削除される。
【0075】
ここでは意味分類一覧ウインドウ30に表示される意味分類の一覧を参照して意味分類を指定して入力する方法を説明したが、どのような意味分類がサポートされているかを熟知しているオペレータなら、(b)で示した状態において、いきなり意味分類〈政治家〉を入力することもできる。そうすれば、破線で示すようにすぐに(f)で示した状態に移ることができ、単語指定ダイアログ28や意味分類一覧ウインドウ30を表示して指定単語を入力したり意味分類を指定する必要がなく、操作が簡単になる。
【0076】
またここでは、意味分類の一覧を表示するときに、オペレータが入力した特定の指定単語を含む意味分類を表示する方法を説明したが、もし全ての意味分類の一覧を表示したい場合には、(c)で示した状態において、指定単語を何も入力せずに実行キーを打鍵すれば良い。そうすれば、(c)で示した状態から(e)で示した状態になり、この状態において意味辞書54に登録されている全ての意味分類の一覧が意味分類一覧ウインドウ30内に表示される。
【0077】
図6は用例辞書53から意味用例を削除する際の操作手順の一例を示す説明図である。
【0078】
用例一覧キーを打鍵すると、表示装置10の画面には(a)で示すように用例一覧ウインドウ31が表示される。用例一覧ウインドウ31には、初期状態では用例辞書53に登録されている全ての用例の一覧が表示される。表示順は、意味用例の場合の意味分類についてはコード順、個別用例の場合の単語については表記のJISコード順となっている。もちろん、ソート法の工夫により他の適当な順序で表示することができる。たとえば、個別用例と意味用例が全く分離した状態で表示するようにすることもできる。
【0079】
ここで絞り込みキーを打鍵すると(b)で示す状態になり、単語指定ダイアログ28が表示され、削除を希望する意味用例が含む単語を指定することができる。たとえば、キーボード6から「せいさく」と打鍵してかな漢字変換し「政策」を入力すると、(c)で示すように単語指定ダイアログ28の指定単語入力部29に「政策」が入力される。次に、実行キーを打鍵すると単語指定ダイアログ28の表示が消去されて(d)で示す状態となり、「政策」を含む用例だけの一覧を用例一覧ウインドウ31に表示することができる。
【0080】
なお、(c)で示した単語指定ダイアログ28において意味分類を指定して(たとえば、〈政治家〉と指定する)実行キーを打鍵すると、その意味分類を含む意味用例と指定単語「政治家」を含む個別用例だけを表示させることもできる。また、意味分類の表記が分からない場合にはさらに意味分類一覧キーを打鍵して意味分類の一覧を表示させ、その中から目指す意味分類を選択することで意味分類を指定することもできる。
【0081】
そして、(d)で示す状態の用例一覧ウインドウ31において、削除したい意味用例(たとえば「〈政治家〉の/政策」)にカーソルを合わせ削除キーを打鍵すると、その意味用例を用例辞書53から削除することができる。
【0082】
次に、上述した意味用例登録と意味用例削除を含む変換候補出力動作についてフローチャートを参照して説明する。
【0083】
図7は本発明の文字処理方法の第1の実施の形態のメインルーチンを表すフローチャートである。図7以下、図11までのフローチャートで示される処理手順は、図1に示した文字処理装置1のROM4内のプログラムエリア41に格納された制御プログラムに基づいて、CPU3が制御、論理判断を行うことにより実行される。
【0084】
まずステップS70において、キーボード6を打鍵して入力されたキー入力データを取り込む。続くステップS71において、打鍵されたキーの種類を判定し、その判定結果に基づいて各キーの種類に応じた処理(ステップS72,S74,S76,またはS78)に分岐する。
【0085】
用例登録キーが打鍵されたと判定したときはステップS72の用例登録/削除処理に分岐し、後に図8を参照して説明するとおりの処理を行なう。また、用例一覧キーが打鍵されたと判定したときは、ステップS74の用例一覧処理に分岐し、後に図9および図10を参照して説明するとおりの処理を行なう。
【0086】
また、変換キーが打鍵されたと判定したときは、ステップS76のかな漢字変換処理に分岐し、後に図11を参照して説明するとおりの処理を行なう。そして、その他のキーが打鍵されたと判定したときはステップS78の処理に分岐し、文字削除、移動、キー入力された読み列を入力バッファ51に蓄積する処理等の通常の文字処理装置において行なわれるその他の処理を行なう。
【0087】
分岐した各処理が終了するとステップS70の処理に戻り、上述したステップS70〜S78の処理を繰り返し実行する。
【0088】
図8は図7中のステップS72の用例登録/削除処理について詳細に表すフローチャー卜である。
【0089】
用例登録キーが打鍵されたと判定するとまずステップS205において、用例登録/削除ダイアログ21を表示する準備のために各エディット項目(係り単語の表記、品詞、受け単語の表記、品詞、係り単語が受け単語に係る際の助詞、および用例自体の優先度)に割り当てられた変数をクリアする等の初期設定を行う。
【0090】
初期設定が済むとステップS210において、そのときの変数の値に従って表示装置10に用例登録/削除ダイアログ21を表示する(図5(a)参照)。
【0091】
ステップS215において、キー打鍵が行なわれてキーデータが入力されるまで待ち、入力されたキーデータを取り込む。
【0092】
ステップS220において、取り込まれたキーデータを判別して打鍵されたキーの種類を判定し、打鍵されたキーの種類に応じた処理(ステップS225,S230,S235,またはS240)に分岐する。
【0093】
意味分類一覧キー、登録キー、削除キー以外の文字入力キー、カーソル移動キーなどのその他のキーが打鍵されたと判定したときは、ステップS225のその他の処理に分岐し、文字入力、画面制御などの処理を行ってステップS210の処理に戻り、用例登録/削除ダイアログ21を表示し続け、ステップS215,S220の処理を再び実行する。
【0094】
そしてステップS220において意味分類一覧キーが打鍵されたと判定したときは、ステップS230の単語入力処理に分岐し指定単語が入力されるとステップS260において、当該指定単語を単語辞書52から検索し、当該指定単語を含む意味分類を取得する。なお、もし検索しても指定単語が存在しないためにこの意味分類を得られないときは、単語辞書52中の全ての単語について各単語を含む意味分類を取得する。
【0095】
意味分類を取得するとステップS265において、取得した意味分類の表記に対応する定義文と語例を意味辞書54を検索して求め、これらの情報を意味分類の表記と共に意味分類一覧ウインドウ30に一覧表示する。この状態で、オペレータがカーソルを移動して指定を希望する意味分類を選択し実行キーを打鍵すると、ステップS270において意味分類一覧ウインドウ30を消去し、用例登録/削除ダイアログ21の係り単語表記入力部22に選択された意味分類の表記を流し込む表記流し込み処理を行う。表記流し込み処理を終了すると再びステップS210の処理に戻り、用例登録/削除ダイアログ21を表示し続け、ステップS215,S220の処理を再び実行する。
【0096】
ステップS220において登録キーが打鍵されたと判定したときはステップS235の用例登録処理に分岐し、用例登録/削除ダイアログ21で指定された条件の一つの用例を用例辞書53に登録する。用例登録処理を終了するとステップS275の処理に進み、用例登録/削除ダイアログ21を消去し、図7に示したメインルーチンにリターンする。
【0097】
また、ステップS220において削除キーが打鍵されたと判定したときはステップS240の用例削除処理に分岐し、用例登録/削除ダイアログ21で指定された条件の一つの用例を用例辞書53から削除する。用例削除処理を終了するとステップS275の処理に進み、用例登録/削除ダイアログ21を消去し、図7に示したメインルーチンにリターンする。
【0098】
このようにステップS72の用例登録/削除処理では、キー入力データを取り込んでキー種類判定処理を繰り返し行い、この判定結果に応じて登録または削除を希望する用例の条件を用例登録/削除ダイアログ21に逐次設定し、設定された条件の用例を一回のキー入力毎に一つずつ登録、または削除している。
【0099】
図9は図7中のステップS74の用例一覧処理について詳細に表すフローチャートである。
【0100】
用例一覧キーが打鍵されるとまずステップS405において、用例一覧ウインドウ31を表示する準備のために各種の変数を初期設定する。初期設定が済むとステップS410に進み、用例辞書53を参照して用例一覧表示用バッファ55に全用例のリストを作成する。
【0101】
リストを作成するとステップS415において、用例一覧表示用バッファ55に作成されたリストに従って、図6(a)に示したように表示装置10に用例一覧ウインドウ31を表示する。用例一覧ウインドウ31には、用例辞書53に登録されている全ての用例の一覧が表示される。
【0102】
用例一覧ウインドウ31を表示した状態でステップS420において、キー打鍵が行なわれてキーデータが入力されるまで待ち、入力されたキーデータを取り込む。
【0103】
続くステップS425において、取り込まれたキーデータを判別して打鍵されたキーの種類を判定し、打鍵されたキーの種類に応じた処理(ステップS430,S435,S440,またはS445)に分岐する。
【0104】
絞り込みキーが打鍵されたと判定したときはステップS430の絞り込み処理に分岐し、単語指定ダイアログ28を表示して(図6(b)参照)オペレータに単語を指定入力させる(図6(c)参照)ことにより用例を絞り込み、絞り込まれた用例一覧のリストを用例一覧表示用バッファ55に作成する。この絞り込み処理については、後に図10を参照して詳細に説明する。そして単語指定ダイアログ28を消去して絞り込み処理を終了するとステップS415の処理に戻り、図6(d)に示したように、たとえば指定単語「政策」で絞り込まれた「政策」を含む用例一覧のリストに基づいて用例一覧ウインドウ31を表示した後、ステップS420,S425の処理を再び実行する。
【0105】
削除キーが打鍵されたと判定したときはステップS435の用例削除処理に分岐し、カーソルのある行の用例(たとえば〈政治家〉の政策)を用例辞書53から削除する。その後、ステップS415の処理に戻り、用例一覧ウインドウ31を表示し続け、ステップS420,S425の処理を再び実行する。
【0106】
カーソル移動キー、次画面キーなどのその他のキーが打鍵されたと判定したときはステップS440のその他の処理に分岐し、画面制御などのその他の処理を行う。その他の処理を終了するとステップS415の処理に戻り、用例一覧ウインドウ31を表示し続け、ステップS420,S425の処理を再び実行する。
【0107】
そして、終了キーが打鍵されたと判定したときはステップS445の用例一覧ウインドウ消去処理に分岐し用例一覧ウインドウ31を消去して用例一覧処理を終了し、図7に示したメインルーチンにリターンする。
【0108】
図10は図9中のステップS430の絞り込み処理について詳細に表すフローチャートである。
【0109】
絞り込みキーが打鍵されたと判定するとまずステップS1010において、単語指定ダイアログ28を表示する準備のために、エディット項目(指定単語)に割り当てられた変数をクリアする等の初期設定を行う。
【0110】
初期設定が済むとステップS1020において、そのときの変数の値に従って用例一覧ウインドウ31に重ねて単語指定ダイアログ28を表示する。
【0111】
単語指定ダイアログ28を表示するとステップS1030において、キー打鍵が行なわれてキーデータが入力されるまで待ち、入力されたキーデータを取り込む。
【0112】
続いてステップS1040において、取り込まれたキーデータを判別して打鍵されたキーの種類を判定し、打鍵されたキーの種類に応じた処理(ステップS1060,S1050,またはS1070)に分岐する。
【0113】
意味分類一覧キーが打鍵されたと判定したときはステップS1050の単語入力処理に分岐し、図6(b)に示したとおりに単語指定ダイアログ28を表示し、オペレータに指定を希望する単語を入力させる。
【0114】
続いてステップS1080において、ステップS1050において入力された指定単語を単語辞書52から検索し、当該指定単語を含む意味分類を取得する。なお、もし検索しても指定単語が存在しないためにこの意味分類を得られないときには、意味辞書53から全ての意味分類を取得する。
【0115】
意味分類を取得するとステップS1090において、取得した意味分類の表記に対応する定義文、語例を意味辞書54から求め、意味分類一覧ウインドウ30を表示してこれらの情報を意味分類の表記と共に一覧表示し(図6では図示を省略した)、オペレータに希望する意味分類を選択させる意味分類一覧表示処理を実行する。
【0116】
そして、オペレータがカーソルを移動して希望する意味分類を選択し実行キーを打鍵すると、ステップS1100において、意味分類一覧ウインドウ30を消去して選択された意味分類の表記を図6(c)に示したとおり単語指定ダイアログ28の指定単語入力部29に入力する表記流し込み処理を行う。表記流し込み処理を終了すると再びステップS1020の処理に戻り、単語指定ダイアログ28を表示し続け、ステップS1020,S1040の処理を再び実行する。
【0117】
カーソル移動キー、次画面キーなどの意味分類キーおよび実行キー以外のその他のキーが打鍵されたと判定したときはステップS1060の処理に分岐し、画面制御などのその他の処理を行う。その他の処理を終了するとステップS1020の処理に戻り、単語指定ダイアログ28を表示し続け、ステップS1030,S1040の処理を再び実行する。
【0118】
実行キーが打鍵されたと判定したときはステップS1070の処理に分岐し、単語指定ダイアログ28を消去する。単語指定ダイアログ28を消去した後、ステップS1110において、単語指定ダイアログ28で指定された単語または意味分類を含む用例のみを用例辞書53から抽出し、抽出された用例のリストを用例一覧表示用バッファ55に作成し、これに基づいて用例一覧ウインドウ31を図6(d)に示したとおりに表示し、図9に示した用例一覧処理にリターンする。
【0119】
図11は図7中のステップS76のかな漢字変換処理について詳細に表すフローチャー卜である。
【0120】
変換キーが打鍵されるとまずステップS605の文節候補列作成処理において、キー入力されて入力バッファ51に蓄積された読み列を読み出し、これを形態素解析することにより文節候補列を何通りか作成する。
【0121】
続くステップS610の第1変換候補決定処理において、作成された文節候補列の一つ一つに対して文尤度(文節候補の列から構成される文の尤もらしさを表す値)を計算し、文尤度の値が最大となる文節候補列を求め、この文節候補列を第1変換候補に決定する。ここで、文尤度の計算方法とその一例について説明する。
【0122】
図12は文尤度の計算方法と計算例を示す説明図である。
【0123】
文尤度は値が大きいほど尤もらしいことを意味し、文節尤度の和、文節間尤度の和、および用例尤度の和を加算することにより算出される。
【0124】
文節尤度は各文節候補の尤もらしさを表すものであり、値が大きいほど尤もらしいことを意味する。文節尤度としては、その文節中の自立語の単語辞書52に記載されている単語尤度の値が使用される。
【0125】
文節間尤度は連続する文節候補間の接続の尤もらしさを表すものであり、本実施の形態では(文節間尤度)=−30で一定値とする。なお、n文節で構成されている文の文節間は(n−1)あるので、文節間尤度の和は必ず(−30)×(n−1)となる。
【0126】
用例尤度は、各文節間に適用されている用例の一つ一つについて文尤度に加算される。用例尤度は、各用例に記述されている用例の優先度の4倍の値にその用例が含む意味分類の優先度を乗じて5で除した値から、その用例を適用する際に飛び越す文節数の2倍の値を減ずることで算出される。ただし、個別用例の場合は用例の優先度は5であるものと解釈する。また、上記のように計算して得た用例尤度の値がもしも0以下になったときは、用例尤度の下限値として0を採用する。
【0127】
上記のように計算すると、図12中の[文尤度の計算の例]に示すとおり、たとえば「首相の/政策」の文尤度は(−4)となり、また「首相の/製作」の文尤度は(−20)となる。したがって、「首相の/政策」の文尤度(−4)の方が「首相の/製作」の文尤度(−20)よりも大きいため、「首相の政策」が第1変換候補として決定される。
【0128】
ここで図11のフローチャートに戻って説明するに、ステップS610で第1変換候補を決定するとステップS615の変換結果出力処理に進み、決定された第1変換候補の文節候補列をテキストバッファ56に出力する。すなわち、上記の計算例に従えば「首相の政策」がテキストバッファ56に出力される。テキストバッファ56に出力された文節候補列は、表示装置10に表示される。
【0129】
このように、読み列が正しく漢字かな混じり変換されて出力表示される理由は、単語辞書52中に存在する単語52f(表記は「首相」)に意味分類〈政治家〉が登録されており、用例辞書53中に意味分類〈政治家〉を含む意味用例53e「〈政治家〉の/政策」が登録されているためである。
【0130】
以上説明したように、本発明の第1の実施の形態によれば、オペレータが意味分類を指定することで用例辞書53に意味用例を登録することができるので、多数の個別用例を登録することなく希望する正しい変換結果を得ることができる。このため、多数の個別用例を登録する必要がないので用例を記憶するためのモリ容量が少なくて済むので装置を安価に構成することができ、さらに用例を登録する手間を省くことができるため操作が簡単になる。
【0131】
また、オペレータが誤った意味用例を登録した場合には、用例登録/削除ダイアログに表示された用例からこれを選択して削除することもできるので、誤った意味用例を使用することなく正しい変換を行うことができる。
【0132】
また、オペレータが意味用例を登録する際に、使用可能な意味分類の表記をその意味分類の定義文および語例と共に意味辞書53に登録しておき、これを一覧表示する機能を有するので、オペレータはこの一覧表示を参照して意味分類を指定することができるため、希望する意味用例を間違いなく容易に登録することができる。
【0133】
また、上記の意味分類指定の際、単語を指定することでその単語が含まれる意味分類に絞って意味分類を表示する機能を有するので、オペレータによって希望する意味分類を間違いなく容易に指定することができる。
【0134】
(第2の実施の形態)
次に、本発明の第2の実施の形態について説明する。
【0135】
本実施の形態の文字処理装置は、図1に示した文字処理装置1のブロック構成と同一構成とすることにより実現される。ただし、キーボード6は、ファンクションキーとして一括用例登録キーおよび一括用例削除キーをさらに備える必要がある。また、ROM4に格納される制御プログラムは後述するとおり第1の実施の形態の制御プログラムとは異なっており、また外部ディスクメモリ12のテキストファイル上に一括用例登録/削除ファイルを予め作成しておく必要がある。
図13は一括用例登録/削除ファイルの構成を示す説明図である。
【0136】
一括用例登録/削除ファイル60には、登録または削除の対象となる意味用例および個別用例が1行にそれぞれ1用例ずつ記述されている。
【0137】
一括用例登録/削除ファイル60中の各用例の一般形は、係り単語表記フィールド61,係り単語品詞フィールド62,助詞フィールド63,受け単語表記フィールド64,および受け単語品詞フィールド65が順番に記述されて構成され、各フィールド間はカンマ「,」で区切られている。
【0138】
用例が意味用例である場合、係り単語表記フィールド61には意味分類の表記が記述され、係り単語品詞フィールド62には0個の文字で構成されるヌル文字列が記述される。たとえば意味用例66に関しては、係り単語表記フィールド61には「〈政治家〉」が、係り単語品詞フィールド62にはヌル文字列が、助詞フィールド63には「の」が、受け単語表記フィールド64には「任務」が、受け単語品詞フィールド65には「名詞」がそれぞれ記述されている。
【0139】
また、たとえば個別用例67に関しては、係り単語表記フィールド61には「政策」が、係り単語品詞フィールド62には「名詞」が、助詞フィールド63には「を」が、受け単語表記フィールド64には「立案」が、受け単語品詞フィールド65には「サ変名詞」がそれぞれ記述されている。
【0140】
このような一括用例登録/削除ファイル60を予め作成して外部ディスクメモリ12に記憶させておき、一括用例登録キーを打鍵するとこれがテキストバッファ55に読み込まれ、一括用例登録/削除ファイル60に登録されている用例(意味用例と個別用例)が一括して用例辞書53に登録される。また、一括用例削除キーを打鍵すると、一括用例登録/削除ファイル60に登録されている用例(意味用例と個別用例)が一括して用例辞書53から削除される。
【0141】
ここで、上述の意味一括用例登録/削除動作をフローチャートに従って説明する。
【0142】
図14は本発明の文字処理方法の第2の実施の形態のメインルーチンを表すフローチャートである。図14において、図7中の各ステップと同一の処理を行うステップには同一ステップ番号を付してある。この図14および後述する図15,並びに前述した図8〜図11に示したフローチャートで示される処理手順は、図1に示した文字処理装置1のROM4内のプログラムエリア41に第1の実施の形態で用いられた制御プログラムとは異なる制御プログラムを格納し、当該プログラムに基づいてCPU3が制御、論理判断を行うことにより実行される。
【0143】
まずステップS70において、キーボード6を打鍵して入力されたキーデータを取り込む。続くステップS71において、取り込まれたキーの種類を判定し、その判定結果に基づいて各キーの種類に応じた処理(ステップS72,S74,S76,S78,またはS150)に分岐する。
【0144】
用例登録キーが打鍵されたと判定したときはステップS72の用例登録/削除処理に分岐し、図8を参照して説明したように用例登録/削除処理を行なう。また、用例一覧キーが打鍵されたと判定したときは、ステップS74の用例一覧処理に分岐し、図9および図10を参照して説明したように用例一覧処理を行なう。また、変換キーが打鍵されたと判定したときは、ステップS76のかな漢字変換処理に分岐し、図11を参照して説明したようにかな漢字変換処理を行なう。
上記の用例登録キー、用例一覧キー、変換キー、および一括用例登録キー、一括用例削除キー以外のその他のキーが打鍵されたと判定したときはステップS78の処理に分岐し、文字削除、移動、キー入力された読み列を入力バッファ51に蓄積する処理等の通常の文字処理装置において行なわれるその他の処理を行なう。
【0145】
そして、一括用例登録キーまたは一括用例削除キーが打鍵されたと判定したときはステップS150の一括用例登録/削除処理に分岐し、図15を参照して説明するように一括用例登録/削除処理を行なう。
【0146】
分岐した各処理が終了するとステップS70の処理に戻り、上述したステップS70〜S78,S150の処理を繰り返し実行する。
【0147】
図15は図14中のステップS150の一括用例登録/削除処理について詳細に表すフローチャートである。
【0148】
一括用例登録キーまたは一括用例削除キーが打鍵されたと判定するとまずステップS152において、外部ディスクメモリ12から一括用例登録/削除ファイル60をテキストバッファ55に読み込む。
【0149】
ステップS154において、読み込まれた一括用例登録/削除ファイル60の一行から係り単語の表記と品詞を取得する。次にステップS156において、対応する助詞を取得する。次にステップS158において、対応する受け単語の表記と品詞を取得する。
【0150】
ステップS154〜S158の処理で一括用例登録/削除ファイル60の一行に記述された一個の用例を取得するとステップS160のキー判定処理に進み、打鍵されたキーが一括用例登録キーかを判定する。打鍵されたキーが一括用例登録キーである(Yes)と判定したときはステップS162の用例登録処理に分岐し、ステップS154〜S158で取得した一個の用例を用例辞書53に登録する。用例登録処理を終了するとステップS166の判定処理に進む。
【0151】
一方、ステップS160において、打鍵されたキーが一括用例登録キーではない(No)と判定したときは一括用例削除キーが打鍵されたので、ステップS164の用例削除処理に分岐し、ステップS154〜S158で取得した一個の用例を用例辞書53から削除する。用例削除処理を終了するとステップS166の判定処理に進む。
【0152】
ステップS166では、一括用例登録/削除ファイル60の全ての行の用例登録処理または用例削除処理を終了したかを判定する。全ての行の処理を終了していない(No)と判定したときはステップS168に進んで次の未処理の行を取得した後ステップS154に戻り、ステップS154以降の処理を繰り返し実行する。このとき、一括用例登録/削除ファイル60の未処理行に記述された他の一個の用例を取得した後、ステップS160では一回目と同じ判定結果が得られ、この判定結果に応じて用例登録処理または用例削除処理が繰り返し実行される。
【0153】
上記の処理を繰り返し実行して用例を一個づつ登録(または削除)する間に、ステップS166において全ての行の処理を終了した(Yes)と判定したときは、一括用例登録/削除ファイル60の全ての行に記述された用例が、打鍵されたキーに応じて一括して用例辞書53に登録されるか用例辞書53から削除され一括用例登録/削除処理を終了したので、図14に示したメインルーチンにリターンする。
【0154】
以上説明したように、本実施の形態によれば、予め作成した一括用例登録/削除ファイル60中の意味用例と個別用例をオペレータのキー操作によって一括して用例辞書53に登録することができるので、多数の意味用例を登録する手間を省くことができ、操作性を向上させることができる。
【0155】
また、オペレータが意味用例や個別用例を誤って登録した場合でも、削除したい用例を記述した一括用例登録/削除ファイル60を作成しておけば、これに基づいてオペレータのキー操作により多数の用例を一括して削除することができ、操作性を向上させることができる。
【0156】
(第3の実施の形態)
次に本発明の第3の実施の形態について説明する。
【0157】
上述した本発明の第1の実施の形態および第2の実施の形態では、具体的に指示された意味用例と個別用例の登録を一回のキー入力毎に一用例ずつ、または一括用例登録/削除ファイル60に登録された複数の用例に対して一括して行っていた。これに対して本発明の第3の実施の形態では、同じ意味分類に含まれる係り単語を含む個別用例を多数登録すればその個別用例が自動的に上位概念の意味分類を含む意味用例に抽象化され、この意味用例が登録されるように構成している。
【0158】
本実施の形態の文字処理装置は、上記した第2の実施の形態の文字処理装置と同一構成とすることにより実現される。ただし、ROM4に格納される制御プログラムは後述するとおり第1の実施の形態および第2の実施の形態の制御プログラムとは異なっており、また外部ディスクメモリ12のテキストファイル上に一括用例登録ファイルを予め作成しておく必要がある。
【0159】
図16は一括用例登録ファイルの構成を示す説明図である。
【0160】
一括用例登録ファイル70には、意味用例の登録に利用する個別用例が1行にそれぞれ1用例ずつ記述されている。
【0161】
各個別用例の一般形は、図16中(a)で示すように、係り単語表記フィールド71,係り単語品詞フィールド72,助詞フィールド73,受け単語表記フィールド74,および受け単語品詞フィールド75が順番に記述されて構成され、各フィールド間はカンマ「,」で区切られている。(a)に示される各個別用例は助詞と受け単語が同一であり、係り単語のみが異なっている。さらに係り単語を詳細にみると、全て同じ意味分類に含まれる単語である。
【0162】
すなわち、係り単語表記フィールド71の各行にはそれぞれ同じ意味分類に含まれる「大臣」、「市議」、「首相」、「蔵相」が記述されており、係り単語品詞フィールド72の各行にはこれらに対応してそれぞれ「名詞」が記述されている。そして、助詞フィールド73の各行には全て「の」が、受け単語表記フィールド74の各行には全て「政策」が、受け単語品詞フィールド75の各行には全て「名詞」がそれぞれ記述されている。このような一括用例登録ファイル70を予め作成して外部ディスクメモリ12に記憶させておく。
【0163】
用例登録キーまたは一括用例登録キーを打鍵するとこの一括用例登録ファイル70をテキストバッファ55に読み込んで、ステップS235の用例登録処理またはステップS190の用例登録処理を実行することにより、一括用例登録ファイル70に登録された個別用例が抽象化されて実際に登録したい意味用例が自動的に生成される。
【0164】
たとえば図16(b)で示すように、一括用例登録ファイル70(図16(a)参照)に登録された個別用例の係り単語「大臣」、「市議」、「首相」、「蔵相」を抽象化した意味分類〈政治家〉を含む意味用例76(〈政治家〉の政策)がテキストバッファ55上に自動的に生成され、用例辞書53に登録される。
【0165】
ここで、上述の個別用例を利用した意味用例登録動作をフローチャートに従って説明する。
【0166】
図17は本発明の文字処理方法の第3の実施の形態のメインルーチンを表すフローチャートである。図17のフローチャートは、図14中のステップS72の用例登録/削除処理をステップS73の用例登録処理に置き代え、ステップS150の一括用例登録/削除処理をステップS180の一括用例登録処理に置き代えたもので、その他のステップでは図14中の各ステップと同一の処理を行う。そこで、同一の処理を行うステップには同一ステップ番号を付し、その説明を省略する。
【0167】
この図17および後述する図18,図19,並びに前述した図8〜図11に示したフローチャートで示される処理手順は、図1に示した文字処理装置1のROM4内のプログラムエリア41に第1の実施の形態および第2の実施の形態で用いられた制御プログラムとは異なる制御プログラムを格納し、当該プログラムに基づいてCPU3が制御、論理判断を行うことにより実行される。
【0168】
図17中ステップS71において、一括用例登録キーが打鍵されたと判定したときはステップS180の一括用例登録処理に分岐し、図18を参照して説明するように一括用例登録処理を行なう。
【0169】
図18は図17中のステップS180の一括用例登録処理について詳細に表すフローチャートである。
【0170】
一括用例登録キーが打鍵されたと判定するとまずステップS182において、外部ディスクメモリ12から一括用例登録ファイル70をテキストバッファ55に読み込む。
【0171】
ステップS184において、読み込まれた一括用例登録ファイル70の一行から係り単語の表記と品詞を取得する。次にステップS186において、対応する助詞を取得する。次にステップS188において、対応する受け単語の表記と品詞を取得する。
【0172】
ステップS184〜S188の処理で一括用例登録ファイル70の一行に記述された一個の個別用例を取得するとステップS190の用例登録処理に進み、ステップS184〜S188で取得した一個の個別用例を用例辞書53に登録する。用例登録処理を終了するとステップS192の判定処理に進む。
【0173】
ステップS192では、一括用例登録ファイル70の全ての行の個別用例登録処理を終了したかを判定する。全ての行の処理を終了していない(No)と判定したときはステップS194に進んで次の未処理の行を取得した後ステップS184に戻り、ステップS184以降の処理を繰り返し実行する。このとき、一括用例登録ファイル70の未処理行に記述された他の一個の用例を取得した後、用例登録処理が繰り返し実行される。
【0174】
上記の処理を繰り返し実行して個別用例を一個づつ登録する間に、ステップS192において全ての行の処理を終了した(Yes)と判定したときは、一括用例登録ファイル70の全ての行に記述された個別用例が一括して用例辞書53に登録され一括用例登録処理を終了したので、図17に示したメインルーチンにリターンする。
【0175】
このとき、図17のメインルーチンでは、用例登録/削除処理(ステップS72)におけるステップS235の用例登録処理と一括用例登録処理(ステップS180)におけるステップS190の用例登録処理は、以下に説明するとおり同一の手順で行われる。
【0176】
図19は、図17のメインルーチンで行われる図8中のステップS235の用例登録処理、および図18中のステップS190の用例登録処理について詳細に表すフローチャートである。
【0177】
図17のメインルーチンを実行してステップS71で用例登録キーが打鍵されたと判定して図8の用例登録/削除処理を行った際にステップS220で登録キーが打鍵されたと判定したときに、図19に示す用例登録処理(ステップS235,S190)の実行を開始する。また、図17のメインルーチンを実行してステップS71で一括用例登録キーが打鍵されたと判定したときにも、図19に示す用例登録処理の実行を開始する。
【0178】
用例登録処理を開始するとまずステップS510において、登録しようとしている用例(用例登録/削除ダイアログ21で指定された条件の用例または一括用例登録ファイル70から読み込まれた個別用例)が意味用例かを判定する。意味用例である(Yes)と判定したときはステップS520に分岐し、当該用例を意味用例として用例辞書53に登録した後、図8に示した用例登録/削除処理(ステップS72)にリターンする。ステップS190の一括用例登録処理では、登録しようとしている用例は一括用例登録ファイル70から読み込まれた個別用例であるため、ステップS510において登録しようとしている用例が意味用例である(Yes)と判定されることはない。
【0179】
ステップS510において登録しようとしている用例が意味用例でない(No)と判定すると、当該用例は個別用例であるためステップS530以降の処理に分岐する。そして、当該用例に含まれる単語のうちの一方の単語(たとえば係り単語とする)に対して単語辞書52を参照することによりその意味分類を調ベ、次にその意味分類を持つ単語辞書52中の全ての単語について同じ共起関係が成立するかを調べる。
【0180】
すなわち、ステップS530において、当該用例に含まれる単語のうちの一方の単語と同じ意味分類を持つ全ての単語について同じ個別用例があるかを調べ、ステップS540において、ステップS530で調べた全ての個別用例が既に用例辞書53に登録されているかを判定する。つまり、単語辞書52中の別の単語と当該用例に含まれる単語のうちの他方の単語(受け単語となる)との個別用例が用例辞書53に既に登録されているかを判定する。
【0181】
そして、ステップS540において全ての個別用例が登録されていない(No)と判定すると共起関係が成立しないのでステップS550の処理に分岐し、当該用例を個別用例として用例辞書53に登録した後、図8に示した用例登録/削除処理または図18に示した一括用例登録処理にリターンする。
【0182】
これに対して、ステップS540において全ての個別用例が登録されている(Yes)と判定すると共起関係が成立しているのでステップS560の処理に分岐し、当該用例に含まれる単語のうちの一方の単語を含む意味分類と他方の単語とからなる意味用例を作成し、その意味用例を用例辞書53に登録する。次にステップS570において、意味用例を登録する個別用例を用例辞書53から削除することで、複数の個別用例が1つの意味用例に変更、登録される。そして、図8に示した用例登録/削除処理または図18に示した一括用例登録処理にリターンする。 このように本実施の形態によれば、複数の個別用例を抽象化可能であるとき、意味分類を自動的に生成して付与し、複数の個別用例を1つの意味用例に変更することができる。
【0183】
以上説明したように、各実施の形態によれば、オペレータが意味用例を登録する際、多数の個別用例を登録するだけで良く、オペレータが意味用例登録のための面倒な概念を理解する必要がないので、操作性の良い文字処理装置を提供することができる。
【0184】
本発明方法は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用しても良い。また、本発明方法はシステム或いは装置にプログラムを供給することによって達成される場合にも適用できることは言うまでもない。この場合、本発明方法を達成するためのソフトウエアによって表されるプログラムを格納した記憶媒体をシステム或いは装置に読み出すことによって、そのシステム或いは装置が、本発明方法の効果を享受することが可能になる。
【0185】
【発明の効果】
以上説明してきたように、本発明の文字処理方法およびその装置によれば、複数の個別用例から意味用例を作成して登録するとともに、意味用例を作成した個別用例を削除することで、ユーザが登録用例のために必要とするメモリ容量を減らすことができるため、操作性を向上させることができるという効果が得られる。
【図面の簡単な説明】
【図1】本発明を適用した文字処理装置の第1の実施の形態の構成を示すブロック図である。
【図2】単語辞書52の構成を示す説明図である。
【図3】用例辞書53の構成を示す説明図である。
【図4】図4は意味辞書54の構成を示す説明図である。
【図5】意味用例登録を行う際の操作手順の一例を示す説明図である。
【図6】用例辞書53から意味用例を削除する際の操作手順の一例を示す説明図である。
【図7】本発明の文字処理方法の第1の実施の形態のメインルーチンを表すフローチャートである。
【図8】図7中のステップS72の用例登録/削除処理について詳細に表すフローチャー卜である。
【図9】図7中のステップS74の用例一覧処理について詳細に表すフローチャートである。
【図10】図9中のステップS430の絞り込み処理について詳細に表すフローチャートである。
【図11】図7中のステップS76のかな漢字変換処理について詳細に表すフローチャー卜である。
【図12】文尤度の計算方法と計算例を示す説明図である。
【図13】一括用例登録/削除ファイルの構成を示す説明図である。
【図14】本発明の文字処理方法の第2の実施の形態のメインルーチンを表すフローチャートである。
【図15】図14中のステップS150の一括用例登録/削除処理について詳細に表すフローチャートである。
【図16】一括用例登録ファイルの構成を示す説明図である。
【図17】本発明の文字処理方法の第3の実施の形態のメインルーチンを表すフローチャートである。
【図18】図17中のステップS180の一括用例登録処理について詳細に表すフローチャートである。
【図19】図17のメインルーチンで行われる図8中のステップS235の用例登録処理、および図18中のステップS190の用例登録処理について詳細に表すフローチャートである。
【符号の説明】
1 文字処理装置
2 システムバス
2a アドレスバス
2b データバス
2c コントロールバス
3 CPU
4 ROM
5 RAM
6 キーボード
7 カーソルレジスタ
8 表示用バッファメモリ
9 表示装置コントローラ
10 表示装置
11 キャラクタジェネレータ
12 ディスクメモリ
51 入力バッファ
52 単語辞書
53 用例辞書
54 意味辞書
55 用例一覧表示用バッファ
56 テキストバッファ
Claims (2)
- 単語の読みと表記と意味分類とを対応付けた単語辞書と、共起する単語同士を対応付けた個別用例と共起する単語の意味分類と単語とを対応付けた意味用例とが登録された用例辞書と、プログラムに基づいて各種処理を実行する処理手段とを備えた文字処理装置により、入力された読み列を漢字かな混じり文字列に変換する文字処理方法において、
共起する第1及び第2の単語を前記処理手段により取得する単語取得ステップと、
取得された前記第1の単語の意味分類を前記単語辞書から前記処理手段により検索する検索ステップと、
前記単語辞書において前記第1の単語と意味分類の一致する全ての単語について、前記用例辞書から、当該意味分類の一致する単語と前記第2の単語とを対応付けた個別用例を前記処理手段により検索する用例検索ステップと、
前記用例検索ステップにおいて前記第1の単語と意味分類の一致する全ての単語に対して該当する個別用例が検索された場合に、当該一致する意味分類と前記第2の単語とを対応付けた意味用例を、前記処理手段により前記用例辞書に登録する登録ステップと、
前記用例検索ステップにおいて検索された該当する個別用例を前記処理手段により前記用例辞書から削除する削除ステップと
を含んでなることを特徴とする文字処理方法。 - 単語の読みと表記と意味分類とを対応付けた単語辞書および共起する単語同士を対応付けた個別用例と共起する単語の意味分類と単語とを対応付けた意味用例とが登録された用例辞書に基づいて、入力された読み列を漢字かな混じり文字列に変換する文字処理装置において、
共起する第1及び第2の単語を取得する単語取得手段と、
取得された前記第1の単語の意味分類を前記単語辞書から検索する検索手段と、
前記単語辞書において前記第1の単語と意味分類の一致する全ての単語について、前記用例辞書から、当該意味分類の一致する単語と前記第2の単語とを対応付けた個別用例を検索する用例検索手段と、
前記用例検索手段により前記第1の単語と意味分類の一致する全ての単語に対して該当する用例が検索された場合に、当該一致する意味分類と前記第2の単語とを対応付けた意味用例を前記用例辞書に登録する登録手段と、
前記用例検索手段により検索された該当する個別用例を前記用例辞書から削除する削除手段と
を具備したことを特徴とする文字処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13319496A JP3768597B2 (ja) | 1996-05-28 | 1996-05-28 | 文字処理方法およびその装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13319496A JP3768597B2 (ja) | 1996-05-28 | 1996-05-28 | 文字処理方法およびその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09319740A JPH09319740A (ja) | 1997-12-12 |
JP3768597B2 true JP3768597B2 (ja) | 2006-04-19 |
Family
ID=15098918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13319496A Expired - Fee Related JP3768597B2 (ja) | 1996-05-28 | 1996-05-28 | 文字処理方法およびその装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3768597B2 (ja) |
-
1996
- 1996-05-28 JP JP13319496A patent/JP3768597B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH09319740A (ja) | 1997-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6418239B1 (en) | Method and mechanism for providing partial results in full context handwriting recognition | |
KR100650427B1 (ko) | 자연어 인식 애플리케이션 구축을 위한 통합 개발 툴 | |
US5623406A (en) | Method and system for entering text in computer equipment | |
US6247010B1 (en) | Related information search method, related information search system, and computer-readable medium having stored therein a program | |
US5899989A (en) | On-demand interface device | |
JP2937520B2 (ja) | 文書検索装置 | |
JP3527540B2 (ja) | 情報検索装置 | |
EP0118187B1 (en) | Menu-based natural language understanding system | |
JPH07192020A (ja) | 文書情報検索装置 | |
JPH0652221A (ja) | 固有名詞の自動抽出方式 | |
JP3768597B2 (ja) | 文字処理方法およびその装置 | |
JP2002251412A (ja) | 文書検索装置および方法ならびに記憶媒体 | |
JPH07334499A (ja) | 文字列入力装置 | |
JPH1055372A (ja) | オンデマンド・インターフェース装置及びコンピュータ読み取り可能な記録媒体 | |
JP3489326B2 (ja) | テーブル生成方法 | |
JP3056810B2 (ja) | 文書検索方法および装置 | |
JPS61248160A (ja) | 文書情報登録方式 | |
JP3266755B2 (ja) | 中国語情報処理装置 | |
JP3873305B2 (ja) | 仮名漢字変換装置および仮名漢字変換方法 | |
JP3498635B2 (ja) | 情報検索方法及びその装置並びにコンピュータ可読記録媒体 | |
JP2004220513A (ja) | 情報検索装置 | |
JPH0793345A (ja) | 文書検索装置 | |
JPH09146934A (ja) | 仮名漢字変換装置 | |
JP3367198B2 (ja) | 文字属性を用いたテキスト処理装置 | |
JP3608253B2 (ja) | イメージ検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050128 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051108 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060202 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100210 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100210 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110210 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120210 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130210 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |