JP3809238B2 - 文書処理方法及びその装置 - Google Patents

文書処理方法及びその装置 Download PDF

Info

Publication number
JP3809238B2
JP3809238B2 JP35023996A JP35023996A JP3809238B2 JP 3809238 B2 JP3809238 B2 JP 3809238B2 JP 35023996 A JP35023996 A JP 35023996A JP 35023996 A JP35023996 A JP 35023996A JP 3809238 B2 JP3809238 B2 JP 3809238B2
Authority
JP
Japan
Prior art keywords
word
dictionary
input
registered
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP35023996A
Other languages
English (en)
Other versions
JPH10187706A (ja
Inventor
雄二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP35023996A priority Critical patent/JP3809238B2/ja
Publication of JPH10187706A publication Critical patent/JPH10187706A/ja
Application granted granted Critical
Publication of JP3809238B2 publication Critical patent/JP3809238B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、辞書情報の更新が可能な構文構造に関する辞書を有し、自然言語文の構文構造の解析を含む文書処理を行う文書処理方法及びその装置に関するものである。
【0002】
【従来の技術】
従来、自然言語文(例えば日本語文)を対象として、辞書情報を参照することにより、その入力文の構文構造を解析する機能を備えた文書処理装置として、仮名文字列を入力し、その構文構造を解析して、適切な漢字仮名混じり文字列への変換を行う仮名漢字変換装置がある。
【0003】
仮名漢字変換においては、通常、単語の仮名読み文字列、漢字表記文字列、品詞情報などを対応させた単語情報を格納した単語辞書と、用例と呼ばれる単語同士の結び付きを格納した用例辞書とを参照して、入力の仮名読み文字列から漢字仮名混じり文字列への変換を行う。さらに、単語辞書および用例辞書に対して、入力オペレータ固有の情報を追加できるよう追記可能にした辞書更新機能を備え、再入力の操作性を向上させている。辞書更新機能により、初期状態において未登録であった単語が、辞書更新後は既知となり、2回目以降の入力の解析を成功させることができる。さらに、辞書更新機能の有効な機能として、複数の単語を指定して、用例を追加登録する機能があり、この機能により、同音語と呼ばれる同じ読み文字列の単語であっても、用例によって単語の識別が可能になり、適切な漢字仮名混じり表記文字列を得ることができる。
【0004】
ここで、用例は単語と単語の結びつきのデータとして格納されるため、用例辞書には用例を表す単語の読み、表記、品詞などを格納している。また、用例が動詞のような活用語から構成される場合には、活用形のそれぞれに対して用例を適用することができる。さらに、用例を適用するための付加条件として、文節末尾の助詞に代表される係り受け情報を付与する試みがなされており、係り受け情報を同じ機能を持つ他の助詞に対しても適用させることで、用例の適用範囲を広げることができる。
【0005】
【発明が解決しようとする課題】
しかしながら、従来の辞書更新手法によれば、すでに辞書に登録済の単語を組合せた用例を追加登録することはできるが、辞書に未登録の単語を用いた用例を登録する際には、あらかじめ単語を登録しておく必要があり、オペレータの用例登録操作の効率が低下する。
【0006】
また、単語が用例に使用されればされるほど、用例辞書の容量が大きくなって低コストでの実現が困難となり、なおかつ用例辞書の検索効率を低下させる。
また、指定した用例が指定した入力文字列以外の入力文字列に対しても適用されるのかどうかは、用例登録後に他の入力文字列を変換してみるまでわからず、誤った情報を付与してしまい、所望の用例登録および用例を参照した仮名漢字変換を行うことができない場合も発生する。例えば、「友達に会う」という用例を登録した時に、「友達には会えなかった」が該登録用例を適用することによって変換可能かどうかを知るには、とにかく「友達に会う」を登録してから、文字列「ともだちにはあえなかった」を入力して変換可能かどうか試してみるほかない。
【0007】
更に、所望の用例を登録する場合、その用例を構成する単語の組合せを指定しなければならず、単語の読み、表記、品詞の情報を個別に入力する必要があり、オペレータの用例登録操作の効率が低下する。
本発明は、上述の点に鑑みてなされたものであり、その目的とするところは、新たな用例を構成するそれぞれの単語に単語辞書への未登録の単語あった場合でも、用例の用例辞書への登録とともに未登録の単語の単語辞書への登録も行うことで、オペレータの辞書への登録操作の効率を改善した文書処理方法及びその装置を提供することにある。
【0008】
又、用例をなす単語の格納方法を複数用意し、書き込み不可能で単語の位置情報が不変である単語については、位置情報で格納し、書き込み可能で位置情報が不定である単語については、単語辞書において関連づけられている情報の部分情報で格納することで、用例辞書に用例を追加していく場合であっても、容量の増加を抑制することにより、大量の用例を低コストで格納する文書処理方法及びその装置を提供する。
【0009】
又、用例を登録する際に、該用例が登録されたとき、どのような変換動作をするかを事前に確かめることができるように制御する文書処理方法及びその装置を提供する。
更に、用例の文字列を入力するだけで、単語の組合せを解析して表示することで、オペレータは入力した用例をなす単語の組合せを確認するだけで、単語の詳細情報の入力を不要とするように制御する文書処理方法及びその装置を提供する。
【0010】
【課題を解決するための手段】
上記目的を達成するために、本発明の文書処理方法は、単語の読みと表記と品詞とが登録された単語辞書記憶部と、複数の単語の読みと表記と品詞とが対応づけられて登録された用例辞書記憶部と、文字列を受け付ける入力手段と、プログラムに基づいて各種処理を実行する処理手段とを備えた文書処理装置により、文書を解析する文書処理方法において、前記処理手段、前記入力手段より受け付けられた新たな用例を構成する漢字仮名混じり表記文字列から複数の単語表記を抽出して、該複数の単語のそれぞれが既に前記単語辞書記憶部に登録されているか否かを判別する判別工程と、前記単語辞書記憶部に登録されていると判別された単語の読みと品詞とを、当該単語辞書記憶部から前記処理手段取得する取得工程と、前記処理手段、前記判別工程で抽出された複数の単語表記と、前記取得工程により取得された単語の読み及び品詞とを用例入力欄に訂正可能に表示するとともに、前記単語辞書記憶部に登録されていないと判別された単語の読みと品詞との当該用例入力欄への入力を要求する要求工程と、前記処理手段、登録指示がなされた際の前記用例入力欄の内容に基づいて、新たな用例を前記用例辞書記憶部に登録するとともに、該用例を構成する複数の単語に前記単語辞書記憶部に登録されていないと判別された単語があれば、当該用例入力欄に入力された該単語の読みと表記と品詞とを当該単語辞書記憶部に登録する登録工程とを備えることを特徴とする。
【0011】
ここで、前記単語辞書記憶部が、更新可能な単語辞書部と更新不可能な単語辞書部とを有し、前記登録工程において、少なくとも前記更新不可能な単語辞書部の単語に関する前記用例辞書への登録は当該単語へのポインタで行なわれる。また、前記登録工程で登録された単語と用例とを使って、前記入力手段より受け付けられた前記新たな用例の読みを表わす仮名文字列を、前記処理手段仮名漢字変換して変換結果を表示する変換工程を更に備える。また、前記判別工程では、前記入力手段より受け付けられた新たな用例を構成する漢字仮名混じり文字列を、前記予め登録された単語を参照して形態素に分割することにより、当該文字列から複数の単語表記を抽出する。
【0012】
又、本発明の文書処理装置は、単語の読みと表記と品詞とが登録された単語辞書記憶部及び複数の単語の読みと表記と品詞とが対応づけられて登録された用例辞書記憶部のデータを使用して文書を解析する文書処理装置において、文字列を受け付ける入力手段と、該入力手段より受け付けられた新たな用例を構成する漢字仮名混じり表記文字列から複数の単語表記を抽出して、該複数の単語のそれぞれが既に前記単語辞書記憶部に登録されているか否かを判別する判別手段と、前記単語辞書記憶部に登録されていると判別された単語の読みと品詞とを当該単語辞書記憶部から取得する取得手段と、前記判別手段により抽出された複数の単語表記と、前記取得手段により取得された単語の読み及び品詞とを用例入力欄に訂正可能に表示するとともに、前記単語辞書に登録されていないと判別された単語の読みと品詞との当該用例入力欄への入力を要求する要求手段と、登録指示がなされた際の前記用例入力欄の内容に基づいて、新たな用例を前記用例辞書記憶部に登録するとともに、該用例を構成する複数の単語に前記単語辞書記憶部に登録されていないと判別された単語があれば、当該用例入力欄に入力された該単語の読みと表記と品詞とを当該単語辞書記憶部に登録する登録手段とを備えることを特徴とする。
【0013】
ここで、更新不可能な単語辞書部を有する場合に、前記用例の登録において、少なくとも前記更新不可能な単語辞書部の単語登録は当該単語へのポインタで行なわれる。また、前記登録手段により登録された単語と用例とを使って、前記入力手段より受け付けられた前記新たな用例の読みを表わす仮名文字列を仮名漢字変換して変換結果を表示する変換手段を更に備える。また、前記判別手段は、前記入力手段より受け付けられた新たな用例を構成する漢字仮名混じり文字列を、前記予め登録された単語を参照して形態素に分割することにより、当該文字列から複数の単語表記を抽出する。
【0016】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<文書処理装置の構成例>
図1は、本実施の形態の文書処理装置の全体構成の一例を示す図である。
図示の構成において、11はマイクロプロセッサ(CPU)であり、文書処理のための演算、論理判断等を行ない、アドレスバスAB、コントロールバスCB、データバスDBを介して、それらのバスに接続された各構成要素を制御する。アドレスバスABは、CPU11の制御の対象とする構成要素を指示するアドレス信号を転送する。コントロールバスCBは、CPU11の制御の対象とする各構成要素間のコントロール信号を転送して印加する。データバスDBは、各構成機器相互間のデータ転送を行なう。
【0017】
12は読出し専用の固定メモリ(ROM)である。ROM12は、図18〜図24に基づき後述するCPU11による制御の手順を記憶させたプログラム領域12aと、図12に基づき後述する固定辞書(STDDIC)領域12bとを有している。
13は、例えば1ワード16ビットで構成される書込み可能なランダムアクセスメモリ(RAM)であって、各構成要素からの各種データの一時記憶に用いる。RAM13は、登録用例入力バッファ(YIBUF)、係り単語情報格納バッファ(KWINF)、受け単語情報格納バッファ(UWINF)、係り単語読み格納バッファ(KWYBUF)、係り単語表記格納バッファ(KWHBUF)、係り単語品詞格納バッファ(KWGINF)、係り単語係り情報格納バッファ(KWKINF)、受け単語読み格納バッファ(UWYBUF)、受け単語表示格納バッファ(UWHBUF)、受け単語品詞格納バッファ(UWGINF)、受け単語受け情報格納バッファ(UWUINF)、仮名漢字変換テスト用入力読みバッファ(KIBUF)、仮名漢字変換出力漢字バッファ(KOBUF)の各一時記憶バッファメモリから構成されるバッファ領域13aと、プログラムを外部記憶媒体やホスト等からロードして実行する構成の場合のプログラムロード領域13bとを有している。
【0018】
登録用例入力バッファは、登録指示がなされた用例となる単語の組み合わせ表示文字列を格納するバッファであり、その格納データが図3における表示データ25となる。
係り単語情報格納バッファは、図15に示す単語の内部表現形式で、用例の係り側となる単語を一時記憶するバッファであり、同様に、受け単語情報格納バッファは用例の受け側となる単語を内部表現形式で一時記憶するバッファである。係り単語読み格納バッファは、係り単語情報格納バッファに記憶された単語の読み文字列を格納するバッファであり、図3における表示データ26となる。係り単語表記格納バッファは、係り単語情報格納バッファに記憶された単語の表記文字列を格納するバッファであり、図3における表示データ27となる。係り単語品詞格納バッファは、係り単語情報格バッファに記憶された単語の品詞を格納するバッファであり、図3における表示データ28となる。係り単語係り情報格納バッファは、係り単語情報格納バッファに記憶された単語の係り情報を図16に後述するコードで格納するバッファであり、これを該係り情報コードテーブルにより係り情報に対応させた文字列が図3における表示データ29となる。
【0019】
受け単語読み格納バッファは、受け単語情報格納バッファに記憶された単語の読み文字列を格納するバッファであり、図3における表示データ2aとなる。受け単語表記格納バッファは、受け単語情報格納バッファに記憶された単語の表記文字列を格納するバッファであり、図3における表示データ2bとなる。受け単語品詞格納バッファは、受け単語情報格納バッファに記憶された単語の品詞を格納するバッファであり、図3における表示データ2cとなる。受け単語受け情報格納バッファは、受け単語情報格納バッファに記憶された単語の受け情報を図17に後述するコードで格納するバッファであり、これを該受け情報コードテーブルにより受け情報に対応させた文字列が図3における表示データ2dとなる。
【0020】
仮名漢字変換テスト用入力読みバッファは、仮名漢字変換の動作確認テストを行う対象となる入力文字列を格納するバッファであり、仮名漢字変換出力漢字バッファは仮名漢字変換処理後の変換済み漢字列を格納するバッファであって、仮名漢字変換を行う同種の情報処理装置において一般的に用いられているので、詳細な説明は省略する。
【0021】
14は外部メモリ(本例では、DISK)であり、本実施の形態で使用される各種辞書を格納する辞書格納領域14aと、RAM13にロードされて実行されるプログラムを格納するプログラム格納領域14bと、文書データを保管する文書データ格納領域14cとを有する。尚、外部メモリ14としては、フロッピディスク,ハードディスク,CDROM,MO,DVD等が使用可能であり、外部メモリ14をホストコンピュータからの通信手段により代用することも可能である。尚、文書データ等は必要に応じて保管され、また、保管されたデータはキーボードの指示により、必要な時に呼び出される。
【0022】
図2は、外部メモリ14の記憶媒体内の構成例を示す図である。
辞書格納領域14aには、図13において後述する追記可能辞書(USRDIC)、図14において後述する追記用例辞書(AYRDIC)、追記可能辞書(USRDIC)の一時退避データ領域1(TMPAREA1)、追記用例辞書(AYRDIC)の一時退避データ領域2(TMPAREA2)等が含まれる。
【0023】
プログラム格納領域14bには、図18〜図24に示すようなフローチャートを実現するコード群からなる、ユーザインタフェースモジュール、文字列解析モジュール、用例登録モジュール、動作テストモジュール等が含まれる。
15はキーボード(KB)であり、アルファベットキー、ひらがなキー、カタカナキー、句点等の文字記号入力キー、仮名漢字変換を指示する変換キー、用例登録、および操作の取消を指示する操作指示キー、及び、カーソル移動を指示するカーソル移動キー等のような各種の機能キーを備えている。
【0024】
16はカーソルレジスタ(CR)である。CPU11により、カーソルレジスタ16の内容を読み書きできる。後述するCRTコントローラ(CRTC)18は、ここに蓄えられたアドレスに対する表示装置(CRT)19上の位置にカーソルを表示する。17は表示用バッファメモリ(DBUF)で、表示すべきデータのパターンを蓄える。18はCRTコントローラ(CRTC)であり、カーソルレジスタCR16及びバッファDBUF17に蓄えられた内容を表示器CRT19に表示する役割を担う。また、19は陰極線管等を用いた表示装置(CRT)であり、その表示装置CRTにおけるドット構成の表示パターンおよびカーソルの表示をCRTコントローラ18で制御する。1aはキャラクタジェネレータ(CG)であって、表示装置CRT19に表示する文字、記号のパターンを記憶するものである。
【0025】
かかる各構成要素からなる本実施の形態の文書処理装置においては、キーボードKB15からの各種の入力に応じて作動するものであって、キーボードKB15からの入力が供給されると、まず、インタラプト信号がマイクロプロセッサCPU11に送られ、そのマイクロプロセッサCPU11がROM12内に記憶してある(または、DISK14からRAM13にロードされた)各種の制御プログラムを読出し、それらの制御プログラムに従って、各種の制御が行なわれる。
【0026】
<動作手順の概要>
上記の構成よりなる本装置において、用例の登録が実行される例をCRT19上に表示される表示画面を示す図3〜図11を参照して以下に説明する。
図3の(2-1) は、KB15上の用例登録キーが押下された時の表示画面例である。画面(2-1) は、かな漢字変換動作テストボタン21、登録指示ボタン22、削除指示ボタン23、操作取消ボタン24の4つの機能指定ボタンを持っている。25は登録したい用例の入力枠であり、この枠内に用例である文字列を入力する。
【0027】
26,27,28,29は、用例入力枠25に入力された用例の係り側となる単語の読み文字列、表記文字列、品詞、係り情報をそれぞれ表示する枠である。また、カーソル移動手段により用例入力枠25から、係り単語枠26,27,28,29のそれぞれに直接入力することもできる。
2a,2b,2c,2dは、用例入力枠25に入力された用例の受け側となる単語の読み文字列、表記文字列、品詞、係り情報をそれぞれ表示する枠である。また、カーソル移動手段により用例入力枠25から、受け単語枠2a,2b,2c,2dのそれぞれに直接入力することもできる。
【0028】
2eは、仮名漢字変換動作テストボタン21が押下された場合に、仮名漢字変換動作テスト用の入力読み列および入力読み列に対する仮名漢字変換結果文字列を表示する枠である。
図4の(2-2) は、「資料を読む」という用例文字列を登録しようと用例入力枠25に入力した状態である。この状態で登録指示ボタン22を押下すると、図5の(2-3) の状態になる。入力された「資料を読む」という用例文字列を係り単語、受け単語それぞれに分割し、係り単語各項目26,27,28,29、受け単語各項目2a,2b,2c,2dに表示し、これらの単語の組合せで用例が登録されることの確認を求める。
【0029】
図6の(2-4) は、(2-3) の状態で仮名漢字変換動作テスト指示ボタン21を押下し、用例登録枠25に入力された用例が、実際にどのように仮名漢字変換されるのかを確認する。(2-4) で動作テスト用入力枠2eに「しりょうはよまない」と入力読み文字列を入力する。公知の仮名漢字変換手段のごとくKB15上の変換キーを押下することにより、仮名漢字変換が行われ、図7の(2-5) のように、その変換結果文字列が動作テスト用入力枠2eに変換前の入力読み文字列に置き換わって表示される。
【0030】
次に、固定辞書(STDDIC)に登録されていない単語を用例として登録する場合の操作実行例を示したのが、図8の(2-6) である。(2-6) において、用例入力枠25に「三国志を読む」と入力する。ここで、「三国志」は固定辞書(STDDIC)および追記可能辞書(USRDIC)のいずれにも登録されていない未登録語であるとする。
【0031】
図4の(2-2) における操作と同様に登録指示ボタン22を押下すると、図9の(2-7) のように、用例入力枠25に表示された用例文字列を係り単語、受け単語に振り分け表示するが、係り単語として代表された「三国志」は未知語であるため、読み26、品詞29は符号**で代用させている。
図10の(2-8) は、符号で代用された読み26、品詞29への入力を終えたところで、この状態で登録指示ボタン22を押下することで、読み「さんごくし」,表記「三国志」,品詞「固有名詞」である単語「三国志」が、追記可能辞書(USRDIC)に登録されるとともに、用例「三国志を読む」が追記用例辞書(AYRDIC)に登録される。
【0032】
図11の(2-9) は、図9の(2-7) と同じく、入力された用例文字列に未知語を含む場合であるが、用例入力枠25に入力された「オフサイドの反則」に対して、表示文字列であるカタカナに対応するひらがな文字列を読み文字列の推定結果として符号で代用せずに表示する。
<各辞書の構成例>
図12は、本文書処理装置における固定辞書の例である。
【0033】
固定辞書(STDDIC)は、図に示す31,32,33,34,35の5つのフィールドより構成される。固定辞書単語連番30は固定辞書に格納された単語の先頭からの連続番号であり、後述する単語の読みと表記と品詞が等しい単語に対してただひとつの連番を与える。ただし、連番自体は固定辞書に格納される必要はなく、図において説明容易性のために記している。単語サイズ31は、以下の単語読み32、単語表記33、単語品詞34、用例35で構成される単語の1レコードの長さを格納する。
【0034】
単語読み32は単語の読み文字列を、単語表記33は単語の表記文字列を、単語品詞34は単語の品詞を格納し、それぞれのデリミタとして末尾に特殊符号として“\”を格納する(図示せず)。
用例35は、単語読み32、単語表記33、単語品詞34で表される単語が他の単語と結びついてできる用例を格納する。用例は、見出しとなる単語が係り側(K)となるか受け側(U)となるかを表す機能分類、見出しとなる単語の係り受け情報(見出し単語が係り側である場合は係り情報、見出し単語が受け側である場合は受け情報)、用例のペアをなす単語の先頭アドレス情報情報(図示においては固定辞書単語連番30の前に&を付けた符号で表現している)、用例のペアをなす単語の係り受け情報の4組で構成される。例えば、固定単語連番30が“8391”を示す単語「植物」は、「熱帯」(30878)に対して受け側(U)となり「熱帯の植物」(の=4)という用例を作ることを示す。
【0035】
図13は、本文書処理装置における追記可能辞書(USRDIC)の例である。
追記可能辞書は、単語サイズ41、読み42、表記43、品詞44、登録種別45、用例46の6つのフィールドから構成される。登録種別45、用例46を除き、構成内容は図12と同様である。登録種別45は、該単語がオペレータにより明示的に登録指示されたユーザ登録単語か、オペレータが明示的に登録指示せずに登録された自動登録単語であるかの種別を表すデータである。用例46の構成も図12における用例35と同様であるが、用例46は用例を構成する単語として固定辞書に格納されている以外の単語、例えば“孟徳”や“曹操”等、も登録することができる。
【0036】
図14は、本文書処理装置における追記用例辞書の例である。
追記用例辞書は、固定辞書に格納されている単語を含む用例を追加登録する際の格納先となる辞書である。固定辞書単語連番51は、用例の見出し単語となる固定辞書に格納されている単語のアドレスを格納する。アドレスを参照することで単語の実体(単語読み、単語表記、単語品詞)を取り出すことが可能となる。用例52は用例46と同様の構成である。
【0037】
例えば、固定辞書単語連番51に&2とあるのは「会う」というワ行五段動詞であり、用例52に格納された対応する用例データ(U,0,&8280,3)は、「社長に会う」という用例を表し、固定辞書単語連番51に&107385とあるのは「読む」というマ行五段動詞であり、用例52に格納された対応する用例データ(U,0,(さんごくし,三国志,固有名詞),2)は「三国志を読む」という用例を表す。
【0038】
図15は、用例36、用例46、用例52に格納される用例データの構成を示した図である。
(6-1) は、ひとつの用例の構成を示しており、61はこの用例データを持つ見出し単語が係り側単語であるか、受け側単語であるかの機能分類を格納する。図において「K」となっているのは、係り分類であることを示す。受け分類の場合は「U」を格納する。62は見出し単語の係り受け状態を格納する。見出し単語が係り側分類(機能分類61の値が「K」)であれば、図7に示す係り情報コードを、見出し単語が受け側分類(機能分類61の値が「U」)であれば、図8に示す受け情報コードを格納する。図において「2」となっているのは、係り情報が「を」であることを示す。即ち見出し単語が文節末尾に「を」をともなって受け側単語に係ることを意味する。63は用例を構成する他方の単語を格納する。単語の格納方法には2種類あり、後述する。64は他方の単語63に格納される単語の係り受け情報を格納する。係り受け状態62が係り情報であれば受け情報を、係り受け状態62が受け情報であれば係り情報が格納される。
【0039】
(6-2) は他方の単語63の構成を示した図である。65は単語の格納種別を表す種別情報で、固定辞書に格納されるアドレス不変の単語である場合は「S」を、追記可能辞書に格納されるアドレスが変化する単語である場合は「D」を格納する。66は単語情報67のレコード長を格納する。単語格納タイプ65が「S」である場合は、単語情報67は単語のアドレスで表されるために「4」をレコード長として格納する。単語格納タイプ65が「D」である場合は、単語情報67は読み,表記,品詞を有し、例えば「三国志」の場合デリミタ“\”を含めると「15」となる。67は単語情報であり、(6-3) および(6-4) に後述する。
【0040】
(6-3) は単語格納タイプ65が「S」である場合の単語情報の構成である。68に単語のアドレスが格納される。図示において「&107385」とあるのは、固定辞書単語連番107385の単語「読」のアドレスを意味するものとする。
(6-4) は単語格納タイプ65が「D」である場合の単語情報の構成である。69に単語の読み文字列、6aに単語の表示文字列、6bに単語の品詞が格納され、それぞれのデリミタとして末尾に特殊符号として“\”を格納する。
【0041】
図16は用例データ中の係り情報コードの例を示した図であり、係り分類71と対応するコード72との対応テーブルとなっている。図17は用例データ中の受け情報コードの例を示した図であり、受け分類81と対応するコード82との対応テーブルとなっている。
<フローチャートの説明>
上述の本実施の形態の文書処理装置の動作手順を、図18〜図24のフローチャートに従って説明する。
【0042】
(全体の動作手順)
図18は本文書処理装置の全体の動作手順を示すフローチャートである。
ステップS101において、キーボードよりキーが押下され、割り込みが発生するのを待つ。キーが入力されると、ステップS102において、キーが押下される直前の状態におけるキーに対応する機能を判別し、機能の種類に応じてステップS103,ステップS104のいずれかのステップに分岐する。
【0043】
ステップS103は、ステップS102において用例登録と判定された場合の処理であり、図19に詳述するように、オペレータが所望する用例を辞書登録する。ステップS104は、ステップS102において用例登録以外(例えば、カーソル移動等)と判定された場合の処理であり、同種の情報処理装置において一般的に行われている処理であり、公知であるので特に記述しない。
【0044】
(用例登録処理S103の手順)
図19は、ステップS103の処理を詳細化したフローチャートである。
まず、ステップS201で図3の初期入力画面(2-1) を表示する。初期画面において入力カーソルは、用例入力枠25に位置づけられる。次に、ステップS202においてキー入力待ちとなり、ステップS203で用例の入力か機能の指示であるかの判定を行う。文字キーであるなら用例の入力であり、引き続きステップS202で入力を継続する。文字キー以外の機能キーであるならば、ステップS204で実行機能の判定を行う。
【0045】
ステップS205はカーソル移動キーが押下された場合の処理であり、押下されたカーソル移動キーに応じて入力カーソルを用例入力枠25から他の入力枠、例えば係り単語読み入力枠26へ移動させる。カーソル移動処理を終えたら、再びステップS202へ戻り処理を継続する。ステップS206は、仮名漢字変換動作テストボタン21が押下された場合の処理であり、図20に詳述する処理を行った後、再びステップS202へ戻り処理を継続する。
【0046】
ステップS207は、カーソルが用例入力枠25または、係り単語各入力枠26,27,28,29、受け単語各入力枠2a,2b,2c,2dにある場合、用例のデータの各バッファへの入力を行う。
カーソルが用例入力枠25にある場合は、入力された用例文字列を登録用例入力バッファ(YIBUF)に格納する。カーソルが係り単語読み入力枠26にある場合は、入力された係り単語読み文字列を係り単語読み格納バッファ(KWYBUF)に、カーソルが係り単語表記入力枠27にある場合は、入力された係り単語表記文字列を係り単語表記格納バッファ(KWHBUF)に、カーソルが係り単語品詞入力枠28にある場合は、入力された係り単語品詞を係り単語品詞格納バッファ(KWGINF)に、カーソルが係り単語係り情報入力枠29にある場合は、入力された係り単語係り情報を係り単語係り情報格納バッファ(KWKINF)にそれぞれ格納する。同様に、カーソルが受け単語読み入力枠2aにある場合は、入力された受け単語読み文字列を受け単語読み格納バッファ(UWYBUF)に、カーソルが受け単語表記入力枠2bにある場合は、入力された受け単語表記文字列を受け単語表記格納バッファ(UWHBUF)に、カーソルが受け単語品詞入力枠2cにある場合は、入力された受け単語品詞を受け単語品詞格納バッファ(UWGINF)に、カーソルが受け単語受け情報入力枠2dにある場合は、入力された受け単語受け情報を受け単語受け情報格納バッファ(UWIUINF)に、それぞれ格納する。
【0047】
ステップS208は、登録指示ボタン22が押下された場合の処理であり、図21に詳述する処理を行った後、リターンする。ステップS209は、削除指示ボタン23が押下された場合の処理であり、用例入力枠25に表示される用例を追記可能辞書および追記用例辞書から削除する。
ステップS210は、操作取消指示ボタン24が押下された場合の処理であり、ステップS201で表示した入力画面を消去し、登録用例入力バッファ(YIBUF)、係り単語情報格納バッファ(KWINF)、受け単語情報格納バッファ(UWINF)、係り単語読み格納バッファ(KWYBUF)、係り単語表記格納バッファ(KWHBUF)、係り単語品詞格納バッファ(KWGINF)、係り単語係り情報格納バッファ(KWKINF)、受け単語読み格納バッファ(UWYBUF)、受け単語表記格納バッファ(UWHBUF)、受け単語品詞格納バッファ(UWGINF)、受け単語受け情報格納バッファ(UWUINF)、仮名漢字変換テスト用入力読みバッファ(KIBUF)、仮名漢字変換出力漢字バッファ(KOBUF)の各一時記憶バッファメモリをクリアしてリターンする。
【0048】
(仮名漢字変換テストS206の手順)
図20は、ステップS206の処理を詳述したフローチャートである。
ステップS301は、仮名漢字変換動作テスト用入力枠2eへの入力カーソルを移動し、仮名漢字変化対象読み文字列を入力できるようにする。次に、ステップS302で動作確認のための用例仮登録に先立って、現在の用例辞書を一時待避しておく。即ち、追記可能辞書(USRDIC)を一時退避データ領域1(TMPAREA1)に、追記用例辞書(AYRDIC)を一時退避データ領域2(TMPAREA2)にコピーする。これは、用例の仮登録の際に、追記可能辞書および追記用例辞書のあふれなどによるエラーが発生した場合に現状用例辞書に復帰可能にするためである。
【0049】
ステップS303で、用例登録後の実際の仮名漢字変換の挙動をテストするために、追記可能辞書及び追記用例辞書に用例を登録する。この処理は図21で詳述する。次に、ステップS304でキー入力を待ち、ステップS305で入力されたキーの判定を行い、実行機能ごとに分岐する。
ステップS306は、読み文字列キーが入力された場合の処理で、仮名漢字変換テスト用入力読みバッファ(KIBUF)に入力された読み文字列を蓄えていくとともに、仮名漢字変換入力読み表示枠2eに、入力読みを順次表示し、ステップS304へ戻り、次の入力を受けつける。
【0050】
ステップS307は、KB15上の変換キーが押下された場合の処理で、仮名漢字変換テスト用入力読みバッファ(KIBUF)に蓄えられた読み文字列を対象として、用例を参照した仮名漢字変換を実行し、変換結果を仮名漢字変換出力漢字バッファ(KOBUF)に出力するとともに、仮名漢字変換入力読み表示枠2eに表示された読み文字列を消去し、仮名漢字変換出力漢字バッファの内容を変換結果文字列として表示した後、ステップS304へ戻り、次の入力を受けつける。用例を参照した仮名漢字変換処理は公知の技術であり、詳述しない。
【0051】
ステップS308は、仮名漢字変換の対象読み、変換キー以外のキー、例えばカーソル移動キーが入力された場合の処理で、仮名漢字変換動作テストを終了する。終了前に用例辞書を用例登録前の状態に復帰させるため、ステップS302)で対比した用例辞書を回復する。即ち、一時退避データ領域1(TMPAREA1)を追記可能辞書(USRDIC)に、一時退避データ領域2(TMPAREA2)を追記用例辞書(AYRDIC)にコピーする。
【0052】
(用例登録S208の手順)
図21は、ステップS208の処理を詳述化したフローチャートである。
まず、ステップS401で、用例を構成する係り単語、受け単語が入力済であるかどうかチェックする。用例入力枠25に入力されたのは用例の表記文字列であり、用例を格納する追記可能辞書および追記用例辞書に登録可能な単語単位への分割はされていないが、ステップS207で係り単語入力枠、受け単語入力枠のそれぞれへカーソル移動した後に、単語入力されている場合は、係り単語、受け単語が入力済となり、該単語情報で用例登録を行う。係り単語、受け単語が入力済であるならば、ステップS406へ進み、用例辞書への登録を行う。係り単語、受け単語が未入力であれば、ステップS402へステップする。
【0053】
ステップS402で、用例入力枠25に入力され、登録用例入力バッファに格納された用例文字列を解析し、係り単語情報、受け単語情報のそれぞれをセットする。この処理は図22に詳述する。
次に、ステップS403でカーソルを係り単語読み入力枠26に移動させる。これは、ステップS402で係り単語、受け単語に自動分割した単語情報のオペレータによる修正を容易にするためである。そしてステップS404においてオペレータによる係り単語および受け単語の修正を行い、ステップS405で登録指示ボタン22が押下されるまでループする。
【0054】
次にステップS406で係り単語情報、受け単語情報をもって用例辞書への登録を行いリターンする。用語辞書への登録処理は図23において詳述する。
(単語セットS402の手順)
図22は、ステップS402の処理を詳細化したフローチャートである。
まずステップS501で、登録用例入力バッファ(YIBUF)に格納されている用例文字列を固定単語辞書STDDIC)、追記可能辞書(USRDIC)を参照することによって、形態素に分割する。形態素分割については公知の技術であるので詳述はしない。
【0055】
ステップS502で形態素分割の結果、文頭側の形態素文節の文節末尾をチェックする。文節末尾が助詞であれば、該文節は係り側文節としてステップS507へ分岐する。助詞でなければステップS503へ進む。ステップS503では該文頭側文節が連体形であるかチェックする。連体形であれば、該文節は係り側文節としてステップS507へ分岐する。連体形でなければステップS504へ進む。ステップS504で、該文頭側文節と文末側文節が名詞の連接であるかチェックする。名詞連接であれば、該文頭側文節は係り側文節としてステップS507へ分岐する。名詞連接でなければ該文頭側文節を受け側文節としてステップS505へ進む。
【0056】
ステップS505で、文頭側文節を受け単語情報格納バッファ(UWINF)、受け単語読み格納バッファ(UWYBUF)、受け単語表記格納バッファ(UWHBUF)、受け単語品詞格納バッファ(UWGINF)、受け単語係り情報格納バッファ(UWKINF)に格納するとともに、受け単語情報2a,2b,2c,2dへ格納内容を表示する。続いてステップS506で、文末側文節を係り側文節として、係り単語情報格納バッファ(KWINF)、係り単語読み格納バッファ(KWYBUF)、係り単語表記格納バッファ(KWHBUF)、係り単語品詞格納バッファ(KWGINF)、係り単語係り情報格納バッファ(KWKINF)に格納するとともに、係り単語情報26,27,28,29へ格納内容を表示してリターンする。
【0057】
一方、ステップS507では、文頭側文節を文頭側文節を係り側文節として、係り単語情報格納バッファ(KWINF)、係り単語読み格納バッファ(KWYBUF)、係り単語表記格納バッファ(KWHBUF)、係り単語品詞格納バッファ(KWGINF)、係り単語係り情報格納バッファ(KWKINF)に格納するとともに、係り単語情報26,27,28,29へ格納内容を表示する。続いてステップS508で、文頭側文節を受け単語情報格納バッファ(UWINF)、受け単語読み格納バッファ(UWYBUF)、受け単語表記格納バッファ(UWHBUF)、受け単語品詞格納バッファ(UWGINF)、受け単語係り情報格納バッファ(UWKINF)に格納するとともに、受け単語情報2a,2b,2c,2dへ格納内容を表示してリターンする。
【0058】
(用例辞書登録S406の手順)
図23はステップS406の処理を詳細化したフローチャートである。
ステップS601で係り単語読み格納バッファ(KWYBUF)、係り単語表記格納バッファ(KWHBUF)、係り単語品詞格納バッファ(KWGINF)に格納された単語が固定単語辞書ステップSTDDIC)あるいは追記可能辞書(USRDIC)中に登録済の単語であるかどうか検索する。
【0059】
ステップS602で、単語が検索されたならば、ステップS604へ分岐し、単語が見つからなければ、ステップS603で該単語を追記可能辞書(USRDIC)へ登録する。ステップS604で受け単語情報格納バッファ(UWINF)、受け単語読み格納バッファ(UWYBUF)、受け単語情報格納バッファ(UWINF)、受け単語読み格納バッファ(UWYBUF)、受け単語表記格納バッファ(UWHBUF)、受け単語品詞格納バッファ(UWGINF)に格納された単語が固定単語辞書ステップSTDDIC)あるいは追記可能辞書(USRDIC)中に登録済の単語であるかどうか検索する。
【0060】
ステップS605で、単語が検索されたならば、ステップS607へ分岐し、単語が見つからなければ、ステップS606で該単語を追記可能辞書(USRDIC)へ登録する。ステップS607で、係り側、受け側それぞれの文節情報に格納されている単語で構成される用例を追記可能辞書(USRDIC)あるいは追記用例辞書(AYRDIC)に登録する。
【0061】
(登録S607の手順)
図24はステップS607の処理を詳細化したフローチャートである。用例辞書には、用例を構成する係り側単語、受け単語のいずれからも検索可能なように、係り側、受け側単語のそれぞれを見出し語として、用例を登録する。
ステップS701で係り単語情報格納バッファ(KWINF)に格納された単語情報をチェックし、該単語が固定単語辞書ステップSTDDIC)に格納されている単語であるならば、ステップS702へ、そうでなければステップS703へ分岐する。見つかった単語の格納種別に応じて、ステップS703では追記可能辞書(USRDIC)を検索対象として検索し、ステップS702では該係り単語を見出し語とする用例が追記用例辞書(AYRDIC)あるいは固定単語辞書ステップSTDDIC)に存在しないかどうか検索し、ステップS704で見つかったかどうかを判定、見つかれば用例登録の必要なしとして、ただちにリターンする。見つからなければ、ステップS705で、該係り単語を見出し語として、追記用例辞書(AYRDIC)に追加登録する。
【0062】
続いて、ステップS706で受け単語情報格納バッファ(UWINF)に格納された単語情報をチェックし、該単語が固定単語辞書ステップSTDDIC)に格納されている単語であるならば、ステップS707へ、そうでなければステップS708へ分岐する。見つかった単語の格納種別に応じて、ステップS708では追記可能辞書(USRDIC)を検索対象として検索し、ステップS707では該受け単語を見出し語とする用例が追記用例辞書(AYRDIC)あるいは固定単語辞書ステップSTDDIC)に存在しないかどうか検索し、ステップS709で見つかったかどうか判定、見つかれば用例登録の必要なしとして、ただちにリターンする。見つからなければ、該受け単語を見出し語として、追記用例辞書(AYRDIC)に追加登録する。
【0063】
以上の説明において、用例として係り側単語1個に対し、受け側単語1個が対をなす2単語からなる1単語対用例の例を示したが、2単語対用例に限らず、3単語以上から構成される用例でも同様に、用例構成単語を未登録単語があれば、これを単語登録してしまうことで、同様の効果を得ることができる。
本実施の形態においては、用例データの格納先として、固定単語辞書、追記可能辞書、追記用例辞書と3種類の辞書にそれぞれ格納するように構成したが、固定単語辞書から用例を分離して、固定単語を検索見出しとする用例の全てを追記用例辞書に格納するようにしてしまっても同様に処理することができる。
【0064】
なお、本発明は、複数の機器(例えばホストコンピュータ,インタフェイス機器など)から構成されるシステムに適用しても、図1のような1つの機器からなる装置に適用してもよい。
また、本発明の目的は、前述したように、実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0065】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0066】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0067】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0068】
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードを格納することになる。
【0069】
【発明の効果】
以上説明したように、本発明によれば、新たな用例を構成するそれぞれの単語に単語辞書への未登録の単語があった場合でも、用例の用例辞書への登録とともに未登録の単語の単語辞書への登録も行うことにより、オペレータに単語辞書での単語存在の有無を意識させることなく用例の用例辞書への登録を行うことができ、操作性の高い文書処理方法及びその装置を実現することができる。
【0070】
また、単語情報の追加、変更、削除などにともない、単語の位置情報が固定でない単語は、単語を一意に決定する部分情報をもって格納することで、用例辞書が単語情報の変更の影響を被ることがなくなり、用例辞書の保守が容易になる。また、単語の位置情報が固定である更新不可能な単語である場合は、該単語の位置情報などのポインタで単語情報をたどることができるため、単語情報を容易に引き出すことができ、かつ、用例辞書の容量を抑制することができるため、低コストで大量の用例を格納することができる。
【0071】
また、用例格納用の辞書への登録前に、登録後の変換動作を確認することが可能で、登録したのちに、実際に変換して登録データを修正するといった手順が短縮され、用例の係り受け条件や単語の品詞といった不可的な辞書情報の追加変更が容易になり、操作性の高い文書処理方法及び装置を実現することができる。
また、追加登録を所望する用例を単語の組合せを意識することなく、所望の用例の文字列を指定するだけで、用例の登録が行うことができ、操作性の高い文書処理方法及び装置を実現することができる。
【0072】
さらに、単語に分割された用例の構成要素を修正することによって、意にそぐわない登録を抑制することができ、なおかつ、情報を追加加工することも容易になる。
【図面の簡単な説明】
【図1】本実施の形態の文書処理装置の全体構成を示すブロック図である。
【図2】外部記憶媒体の記憶構成を示す図である。
【図3】本実施の形態の用例登録の例を示した図である。
【図4】本実施の形態の用例登録の例を示した図である。
【図5】本実施の形態の用例登録の例を示した図である。
【図6】本実施の形態の用例登録の例を示した図である。
【図7】本実施の形態の用例登録の例を示した図である。
【図8】本実施の形態の用例登録の例を示した図である。
【図9】本実施の形態の用例登録の例を示した図である。
【図10】本実施の形態の用例登録の例を示した図である。
【図11】本実施の形態の用例登録の例を示した図である。
【図12】本実施の形態の固定単語辞書の構成の一例を示した図である。
【図13】本実施の形態の追記可能辞書の構成の一例を示した図である。
【図14】本実施の形態の追記用例辞書の構成の一例を示した図である。
【図15】本実施の形態の単語情報の構成の一例を示した図である。
【図16】本実施の形態の係り情報コードの一例を示した図である。
【図17】本実施の形態の受け情報コードの一例を示した図である。
【図18】本実施の形態の動作全体の処理手順の一例を示すフローチャートである。
【図19】本実施の形態の用例登録処理の処理手順の一例を示すフローチャートである。
【図20】本実施の形態の用例登録後仮名漢字変換動作テストの処理手順の一例を示すフローチャートである。
【図21】本実施の形態の用例登録処理詳細手順の一例を示すフローチャートである。
【図22】本実施の形態の用例係り受け単語セット処理手順の一例を示すフローチャートである。
【図23】本実施の形態の単語存在チェック処理手順の一例を示すフローチャートである。
【図24】本実施の形態の用例辞書格納処理手順の一例を示すフローチャートである。

Claims (8)

  1. 単語の読みと表記と品詞とが登録された単語辞書記憶部と、複数の単語の読みと表記と品詞とが対応づけられて登録された用例辞書記憶部と、文字列を受け付ける入力手段と、プログラムに基づいて各種処理を実行する処理手段とを備えた文書処理装置により、文書を解析する文書処理方法において、
    前記処理手段、前記入力手段より受け付けられた新たな用例を構成する漢字仮名混じり表記文字列から複数の単語表記を抽出して、該複数の単語のそれぞれが既に前記単語辞書記憶部に登録されているか否かを判別する判別工程と、
    前記単語辞書記憶部に登録されていると判別された単語の読みと品詞とを、当該単語辞書記憶部から前記処理手段取得する取得工程と、
    前記処理手段、前記判別工程で抽出された複数の単語表記と、前記取得工程により取得された単語の読み及び品詞とを用例入力欄に訂正可能に表示するとともに、前記単語辞書記憶部に登録されていないと判別された単語の読みと品詞との当該用例入力欄への入力を要求する要求工程と、
    前記処理手段、登録指示がなされた際の前記用例入力欄の内容に基づいて、新たな用例を前記用例辞書記憶部に登録するとともに、該用例を構成する複数の単語に前記単語辞書記憶部に登録されていないと判別された単語があれば、当該用例入力欄に入力された該単語の読みと表記と品詞とを当該単語辞書記憶部に登録する登録工程とを備えることを特徴とする文書処理方法。
  2. 前記単語辞書記憶部が、更新可能な単語辞書部と更新不可能な単語辞書部とを有し、前記登録工程において、少なくとも前記更新不可能な単語辞書部の単語に関する前記用例辞書への登録は当該単語へのポインタで行なわれることを特徴とする請求項1記載の文書処理方法。
  3. 前記登録工程で登録された単語と用例とを使って、前記入力手段より受け付けられた前記新たな用例の読みを表わす仮名文字列を、前記処理手段仮名漢字変換して変換結果を表示する変換工程を更に備えることを特徴とする請求項1記載の文書処理方法。
  4. 前記判別工程では、前記入力手段より受け付けられた新たな用例を構成する漢字仮名混じり文字列を、前記予め登録された単語を参照して形態素に分割することにより、当該文字列から複数の単語表記を抽出することを特徴とする請求項1記載の文書処理方法。
  5. 単語の読みと表記と品詞とが登録された単語辞書記憶部及び複数の単語の読みと表記と品詞とが対応づけられて登録された用例辞書記憶部のデータを使用して文書を解析する文書処理装置において、
    文字列を受け付ける入力手段と、
    該入力手段より受け付けられた新たな用例を構成する漢字仮名混じり表記文字列から複数の単語表記を抽出して、該複数の単語のそれぞれが既に前記単語辞書記憶部に登録されているか否かを判別する判別手段と、
    前記単語辞書記憶部に登録されていると判別された単語の読みと品詞とを当該単語辞書記憶部から取得する取得手段と、
    前記判別手段により抽出された複数の単語表記と、前記取得手段により取得された単語の読み及び品詞とを用例入力欄に訂正可能に表示するとともに、前記単語辞書に登録されていないと判別された単語の読みと品詞との当該用例入力欄への入力を要求する要求手段と、
    登録指示がなされた際の前記用例入力欄の内容に基づいて、新たな用例を前記用例辞書記憶部に登録するとともに、該用例を構成する複数の単語に前記単語辞書記憶部に登録されていないと判別された単語があれば、当該用例入力欄に入力された該単語の読みと表記と品詞とを当該単語辞書記憶部に登録する登録手段とを備えることを特徴とする文書処理装置。
  6. 更新不可能な単語辞書部を有する場合に、前記用例の登録において、少なくとも前記更新不可能な単語辞書部の単語登録は当該単語へのポインタで行なわれることを特徴とする請求項5記載の文書処理装置。
  7. 前記登録手段により登録された単語と用例とを使って、前記入力手段より受け付けられた前記新たな用例の読みを表わす仮名文字列を仮名漢字変換して変換結果を表示する変換手段を更に備えることを特徴とする請求項5記載の文書処理装置。
  8. 前記判別手段は、前記入力手段より受け付けられた新たな用例を構成する漢字仮名混じり文字列を、前記予め登録された単語を参照して形態素に分割することにより、当該文字列から複数の単語表記を抽出することを特徴とする請求項5記載の文書処理装置。
JP35023996A 1996-12-27 1996-12-27 文書処理方法及びその装置 Expired - Fee Related JP3809238B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35023996A JP3809238B2 (ja) 1996-12-27 1996-12-27 文書処理方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35023996A JP3809238B2 (ja) 1996-12-27 1996-12-27 文書処理方法及びその装置

Publications (2)

Publication Number Publication Date
JPH10187706A JPH10187706A (ja) 1998-07-21
JP3809238B2 true JP3809238B2 (ja) 2006-08-16

Family

ID=18409170

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35023996A Expired - Fee Related JP3809238B2 (ja) 1996-12-27 1996-12-27 文書処理方法及びその装置

Country Status (1)

Country Link
JP (1) JP3809238B2 (ja)

Also Published As

Publication number Publication date
JPH10187706A (ja) 1998-07-21

Similar Documents

Publication Publication Date Title
KR100330801B1 (ko) 언어식별장치및언어식별방법
JPH11328166A (ja) 文字入力装置及び文字入力処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3809238B2 (ja) 文書処理方法及びその装置
JP2943791B2 (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JP2621999B2 (ja) 文書処理装置
JPS59100941A (ja) 仮名漢字変換装置
JP2786260B2 (ja) かな漢字変換装置
JP2002132764A (ja) 機械翻訳前処理装置
JPH11203279A (ja) かな漢字変換装置、かな漢字変換方法、及び記憶媒体
JP3847801B2 (ja) 文字処理装置及びその処理方法
JP3147947B2 (ja) 機械翻訳装置
JP2688651B2 (ja) 文字列変換装置
JP2000276479A (ja) 電子辞書装置及び電子辞書プログラムを記録した記録媒体
JP2603269B2 (ja) 文字処理装置
JP3847869B2 (ja) 文字列変換装置及び方法
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPH025175A (ja) 文字処理装置
JPH0567146A (ja) データ編集装置
JPH05189421A (ja) 古文かな漢字変換装置及び方法
JPH11175511A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPH02239368A (ja) 機械翻訳装置
JPH0154742B2 (ja)
JPH08292954A (ja) かな漢字変換装置
JPS62119665A (ja) ワ−ドプロセツサ
JPS63308664A (ja) 文字処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050523

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060522

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100526

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100526

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110526

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120526

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120526

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130526

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees