JP2758164B2 - 文書作成装置及び文書作成方法 - Google Patents

文書作成装置及び文書作成方法

Info

Publication number
JP2758164B2
JP2758164B2 JP63042512A JP4251288A JP2758164B2 JP 2758164 B2 JP2758164 B2 JP 2758164B2 JP 63042512 A JP63042512 A JP 63042512A JP 4251288 A JP4251288 A JP 4251288A JP 2758164 B2 JP2758164 B2 JP 2758164B2
Authority
JP
Japan
Prior art keywords
phrase
character string
information
reading
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63042512A
Other languages
English (en)
Other versions
JPH01217551A (ja
Inventor
明美 黒森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63042512A priority Critical patent/JP2758164B2/ja
Publication of JPH01217551A publication Critical patent/JPH01217551A/ja
Application granted granted Critical
Publication of JP2758164B2 publication Critical patent/JP2758164B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、複数の文節を含む文字列を文節に切断して
一括かな漢字変換する機能を備えた文書作成装置及び文
書作成方法に関する。
(従来の技術) 複数の文節を含む文字列を一括してかな漢字変換する
場合、例えば「ここではきものをぬぐ」という文字列の
場合には、 (a)[ここでは][きものを][ぬぐ] (b)[ここで][はきものを][ぬぐ] の文節切断例が考えられる。
文書作成装置は、内部に辞書として記憶している単語
情報、助詞などの付属語の情報、用言の活用の情報など
の情報に従って、例えば最長一致法として知られた方法
で(a)か(b)のいずれかの文節切断を行う。従っ
て、例えば、(b)の文節切断を期待して文字列の入力
を行ったにも拘らず、(a)の切断が行われてしまう場
合がある。
この対策として、文書作成装置は、入力文字列の文節
をやり直し、最初の文節切断とは異なる文節切断の候補
を再出力する「文節切り直し」の機能を持っている。
(発明が解決しようとする課題) 従来の文書作成装置は、切り直された文節の切断点を
覚えていないため、同じ文字列の入力があるたびに間違
った文節切断が行われ、文節切り直しの作業を行わなけ
ればならなかった。
本発明はこの問題を解決するために、入力された文字
列について切り直された文節の切断点を覚えておき、再
度同様な文字列の入力があったときには、学習した切断
点によって文節の切断を行い、オペレータの所望する変
換結果を得易くした文書作成装置及び文書作成方法を提
供することを目的とする。
[発明の構成] (課題を解決するための手段及び作用) 本発明は文書作成装置に於いて、複数の文節を含む読
みの文字列を切断可能な文節の候補に切って漢字かな混
じり文に変換する変換手段と、前記変換手段によって変
換された漢字かな混じり文に対し、文節の切り直しを指
示する文節切直指示手段と、前記文節切直指示手段によ
り指定された文節の区切りに従って、前記変換手段に前
記読みの文字列の再変換を行わせる変換制御手段と、前
記文節切直指示手段により切り直しが指示された第1文
節について、当該第1文節の読み、当該第1の次に続く
第2文節の語幹の読み、及び当該第2文節の語幹の品詞
とからなる文節切断情報を記憶する文節切断情報記憶手
段とを具備し、前記変換手段は、新たに入力される読み
の文字列の漢字かな混じり文への変換に際し、前記新た
に入力される読みの文字列に対応する文節切断情報が前
記文節切断情報記憶手段に記憶されている場合には、当
該記憶されている文節切断情報に従って前記新たに入力
された読みの文字列に対する文節の切断を行うことを特
徴とする。
また、本発明は上記文書作成装置に於いて、前記文節
切直手段によって切られた第1文節が変換の対象となる
かな以外の字種の文字列と付属語との組み合わせであっ
た場合、前記文節切断情報記憶手段は、第1文節の字
種、当該第1文節の次に続く第2文節の語幹の読み、及
び、当該第2文節の語幹の品詞を文節切断情報として記
憶し、前記変換手段は、前記入力された読みの文字列の
第1文節の文字列の字種が前記かな以外の字種であった
場合、前記文節切断情報記憶手段に前記入力された第1
文節の字種と一致する文書切断情報が記憶されているか
否かを判断し、この判断の結果、字種の一致する文書切
断情報が記憶されていた場合、当該字種の一致する文節
切断情報に従って前記入力された読みの文字列の文節の
切断を行うことを特徴とする。
また、本発明は文書作成方法に於いて、複数の文節を
含む読みの文字列を切断可能な文節の候補に切って漢字
かな混じり文に変換し、変換された漢字かな混じり文に
対する文節の切り直しの指示を受け付け、当該受け付け
た文節の区切りに従って前記読みの文字列の再変換を行
い、文節の切り直しが指示された第1文節について、当
該第1文節の読み、当該第1文節の次に続く第2文節の
語幹の読み、及び当該第2文節の語幹の品詞とからなる
文節切断情報を記憶し、新たに入力される読みの文字列
の漢字かな混じり文への変換に際し、前記新たに入力さ
れる読みの文字列に対応する文節切断情報が記憶されて
いるか否かを判断し、この結果、前記新たに入力される
読みの文字列に対応する文節切断情報が記憶されている
と判断された場合には、当該記憶されている文節切断情
報に従って前記新たに入力された読みの文字列の文節の
切断を行うことを特徴とする。
(実施例) 以下図面を参照して本発明の一実施例を説明する。
第1図は、この実施例の文書作成装置のブロック図で
ある。
この文書作成装置の機能を司るマイクロプロセッサ
(CPU)11の管理のもとに、オペレータとのインタフェ
ースとなるキーボード(KB)14、LCD表示器16、プリン
タ(PRT)19が設けられる。更に、CPU11が実行する機能
の各種プログラム、前述した変換用の辞書が記憶された
ROM11、文書保存のためのフロッピーディスク(FD)が
装着され、このFDから文書の読みだし、書込みを行うフ
ロッピーディスクドライブ(FDD)21、作成中の文書、C
PU11による前記プログラムの実行に必要なデータを記憶
するランダムアクセスメモリ(RAM)13が設けられる。
前記KB14、LCD16、PRT19、FDD21はCPU11との間のデータ
の授受を制御する各々のインタフェース(KB−IF15、表
示CNT17、PRT−IF20、FDD−IF22)を介して、CPU11のバ
スに接続されている。CNT17は、CPU11から送られた文字
パターンデータをLCD表示器16に表示するための表示用
ドットメモリ18が接続されており、表示CNT17は表示用
ドットメモリ18からドットパターンを読み出してLCD表
示器16に送っている。以上の構成は従来の文書作成装置
の構成と同じなので詳細な説明は省略する。また、かな
漢字変換の手法、文節切断の手法については、様々な文
献で紹介されているので説明を省く。
本実施例の文書作成装置の特徴は、RAM13の中に、切
り直された文節の文節切断情報が登録されるテーブルと
して、検索テーブル131と文節テーブル132とを設けるこ
とにある。そして、CPU11の実行する機能として、文節
の切り直しの時点で文節の切断点の情報を前記テーブル
に登録する機能と、文字列が入力されたときに前記テー
ブルを参照して、入力された文字列が前に切り直された
文字列と同様な文字列(同様としたのは、第2文節の活
用が変化したり、助詞が変わっていたりしても同じ文字
列として扱うことによる)であるときに同じ文節切断を
行う機能を付与したことにある。
第2図は、検索テーブル131と文節テーブル132とのデ
ータ記憶形態を示す図である。
検索テーブル131は、入力文字列の文節切断情報が登
録されているか否かの検索を高速化するために設けられ
たテーブルであり、第1文節の読みの先頭から2文字が
50音順に見出しとして記憶され、さらに各々に対応し
て、前記2文字に続く文字列が記憶されている文節テー
ブル132のエントリを示す情報(Point)が記憶されてい
る。入力文字列全体を登録された読みと比較しなくて
も、その先頭の2文字だけ比較して登録されている可能
性があるか否かを確認できる。
Pointで示された文節テーブル132のエントリには、第
1文節の残りの読みと第2文節の語幹までの読みの文字
列と、第1文節の読みの長さ、第2文節の語幹の読みの
長さ、及び、第2文節の語幹の品詞の示す情報が記憶さ
れている。
第2文節までを登録の対象としたのは、文節の切断は
後の文節との絡みで決定されるのが一般的であり、第1
文節の読みだけの登録では、第2文節がどんな場合にも
画一的な切断となってしまう不具合が生じるからであ
る。
例えば、第2文節によらず、[ここで]を文節のくぎ
りとして覚えてしまうと、 [ここではきれいにしよう] という文節が入力されても、 [ここで][はきれいに][しよう] と切断してしまい、変換が無味なものになってしまう。
また、第2文節の語幹のみを覚えるのは、入力文字列
の第2文節では、語幹に続く助詞、又は、活用語尾が様
々に変化するので、第2文節の全体を覚えてしまうと極
めて狭い学習となってしまうからである。
更に、第2文節の語幹の品詞を覚えるのは、全く同じ
文字列でも、意味の異なる場合が生じるからである。
例えば、[ここではねを]という文字列に対して、
[ここでは][根を]という変換結果から[ここで]
[はねを]という文節切り直しを行って[ここで][は
ね]という、[はね]の品詞情報のない文節切断情報を
覚えたとする。
この場合、 [ここではねる](「はね」は動詞) [ここではねを](「はね」は名詞) は両方とも[ここで」で切断され、 [ここで][跳ねる] [ここで][羽を] と変換される。
しかし、オペレータは、の変換はOKでも、の文字
列に対しては、 [ここでは][寝る] という文節切断、変換を望んでいる可能性もある。[は
ね]の品詞情報を名詞と覚えておけば、上記の場合の
みが変換の対象となって、のような誤変換がおこる可
能性がなくなり変換効率が上がる。
更に、例えば、 [1134kmでは][やめる] から、 [1134kmで][はや(速)める] のような文節切り直しが行われた場合、数字の部分、英
字の部分の内容は様々に変わる可能性が高い。従って、
文字列そのものを覚えてしまうと、 [2639kmではやめる] というような文字列が入力されると、切断情報未登録と
して処理されてしまい、学習能力として効率が悪い。
このため本実施例では、かな文字列以外の漢字への変
換の対象とならない字種、例えば、数字文字列、英字文
字列、記号文字列、カタカナ文字列は、文字列を覚える
のではなく、字種を示すコードで記憶しておく。
例えば、上の列では、[数字コード][英字コード]
が(実際に数字文字列、英字文字列が何文字あろうと
も)2文字分として検索テーブル131に記憶され、残り
の文字列[ではやめ]がPointで示された文節テーブル1
32のエントリに記憶される。
第3図は、変換結果を得るまでのCPU11の処理の流れ
を示している。変換の対象となる文字列の入力があり、
変換を行った結果所望する文節が得られなかったとき
に、KB14から文節切り直し指示(特定キーの押下)がな
される。このとき、CPU11は文節切断の機能を再度実行
して、新たに文節切断された文字列をLCD表示器16に表
示する。最初の変換では、例えば[では]が助詞として
認識され切断されたが、[で]単独でも助詞となりうる
ので、文節切り直しによって[で]を第1文節の切断点
として、以降の文字列の文節切断を実行していく。この
切り直しの時点で、前述した文節切断情報がテーブル13
1、132に登録される。尚、文節切断の実行の際に、文字
列で辞書を検索し単語の抽出と品詞のチェック、接続関
係のチェック等の文法チェックが行われる事は周知であ
るが、この過程で第2文節の語幹の抽出と品詞の情報が
得られる。
第4図は、文節切断情報がテーブル131、132に文節切
断情報を登録する際の、CPU11の処理の流れを示してい
る。
ただし、文節切り直しの過程で、 「で]で切断。
「ここ]:辞書に単語として登録あり。
「はきものをぬぐ」で辞書検索。
「はきもの」:辞書に名詞の単語としてあり。
「を」:辞書に助詞として登録あり、かつ、「はきも
の」(名詞)との接続OK。
「ぬぐ」:動詞として辞書に登録あり。
という動作が行われており、この過程で得られた第1文
節の先頭2文字の読みが検索テーブル131に記憶され(S
7)、第1文節の残りの文字列と第1文節の読みの長
さ、及び、第2文節の語幹の読み、長さ、品詞の情報が
文節テーブルに記憶される(S9)。
第5図は、変換対象となる文字列が入力され、変換が
CPU11に指示され、文節の切断、変換という機能が実行
されるとき、この機能の中で前記テーブル131、132が参
照されるという処理の流れを示した図である。
[発明の効果] 以上詳記したように本発明によれば、文節の切り直し
が行われた場合、第1文節の読みと第2文節の語幹の読
みと品詞の情報を文節切断情報として学習するようにし
たので、学習した以降の文字列で登録したと同様な文字
列が存在した場合には同じ文節切断を行うことができ
る。しかも第2文節の語幹の読みと品詞の情報を文節切
断情報として学習しているので、学習の結果が無意味な
文節切断に利用される可能性が少なくなり、変換効率の
一層の向上をもたらす。
【図面の簡単な説明】
第1図は実施例の文書作成装置のブロック図、第2図は
文節切断情報登録テーブルの構成を示す図、第3図は入
力文字列の変換と文節切り直しの処理の流れを示す図、
第4図は文節切り直しの処理における文節切断情報の登
録処理の流れを示す図、第5図は登録された文節切断情
報を利用した入力文字列の変換処理における文節切断の
処理の流れを示す図である。 131……検索テーブル、132……文節テーブル。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】複数の文節を含む読みの文字列を切断可能
    な文節の候補に切って漢字かな混じり文に変換する変換
    手段と、 前記変換手段によって変換された漢字かな混じり文に対
    し、文節の切り直しを指示する文節切直指示手段と、 前記文節切直指示手段により指定された文節の区切りに
    従って、前記変換手段に前記読みの文字列の再変換を行
    わせる変換制御手段と、 前記文節切直指示手段により切り直しが指示された第1
    文節について、当該第1文節の読み、当該第1の次に続
    く第2文節の語幹の読み、及び当該第2文節の語幹の品
    詞とからなる文節切断情報を記憶する文節切断情報記憶
    手段とを具備し、 前記変換手段は、新たに入力される読みの文字列の漢字
    かな混じり文への変換に際し、前記新たに入力される読
    みの文字列に対応する文節切断情報が前記文節切断情報
    記憶手段に記憶されている場合には、当該記憶されてい
    る文節切断情報に従って前記新たに入力された読みの文
    字列に対する文節の切断を行う ことを特徴とする文書作成装置。
  2. 【請求項2】前記文節切直手段によって切られた第1文
    節が変換の対象となるかな以外の字種の文字列と付属語
    との組み合わせであった場合、前記文節切断情報記憶手
    段は、第1文節の字種、当該第1文節の次に続く第2文
    節の語幹の読み、及び、当該第2文節の語幹の品詞を文
    節切断情報として記憶し、 前記変換手段は、前記入力された読みの文字列の第1文
    節の文字列の字種が前記かな以外の字種であった場合、
    前記文節切断情報記憶手段に前記入力された第1文節の
    字種と一致する文書切断情報が記憶されているか否かを
    判断し、この判断の結果、字種の一致する文書切断情報
    が記憶されていた場合、当該字種の一致する文節切断情
    報に従って前記入力された読みの文字列の文節の切断を
    行う ことを特徴とする特許請求の範囲第1項記載の文書作成
    装置。
  3. 【請求項3】複数の文節を含む読みの文字列を切断可能
    な文節の候補に切って漢字かな混じり文に変換し、 変換された漢字かな混じり文に対する文節の切り直しの
    指示を受け付け、当該受け付けた文節の区切りに従って
    前記読みの文字列の再変換を行い、 文節の切り直しが指示された第1文節について、当該第
    1文節の読み、当該第1文節の次に続く第2文節の語幹
    の読み、及び当該第2文節の語幹の品詞とからなる文節
    切断情報を記憶し、 新たに入力される読みの文字列の漢字かな混じり文への
    変換に際し、前記新たに入力される読みの文字列に対応
    する文節切断情報が記憶されているか否かを判断し、 この結果、前記新たに入力される読みの文字列に対応す
    る文節切断情報が記憶されていると判断された場合に
    は、当該記憶されている文節切断情報に従って前記新た
    に入力された読みの文字列の文節の切断を行う ことを特徴とする文書作成方法。
JP63042512A 1988-02-25 1988-02-25 文書作成装置及び文書作成方法 Expired - Lifetime JP2758164B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63042512A JP2758164B2 (ja) 1988-02-25 1988-02-25 文書作成装置及び文書作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63042512A JP2758164B2 (ja) 1988-02-25 1988-02-25 文書作成装置及び文書作成方法

Publications (2)

Publication Number Publication Date
JPH01217551A JPH01217551A (ja) 1989-08-31
JP2758164B2 true JP2758164B2 (ja) 1998-05-28

Family

ID=12638121

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63042512A Expired - Lifetime JP2758164B2 (ja) 1988-02-25 1988-02-25 文書作成装置及び文書作成方法

Country Status (1)

Country Link
JP (1) JP2758164B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3466761B2 (ja) * 1995-03-31 2003-11-17 キヤノン株式会社 文書処理装置及びその制御方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61173377A (ja) * 1985-01-29 1986-08-05 Matsushita Electric Ind Co Ltd 日本語文作成装置
JP2595934B2 (ja) * 1985-07-08 1997-04-02 株式会社リコー 仮名漢字変換処理装置
JPS62145463A (ja) * 1985-12-20 1987-06-29 Ricoh Co Ltd 仮名漢字変換方式

Also Published As

Publication number Publication date
JPH01217551A (ja) 1989-08-31

Similar Documents

Publication Publication Date Title
JP2758164B2 (ja) 文書作成装置及び文書作成方法
JP2621999B2 (ja) 文書処理装置
JPS6362018B2 (ja)
JPH077411B2 (ja) 文書処理装置
JPH0521247B2 (ja)
JPH03136161A (ja) 文書作成装置
JPS5998236A (ja) 日本文入力装置
JPS6395573A (ja) 日本語文形態素解析における未知語処理方法
JPS5832418B2 (ja) 漢字まじり文入力装置
JPS63228375A (ja) 電子辞書
JP2573183B2 (ja) かな漢字変換装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JP3255328B2 (ja) 機械翻訳装置
JPH02136956A (ja) レイアウト情報の抽出方法
JPH0797368B2 (ja) 日本語入力装置
JP2005258571A (ja) かな漢字文字変換装置、かな漢字文字変換方法、かな漢字文字変換プログラム、およびかな漢字文字変換プログラム記録媒体
JPH0585055B2 (ja)
JPH0683807A (ja) 文書作成装置
JPH027160A (ja) 文字処理装置
JPS59148924A (ja) 英字鍵盤による日本文入力法
JPH04160668A (ja) 文字処理装置
JPH07160696A (ja) 文書処理方法及びその装置
JPH09134353A (ja) 文書処理装置の仮名漢字変換方法
JPH0683806A (ja) 文書作成装置
JPS6370373A (ja) 文字処理装置