JPH07121526A - 文章作成装置 - Google Patents

文章作成装置

Info

Publication number
JPH07121526A
JPH07121526A JP5266900A JP26690093A JPH07121526A JP H07121526 A JPH07121526 A JP H07121526A JP 5266900 A JP5266900 A JP 5266900A JP 26690093 A JP26690093 A JP 26690093A JP H07121526 A JPH07121526 A JP H07121526A
Authority
JP
Japan
Prior art keywords
character string
shortening
word
kana
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5266900A
Other languages
English (en)
Inventor
Akiko Oosuga
亜紀子 大須賀
Kozue Watanabe
こずえ 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP5266900A priority Critical patent/JPH07121526A/ja
Publication of JPH07121526A publication Critical patent/JPH07121526A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 かな漢字変換の辞書に単語ごとにあらかじめ
記憶させた短縮化情報を用いて、入力文の短縮化を自動
的に行うことによって、文章作成時のオペレータの負荷
を軽減させる。 【構成】 キーボード2から入力された読み文字列を、
CPU10は変換辞書11aの情報を参照して候補文字
列に変換する。短縮処理は、まず、変換された候補文字
列を単語毎に分割する。そして、各単語の有する短縮条
件をROM11内の短縮化情報部11bの情報を参照し
て、短縮可能な単語を検知する。検知された単語は短縮
化情報部11bに記憶された対応する短縮形に変換され
る。これを繰り返し、全体として短縮された文章に自動
的に変換することが出来る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、かな漢字変換辞書に単
語単位であらかじめ登録されている短縮情報を用いて、
入力文を自動的に短縮する文章作成装置に関する。
【0002】
【従来の技術】従来、この種の文章作成装置は、特開昭
63−198162号公報に示されているように、ファ
イル化された省略化規則を参照して、入力文の省略処理
を行っていた。その省略化規則は、構文的省略規則・主
題に基づく省略規則・文脈に基づく省略規則の3規則に
分類されている。
【0003】構文的省略規則の例としては、「出力すべ
き一文の意味表現が等位接続関係にある複数のイベント
である場合は、control−adjunction
により解析可能な格成分は一方を省略化する」という規
則を挙げている。主題に基づく省略規則の例としては、
「旧主題と新主題が等しい場合には主題成分を省略す
る」という規則を挙げている。また、文脈に基づく省略
規則の例としては、「名詞概念を限定・修飾する修飾句
と等しい内容が文脈テーブルに存在する場合はその修飾
句相当の意味表現を省略する」という規則が挙げられて
いる。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
省略化規則ファイルを参照する省略処理では、省略化の
規則を構文・主題・文脈のいずれかのレベルで記述しな
ければならず、対象となる文中の単語は問わない省略化
のルールとなる。
【0005】そのため、同型の構文であっても文中の単
語によって省略が可能になったり不可能になったりする
ような場合には対応できなかった。
【0006】たとえば、「〈国名〉+を+〈サ変動
詞〉」という構文を「<サ変動詞の短縮形>+<国名の
短縮形>」の形に省略するという規則があるとする。こ
こからいくと「米国を訪問する」は「訪米」と省略され
る。これは、「訪米」が構文的あるいは文法的な省略で
はなく、「〈国〉を訪問する」という事柄が、『今回の
首相の訪米にあたって』等の表現にみられるように、新
聞・テレビの報道など簡潔な表現を要求される場に頻繁
に登場する事柄であり、そのため省略表現が生まれ、ま
た慣用化されて使用されていることによると考えられ
る。また、[〈国名〉+を+〈サ変動詞〉]という同型
の構文である「米国を案内する」を入力すると「案米」
と省略されてしまう。しかし、「案米」という言葉は
「訪米」とは違って慣用句的に使われることはないた
め、この言葉を受け取った側はこの語の意味する事柄を
認識できない。よって、この省略は妥当ではなく、この
ような場合には省略化すべきでない。
【0007】さらに、「米国」を「米」、「訪問する」
を「訪」と省略するのは、その単語特有の情報であり、
これらを従来の省略化規則ファイルに記述することは不
可能であった。
【0008】本発明は、上述した問題点を解決するため
になされたものであり、かな漢字変換辞書に単語単位で
あらかじめ登録されている省略情報を用いて、誤りがな
く、幅広い入力文に対しても自動的に短縮化を行うこと
が可能な文章作成装置を提供することを目的とする。
【0009】
【課題を解決するための手段】この目的を達成するため
に本発明の文章作成装置では、図1に示すように、読み
文字列を入力する入力手段と、単語毎に読みと候補文字
列である表記と品詞等の情報を記憶する変換辞書部と、
前記入力手段より入力された読み文字列を前記変換辞書
部を参照して候補文字列に変換するかな漢字変換手段を
具備するものであり、更に、単語毎にその単語が短縮化
可能であるか否かを判別するための短縮条件と短縮が可
能ならばその単語の短縮形とを記憶する短縮化情報部
と、前記かな漢字変換手段によって変換された候補文字
列と前記短縮化情報部とを参照して短縮条件に当てはま
るか否かを判別する判別手段と、前記判別手段より短縮
条件を満たすと判断された場合には、前記候補文字列を
対応する短縮形に変換する短縮手段とを備えている。
【0010】尚、更に、作成したい文章の最大文字数を
設定する設定手段と、かな漢字変換された候補文字列が
前記設定手段により設定された最大文字数を越える場合
にのみ前記短縮手段を動作させる制御手段とを備えてい
てもよい。
【0011】尚、前記短縮手段は、かな漢字変換された
文字列中の各単語をその対応する略語で置き換える第一
の短縮手段と、前記短縮化情報部の短縮条件に当てはま
る特定構文がかな漢字変換された文字列中に存在する場
合には、その表現をその対応する合成語で置き換える第
二の短縮手段とを備えていてもよい。
【0012】
【作用】上記の構成を有する本発明の文章作成装置で
は、入力手段から入力された読み文字列を、かな漢字変
換手段が変換辞書部の情報を参照して候補文字列に変換
する。そして、判別手段が、前記かな漢字変換手段によ
り変換された候補文字列と省略化情報部の情報とを参照
して、短縮条件に当てはまるかどうか判定する。前記判
別手段より短縮条件を満たすと判断された場合には、短
縮手段は前記候補文字列を対応する短縮形に変換され
る。
【0013】
【実施例】以下、本発明を具体化した一実施例を図面を
参照して説明する。
【0014】図2は本発明を具体化した文章作成装置の
構成を示すブロック図である。本実施例の文章作成装置
は、文字や編集指示などを入力する入力手段であるキー
ボード2、文字や図形を表示するディスプレイ3、文字
や図形を印字するプリンタ4、およびこれらに接続さ
れ、文書の入力・変換・編集・印刷を制御する機能を備
えた電子制御装置5などから構成されている。
【0015】キーボード2には、文字を入力する文字キ
ー、入力されたかな文字列を漢字かな交じり文に変換す
るように指示する変換キー、変換時の部分候補の変換し
直しを指示する次候補変換キー、変換時の候補文字列の
選択等、各種動作の実行を指示する改行実行キー、文書
中の文字入力位置及び変換文字の範囲指定等を指定する
カーソルキー、後述する短縮処理の実行を指示する短縮
キー等が設けられており、オペレータはこれらのキーを
操作することによって、文書の入力、変換、編集、印刷
等の指示を前記電子制御装置5に与える。
【0016】電子制御装置5は、CPU10、ROM1
1、RAM12等を中心に構成され、前記キーボード2
等の外部装置の入出力信号を、CPU10の処理可能な
信号に変換する入出力ポート13等を備えている。
【0017】前記ROM11には、かな漢字変換処理お
よび後述する短縮処理等のプログラムが格納されるプロ
グラム領域のほかに、かな漢字変換処理で使用される単
語情報が格納されている変換辞書部11a、および、短
縮処理で使用される単語の短縮情報が格納されている短
縮化情報部11bが設けられる。
【0018】また、RAM12には、読み文字列を格納
する読み文字列領域12a、候補文字列を格納する候補
文字列領域12b、作業領域12c、後述する短縮処理
により作成される短縮文字列を格納する短縮文字列領域
12d等が設けられる。
【0019】変換辞書11aに記憶されている単語情報
の一例を図3に示す。辞書データは、単語が読み順に格
納されており、各単語の読み対して、表記・品詞情報・
前後の単語との接続情報・意味情報等が対になって格納
されている。例えば、「あめりかがっしゅうこく」とい
う読みに対して、表記「アメリカ合衆国」・品詞情報
[名詞]・意味分類[国名]などが格納されている。
【0020】また、短縮化情報部11bには文書短縮の
ための情報が格納されている。短縮化情報の記述の仕方
はいろいろな方法が可能であるが、ここではその一例を
図1に示す。図1に示すように本実施例では各日本語の
表記に対応させて、短縮化情報として短縮条件と短縮形
式とが記憶されている。短縮条件とは、単語がどのよう
に用いられた場合に短縮化が生じるかを記述するもので
ある。もし短縮化される条件を特定化できないならば、
記述しなくてよい。また短縮形式とは、先の短縮条件を
満たすときその単語がどのように短縮されるかを記述す
るものである。短縮形式に従って文を構成し直すことに
より、短縮化された表現を作成することができる。
【0021】具体的には「センチメートル」という表記
には、短縮形式として「cm」が記憶されている。この
場合、短縮条件が記述されていないので、「センチメー
トル」はどの様な文章内においても「cm」と短縮化で
きることを示している。また、「研究所」という表記で
は、そこに記述された短縮条件<(意味)人名><[研
究所]> でしか短縮形式<(意味)人名><[研]>
に短縮化されない。尚、短縮条件の意味するところにつ
いては後述する。また、短縮形を持たない単語について
は、この短縮化情報部11bには記憶されていない。
【0022】まず、本実施例における一連のかな漢字変
換の変換処理について詳述する。
【0023】キーボード2上の文字キーにより、読み文
字列が読み文字列領域12aに入力され、変換キーが押
下されることにより、かな漢字変換の初回変換の処理が
開始される。まず、入力された読み文字列を順に単語に
区切りながら変換辞書11a内の登録単語との読み比較
を行う。一致する語があれば、その語の表記及び品詞等
の文法情報を受取る。さらにその各々の単語の品詞情報
等を用いての接続検定を行うことにより読み文字列を分
割し、それぞれの分割された読みに対する候補となる登
録単語を特定する。その結果として分割された単語単位
に、それぞれの単語の同音異義語も含めて、辞書情報を
作業領域12cに格納する。
【0024】作業領域12cに格納された単語を連結し
て候補文字列領域12bに取り出して候補文字列を作成
し、ディスプレイ3に表示する。以上でかな漢字変換の
初回変換処理が終了し、次のキー入力の待ち状態にな
る。
【0025】ここで、変換された候補文字列が、オペレ
ータの求めるものに一致しない場合は、カーソルキーに
よって読みの分割位置を指定し次候補変換キーを押下し
て候補文字列を変えることにより、求める文字列になる
ように修正することができる。
【0026】また、確定キーが押された場合は、候補文
字列の文書内への挿入などの確定処理を行い、かな漢字
変換処理を終了する。
【0027】一方、変換された候補文字列が、オペレー
タにとって文字数が多すぎる場合がある。オペレータは
何かの文書を作成するために文章を入力することが多い
と思われるが、文書のフォーマットによって文字数が制
限されたり、表現を簡潔化する必要が生じることもあ
る。そのために、かな漢字変換結果の候補文字列を短縮
したい場合がある。このような場合に、オペレータは短
縮キーを押下して候補文字列を短縮した表現に修正する
のである。
【0028】次に、短縮処理の詳細を図4のフローチャ
ートを用いて説明する。いま、入力読み文字列「べいこ
くをほうもんする」に対し、かな漢字変換によって「米
国を訪問する」という漢字かな交じり文が生成された場
合を例に取り上げる。この漢字かな交じり文は、かな漢
字変換がなされた際に「米国/を/訪問する」という単
語分割がなされて記憶されているとする。
【0029】まず、短縮キーを押下し、カーソルキーで
短縮化したい文章の範囲指定を行い短縮処理を開始させ
る(S10)。ここでは、「米国を訪問する」と範囲指
定する。
【0030】短縮処理が開始されると、作業領域12c
に格納されている変換文字列の各単語に対応する短縮化
情報を短縮化情報部11bから検索する(S11)。短
縮化情報を有す単語があれば、まずその単語の短縮条件
を読み込む(S12)。作業領域12c内の各単語の短
縮化情報には、単語「訪問する」に対して、短縮条件と
して[<(意味分類)国名><[を]><[訪問する]
>]とある。この短縮条件は、「訪問する」という単語
がどのように用いられた場合に短縮が生じるかを記述し
ている。ここで<>に囲まれた単語がこの順に文中に出
現することを示すものとする。さらに<>内において、
単語の表記によって単語を特定化する場合は、<[を]
>のように、その表記を[]で囲って記述するものとす
る。また単語の属性を指定して単語を特定化する場合
は、<(意味分類)国名>のように、()内に属性名を
示し、その後に属性の値を記述するものとする。
【0031】まず、CPU10が候補文字列が短縮条件
に合致するかどうかを各単語別に判定する(S13)。
「訪問する」の短縮条件に照らし合わせるため、「米
国」の辞書情報内の意味分類を検索すると「国名」とあ
る。したがって「米国を訪問する」という文はこの条件
に合致する。これに対し、たとえば「研究所を訪問す
る」という文では、「研究所」の意味分類は「機関」で
あるので、合致しない。
【0032】短縮条件に合致した場合は(S13:YE
S)、短縮形式を検索する(S14)。短縮形式は、ど
のように文を短縮するかが記述されている。「訪問す
る」の短縮形式は、[<[訪]><国名の短縮形式>]
となっている。「米国」の短縮情報をみると、短縮条件
は規定されておらず、短縮形式が[<[米]>]とあ
る。この「米国」の短縮形式[<[米]>]を、「訪問
する」の短縮形式である[<[訪]><国名の短縮形式
>]にあてはめ、「訪米」という文字列を作成し(S1
5)、短縮文字列領域12dに格納する。
【0033】短縮文字列領域12dに格納された文字列
をディスプレイ3に表示し、キー入力待ちの状態になる
(S16)。ここで、確定キーが押された場合には(S
17:YES)、候補文字列の文書の表現とここで短縮
化された表現との入れ替えなどの確定処理を行い(S1
8)、短縮処理が終了する。
【0034】また、短縮させる対象文として「米国を案
内する」を考える。各単語に対応する短縮化情報を短縮
化情報部11bから検索すると(S11)、単語「案内
する」には短縮化条件が無いから、この語に関する短縮
化は行わない(S11:NO)。但し、単語「米国」に
対しては短縮条件無しに短縮形式<[米]>とあるた
め、「米を案内する」という文字列を作成する(S1
5)。
【0035】尚、短縮化情報部11bの辞書データに
は、一つの単語に対し短縮化情報を複数持たせることも
可能である。複数の短縮条件を有す場合には、変換対象
物である候補文字列に合致する短縮条件をCPU10が
判断し、その短縮条件に対応する短縮形式に則って短縮
処理を行う。
【0036】また、一つの単語に同じ短縮条件で対応す
る短縮形式を複数登録しておき、かな漢字変換と同様に
キー操作によりオペレータが任意に短縮形式を選択でき
るようにしてもよい。例えば、「アメリカ合衆国」に対
して短縮語を「米国」,「米」と登録しておき、その語
の短縮が指示された際には、次変換キーを押下すること
でオペレータは自分の所望の文章に合う短縮語を自由に
選択できるようにしてもよい。
【0037】以上説明したように、本実施例では、かな
漢字変換辞書に単語単位であらかじめ登録されている短
縮情報を用い、語に依存するような文章の短縮化を自動
的に行うことができ、文章作成時のオペレータの負荷を
軽減することができる。
【0038】尚、本発明は上記実施例に限定されるもの
でなく、その主旨を逸脱しない範囲で変更は可能であ
る。例えば、上記の実施例では短縮処理はキーボードか
らの短縮キー押下を動作開始の基準にしていたが、かな
漢字変換された候補文字列の文字数が所定の数を越える
と自動的に短縮化動作を始めるようにしたものでもよ
い。例えば、新聞等の見出しのように、作成する文章の
文字数が限定される場合には、その文字数を予め設定し
ておく。その設定値をかな漢字変換された短縮化対象文
の文字数が上回っている場合に短縮化が自動的になされ
るようにすればよい。
【0039】また、短縮化は段階的になされるものであ
ってもよい。即ち、短縮化の第一段階として例えば「ア
メリカ合衆国」→「米国」と変換されるような、無条件
に表記を略語に変換できる単語のみを変換し、第二段階
で、例えば「米国を訪問する」→「訪米」などのよう
な、短縮条件を有す短縮化を行うように分割し、利用者
はどの段階まで短縮化を行うかを選択できるようにして
もよい。
【0040】
【発明の効果】以上説明したことから明かなように、本
発明の文章作成装置は、かな漢字変換辞書に単語単位に
登録されている短縮情報を用いて、候補文字列を自動的
に短縮した文に変換することができる。そして、情報伝
達効率のよい文章を作成することができる。
【図面の簡単な説明】
【図1】本実施例の短縮化情報部に格納されているデー
タの詳細図である。
【図2】本実施例の文章作成装置のブロック図である。
【図3】本実施例の辞書検索データの詳細図である。
【図4】本実施例の短縮処理の流れ図である。
【符号の説明】
1 文章作成装置 2 キーボード 5 電子制御装置 10 CPU 11 ROM 11a 変換辞書 11b 短縮化情報部 12 RAM 12a 読み文字列領域 12b 候補文字列領域 12c 作業領域 12d 短縮文字列領域
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 8125−5L 15/38 D

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 読み文字列を入力する入力手段と、 単語毎に読みと候補文字列である表記と品詞等の情報を
    記憶する変換辞書部と、前記入力手段より入力された読
    み文字列を前記変換辞書部を参照して候補文字列に変換
    するかな漢字変換手段を具備する文章作成装置におい
    て、 単語毎にその単語が短縮化可能であるか否かを判別する
    ための短縮条件と短縮が可能ならばその単語の短縮形と
    を記憶する短縮化情報部と、 前記かな漢字変換手段によって変換された候補文字列と
    前記短縮化情報部とを参照して短縮条件に当てはまるか
    否かを判別する判別手段と、 前記判別手段より短縮条件を満たすと判断された場合に
    は、前記候補文字列を対応する短縮形に変換する短縮手
    段とを備えることを特徴とした文章作成装置。
  2. 【請求項2】 更に、作成したい文章の最大文字数を設
    定する設定手段と、 かな漢字変換された候補文字列が前記設定手段により設
    定された最大文字数を越える場合にのみ前記短縮手段を
    動作させる制御手段とを備えることを特徴とする請求項
    1に記載の文章作成装置。
  3. 【請求項3】 前記短縮手段は、 かな漢字変換された文字列中の各単語をその対応する略
    語で置き換える第一の短縮手段と、 前記短縮化情報部の短縮条件に当てはまる特定構文がか
    な漢字変換された文字列中に存在する場合には、その表
    現をその対応する合成語で置き換える第二の短縮手段と
    を備えていることを特徴とする請求項1に記載の文章作
    成装置。
JP5266900A 1993-10-26 1993-10-26 文章作成装置 Pending JPH07121526A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5266900A JPH07121526A (ja) 1993-10-26 1993-10-26 文章作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5266900A JPH07121526A (ja) 1993-10-26 1993-10-26 文章作成装置

Publications (1)

Publication Number Publication Date
JPH07121526A true JPH07121526A (ja) 1995-05-12

Family

ID=17437223

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5266900A Pending JPH07121526A (ja) 1993-10-26 1993-10-26 文章作成装置

Country Status (1)

Country Link
JP (1) JPH07121526A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9286278B2 (en) 2011-11-17 2016-03-15 International Business Machines Corporation Range-based text editing

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9286278B2 (en) 2011-11-17 2016-03-15 International Business Machines Corporation Range-based text editing

Similar Documents

Publication Publication Date Title
US5091876A (en) Machine translation system
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
JPH03268062A (ja) 機械翻訳電子メール装置における私用単語の登録装置
JP3038079B2 (ja) 自動翻訳装置
JPH08314910A (ja) 異種コード文字列転記装置および電子辞書
JPH11328166A (ja) 文字入力装置及び文字入力処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH07121526A (ja) 文章作成装置
JP2943791B2 (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JPH05233600A (ja) ワードプロセッサ
JP3036005B2 (ja) かな漢字変換装置
JP2737160B2 (ja) 文章処理装置
JPS60207948A (ja) カナ漢字変換処理装置
JP3031170B2 (ja) かな漢字変換システム
JP3353873B2 (ja) 機械翻訳装置
JPH09274615A (ja) 文体変換装置
JPH05189421A (ja) 古文かな漢字変換装置及び方法
JPH08171568A (ja) 複数言語入力方法
JPH06110878A (ja) 仮名漢字変換方法
JP2000057132A (ja) 文字データ処理装置およびそのプログラム記録媒体
JPH05151199A (ja) 文書作成装置
JPH0131230B2 (ja)
JPH064523A (ja) 辞書登録方式およびかな漢字変換方式
JPH11316758A (ja) 形態素解析装置、形態素解析装置を備えた機械翻訳装置、形態素解析処理プログラムを記録したコンピュータ読み取り可能な記録媒体、及び形態素解析処理プログラムを備えた機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0877159A (ja) 学習方法