JPH03131960A - 文字処理方法およびその装置 - Google Patents

文字処理方法およびその装置

Info

Publication number
JPH03131960A
JPH03131960A JP1270649A JP27064989A JPH03131960A JP H03131960 A JPH03131960 A JP H03131960A JP 1270649 A JP1270649 A JP 1270649A JP 27064989 A JP27064989 A JP 27064989A JP H03131960 A JPH03131960 A JP H03131960A
Authority
JP
Japan
Prior art keywords
character string
character
input
soren
sovieto
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1270649A
Other languages
English (en)
Other versions
JP2792147B2 (ja
Inventor
Yukie Kinugawa
衣川 幸恵
Junichi Kubota
淳市 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1270649A priority Critical patent/JP2792147B2/ja
Publication of JPH03131960A publication Critical patent/JPH03131960A/ja
Application granted granted Critical
Publication of JP2792147B2 publication Critical patent/JP2792147B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明(よ 文書の作意 管理等の文書処理を目的とし
た文字処理方法およびその装置に関するものである。
従来の技術 日本語文章の中ではある単語を表わすためにその単語の
一部の文字から構成される略語が用いられることがあり
、 1つの文章中で耘 ある1つの単語についてこのよ
うな複数の表記が混在していることが多い(仇 パーソ
ナルコンピュータとパソコン、ソビエト連邦とソ連など
)。このような現象(友 文章の統一性を損な((読み
易さを阻害すると言われていも これに対し、、1つの
単語に対して許容される表記の情報を辞書内に持板 文
章中の文字列とこの辞書内の単語表記を比較して表記の
統一を図る文字処理装置が近年考案されている(特開昭
63−15359)。
第2図(上 前記の従来の文字処理装置の構成図であも 図東 21i&  入力部であり、漢字かな混じりの文
字列を入力すも 22ζよ 単語テーブルであり、複数
の表記が許容される単語を許容される表記と共に記憶す
ム 23(よ 単語検出部であり、前記単語テーブル2
2に記憶されている表記と比較して、入力部21で入力
された文字列から複数の表記が許容される単語を検出す
も 24ζ瓜時記憶部であり、入力された文字列の中か
ら単語検出部23で検出された複数の表記が許容される
単語とその表記を一時記憶す425にL  比較部であ
り、入力部21で入力された単語が単語検出部23で検
出されたとき、一時記憶部24で一時記憶している単語
の表記と入力文字列の表記を比較す42614  文書
バッファであり、決定した文書を記憶する。27(表 
表示部であり、比較部25において表記の方法が異なる
と判定されたときにそのことを出力すa これら以外に
も構成要素が存在する力丈 本発明との対比のためには
必要がないので省略すも 上記のように構成された従来の文字処理装置において、
まず、入力部21から入力された文字列の表記が単語テ
ーブル22の中に存在するかどうかを判断し 存在すれ
ば 一時記憶部24に入力部21から人力された文字列
の表記を一時記憶すも また 既に一時記憶している単
語の中から同一単語を検索すも 同一単語が検索されて
、入力しようとしている単語の表記と、前にもちいられ
たその単語の表記が一致しないとき、表示部27よりそ
のことを出力する。
発明が解決しようとする課題 従来の文字処理装置を用いて略語の表記のゆれを検出す
る場合、あらかじめ許容される複数の表記を対応させて
表記のゆれ辞書として記憶しておく必要があっ九 この
たべ 表記のゆれ辞書に存在しない表記のゆれを検出す
ることができなかっ九 また 実用上十分な表記のゆれ
を検出するためには膨大な量の情報を記憶している必要
があつ丸 本発明(戴 従来の文字処理装置が有していた前記の問
題点に鑑へ 表記のゆれ辞書を用いずへある文字列の表
記をあたえれば その文字列の一部の文字からなる略語
である可能性がある文字列を文章中から検索す衣 また
(よ ある単語の一部の文字からなる略語の表記をあた
えれば その文字列の正式な表記である可能性がある文
字列を文書中から検索することができる文字処理装置お
よびその方法を提供することを目的とする。
課題を解決するための手段 (1)文章を記憶する文章記憶部と、前記文章記憶部に
記憶している文章の中から文字列を抽出する文字列抽出
部と、文字列の表記を入力する入力部と、前記人力部か
ら入力された文字列を一時記憶する入力文字列一時記憶
部と、前記文字列抽出部が抽出した文字列と前記入力文
字列一時記憶部が一時記憶する文字列のうち、 一方の
文字列の各構成文字がその構成順に他方の文字列中に存
在するか否かを判定する略語判定部とを備えた文字処理
装置である。
(2)文章の中から文字列を抽出する文字列抽出段階と
、人力された文字列を一時記憶する入力文字列一時記憶
段階と、前記文字列抽出段階が抽出した文字列と前記入
力文字列一時記憶段階が一時記憶する文字列のうち、 
一方の文字列の各構成文字がその構成順に他方の文字列
中に存在するか否かを判定する略語判定段階とを備えた
文字処理方法である。
作用 本発明は前記した構成により、文字列抽出部(上文書記
憶部で記憶している文書の中から文字列を抽出する。文
字列一時記憶部(よ 入力部から入力された文字列の表
記を一時記憶する。略語判定部は 文字列抽出部が抽出
した文字列表記と一時記憶部が一時記憶している文字列
の表記を比較して、どちらか一方がもう一方の略語にな
っているか否かを判定する。
実施例 以下、本発明の実施例を図面を用いて説明すも第1図(
友 本発明における一実施例の文字処理装置の構成図で
ある。
第1図において、 11は文章記憶部であり、人力され
た文章を記憶する。 12は文字列抽出部であり、文章
記憶部11が記憶している文章をひらがなから他の種類
の文字に変わるところで区切り、区切りと区切りの間の
文字列を1つずつ順に抽出す4 13は人力部であり、
ある単語の略を献  あるい(よ 正式な表記を人力す
る。 14は入力文字列一時記憶部であり、入力部13
で入力された文字列の表記を一時記憶す&  15は文
字列長判定部であり、文字列抽出部12で抽出された文
字列の表記と入力文字列一時記憶部14で一時記憶して
いる2つの文字列の長さを比較してどちらの文字列が短
い(同じ長さを含む)かを判定し 後述する略語判定部
に長短の区別をつけて2つの文字列を渡す。 16は略
語判定部であり、前記文字列長判定部15で判定した文
字列長の短い方の表記を構成する各文字力交 他方の表
記の文字列中にその出現類にすべて含まれているとき、
文字列長の短い方の文字列(よ 他方の文字列に含まれ
る文字列の略語になっている可能性があると判定すム1
7(よ 表示部であり、略語判定部16でどちらか一方
が他方の略語になっている可能性があると判定されたと
きく どちらの文字列がどちらの文字列の略語になって
いるかをそれらの文字列の表記と共に一覧表示すも 第3図(よ 本発明の一実施例の文字処理方法を説明す
るフロー図であも 31は入力文字列一時記憶段階であり、入力部13で入
力された文字列の表記を一時記憶すム32は文字列抽出
段階であり、文章記憶部11が記憶している文章をひら
がなから他の種類の文字に変わるところで区切り、区切
りと区切りの間の文字列を1つずつ順に抽出す′;4.
33は文字列長判定段階であり、文字列抽出段階32で
抽出された文字列と入力文字列一時記憶部14で一時記
憶している文字列の長さを比較し どちらが文字列長が
短い(同じ長さを含む)かを判定し 後述する略語判定
段階に長短の区別をつけて2つの文字列を渡す。34は
略語判定段階であり、前記文字列長判定段階で文字列長
が短いと判定された文字列を構成する各文字力交 他方
の文字列中にその出現類にすべて含まれているとき、文
字列長の短い方の文字列(よ 他方の文字列の略語にな
っている可能性があると判定すム 35は文章終了判定
段階であり、文章中から文字列をすべて抽出したか否か
を判定し まだ文字列が残っていれば32の段階に戻る
。文字列をすべて抽出したら表示部17に判定結果を一
覧表示すも 以上のように構成された本実施例の文字処理装置および
その方法について以下その動作を具体的に説明する。
まず、文章記憶部11で記憶している文章中で「ソビエ
ト連邦」という文字列がいろいろな表記で記述されてい
ないかを調べるときく 入力部13より、 「ソビエト
連邦」を入力すム すると、入力文字列一時記憶部14
に「ソビエト連邦」が一時記憶されも 次に 文字列抽出部12は 文章記憶部11に記憶され
ている文章をひらがなから他の種類の文字に変わるとこ
ろで区切り、区切りと区切りの間の文字列を1つずつ抽
出すも 文字列抽出部12で抽出された文字列の表記カ
ミ 「ソ連」だった場合、文字列長判定部15は 「ソ
ビエト連邦」と「ソ連」の文字列長を比較すも このと
き、 「ソ連」の方が文字列長が短いとして、略語判定
部16に渡す。略語判定部16 i;t、  文字列長
の短い方の文字列「ソ連」を構成する各文字「ソ」、 
「連」(よ もう一方の文字列「ソビエト連邦」に出現
類と同じ順序ですべて含まれるので、 「ソ連」は「ソ
ビエト連邦」の略語である可能性があると判定すa さらく 文字列抽出部12て 「ソビエト社会主義共和
国連邦」が抽出された場合、文字列長判定部15Urソ
ビエト連邦」と「ソビエト社会主義共和国連邦」を比較
して、 「ソビエト連邦」の方が文字列長が短いと判定
すも 略語判定部16(友 「ソビエト連邦」力<、「
ソビエト社会主義共和国連邦」の略語である可能性があ
ると判定する。
このようにして、文章中のすべての文字列と入力文字列
一時記憶部14で一時記憶している文字列を比較し 略
語であるか否かを判定する。すべての文字列について略
語判定が終了したべ 表示部17に略語と判定されたも
のを表示すも以上のよう凶 本実施例によれば 文字列
長判定部を設置す、略語判定部において2つの文字列を
相互に比較する場合間 あらかじめ文字列長の短い方を
判定して略語になる可能性がある文字列を一方に限定す
ることによって、比較する回数が減り、処理速度が遠く
な4 な抵 本実施例で(友 文字列抽出部(よ 文章をひら
がなから他の種類の文字に変わるところで区切り、区切
りと区切りの間の文字列を1つずつ抽出するとした力交
 カタカナ文字列などの同一種の文字からなるl続きの
文字列を抽出するとしてもよしも また 小規模の付属
語表記辞書を持板 付属語で区切られる文字列を抽出す
るとしてもよ(〜さらく 表示部(よ 略語と判定され
た部分を一覧表示するとした力交 文章中において該当
部分を反転表示 下線表示して他の部分と異なる表示を
行うとしてもよしも 発明の効果 本発明によれ(え ある単語の略語を文章中から検索し
たり、また1よ ある略語の正式な表記の文字列を文書
中から検索することができる。さらく表記のゆれ辞書を
用いる必要がないので、少ないメモリで実現することが
できるたべ その実用的効果は大きし〜
【図面の簡単な説明】
第1図は本発明の一実施例の文字処理装置の構成医 第
2図は従来の文字処理装置の構成@ 第3図は本発明の
一実施例の文字処理方法のフロー図であも 11、、、、文章記憶訊 12.、、、文字列抽出部1
3 、、、、入力態 14.、、、入力文字列語一時記
憶Ia  15.、、、文字列長判定部 16.、、、
略語判定部 17.、、、表示部

Claims (2)

    【特許請求の範囲】
  1. (1)文章を記憶する文章記憶部と、前記文章記憶部に
    記憶している文章の中から文字列を抽出する文字列抽出
    部と、文字列の表記を入力する入力部と、前記入力部か
    ら入力された文字列を一時記憶する入力文字列一時記憶
    部と、前記文字列抽出部が抽出した文字列と前記入力文
    字列一時記憶部が一時記憶する文字列のうち、一方の文
    字列の各構成文字がその構成順に他方の文字列中に存在
    するか否かを判定する略語判定部とを具備することを特
    徴とした文字処理装置。
  2. (2)文章の中から文字列を抽出する文字列抽出段階と
    、入力された文字列を一時記憶する入力単語一時記憶段
    階と、前記文字列抽出段階が抽出した文字列と前記入力
    文字列一時記憶段階が一時記憶する文字列のうち、一方
    の文字列の各構成文字がその構成順に他方の文字列中に
    存在するか否かを判定する略語判定段階とを具備するこ
    とを特徴とした文字処理方法。
JP1270649A 1989-10-18 1989-10-18 文字処理方法およびその装置 Expired - Fee Related JP2792147B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1270649A JP2792147B2 (ja) 1989-10-18 1989-10-18 文字処理方法およびその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1270649A JP2792147B2 (ja) 1989-10-18 1989-10-18 文字処理方法およびその装置

Publications (2)

Publication Number Publication Date
JPH03131960A true JPH03131960A (ja) 1991-06-05
JP2792147B2 JP2792147B2 (ja) 1998-08-27

Family

ID=17489034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1270649A Expired - Fee Related JP2792147B2 (ja) 1989-10-18 1989-10-18 文字処理方法およびその装置

Country Status (1)

Country Link
JP (1) JP2792147B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2719136A1 (fr) * 1994-04-25 1995-10-27 Saint Laurent De Jean Procédé et dispositif de saisie de données assistée par ordinateur.
JPH09212504A (ja) * 1996-02-06 1997-08-15 N T T Data Tsushin Kk 文書校正装置
JP2000076293A (ja) * 1998-09-02 2000-03-14 Nec Corp 省略名称抽出装置、方法および記録媒体

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5125404B2 (ja) * 2007-10-23 2013-01-23 富士通株式会社 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5854431A (ja) * 1981-09-26 1983-03-31 Toshiba Corp 文書入力装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5854431A (ja) * 1981-09-26 1983-03-31 Toshiba Corp 文書入力装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2719136A1 (fr) * 1994-04-25 1995-10-27 Saint Laurent De Jean Procédé et dispositif de saisie de données assistée par ordinateur.
US5680630A (en) * 1994-04-25 1997-10-21 Saint-Laurent; Jean De Computer-aided data input system
JPH09212504A (ja) * 1996-02-06 1997-08-15 N T T Data Tsushin Kk 文書校正装置
JP2000076293A (ja) * 1998-09-02 2000-03-14 Nec Corp 省略名称抽出装置、方法および記録媒体

Also Published As

Publication number Publication date
JP2792147B2 (ja) 1998-08-27

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP2783558B2 (ja) 要約生成方法および要約生成装置
JP4502114B2 (ja) データベース検索装置
JPH03131960A (ja) 文字処理方法およびその装置
Can et al. Automatic categorization of ottoman poems
JP4281899B2 (ja) 質問文書要約装置、質問応答検索装置、質問文書要約プログラム
JP3187671B2 (ja) 電子辞書表示装置
JPH04167049A (ja) 文書処理装置
JPH01266670A (ja) 日本語対象文固有用語抽出処理装置
JPH09212523A (ja) 全文検索方法
JP2002358301A (ja) 電子辞書
JP2000067070A (ja) 情報検索方法、検索ファイル作成方法及び情報検索装置
JP3327587B2 (ja) 文章作成支援装置
JP3329353B2 (ja) テキスト用話題構造認識における話題語選択方法と話題構造認識装置
WO2017126057A1 (ja) 情報検索方法
JPH0231274A (ja) 単語辞書検索装置
JPH0528871B2 (ja)
Ushiku et al. Language Resource Addition Strategies for Raw Text Parsing
JPH0338765A (ja) 文字処理方法およびその装置
JPH01217564A (ja) 自然言語解析装置及びその方法
JPH04316162A (ja) 形態素解析装置
JP2003016052A (ja) テキスト整形装置
JP2001318945A (ja) 文書検索装置及び文書検索方法
JPS63174164A (ja) 文章作成支援方式
JPH01181154A (ja) かな漢字変換装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees