JP2704945B2 - 重複表現処理装置 - Google Patents

重複表現処理装置

Info

Publication number
JP2704945B2
JP2704945B2 JP63041032A JP4103288A JP2704945B2 JP 2704945 B2 JP2704945 B2 JP 2704945B2 JP 63041032 A JP63041032 A JP 63041032A JP 4103288 A JP4103288 A JP 4103288A JP 2704945 B2 JP2704945 B2 JP 2704945B2
Authority
JP
Japan
Prior art keywords
words
word
input sentence
processing
semantic network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63041032A
Other languages
English (en)
Other versions
JPH01216474A (ja
Inventor
佳之 信國
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63041032A priority Critical patent/JP2704945B2/ja
Publication of JPH01216474A publication Critical patent/JPH01216474A/ja
Application granted granted Critical
Publication of JP2704945B2 publication Critical patent/JP2704945B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔概 要〕 文書処理システムにおける、文の推敲処理に関し、 入力文から意味的に重複する表現を自動的に削除する
重複表現修正処理方法を目的とし、 入力文の構文解析を行って、単語間の関係を示す意味
ネットワークを生成する文書処理システムにおいて、各
単語ごとの所定の概念コードを示す辞書を設け、該意味
ネットワーク上の単語に該辞書に示す該概念コードを付
与し、該意味ネットワークの同一分枝上に連結され、同
一の該概念コードを有する複数の単語を検出し、該複数
の単語を、そのうちの1個の単語に置き換えて修正する
ように構成する。
〔産業上の利用分野〕
本発明は、文書処理システムにおける、文の推敲処
理、特に重複表現の修正のための処理方法に関する。
〔従来の技術と発明が解決しようとする課題〕 例えば印刷出力し、又は翻訳する場合の前処理とし
て、例えば和文の入力文について、未登録語や送り仮名
誤りを検出して指摘する推敲処理はよく知られている。
又推敲処理において、入力文中の重複表現を指摘する
ことも行われていて、公知の方法で入力文を単語に切り
分けた結果について、同じ文字列を含む単語が複数ある
ことを検出することにより、例えば、 「システムの開発を昨年から開発している。」 という入力文について、下線で示すように、同じ文字列
が文中で重複していることを指摘することができるが、
例えば、 「いちばん 最初にシステムを起動する。」 という文の下線部分のように、意味的に重複するが、文
字列として異なるものを指摘することはできない。
本発明は、文の推敲処理において、入力文から意味的
に重複する表現を自動的に削除することのできる重複表
現修正処理方法を目的とする。
〔課題を解決するための手段〕
第1図は、本発明の構成を示す処理の流れ図である。
図は重複表現修正処理の流れを示し、1〜5は処理ス
テップである。
〔作 用〕
入力文の重複表現を修正する処理において、先ず第1
図の処理ステップ1により、入力文を解析して意味ネッ
トワークを生成し、処理ステップ2において推敲用辞書
情報を参照することにより、意味ネットワーク上の各単
語に概念コードを付与する。処理ステップ3〜5におい
て、同一の概念コードを持ち、意味ネットワークの同じ
分枝にある複数の単語をその1単語に置き換えて修正出
力する。
以上により、単語の文字列に関わらず、同一概念を持
つ単語の重複を修正することができる。
〔実施例〕
第2図は文書処理システムにおける重複表現処理機構
の構成例を示すブロック図であり、重複表現処理部10は
入力文11を入力して、入力文11中の重複表現を検出し、
可能な重複表現の単語をそのうちの1単語に置き換える
ように修正した修正文14を出力する。
そのために、重複表現処理部10は第1図の処理ステッ
プ1で、先ず公知の単語辞書12を検索して、いわゆる形
態素解析処理によって入力文10を順次単語に切り分ける
と共に、それらの単語間の関係を解析して、例えば第3
図(a)に示すような意味ネットワークを生成する。
第3図(a)は、入力文「いちばん最初にシステムを
起動する」を処理して生成した意味ネットワークの例を
示し、形態素解析の結果、入力文から切り出した単語
「いちばん」、「最初に」、「システムを」及び「起動
する」を各枠内に示し、それらの係り受け関係とその属
性を、矢印線と付加した記号<対象>、<態様>、<時
間>等によって示すものである。
こゝで、例えば<対象>は矢印の先が作用の対象であ
る関係、<様態>は矢印の元を修飾等する関係、<時間
>は様態の細分類を示す記号として使用するものとす
る。
次に処理ステップ2において、推敲辞書13を検索し
て、意味ネットワーク上の各単語に概念コードを付与す
る。そのために推敲辞書13は所要の各単語に対して、そ
の上位概念を示す所定の概念コードを1以上対応させて
構成した辞書とする。
第3図(a)には、概念コードを英字で表した例によ
り、各枠内にそれらの単語に付与した概念コードを示し
てあり、上記のように定める概念コードの意味から明ら
かなように、同じ概念コードを持つ単語は同じ上位概念
を持つものである。
処理ステップ3において、意味ネットワークの同じ分
枝上で同じ概念コードの単語が複数個あるか探索し、そ
のようなケースが無ければ重複表現が無いものとして、
処理ステップ5で元の入力文をそのまゝ出力して処理を
終了する。
処理ステップ3で、同じ分枝上に同じ概念コードの単
語が複数個あることを検出した場合には、それを修正を
要する重複表現とみなして、処理ステップ4において、
例えばその分枝の元に近い単語によってそれらの単語を
置き換えるように、他の重複単語を削除し、処理ステッ
プ5で修正結果の文を構成して出力する。
従って、第3図(a)の例の場合には、同じ概念コー
ド“first"の単語「最初に」と「いちばん」とが、単語
「起動する」から出る分枝上にあるので、分枝の先にあ
る重複する単語「いちばん」を削除して(b)とし、そ
れに対応する修正文「最初にシステムを起動する」を構
成して出力する。
〔発明の効果〕
以上の説明から明らかなように本発明によれば、文書
処理システムの文の推敲処理において、単語の文字列に
関わらず、同一概念を持つ単語の重複を自動的に修正す
ることができるという著しい工業的効果がある。
【図面の簡単な説明】
第1図は本発明の構成を示す処理の流れ図、 第2図はシステムの構成例ブロック図、 第3図は意味ネットワークの説明図 である。 図において、 1〜5は処理ステップ、10は重複表現処理部、 11は入力文、12は単語辞書、 13は推敲辞書、14は修正文 を示す。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力文の構文解析を行って単語に分割し、
    単語間の関係を複数の属性に振り分けて記憶する意味ネ
    ットワーク生成手段と、 各単語毎の所定の概念コードを記憶する概念コード記憶
    手段と、 前記意味ネットワーク生成手段で同一の属性に振り分け
    られて記憶された複数の単語に、前記概念コードを付与
    し、概念コードが同一の場合に、当該複数単語から一つ
    の単語を選択する選択手段と、 前記選択手段で選択された単語以外の単語を、該入力文
    から削除して出力する修正手段 を備えたことを特徴とする重複表現処理装置。
JP63041032A 1988-02-24 1988-02-24 重複表現処理装置 Expired - Fee Related JP2704945B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63041032A JP2704945B2 (ja) 1988-02-24 1988-02-24 重複表現処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63041032A JP2704945B2 (ja) 1988-02-24 1988-02-24 重複表現処理装置

Publications (2)

Publication Number Publication Date
JPH01216474A JPH01216474A (ja) 1989-08-30
JP2704945B2 true JP2704945B2 (ja) 1998-01-26

Family

ID=12597059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63041032A Expired - Fee Related JP2704945B2 (ja) 1988-02-24 1988-02-24 重複表現処理装置

Country Status (1)

Country Link
JP (1) JP2704945B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7756897B2 (en) 2003-01-23 2010-07-13 Fujtisu Limited Topic net generation method and apparatus
JPWO2004066164A1 (ja) * 2003-01-23 2006-05-18 富士通株式会社 話題ネットの生成方法及び装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60171564A (ja) * 1984-02-15 1985-09-05 Comput Basic Mach Technol Res Assoc 文字置換方式
JPS62269265A (ja) * 1986-05-19 1987-11-21 Nippon Telegr & Teleph Corp <Ntt> 文章正規化装置
JPS6315359A (ja) * 1986-07-08 1988-01-22 Matsushita Electric Ind Co Ltd 日本語文書作成支援装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60171564A (ja) * 1984-02-15 1985-09-05 Comput Basic Mach Technol Res Assoc 文字置換方式
JPS62269265A (ja) * 1986-05-19 1987-11-21 Nippon Telegr & Teleph Corp <Ntt> 文章正規化装置
JPS6315359A (ja) * 1986-07-08 1988-01-22 Matsushita Electric Ind Co Ltd 日本語文書作成支援装置

Also Published As

Publication number Publication date
JPH01216474A (ja) 1989-08-30

Similar Documents

Publication Publication Date Title
EP0283685B1 (en) A spelling assistance method for compound words
US5680628A (en) Method and apparatus for automated search and retrieval process
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP4330285B2 (ja) 機械翻訳用辞書登録装置、機械翻訳用辞書登録方法、機械翻訳装置、機械翻訳方法及び記録媒体
JPH079655B2 (ja) スペルの誤りの検出訂正方法及び装置
JPH1153384A (ja) キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
JP2000311166A (ja) 自然言語入力データからプロセッサ使用可能データを生成する装置及びその方法
JPH02299068A (ja) 入力文字列からワードを分離する方法
JPH0211934B2 (ja)
JP3794716B2 (ja) 単語を語形変化させる方法及びその方法を実行するデータ処理装置
Ganfure et al. Design and implementation of morphology based spell checker
Kaur et al. Spell checker for Punjabi language using deep neural network
JP2704945B2 (ja) 重複表現処理装置
US20040054677A1 (en) Method for processing text in a computer and a computer
Kirby et al. Computer translation of IUPAC systematic organic chemical nomenclature. 6.(Semi) automatic name correction
JPH07230468A (ja) キーワード自動抽出装置およびキーワード自動抽出方法
Samsuri et al. A comparison of distributed, pam, and trie data structure dictionaries in automatic spelling correction for indonesian formal text
JP3135221B2 (ja) 用例主導型言語構造解析装置
JPH04178837A (ja) 字句エラー訂正方法
Erry Resolving Abbreviations and Domain Terms in Source Code using Documentation
JPH0228873A (ja) 形態素解析方法
JPH04330565A (ja) 自然言語処理システム
JP2895137B2 (ja) 日本文誤り自動検出および訂正装置
JPH0486948A (ja) 分野別辞書を利用したカナ振りデータベースの作成方法
Bol'shakov Automatic error correction in inflected languages

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees