JPH05334293A - 文字列置換規則の生成方式及び方法 - Google Patents

文字列置換規則の生成方式及び方法

Info

Publication number
JPH05334293A
JPH05334293A JP4142282A JP14228292A JPH05334293A JP H05334293 A JPH05334293 A JP H05334293A JP 4142282 A JP4142282 A JP 4142282A JP 14228292 A JP14228292 A JP 14228292A JP H05334293 A JPH05334293 A JP H05334293A
Authority
JP
Japan
Prior art keywords
character string
morpheme
replacement
input
substitution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4142282A
Other languages
English (en)
Other versions
JP3553984B2 (ja
Inventor
Naoto Nakamura
直人 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP14228292A priority Critical patent/JP3553984B2/ja
Publication of JPH05334293A publication Critical patent/JPH05334293A/ja
Application granted granted Critical
Publication of JP3553984B2 publication Critical patent/JP3553984B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 元文字列を結果文字列に置換する際の置換規
則を生成して、出力する文字列置換規則生成方式及び方
法に関する。単語の種類を表現している形態素の属性を
知らなくても文字列で置換規則の定義を行えるため、形
態素についての専門知識のない者も容易に、簡便に、か
つ、確実に文字列の置換規則の生成を行うことを目的と
する。 【構成】 元文字列を結果文字列に置換する文字列で表
現された一または二以上の置換例を入力し、入力した置
換例を部分文字列とそれに対応する属性並びからなる形
態素に分解し、分解された形態素に基づいて、対応する
置換規則を生成するように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書の清書、標準化、
機械翻訳の前編集等のために行われる文字列置換規則の
生成方式及び方法に係り、特に、元文字列を結果文字列
に置換する際の置換規則を生成して、出力する文字列置
換規則生成方式及び方法に関する。
【0002】
【従来の技術】従来、図7に示すように、元文字列から
結果文字列へ形態素情報を利用して文字列置換を行う場
合には、予め、形態素の属性で記述された元文字列に対
応する形態素並び、及び形態素の属性で記述された結果
文字列に対応する形態素並びの置換例を入力する形態素
並び入力部71と、当該形態素並び入力部71から入力
した形態素並びに基づいて置換規則の作成を行う規則作
成部73とを有するものである。従来では、この置換規
則を得るには、文字列を形態素に分解し、形態素の属性
を並べた形態素並びを人間が作成して、形態素並び入力
部71から入力する必要があった。
【0003】
【発明が解決しようとする課題】さて、従来例にあって
は、以上説明したように、特定の文字列を新たな文字列
に変換する場合の文字列の置換規則を作成するには、利
用者は、文字列を形態素で表現された際の各形態素の属
性を知る必要があり、規則作成のための基礎知識が要求
されるという問題点を有していた。このため、処理系が
持っている形態素に関する情報を知っている利用者以外
には使用不可能であり、また、たとえ情報を知っていて
も文字列で置換を定義する場合に比べ形態素の属性での
指定は、形態素が細分化されていて属性が多数・多種あ
ればあるほど指定が煩雑であるという問題点を有してい
た。
【0004】そこで、本発明は、元文字列を結果文字列
に置換する置換規則を、形態素の属性に関する知識を有
せずに、利用者により容易に、簡便に、確実に、かつ、
信頼性良く生成することのできる文字列置換規則生成方
式及び方法を提供することを目的としてなされたもので
ある。
【0005】
【課題を解決するための手段】以上の技術的課題を解決
するため、第一の発明は、図1に示すように、元文字列
を別表現の結果文字列に置換する文字列で表現された一
または二以上の置換例を入力する置換例入力部10と、
入力された置換例を、部分文字列とそれに対応する属性
並びからなる形態素に分解する形態素解析部20と、分
解された形態素に基づいて、対応する置換規則を生成す
る規則生成部30と、を有するものである。
【0006】一方、第二の発明は、図3に示すように、
元文字列を別表現の結果文字列に置換する文字列で表現
された一または二以上の置換例を入力し(S1)、入力
した置換例を部分文字列とそれに対応する属性並びから
なる形態素に分解し(S2)、分解された形態素に基づ
いて、対応する置換規則を生成する(S3)ものであ
る。
【0007】
【作用】続いて、本発明の動作について説明する。図1
及び図3に示すように、元文字列を別表現の結果文字列
に置換する場合の置換規則を生成しようする場合には、
ステップS1で、前記置換例入力部10から、元文字列
から結果文字列への置換例を文字列で表現された形で入
力する。すると、ステップS2で、形態素解析部20
は、入力した元文字列と結果文字列とについて、各々部
分文字列とそれに対応する属性並びからなる形態素に分
解する。ここで、「属性」には、例えば、部分文字列の
品詞(女性、男性及び中性等の別、単数及び複数の別、
並びに、現在及び過去の別等を含む)や、語の構文カテ
ゴリ、構文機能、論理関係等の情報を含む。すると、ス
テップS3で、前記規則生成部30は、部分文字列とそ
れに対応する属性並びからなる形態素に基づいて、対応
する置換規則を生成する。
【0008】尚、請求項2、請求項4及び図2には、前
記置換例として、少なくとも二以上の例を入力し、前記
形態素解析部20により形態素並びに分解するものが示
されている。当該場合には、前記形態素並び比較部50
は、図3に示すように、入力した各置換例の元文字列と
結果文字列との間について、及び、入力した二以上の置
換例の間について、形態素並びを比較する。前記属性条
件演算部80は、比較の結果、入力した二以上の置換例
の間での同位置にある形態素の異なる特定の形態素につ
いての属性の条件式を求める。ここで、「属性の条件」
には、例えば、異なる形態素の属性を全て包含するよう
な条件、または、異なる形態素の属性の共通の部分のみ
を含むような条件等が考えられる。前記規則合成部90
は、前記比較結果及び属性の条件に基づいて、形態素並
びの置換規則の生成を行うことになる。
【0009】
【実施例】続いて、本発明の実施例について説明する。
図4には、当該実施例に係るブロック図を示す。同図に
示すように、本例は、大きくは、元文字列を結果文字列
に置換する文字列で表現された二以上の置換例を入力す
る置換例入力部1であるキーボード21と、置換規則の
出力を行う置換規則出力部4であるプリンタや表示装置
等の出力部24と、元文字列を別表現の結果文字列に置
換する際の置換規則を生成して出力する制御等の種々の
制御を行うCPU及びメモリ23とを有するものであ
る。さらに、前記CPU及びメモリ23には、同図に示
すように、入力した置換例を、部分文字列とそれに対応
する属性並びからなる形態素に分解する形態素解析部2
と、分解された形態素に基づいて、対応する置換規則を
生成する規則生成部3とを有するものである。
【0010】また、当該規則生成部3は同図に示すよう
に、前記形態素解析部2により形態素に分解された置換
例を形成する元文字列に対応する元形態素並びと結果文
字列に対応する結果形態素並びを、入力した置換例の数
だけ記憶する置換例記憶部51と、入力した二以上の各
置換例の元文字列と結果文字列との間について、及び、
入力した二以上の置換例の間について、形態素並びを比
較する形態素並び比較部5と、入力した二以上の置換例
の間での同位置にある形態素の異なる特定の形態素につ
いての属性の条件式を求める属性条件演算部8と、少な
くとも、二つの属性並びと同一要素の指定を得て置換規
則を合成する規則合成部9と、を有するものである。
尚、符号15は種々の規則生成の制御を行う生成制御部
である。
【0011】さらに、前記形態素並び比較部5は、同図
に示すように、同一の個数の形態素からなる各文字列の
形態素並びを二つ以上受け入れて、並び中の各位置の形
態素が同一であるか否かを判定し、形態素並びの相違を
検出する形態素並び相違検出部6と、2つの形態素の同
一性を判定するために、一つの置換例において特定の形
態素が結果形態素並びのどこに存在するかを調べること
により形態素の検索を行う形態素検索部7とを有するも
のである。
【0012】続いて、本実施例の動作について説明す
る。図5に示すように、ステップSJ1で、前記置換例
入力部1であるキーボード21から元文字列を別表現の
結果文字列に置換する文字列で表現された二個の置換例
を入力する。文字列で表現された二個の置換例の一例を
図6のに示す。ステップSJ2で、前記形態素解析部
2は、入力された置換例を、部分文字列とそれに対応す
る属性並びからなる形態素に分解する。当該形態素解析
部2は、図6のに示すように、各部分文字列毎にその
属性を対応させた形態素情報を内部に有し、当該情報に
基づいて解析が行われることになる。但し、実際の形態
素解析にあっては、単語の前後の接続情報等の情報が利
用されるが、本例に係る形態素解析にあっては、単語の
前後の接続情報等の情報が利用されるが、この例の解説
に用いられないものは省略する。解析の結果は図6の
の表の第一及び第二段に示す。これらの情報は前記置換
例記憶部51に格納される。
【0013】ステップSJ3で、前記形態素並び比較部
3の前記形態素並び相違検出部6は、同一の個数の形態
素からなる各文字列の形態素並びを二つ以上受け入れ
て、並び中の各位置の形態素が同一であるか否かを判定
し、形態素並びの相違を検出する。その結果は図6の
の表の下段に示す。ここで、記号“√”を付した形態素
は二つの置換例において同一の形態素である。その際、
二つの置換例の形態素の個数が異なるか否かを前記形態
素並び相違検出部6により、形態素の個数が異なると判
断された場合には、ステップSJ9に進み、置換規則の
合成は失敗したと判断される。
【0014】一方、二つの置換例の形態素の個数が同一
であると判断された場合には、ステップSJ5に進み、
前記形態素検索部7は、一方の置換例について、元形態
素並びで置換例の間で同一でなかった形態素について、
結果形態素並び中に見いだす検索処理が行われる。その
結果検索に成功しなかった場合には、ステップSJ9に
進み、置換規則合成は失敗したと判断される。検索に成
功した場合には、ステップSJ7に進み、一方の置換例
についての元形態素並びと結果形態素並びにおける対応
形態素の関係が、他方の置換例でも成立するか否かを確
認する。成立しない場合にはステップSJ9に進み、置
換規則合成は失敗したと判断される。
【0015】この確認に成功した場合には、図6のの
下段に示すようになる。ここで、記号★−aは、元形態
素リストにおいて、置換例毎に異なっている形態素が結
果形態素並びのどこに出現しているかを示したもので、
元形態素並びと結果形態素並びとで同じ記号を付するこ
とにより対応関係を示している。二つ以上の形態素につ
いて示す必要がある場合には、記号を★−b、★−c…
…等と順に変えて示せばよい。さらに、★−a等の記号
を付けた置換例の間で共通でなかった形態素について
は、その形態素を各例から取り出し、属性条件演算部8
が属性の演算を行って、与えられた全ての形態素の属性
を満たす属性条件式を得る。図6に示した例では、とも
に属性“n”を持っているので、結果も“n”となって
いる。属性が複数ある場合には、属性の集合の共通部分
と選択する方法や、異なる属性を論理和で結び、これと
共通部分とを論理積で結んだものを選択するなど、種々
の方法が可能である。
【0016】次に、ステップSJ8で、前記置換規則合
成部9が、形態素並び置換式としたものが、図6に示
すものである。図中の元形態素条件並びでは、置換例の
間で一致した形態素について形態素の表記部分とそれに
対応する属性が指定され、一致しなかった形態素では表
記は指定がなく属性条件のみが指定されている。結果形
態素並びでは、どのような出力が行われるか記述され、
元形態素並びから複写する形態素については元形態素条
件並びの表示部に記入された記号と同じ記号が記述され
対応関係を示す。これらの結果は前記置換規則出力部4
から出力される。以上の処理過程は、前記生成制御部1
5により制御される。尚、以上の説明にあっては、英語
の例を挙げて説明したが、英語に限られず、日本語、ま
たは他の言語についても可能である。また、属性として
は、品詞のみを用いて説明したが、品詞に限られず、そ
の他、種々の属性が考えられる。さらに、以上の例で
は、説明の簡単のため、2個の置換例の間で、1個の異
なる形態素の場合について、説明したが、この例に限ら
れず、3個以上の置換例の間で比較しても良く、また、
2個以上の異なる形態素があっても良い。その場合異な
る品詞は、必ずしも、名詞だけに限られず、前置詞と名
詞との組合わせ、または前置詞と動詞との組合わせ等の
種々の場合がある。
【0017】
【発明の効果】以上説明したように、本発明にあって
は、元文字列から結果文字列への置換規則を、元文字列
と結果文字列との置換例を入力することにより、自動的
に、置換規則を生成することができる。したがって、文
字列の置換規則を、文字列の入力により行うため、文字
列に含まれている単語の種類が考慮されて定義されるこ
とになる。また、その定義において単語の種類を表現し
ている形態素の属性を知らなくても文字列で定義を行え
るため、形態素についての専門知識のない者も容易に、
簡便に、かつ、確実に文字列の置換規則の生成を行うこ
とができる。
【図面の簡単な説明】
【図1】第一の発明の原理ブロック図
【図2】第一の発明の実施態様を示すブロック図
【図3】第二の発明に係る原理流れ図
【図4】実施例に係るブロック図
【図5】実施例に係る流れ図
【図6】実施例に係る置換例を示す図
【図7】従来例に係るブロック図
【符号の説明】
10,1 置換例入力部 20,2 形態素解析部 30,3 置換規則生成部 4 置換規則出力部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 元文字列を結果文字列に置換する文字列
    で表現された一または二以上の置換例を入力する置換例
    入力部(10)と、 入力された置換例を、部分文字列とそれに対応する属性
    並びからなる形態素に分解する形態素解析部(20)
    と、 分解された形態素に基づいて、対応する置換規則を生成
    する規則生成部(30)と、を有することを特徴とする
    文字列置換規則の生成方式。
  2. 【請求項2】 前記置換例入力部(10)は、元文字列
    を結果文字列に置換する二以上の置換例を入力するもの
    であり、 前記規則生成部(31)は、入力した二以上の各置換例
    の元文字列と結果文字列との間について、及び、入力し
    た二以上の置換例の間について、形態素並びを比較する
    形態素並び比較部(50)と、 入力した二以上の置換例の間での同位置にある形態素の
    異なる特定の形態素についての属性の条件式を求める属
    性条件演算部(80)と、 特定の形態素についての属性の条件式、及び、前記形態
    素並び比較部(50)の比較結果に基づいて置換規則を
    合成する置換規則合成部(90)とを有することを特徴
    とする請求項1記載の文字列置換規則の生成方式。
  3. 【請求項3】 元文字列を結果文字列に置換する文字列
    で表現された一または二以上の置換例を入力し(S
    1)、 入力した置換例を部分文字列とそれに対応する属性並び
    からなる形態素に分解し(S2)、 分解された形態素に基づいて、対応する置換規則を生成
    する(S3)ことを特徴とする文字列置換規則の生成方
    法。
  4. 【請求項4】 元文字列を結果文字列に置換する文字列
    で表現された二以上の置換例を入力し(S11)、 入力した置換例を部分文字列とそれに対応する属性並び
    からなる形態素に分解し(S2)、 入力した二以上の各置換例の元文字列と結果文字列との
    間について、及び、入力した二以上の置換例の間につい
    て、形態素並びを比較し、入力した二以上の置換例の間
    での同位置にある形態素の異なる特定の形態素について
    の属性の条件式を求め、 特定の形態素についての属性の条件式、及び、前記比較
    結果に基づいて置換規則を合成することを特徴とする請
    求項3記載の文字列置換規則の生成方法。
JP14228292A 1992-06-03 1992-06-03 文字列置換規則の生成装置及び方法 Expired - Fee Related JP3553984B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14228292A JP3553984B2 (ja) 1992-06-03 1992-06-03 文字列置換規則の生成装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14228292A JP3553984B2 (ja) 1992-06-03 1992-06-03 文字列置換規則の生成装置及び方法

Publications (2)

Publication Number Publication Date
JPH05334293A true JPH05334293A (ja) 1993-12-17
JP3553984B2 JP3553984B2 (ja) 2004-08-11

Family

ID=15311746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14228292A Expired - Fee Related JP3553984B2 (ja) 1992-06-03 1992-06-03 文字列置換規則の生成装置及び方法

Country Status (1)

Country Link
JP (1) JP3553984B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010257022A (ja) * 2009-04-22 2010-11-11 Kddi Corp 修正候補取得装置、修正候補取得システム、修正候補取得方法、修正候補取得プログラム
JP2011113097A (ja) * 2009-11-21 2011-06-09 Kddi R & D Laboratories Inc 未知語を含む文章を修正するための文章修正プログラム、方法及び文章解析サーバ
US11356573B2 (en) 2018-07-02 2022-06-07 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101321800B1 (ko) * 2011-09-02 2013-11-21 김상현 대표값 치환을 이용한 데이터 보호 방법 및 장치
CN109084971B (zh) * 2018-07-23 2019-11-08 中国矿业大学 一种基于粒子群优化的气动调节阀故障诊断方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010257022A (ja) * 2009-04-22 2010-11-11 Kddi Corp 修正候補取得装置、修正候補取得システム、修正候補取得方法、修正候補取得プログラム
JP2011113097A (ja) * 2009-11-21 2011-06-09 Kddi R & D Laboratories Inc 未知語を含む文章を修正するための文章修正プログラム、方法及び文章解析サーバ
US11356573B2 (en) 2018-07-02 2022-06-07 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program

Also Published As

Publication number Publication date
JP3553984B2 (ja) 2004-08-11

Similar Documents

Publication Publication Date Title
US5311429A (en) Maintenance support method and apparatus for natural language processing system
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
EP0201324B1 (en) Language forming system
JPH05334293A (ja) 文字列置換規則の生成方式及び方法
US20040054677A1 (en) Method for processing text in a computer and a computer
JPH04160473A (ja) 事例再利用型翻訳方法および装置
US5587918A (en) Circuit pattern comparison apparatus
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
JP3206816B2 (ja) 自然言語自動翻訳方法
JP3051747B2 (ja) 機械翻訳方法及び機械翻訳システム
JP3524189B2 (ja) 文字処理装置
JPH0439763A (ja) 文章編集装置
JPS6368972A (ja) 未登録語処理方式
JPH0573336A (ja) アンパーザ自動生成処理装置
JP2010211744A (ja) 機械翻訳装置及びプログラム
JPH0728821A (ja) テキスト処理装置
JPH05120333A (ja) 日本語生成装置
JPH0612446A (ja) 文生成装置
JP2004157688A (ja) 翻訳装置、翻訳方法及び翻訳プログラム
JPS62271065A (ja) 機械翻訳システム
JPH07141375A (ja) 機械翻訳装置
JPH11345229A (ja) 文字処理装置及び文字処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH04213164A (ja) 辞書引き方式
JPH09146959A (ja) 機械翻訳システム
JPH0736892A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031216

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040210

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040506

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees