JP3553984B2 - 文字列置換規則の生成装置及び方法 - Google Patents
文字列置換規則の生成装置及び方法 Download PDFInfo
- Publication number
- JP3553984B2 JP3553984B2 JP14228292A JP14228292A JP3553984B2 JP 3553984 B2 JP3553984 B2 JP 3553984B2 JP 14228292 A JP14228292 A JP 14228292A JP 14228292 A JP14228292 A JP 14228292A JP 3553984 B2 JP3553984 B2 JP 3553984B2
- Authority
- JP
- Japan
- Prior art keywords
- morpheme
- character string
- replacement
- input
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【産業上の利用分野】
本発明は、文書の清書、標準化、機械翻訳の前編集等のために行われる文字列置換規則の生成方式及び方法に係り、特に、元文字列を結果文字列に置換する際の置換規則を生成して、出力する文字列置換規則生成方式及び方法に関する。
【0002】
【従来の技術】
従来、図7に示すように、元文字列から結果文字列へ形態素情報を利用して文字列置換を行う場合には、予め、形態素の属性で記述された元文字列に対応する形態素並び、及び形態素の属性で記述された結果文字列に対応する形態素並びの置換例を入力する形態素並び入力部71と、当該形態素並び入力部71から入力した形態素並びに基づいて置換規則の作成を行う規則作成部73とを有するものである。
従来では、この置換規則を得るには、文字列を形態素に分解し、形態素の属性を並べた形態素並びを人間が作成して、形態素並び入力部71から入力する必要があった。
【0003】
【発明が解決しようとする課題】
さて、従来例にあっては、以上説明したように、特定の文字列を新たな文字列に変換する場合の文字列の置換規則を作成するには、利用者は、文字列を形態素で表現された際の各形態素の属性を知る必要があり、規則作成のための基礎知識が要求されるという問題点を有していた。
このため、処理系が持っている形態素に関する情報を知っている利用者以外には使用不可能であり、また、たとえ情報を知っていても文字列で置換を定義する場合に比べ形態素の属性での指定は、形態素が細分化されていて属性が多数・多種あればあるほど指定が煩雑であるという問題点を有していた。
【0004】
そこで、本発明は、元文字列を結果文字列に置換する置換規則を、形態素の属性に関する知識を有せずに、利用者により容易に、簡便に、確実に、かつ、信頼性良く生成することのできる文字列置換規則生成方式及び方法を提供することを目的としてなされたものである。
【0005】
【課題を解決するための手段】
以上の技術的課題を解決するため、第一の発明は、図1及び図2に示すように、元文字列を結果文字列に置換する文字列で表現された二以上の置換例を入力する置換例入力部10、入力された置換例を、形態素に分解し、各形態素ごとにその属性を求めて形態素並びを得る形態素解析部20と、入力した二以上の各置換例の元文字列と結果文字列との間について、及び、入力した二以上の置換例の間について、形態素並びを比較する形態素並び比較部50、入力した二以上の置換例の間での同位置にある形態素の異なる特定の形態素についての属性の条件式を求める属性条件演算部80、特定の形態素についての属性の条件式、及び、前記形態素並び比較部50の比較結果に基づいて置換規則を合成する置換規則合成部90が設けられた規則生成部31と、を有するものである。
【0006】
一方、第二の発明は、図3に示すように、元文字列を結果文字列に置換する文字列で表現された二以上の置換例を入力する置換例入力部と、入力された置換例を、形態素に分解し、各形態素ごとにその属性を求めて形態素並びを得る形態素解析部と、入力した二以上の各置換例の元文字列と結果文字列との間について、及び、入力した二以上の置換例の間について、形態素並びを比較する形態素並び比較部、入力した二以上の置換例の間での同位置にある形態素の異なる特定の形態素についての属性の条件式を求める属性条件演算部、特定の形態素についての属性の条件式、及び、前記形態素並び比較部の比較結果に基づいて置換規則を合成する置換規則合成部が設けられた規則生成部と、を有する装置について、前記置換例入力部によって、元文字列を結果文字列に置換する文字列で表現された二以上の置換例が入力されると(S1)、前記形態素解析部によって入力された置換例を、形態素に分解し、各形態素ごとにその属性を求めて形態素並びを得(S2)、前記規則生成部の前記属性条件演算部によって、入力された二以上の各置換例の元文字列と結果文字列との間について、及び、入力された二以上の置換例の間について、形態素並びを比較し、入力した二以上の置換例の間での同位置にある形態素の異なる特定の形態素についての属性の条件式を求め、前記置換規則合成部によって、特定の形態素についての属性の条件式、及び、前記比較結果に基づいて置換規則を合成する(S3)ことである。
【0007】
【作用】
続いて、本発明の動作について説明する。
図1及び図3に示すように、元文字列を別表現の結果文字列に置換する場合の置換規則を生成しようとする場合には、ステップS1で、前記置換例入力部10から、元文字列から結果文字列への置換例を文字列で表現された形で入力する。すると、ステップS2で、形態素解析部20は、入力した元文字列と結果文字列とについて、形態素に分解し、各形態素ごとに対応する属性を求めて形態素並びを得る。
ここで、「属性」には、例えば、部分文字列の品詞(女性、男性及び中性等の別、単数及び複数の別、並びに、現在及び過去の別等を含む)や、語の構文カテゴリ、構文機能、論理関係等の情報を含む。
すると、ステップS3で、前記規則生成部30は、分解された形態素並びに基づいて、前記元文字列から結果文字列への置換に関する置換規則を生成する。
【0008】
尚、上記手段及び図2には、前記置換例として、少なくとも二以上の例を入力し、前記形態素解析部20により形態素並びに分解するものが示されている。当該場合には、前記形態素並び比較部50は、図3に示すように、入力した各置換例の元文字列と結果文字列との間について、及び、入力した二以上の置換例の間について、形態素並びを比較する。
前記属性条件演算部80は、比較の結果、入力した二以上の置換例の間での同位置にある形態素の異なる特定の形態素についての属性の条件式を求める。
ここで、「属性の条件」には、例えば、異なる形態素の属性を全て包含するような条件、または、異なる形態素の属性の共通の部分のみを含むような条件等が考えられる。
前記規則合成部90は、前記比較結果及び属性の条件に基づいて、形態素並びに置換規則の合成を行うことになる。
【0009】
【実施例】
続いて、本発明の実施例について説明する。
図4には、当該実施例に係るブロック図を示す。
同図に示すように、本例は、大きくは、元文字列を結果文字列に置換する文字列で表現された二以上の置換例を入力する置換例入力部1であるキーボード21と、置換規則の出力を行う置換規則出力部4であるプリンタや表示装置等の出力部24と、元文字列を別表現の結果文字列に置換する際の置換規則を生成して出力する制御等の種々の制御を行うCPU及びメモリ23とを有するものである。さらに、前記CPU及びメモリ23には、同図に示すように、入力した置換例を、形態素に分解し、各形態素ごとに対応する属性を求めって形態素並びを得る形態素解析部2と、分解された形態素並びに基づいて、対応する置換規則を生成する規則生成部3とを有するものである。
【0010】
また、当該規則生成部3は同図に示すように、前記形態素解析部2により形態素に分解された置換例を形成する元文字列に対応する元形態素並びと結果文字列に対応する結果形態素並びを、入力した置換例の数だけ記憶する置換例記憶部51と、入力した二以上の各置換例の元文字列と結果文字列との間について、及び、入力した二以上の置換例の間について、形態素並びを比較する形態素並び比較部5と、入力した二以上の置換例の間での同位置にある形態素の異なる特定の形態素についての属性の条件式を求める属性条件演算部8と、少なくとも、二つの属性並びと同一要素の指定を得て置換規則を合成する規則合成部9と、を有するものである。尚、符号15は種々の規則生成の制御を行う生成制御部である。
【0011】
さらに、前記形態素並び比較部5は、同図に示すように、同一の個数の形態素からなる各文字列の形態素並びを二つ以上受け入れて、並び中の各位置の形態素が同一であるか否かを判定し、形態素並びの相違を検出する形態素並び相違検出部6と、2つの形態素の同一性を判定するために、一つの置換例において特定の形態素が結果形態素並びのどこに存在するかを調べることにより形態素の検索を行う形態素検索部7とを有するものである。
【0012】
続いて、本実施例の動作について説明する。
図5に示すように、ステップSJ1で、前記置換例入力部1であるキーボード21から元文字列を別表現の結果文字列に置換する文字列で表現された二個の置換例を入力する。
文字列で表現された二個の置換例の一例を図6の▲1▼に示す。
ステップSJ2で、前記形態素解析部2は、入力された置換例を、部分文字列とそれに対応する属性並びからなる形態素に分解する。当該形態素解析部2は、図6の▲2▼に示すように、各部分文字列毎にその属性を対応させた形態素情報を内部に有し、当該情報に基づいて解析が行われることになる。
但し、実際の形態素解析にあっては、単語の前後の接続情報等の情報が利用されるが、本例に係る形態素解析にあっては、単語の前後の接続情報等の情報が利用されるが、この例の解説に用いられないものは省略する。解析の結果は図6の▲3▼の表の第一及び第二段に示す。これらの情報は前記置換例記憶部51に格納される。
【0013】
ステップSJ3で、前記形態素並び比較部3の前記形態素並び相違検出部6は、同一の個数の形態素からなる各文字列の形態素並びを二つ以上受け入れて、並び中の各位置の形態素が同一であるか否かを判定し、形態素並びの相違を検出する。その結果は図6の▲3▼の表の下段に示す。ここで、記号“√”を付した形態素は二つの置換例において同一の形態素である。
その際、二つの置換例の形態素の個数が異なるか否かを前記形態素並び相違検出部6により、形態素の個数が異なると判断された場合には、ステップSJ9に進み、置換規則の合成は失敗したと判断される。
【0014】
一方、二つの置換例の形態素の個数が同一であると判断された場合には、ステップSJ5に進み、前記形態素検索部7は、一方の置換例について、元形態素並びで置換例の間で同一でなかった形態素について、結果形態素並び中に見いだす検索処理が行われる。
その結果検索に成功しなかった場合には、ステップSJ9に進み、置換規則合成は失敗したと判断される。
検索に成功した場合には、ステップSJ7に進み、一方の置換例についての元形態素並びと結果形態素並びにおける対応形態素の関係が、他方の置換例でも成立するか否かを確認する。成立しない場合にはステップSJ9に進み、置換規則合成は失敗したと判断される。
【0015】
この確認に成功した場合には、図6の▲3▼の下段に示すようになる。ここで、記号★−aは、元形態素リストにおいて、置換例毎に異なっている形態素が結果形態素並びのどこに出現しているかを示したもので、元形態素並びと結果形態素並びとで同じ記号を付することにより対応関係を示している。二つ以上の形態素について示す必要がある場合には、記号を★−b、★−c……等と順に変えて示せばよい。
さらに、★−a等の記号を付けた置換例の間で共通でなかった形態素については、その形態素を各例から取り出し、属性条件演算部8が属性の演算を行って、与えられた全ての形態素の属性を満たす属性条件式を得る。図6に示した例では、ともに属性“n”を持っているので、結果も“n”となっている。
属性が複数ある場合には、属性の集合の共通部分と選択する方法や、異なる属性を論理和で結び、これと共通部分とを論理積で結んだものを選択するなど、種々の方法が可能である。
【0016】
次に、ステップSJ8で、前記置換規則合成部9が、形態素並び置換式としたものが、図6▲4▼に示すものである。図中の元形態素条件並びでは、置換例の間で一致した形態素について形態素の表記部分とそれに対応する属性が指定され、一致しなかった形態素では表記は指定がなく属性条件のみが指定されている。結果形態素並びでは、どのような出力が行われるか記述され、元形態素並びから複写する形態素については元形態素条件並びの表示部に記入された記号と同じ記号が記述され対応関係を示す。
これらの結果は前記置換規則出力部4から出力される。以上の処理過程は、前記生成制御部15により制御される。
尚、以上の説明にあっては、英語の例を挙げて説明したが、英語に限られず、日本語、または他の言語についても可能である。
また、属性としては、品詞のみを用いて説明したが、品詞に限られず、その他、種々の属性が考えられる。
さらに、以上の例では、説明の簡単のため、2個の置換例の間で、1個の異なる形態素の場合について、説明したが、この例に限られず、3個以上の置換例の間で比較しても良く、また、2個以上の異なる形態素があっても良い。
その場合異なる品詞は、必ずしも、名詞だけに限られず、前置詞と名詞との組合わせ、または前置詞と動詞との組合わせ等の種々の場合がある。
【0017】
【発明の効果】
以上説明したように、本発明にあっては、元文字列から結果文字列への置換規則を、元文字列と結果文字列との置換例を入力することにより、自動的に、置換規則を生成することができる。
したがって、文字列の置換規則を、文字列の入力により行うため、文字列に含まれている単語の種類が考慮されて定義されることになる。また、その定義において単語の種類を表現している形態素の属性を知らなくても文字列で定義を行えるため、形態素についての専門知識のない者も容易に、簡便に、かつ、確実に文字列の置換規則の生成を行うことができる。
【図面の簡単な説明】
【図1】第一の発明の原理ブロック図
【図2】第一の発明の実施態様を示すブロック図
【図3】第二の発明に係る原理流れ図
【図4】実施例に係るブロック図
【図5】実施例に係る流れ図
【図6】実施例に係る置換例を示す図
【図7】従来例に係るブロック図
【符号の説明】
10,1 置換例入力部
20,2 形態素解析部
30,3 置換規則生成部
4 置換規則出力部
Claims (2)
- 元文字列を結果文字列に置換する文字列で表現された二以上の置換例を入力する置換例入力部(10)と、
入力された置換例を、形態素に分解し、各形態素ごとにその属性を求めて形態素並びを得る形態素解析部(20)と、
入力した二以上の各置換例の元文字列と結果文字列との間について、及び、入力した二以上の置換例の間について、形態素並びを比較する形態素並び比較部(50)、入力した二以上の置換例の間での同位置にある形態素の異なる特定の形態素についての属性の条件式を求める属性条件演算部(80)、特定の形態素についての属性の条件式、及び、前記形態素並び比較部(50)の比較結果に基づいて置換規則を合成する置換規則合成部(90)が設けられた規則生成部(31)と、を有することを特徴とする文字列置換規則の生成装置。 - 元文字列を結果文字列に置換する文字列で表現された二以上の置換例を入力する置換例入力部と、入力された置換例を、形態素に分解し、各形態素ごとにその属性を求めて形態素並びを得る形態素解析部と、入力した二以上の各置換例の元文字列と結果文字列との間について、及び、入力した二以上の置換例の間について、形態素並びを比較する形態素並び比較部、入力した二以上の置換例の間での同位置にある形態素の異なる特定の形態素についての属性の条件式を求める属性条件演算部、特定の形態素についての属性の条件式、及び、前記形態素並び比較部の比較結果に基づいて置換規則を合成する置換規則合成部が設けられた規則生成部と、を有する装置について、
前記置換例入力部によって、元文字列を結果文字列に置換する文字列で表現された二以上の置換例が入力されると(S1)、
前記形態素解析部によって入力された置換例を、形態素に分解し、各形態素ごとにその属性を求めて形態素並びを得(S2)、
前記規則生成部の前記属性条件演算部によって、入力された二以上の各置換例の元文字列と結果文字列との間について、及び、入力された二以上の置換例の間について、形態素並びを比較し、入力した二以上の置換例の間での同位置にある形態素の異なる特定の形態素についての属性の条件式を求め、
前記置換規則合成部によって、特定の形態素についての属性の条件式、及び、前記比較結果に基づいて置換規則を合成する(S3)ことを特徴とする文字列置換規則の生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14228292A JP3553984B2 (ja) | 1992-06-03 | 1992-06-03 | 文字列置換規則の生成装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14228292A JP3553984B2 (ja) | 1992-06-03 | 1992-06-03 | 文字列置換規則の生成装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05334293A JPH05334293A (ja) | 1993-12-17 |
JP3553984B2 true JP3553984B2 (ja) | 2004-08-11 |
Family
ID=15311746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14228292A Expired - Fee Related JP3553984B2 (ja) | 1992-06-03 | 1992-06-03 | 文字列置換規則の生成装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3553984B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101321800B1 (ko) * | 2011-09-02 | 2013-11-21 | 김상현 | 대표값 치환을 이용한 데이터 보호 방법 및 장치 |
CN109084971A (zh) * | 2018-07-23 | 2018-12-25 | 中国矿业大学 | 一种基于粒子群优化的气动调节阀故障诊断方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5363178B2 (ja) * | 2009-04-22 | 2013-12-11 | Kddi株式会社 | 修正候補取得装置、修正候補取得システム、修正候補取得方法、修正候補取得プログラム |
JP5495425B2 (ja) * | 2009-11-21 | 2014-05-21 | 株式会社Kddi研究所 | 未知語を含む文章を修正するための文章修正プログラム、方法及び文章解析サーバ |
JP7143651B2 (ja) | 2018-07-02 | 2022-09-29 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、情報処理システム及びプログラム |
-
1992
- 1992-06-03 JP JP14228292A patent/JP3553984B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101321800B1 (ko) * | 2011-09-02 | 2013-11-21 | 김상현 | 대표값 치환을 이용한 데이터 보호 방법 및 장치 |
CN109084971A (zh) * | 2018-07-23 | 2018-12-25 | 中国矿业大学 | 一种基于粒子群优化的气动调节阀故障诊断方法 |
CN109084971B (zh) * | 2018-07-23 | 2019-11-08 | 中国矿业大学 | 一种基于粒子群优化的气动调节阀故障诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
JPH05334293A (ja) | 1993-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8195447B2 (en) | Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions | |
US8214199B2 (en) | Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions | |
US5644774A (en) | Machine translation system having idiom processing function | |
US5311429A (en) | Maintenance support method and apparatus for natural language processing system | |
JP2664915B2 (ja) | 情報検索システム | |
US20080086298A1 (en) | Method and system for translating sentences between langauges | |
US9053090B2 (en) | Translating texts between languages | |
KR100530154B1 (ko) | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 | |
CA2480373A1 (en) | Machine translation | |
JP2001282786A (ja) | 機械翻訳システム、機械翻訳方法及び機械翻訳方法を実行するためのプログラムを記憶した記憶媒体 | |
Hämäläinen et al. | Development of an open source natural language generation tool for finnish | |
JP3553984B2 (ja) | 文字列置換規則の生成装置及び方法 | |
Lakkaraju et al. | Rating sentiment analysis systems for bias through a causal lens | |
JPS6318458A (ja) | 感情情報抽出装置 | |
JPH04160473A (ja) | 事例再利用型翻訳方法および装置 | |
JP2005025555A (ja) | シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体 | |
JPH09325673A (ja) | 翻訳文添削支援装置 | |
JP3206816B2 (ja) | 自然言語自動翻訳方法 | |
JPH0833895B2 (ja) | 機械翻訳システムにおける文生成処理方式 | |
JPH11259482A (ja) | 複合名詞の機械翻訳方式 | |
JPH06295311A (ja) | 機械翻訳装置 | |
Dutta | Encoding Abstract Syntax Trees (AST) via distance based self-attention mechanism | |
JP2001125898A (ja) | 言語解析処理の方法、システム | |
JPH07122876B2 (ja) | 機械翻訳装置 | |
JP2004157688A (ja) | 翻訳装置、翻訳方法及び翻訳プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20031216 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040210 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20040217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040427 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040506 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080514 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090514 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090514 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100514 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |