JPS60136866A - 文字推定装置 - Google Patents

文字推定装置

Info

Publication number
JPS60136866A
JPS60136866A JP58249464A JP24946483A JPS60136866A JP S60136866 A JPS60136866 A JP S60136866A JP 58249464 A JP58249464 A JP 58249464A JP 24946483 A JP24946483 A JP 24946483A JP S60136866 A JPS60136866 A JP S60136866A
Authority
JP
Japan
Prior art keywords
character
speech
appearance probability
unknown
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58249464A
Other languages
English (en)
Inventor
Toshiyuki Funabe
舟部 敏行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP58249464A priority Critical patent/JPS60136866A/ja
Publication of JPS60136866A publication Critical patent/JPS60136866A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は文字推定装置、すなわち5部分的に不明文字を
含む単語に対してその不明文字を推定するための装置に
関するものである。
従来技術 従来から、例えば、日本語ワードプロセッサ等の日本語
処理装置においては、上述の如く、部分的に不明文字を
含む単語(文章)に対処するため、隣接文字出現確率表
を有しているものがあった。
しかしながら、従来のこの種の装置においては。
上記隣接文字出現確率表を品詞別等に分類していないた
め、平均的な出現確率しか得られず、また、上記不明な
文字に対する候補文字が多く出現し・、その判定が困難
であると、いう問題を有するものであった。
目 的 本発明は上記事情に鑑みてなされたもので、その目的と
するところは、従来の日本語処理装置の文字推定装置に
おける上述の如き問題、を解消し、不明な文字を容易に
判定可能とする文字推定装置を提供することにある。
構 成 以下、実施例に基づいて、本発明の構成を涯細に説明す
る。
第1図は本発明の一実施例を示す文字推定装置のブロッ
ク図である。図において、1は未知語品詞推定部、2は
確率表制御部、3は評価制御部、4は辞書マツチング制
御部を示している。また、5A、5B、5Gはそれぞれ
4名詞、動詞およびその他の品詞に特有の隣接文字出現
確率を記憶している隣接文字出現確率表、6,7はスタ
ック、8A〜8Cは辞書、9は接続表を示し、ている。
なお、辞書8A〜8Cは、それぞれ、自立語、活用語お
よび付属語を収納しているものである。
上記未知語品詞推定部lは辞書8A〜8Cおよび接続表
9を用いて、入力された未知語の品詞を推定する機能を
有するものである。確率表制御部2は上記隣接文字出現
確率表5Δ〜5Cおよび後述するスタック(B)7を制
御する機能を有するものである。また、評価制御部3は
後述するスタック(A)6内の各未知文字の確率中の最
大のものを選択する機能を有するものである。辞書マツ
チング制御部4は文字列と辞書とのマツチングをf’7
って、一致した場合にスタック(B)7に収納する機能
を有するものである。
上記隣接文字出現確率表5A〜5Cの溝造を第2図に示
す。図からも明らかな如(、上記隣接文字出現確率表(
以下、単に1表」ともいう)5A〜5Cは、X方向、X
方向にそれぞれ、五十音をとり。
それらが隣接して出現する確率をマ1−リクス状に示す
ものである。なお、図中の1〕、Qは、それぞれ、[お
」の次にrえ」が来る確率、および「え」の次に[おJ
が来る確率を示すものであり、同様の表が、自立語、活
用語および付属語について別々に用意されている。
以下、具体例を挙げて本実施例の動作を説明する。なお
、以下の説明においては。
にんげん は という文節の「ん」が不明であって、 に0げん は という形になった場合に、この不明文字を推定する場合
を例にとる。
まず第3図に示すフローチ\を一卜において、上記未知
語「に0げん」は直後に「は」という前接名詞性の付属
語を持っていることから、ステップ(1)〜(5)〜(
6)と進み、品詞が名詞であると判定された上で、第4
図に示すフローチャートに行く。
第1図に示すフローチャートにおいてステップ(9)〜
(10)〜(11)〜(15)〜(16)と進む。ここ
で、前記隣接文字出現確率表5Aの内容が第5図のよう
になっているものとすると、上記ステップ(16)の処
理で、表のFにJのX方向の左側の確率をスタック(A
)6に収納する(第6図参照)。
次に、ステップ(I7)〜(I8)〜(19)に進み、
表の[げ」のX方向の右側の確率をスタック(A)6に
加える(第7図参照〕。
上記処理後、ステップ(9)に戻り、(13)〜(14
)に進み、ここでは、確率の最も高い文字[ん」を選択
し1.前記不明な単語は一応[にんげん」となる。
続いて、第8図に示すフローチャー1−に行く。
第8図に示すフローチャートにおいて、ステップ(33
)で辞書しマツチングが取れると、ステップ(34)〜
(35)に進む。ここで、前記スタック(B ) 7に
上記[にんげん」が収納される(第9図参照)。次に、
ステップ(36)に行き、次に確率が高い[い」。
[<」が取出されステップ(33)に行くが、マツチン
グせず、(34)〜(36)へ行き、以下、同じ動作で
ステップ(37)を経て次の処理に行く。
上記処理により、前記不明な単語「にOげん」は[にん
げん」であることが高い確率で推定される。
第10図は本発明の第2の実施例を示す文字推定装置の
ブロック図である。図において、記号1〜9は先に第1
図に示したと同じ構成要素を示しており、10は禁止条
件表を示している。この禁止条件表I0には、各文字特
有の禁止条件が示されている。
禁止条件としては、例えば、第11図に示す如きものを
挙げることができる。
本実施例の動作を、先程と同じ具体例について説明する
。なお1本実施例の動作のうち、第3図。
第4図(いずれも前出)に示すフローチャートに関する
部分は先の実施例と全く同じであるので省略し、第4図
に示したフローチャートに続く、第I2図に示すフロー
チャートに関する部分のみを説明する。
本実施例においては、辞書とのマツチングを取る直前に
、ステップ(38)により禁止条件表10を用いて文字
列の評価を行う。その結果、禁1F条件を満たし・てい
る場合のみ、辞書とのマツチングを取るというステップ
(33)に進む。禁+L条件を満たしていない場合、例
えば、[にをげん」という文字列が殊定文字列として入
って来た場合には、ステップ(38)の処理でrを」の
禁止条件に反しているのでリジェクトされ、ステップ(
36)に進む。
上記説明においては、不明の文字を含む単語が名詞であ
る場合を例に挙げたので、第4図に示したフローチャー
1−において、ステップ(9)〜(10)〜(11)〜
(15)〜・・・・〜(19)〜(9)〜(I3)〜(
14)という処理となったが、不明の文字を含む単語が
動詞である場合には、ステップ(9)〜(10)〜(1
1)〜(12)〜(21)〜・・・・(25)の処理に
、また、不明の文字を含む単語がその他の品詞であ]L
ば、ステップ(9)〜(10)〜(11)〜(I2)〜
(27)〜・・・・(31)の処理を行うことになるの
は言うまでもない。
なお、上記実施例に示した隣接文字出現確率表5A〜5
Cの内容は一例であり、本発明はこれに限定されるべき
ものではない。スタック(A’16゜同(B)7の形式
も上記実施例に示し、たちのに限定されるべきものでは
ない。また、各辞書8八〜8Cとしては種々の形式のも
のを用いることがi’iJ能である。
効 果 以上述べた如く、本発明によれば、入力された未知語の
品詞を推定しお各品詞をその品詞を構成する文字列内の
隣接文字出現確率表を用いて推定するようにしたので、
不明な文字を容易に判定可能な文字推定装置を実現でき
るという顕著な効果を奏するものである。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図。 第2図隣接文字出現確率表の構造例を示す図、第3図、
第4図、第8図は実施例の動作を示すフローチャー1−
1第5図は隣接文字出現確率表の具体例を示す図、第6
図、第7図はスタック(A)の内容を示ず図7第9図は
スタック(B)の内容を示す図、第10図は本発明の他
の実施例を示すブロック図、第11図は禁止条件表の例
を示す図、第12図は第10図に示し、た実施例の特徴
的動作部分を示すフローチャー1−である。 ■=未知語品詞推定部、2:確率表制御部、3:評価制
御部、4:辞書マツチング制御部、5Δ〜5C:隣接文
字出現確率表、6,7:スタック、8Δへ8G=辞書、
9:接続表、jo:禁11条件表。

Claims (2)

    【特許請求の範囲】
  1. (1)自立語、活用語および付属語の各辞書と接続表と
    を用いて入力された未知語の品詞を推定する未知語品詞
    推定部と1名詞、動詞およびその他の各品詞を構成する
    文字列内の隣接文字出現確率表と、出現確率を評価する
    評価制御部とを有し、入力された未知文字を含む単語の
    未知文字をその出現確率により推定する如く構成された
    ことを特徴とする文字推定装置。
  2. (2)自立語、活用語および付属語の各辞書と接続表と
    を用いて入力された未知語の品詞を推定する未知語品詞
    推定部と、名詞、動詞およびその他の各品詞を構成する
    文字列内の隣接文字出現確率表と、出現確率を評価する
    評価制御部と、特定の文字に関する禁止条件表とを有し
    、入力された未知文字を含む単語の未知文字を、前記禁
    止条件を考慮してその出現確率により推定する如く構成
    されたととを特徴とする文字推定装置。
JP58249464A 1983-12-26 1983-12-26 文字推定装置 Pending JPS60136866A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58249464A JPS60136866A (ja) 1983-12-26 1983-12-26 文字推定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58249464A JPS60136866A (ja) 1983-12-26 1983-12-26 文字推定装置

Publications (1)

Publication Number Publication Date
JPS60136866A true JPS60136866A (ja) 1985-07-20

Family

ID=17193345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58249464A Pending JPS60136866A (ja) 1983-12-26 1983-12-26 文字推定装置

Country Status (1)

Country Link
JP (1) JPS60136866A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62182982A (ja) * 1986-02-07 1987-08-11 Nippon Telegr & Teleph Corp <Ntt> 日本文誤字自動検出方式
JPH01220082A (ja) * 1988-02-29 1989-09-01 Fujitsu Ltd 文字認識装置
US5537317A (en) * 1994-06-01 1996-07-16 Mitsubishi Electric Research Laboratories Inc. System for correcting grammer based parts on speech probability

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62182982A (ja) * 1986-02-07 1987-08-11 Nippon Telegr & Teleph Corp <Ntt> 日本文誤字自動検出方式
JPH01220082A (ja) * 1988-02-29 1989-09-01 Fujitsu Ltd 文字認識装置
US5537317A (en) * 1994-06-01 1996-07-16 Mitsubishi Electric Research Laboratories Inc. System for correcting grammer based parts on speech probability

Similar Documents

Publication Publication Date Title
Bolinger On defining the morpheme
US7124074B2 (en) Method and apparatus for providing improved HMM POS tagger for multi-word entries and factoids
US6892190B2 (en) Method and apparatus for machine translation and recording medium
US6823301B1 (en) Language analysis using a reading point
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
Gaskin A Defence of the Resemblance Meaning of ‘What it’s like’
JPS60136866A (ja) 文字推定装置
EP1066626B1 (en) Speech recognition dictionary enlargement using derived words
Kimura et al. Spoken dialogue processing method using inductive learning with genetic algorithm
Mitchell " APO KOINOU" IN OLD ENGLISH POETRY?
JPH09146952A (ja) 形態素解析装置
JP3084864B2 (ja) 文章入力装置
KR100284769B1 (ko) 통계 기반 케이-베스트 품사 태깅 장치 및 방법
JPH05204389A (ja) 音声規則合成用ユーザー辞書登録システム
JP3386520B2 (ja) 仮名漢字変換装置および方法
JPH0587857B2 (ja)
JPH1185749A (ja) 日本語省略要素補完装置
JP3091540B2 (ja) 日本語文の形態素解析方式
JPH0635902A (ja) 辞書登録方式
Mallén Attributive adjectives in Germanic and Romance
JPH03268161A (ja) 仮名漢字変換装置
JP2000259626A (ja) 言語解析システムおよび方法
Bromberger et al. Phonology [A]
JPS62232078A (ja) 文脈推定方式
JPH0772891A (ja) 音声認識装置