JPH034946B2 - - Google Patents

Info

Publication number
JPH034946B2
JPH034946B2 JP57230638A JP23063882A JPH034946B2 JP H034946 B2 JPH034946 B2 JP H034946B2 JP 57230638 A JP57230638 A JP 57230638A JP 23063882 A JP23063882 A JP 23063882A JP H034946 B2 JPH034946 B2 JP H034946B2
Authority
JP
Japan
Prior art keywords
character string
kanji
text
combination
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57230638A
Other languages
English (en)
Other versions
JPS59127140A (ja
Inventor
Takayuki Ooyama
Makoto Sueda
Tooru Kanamori
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57230638A priority Critical patent/JPS59127140A/ja
Publication of JPS59127140A publication Critical patent/JPS59127140A/ja
Publication of JPH034946B2 publication Critical patent/JPH034946B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 (A) 発明の技術分野 本発明に印刷,出版などの業務に使用される言
語処理に関するもので、文章中の誤字,脱字等の
誤りを自動的に検出修正する装置に関するもので
あり、特日本語等単語境界のあいまいな言語にお
ける誤りを検出する装置に関するものである。
(B) 技術の背景 印刷・出版などの業務に於ては、その多くの部
分が機械化され自動化されてきた。しかしながら
文章を考えるのが人間である以上文章を機械に入
力するまでの過程で誤りが発生することが避けら
れない。これは、執筆者の記憶違いによる誤字、
あるいは入力時の誤字、脱字、などである。また
新聞等の発行にあたつては、社会常識とは別に、
使用する用語の範囲を限定しているものもあり、
現時点では機械に入力された文章を人間が検査・
校正することが不可欠である。この人手による検
査・校正には多大の労力と時間を要している。ま
た、人手による校正にも、誤りや、見のがしがあ
り、場合によつては2重・3重の検査・校正を必
要する。
本発明は、従来日本語のような単語境界が不明
確な言語に対しては不可能であつた自動的な誤字
脱字等の検出、および修正を目的としたものであ
り、本発明を用いることにより多大な労力と時間
の節約が可能となり、しかも、より完全な検査、
校正を行なうことができる。
(C) 従来技術と問題点 従来、英語等では文章中の単語のスペルと、辞
書中の単語とのマツチングにより、辞書にない
(誤りの可能性の高い)単語を検出する装置が存
在する。
しかしながら日本語のように単語境界の不明確
な言語においては、上記方法を使用することは不
可能であつた。
本装置は文字列単位(以下単語と略す)の組み
合せが、文章と一致するか否かという判定を行な
うことにより、日本語のよう単語境界が不明確な
言語に対しても、自動的な検査修正を可能とした
ものである。
(D) 発明の目的 従つて本発明の目的は印刷,出版などの文章の
処理に於いて、従来人手によつていた文章の誤
字,脱字,不適当な用語等の異常を自動的に検
出,修正する装置を提供することにあり、特に日
本語等単語境界のあいまいな言語の処理に有効で
ある。
(E) 発明の構成 この目的を達成するため本発明の文章異常検査
修正装置は、原稿での誤記、又は誤入力しやすい
単語等の文字系列とその修正方法をあらかじめ記
憶しておき、これを文章と照合し、自動的に検出
および修正を行なう、1つの異常な文字列に対
し、複数の修正方法を記憶しておき、操作者に判
断をさせることを特徴とするものである。
(F) 発明の実施例 図は本発明の一実施例を示す図であり、図中1
はスピーカ,ヘツドフオン等の音声出力装置、2
は日本語デイスプレイ等の文字表示装置、3は漢
字入力キーボード等の文字入力装置、4は音声合
成装置、5は文字表示制御部、6はシステム全体
の制御を行なうシステム制御部、7は修正文字列
入力部、8は任意語音声パラメータ合成部、9は
任意語音声パラメータ辞書、10は自動修正文字
列決定部、11は文字列修正部、12は文章読み
出し部、13は文章記憶部、14は読み解析部、
15は文章解析結果記憶部、16は異常文字列検
出部、17は辞書より出し部、18は文字列、読
み辞書である。
次に本実施例の動作を説明する。
まず検査対称文章は文章読み出し部12によつ
て文章記憶装置13から読み出され、異常文字列
検出部16、文字表示制御部5に送られる。文章
記憶装置13は磁気デイスクあるいは半導体記憶
装置等であり、文章(文字コード列)並びに文章
の管理に必要な文章番号,頁番号,行番号等を記
憶している。
文章読み出し部12は文章記憶装置13から、
順次検査対称文章を1文あるいは句点,読点,カ
ツコ等の区切り記号で区切られる小単位毎に読み
出して、異常文字列検出部16、文字表示制御部
5に送る。
異常文字列検出部に入力された文章は、辞書よ
り出し部17により文字列,読み辞書18から読
み出された文字列と照合される。
文字列,読み辞書18は、異常検出,自動修正
に用いるための、文章中に現われる可能性のある
文字列(単語,複合語)及び、その接続関係情報
(文章中で許される組み合せと、許されない組み
合せの区別)及び文章中に現れる可能性のない文
字列(誤つた単語)とその修正方法(正しい単語
の文字列など)及び読み上げに用いるための音声
情報(よみ,単語アクセント型)を1群あるいは
複数群記憶している。
辞書より出し部17は文字列,読み辞書18よ
り必要な情報を高速に読み出すための、アドレス
テーブル等を備え、異常文字列検出部16又は読
み解析部14の指示によつて、文章中の文字列
と、一致する辞書中の文字列に関する情報を前記
辞書18より読み出し、異常文字列検出部16又
は読み解析部14あるいは自動修正文字列決定部
10へ送る。
異常文字検出部16では文章記憶装置13から
読み出された検査対称文章の文字列と、辞書より
出し部17により読み出された文字列の組み合せ
が一致するか否か、及び組み合せが許されるもの
か否か、及び誤つた単語と一致する文字列が、検
査対象文章中に存在するか否かを判定し、その結
果を自動修正文字列決定部10及び文字表示制御
部5に送る。
前記の組み合せが一致するか否かの検査は、文
章中の部分定な文字列と一致する辞書中のすべて
の文字列を抽出しておき、これらの組み合せの中
で過不足なく文章と一致する組み合せが存在する
か否かを判定する方法などが適用でき、いずれも
当業者が容易実現できるものである。また前記の
組み合せが許されるか否かの検査は、辞書中の各
文字列に対してその前方向接続特性,後方向接続
特性を記憶し、また許される後方向接続特性と前
方向接続特性の組み合せを別途記憶させておき、
各文字列の境界に於いて、その前側文字列の後方
向接続特性と、後側文字列の前方向接続特性が許
されるものであるかどうかを判断する方法などが
適用できる。
また異常文字列検出部16では、必要な場合、
読み解析部14で使用するための、文章解析結果
(文章と一致した辞書の文字列の組み合せ方など
の情報)を文章解析結果記憶部5に送り、記憶さ
せる。
異常文字列検出部16では以上の判定の結果と
して、組み合せが一致しなかつた文章全体又は組
み合せによつて表現することのできなかつた文章
中の部分文字列を文章の異常として検出し、文字
表示制御部5に送出する。
自動修正文字列決定部は異常文字列検出部16
から入力される誤つた単語及び、辞書より出し部
17より入力されるその修正方法をもとに、必要
な場合文字表示制御部5に修正方法を送り、文字
表示装置2に表示するなどして、操作者に確認,
選択を求め、修正文字列を決定し、文字列修正部
11へ送る。
誤入しやすい単語、誤記しやすい単語、修正方
法が複数ある単語の例をあげれば次のようなもの
である。
例 〇誤入力しやすい単語 提 出→堤 出 環 境→還 境 〇誤記しやすい単語 喜望峰→希望峰 押さえる→押える 〇修正方法が複数ある単語 公 義公 議 公 議 講 義 文字表示制御部5では文字読み出し部、異常文
字列検出部16、自動修正文字列決定部より入力
される情報を表示させ、操作者に確認,選択及び
修正文字列の入力を求める。また修正文字列入力
部7より入力される文字列の表示も行なうもので
ある。
修正文字列入力部は文字入力装置3より操作者
の指示及び修正文字列を入力し、文字表示制御部
5,自動修正文字列決定部10,文字列修正部1
1に送る。
文字列修正部11は文字読み出し部12より入
力される文章に、自動修正文字列決定部10及び
修正文字列入力部7より入力される修正を行ない
修正済文章を文章記憶装置13に再び格納する。
以上により文章記憶装置13に格納された文章
の修正が行なわれるが、本実施例は更に、文章の
読み上げ機能を有する。
すなわち、読み解析部14は文章読み出し部1
2より入力される文章を辞書より出し部17より
入力される読み情報及び文章解析結果記憶部15
より入力される文章解析結果を用いて、漢字カナ
等の混在する文章を音素並びに韻律に関する情報
に変換し、その結果を任意語音声パラメータ合成
部8に送り、該任意語音声パラメータ合成部8で
は読み解析部14より入力される情報及び任意語
音声パラメータ辞書9に格納されている各音韻に
対応する音響パラメータ及び韻律制御情報等を用
いて、文章に対応する音響パラメータ時系列を生
成する。そして、音声合成装置4は任意語音声パ
ラメータ合成部より入力される音響パラメータを
音声合成モジユール(LSI等で構成され得る)等
により、音声波に変換し音声出力装置1を通じ
て、操作者に対して出力することができる。
(G) 発明の効果 以上述べたように本発明は日本語等、単語境界
のあいまいな言語の処理において、文章中の誤字
脱字,不適当な単語の検査,修正が自動的に行な
えるものであり、印刷,出版業務における省力化
に有効なものである。
【図面の簡単な説明】
図は本発明の一実施例を示す図であり、図中1
はスピーカ,ヘツドフオン等の音声出力装置、2
は日本語デイスプレイ等の文字表示装置、3は漢
字入力キーボード等の文字入力装置、4は音声合
成装置、5は文字表示制御部、6は本システム全
体の制御を行なうシステム制御部、7は修正文字
列入力部、8は任意語音声パラメータ合成部、9
は任意語音声パラメータ辞書、10は自動修正文
字列決定部、11は文字列修正部、12は文章読
み出し部、13は文章記憶部、14は読み解析
部、15は文章解析結果記憶部、16は異常文字
列検出部、17は辞書より出し部、18は文字
列,読み辞書である。

Claims (1)

  1. 【特許請求の範囲】 1 文章中で使用される可能性のある漢字を含む
    異常な文字列単位の組み合わせと、該漢字を含む
    異常な文字列単位の組み合わせに対応する漢字を
    含む正しい文字列単位の組み合わせを記憶したメ
    モリと、 検査対象文章内の漢字を含む文字列単位の組み
    合わせと、該メモリに記憶された漢字を含む異常
    な文字列単位の組み合わせとを照合する照合回路
    と、 該照合回路により該検査対象文章内に該メモリ
    に記憶された漢字を含む異常な文字列単位の組み
    合わせと同一の漢字を含む文字列単位の組み合わ
    せが検出された場合、該検査対象文章内の漢字を
    含む異常な文字列単位の組み合わせを該メモリに
    記憶された該漢字を含む正しい文字列単位の組み
    合わせに置き換えて修正する修正部と、 を備えたことを特徴とする文章の自動検査修正
    装置。 2 前記照合回路により検出された漢字を含む異
    常な文字列単位の組み合わせおよび前記修正部に
    おける修正結果を表示または印刷する手段を有す
    ることを特徴とする特許請求の範囲第1項記載の
    文章の自動検査修正装置。
JP57230638A 1982-12-28 1982-12-28 文章の自動異常検査修正装置 Granted JPS59127140A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57230638A JPS59127140A (ja) 1982-12-28 1982-12-28 文章の自動異常検査修正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57230638A JPS59127140A (ja) 1982-12-28 1982-12-28 文章の自動異常検査修正装置

Publications (2)

Publication Number Publication Date
JPS59127140A JPS59127140A (ja) 1984-07-21
JPH034946B2 true JPH034946B2 (ja) 1991-01-24

Family

ID=16910920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57230638A Granted JPS59127140A (ja) 1982-12-28 1982-12-28 文章の自動異常検査修正装置

Country Status (1)

Country Link
JP (1) JPS59127140A (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2570681B2 (ja) * 1985-04-04 1997-01-08 株式会社日立製作所 ワード・プロセッサ
JPS61282963A (ja) * 1985-06-10 1986-12-13 Matsushita Electric Ind Co Ltd 日本語ワ−ドプロセツサ
JPS6222176A (ja) * 1985-07-20 1987-01-30 Niyuu Puranshiya:Kk 文章の校正方法
JPS6277669A (ja) * 1985-09-25 1987-04-09 Fujitsu Ltd 入力文章の自動校正方式
JPS62205464A (ja) * 1986-03-05 1987-09-10 Fujitsu Ltd 文章の校正方法
JPS62209664A (ja) * 1986-03-10 1987-09-14 Sharp Corp 日本語文章校正装置
JPS62209668A (ja) * 1986-03-10 1987-09-14 Sharp Corp 日本語文章校正装置
JPS62209663A (ja) * 1986-03-10 1987-09-14 Sharp Corp 日本語文章校正装置
JPS62209662A (ja) * 1986-03-10 1987-09-14 Sharp Corp 日本語文章校正装置
JPS62212871A (ja) * 1986-03-14 1987-09-18 Fujitsu Ltd 文章読み上げ校正装置
JPS63103375A (ja) * 1986-10-20 1988-05-09 Fujitsu Ltd 文書処理装置
JPS63115263A (ja) * 1986-10-31 1988-05-19 Sharp Corp 日本語文章校正装置
JPS63118868A (ja) * 1986-11-06 1988-05-23 Sharp Corp 日本語文章校正装置
JPH01318155A (ja) * 1988-06-20 1989-12-22 Canon Inc 文書処理装置
JPH0622027B2 (ja) * 1989-10-20 1994-03-23 キヤノン株式会社 文字処理装置
JPH03154154A (ja) * 1989-11-10 1991-07-02 Matsushita Electric Ind Co Ltd 仮名漢字変換装置
JP2633978B2 (ja) * 1990-06-28 1997-07-23 シャープ株式会社 仮名漢字変換方法
JPH04174055A (ja) * 1990-11-02 1992-06-22 Chubu Nippon Denki Software Kk 日本語ワードプロセッサの誤変換語検出訂正方式

Also Published As

Publication number Publication date
JPS59127140A (ja) 1984-07-21

Similar Documents

Publication Publication Date Title
JPH034946B2 (ja)
US5258909A (en) Method and apparatus for "wrong word" spelling error detection and correction
US8219381B2 (en) Dictionary registration apparatus, dictionary registration method, and computer product
EP0093249A2 (en) System for detecting and correcting contextual errors in a text processing system
JPS59127148A (ja) 文章読上げ装置
JPS59127139A (ja) 文章の異常検査修正装置
JPS59127151A (ja) 文章読上げ装置
JPS59127137A (ja) 文章校正装置
JPS59127152A (ja) 文章読上げ装置
KR101747924B1 (ko) 한국어 철자 검사 방법 및 이를 실행하는 장치
JPS59127138A (ja) 文章の異常検査修正装置
JPS6118074A (ja) プレ・エデイツト方式
JPS59127150A (ja) 文章読上げ検査装置
JPS59127147A (ja) 文章読上げ検査装置
JPS6277669A (ja) 入力文章の自動校正方式
JPS59127149A (ja) 文章の読上げ検査装置
JPH0267684A (ja) 校正支援方法
JPS59127146A (ja) 文章読上げ装置
JP2002351868A (ja) 電子辞書
JPS60189573A (ja) 文字変換装置
JPH02309448A (ja) 誤り検出装置
JP2000003363A (ja) 発音表記装置、発音表記方法および発音表記プログラムを記録した記録媒体
JPS58214931A (ja) 単語切り出し装置
JPH0434189B2 (ja)
JPH04268669A (ja) 日本語解析装置