JPS59127138A - 文章の異常検査修正装置 - Google Patents

文章の異常検査修正装置

Info

Publication number
JPS59127138A
JPS59127138A JP57230613A JP23061382A JPS59127138A JP S59127138 A JPS59127138 A JP S59127138A JP 57230613 A JP57230613 A JP 57230613A JP 23061382 A JP23061382 A JP 23061382A JP S59127138 A JPS59127138 A JP S59127138A
Authority
JP
Japan
Prior art keywords
sentence
character
character string
dictionary
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57230613A
Other languages
English (en)
Other versions
JPS611787B2 (ja
Inventor
Toru Kanamori
金盛 亨
Makoto Sueda
末田 信
Takayuki Ooyama
大山 隆之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57230613A priority Critical patent/JPS59127138A/ja
Publication of JPS59127138A publication Critical patent/JPS59127138A/ja
Publication of JPS611787B2 publication Critical patent/JPS611787B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (4)発明の技術分野 本発明は印刷、出版などの業務に使用される言語処理に
関するもので、文章中の誤字、脱字等の誤シを自動的に
検出する装置に関するものであり、特に日本語等単語境
界のあいまいな言語における誤υを検出する装置に関す
るものである。
(B)  技術の背景 印刷・出版などの業務に於てけ、その多くの部分が機械
化され自動化されてきた。しかしながら文章を考えるの
が人間である以上文章を機械に入力するまでの過程で誤
りが発生することが避けられない。これは、執筆者の記
憶違いによる誤字、あるいは入力時の誤字、脱字などで
ある。また、新聞等の発行にあたっては、社会常識とは
別K。
使用する用語の範囲を限定しているものもあり、現時点
では楼、械に入力された文章を人間が検査・校正するこ
とが不可欠である。
この人手による検査・校正には多大の労力と時間を憂し
ている。
また、人手による校正にも、誤りや、見のがしがあり、
場合によっては2重・3重の検査・校正を必要する。
本発明は、従来日本語のような単語境界が不明確な言語
に対しては不可能であった自動的な誤字・脱字等の検出
、および修正を目的と1−だものであわ、本発明を用い
ることにより多大な労力と時間の節約が可能となシ、し
かも、より完全な検査、校正を行なうことができる。
(C)  従来技術と問題点 従来、英語等では、文章中の単語のスペルと、辞書中の
単語とのマツチングにより、辞書にない(誤りの可能性
の高い)単語を検出する装置が存在する。
しかしながら日本語のように卑語境界の不明確な言語に
おいては、上記方式を使用することは不可能であった。
本装置(d文字列単位(以下単語と略す)の組み合わせ
が、文章と一致するか否かという判定を行なうことによ
り、日本語のような単語境界が不明確力言語に対しても
、自動的な検査を可能としたものである。
0 発明の目的 従って本発明の目的は日本語々ど単語境界のあい甘いな
言語の処理において、従来人手によって行左っていた文
章の誤字、脱字等の異常を自動的に検出することのでき
る文章の異常検査装置を提供することにある。
(ト)発明の構成 この目的を達成するため、本発明の文章異常検査装置は
文章中で使用される可能性のある単語、複合語あるいは
とわ、らと助詞、助動詞等が結合した文字列などの文字
列単位、及びこれらの文字列単位の文章中で使用される
可能性のある組み合せの規則を拡納した文字列単位辞書
を持つ、対象となる文章が、上記辞書中の文字列単位の
許された組み合わせあるいはすべての紹み合せにより表
現3− し得るか否かを判定し、表現し得ない文字列を検出する
手段を持つことを4.〒vlとしている。
■ 発明の実施例 図は本発明の一実施例を示す図であり、図中1はスピー
カ、ヘッドフォン等の音声合成装置−12は日本語ディ
スプレイ等の文字表示装置、3は漢字入力キーボード等
の文字入力装置、4は音声合成装置、5は文字表示制御
部、6け本システム全体の制御を行なうシステム制御部
、7は修正文字列入力部、8は任意語音声パラメータ合
成部、9は任意語音声パラメータ辞書、10は自動修正
文字判決宇部、11は文字列修正部、12は文章読み出
し部、13け文章記憶部、14に読み解析部、15文章
解析結果記憶部、16は異常文字列検出部、17は辞W
よシ出し部、18は文字列・読み辞書である。
次に本実施例の動作を説明する。
壕ず検査対称文章は文章読み出し部12によって文章記
憶部[13から読み出され、異常文字列検出部16、文
字表示制御部5に送られる。文章4− 記憶装置13は磁気ディスクあるいは半導体記憶装置等
であシ、文章(文字コード列)並びに文章の管理に必要
な文章番号、頁番号、行番号等を記憶している。
文章読み出し部12は文章配憶装置13から、順次検査
対称文章を1文あるいは句点、読点、カッコ等の区切り
記号で区切られる小単位毎に読み出して、異常文字列検
出部16、文字表示制御部5に送る。
異常文字列検出部に人力された文章は、辞書よシ出し部
17によシ文字列・読み辞書18から読み出された文字
列と照合される。
文字列・読み辞書18は、異常検出、自動修正に用いる
ための、文章中に現われる可能性のある文字列(単語、
複合語)及びその接続関係情報紋章中で許される組み合
せと、許されない組み合せの区別)及び文章中に現れる
可能性のない文字列(誤った単語)とその修正方法(正
しい単語の文字列など)及び読み上げに用いるための音
声情報(よみ、単語アクセント型)を1群あるいは複数
群記憶している。
辞書より出し部1714文字列・読み辞’1.F18よ
り必要々情報を商運に読み出すだめのアドレステーブル
等を備え、異常文字列検出部16又は読み解析部14の
指示によって、文章中の文字列と一致する辞書中の文字
列に関する情報を前記辞書18より読み出し、異常文字
列検出部16又は読み解析部14.りるいは自動修正文
字列決定部10へ送る0 異常文字検出部16では文章記憶装置13から読み出さ
れた検査対称文章の文字列と、辞書より出し部17によ
り読み出された文字列の絹み合せが一致するか否か及び
糾み合せが許されるものか否か、及び誤った単語と一致
する文字列が、検査対称文章中に存在するか否かを判定
し、その結果を自動修正文字列決定部10及び文字表示
制御部5に送る。
前記の組み合せが一致するか否かの検査は、文章中の部
分的な文字列と一致する辞書中のすべての文字列を抽出
しておき、これらの組み合せの中で週不足なく文章と一
致する組み合せが在存するか否かを判定する方法などが
適用でき、いずれも当秦者が容易実現できるものである
また前記の絹み合せが許されるか否かの検査は、辞書中
の各文字列に対してその前方向接続特性、後方向接続特
性を記憶し、まだ許される後方向接続特性と前方向接続
特性の組み合せを別途記憶させておき、各文字列の境界
に於いて、その前側文字列の後方向接続特性と、後側文
字列の前方向接続特性が許されるものであるかどうかを
判断する方法などが適用できる。
また異常文字列検出部16では、必要な場合、読み解析
部14で使用するだめの文章解析結果紋章と一致した辞
書の文字列の組み合せ方などの情報)を文章解析結果記
憶部5に送9記憶させる。
異常文字列検出部16では以上の判定結果として、組み
合せが一致しなかった文章全体又は組み合せによって表
現することのできなかった文章中の部分文字列を文章の
異常として検出し、文字表示制御部5に送出する。
7− 自動修正文字列決定部は異常文字列検出部16から人力
される誤った単語及び、辞書より出し部17より入力き
れるその修正方法をもとに、必要な場合文字表示制御部
5に修正方法を送ね、文字表示装置2に表示するなど1
7て、操作者に確認、選択を求め、修正文字列を決定1
2、文字列修正部11へ送る。
文字表示装置1部5では文字読み出し部、異常文字列検
出部16、自動修正文字列決定部より入力される情報を
表示させ、操作者に罹認、選択及び修正文字列の入力を
求める。まだ4%正文字タリ入力部7よ多入力される文
字列の表示も行なうものである。
修正文字列人力部は文字入力装置3より操作者の指示及
び修正文字列を入力1−1文字表示制御部5、自動修正
文字列決定部10、文字列修正部11に送る。
文字列修正部11i1−1文字読み出し部12より入力
される文章に、自動修正文字列決定部10及び修正文字
列入力部7より入力される修正を行々い、8− 修正済文章を文章記憶装置13に再び格納する。
以上によシ文章記憶装置13に格納された文章の修正が
行なわれるが、本実施例は更に、文章の読み上げ機能を
有する。
すなわち、読み解析部14は文章読み出し部12より人
力されろ文章を辞書より出し部17より人力される読み
情報及び文章解析結果記憶部15より入力される文章解
析結果を用いて、漢字カナ等の混在する文章を音素並び
に韻律に関する情報に変換し、その結果を任意語音声パ
ラメータ合成部8に送シ、該任意語音声パラメータ合成
部8では、読み解析部14より入力される情報及び任意
語音声パラメータ辞書9に格納されている各音韻に対応
する音響バラメーク及び韻律制御情報等を用いて、文章
に対応する音響パラメータ時系列を生成する。そして、
音声合成装置4は任意語音声パラメータ合成部よ多入力
される音響パラメータを音声合成モジュール(I、ST
等で構成され得る)等により、音声波に変換し、音声出
力装置1を通じて、操作者に対し出力することができる
(G)  発明の効果 以上述べたように本発明は日本語等単語境界のあいまい
な言語処理において、文章中の誤字、脱字等を自動的に
検出することができるものであり、文章の検査、校正が
答易となり、かつ人手に頼っていた従来に比し、誤りの
見落し等が防止でき、極めて有効なものである。
【図面の簡単な説明】
図は本発明の一実施例を示す図であり、図中1はスピー
カ、ヘソドフォン等の音声合成装置、2は日本語ディス
プレイ等の文字表示装置、3は漢字入力キーボード等の
文字入力装置、4は音声合成装置、5は文字表示制御部
、6は本システム全体の制御を行なうシステム制御部、
7は修正文字列入力部、8はfE意語音声パラメータ合
成部、9は任意語音声パラメータ辞書、10は自動4y
正文字列決定部、11け文字列修正部、12は文章読み
出し部、13は文章記憶部、14け読み解析部、15は
文章解析結果記憶部、16は異常文字列検出部、17は
辞ヤFよシ出し部、18は文字列・読み辞書である。

Claims (1)

  1. 【特許請求の範囲】 (1)1文章内で使用される可能性のある文字列単位の
    情報を記憶した文字列単位辞書及び検査対象文章と文字
    列単位辞書とを照合を行ない、文字列単位辞書内の文字
    列単位の組み合せによって表現することのでき々い連続
    した文字系列を検査対象文章中よシ検出する手段を備え
    ることを特徴とする文章の異常検査装置。 (2、特許請求の範囲第1項記載の文章の異常検査装置
    において、文字列単位辞書内の文字列単位の文章内で使
    用される可能性のある和み合わせによって表現すること
    のできない連続した文字系列をあわせて検出する手段を
    備えることを特徴とする文章の異常検査装置。 (3)、特許請求の範囲第1項又は第2項記載の文章の
    異常検査装置において句点、読点、括弧などの記号及び
    文頭・文末間にはさまれる文章の部分毎に、辞書中の文
    字列単位の組み合わせにより表現し得るか否かを判定す
    ることを特徴とする文章の異常検査装置。
JP57230613A 1982-12-28 1982-12-28 文章の異常検査修正装置 Granted JPS59127138A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57230613A JPS59127138A (ja) 1982-12-28 1982-12-28 文章の異常検査修正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57230613A JPS59127138A (ja) 1982-12-28 1982-12-28 文章の異常検査修正装置

Publications (2)

Publication Number Publication Date
JPS59127138A true JPS59127138A (ja) 1984-07-21
JPS611787B2 JPS611787B2 (ja) 1986-01-20

Family

ID=16910502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57230613A Granted JPS59127138A (ja) 1982-12-28 1982-12-28 文章の異常検査修正装置

Country Status (1)

Country Link
JP (1) JPS59127138A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63231569A (ja) * 1987-03-12 1988-09-27 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 複合語の解析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
COMMUICATIONS OF THE ACM=1980 *
COMMUNICATIONS ACM=1980 *
LECTURE NOTES IN COMPUTER SCIENCE=1980 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63231569A (ja) * 1987-03-12 1988-09-27 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 複合語の解析方法

Also Published As

Publication number Publication date
JPS611787B2 (ja) 1986-01-20

Similar Documents

Publication Publication Date Title
JPH034946B2 (ja)
US6975985B2 (en) Method and system for the automatic amendment of speech recognition vocabularies
Davel et al. Pronunciation dictionary development in resource-scarce environments
CN109979484A (zh) 发音检错方法、装置、电子设备及存储介质
Yarra et al. Indic TIMIT and Indic English lexicon: A speech database of Indian speakers using TIMIT stimuli and a lexicon from their mispronunciations
JPS59127148A (ja) 文章読上げ装置
Felker et al. Evaluating dictation task measures for the study of speech perception
Baby et al. Non-native English lexicon creation for bilingual speech synthesis
Schlippe et al. Automatic Error Recovery for Pronunciation Dictionaries.
JPS59127138A (ja) 文章の異常検査修正装置
JPS59127139A (ja) 文章の異常検査修正装置
JPS59127151A (ja) 文章読上げ装置
Cylwik et al. The EURONOUNCE corpus of non-native Polish for ASR-based pronunciation tutoring system.
Kabra et al. Auto spell suggestion for high quality speech synthesis in hindi
Eide Preservation, identification, and use of emotion in a text-to-speech system
JPS59127152A (ja) 文章読上げ装置
JPS59127137A (ja) 文章校正装置
JPS59127147A (ja) 文章読上げ検査装置
JPS59127150A (ja) 文章読上げ検査装置
JPS59127146A (ja) 文章読上げ装置
JPH0244080B2 (ja)
KR101747924B1 (ko) 한국어 철자 검사 방법 및 이를 실행하는 장치
CN112988955B (zh) 多语语音识别及主题语意分析方法与装置
JPS59127149A (ja) 文章の読上げ検査装置
KR102361205B1 (ko) 발음 교정 시스템의 구동 방법