JPS62208169A - 文章解析処理方式 - Google Patents

文章解析処理方式

Info

Publication number
JPS62208169A
JPS62208169A JP61051944A JP5194486A JPS62208169A JP S62208169 A JPS62208169 A JP S62208169A JP 61051944 A JP61051944 A JP 61051944A JP 5194486 A JP5194486 A JP 5194486A JP S62208169 A JPS62208169 A JP S62208169A
Authority
JP
Japan
Prior art keywords
sentence
words
dictionary
katakana
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61051944A
Other languages
English (en)
Other versions
JPH0350292B2 (ja
Inventor
Fukami Kamiyama
神山 ふかみ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61051944A priority Critical patent/JPS62208169A/ja
Publication of JPS62208169A publication Critical patent/JPS62208169A/ja
Publication of JPH0350292B2 publication Critical patent/JPH0350292B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 カタカナ語は多様で変転が激しいため、辞書で対応する
のは困難である。そのため、辞書にないカタカナ語は、
l音ずつの単語が連結したものとみなして、解析処理の
円滑化を図る。
〔産業上の利用分野〕
本発明は9文章読上げ装置などの1文章の読みを生成す
る日本語情報処理装置に関するものであり、特に表記さ
れた文章を入力してその文字列中の単語を識別するため
の文章解析処理方式に関する。
〔従来の技術〕
一般の日本語文の形で表記された文章を文字入力し、そ
の正しい読みを音声出力する文章読上げ装置は1文書の
l+1!認や校正などの多くの用途において、有用なも
のとして最近注目されている。
従来の文章解析方式にあっては2文章の中に連続したカ
タカナの部分が存在すると、その部分が単語辞書に登録
されている単語と一致すれば良いが、そうでない場合、
その一部分が辞書中のある単語と一致し、複数単語の集
合ととられ、まったく意味が異なるにもかかわらずマツ
チングがとれたり、あるいは、辞書中に単語がないとし
て、解析エラーを起こし易い。
第3図は、従来の文章読上げ装置の基本的な構成を示し
たものである。
図において、31は文章入力部232は文章解析部、3
3は辞書、34は読み列格納部、35は音声出力部であ
る。
文章入力部31は、キーボード等を用いて日本語文章を
入力する。
文章解析部32は、辞書33を用いて入力された文章デ
ータ中の各単語を同定し、その“読み”を読み列格納部
34に格納する。文章中の単語の同定は、辞書33から
候補単語を取り出し1文章データとの間でマツチングを
行なって、最適な単語の組合ね・1!を選択する方法で
行なわれる。
辞書33には、単語の表記とその読み、用法等の文法が
登録されている。単語には、漢字語、カタカナ語、漢字
かなまじり語などが含まれる。
音声出力部35は、読み列格納部34から文章の読み列
を取り出し、音声合成を行なって、音声出力する。
〔発明が解決しようとする問題点〕
最近の新聞記事などを見ると、外国の地名、会社名、新
造語(たとえば流行語)2強調のためのカタカナ表現な
ど、カタカナ語を含む文章が頻出しており、一般的に多
くの分野でこのような傾向が広まっている。
文章読上げ装置で通常用いられる辞書には、主として外
来語がカタカナ語として登録されている。
しかし、実際の入力文掌中に現われるカタカナ語はその
種類が極めて多く、たとえば「テンヤヮンヤ」のような
俗語などまで辞書として対応することは困難であるため
、単語同定がうまくゆかない場合が多い。
〔問題点を解決するための手段〕
本発明は1文章解析において、辞書に未登録のカタカナ
語が検出された場合には、各カタカナ1文字ごとに1単
語とみなし、単語同定が行なわれたものとして文章解析
を先に進めるものである。
この場合、出力される“読み”は、カタカナ表記から直
ちに得ることができる。
第1図に本発明による文章解析方式を適用した1実施例
である文章読上げ装置の原理的構成を示す。
図において、11は文章入力部、12は文章解析部、1
3は辞書、14は読み列格納部、15は音声出力部、1
21は辞書検索処理、122はカタカナ未知語処理、1
23は−・照合処理を表わす。
文章入力部11から入力された文章データの文字列は2
文章解析部12の辞書検索処理121により種々に区切
られて、辞書13中の各単語と照合される。
文章データ中で辞書と照合できなかったカタカナ文字列
は、カタカナ未知語処理122でカタカナ、とじて単語
化される。
辞書検索処理121における単語検索の結果。
複数の候補単語が発生した場合、それらと単語化された
カタカナ語とに基づいて、照合処理123において1文
章データとの間でマツチングが行なわれ、最適な単語の
組合わせが選択される。
次にこのようにして確定された単語列について。
それぞれの“読み”が辞書13から取り出され。
読み列格納部14に格納される。
音声出力部15は、読み列格納部14の読み列データを
音声合成により音声信号に、変換し、音声出力する。
〔作用〕
本発明によれば1表記された文章中に含まれる任意のカ
タカナ文字列は、辞書との照合に失敗しても、無条件に
1字単語が連続したものとして確定されるため9文章全
体の解析処理を効率的に進めることができる。
〔実施例〕
第2図に本発明の1実施例の動作を説明する。
第2図に示されている構成は第1図の構成を基礎として
おり、参照番号も同じものが使用されている。ただし、
説明を具体的なレベルで行なう必要から1文章解析部1
2中に1作業用の単語ラティステーブル124が追加さ
れている。
文章入力部11から入力された文章が、たとえば「あの
時はテンヤワンヤの大騒ぎ」であり、そしてこの場合、
辞書13には「テンヤワンヤ」のm語が登録されていな
かったものとすると9文章解析12の辞書検索処理12
1では、[テンヤワンヤ1 (+)IfF 2.f照合
に失敗する。
他方、辞書検索処理121が照合できた単語は。
「あの」、「の」、「時(とき)」、「時(し)」、「
は」、「の」、「大(おお)」、「大(だい)J、r騒
ぎ」、「ぎ」である。これらは、単語ラティステーブル
124に単語候補として格納される。
カタカナ未知語処理122では、辞書照合ができなかっ
たカタカナ文字列「テンヤワンヤ」を。
1字ごとに分解して、「テ」、「ン」、「ヤ」。
「ワ」、「ン」、「ヤ」の6個の単語を作成し。
同様に単語ラティステーブル124に格納する。
照合処理123は、単語ラティステーブル124に格納
されている単語と入力文章の文字列との間でDPマツチ
ングをとる。この結果確定した単語列にしたがって、読
み列「アノトキワテンヤワンヤノオオサワギ」を生成し
、読み列格納部14に格納する。
音声出力部15は、@み列格納部14の読み列に基づき
音声合成を行ない、音声出力する。
〔発明の効果〕
本発明によれば1文章読上げ装置等の文章からその読み
を生成する機能を含む日本語情報処理装置において、カ
タカナ表記の創作新語などが入力文章中に存在していて
も、支障なく文章解析が可能となり2文章解析処理を高
速化することができる。
【図面の簡単な説明】
第1図は本発明の詳細な説明するための文章読上げ装置
の実施例の構成図、第2図は第1図に示されている実施
例構成に基づく動作の説明図、第3図は従来の文章読上
げ装置の基本構成図である。 第1図′中。 1に文章入力部 12:文章解析部 13:辞書 121:辞書検索処理 122:カタカナ未知語処理 123:照合処理 1、j 、:’i’出願人   富士通株式会社代理人
弁理士  長谷用 文 廣(外1名)し季ζ弓j−一り
つ11ジイプ゛1aノ\。 $2UA

Claims (1)

    【特許請求の範囲】
  1. 表記された文章を入力する手段と、文字列の表記、読み
    および文法等を登録した辞書とをそなえ、表記された文
    章が入力されたとき、前記辞書を用いて文章中の単語等
    を同定する解析処理を行ない、読み列を生成する日本語
    情報処理装置において、前記表記された文章の解析中に
    、前記辞書には登録されていないカタカナ語が検出され
    た場合、そのカタカナ語の各1文字を1つの単語とみな
    し、読みは表記からそのまま補って、文章解析を進める
    ことを特徴とする文章解析処理方式。
JP61051944A 1986-03-10 1986-03-10 文章解析処理方式 Granted JPS62208169A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61051944A JPS62208169A (ja) 1986-03-10 1986-03-10 文章解析処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61051944A JPS62208169A (ja) 1986-03-10 1986-03-10 文章解析処理方式

Publications (2)

Publication Number Publication Date
JPS62208169A true JPS62208169A (ja) 1987-09-12
JPH0350292B2 JPH0350292B2 (ja) 1991-08-01

Family

ID=12900981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61051944A Granted JPS62208169A (ja) 1986-03-10 1986-03-10 文章解析処理方式

Country Status (1)

Country Link
JP (1) JPS62208169A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7498102B2 (en) 2002-03-22 2009-03-03 Bookeun Oh Nonaqueous liquid electrolyte

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7498102B2 (en) 2002-03-22 2009-03-03 Bookeun Oh Nonaqueous liquid electrolyte

Also Published As

Publication number Publication date
JPH0350292B2 (ja) 1991-08-01

Similar Documents

Publication Publication Date Title
JP2003514304A5 (ja)
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
KR20010025857A (ko) 외래어 음차표기 유사도 비교 방법
JP2002278579A (ja) 音声データ検索装置
JPS62208169A (ja) 文章解析処理方式
Cissé et al. Automatic Spell Checker and Correction for Under-represented Spoken Languages: Case Study on Wolof
JPS6229796B2 (ja)
JPS58123129A (ja) 仮名漢字変換装置
JPS58123126A (ja) 辞書検索装置
JPH0869474A (ja) 類似文字列検索装置
JPS61122781A (ja) 音声ワ−ドプロセツサ
JP2600081B2 (ja) 自然言語対話装置
JPS60136865A (ja) 辞書検索装置
JPS61177575A (ja) 日本語文章作成装置
JPH09288494A (ja) 音声認識装置および音声認識方法
JPS63153596A (ja) 音声文章入力装置
Beeksma et al. shotgun: converting words into triplets: A hybrid approach to grapheme-phoneme conversion in Dutch
JPH0760378B2 (ja) 文章読み上げ装置
JPS62117060A (ja) 文字・音声入力変換方式
JPH05342251A (ja) 辞書検索装置
JPS61177574A (ja) 日本語文章作成装置
JPH0552506B2 (ja)
JP3048793B2 (ja) 文字変換装置
JPS61177573A (ja) 日本語文章作成装置
JPH0414168A (ja) 文書作成装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees