JPS61125678A - 辞書検索装置 - Google Patents

辞書検索装置

Info

Publication number
JPS61125678A
JPS61125678A JP59247314A JP24731484A JPS61125678A JP S61125678 A JPS61125678 A JP S61125678A JP 59247314 A JP59247314 A JP 59247314A JP 24731484 A JP24731484 A JP 24731484A JP S61125678 A JPS61125678 A JP S61125678A
Authority
JP
Japan
Prior art keywords
dictionary
character string
long vowel
long
vowel symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59247314A
Other languages
English (en)
Other versions
JPH0785238B2 (ja
Inventor
Akiko Nakajima
中嶋 章子
Hideyuki Takagi
英行 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59247314A priority Critical patent/JPH0785238B2/ja
Publication of JPS61125678A publication Critical patent/JPS61125678A/ja
Publication of JPH0785238B2 publication Critical patent/JPH0785238B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は仮名漢字変換装置における辞書検索装置に係り
、特に長母音記号を含む入力文字列に対して適切な変換
処理を行なう辞書検索装置に関するものである。
従来の技術 近年、日本語ワードプロセッサ等の文章作成装置が普及
してきた。この種の装置は、一般に作成るモード情報を
入力することで、日本語情報を入力処理する方式が提案
されているが、音声により言語を入力する際の多くの問
題を生じている。
特に長母音記号を含む文字列を入力した場合は、その長
母音記号をどのような仮名文字に変換して単語辞書を検
索するかが、その検索時間に大きく影響する。たとえば
入力音声中に「え−」という文字列が含まれる場合、そ
の長母音記号を仮名文字の「え」に変換した仮名文字列
で単語辞書を検索しても、そのような仮名文字列が辞書
にない場合が多く、新たに別の仮名文字「い」に変換し
た別の仮名文字列で検索をしなおす必要があった。
本発明者らは先に辞書検索装置としては特願昭59−9
5931号に示すものを提案した。
第3図はこの辞書検索装置の構成図を示すもので、1は
長母音記号を含む文字列を入力とし、「あ段」の次にあ
る長母音記号を「あ」、「い段」0次にある長母音記号
と「い」、「う段」の次にある長母音記号を「う」、「
え段」の次にある長母音記号を「い」または「え」、「
お段」の次にある長母音記号を「う」または「お」に変
換して出力し長母音記号が含まれない時はそのまま出力
する文字列変換部、2は日本語の書きことばが登録され
ている辞書、3Vi文字列変換部1から得られた文字列
で辞書2を検索する辞書照合部である。
以上のように構成された辞書検索装置について以下その
動作を説明する。説明上、長母音記号を長で表わす。
たとえば「閉鎖」を入力したい場合に、単音節「へ」及
び「さ」を音声入力した時の認識結果が表1のようであ
ったとする。
表   1 この時、入力文字列「へ長さ」に対する文字列の候補と
して表2に示す候補が得られたとする。
表   2 この文字列の候補が文字列変換部1に入力されると、表
3の規則に従って文字列変換される。
表   3 表3の規則に従って文字列変換した結果を表4に示す。
表   4 そして表4に示された文字列の候補が辞書照合部3に送
られる。辞書2には、日本語の書きことばが登録されて
いるので、辞書照合部3では文字列の第1候補から順に
辞書と照合して、正解として対応する辞書内容を出力す
る。この例の場合は、13回辞書を検索してはじめて求
めるべき文字列「閉鎖」を得ることができる。
発明が解決しようとする問題点 しかしながら上記のような構成では、例に示したような
「え段」の次罠長母音記号が在るような文字列を入力し
たとき、その長母音記号を一律に「い」及び「え」に変
換した文字列で辞書と照合していたので、辞書照合に多
くの時間を要するという問題点を有していた。
本発明はかかる点に鑑み、日本語音声情報中の長母音を
利便性よく、かつ簡単に処理することのできる辞書検索
装置を提供することを目的とする。
問題点を解決するための手段 本発明は、長母音記号を含む文字列を入力した時、長母
音記号に前接する音節に着目して、前接音節が「あ段」
の時は長母音記号を「あ」、「い段」の時は「い」、「
う段」の時は「う」、「え段」の時は「い」または「え
」、「お段」の時は「う」または「お」に変換して出力
し、長母音記号が含まれない時はそのまま出力する文字
列変換部と、辞書と、文字列変換部から得られた文字列
で辞書を検索する際に、長母音記号に前接する音節が「
え段」の時は、前接音節の種類に応じて、長母音記号を
「い」または「え」に一意的に変換した文字列で辞書を
検索する辞書照合部とを備えた辞書検索装置である。
作  用 本発明は前記した構成により、「え段」の音節に後続し
た長母音記号を含む文字列に対して、長母音記号を文字
に変換して辞書検索する際に、前接音節の種類によって
、検索する文字列を限定することで効率よく適切なカナ
漢字変換出力を得ることができる。
実施例 2は辞書で、以上は第2図の構成と同様なものである。
3は文字列変換部1から得られた文字列で辞書2を検索
する際に、長母音記号に前接する音節が「え段」の時は
、前接音節の種類に応じて、長母音記号を「い」または
「え」に一意的に変換した文字列で辞書を検索する辞書
照合部である。
以上のように構成された本実施例の辞書検索装置につい
て以下その動作を説明する。説明上、長母音記号を長で
表わす。
比較のために第3図について説明した文字列を用いて説
明する。文字列「閉鎖」を入力したい場合に、単音節「
へ」及び「さ」を音声入力した時の認識結果が表1のよ
うであった時、入力文字列「へ長さ」に対する文字列の
候補として表2に示す候補が得られる。そしてこの文字
列候補を文字列変換部1に入力すると表3の規則に従っ
て文字列変換され、表4に示すような文字列の候補を辞
書照合部3に送る。辞書照合部3では、表4に示すよう
な文字列の候補で辞書を検索する際に、表6の規則に従
って検索する。
表   6 表5の規則に従うと、表4に示した文字列候補のうち、
表6に示す文字列候補についてだけ辞書を検索すればよ
いことになる。
表   に の場合は、7回めの辞書検索で文字列「閉鎖」を得るこ
とができ、従来例と比較するとほぼ半数の辞書検索で求
めるべき文字列を得ていることがわかる。
以上のように本実施例によれば、前述した表6の長母音
記号に対する変換規則を用いることKよって辞書検索時
間を大幅に減少することができる。
なお、表6に示した長母音記号に対する変換規則は以下
に示すような日本語単語としての存在の偏りに基づくも
のである。
まず、3万語の日本語単語の中から重母音を含む単語を
抽出した。ここで重母音とは、1語において又は語の連
結において母音が二つ以上連続しているものを指すもの
とする。この場合、それぞれ一つの独立した母音音節の
連続とは限らず、前の音節に含まれている母音と、その
直後にある母音節との連続の場合も重母音ということに
する。
例えば、「愛(アイ)」、「甥(オイ)」。
「魚(ウォ)」などは重母音であり、「貝(カイ)」。
「鯉(コイ)」、「酸い(スイ)」などもまた重母音を
含んでいる。重母音がある場合に、それぞれの母音を孤
立させて発するものと、あとの母音が直前の母音に密接
に結び付いてあたかも一つの母音として長母音のように
発するものがある。後者のものを、特に「重母音」とい
うことにする。
この装置で使用した辞書2の3万語の日本語単語の中で
重母音を含む単語について調べた結果、次のようなデー
タが得られた。
■ 「え段」+「え」の文字列を含む単語は僅か10単
語しかない。その内、「え長Jと長音的に発声され得る
単語は「あかんべえ」「ええと」「ねえさん」「ねえや
」の4単語である。
■ 「え段」+「い」の文字列を含む単語は1620単
語あり、その内「え長」と長音的に発声され得る単語は
1496単語ある。そしてこの中には、「ねい」という
文字列を含む単語は存在しない。
この装置で使用した辞書2には、上記■及び■のような
偏り規則が存在し、本発明はこの規則に基づいて長母音
に対する変換規則を持たせたものである。
なお本実施例の規則は、この装置で使用する辞書の偏り
に基づいて規則化したものであり、使用する辞書が異な
れば偏りにも多少の違いが生じてくるのは当然である。
よって本発明は使用する辞書にあわせた規則でもって、
辞書検索する前に検索する文字列を限定するところに特
命がある。
また、本実施例においては、辞書検索文字列の限定を辞
書照合部で行なっているが、辞書照合前ならどの段階で
行なっても同じ効果が得られ、例えば文字列変換部で限
定する時は、実際に検索する文字列にだけ長母音記号を
変換することによって限定をすればよい。
発明の詳細 な説明したように、本発明は、長母音記号を含む文字列
に対して、長母音記号を文字に変換した文字列で辞書を
検索する際に、前記音節の種類によって、検索する文字
列を限定して辞書検索するように構成しているので、長
母音記号を含む文字列に対しても効率よく適切なカナ漢
字変換出力を得ることができ、その実用的効果は大きい
【図面の簡単な説明】
第1図は本発明における一実施例の辞書検索装置の構成
を示す概略構成図、第2図は同実施例の動作説明図、第
3図は先に提案した辞書検索装置の概略構成図である。 1・・・・・文字列変換部、2・・・・・・辞書、3・
・・・・・辞書照合部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
(!l 第2図 第3e!i1 挟敢侍果

Claims (1)

    【特許請求の範囲】
  1. 長母音記号を含む文字列を入力した時、前記長母音記号
    に前接する音節に着目して、前記前接音節が「あ段」の
    時は前記長母音記号を「あ」、「い段」の時は前記長母
    音記号を「い」、「う段」の時は前記長母音記号を「う
    」、「え段」の時は前記長母音記号を「い」または「え
    」、「お段」の時は前記長母音記号を「う」または「お
    」に変換して出力し、長母音記号が含まれない時はその
    まま出力する文字列変換部と、辞書と、前記文字列変換
    部から得られた文字列で前記辞書を検索する辞書照合部
    とを備え、前記辞書照合部は、前記前接音節が「え段」
    の時は、前記前接音節の種類に応じて、前記長母音記号
    を「い」または「え」に一意的に変換した文字列で辞書
    を検索することを特徴とする辞書検索装置。
JP59247314A 1984-11-22 1984-11-22 辞書検索装置 Expired - Lifetime JPH0785238B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59247314A JPH0785238B2 (ja) 1984-11-22 1984-11-22 辞書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59247314A JPH0785238B2 (ja) 1984-11-22 1984-11-22 辞書検索装置

Publications (2)

Publication Number Publication Date
JPS61125678A true JPS61125678A (ja) 1986-06-13
JPH0785238B2 JPH0785238B2 (ja) 1995-09-13

Family

ID=17161552

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59247314A Expired - Lifetime JPH0785238B2 (ja) 1984-11-22 1984-11-22 辞書検索装置

Country Status (1)

Country Link
JP (1) JPH0785238B2 (ja)

Also Published As

Publication number Publication date
JPH0785238B2 (ja) 1995-09-13

Similar Documents

Publication Publication Date Title
WO2000045377A9 (en) A method and apparatus for performing spoken language translation
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JPH01501977A (ja) 言語翻訳システム
JPS61125678A (ja) 辞書検索装置
JPH033260B2 (ja)
JPS6219899A (ja) 文章音声認識装置
JPS6229796B2 (ja)
JPS63228326A (ja) キ−ワ−ド自動抽出方式
JPH11250063A (ja) 検索装置及び検索方法
JPH1049187A (ja) 音声情報検索装置
JPS61128364A (ja) 辞書検索装置
Milon et al. A Comprehensive Dialect Conversion Approach from Chittagonian to Standard Bangla
KR20010077042A (ko) 트리 구조의 단어사전을 갖는 연속음성 인식 장치
JP3048793B2 (ja) 文字変換装置
JPH0916575A (ja) 発音辞書装置
JPH04372047A (ja) 仮名漢字変換装置
JPS60239865A (ja) 辞書検索装置
JPH0695689A (ja) 音声認識システム
JPS61177575A (ja) 日本語文章作成装置
JPS6162166A (ja) 日本語文章作成装置
JP2001125907A (ja) 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体
JPH0414168A (ja) 文書作成装置
JPH04112269A (ja) 認識候補間類似度の差を利用したラティス探索方式
JPS588379A (ja) 仮名漢字変換方式
JPS6162167A (ja) 日本語文章作成装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term