JPS61128364A - 辞書検索装置 - Google Patents

辞書検索装置

Info

Publication number
JPS61128364A
JPS61128364A JP59250812A JP25081284A JPS61128364A JP S61128364 A JPS61128364 A JP S61128364A JP 59250812 A JP59250812 A JP 59250812A JP 25081284 A JP25081284 A JP 25081284A JP S61128364 A JPS61128364 A JP S61128364A
Authority
JP
Japan
Prior art keywords
dictionary
character string
long vowel
character
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59250812A
Other languages
English (en)
Inventor
Akiko Nakajima
中嶋 章子
Hideyuki Takagi
英行 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59250812A priority Critical patent/JPS61128364A/ja
Publication of JPS61128364A publication Critical patent/JPS61128364A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は仮名漢字変換装置における辞書検索装置に係シ
、特に長母音記号を含む入力文字列に対して適切な変換
処理を行なう辞書検索装置に関するものである。
従来の技術 近年、日本語ワードプロセッサ等の文章作成装置が普及
してきた。この種の装置は、一般に作成文章を仮名文字
入力し、これを単語毎に漢字混じりの文字系列に変換し
て日本語文章を作成していくものである。
ところで、昨今、音声および音声に対応する字種を指定
するモード情報を入力することで、日本語情報を入力処
理子る方式が提案されているが、音声によシ言語を入力
する際の多くの問題を生じている。
特に長母音記号を含む文字列を入力した場合は、その長
母音記号をどのような仮名文字に変換して単語辞書を検
索するかが、その検索時間に大きく影響する。たとえば
入力音声中に「お−」という文字列が含まれる場合、そ
の長母音記号を仮名文字の「お」に変換した仮名文字列
で単語辞書を検索しても、そのような仮名文字列が辞書
にない場合が多く、新たに別の仮名文字「う」に変換し
た別の仮名文字列で検索をしなおす必要があった。
本発明者らは先に辞書検索装置として、特願昭’59−
95931号に示す装置を提案した。
第3図は従来の辞書検索装置の構成図を示すもので、1
は長母音記号を含む文字列を入力とし、「あ段」の次に
ある長母音記号を「あ」、「い段」の次にある長母音記
号を「い」、「う段」の次にある長母音記号を「う」、
「え段」の次にある長母音記号を「い」または「え」、
「お段」の次にある長母音記号を「う」または「お」に
変換して出力し長母音記号が含まれない時はそのまま出
力する文字列変換部、2は日本語の書きことばが登録さ
れている辞書、3は文字列変換部1から得られた文字列
で辞書2を検索する辞書照合部である。
以上のように構成された従来例の辞書検索装置について
以下その動作を説明する。説明上、長母音記号を長で表
わす。
たとえば「表示」を入力したい場合に、単音節「ひよ」
及び「じ」を音声入力した時認識結果が表1のようであ
ったとする。
表1 この時、入力文字列「ひょ1じ」に対する文字列の候補
として表2に示す候補が得られたとする。
<12  丁 LI!  白2 表2 この文字列の候補が文字列変換部1に人力されると、表
3の規則忙従って文字列変換される。
表3 表3の規則に従って文字列変換した結果を表4に示す。
表4 そして表4に示された文字列の候補が辞書照合部3に送
られる。辞書2には、日本語の書きことばが登録されて
いるので、辞書照合部3では文字列の第1候補から順に
辞書と照合して、正解とし、て対応する辞書内容を出力
する。この例の場合は、17回辞誓を検索してはじめて
求めるべき文字列「表示」を得ることができる。
発明が解決しようとする問題点 しかしながら上記のような構成では、例に示したような
「お段」の次に長母音記号が在るような文字列を入力し
たとき、その長母音記号を一律に「う」及び「お」に変
換した文字列で辞書と照合していたので、辞書照合に多
くの時間を要するという問題点を有していた。
本発明はかかる点に鑑み、日本語音声情報中の長母音を
利便性よく、かつ簡単に処理することのできる辞書検索
装置を提供することを目的とする。
問題点を解決するための手段 本発明は、長母音記号を含む文字列を入力した時、長母
音記号に前接する音節に着目して、前接音節が「あ段」
の時は長母音記号を「あ」、「い段」の時は「い」、「
う段」の時は「うJ、「え段」の時は「い」または「え
」、「お段」の時は「う」または「お」忙変換して出力
し、長母音記号が含まれない時はそのまま出力する文字
列変換部と、辞書と、文字列変換部から得られた文字列
で辞書を検索する際に、長母音記号忙前接する音節が「
お段」の時は、前接音節の種類に応じて、長母音記号を
「う」または「お」に−意的忙変換した文字列で辞書を
検索する辞書照合部とを備えた辞書検索装置である。
作  用 本発明は前記した構成により、「お段」の音節に後続し
た長母音記号を含む文字列忙対して、長母音記号を文字
に変換して辞書検索する際に、前接音節の種類によって
、検索する文字列を限定することで効率よく適切なカナ
漢字変換出力を得ることができる。
実施例 第1図は本発明の辞書検索装置の構成図を示すものであ
る。第1図において、1は文字列変換部、2は辞書で、
以上は第2図の構成と同様なものである。3は文字列変
換部1から得られた文字列で辞書2を検索する際に、長
母音記号妃前接する音節が「お段」の時は、前接音節の
種類に応じて、長母音記号を「う」または「お」K−意
的に変換した文字列で辞書を検索する辞書照合部である
以上のように構成された本実施例の辞書検索装置につい
て以下その動作を説明する。説明上、長母音記号を頁で
表わす・ 比較のために従来例で示した文字列を用りて説明する。
文字列「表示」を入力したい場合に、単音節「ひよ」及
び「じ」を音声入力した時の認識結果が表1のようであ
った時、入力文字列「ひよ冨じ」忙対する文字列の候補
として表2に示す候補が得られる。そしてこの文字列候
補を客字列変。
換部1妃入力すると表3の規則に従って文字列変換され
、表4に示すような文字列の候補を辞書照合部3忙送る
。辞書照合部3では、表4に示すような文字列の候補で
辞書を検索する際に1表6の規則に従って検索する。
(jズ  下  倹  自2 表5 表6の規則に従うと、表4に示した文字列候補のうち、
表6に示す文字列候補についてだけ辞書を検索すればよ
いことになる。
表に の場合は、9回めの辞書検索で文字列「表示」を得るこ
とができ、従来例と比較するとほぼ半数の辞書検索で求
めるべき文字列を得ていることがわかる。
以上のように本実施例によれば、前述した表6の長母音
記号に対する変換規則を用いることによって辞書検索時
間を大゛幅に□減少することができる。
なお□、表6に示した長母音記号に対する一変換規則は
以下に示すような日本語単語としての存在の偏りに基づ
くものである。
まず、3万語の日本語単語の中から連母音を含む単語を
抽出した。ここで連母音とは、1語において又は語の連
結において母音が二つ以上連続しているものを指すもの
とする。この場合、それぞれ一つの独立した母音音節の
連続とは限らず、前の音節に含まれている母音と、その
直後にある母音節との連続の場合も連母音ということに
する。
例えば、「愛(アイ)」、「甥(オイ)」。
「魚(ウオ)」などは連母音であり、「貝(カイ)」。
「鯉(コイ)」、「酸い(スイ)」などもまた連母音を
含んでいる。連母音がある場合に、それぞれの母音を孤
立させて発するものと、あとの母音が直前の母音に密接
に結び付いてあたかも一つの母音として長母音のように
発するものがある。後者のものを、特K「重母音」とい
うことにする。
この装置で用いた辞書2の3万語の日本語単語の中で連
母音を含む単語について調べた結果、次のようなデータ
が得られた。
■ 「お段」+「お」の文字列を含む単′語は約250
単語あり、その内「お長」と長音的に発声され得る単語
は210単語はどある。そしてその「お段」の音節は「
お」「こ」「ご」「a「ど」「は」「の」K限られる。
■ 「お段」+「う」の文字列を含む単語は約3980
単語あり、それらのほとんどが「お長」と長音的に発声
され得る。そしてこの中には前接音節が上記■で示した
音節であるものも含まれ、その数は■で示したどの音節
の場合も■で出現する単語数より多い。
この装置で用いた辞書2には、上記■及び■のような偏
り規則が存在し、本発明はこの規則に基づいて長母音に
対する変換規則を持たせたものである。
なお本実施例の規則は、この装置で使用する辞書の偏り
に基づいて規則化したものであり、使用する辞書が異な
れば偏りにも多少の違いが生じてくるのは当然である。
よって本発明は使用する辞書にあわせた規則でもって、
辞書検索する前に検索する文字列を限定するところに特
徴がある。
また、本実施例においては、辞書検索文字例の限定を辞
書照合部で行なっているが、辞書照合前ならどの段階で
行なっても同じ効果が得られ、例えば文字列変換部で限
定する時は、実際に検索する文字列にだけ長母音記号を
変換することによって限定をすればよい。
発明の詳細 な説明したように、本発明は、長母音記号を含む文字列
忙対して、長母音記号を文字に変換した文字列で辞書を
検索する際に、前接音節の種類によって、検索する文字
列を限定して辞書検索するように構成しているので、長
母音記号を含む文字列に対しても効率よく適切なカナ漢
字変換出力を得ることができ、その実用的効果は大きい
【図面の簡単な説明】
第1図は本発明における〜実施例の辞書検索装置の構成
を示す概略構成図、第2図は同実施例の動作説明図、第
3図は先に提案した辞書検索装置の概略構成図である。 1・・・・・・文字列変換部、2・・・・・・辞書、3
・・・・・・辞薔照合部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 梗宗結呆 第2図

Claims (1)

    【特許請求の範囲】
  1. 長母音記号を含む文字列を入力した時、前記長母音記号
    に前接する音節に着目して、前記前接音節が「あ段」の
    時は前記長母音記号を「あ」、「い段」の時は前記長母
    音記号を「い」、「う」段の時は前記長母音記号を「う
    」、「え段」の時は前記長母音記号を「い」または「え
    」、「お段」の時は前記長母音記号を「う」または「お
    」に変換して出力し、長母音記号が含まれない時はその
    まま出力する文字列変換部と、辞書と、前記文字列変換
    部から得られた文字列で前記辞書を検索する辞書照合部
    とを備え、前記辞書照合部は、前記前接音節が「お段」
    の時は、前記前接音節の種類に応じて、前記長母音記号
    を「う」または「お」に一意的に変換した文字列で辞書
    を検索することを特徴とする辞書検索装置。
JP59250812A 1984-11-28 1984-11-28 辞書検索装置 Pending JPS61128364A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59250812A JPS61128364A (ja) 1984-11-28 1984-11-28 辞書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59250812A JPS61128364A (ja) 1984-11-28 1984-11-28 辞書検索装置

Publications (1)

Publication Number Publication Date
JPS61128364A true JPS61128364A (ja) 1986-06-16

Family

ID=17213412

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59250812A Pending JPS61128364A (ja) 1984-11-28 1984-11-28 辞書検索装置

Country Status (1)

Country Link
JP (1) JPS61128364A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001242887A (ja) * 2000-02-29 2001-09-07 Xanavi Informatics Corp 音声認識装置および音声認識ナビゲーション装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001242887A (ja) * 2000-02-29 2001-09-07 Xanavi Informatics Corp 音声認識装置および音声認識ナビゲーション装置

Similar Documents

Publication Publication Date Title
JPH03185561A (ja) 欧文単語入力方法
JPS61128364A (ja) 辞書検索装置
JPH1011431A (ja) 漢字検索装置および方法
JPS58123126A (ja) 辞書検索装置
JPS62209667A (ja) 文章作成装置
JPH0441399Y2 (ja)
JPS595335A (ja) 日本語入力装置
JPH0475162A (ja) 仮名漢字変換装置
JPS61177575A (ja) 日本語文章作成装置
JPH027159A (ja) 日本語処理装置
JPS63316162A (ja) 文書作成装置
JPS62226270A (ja) 文章作成装置
JPS61125678A (ja) 辞書検索装置
JPH02289900A (ja) 日本語音声入力支援装置
JPH03225462A (ja) ローマ字漢字変換装置
JPH04372047A (ja) 仮名漢字変換装置
JPH0267675A (ja) かな漢字変換方式
JPS6257055A (ja) 日本語ワ−ド・プロセツサ
JPH0991278A (ja) 文書作成装置
KR920001375A (ko) 한글형 문자 입력 처리 방법
JPS61177573A (ja) 日本語文章作成装置
JPS5952338A (ja) かな漢字変換装置
JPH02297151A (ja) 文書編集装置
JPH03160555A (ja) 日本語入力装置
JPH07319864A (ja) かな漢字変換装置