JPS59132038A - カナ文字列評定方法 - Google Patents

カナ文字列評定方法

Info

Publication number
JPS59132038A
JPS59132038A JP58005682A JP568283A JPS59132038A JP S59132038 A JPS59132038 A JP S59132038A JP 58005682 A JP58005682 A JP 58005682A JP 568283 A JP568283 A JP 568283A JP S59132038 A JPS59132038 A JP S59132038A
Authority
JP
Japan
Prior art keywords
kana character
character string
kana
syllable
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58005682A
Other languages
English (en)
Inventor
Yasutaka Morimoto
森本 恭隆
Yutaka Ooyama
裕 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP58005682A priority Critical patent/JPS59132038A/ja
Publication of JPS59132038A publication Critical patent/JPS59132038A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、単音節単位に区切って発音された日本語文章
のそれぞれの該単音節に対して得られた1種あるいは複
数種のカナ文字候補から構成されるカナ文字列を優先度
の高いものから予め指定された数だけ評定するカナ文字
列評定方法に関するものである。
近年、コンピュータ等の情報処理装置によって日本語文
章の処理が行なわれるようになってきている。しかし、
日本語は漢字、平仮名1汁仮名。
英数字、記号を含む多種類の文字種を用いる言語である
ため日本語文章を処理する上で入力の問題が最大の技術
的障害とされてきた。そし、て現在、日本語文書処理に
おいては効率の良い容易な入力方式の確立が最大の課題
になっている。
現在のところ、日本語入力方式としてはカナ漢字変換方
式が主流となっている。これは、カナキーボードから所
望の文章を読みの通シに入力し、これを漢字カナ混じシ
文章に変換する方式であり日本語の文章に使用される数
千字種もの漢字を数十棟程度のカナ文字用のキーボード
で入力できるという利点がある。しかし、利用者がカナ
タイプの訓練を受けていないと、カナキーボードからの
入力は決して容易なものではなく、利用者に大きな負担
を与えるだけでなく、入力の速度も決して速くはないだ
め、カナキーボードからの入力によるカナ漢字変換方式
は、カナタイプに習熟していない一般の利用者にとって
は十分な効果をあげているとはいえない。
そこで、キーボードの代りに単音節音声入力装置を備え
たカナ漢字変換方式が考えられる。この方式によれば、
利用者が入力したい文章を口述すると、単音節音声入力
装置がカナ文字列に変換しこれをカナ漢字変換方式によ
って変換することによって所望の漢字カナ混じ9文が得
られるため、利用者はほとんど訓練を受けることなしに
、日本語の文章を容易に入力することが可能となる。
しかし、実際には単音節音声入力装置による単音節認識
の認識率が100メではないため、利用者が口述した音
節列を必ずしも所望のカナ文字列に変換できるとは限ら
ない。そのため、漢字カナ混じり文への誤変換や変換不
能を生じることになる。
単音節音声入力装置からの出力であるカナ文字列を利用
者が確認してカナ文字列の誤シを補助キーボード等によ
って修正する方式も考えられるが操作性が悪く、音声入
力の特長が半減することになる。よって、音声認識結果
のあいまいさを認めた上て、これを補う処理を自動的に
行い、キーボードを介した人手による修正操作を極力少
なくするこトカマンマシンインタフェース的視野からも
望ましい。
本発明の目的は、単音節音声入力装置の認識が一意的に
決定しない状態のときに、それぞれの単音節に対して得
られたカナ文字候補から構成されるカナ文字列を、優先
度の高いものから予め指定された数だけ評定するカナ文
字列評定方法を提供し、音声カナ漢字変換方式をはじめ
とした音声人。
力を伴う日本語情報処理装置の性能および操作性の向上
を実現せしめることにある。
本発明に関連した発明にカナ文字列決定方式(%願昭5
7−092757号)およびカナ文字列優先度決定方式
(%願昭57−092755号)があるが、該カナ文字
列決定方式においてはカナ文字列の候補が1つしか得ら
れなかった。また該カナ文字列優先度決定方式において
はすべてのカナ文字候補の組合わせ(即ち例えば単音節
ごとのカナ文字候補が5ケずつあるn文字の語であれば
5n通シの組合わせ)から成るカナ文字列について検討
しているため、処理時間が長く記憶量も膨大なものにな
っ−Cいた。
本発明においては、この2点を改善し、しかも鏝先度の
高いものから予め指定された数だけカナ文字列を評定す
るために次の方法をとっている。
即ち、m音節部分カナ文字列にm+1音節目のカナ文字
候補を接続しm+1音節部分カナ文字列を生成する際に
、m+1音節部分カナ文字列優先度の小さい部分カナ文
字列(日本語として適当である可能性が極めて低い)を
排除することにしている。これによシ評定する部分カナ
文字列の数が減少するため、処理時間が短縮され記憶量
も減少することになる。
以下に図面を用いて具体的な実施例を掲げて本発明を説
明するが、ここで用いた装置構成は本実施例以外の形態
をとることも可能であシ本発明の範囲を限定するもので
はない。
第1図は本発明の一実施例を示すブロック図である。1
は単音節音声入力装置であセ、2は単音節音声入力装置
lから出力されるカナ文字候補および該カナ文字候補の
尤度を一時的に記憶しておくためのカナ文字・尤度記憶
装置であシ、3はカナ文字・尤度記憶装置2内の前記カ
ナ文字候補と前記尤度によって該カナ文字候補から構成
される部分カナ文字列を部分カナ文字列優先度の高いも
のから出力するカナ文字列・優先度演算装置であシ、4
はカナ文字列・優先度波p装置3から出力された部分カ
ナ文字列および該部分カナ文字列優先度を記憶するため
のカナ文字列・優先度記憶装置である。
利用者は、単音節単位に区切った日本語文章を発声する
かあるいはテープレコーダーに録音された音声を出力さ
せる等の手段を用いて単音節列を単音節音声入力装置1
に入力する。単音節音声入力装置1は、入力された単音
節ごとにその単音節に対応するカナ文字候補と、そのカ
ナ文字候補の確からしさを表わす尤度をカナ文字・尤度
記憶装置2に出力する。
第2図は、カナ文字・尤度記憶装置2内でカナ文字候補
とその尤度が記憶される一例を示した概念図である。
第2図において、A(i、j)(i 、jはともに自然
数)は単音節音声入力装R1から入力された第1音節の
第j番目の候補であるカナ文字であシ、B(i、j)(
i 、jはともに自然数)はA(玉、j)の確からしさ
を数値で表わした尤度である。
カナ文字列・優先度演算装置3は、カナ文字・尤度記憶
装置2内のカナ文字候補と該カナ文字候補の尤度とによ
って、該カナ文字候補から構成される部分カナ文字列を
部分カナ文字列優先度の高いものから予め指定された数
だけ評定する装置である。−カナ文字列・優先度演算装
置3の具体的な実現例は次の通シである。
カナ文字候補と該カナ文字候補の尤度が第2図の形式で
与えられた場合、m音節部分カナ文字列は必ず(1)式
の形をとる。
A(11XI )A(2#!り・−・A(m、xm)(
1)ただしx、(1=1.2.・・・・・m)はカナ文
字候補番号である。以下の(2) 、 (3)式の処理
を第1音節目から繰シ返し適用して(1)式の形式をと
る部分カナ文字列を生成してゆき最後の第n前節目まで
処理することによシ日本語として適当でないと思われる
もの(即ち、尤度の小さいカナ文字候補から構成される
カナ文字列)を除き、逆に日本語として適当であると思
われるもの(即ち、尤度の大きいカナ文字候補から構成
されるカナ文字列)を優先度の高いものから予め指定さ
れた数だけ評定することができる。
Tl(PI)”f’ CB(1、・1)、B(2,j)
)    (2)ただし i=1.2.・・・・・・+
”IJm1 、2 、・・・・・・、m% ’            P1=1 、2 、 ・−
= 、 ml + IJm、:第に音節目のカナ文字候
補数 T、:に+1音節部分カナ文字列優先度の集合 * TL(Pj) =f(B(1+1.j)、T□−1(i
))    (3)ただし 量−A、2.−−、mL(
rnJ、+、−N)j=1 、2 、・・・・・・r”
L+1Pj=1 、2 + −= + m、1.””、
+xA=2.3・・・−・・、n−・1 (2) 、 (3)式において、関数fはカナ文字候補
の尤度x、(+=1.2.・・・・・・、j)と、部分
カナ文字列の優先度yとによって優先度を決定する関数
であシ、具体的には、例えばf (xl 、 xl 、
 ・・・・・・x、 、 y )=x、+ xg+・・
・十X+ 十yといった数式で表現できる。また関数f
′はf’(xl、 xl、 ・−、x、 ) 2f(x
l、xl、−、x、、0)とする。
(2> 、 (3)式を説明すると次のようになる。
まず、(2)式でm7・m1通#)1文字目と2文字目
の尤度を用いて優先度集合T、を得る。このT1を降順
に並べかえ降順優先度集合式を得る。同時*** に、2音節部分カナ文字列を並べかえA (i 、j 
)(1*=1,2  j*=1.2.・−・・・・1m
、)を得る。
ただし、この段階で第2音節目のカナ文字候補数町は予
め指定された数Nとする。
2文字目以降は、(3)式でmL””1.−1通り11
1文字目尤度と1音節部分カナ文字列優先度を用いて優
先度集合T1を得る。これよ勺降順優先度集合TI*お
よびA*(1*、j*)  (1*=1.2.・・・・
・・μ+1j*=1 + 2 + −=’ 、 m J
+1 )  を得る。このときmL+、−=uとする。
この(3)式の処理を加2 、3 、・・・・・・、n
−1について繰シ返し行なうことによって優先度の高い
ものから予め指定された数だけカナ文字列を評定するこ
とができる。
このようにしてカナ文字列を優先度の高いもの−から予
め指定された数だけカナ文字列・優先度記憶装置4に記
憶させることによシ、入力された音声に対応するカナ文
字列を優先度の高いものから予め指定された数だけ得る
ことができる。
第3図(a)はカナ文字列・優先度演算装置3円のデー
タ構造を示した例であり5は優先度の順位、6は部分カ
ナ文字列、7は部分カナ文字列6の優先度である。
第3図fa)のように予め指定された数(前記説明中の
N)が5である場合には、例えば単音節ごとのカナ文字
候補が5ケずつあるn文字の語に(2)。
(3)式の処理を施したとすれば、2音節部分カナ文字
列を生成するのに5×5通シ、2音節部分カナ文字列の
うち上位5候補と3音節目のカナ文字候補よシ3音節部
分カナ文字列を生成するのに5×5通)、これを繰シ返
すから合計5X5X(n−1)通りの組合わせから成る
部分カナ文字列のみを評定することになるため、前記カ
ナ文字列優先度決定方式(特願昭57−092755号
)が5n通シの組合わせから成る部分カナ文字列を評定
するのに比べ、処理時間が短縮され記憶量も減少するこ
とになる。
また前記データ構造を第3図(b)のようなセル形式に
することもできる。図において、8は部分カナ文字列の
入る候補テーブル、9は制御情報の入る制御セルであシ
、制御セル9には制御情報として候補テーブル8中のど
の部分カナ文字列を指すかを示すテーブルポインタ10
、候補テーブル8中に刺青節分の部分カナ文字列が入っ
ているかを示す音節数11、該部分カナ文字列の優先度
12、およびそのセルの次に優先度の高いセルを指すセ
ルポインタ13が格納されている。また、14は優先度
12が最大のセルへの最大セルポインタ、15は最大セ
ルポインタ14と制御セル9から成る制御テーブルであ
る。このようにセル形式のデータ構造を用いて、部分カ
ナ文字列をテーブルとポインタで制御することによシ並
びかえが単純になるため処理時間が短縮できる上に候補
テーブル8の大きさを一定化することで、部分カナ文字
列の候補数(即ち前記説明中のNの値)による絞シ込み
(即ち、たとえば候補テーブル8の大きさが25文字分
だと仮定すれば5文字の語の場合、2文字目までなら1
2通シの候補が格納できるが、3.4.5文字目と処理
してゆくに従い優先度の高い候補から8通シ、6通シ、
5通りと部分カナ文字列の候補数が変化してゆくこと)
ができるため、最初は多くの可能性を残しておき終シに
近づくにつれて下位のカナ文字列(即ち、尤度の小さい
カナ文字候補から構成されるカナ文字列)を排除するこ
とによシ処理時間の短縮を可能にすることもできる。
第4図は利用者が発声した単音節列を単音節音声入力装
置1を通してカナ文字・尤度記憶装置2に出力したカナ
文字候補と尤度の一例であシ、図において括弧内の数字
は尤度を示している。また、第5図はカナ文字列・優先
度演算装置3によって、カナ文字・尤度記憶装置2内の
カナ文字候補と該カナ文字候補の尤度(第4図)とによ
って該カナ文字候補から構成されるカナ文字列を優先度
の高いものからカナ文字列・優先度記憶装置4に出力し
たものであシ、図において括弧内の数字は優先度を示し
ている。
第4図と第5図に示したように単音節での認識結果の第
1候補が誤っているために正しいカナ文字列が第1候補
として現われなくても上位候補に現われる可能性は高い
以上述べたように、本発明によれば、それぞれの単音節
に対して得られたカナ文字候補から構成されるカナ文字
列を優先度の高いものから得ることができるため、利用
者による非効率的なカナ文字修正等の作業を軽減するこ
とができ、効率の良い音声カナ漢字変換方式等を実現す
ることができる。
本発明の説明のために用いたカナ文字、尤度などの情報
記憶形態等は本実施例以外の形態をとることも可能でs
b、本発明の範囲を限定するものではない。
【図面の簡単な説明】
第1図は本発明を実現するための一実施例を示したブロ
ック図であシ、図において、1は単音節音声入力装置、
2はカナ文字・尤度記憶装置、3はカナ文字列・優先度
演算装置、4はカナ文字列・優先度記憶装置である。 第2図はカナ文字候補と尤度の記憶形態例を示す概念図
、第3図(a) 、 (b)はカナ文字列・優先度演算
装置3内のデータ構造例を示す概念図、第4図および第
5図は本発明の実施例でカナ文字列を評定した結果例を
示す図である。

Claims (1)

  1. 【特許請求の範囲】 (リ 単音節単位に区切って発音された日本語文章のそ
    れぞれの該単音節に対する1種あるいは複数種のカナ文
    字候補と該カナ文字候補の確からしさを表わす尤度とを
    用いて前記カナ文字候補から構成されるカナ文字列およ
    び該カナ文字列優先度を評定するに際して、m音節分の
    前記カナ文字候補から構成される1種あるいは複数種の
    m音節部分カナ文字列の確からしさを表わすm音節部分
    カナ文字列優先度とm+1音節目の前記尤度とを用いて
    m+1音節部分カナ文字列優先度を決定し、該m + 
    1音節部分カナ文字列優先度の高いものから予め指定さ
    れた数だけm+1音節部分カナ文字列を生成する処理過
    程を繰シ返すことによシ、1種あるいは複数種の前記カ
    ナ文字列および該カナ文字列の優先度を評定することを
    特徴とするカナ文字列評定方法。 (2)1種あるいは複数種の前記部分カナ文字列を生成
    する際、生成する該部分カナ文字列の数を該部分カナ文
    字列の長さによシ可変にすることを特徴とする特許請求
    範囲第(1)項記載のカナ文字列評定方法。
JP58005682A 1983-01-17 1983-01-17 カナ文字列評定方法 Pending JPS59132038A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58005682A JPS59132038A (ja) 1983-01-17 1983-01-17 カナ文字列評定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58005682A JPS59132038A (ja) 1983-01-17 1983-01-17 カナ文字列評定方法

Publications (1)

Publication Number Publication Date
JPS59132038A true JPS59132038A (ja) 1984-07-30

Family

ID=11617863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58005682A Pending JPS59132038A (ja) 1983-01-17 1983-01-17 カナ文字列評定方法

Country Status (1)

Country Link
JP (1) JPS59132038A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59176835A (ja) * 1983-03-26 1984-10-06 Fujitsu Ltd 音声入力文章作成方式およびその装置
JPS6146557A (ja) * 1984-08-13 1986-03-06 Nec Corp 音声ワ−ドプロセツサ
EP0440197A2 (en) * 1990-01-30 1991-08-07 Hitachi, Ltd. Method and apparatus for inputting text

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59176835A (ja) * 1983-03-26 1984-10-06 Fujitsu Ltd 音声入力文章作成方式およびその装置
JPH0376492B2 (ja) * 1983-03-26 1991-12-05 Fujitsu Ltd
JPS6146557A (ja) * 1984-08-13 1986-03-06 Nec Corp 音声ワ−ドプロセツサ
EP0440197A2 (en) * 1990-01-30 1991-08-07 Hitachi, Ltd. Method and apparatus for inputting text
US5526259A (en) * 1990-01-30 1996-06-11 Hitachi, Ltd. Method and apparatus for inputting text

Similar Documents

Publication Publication Date Title
JPS6238716B2 (ja)
Touretzky et al. A computational basis for phonology
JPS59132038A (ja) カナ文字列評定方法
JPS59132039A (ja) カナ文字列評定方法
JPS60247770A (ja) 文字処理装置
Shakil et al. Cognitive Devanagari (Marathi) text-to-speech system
JPS60142464A (ja) 音声入力による文章作成システム
JPH09288493A (ja) 音声認識方法および音声認識装置、並びに情報処理方法および情報処理装置
JP3284976B2 (ja) 音声合成装置及びコンピュータ可読記録媒体
JPS5977547A (ja) 文書作成装置
JPS60136865A (ja) 辞書検索装置
JPS58134371A (ja) 日本語入力装置
Omotayo A microcomputer-based reading aid for blind students
JPH06103457B2 (ja) 音声タイプライタ
JPS63140365A (ja) 漢字変換装置
JPS6258371A (ja) 文生成装置
JPS61177575A (ja) 日本語文章作成装置
JPS62271050A (ja) 日本語文書作成装置
JPS58208846A (ja) カナ文字列優先度決定方式
CN1156274A (zh) 汉语语音编码法和键盘及用该法的电子说话器
JPS63223792A (ja) 文−音声変換装置
Kaczmarek A procedural approach to synthesis by rule
JPH04177526A (ja) 文章読み上げ装置
JPS6236685A (ja) 音声辞書装置
JPH06130987A (ja) 音声認識装置