JPS61122781A - 音声ワ−ドプロセツサ - Google Patents

音声ワ−ドプロセツサ

Info

Publication number
JPS61122781A
JPS61122781A JP59244766A JP24476684A JPS61122781A JP S61122781 A JPS61122781 A JP S61122781A JP 59244766 A JP59244766 A JP 59244766A JP 24476684 A JP24476684 A JP 24476684A JP S61122781 A JPS61122781 A JP S61122781A
Authority
JP
Japan
Prior art keywords
voice
dictionary
display
word
suitability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59244766A
Other languages
English (en)
Inventor
Haruki Matsui
松井 春樹
Yasuo Sato
佐藤 泰雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59244766A priority Critical patent/JPS61122781A/ja
Publication of JPS61122781A publication Critical patent/JPS61122781A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声ワードプロセッサ、特に辞書照合の終わっ
た表示用文字列を表示するにあた゛って。
音声適合度の外に言語適合度による条件を加味して表示
優先順位を決定することにより、正解である文字列の表
示優先順位を上げるようにした音声ワーrプロセッサに
関するものである。
〔従来の技術と問題点〕
最近、音声認識の技術が実用化の段階に入り。
日本語ワードプロセッサの入力を、音声入力で行うこと
が考慮されている。
このような音声ワードプロセッサでは2文章デ−タの読
み上げ音声について音声認識を行う部分と、仮名漢字変
換を処理する部分とは独立に設けられ、音声認識する部
分から仮名漢字変換を処理する部分に対しては、子音(
C)/母音(V)の組合わせからなるCV音節候補系列
に関するデータが引き渡されている。そして−候補とな
る音節の組合わせによる曖昧文字列について、単語辞書
と照合することにより、不適正な文字列を排除し。
適正な文字列をディスプレイに順次表示するようにされ
る。
しかし、従来方式によれば、辞書照合により得られた適
正文字列を表示する順番は、候補音節に対応する標準パ
ターンとの類似度または認識順位による音声適合度によ
って定められ、そのため通常あまり用いられない不自然
な文字列が先に表示されることが多く、変換効率が悪い
という問題があった。
〔問題点を解決するための手段〕
本発明は上記問題点の解決を図り1表示優先順位を決定
するにあたって、音声適合度だけでなく。
例えば単語使用頻度や形態素数、単語読み長等による言
語適合度が考慮されるようにし、自然な文字列が優先的
に選択表示される手段を提供する。
即ち9本発明の音声ワードプロセッサは1文章データの
入力について、該データの読み上げ音声を音声認識に基
づきCV音節候補系列に変換し、該系列に対し辞書照合
を用いた仮名漢字変換処理によって日本語文書を作成す
る音声ワードプロセッサにおいて、入力音声の特徴パラ
メータを抽出するパラメータ抽出部と、該パラメータ抽
出部が抽出した特徴パラメータに基づいて予め辞書に格
納された標準パターンと照合することにより候補となる
音節系列を選出する音声認識部と、少なくとも各適正文
字と該適正文字の使用頻度情報とが対応づけられて登録
された単語辞書と、上記音声認識部による認識結果に基
づいて生成される曖昧文字列について上記単語辞書を検
索し適正文字を抽出する辞書照合部と、該辞書照合部が
抽出した適正文字による各文字系列に対し音声認識時に
おける標準パターンとの距離に関連する音声適合度と少
なくとも上記使用頻度情報に関連する言語適合度との荷
重和による適合度を求め、該適合度により表示用文字列
の表示優先順位を決定する表示選択部とを備えたことを
特徴としている。以下2図面を参照しつつ、実施例に従
って説明する。
〔実施例〕
第1図は本発明の一実施例ブロック図、第2図は本発明
の一実施例における表示用文字列の適合度を説明するた
めの図、第3図は本発明の一実施例による表示優先順位
の決定を説明するための図を示す。
第1図において、符号1は音声を入力するマイク、2は
音声パラメータ抽出部、3は音声の特徴パラメータに関
する標準パターンが格納された音声辞書、4は連続音声
認識または離散音声認識を行う音声認識部、5は音声認
識部4による認識結果が格納される音節ラティス記憶部
、6は音節ラティス記憶部5に記憶された候補となる音
節の組合わせによる曖昧文字列を生成し変換対象を選択
する変換対象選択部、7け適正文字への変換の対象とな
る曖昧文字列が格納される曖昧文字列バッファ、8は読
みと漢字混じりの適正文字とが予め登録された単語辞書
、9は辞書照合部、10は辞書照合部9による照合結果
を記憶する照合結果記憶部、11は表示用文字列の適合
度による優先順位に従って照合結果を表示する表示選択
部、12はディスプレイを表す。
マイク1から1文章データを読み上げた音声が入力され
ると、音声パラメータ抽出部2によって。
スペクトル情報等に関する音声の特徴パラメータ時系列
が抽出される。音声認識部4は、音声゛パラメータ抽出
部2が抽出した未知入力音声の特徴パラメータと、音声
辞書3に例えば単音節単位に格納されている標準パター
ンとを1例えばDPマツチング法等により照合し、認識
結果であるCv音節候補系列を、候補順位に従って、音
節ラティス記憶部5に格納する。なお、候補となる各音
節毎の標準パターンとの距離情報についても対応させて
格納する。
変換対象選択部6は、音節ラティス記憶部5に格納され
た音声認識結果に基づいて、各候補となる音節を組合わ
せることにより、曖昧文字列を生成し、曖昧文字列バッ
ファ7に格納する。また。
格納した各曖昧文字列毎に、その曖昧文字列を構成する
各音節の標準パターンとの距離に基づく類似度ないし候
補順位情報を求め、併せて曖昧文字列バッファ7に格納
する。そして、曖昧文字列バッファ7に格納した曖昧文
字列を順次選択して。
辞書照合部9へ引き渡す。
辞書照合部9は、渡された曖昧文字列について。
必要に応じて適当な文字列に区切り、その読みをキーと
して、単語辞書8を検索する。単語辞書8には、予め適
正な文字についての読みAI、A2゜・・・と、その読
みに対応する漢字を含む適正文字ないし単語Bl、B2
.・・・が登録されている。さらに、その適正文字ない
し単語B1.B2.・・・に対応して、使用頻度情報N
1.N2.・・・が格納されている。単語辞書8に求め
る適正文字等があると。
その照合結果を照合結果記憶部10に順次格納する。
表示選択部11は、照合結果記憶部10に格納された各
照合結果について、音声適合度と言語適合度との荷重和
による表示用文字列の適合度を演算し、その適合度の大
きいものから順にディスプレイ12に表示する処理を実
行する。
表示選択部11が表示優先順位を決定する基準となる表
示用文字列の適合度は2例えば第2図図示のように決定
される。第2図において、WlないしW22は、所定の
重み係数である。この重み係数は2例えば゛音声認識部
4による認識精度等によって異なるので、実験によって
適当に定められる。
表示用文字列の適合度は、言語適合度に重み係数W1を
乗じたものと、音声適合度に重み係数W2を乗じたもの
との和によって求められる。この言語適合度は2例えば
照合結果についての形態素数、単語使用頻度、単語読み
長等に、各重み係数Wl 1.Wl 2.Wl 3をそ
れぞれ乗じたものの総和から得られる。ここで形態素数
は、曖昧文字列を構成する単語数等であって9例えば曖
昧文字列が「天気が」である場合、形態素数は、「天気
/が」から“2”となる。また、曖昧文字列が「出る日
が」の場合、「出る/日/が」と分割できるので、形態
素数は“3”となる。形態素数が小さい方が、言語適合
度が大となるように1重み係数Wllが定められる。
単語使用頻度は、単語辞書8に登録されているものであ
る。曖昧文字列が複数の単語によって構成されていると
き、その総和または使用頻度が最大のものまたは先頭の
単語のものが1選ばれる。
単語読み長は、曖昧文字列に含まれる単語の中で、FA
みの長さが最も長いもの、または先頭の単語のものが基
準にされる。
音声適合度は1例えば音声認識時における標準パターン
との距離情報、各候補となる音節の順位等を基準として
、定められる。
例えば第3図に示すように、曖昧文字列バッファ7に格
納された曖昧文字列が、「てるきが」。
「べんきが」、「てんきが」、・・・・・・であったと
する。第1図図示辞書照合部9は、これらの各曖昧文字
列について、順次単語辞書8内の登録単語と照合し、適
正な文字列を抽出して、結果を照合結果記憶部10に格
納する。なお、この照合処理は。
従来の日本語ワードプロセッサにおける単語単位の仮名
漢字変換または文節/文単位の仮名漢字変換処理等と同
様に行われると考えてよい。
また、照合結果記憶部10には適正文字への変換結果と
共に、照合時に得られる上記言語適合度に関する基礎情
報が、各表示用文字列に対応して格納される。例えば、
「照る気が」の場合、音声の適正順位は第1位になって
いるが、形態素°数は「照る/気/が」で“3”であり
、使用頻度は小さな数値、単語読み長は“2”となって
いる。
第1図図示表示選択部11は、この照合結果に基づいて
、第2図に示したような表示用文字列の適合度を求める
。この例では、「天気が」が最も適合度が大きく、第2
番目が「電気が」、第3番目が「ペンキが」、・・・と
なっている。従って、ディスプレイ12に、最初「天気
が」が表示され。
これが正解でない場合9例えばキーボードに設けられた
次候補要求キーによって1次に「電気がjが表示される
ようになっている。このように、音声適合度だけでな(
、言語適合度についても1表示優先順位の決定条件とさ
れることにより、正解である確率が大きい適正文字列が
優先的に選択されることになる。
〔発明の効果〕
以上説明した如く1本発明によれば、正解である文字列
の表示順位が上がるので、適正な文字列への変換率が向
上し、変換修正の回数が少な(なるので、迅速な音声入
力による文書作成を行うことができるようになる。
【図面の簡単な説明】
第1図は本発明の一実施例ブロック図、第2図は本発明
の一実施例における表示用文字列の適合度を説明するた
めの図、第3図は本発明の一実施例による表示優先順位
の決定を説明するための図を示す。 図中、1はマイク、2は音声パラメータ抽出部。 3は音声辞書、4は音声認識部、5は音節ラティス記憶
部、6は変換対象選択部、7は曖昧文字列バッファ、8
は単語辞書、9は辞書照合部、10は照合結果記憶部、
11は表示選択部、12はディスプレイを表す。

Claims (1)

    【特許請求の範囲】
  1. 文章データの入力について、該データの読み上げ音声を
    音声認識に基づきCV音節候補系列に変換し、該系列に
    対し辞書照合を用いた仮名漢字変換処理によって日本語
    文書を作成する音声ワードプロセッサにおいて、入力音
    声の特徴パラメータを抽出するパラメータ抽出部と、該
    パラメータ抽出部が抽出した特徴パラメータに基づいて
    予め辞書に格納された標準パターンと照合することによ
    り候補となる音節系列を選出する音声認識部と、少なく
    とも各適正文字と該適正文字の使用頻度情報とが対応づ
    けられて登録された単語辞書と、上記音声認識部による
    認識結果に基づいて生成される曖昧文字列について上記
    単語辞書を検索し適正文字を抽出する辞書照合部と、該
    辞書照合部が抽出した適正文字による各文字系列に対し
    音声認識時における標準パターンとの距離に関連する音
    声適合度と少なくとも上記使用頻度情報に関連する言語
    適合度との荷重和による適合度を求め、該適合度により
    表示用文字列の表示優先順位を決定する表示選択部とを
    備えたことを特徴とする音声ワードプロセッサ。
JP59244766A 1984-11-20 1984-11-20 音声ワ−ドプロセツサ Pending JPS61122781A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59244766A JPS61122781A (ja) 1984-11-20 1984-11-20 音声ワ−ドプロセツサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59244766A JPS61122781A (ja) 1984-11-20 1984-11-20 音声ワ−ドプロセツサ

Publications (1)

Publication Number Publication Date
JPS61122781A true JPS61122781A (ja) 1986-06-10

Family

ID=17123583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59244766A Pending JPS61122781A (ja) 1984-11-20 1984-11-20 音声ワ−ドプロセツサ

Country Status (1)

Country Link
JP (1) JPS61122781A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6381586A (ja) * 1986-09-25 1988-04-12 Toshiba Corp 情報処理装置
JPS6470865A (en) * 1987-09-11 1989-03-16 Brother Ind Ltd Language processor based upon voice input
JP2009145548A (ja) * 2007-12-13 2009-07-02 Mitsubishi Electric Corp 音声検索装置
JP2020089641A (ja) * 2018-12-07 2020-06-11 株式会社日立製作所 音声認識入力装置、音声認識入力プログラム及び医用画像撮像システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6381586A (ja) * 1986-09-25 1988-04-12 Toshiba Corp 情報処理装置
JPS6470865A (en) * 1987-09-11 1989-03-16 Brother Ind Ltd Language processor based upon voice input
JP2009145548A (ja) * 2007-12-13 2009-07-02 Mitsubishi Electric Corp 音声検索装置
JP2020089641A (ja) * 2018-12-07 2020-06-11 株式会社日立製作所 音声認識入力装置、音声認識入力プログラム及び医用画像撮像システム

Similar Documents

Publication Publication Date Title
US8126714B2 (en) Voice search device
US8185376B2 (en) Identifying language origin of words
CN111145718A (zh) 一种基于自注意力机制的中文普通话字音转换方法
JPH03257596A (ja) 認識距離の差に基づく最良優先探索処理方法
JP4570509B2 (ja) 読み生成装置、読み生成方法及びコンピュータプログラム
JP2002149643A (ja) 日本語の表意文字の読み方を予測する方法
JPS61122781A (ja) 音声ワ−ドプロセツサ
JP2009271117A (ja) 音声検索装置および音声検索方法
JPH10269204A (ja) 中国語文書自動校正方法及びその装置
Chiang et al. On jointly learning the parameters in a character-synchronous integrated speech and language model
JP3366253B2 (ja) 音声合成装置
US5689583A (en) Character recognition apparatus using a keyword
JP2647234B2 (ja) 音声認識装置
JPS6229796B2 (ja)
JPH049320B2 (ja)
JP2004206659A (ja) 読み情報決定方法及び装置及びプログラム
JPS59180629A (ja) 日本語音声入力装置
JP3123181B2 (ja) 文字認識装置
JP3084864B2 (ja) 文章入力装置
JPH04232997A (ja) 音声認識装置における認識結果表示方式
JPS62117060A (ja) 文字・音声入力変換方式
JPH01114976A (ja) 文書処理装置の辞書構造
JP3339879B2 (ja) 文字認識装置
JPH04296898A (ja) 音声認識装置
JPS62208169A (ja) 文章解析処理方式