JPS61121167A - 区切り発声に基づく音声ワ−ドプロセツサ - Google Patents

区切り発声に基づく音声ワ−ドプロセツサ

Info

Publication number
JPS61121167A
JPS61121167A JP59243983A JP24398384A JPS61121167A JP S61121167 A JPS61121167 A JP S61121167A JP 59243983 A JP59243983 A JP 59243983A JP 24398384 A JP24398384 A JP 24398384A JP S61121167 A JPS61121167 A JP S61121167A
Authority
JP
Japan
Prior art keywords
voice
kana
series
syllable
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59243983A
Other languages
English (en)
Inventor
Yasuo Sato
佐藤 泰雄
Haruki Matsui
松井 春樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59243983A priority Critical patent/JPS61121167A/ja
Publication of JPS61121167A publication Critical patent/JPS61121167A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声ワードプロセッサ、特に文章データの入力
中に無音時間に基づく区切り記号を挿入 ゛し1日本語
変換率の向上および音節認識率の向上を可能にした区切
り発声に基づく音声ワードプロセッサに関するものであ
る。      。
〔従来の技術と問題点〕
最近、音声認識の技術が実用化の段階に入り。
日本語ワードプロセッサの入力を、音声入力で行うこと
が考慮されている。
従来、このような音声ワードプロセッサにおいて2文章
データの読み上げ音声について音声認識を行う部分と、
仮名漢字変換を処理する部分とは独立して設けられ、音
声認識する部分から仮名漢字変換を処理する部分へ引き
渡されるデータは。
子音(C)/母音(V)の組合わせからなるCV音節系
列またはそれらのCV音節候補系列に関するデータのみ
であった。即ち、認識結果であるj4!音節の仮名文字
データ列が、そのまま仮名漢字変換部へ引き渡されるよ
うにされていた。そのため。
特に長い文章データを人力した場合、仮名漢字変換を処
理する部分では、i!i!続したデータ列について、そ
の全部を対象として、仮名漢字変換を行わなければなら
ず、単語辞書との照合に時間がかかると共に9間違、た
変換を行うt1率が高くなり。
仮名漢字変換における変換率が悪いという問題があった
一方、仮名漢字変換率を向上させようとした場合、工つ
の文章の音声入力の途中で1例えばキーボードから頻繁
に仮名漢字変換の指示を行わなければならず、その都度
、同音異語等に7いて漢字変換をii定させて入力しな
ければならないので。
操作性が悪くなるという問題があった。
〔問題点を解決するだめの手段〕
本発明は上記問題点の解決を図り、変換対象のデータに
区切り記号を自動的に挿入するようにしたもので、仮名
漢字変換部では、この区切り記号に従って、変換の単位
を定めることができるようにしている。即ち1本発明の
区切り発声に基→く音声ワードプロセッサは9文章デー
タの入力について、該データの読み上げ音声を音声認識
に基づきCV音節系列ないしCV音節候補系列に変換し
該系列に対し言語処理を用いた仮名漢字変換処理によっ
て日本語文章を作成する音声ワードプロセッサにおいて
、入力音声の特徴パラメータを抽出するパラメータ抽出
部と、該パラメータ抽出部が抽出した特徴パラメータに
基づいて予め辞書に格納された標準パターンと照合する
ことによりCv音節系列ないしCV音節候補系列を選出
する離散または連続音声認識部と1発声された入力音声
における区切りの無音時間を計測する計測部と、該計測
部が計測した時間長に基づいて上記音声認識部による認
識結果であるCV音節系列ないしCV音vJ候補系列中
に区切り記号を挿入する区切り記号押入部と、上記区切
り記号の挿入されたCV音節系列ないしCV音節候補系
λりを仮名漢字変(桑における処理対象とする仮名漢字
変換部とを備えたことを特徴としている。
(作用〕 本発明は、in常1文章を読むとき、単語ないし文節で
区切って読むことが1発声の自然性をさほど損なうこと
にはならないことに着目し、単語ないし文節単位で区切
って発声された音声人力における無音時間の情報を、音
声認識部から仮名漢字変換部へ、認識結果と共に通知す
るようにし、仮名漢字変換部では、この無音時間情報に
よる区切り記号に基づいて、仮名漢字変換対象を小さく
分割することにより、変換率を向上させたものである。
以下1図面を参照しつつ、実施例に従って説明する。
(実施例) 第1図は本発明の一実施例ブロック図、第2図は理想的
な音声ワードプロセッサの入力方法を説明するための図
、第3図は連続音声認識を行う本発明の一実施例を説明
するための図、第4図は離11に音声認識を行う本発明
の一実施例を説明するための図、第5図は本発明の一実
施例による仮名漢字変換部への引き渡しデータの例を示
す。
第1L4において、n号1は音声を入力するマイク、2
は音声パラメータ抽出部、3は入力音声強度により有音
または無音を判定する有音無音判定部、4は無音時間計
測部、5は連続音声認識または離散音声認識を行う音声
認識部、6は音声の特徴パラメータに関する標準パター
ンが格納された音声辞書、7は区切り記号挿入部、8は
CV音節候補系列記112部、9は仮名漢字変換部、1
0は単語辞書、11は入力結果を表示するディスプレイ
を表す。
理想的な音声ワードプロセッサを考えた場合。
例えば「区切り記号を入れ・・・・・・」という文章デ
ータを入力するとき、第2図図示のように、「クギリキ
ゴウオイレ」と−気に音声入力し、これが仮名漢字変換
指示により、「区切り記号を入れ」という漢字混じり文
に、一度に変換されることが望まれる。
しかし、一般に仮名漢字変換用の辞書は、単語単位に漢
字データが登録されるので、変換対象となるデータが長
い場合に、単語の切り出しが難しく、漢字に変換したと
しても、誤った漢字混じり文に変換されることが多くな
る。特に、音声入力を行うワードプロセッサにおいては
、音声の認識結果が1つに確定しない状態で、仮名漢字
変換を行うことも考えられ、候補系列として、?Ji数
のデータ系列について仮名漢字変換の対象としなければ
ならないので、連続した長い文章データについて、正し
い変換結果を得るのは、極めて困難となる。
そこで本発明では9人間が単語ないし文ii5単位で区
切って発声した場合に、その区切りにおける無音時間の
長さを計測し、無音時間長が、基1となる所定の時間長
tより長いとき+ LE3(−tた音声系列中における
その無音時間の位置に、自動的に区切り記号を挿入する
例えば、音声認識部が、連続音声認識を行うものである
場合に、「区切り記号を入れ・・・・・・」という文章
データを入力するにあたって、第3図図示のように、「
クギリ」−「キゴウオ」−「イレ」と区切って発声入力
する。この入力に対し、音声認識時に「クギリ」と「キ
ゴウオ」との間の無音時間t、を計測し、この無音時間
1.が所定の基準時間tより長ければ、この位置に、認
識結果のCV音節データと区別できるコードにより定め
られた区切り記号Kを挿入する。同様に「キゴウオ」と
「イレ」との間の無音時間1tを基準時間と比較し1区
切り記号Kを挿入する。
また、音声認識部が、各単音節単位の離散音声認識を行
うものである場合には、「区切り記号を入れ・・・・・
・」という文章データを入力するにあたって1例えば第
4図図示のように入力する。即ち。
「り」と「ギ」の間のように単語内の個々の発声につい
ては短く区切り1文節の切れ目である「リボと「キjの
間は、長く区切る。この例では、無音時間t、〜を雫の
うち、無音時間titff+i*が、基準時間tより長
いため、この間にヌ切り記号Kが挿入されることになる
次に2上記処理を実現する第1図に示した実施例につい
て説明する0例えば第3図または第4図図示のように発
声された音声は、マイク1から入力され、音声パラメー
タ抽出部2によって、スペクトル情報等に関する音声の
特徴パラメータ時系列が抽出される。有音無音判定部3
は9人力音声強度により、有音から無音に変化したこと
を検出すると、無音時間計測部4を起動し、無音から有
音に変化したことを検出すると、音声認識部5を起動す
る。無音時間計測部4は、起動により無音時間をカウン
トし、計測結果を区切り記号挿入部7に伝達する。
音声認識部5は、音声パラメータ抽出部2が抽出した未
知入力音声の特徴パラメータと、音声辞書6に例えば単
音節軍使に格納されている標準パターンとを3例えばD
Pマツチング法等により照合し、認識結果であるCV音
節候補系列を、候補順位に従って、CV音節候補系列記
憶部8に格納する。
区切り記号挿入部7は、無音時間計測部4が計測した無
音時間長を、所定の基準時間と比較することにより、無
音時間長が基準時間を超えるとき。
CV音節候補系列記憶部8における最新の認識結果格納
位置の後に区切り記号を格納する0例えば。
第3図図示の人力に対して、第5図図示のような情報が
格納されることになる。各音節毎に標準パターンとの類
似度の順に従って、@補のデータが格納され5所定の無
音時間が検出された位置に区切り記号が置かれる。なお
1本実施例では1区切り記号に無音時間tl+t!の情
報が含まれるようにされている。この無音時間の情報は
、必要に応じて漢字変換時における参考情報にされる。
仮名漢字変換部9は、CV音節候補系列記憶部8から変
換対象を抽出するにあたって8区切り記号を検出し、そ
の区切り記号までの音節系列について、単語辞書10に
予め登録されている情報を検索することにより、1ff
i常の単語単位の変換ないし文節単位の変換を行う、音
節候補が複数個ある場合には、候補順位の高いものから
順に組合わせて処理するようにされる0区切り記号によ
って。
単語ないし文節の切れ目が明示されているので。
変換率が向上し、迅速に正しい仮名漢字変換を行うこと
ができるようになる。
〔発明の効果〕
以上説明した如く1本発明によれば1発声の自然性をあ
まり損なうことなく1日本語変換率を向上させることが
できるようになる。また、結果として、音節認識率が向
上することとなる。
【図面の簡単な説明】
第1図は本発明の一実施例ブロック図、第2図は理想的
な音声ワードプロセッサの入力方法を説明するための図
、第3図は連続音声認識を行う本発明の一実施例を説明
するための図、第4図は離散音声認識を行う本発明の一
実施例を説明するための図、第5図は本発明の一実施例
による仮名漢字変換部への引き渡しデータの例を示す。 図中、1はマイク、2は音声パラメータ抽出部。 3は有音無音判定部、4は無音時間計測部、5は音声認
識部、6は音声辞書、7は区切り記号挿入部、8はCV
音節候補系列記憶部、9は仮名漢字変換部、10は単語
辞書、11はディスプレイを表す。

Claims (1)

    【特許請求の範囲】
  1. 文章データの入力について、該データの読み上げ音声を
    音声認識に基づきCV音節系列ないしCV音節候補系列
    に変換し、該系列に対し言語処理を用いた仮名漢字変換
    処理によって日本語文章を作成する音声ワードプロセッ
    サにおいて、入力音声の特徴パラメータを抽出するパラ
    メータ抽出部と、該パラメータ抽出部が抽出した特徴パ
    ラメータに基づいて予め辞書に格納された標準パターン
    と照合することによりCV音節系列ないしCV音節候補
    系列を選出する離散または連続音声認識部と、発声され
    た入力音声における区切りの無音時間を計測する計測部
    と、該計測部が計測した時間長に基づいて上記音声認識
    部による認識結果であるCV音節系列ないしCV音節候
    補系列中に区切り記号を挿入する区切り記号挿入部と、
    上記区切り記号の挿入されたCV音節系列ないしCV音
    節候補系列を仮名漢字変換における処理対象とする仮名
    漢字変換部とを備えたことを特徴とする区切り発声に基
    づく音声ワードプロセッサ。
JP59243983A 1984-11-19 1984-11-19 区切り発声に基づく音声ワ−ドプロセツサ Pending JPS61121167A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59243983A JPS61121167A (ja) 1984-11-19 1984-11-19 区切り発声に基づく音声ワ−ドプロセツサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59243983A JPS61121167A (ja) 1984-11-19 1984-11-19 区切り発声に基づく音声ワ−ドプロセツサ

Publications (1)

Publication Number Publication Date
JPS61121167A true JPS61121167A (ja) 1986-06-09

Family

ID=17111958

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59243983A Pending JPS61121167A (ja) 1984-11-19 1984-11-19 区切り発声に基づく音声ワ−ドプロセツサ

Country Status (1)

Country Link
JP (1) JPS61121167A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63111568A (ja) * 1986-10-29 1988-05-16 Nec Corp 音声入力付仮名漢字変換装置
JP2009169139A (ja) * 2008-01-17 2009-07-30 Alpine Electronics Inc 音声認識装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5680771A (en) * 1979-12-04 1981-07-02 Dainippon Printing Co Ltd "kanji" (chinese character) input device for print
JPS58224398A (ja) * 1982-06-22 1983-12-26 三洋電機株式会社 音声認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5680771A (en) * 1979-12-04 1981-07-02 Dainippon Printing Co Ltd "kanji" (chinese character) input device for print
JPS58224398A (ja) * 1982-06-22 1983-12-26 三洋電機株式会社 音声認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63111568A (ja) * 1986-10-29 1988-05-16 Nec Corp 音声入力付仮名漢字変換装置
JP2009169139A (ja) * 2008-01-17 2009-07-30 Alpine Electronics Inc 音声認識装置

Similar Documents

Publication Publication Date Title
US5752227A (en) Method and arrangement for speech to text conversion
US6490563B2 (en) Proofreading with text to speech feedback
US5220639A (en) Mandarin speech input method for Chinese computers and a mandarin speech recognition machine
US9978364B2 (en) Pronunciation accuracy in speech recognition
US4769844A (en) Voice recognition system having a check scheme for registration of reference data
US5995934A (en) Method for recognizing alpha-numeric strings in a Chinese speech recognition system
US7406408B1 (en) Method of recognizing phones in speech of any language
US7430503B1 (en) Method of combining corpora to achieve consistency in phonetic labeling
JP2002278579A (ja) 音声データ検索装置
JPS61121167A (ja) 区切り発声に基づく音声ワ−ドプロセツサ
SE506003C2 (sv) Metod och system för tal-till-tal-omvandling med extrahering av prosodiinformation
JPS634206B2 (ja)
JP3366253B2 (ja) 音声合成装置
JP3378547B2 (ja) 音声認識方法及び装置
JPH0338699A (ja) 音声認識装置
Norkevičius et al. Knowledge-based grapheme-to-phoneme conversion of Lithuanian words
KR100931786B1 (ko) 한국어 철자 발화에 따른 음성인식 방법
JP2647234B2 (ja) 音声認識装置
JPH032319B2 (ja)
JPH0573039B2 (ja)
JPS6180298A (ja) 音声認識装置
JP2005534968A (ja) 漢字語の読みの決定
JPS60158496A (ja) 音声認識装置
JPS5837698A (ja) 音声入力和文タイプライタにおける変換方法
Granström et al. A danish text-to-speech system using a text normalizer based on morph analysis.