JPH03147052A - 音声日本語入力方式 - Google Patents

音声日本語入力方式

Info

Publication number
JPH03147052A
JPH03147052A JP1286311A JP28631189A JPH03147052A JP H03147052 A JPH03147052 A JP H03147052A JP 1286311 A JP1286311 A JP 1286311A JP 28631189 A JP28631189 A JP 28631189A JP H03147052 A JPH03147052 A JP H03147052A
Authority
JP
Japan
Prior art keywords
japanese
input
sound
result
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1286311A
Other languages
English (en)
Inventor
Noboru Kanmura
管村 昇
Ryohei Nakatsu
良平 中津
Fumihiko Kobashi
小橋 史彦
Toshiaki Tsuboi
俊明 坪井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP1286311A priority Critical patent/JPH03147052A/ja
Publication of JPH03147052A publication Critical patent/JPH03147052A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 r産業上の利用分野」 この発明は単語、単音節などの音声認識用標準パタンを
用いて、入力音声中の単語、単音節などの認識を行い、
この認識結果と日本語変換用単語辞書とを用いて上記入
力音声を日本語に変換する音声日本語入力方式に関する
「従来の技術」 音声認識を利用した日本語入力の多くは、利用者が作成
したい文書の内容を発声し、日本語変換された結果に対
して確認、修正処理を行い文書を作成する方式が一般的
である。この方式において文書を音声で入力する人と、
[L2、修正を行なう人とは同一である場合が多い。こ
の場合、入力したい内容は利用者が知っているから確認
、修正処理を実行することができる。しかし入力者と確
認、修正を行なう人が異なる場合、確認、修正処理を行
なう人は入力内容をあらかじめ別の手段で知っておく必
要がある。この場合、入力原稿などを利用することが考
えられるが、文書作成時に同時に原稿を作成しておかな
ければならなくなり、文書作成の能率が低下する。また
原稿なしで思いつくまま文書を作成するような場合には
、入力したい内容を知ることができない。
また音声認識用標準パタンは一般に学習により作成する
が、学習音声は限られた少ないものであり、かつ学習の
ために特に発声するため、通常(自然)の発声とはわず
か異ったものとなることがあり、必ずしも最良の標準パ
タンではない、しかし従来においては標準パタンの修正
は行っていなかった。更に、例えば単音節の標準パタン
を基本的に用いるが、認識精度を上げる点から限られた
単語の標準パタンをも併用することがあり、その場合、
使用頻度の多い単語について標準パタンを用意すること
が好ましい。しかし、入力文書によって単語の使用頻度
が異なり、用意した単語標準パタンか必ずしも適切なも
のでないことがある。
この発明の目的は入力音声を原稿として作っておかなく
ても、確認、修正を入力した人とは異なる人でも行うこ
とを可能とし、また標準パタンの修正を可能とする音声
日本語入力方式を提供することにある。
[課題を解決するだめの手段」 この発明によれば入力音声を符号化してその符号化デー
タを蓄積しておき、これを、日本語変換された結果に対
する確認、修正時に音声として再生して利用する。
またこの蓄積した符号化データと日本語変換結果(確認
、修正済のもの)とを対応ずけて、蓄積した符号化デー
タ中の標準パタンとして必要な部分を抽出し、その抽出
した符号化データを用いて標準パタンを作り、その標準
パタンを音声認識用標準パタンとして用いる。
[実施例J この発明の構成の実施例を第1図に示す。第1図は音声
による日本語入力の一般的な場合を記述している。端子
1から入力された音声信号はAD変換部2でデジタル信
号(PCM符号)に変換され、そのデジタル信号は音声
分析部3で自己相関係数などを抽出する分析が行なわれ
る。これと同時にAD変換部2の出力デジタル信号は入
力音声蓄積部4に例えば文節などの発声単位ごとに蓄積
される。パタンマンチング部5では、入力音声の分析結
果と標準パタン蓄積部6にあらかじめ蓄えられている単
音節および単語標準パタンなどとのマンチングを行い、
入力音声中の単音節や単語などの認識を行う。その認識
結果は日本語変換部7に送られる。日本語変換部7では
、日本語変換用単語辞書8を参照しながら文法処理など
を行い入力音声を書き言葉に変換する。その変換された
結果は表示部9を介して利用者に提示されると同時に変
換結果蓄積部11に蓄積される。利用者はこの変換結果
に対して入力装置12を介して確認・修正作業を行う、
この場合、利用者には、変換された日本語と同時に、変
換部分に対応する音声が、入力音声蓄積部4から読出さ
れ、DA変換部13でアナログ信号に変換され音声出力
部14から出力される。
文書入力時と確認、修正時とが異なる場合には、音声出
力モード(逐次/−括)指定部15からの信号により蓄
積されている変換結果を蓄積部11から読みだし、表示
部9に表示すると共にこれに対応する音声の符号化デー
タを入力音声蓄積部4から読みだしDA変換部13を通
じて音声として再生出力する。利用者は、この再生音声
で入力したい内容を確認し、正しい日本語変換結果を選
択したり、修正を行なう。さらに確認、修正をすべての
変換された結果に対して実行した後、全体の文書の読み
合わせなどにも、蓄積した音声を利用することができる
。これらの指示は指定部15からの指示で実行する。
このようにして確認、修正された日本語変換結果は、必
要に応じて文書出力指示端子16を通じて出力指示を変
換結果蓄積部11に与えて読出し、プリンタなどの出力
装置17に出力する。なお標準パタンは予め学習用音声
を入力端子1に入力して、その音声分析部3の分析結果
を標準パタンとして認識用標準パタン蓄積部6に蓄積し
ておく。
音声を蓄積しておく形式としては、AD変換されたまま
のPCM符号化データが単純であるが、蓄積のためのメ
モリ容量が多くなるという欠点がある。このメモリ容量
を少なくするにはDPCMなどのような波形符号化方式
やPAi?COR,LSPなどの分析合成方式が利用で
きる。この場合は、第2図に示すように、音声分析部3
の分析結果を音声合成用パラメータ抽出部18に入力し
、その抽出したパラメータを示す符号化データを入力音
声蓄積部4に蓄積する。この入力音声蓄積部4から読出
した符号化データはパラメータ復元部19でパラメータ
を復元し、音声合成部20で音声合成し、その出力をD
Δ変換部13へ供給する。
第3図は、日本語変換結果の表示、確認法の実施例であ
り、入力単位ごとの音声出力か文書全体の一括出力かを
画面上の表示をマウスなどで指示(クリック)して選択
する。入力単位ごとに日本語変換を行なう場合、マウス
などで表示されている変換部をクリックすることにより
、その部分に対応する音声が出力される。
第3図の表示例では未修正部分(図中のポインタより右
側以下)に「入浴」、「策定」などの誤った変換結果が
示され、これらは以後の処理によりそれぞれ「入力」、
「作成」に修正されるものであり、現処理では「日本語
をJを入力した部分に対する変換結果としての4つの変
換候補群から、音声出力を聞いて正しい変換結果を、ポ
インタ(図中矢印)で指示して選択することを示してい
る。
全文書修正後は、−柄出力を指定することにより作成し
た文書全体の、読み合わせによる6!認が行えるように
することもできる。
つぎに蓄積された音声を利用して標準パタンの更新、追
加を行なう方法を第4図を参照して説明する。入力音声
の発声内容は入力装置)2からの確認・修正処理過程を
通じて得られる。そこで変換結果蓄積部11に蓄積され
た音声と入力音声蓄積部4の発声された内容とを時間的
に対応させることにより、例えば変換された単語ド相当
する音声符号化データ部分を抽出することができる。さ
らにこの抽出した単語の音声符号化データと単語辞書8
に蓄積されているその単語の頻度情報とにより、よく使
用されている単語についてはその抽出した単語の符号化
データを音声分析部3へ供給して分析し、その分析結果
をその単語の標準パタンとして認識用標準パタン蓄積部
6に追加登録を行なう。これら一連の処理は第1図の構
成に付加された区間抽出/登録判定部21で実行するこ
とができる。認識用標準パタン蓄積部6内の単語辞書の
容量があふれる場合には、新たに加える標準パタンとそ
れまで最も使用回数の少ない単語の標準パタンとを入れ
換えるなどの操作で、この追加登録処理を実行できる。
このように使用頻度の高い単語の標準パタンの追加登録
を行う場合に限らず、例えば単音節に対する標準パタン
も、入力音声蓄積部4に蓄積された符号化データを利用
すれば、学習音声よりも多くの音声につき、しかも自然
に発声した通常の音声により単音節標準パタンを作るこ
とができ、学習音声よりもより良い標準パタンを作るこ
とができ、これを5m用標準パタンと使用することによ
り、認識精度を高くすることができる。
「発明の効果」 以上説明したように、この発明においては利用者が入力
したい内容を別の手段で知っておく必要がなく、入力さ
れた音声を蓄積しておくことにより実現できる0日本語
変換結果の確認、修正時には、蓄積されている音声を再
生することにより入力したい内容を音声で知ることがで
き、文書作成の能率が向上できる。さらに蓄積している
自然発声の音声を用いて標準パタンを作成、追加してい
くことができ、改めて学習用音声を発声する必要がなく
、認識精度の向上が図られる。
【図面の簡単な説明】
第1図はこの発明の実施例を示すブロック図、第2図は
入力音声を圧縮符号化蓄積する場合のこの発明の実施例
を示すブロック図、第3図は確認、修正処理時の画面表
示の一例を示す図、第4図は蓄積された入力音声から標
準パタンを抽出する場合のこの発明の実施例を示すブロ
ック図である。

Claims (2)

    【特許請求の範囲】
  1. (1)単語、単音節などの音声認識用標準パタンを用い
    て、入力音声中の単語、単音節などの認識を行い、この
    認識結果と日本語変換用単語辞書とを用いて上記入力音
    声を日本語に変換する音声日本語入力方式において、 上記入力音声を符号化してその符号化データを蓄積して
    おき、これを、日本語変換された結果に対する確認・修
    正時に音声として再生して利用することを特徴とする音
    声日本語入力方式。
  2. (2)上記蓄積した符号化データと日本語変換結果とを
    対応ずけて、上記蓄積した符号化データ中の標準パタン
    として必要な部分を抽出し、その抽出した符号化データ
    を用いて標準パタンを作り、この標準パタンを上記音声
    認識用標準パタンとして用いることを特徴とする請求項
    1記載の音声日本語入力方式。
JP1286311A 1989-11-01 1989-11-01 音声日本語入力方式 Pending JPH03147052A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1286311A JPH03147052A (ja) 1989-11-01 1989-11-01 音声日本語入力方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1286311A JPH03147052A (ja) 1989-11-01 1989-11-01 音声日本語入力方式

Publications (1)

Publication Number Publication Date
JPH03147052A true JPH03147052A (ja) 1991-06-24

Family

ID=17702739

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1286311A Pending JPH03147052A (ja) 1989-11-01 1989-11-01 音声日本語入力方式

Country Status (1)

Country Link
JP (1) JPH03147052A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10133685A (ja) * 1996-10-31 1998-05-22 Microsoft Corp 連続音声認識中にフレーズを編集する方法及びシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10133685A (ja) * 1996-10-31 1998-05-22 Microsoft Corp 連続音声認識中にフレーズを編集する方法及びシステム

Similar Documents

Publication Publication Date Title
JP4867804B2 (ja) 音声認識装置及び会議システム
US6853971B2 (en) Two-way speech recognition and dialect system
US6975986B2 (en) Voice spelling in an audio-only interface
US20030191643A1 (en) Automatic multi-language phonetic transcribing system
JPH10507536A (ja) 言語認識
WO2007055233A1 (ja) 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム
US20080154591A1 (en) Audio Recognition System For Generating Response Audio by Using Audio Data Extracted
KR19980070329A (ko) 사용자 정의 문구의 화자 독립 인식을 위한 방법 및 시스템
JPH0215080B2 (ja)
JPH03147052A (ja) 音声日本語入力方式
EP3718107B1 (en) Speech signal processing and evaluation
JP2612030B2 (ja) 文章読み上げ装置
JP6991409B2 (ja) 情報処理装置、プログラム及び情報処理方法
JP2001188556A (ja) 音声認識方法及び装置
JPS6315294A (ja) 音声分析装置
JP7363307B2 (ja) 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体
EP0917708B1 (en) Pattern recognition
JP2004309654A (ja) 音声認識装置
JP2638151B2 (ja) 会話補助装置
JPH08297673A (ja) 音声入力翻訳装置
JPH0362279B2 (ja)
EP1103954A1 (en) Digital speech acquisition, transmission, storage and search system and method
JPS60170885A (ja) 単音節音声学習方式
JPH03147053A (ja) 音声日本語入力方式
JPH02289026A (ja) 音声ワードプロセッサ