JP3104661B2 - 日本語文章作成装置 - Google Patents

日本語文章作成装置

Info

Publication number
JP3104661B2
JP3104661B2 JP09323594A JP32359497A JP3104661B2 JP 3104661 B2 JP3104661 B2 JP 3104661B2 JP 09323594 A JP09323594 A JP 09323594A JP 32359497 A JP32359497 A JP 32359497A JP 3104661 B2 JP3104661 B2 JP 3104661B2
Authority
JP
Japan
Prior art keywords
voice
unit
recognition
recognition result
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09323594A
Other languages
English (en)
Other versions
JPH11161464A (ja
Inventor
伸昌 荒木
淳 野口
充 西浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP09323594A priority Critical patent/JP3104661B2/ja
Priority to US09/198,266 priority patent/US6212497B1/en
Publication of JPH11161464A publication Critical patent/JPH11161464A/ja
Application granted granted Critical
Publication of JP3104661B2 publication Critical patent/JP3104661B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、日本語文章作成装
置に係り、特に音声から日本語の文章を作成する日本語
文章作成装置に関する。
【0002】
【従来の技術】従来、人間の音声から日本語を作成する
音声認識装置が種々案出されている。この従来の音声認
識装置は、利用者の発する音声を認識してその結果をデ
ィスプレイ等に表示する。音声認識装置の認識率は必ず
しも100%であるわけでななく、音声認識装置の認識
結果を修正する必要がある。
【0003】図4は、従来の音声認識装置の概略構成を
示すブロック図である。図4に示されたように、従来の
音声認識装置は、音声入力装置1、音声認識部2、認識
結果保持部3、及び表示部4を有する。以上の構成要件
によって、音声入力装置1から入力された音声が音声認
識部2によって自動的に認識され、その認識結果が認識
結果保持部3に保持されるとともに、表示部4に表示さ
れる。
【0004】また、従来の音声認識装置は、操作者が修
正内容を指示する入力装置7及び入力装置7によって指
示された内容に基づいて、認識結果保持部3に保持され
た認識結果を修正する修正部5を備える。修正を行う場
合には、まず、音声認識部2の認識した結果が表示部4
に表示され、誤認識の箇所があれば音が等しい正解とさ
れる候補を1つ又は2以上表示する。利用者は、表示部
4に表示された候補から正しい候補を入力装置7を操作
して選択し、修正することにより修正部5が認識結果保
持部3に保持された認識結果を保持するという方法が用
いられる。
【0005】従来の音声認識装置及び認識結果を修正す
る方法の詳細は、例えば、特開昭61−177573号
公報及び特開平1−197797号公報等に開示されて
いる。
【0006】
【発明が解決しようとする課題】ところで、従来の技術
において、離散発声ではなく、利用者が単語系列を流暢
に発声することを可能とする連続単語認識においては、
発声された単語系列の中の単語境界があいまいであるた
め単語の境界を特定することは困難であり、音声認識装
置が一つの単語を誤って複数の単語の列として認識する
ことがある。この場合、利用者が指定した単語の候補を
表示するような従来の修正方法では、一単語を別の候補
に修正することしかできず、一単語が複数の単語に誤認
識された場合にその単語の列を一単語に修正することは
不可能である。そのため、従来は、このような場合にお
いては、誤認識された箇所を利用者が削除して再入力し
なければならず効率よく音声により日本語の文章を作成
することができないという問題があった。
【0007】本発明は、上記事情に鑑みてなされたもの
であり、一単語が複数の単語に誤認識された場合にも効
率よく音声から日本語文章を作成することができる日本
語文章作成装置を提供することを目的とする。
【0008】
【課題を解決するための手段】上記課題を解決するため
に、本発明は、音声を入力し音声データに変換する音
声入力装置と、前記音声データを保持する音声保持部
と、前記音声入力装置から出力される音声データ又は前
記音声保持部に保持された音声データを認識する音声認
識部と、前記音声認識部の認識結果を表示する表示部
と、操作者の修正範囲の指示を入力する入力装置と、前
記入力装置から入力される修正範囲の指示に基づいて、
当該修正範囲の前記認識結果を修正する修正部とを具備
し、前記音声認識部は、前記音声入力装置から出力され
る音声データを連続した複数の単語として認識処理を行
い、また前記修正部より指定された修正範囲に該当する
音声データを前記音声保持部から取り出し一単語の認識
結果を返すことを特徴とする。また、本発明は、前記音
声認識部は、前記修正部より指定された修正範囲に該当
する音声データを前記音声保持部から取り出し、その音
声データが一単語であるとみなして再認識処理を行い、
認識結果を返すことを特徴とする。また、本発明は、前
記音声認識部より出力された音声認識結果を保持する認
識結果保持部を更に具備し、前記表示部は、前記修正部
より指定された修正範囲に該当する部分の認識結果につ
いて、認識結果保持部に保持されている認識結果より該
当部分の認識結果が一単語となっている候補を検索して
表示することを特徴とする。
【0009】
【発明の実施の形態】以下、図面を参照して本発明の一
実施形態による日本語文章作成装置について詳細に説明
する。図1は、本発明の一実施形態による日本語文章作
成装置の構成を示すブロック図である。図1を参照する
と、図4に示された従来の技術と同様に、利用者の音声
を入力する音声入力装置1と、音声入力装置1から入力
された音声を認識する音声認識部2と、音声認識部2に
よって認識された結果を保持する認識結果保持部3と、
認識結果を表示する表示部4とを備える。
【0010】また、本実施形態においては、上記構成要
件以外に、認識結果の修正を行う修正部5と、入力され
た音声を保持しておく音声保持部6と、キーボード・マ
ウス等の入力装置7を含む。
【0011】上記音声入力装置1は、利用者の発声を受
け取りその音声データを音声認識部2に渡す役割を行
う。音声認識部2は、入力された音声データに対して音
声認識を行い、認識結果を認識結果保持部3に送ると同
時に入力された音声データを音声保持部6に送る。
【0012】認識結果保持部3は、音声認識部2より送
られてきた認識結果を保持する。表示部4は、認識結果
保持部3を参照して認識結果を表示する。修正部5は、
入力装置7を介して利用者から修正の指示が送られてき
た時に認識結果保持部3の内容の修正や、音声認識部2
に対して再認識の指示を行う。
【0013】音声保持部6は、入力された音声データを
保持しておく。入力装置7は、利用者の操作を受け取
り、それが認識結果の修正を指示する操作であればその
指示内容を修正部5に送る。
【0014】次に、本発明の一実施形態による日本語文
章作成装置の動作について説明する。まず、利用者が音
声入力装置1に対して音声を入力すると音声データに変
換され、その音声データは音声認識部2へ出力される。
音声認識部2は入力される音声データを処理し、認識結
果を認識結果保持部3へ出力する。また同時に音声認識
部2は音声データを音声保持部6へ出力する。音声認識
部3から認識結果保持部3へ出力された認識結果、及び
音声認識部3から音声保持部6へ出力された音声データ
はそれぞれ保持される。尚、上記認識結果は、1つの認
識結果のみが含まれているのではなく、1つ又は2以上
の候補も含まれている。
【0015】以上の処理が終了すると、表示部4は認識
結果保持部3に記憶されている候補のうち第1候補を表
示する。利用者は表示部4に表示された結果を見て必要
であれば入力装置7を使用して修正を指示する。修正部
5は入力装置7を通して利用者の修正指示を受け取り、
修正を行う。
【0016】ここで利用者の修正指示が一単語のみを修
正する指示であれば、従来技術と同様に修正部5は認識
結果保持部3に保持された認識結果のうち、その一単語
のみを修正する。ここで、利用者が、例えば「記録ノー
ト」と発声し、誤認識され「記録の音」と表示されたと
する。図2は、誤認識時における表示部4の表示内容を
示す図である。
【0017】この時、利用者は二単語に認識された「の
音」の部分を一単語の「ノート」に修正するため、「の
音」の部分に対して修正指示を出す。ここでは仮に、利
用者が「の音」の部分に対して入力装置7のマウスをド
ラッグすることにより選択したとする。この時、修正部
5は利用者により選択された部分を一単語とみなして認
識結果を修正するよう音声認識部2に指示を出す。
【0018】音声認識部2は修正の手段として、ここで
は例えば音声保持部6より「の音」に相当する部分の音
声データを読み出し、離散単語認識を行う。音声認識部
2はその結果を認識結果保持部3へ送り、以前の「の
音」の認識結果と置き換える。表示部4は認識結果保持
部3より認識結果を読み出し、修正された認識結果を候
補ウィンドウ9(図3参照)内に表示する。図3は、複
数の単語に誤認識された認識結果を修正するときの候補
が表示された表示部4の表示内容を示す図である。
【0019】図3に示されたように、候補としては「ノ
ート」、「ノード」、「モード」などが表示され、利用
者は「ノート」を選択することで誤認識を正しく修正す
ることができる。なお、以上説明した本発明の一実施形
態による日本語文章作成装置では、利用者の修正指示方
法の例としてマウスでドラッグして選択することを挙げ
たが、この限りではなく例えばキーボードでの選択や音
声コマンドによる指示などでもよい。
【0020】また、音声認識部2による認識結果の修正
方法も、上記では指定された範囲に対応する音声部分を
離散単語認識するとしたがこの限りではなく、例えば認
識結果保持部3に保持されている最初の認識結果の中
に、利用者により範囲指定された部分が一単語となって
いる候補を検索して表示してもよい。また、上記では修
正された認識結果を候補ウィンドウに表示するとした
が、修正された認識結果のうちの第一候補のみを表示す
る方法でも構わない。
【0021】
【発明の効果】以上、説明したように、本発明によれ
ば、利用者によって指示された修正範囲に対し、当該範
囲を一つの単語とみなして認識するため、連続単語認識
された結果に対して、誤って分割されて認識された単語
列を一つの単語として修正することができるという効果
がある。この結果、削除して再入力するという手間が省
け、音声入力を効率よく行うことができるという効果が
得られる。
【図面の簡単な説明】
【図1】 本発明の一実施形態による日本語文章作成装
置の構成を示すブロック図である。
【図2】 誤認識時における表示部4の表示内容を示す
図である。
【図3】 複数の単語に誤認識された認識結果を修正す
るときの候補が表示された表示部4の表示内容を示す図
である。
【図4】 従来の音声認識装置の概略構成を示すブロッ
ク図である。
【符号の説明】
1 音声入力装置 2 音声認識部 3 認識結果保持部 4 表示部 5 修正部 6 音声保持部 7 入力装置
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−254896(JP,A) 特開 昭54−148304(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 3/16 G10L 15/22 G10L 15/24

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声を入力し音声データに変換する音
    声入力装置と、 前記音声データを保持する音声保持部と、 前記音声入力装置から出力される音声データ又は前記音
    声保持部に保持された音声データを認識する音声認識部
    と、 前記音声認識部の認識結果を表示する表示部と、 操作者の修正範囲の指示を入力する入力装置と、 前記入力装置から入力される修正範囲の指示に基づい
    て、当該修正範囲の前記認識結果を修正する修正部とを
    具備し、前記音声認識部は、前記音声入力装置から出力
    される音声データを連続した複数の単語として認識処理
    を行い、また前記修正部より指定された修正範囲に該当
    する音声データを前記音声保持部から取り出し一単語の
    認識結果を返すことを特徴とする日本語文章作成装置。
  2. 【請求項2】 前記音声認識部は、前記修正部より指定
    された修正範囲に該当する音声データを前記音声保持部
    から取り出し、その音声データが一単語であるとみなし
    て再認識処理を行い、認識結果を返すことを特徴とする
    請求項1記載の日本語文章作成装置。
  3. 【請求項3】 前記音声認識部より出力された音声認識
    結果を保持する認識結果保持部を更に具備し、 前記表示部は、前記修正部より指定された修正範囲に該
    当する部分の認識結果について、認識結果保持部に保持
    されている認識結果より該当部分の認識結果が一単語と
    なっている候補を検索して表示することを特徴とする請
    求項1記載の日本語文章作成装置。
JP09323594A 1997-11-25 1997-11-25 日本語文章作成装置 Expired - Fee Related JP3104661B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP09323594A JP3104661B2 (ja) 1997-11-25 1997-11-25 日本語文章作成装置
US09/198,266 US6212497B1 (en) 1997-11-25 1998-11-24 Word processor via voice

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09323594A JP3104661B2 (ja) 1997-11-25 1997-11-25 日本語文章作成装置

Publications (2)

Publication Number Publication Date
JPH11161464A JPH11161464A (ja) 1999-06-18
JP3104661B2 true JP3104661B2 (ja) 2000-10-30

Family

ID=18156460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09323594A Expired - Fee Related JP3104661B2 (ja) 1997-11-25 1997-11-25 日本語文章作成装置

Country Status (2)

Country Link
US (1) US6212497B1 (ja)
JP (1) JP3104661B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3543931B2 (ja) * 1998-12-17 2004-07-21 日本電気株式会社 音声認識による文字編集手段を有する移動通信端末装置
JP2001101162A (ja) * 1999-09-27 2001-04-13 Just Syst Corp 文書処理装置、及び文書処理プログラムが記憶された記憶媒体
US7467089B2 (en) * 2001-09-05 2008-12-16 Roth Daniel L Combined speech and handwriting recognition
US7526431B2 (en) * 2001-09-05 2009-04-28 Voice Signal Technologies, Inc. Speech recognition using ambiguous or phone key spelling and/or filtering
US7809574B2 (en) 2001-09-05 2010-10-05 Voice Signal Technologies Inc. Word recognition using choice lists
US7444286B2 (en) * 2001-09-05 2008-10-28 Roth Daniel L Speech recognition using re-utterance recognition
US7505911B2 (en) * 2001-09-05 2009-03-17 Roth Daniel L Combined speech recognition and sound recording
US7412392B1 (en) 2003-04-14 2008-08-12 Sprint Communications Company L.P. Conference multi-tasking system and method
WO2006028171A1 (ja) * 2004-09-09 2006-03-16 Pioneer Corporation データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体
JP5396426B2 (ja) * 2011-04-21 2014-01-22 株式会社Nttドコモ 音声認識装置、音声認識方法及び音声認識プログラム
JP6169864B2 (ja) * 2012-03-21 2017-07-26 株式会社デンソーアイティーラボラトリ 音声認識装置、音声認識プログラム、及び、音声認識方法
KR101939253B1 (ko) * 2012-05-21 2019-01-16 엘지전자 주식회사 음성 녹음 중에 탐색을 용이하게 하는 방법 및 이를 구현한 전자기기
JP2014203207A (ja) * 2013-04-03 2014-10-27 ソニー株式会社 情報処理装置、情報処理方法及びコンピュータプログラム
US10002543B2 (en) * 2014-11-04 2018-06-19 Knotbird LLC System and methods for transforming language into interactive elements
US10733235B2 (en) 2015-06-09 2020-08-04 Patricia Henery Aid for dyslexic readers

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54148304A (en) 1978-05-15 1979-11-20 Toshiba Corp Monosyllable identication device
JPS61177573A (ja) 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPH01197797A (ja) 1988-02-02 1989-08-09 Ricoh Co Ltd 音節認識結果選択方式
JPH04254896A (ja) 1991-02-07 1992-09-10 Seiko Epson Corp 音声認識訂正装置

Also Published As

Publication number Publication date
JPH11161464A (ja) 1999-06-18
US6212497B1 (en) 2001-04-03

Similar Documents

Publication Publication Date Title
JP4444396B2 (ja) 音声認識におけるポジション操作
JP3414735B2 (ja) 複合ワードを有する言語のための音声認識装置
JP4570176B2 (ja) ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム
JP2836159B2 (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JP3104661B2 (ja) 日本語文章作成装置
US6581033B1 (en) System and method for correction of speech recognition mode errors
JP4987623B2 (ja) ユーザと音声により対話する装置および方法
US7315818B2 (en) Error correction in speech recognition
EP0840288B1 (en) Method and system for editing phrases during continuous speech recognition
JPS62239231A (ja) 口唇画像入力による音声認識方法
US6801892B2 (en) Method and system for the reduction of processing time in a speech recognition system using the hidden markov model
JP2002117026A (ja) 確率的入力方法によって生成された候補リストからフィルタリングおよび選択を行うための方法およびシステム
JP2002091492A (ja) 音声補完方法、装置および記録媒体
EP1430474A1 (en) Correcting a text recognized by speech recognition through comparison of phonetic sequences in the recognized text with a phonetic transcription of a manually input correction word
JPH07222248A (ja) 携帯型情報端末における音声情報の利用方式
JP2005043461A (ja) 音声認識方法及び音声認識装置
JPH11194793A (ja) 音声ワープロ
JP2021139994A (ja) 音声認識誤り訂正装置、音声認識誤り訂正方法及び音声認識誤り訂正プログラム
WO2012144525A1 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP2003029779A (ja) 自動通訳システム及びその方法並びにプログラム
JP4220151B2 (ja) 音声対話装置
JP2000056795A (ja) 音声認識装置
JP3958908B2 (ja) 書き起こしテキスト自動生成装置、音声認識装置および記録媒体
JP2000330588A (ja) 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000801

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080901

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080901

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090901

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090901

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100901

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110901

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120901

Year of fee payment: 12

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120901

Year of fee payment: 12

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120901

Year of fee payment: 12

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120901

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120901

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130901

Year of fee payment: 13

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees