JPH11161464A - 日本語文章作成装置 - Google Patents

日本語文章作成装置

Info

Publication number
JPH11161464A
JPH11161464A JP9323594A JP32359497A JPH11161464A JP H11161464 A JPH11161464 A JP H11161464A JP 9323594 A JP9323594 A JP 9323594A JP 32359497 A JP32359497 A JP 32359497A JP H11161464 A JPH11161464 A JP H11161464A
Authority
JP
Japan
Prior art keywords
voice
recognition
unit
input device
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9323594A
Other languages
English (en)
Other versions
JP3104661B2 (ja
Inventor
Nobumasa Araki
伸昌 荒木
Atsushi Noguchi
淳 野口
Mitsuru Nishiura
充 西浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP09323594A priority Critical patent/JP3104661B2/ja
Priority to US09/198,266 priority patent/US6212497B1/en
Publication of JPH11161464A publication Critical patent/JPH11161464A/ja
Application granted granted Critical
Publication of JP3104661B2 publication Critical patent/JP3104661B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 一単語が複数の単語に誤認識された場合にも
効率よく音声から日本語文章を作成することができる日
本語文章作成装置を提供すること。 【解決手段】 音声を入力し、音声データに変換する音
声入力装置1と、音声データを保持する音声保持部6
と、音声入力装置から出力される音声データ又は音声保
持部に保持された音声データを認識する音声認識部2
と、音声認識部の認識結果を表示する表示部4と操作者
の修正範囲の指示を入力する入力装置7と、入力装置か
ら入力される修正範囲の指示に基づいて、当該修正範囲
の認識結果を修正する修正部5とを具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、日本語文章作成装
置に係り、特に音声から日本語の文章を作成する日本語
文章作成装置に関する。
【0002】
【従来の技術】従来、人間の音声から日本語を作成する
音声認識装置が種々案出されている。この従来の音声認
識装置は、利用者の発する音声を認識してその結果をデ
ィスプレイ等に表示する。音声認識装置の認識率は必ず
しも100%であるわけでななく、音声認識装置の認識
結果を修正する必要がある。
【0003】図4は、従来の音声認識装置の概略構成を
示すブロック図である。図4に示されたように、従来の
音声認識装置は、音声入力装置1、音声認識部2、認識
結果保持部3、及び表示部4を有する。以上の構成要件
によって、音声入力装置1から入力された音声が音声認
識部2によって自動的に認識され、その認識結果が認識
結果保持部3に保持されるとともに、表示部4に表示さ
れる。
【0004】また、従来の音声認識装置は、操作者が修
正内容を指示する入力装置7及び入力装置7によって指
示された内容に基づいて、認識結果保持部3に保持され
た認識結果を修正する修正部5を備える。修正を行う場
合には、まず、音声認識部2の認識した結果が表示部4
に表示され、誤認識の箇所があれば音が等しい正解とさ
れる候補を1つ又は2以上表示する。利用者は、表示部
4に表示された候補から正しい候補を入力装置7を操作
して選択し、修正することにより修正部5が認識結果保
持部3に保持された認識結果を保持するという方法が用
いられる。
【0005】従来の音声認識装置及び認識結果を修正す
る方法の詳細は、例えば、特開昭61−177573号
公報及び特開平1−197797号公報等に開示されて
いる。
【0006】
【発明が解決しようとする課題】ところで、従来の技術
において、離散発声ではなく、利用者が単語系列を流暢
に発声することを可能とする連続単語認識においては、
発声された単語系列の中の単語境界があいまいであるた
め単語の境界を特定することは困難であり、音声認識装
置が一つの単語を誤って複数の単語の列として認識する
ことがある。この場合、利用者が指定した単語の候補を
表示するような従来の修正方法では、一単語を別の候補
に修正することしかできず、一単語が複数の単語に誤認
識された場合にその単語の列を一単語に修正することは
不可能である。そのため、従来は、このような場合にお
いては、誤認識された箇所を利用者が削除して再入力し
なければならず効率よく音声により日本語の文章を作成
することができないという問題があった。
【0007】本発明は、上記事情に鑑みてなされたもの
であり、一単語が複数の単語に誤認識された場合にも効
率よく音声から日本語文章を作成することができる日本
語文章作成装置を提供することを目的とする。
【0008】
【課題を解決するための手段】上記課題を解決するため
に、本発明は、音声を入力し、音声データに変換する音
声入力装置と、前記音声データを保持する音声保持部
と、前記音声入力装置から出力される音声データ又は前
記音声保持部に保持された音声データを認識する音声認
識部と、前記音声認識部の認識結果を表示する表示部
と、操作者の修正範囲の指示を入力する入力装置と、前
記入力装置から入力される修正範囲の指示に基づいて、
当該修正範囲の前記認識結果を修正する修正部とを具備
することを特徴とする。また、本発明は、前記音声認識
部の認識結果を保持する認識結果保持部を更に具備する
ことを特徴とする。また、本発明は、前記音声認識部
は、前記音声入力装置から音声データが入力された場合
には、当該音声データに基づいて認識し、前記入力装置
から修正範囲の指示があった場合には、前記音声保持部
に保持された音声データに基づいて認識を行うことを特
徴とする。また、本発明は、前記音声認識部が前記音声
保持部に保持された音声データに基づいて認識を行った
場合には、当該認識の結果が1つ又は複数前記表示部に
表示されることを特徴とする。
【0009】
【発明の実施の形態】以下、図面を参照して本発明の一
実施形態による日本語文章作成装置について詳細に説明
する。図1は、本発明の一実施形態による日本語文章作
成装置の構成を示すブロック図である。図1を参照する
と、図4に示された従来の技術と同様に、利用者の音声
を入力する音声入力装置1と、音声入力装置1から入力
された音声を認識する音声認識部2と、音声認識部2に
よって認識された結果を保持する認識結果保持部3と、
認識結果を表示する表示部4とを備える。
【0010】また、本実施形態においては、上記構成要
件以外に、認識結果の修正を行う修正部5と、入力され
た音声を保持しておく音声保持部6と、キーボード・マ
ウス等の入力装置7を含む。
【0011】上記音声入力装置1は、利用者の発声を受
け取りその音声データを音声認識部2に渡す役割を行
う。音声認識部2は、入力された音声データに対して音
声認識を行い、認識結果を認識結果保持部3に送ると同
時に入力された音声データを音声保持部6に送る。
【0012】認識結果保持部3は、音声認識部2より送
られてきた認識結果を保持する。表示部4は、認識結果
保持部3を参照して認識結果を表示する。修正部5は、
入力装置7を介して利用者から修正の指示が送られてき
た時に認識結果保持部3の内容の修正や、音声認識部2
に対して再認識の指示を行う。
【0013】音声保持部6は、入力された音声データを
保持しておく。入力装置7は、利用者の操作を受け取
り、それが認識結果の修正を指示する操作であればその
指示内容を修正部5に送る。
【0014】次に、本発明の一実施形態による日本語文
章作成装置の動作について説明する。まず、利用者が音
声入力装置1に対して音声を入力すると音声データに変
換され、その音声データは音声認識部2へ出力される。
音声認識部2は入力される音声データを処理し、認識結
果を認識結果保持部3へ出力する。また同時に音声認識
部2は音声データを音声保持部6へ出力する。音声認識
部3から認識結果保持部3へ出力された認識結果、及び
音声認識部3から音声保持部6へ出力された音声データ
はそれぞれ保持される。尚、上記認識結果は、1つの認
識結果のみが含まれているのではなく、1つ又は2以上
の候補も含まれている。
【0015】以上の処理が終了すると、表示部4は認識
結果保持部3に記憶されている候補のうち第1候補を表
示する。利用者は表示部4に表示された結果を見て必要
であれば入力装置7を使用して修正を指示する。修正部
5は入力装置7を通して利用者の修正指示を受け取り、
修正を行う。
【0016】ここで利用者の修正指示が一単語のみを修
正する指示であれば、従来技術と同様に修正部5は認識
結果保持部3に保持された認識結果のうち、その一単語
のみを修正する。ここで、利用者が、例えば「記録ノー
ト」と発声し、誤認識され「記録の音」と表示されたと
する。図2は、誤認識時における表示部4の表示内容を
示す図である。
【0017】この時、利用者は二単語に認識された「の
音」の部分を一単語の「ノート」に修正するため、「の
音」の部分に対して修正指示を出す。ここでは仮に、利
用者が「の音」の部分に対して入力装置7のマウスをド
ラッグすることにより選択したとする。この時、修正部
5は利用者により選択された部分を一単語とみなして認
識結果を修正するよう音声認識部2に指示を出す。
【0018】音声認識部2は修正の手段として、ここで
は例えば音声保持部6より「の音」に相当する部分の音
声データを読み出し、離散単語認識を行う。音声認識部
2はその結果を認識結果保持部3へ送り、以前の「の
音」の認識結果と置き換える。表示部4は認識結果保持
部3より認識結果を読み出し、修正された認識結果を候
補ウィンドウ9(図3参照)内に表示する。図3は、複
数の単語に誤認識された認識結果を修正するときの候補
が表示された表示部4の表示内容を示す図である。
【0019】図3に示されたように、候補としては「ノ
ート」、「ノード」、「モード」などが表示され、利用
者は「ノート」を選択することで誤認識を正しく修正す
ることができる。なお、以上説明した本発明の一実施形
態による日本語文章作成装置では、利用者の修正指示方
法の例としてマウスでドラッグして選択することを挙げ
たが、この限りではなく例えばキーボードでの選択や音
声コマンドによる指示などでもよい。
【0020】また、音声認識部2による認識結果の修正
方法も、上記では指定された範囲に対応する音声部分を
離散単語認識するとしたがこの限りではなく、例えば認
識結果保持部3に保持されている最初の認識結果の中
に、利用者により範囲指定された部分が一単語となって
いる候補を検索して表示してもよい。また、上記では修
正された認識結果を候補ウィンドウに表示するとした
が、修正された認識結果のうちの第一候補のみを表示す
る方法でも構わない。
【0021】
【発明の効果】以上、説明したように、本発明によれ
ば、利用者によって指示された修正範囲に対し、当該範
囲を一つの単語とみなして認識するため、連続単語認識
された結果に対して、誤って分割されて認識された単語
列を一つの単語として修正することができるという効果
がある。この結果、削除して再入力するという手間が省
け、音声入力を効率よく行うことができるという効果が
得られる。
【図面の簡単な説明】
【図1】 本発明の一実施形態による日本語文章作成装
置の構成を示すブロック図である。
【図2】 誤認識時における表示部4の表示内容を示す
図である。
【図3】 複数の単語に誤認識された認識結果を修正す
るときの候補が表示された表示部4の表示内容を示す図
である。
【図4】 従来の音声認識装置の概略構成を示すブロッ
ク図である。
【符号の説明】 1 音声入力装置 2 音声認識部 3 認識結果保持部 4 表示部 5 修正部 6 音声保持部 7 入力装置
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G06F 15/20 512G

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力し、音声データに変換する音
    声入力装置と、 前記音声データを保持する音声保持部と、 前記音声入力装置から出力される音声データ又は前記音
    声保持部に保持された音声データを認識する音声認識部
    と、 前記音声認識部の認識結果を表示する表示部と、 操作者の修正範囲の指示を入力する入力装置と、 前記入力装置から入力される修正範囲の指示に基づい
    て、当該修正範囲の前記認識結果を修正する修正部とを
    具備することを特徴とする日本語文章作成装置。
  2. 【請求項2】 前記音声認識部の認識結果を保持する認
    識結果保持部を更に具備することを特徴とする請求項1
    記載の日本語文章作成装置。
  3. 【請求項3】 前記音声認識部は、前記音声入力装置か
    ら音声データが入力された場合には、当該音声データに
    基づいて認識し、前記入力装置から修正範囲の指示があ
    った場合には、前記音声保持部に保持された音声データ
    に基づいて認識を行うことを特徴とする請求項1記載の
    日本語文章作成装置。
  4. 【請求項4】 前記音声認識部が前記音声保持部に保持
    された音声データに基づいて認識を行った場合には、当
    該認識の結果が1つ又は複数前記表示部に表示されるこ
    とを特徴とする請求項3記載の日本語文章作成装置。
JP09323594A 1997-11-25 1997-11-25 日本語文章作成装置 Expired - Fee Related JP3104661B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP09323594A JP3104661B2 (ja) 1997-11-25 1997-11-25 日本語文章作成装置
US09/198,266 US6212497B1 (en) 1997-11-25 1998-11-24 Word processor via voice

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09323594A JP3104661B2 (ja) 1997-11-25 1997-11-25 日本語文章作成装置

Publications (2)

Publication Number Publication Date
JPH11161464A true JPH11161464A (ja) 1999-06-18
JP3104661B2 JP3104661B2 (ja) 2000-10-30

Family

ID=18156460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09323594A Expired - Fee Related JP3104661B2 (ja) 1997-11-25 1997-11-25 日本語文章作成装置

Country Status (2)

Country Link
US (1) US6212497B1 (ja)
JP (1) JP3104661B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001101162A (ja) * 1999-09-27 2001-04-13 Just Syst Corp 文書処理装置、及び文書処理プログラムが記憶された記憶媒体
WO2006028171A1 (ja) * 2004-09-09 2006-03-16 Pioneer Corporation データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体
WO2012144525A1 (ja) * 2011-04-21 2012-10-26 株式会社エヌ・ティ・ティ・ドコモ 音声認識装置、音声認識方法及び音声認識プログラム

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3543931B2 (ja) * 1998-12-17 2004-07-21 日本電気株式会社 音声認識による文字編集手段を有する移動通信端末装置
US7444286B2 (en) * 2001-09-05 2008-10-28 Roth Daniel L Speech recognition using re-utterance recognition
US7526431B2 (en) * 2001-09-05 2009-04-28 Voice Signal Technologies, Inc. Speech recognition using ambiguous or phone key spelling and/or filtering
US7809574B2 (en) 2001-09-05 2010-10-05 Voice Signal Technologies Inc. Word recognition using choice lists
US7467089B2 (en) * 2001-09-05 2008-12-16 Roth Daniel L Combined speech and handwriting recognition
US7505911B2 (en) * 2001-09-05 2009-03-17 Roth Daniel L Combined speech recognition and sound recording
US7412392B1 (en) 2003-04-14 2008-08-12 Sprint Communications Company L.P. Conference multi-tasking system and method
JP6169864B2 (ja) * 2012-03-21 2017-07-26 株式会社デンソーアイティーラボラトリ 音声認識装置、音声認識プログラム、及び、音声認識方法
KR101939253B1 (ko) * 2012-05-21 2019-01-16 엘지전자 주식회사 음성 녹음 중에 탐색을 용이하게 하는 방법 및 이를 구현한 전자기기
JP2014203207A (ja) * 2013-04-03 2014-10-27 ソニー株式会社 情報処理装置、情報処理方法及びコンピュータプログラム
US10002543B2 (en) * 2014-11-04 2018-06-19 Knotbird LLC System and methods for transforming language into interactive elements
US10733235B2 (en) 2015-06-09 2020-08-04 Patricia Henery Aid for dyslexic readers

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54148304A (en) 1978-05-15 1979-11-20 Toshiba Corp Monosyllable identication device
JPS61177573A (ja) 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPH01197797A (ja) 1988-02-02 1989-08-09 Ricoh Co Ltd 音節認識結果選択方式
JPH04254896A (ja) 1991-02-07 1992-09-10 Seiko Epson Corp 音声認識訂正装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001101162A (ja) * 1999-09-27 2001-04-13 Just Syst Corp 文書処理装置、及び文書処理プログラムが記憶された記憶媒体
WO2006028171A1 (ja) * 2004-09-09 2006-03-16 Pioneer Corporation データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体
WO2012144525A1 (ja) * 2011-04-21 2012-10-26 株式会社エヌ・ティ・ティ・ドコモ 音声認識装置、音声認識方法及び音声認識プログラム
JP2012226220A (ja) * 2011-04-21 2012-11-15 Ntt Docomo Inc 音声認識装置、音声認識方法及び音声認識プログラム

Also Published As

Publication number Publication date
US6212497B1 (en) 2001-04-03
JP3104661B2 (ja) 2000-10-30

Similar Documents

Publication Publication Date Title
JP4987623B2 (ja) ユーザと音声により対話する装置および方法
JP4444396B2 (ja) 音声認識におけるポジション操作
US6735565B2 (en) Select a recognition error by comparing the phonetic
JP3104661B2 (ja) 日本語文章作成装置
EP1693827A2 (en) Extensible speech recognition system that provides a user with audio feedback
JP4516112B2 (ja) 音声認識プログラム
JP2002091492A (ja) 音声補完方法、装置および記録媒体
JP2003022089A (ja) オーディオ専用インターフェースにおけるボイス・スペリング
JP2008051895A (ja) 音声認識装置および音声認識処理プログラム
CN110956020B (zh) 呈现校正候选的方法、存储介质和信息处理设备
JP4220151B2 (ja) 音声対話装置
JPH07181992A (ja) 文書読上げ装置及び方法
JPH04248596A (ja) 音声認識訂正装置
JPH1083195A (ja) 入力言語認識装置及び入力言語認識方法
JP3277579B2 (ja) 音声認識方法および装置
JP6340839B2 (ja) 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム
JP2000047683A (ja) セグメンテーション補助装置及び媒体
CN110955401B (zh) 声音回放区间控制方法、计算机可读存储介质和信息处理装置
JP2000330588A (ja) 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JP2007178692A (ja) 文字入力装置および方法
JP2004287756A (ja) 電子メール作成装置及び電子メール作成方法
JPH10143503A (ja) 音声ワードプロセッサ
JP2003122391A (ja) 音声認識装置およびその制御方法ならびにプログラム
JP2020118872A (ja) 情報入力システム及び方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000801

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080901

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080901

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090901

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090901

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100901

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110901

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120901

Year of fee payment: 12

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120901

Year of fee payment: 12

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120901

Year of fee payment: 12

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120901

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120901

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130901

Year of fee payment: 13

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees