JPH11161464A - 日本語文章作成装置 - Google Patents
日本語文章作成装置Info
- Publication number
- JPH11161464A JPH11161464A JP9323594A JP32359497A JPH11161464A JP H11161464 A JPH11161464 A JP H11161464A JP 9323594 A JP9323594 A JP 9323594A JP 32359497 A JP32359497 A JP 32359497A JP H11161464 A JPH11161464 A JP H11161464A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- recognition
- unit
- input device
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012937 correction Methods 0.000 claims abstract description 38
- 238000010586 diagram Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Document Processing Apparatus (AREA)
Abstract
効率よく音声から日本語文章を作成することができる日
本語文章作成装置を提供すること。 【解決手段】 音声を入力し、音声データに変換する音
声入力装置1と、音声データを保持する音声保持部6
と、音声入力装置から出力される音声データ又は音声保
持部に保持された音声データを認識する音声認識部2
と、音声認識部の認識結果を表示する表示部4と操作者
の修正範囲の指示を入力する入力装置7と、入力装置か
ら入力される修正範囲の指示に基づいて、当該修正範囲
の認識結果を修正する修正部5とを具備する。
Description
置に係り、特に音声から日本語の文章を作成する日本語
文章作成装置に関する。
音声認識装置が種々案出されている。この従来の音声認
識装置は、利用者の発する音声を認識してその結果をデ
ィスプレイ等に表示する。音声認識装置の認識率は必ず
しも100%であるわけでななく、音声認識装置の認識
結果を修正する必要がある。
示すブロック図である。図4に示されたように、従来の
音声認識装置は、音声入力装置1、音声認識部2、認識
結果保持部3、及び表示部4を有する。以上の構成要件
によって、音声入力装置1から入力された音声が音声認
識部2によって自動的に認識され、その認識結果が認識
結果保持部3に保持されるとともに、表示部4に表示さ
れる。
正内容を指示する入力装置7及び入力装置7によって指
示された内容に基づいて、認識結果保持部3に保持され
た認識結果を修正する修正部5を備える。修正を行う場
合には、まず、音声認識部2の認識した結果が表示部4
に表示され、誤認識の箇所があれば音が等しい正解とさ
れる候補を1つ又は2以上表示する。利用者は、表示部
4に表示された候補から正しい候補を入力装置7を操作
して選択し、修正することにより修正部5が認識結果保
持部3に保持された認識結果を保持するという方法が用
いられる。
る方法の詳細は、例えば、特開昭61−177573号
公報及び特開平1−197797号公報等に開示されて
いる。
において、離散発声ではなく、利用者が単語系列を流暢
に発声することを可能とする連続単語認識においては、
発声された単語系列の中の単語境界があいまいであるた
め単語の境界を特定することは困難であり、音声認識装
置が一つの単語を誤って複数の単語の列として認識する
ことがある。この場合、利用者が指定した単語の候補を
表示するような従来の修正方法では、一単語を別の候補
に修正することしかできず、一単語が複数の単語に誤認
識された場合にその単語の列を一単語に修正することは
不可能である。そのため、従来は、このような場合にお
いては、誤認識された箇所を利用者が削除して再入力し
なければならず効率よく音声により日本語の文章を作成
することができないという問題があった。
であり、一単語が複数の単語に誤認識された場合にも効
率よく音声から日本語文章を作成することができる日本
語文章作成装置を提供することを目的とする。
に、本発明は、音声を入力し、音声データに変換する音
声入力装置と、前記音声データを保持する音声保持部
と、前記音声入力装置から出力される音声データ又は前
記音声保持部に保持された音声データを認識する音声認
識部と、前記音声認識部の認識結果を表示する表示部
と、操作者の修正範囲の指示を入力する入力装置と、前
記入力装置から入力される修正範囲の指示に基づいて、
当該修正範囲の前記認識結果を修正する修正部とを具備
することを特徴とする。また、本発明は、前記音声認識
部の認識結果を保持する認識結果保持部を更に具備する
ことを特徴とする。また、本発明は、前記音声認識部
は、前記音声入力装置から音声データが入力された場合
には、当該音声データに基づいて認識し、前記入力装置
から修正範囲の指示があった場合には、前記音声保持部
に保持された音声データに基づいて認識を行うことを特
徴とする。また、本発明は、前記音声認識部が前記音声
保持部に保持された音声データに基づいて認識を行った
場合には、当該認識の結果が1つ又は複数前記表示部に
表示されることを特徴とする。
実施形態による日本語文章作成装置について詳細に説明
する。図1は、本発明の一実施形態による日本語文章作
成装置の構成を示すブロック図である。図1を参照する
と、図4に示された従来の技術と同様に、利用者の音声
を入力する音声入力装置1と、音声入力装置1から入力
された音声を認識する音声認識部2と、音声認識部2に
よって認識された結果を保持する認識結果保持部3と、
認識結果を表示する表示部4とを備える。
件以外に、認識結果の修正を行う修正部5と、入力され
た音声を保持しておく音声保持部6と、キーボード・マ
ウス等の入力装置7を含む。
け取りその音声データを音声認識部2に渡す役割を行
う。音声認識部2は、入力された音声データに対して音
声認識を行い、認識結果を認識結果保持部3に送ると同
時に入力された音声データを音声保持部6に送る。
られてきた認識結果を保持する。表示部4は、認識結果
保持部3を参照して認識結果を表示する。修正部5は、
入力装置7を介して利用者から修正の指示が送られてき
た時に認識結果保持部3の内容の修正や、音声認識部2
に対して再認識の指示を行う。
保持しておく。入力装置7は、利用者の操作を受け取
り、それが認識結果の修正を指示する操作であればその
指示内容を修正部5に送る。
章作成装置の動作について説明する。まず、利用者が音
声入力装置1に対して音声を入力すると音声データに変
換され、その音声データは音声認識部2へ出力される。
音声認識部2は入力される音声データを処理し、認識結
果を認識結果保持部3へ出力する。また同時に音声認識
部2は音声データを音声保持部6へ出力する。音声認識
部3から認識結果保持部3へ出力された認識結果、及び
音声認識部3から音声保持部6へ出力された音声データ
はそれぞれ保持される。尚、上記認識結果は、1つの認
識結果のみが含まれているのではなく、1つ又は2以上
の候補も含まれている。
結果保持部3に記憶されている候補のうち第1候補を表
示する。利用者は表示部4に表示された結果を見て必要
であれば入力装置7を使用して修正を指示する。修正部
5は入力装置7を通して利用者の修正指示を受け取り、
修正を行う。
正する指示であれば、従来技術と同様に修正部5は認識
結果保持部3に保持された認識結果のうち、その一単語
のみを修正する。ここで、利用者が、例えば「記録ノー
ト」と発声し、誤認識され「記録の音」と表示されたと
する。図2は、誤認識時における表示部4の表示内容を
示す図である。
音」の部分を一単語の「ノート」に修正するため、「の
音」の部分に対して修正指示を出す。ここでは仮に、利
用者が「の音」の部分に対して入力装置7のマウスをド
ラッグすることにより選択したとする。この時、修正部
5は利用者により選択された部分を一単語とみなして認
識結果を修正するよう音声認識部2に指示を出す。
は例えば音声保持部6より「の音」に相当する部分の音
声データを読み出し、離散単語認識を行う。音声認識部
2はその結果を認識結果保持部3へ送り、以前の「の
音」の認識結果と置き換える。表示部4は認識結果保持
部3より認識結果を読み出し、修正された認識結果を候
補ウィンドウ9(図3参照)内に表示する。図3は、複
数の単語に誤認識された認識結果を修正するときの候補
が表示された表示部4の表示内容を示す図である。
ート」、「ノード」、「モード」などが表示され、利用
者は「ノート」を選択することで誤認識を正しく修正す
ることができる。なお、以上説明した本発明の一実施形
態による日本語文章作成装置では、利用者の修正指示方
法の例としてマウスでドラッグして選択することを挙げ
たが、この限りではなく例えばキーボードでの選択や音
声コマンドによる指示などでもよい。
方法も、上記では指定された範囲に対応する音声部分を
離散単語認識するとしたがこの限りではなく、例えば認
識結果保持部3に保持されている最初の認識結果の中
に、利用者により範囲指定された部分が一単語となって
いる候補を検索して表示してもよい。また、上記では修
正された認識結果を候補ウィンドウに表示するとした
が、修正された認識結果のうちの第一候補のみを表示す
る方法でも構わない。
ば、利用者によって指示された修正範囲に対し、当該範
囲を一つの単語とみなして認識するため、連続単語認識
された結果に対して、誤って分割されて認識された単語
列を一つの単語として修正することができるという効果
がある。この結果、削除して再入力するという手間が省
け、音声入力を効率よく行うことができるという効果が
得られる。
置の構成を示すブロック図である。
図である。
るときの候補が表示された表示部4の表示内容を示す図
である。
ク図である。
Claims (4)
- 【請求項1】 音声を入力し、音声データに変換する音
声入力装置と、 前記音声データを保持する音声保持部と、 前記音声入力装置から出力される音声データ又は前記音
声保持部に保持された音声データを認識する音声認識部
と、 前記音声認識部の認識結果を表示する表示部と、 操作者の修正範囲の指示を入力する入力装置と、 前記入力装置から入力される修正範囲の指示に基づい
て、当該修正範囲の前記認識結果を修正する修正部とを
具備することを特徴とする日本語文章作成装置。 - 【請求項2】 前記音声認識部の認識結果を保持する認
識結果保持部を更に具備することを特徴とする請求項1
記載の日本語文章作成装置。 - 【請求項3】 前記音声認識部は、前記音声入力装置か
ら音声データが入力された場合には、当該音声データに
基づいて認識し、前記入力装置から修正範囲の指示があ
った場合には、前記音声保持部に保持された音声データ
に基づいて認識を行うことを特徴とする請求項1記載の
日本語文章作成装置。 - 【請求項4】 前記音声認識部が前記音声保持部に保持
された音声データに基づいて認識を行った場合には、当
該認識の結果が1つ又は複数前記表示部に表示されるこ
とを特徴とする請求項3記載の日本語文章作成装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09323594A JP3104661B2 (ja) | 1997-11-25 | 1997-11-25 | 日本語文章作成装置 |
US09/198,266 US6212497B1 (en) | 1997-11-25 | 1998-11-24 | Word processor via voice |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09323594A JP3104661B2 (ja) | 1997-11-25 | 1997-11-25 | 日本語文章作成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11161464A true JPH11161464A (ja) | 1999-06-18 |
JP3104661B2 JP3104661B2 (ja) | 2000-10-30 |
Family
ID=18156460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09323594A Expired - Fee Related JP3104661B2 (ja) | 1997-11-25 | 1997-11-25 | 日本語文章作成装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6212497B1 (ja) |
JP (1) | JP3104661B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001101162A (ja) * | 1999-09-27 | 2001-04-13 | Just Syst Corp | 文書処理装置、及び文書処理プログラムが記憶された記憶媒体 |
WO2006028171A1 (ja) * | 2004-09-09 | 2006-03-16 | Pioneer Corporation | データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体 |
WO2012144525A1 (ja) * | 2011-04-21 | 2012-10-26 | 株式会社エヌ・ティ・ティ・ドコモ | 音声認識装置、音声認識方法及び音声認識プログラム |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3543931B2 (ja) * | 1998-12-17 | 2004-07-21 | 日本電気株式会社 | 音声認識による文字編集手段を有する移動通信端末装置 |
US7444286B2 (en) * | 2001-09-05 | 2008-10-28 | Roth Daniel L | Speech recognition using re-utterance recognition |
US7526431B2 (en) * | 2001-09-05 | 2009-04-28 | Voice Signal Technologies, Inc. | Speech recognition using ambiguous or phone key spelling and/or filtering |
US7809574B2 (en) | 2001-09-05 | 2010-10-05 | Voice Signal Technologies Inc. | Word recognition using choice lists |
US7467089B2 (en) * | 2001-09-05 | 2008-12-16 | Roth Daniel L | Combined speech and handwriting recognition |
US7505911B2 (en) * | 2001-09-05 | 2009-03-17 | Roth Daniel L | Combined speech recognition and sound recording |
US7412392B1 (en) | 2003-04-14 | 2008-08-12 | Sprint Communications Company L.P. | Conference multi-tasking system and method |
JP6169864B2 (ja) * | 2012-03-21 | 2017-07-26 | 株式会社デンソーアイティーラボラトリ | 音声認識装置、音声認識プログラム、及び、音声認識方法 |
KR101939253B1 (ko) * | 2012-05-21 | 2019-01-16 | 엘지전자 주식회사 | 음성 녹음 중에 탐색을 용이하게 하는 방법 및 이를 구현한 전자기기 |
JP2014203207A (ja) * | 2013-04-03 | 2014-10-27 | ソニー株式会社 | 情報処理装置、情報処理方法及びコンピュータプログラム |
US10002543B2 (en) * | 2014-11-04 | 2018-06-19 | Knotbird LLC | System and methods for transforming language into interactive elements |
US10733235B2 (en) | 2015-06-09 | 2020-08-04 | Patricia Henery | Aid for dyslexic readers |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS54148304A (en) | 1978-05-15 | 1979-11-20 | Toshiba Corp | Monosyllable identication device |
JPS61177573A (ja) | 1985-02-04 | 1986-08-09 | Matsushita Electric Ind Co Ltd | 日本語文章作成装置 |
JPH01197797A (ja) | 1988-02-02 | 1989-08-09 | Ricoh Co Ltd | 音節認識結果選択方式 |
JPH04254896A (ja) | 1991-02-07 | 1992-09-10 | Seiko Epson Corp | 音声認識訂正装置 |
-
1997
- 1997-11-25 JP JP09323594A patent/JP3104661B2/ja not_active Expired - Fee Related
-
1998
- 1998-11-24 US US09/198,266 patent/US6212497B1/en not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001101162A (ja) * | 1999-09-27 | 2001-04-13 | Just Syst Corp | 文書処理装置、及び文書処理プログラムが記憶された記憶媒体 |
WO2006028171A1 (ja) * | 2004-09-09 | 2006-03-16 | Pioneer Corporation | データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体 |
WO2012144525A1 (ja) * | 2011-04-21 | 2012-10-26 | 株式会社エヌ・ティ・ティ・ドコモ | 音声認識装置、音声認識方法及び音声認識プログラム |
JP2012226220A (ja) * | 2011-04-21 | 2012-11-15 | Ntt Docomo Inc | 音声認識装置、音声認識方法及び音声認識プログラム |
Also Published As
Publication number | Publication date |
---|---|
US6212497B1 (en) | 2001-04-03 |
JP3104661B2 (ja) | 2000-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4987623B2 (ja) | ユーザと音声により対話する装置および方法 | |
JP4444396B2 (ja) | 音声認識におけるポジション操作 | |
US6735565B2 (en) | Select a recognition error by comparing the phonetic | |
JP3104661B2 (ja) | 日本語文章作成装置 | |
EP1693827A2 (en) | Extensible speech recognition system that provides a user with audio feedback | |
JP4516112B2 (ja) | 音声認識プログラム | |
JP2002091492A (ja) | 音声補完方法、装置および記録媒体 | |
JP2003022089A (ja) | オーディオ専用インターフェースにおけるボイス・スペリング | |
JP2008051895A (ja) | 音声認識装置および音声認識処理プログラム | |
CN110956020B (zh) | 呈现校正候选的方法、存储介质和信息处理设备 | |
JP4220151B2 (ja) | 音声対話装置 | |
JPH07181992A (ja) | 文書読上げ装置及び方法 | |
JPH04248596A (ja) | 音声認識訂正装置 | |
JPH1083195A (ja) | 入力言語認識装置及び入力言語認識方法 | |
JP3277579B2 (ja) | 音声認識方法および装置 | |
JP6340839B2 (ja) | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム | |
JP2000047683A (ja) | セグメンテーション補助装置及び媒体 | |
CN110955401B (zh) | 声音回放区间控制方法、计算机可读存储介质和信息处理装置 | |
JP2000330588A (ja) | 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体 | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
JP2007178692A (ja) | 文字入力装置および方法 | |
JP2004287756A (ja) | 電子メール作成装置及び電子メール作成方法 | |
JPH10143503A (ja) | 音声ワードプロセッサ | |
JP2003122391A (ja) | 音声認識装置およびその制御方法ならびにプログラム | |
JP2020118872A (ja) | 情報入力システム及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000801 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080901 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080901 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090901 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090901 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100901 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110901 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120901 Year of fee payment: 12 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120901 Year of fee payment: 12 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120901 Year of fee payment: 12 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120901 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120901 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130901 Year of fee payment: 13 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |