JPS62113264A - 音声文書作成装置 - Google Patents

音声文書作成装置

Info

Publication number
JPS62113264A
JPS62113264A JP60253206A JP25320685A JPS62113264A JP S62113264 A JPS62113264 A JP S62113264A JP 60253206 A JP60253206 A JP 60253206A JP 25320685 A JP25320685 A JP 25320685A JP S62113264 A JPS62113264 A JP S62113264A
Authority
JP
Japan
Prior art keywords
input
speech
audio
file
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60253206A
Other languages
English (en)
Other versions
JP2723214B2 (ja
Inventor
Yoichi Takebayashi
洋一 竹林
Hiroyuki Tsuboi
宏之 坪井
Hiroshi Kanazawa
金沢 博史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60253206A priority Critical patent/JP2723214B2/ja
Publication of JPS62113264A publication Critical patent/JPS62113264A/ja
Application granted granted Critical
Publication of JP2723214B2 publication Critical patent/JP2723214B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は音声入力による文書作成を効率良く行うことの
できる音声文書作成装置に関する。
(発明の技術的背鯛とその問題点) 筆記することにより行われる。
一方、多忙な文書作成者にあっては、速記者を利用して
口述筆記によって文書作成したり、作成文1情報をテー
プレコーダ等に音声入力し、これを秘書により画面化さ
せる等して文書作成が行われる。
これに対して最近では、日本語ワードプロセッサの普及
に伴い、例えばキーボード操作による文書情報の一括入
力方式で、簡易に文書作成が行われるようになってきて
いる。
ところが文書情゛報の最も自然な入力手段は音声入力で
あり、キーボード等の煩わしい操作が全く不要である。
そこで、音声入力による文書作成装置、つまり音声ワー
ドプロセッサの開発が種々試みられている。
さて、この種の音声ワードプロセッサは、情報処理技術
および半導体製造技術の発展を背景として、その実用化
の研究が進められているものである。
ところが音声認識技術は、例えば工場の製品管理工程で
特定話者認識技術として、また電話サービス等における
限られた認識対象に対する不特定話者認識技術として実
用化されているに過ぎない。
つまり音声認識は、入力音声の種々の変動要因を考慮し
て認識処理する必要がある。この為、その認識性能の向
上を図るべく、認識処理方式に対する種々の工夫が試み
られ、その認識性能が徐々に高められつつある。
しかし人間にとっても会話において誤認識が生じるよう
に、音声認識装置において100%完全な認識率を達成
することは到底困難である。これ故、音声入力によって
文書作成した場合、筆記による文書作成時にも増して、
作成文書情報の厳密なチェックが必要となる。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、音声入力により効果的に文書作
成し、且つその作成文書の編集チェックを簡易に、且つ
効率良く行うことのできる音声文書作成装置を提供する
ことにある。
〔発明の概要〕
本発明は、単語、分節、旬または文等からなる所定の古
語単位で発声入力された音声を分析し、その分析結果を
音声辞書と照合して、音禁または音素等からなる所定の
音声処理単位に対する認識候補を求め、この認識候補の
系列を言語辞書と照合して前記所定の言語単位の入力音
声に対する認識結果を求め、この認識結果を文書ファイ
ルに記憶して文書を作成する音声文書作成装置において
、上記認識結果を得た前記所定の言語単位の入力音声デ
ータを該認識結果に対応して音声ファイルに記憶し、こ
の音声ファイルに記憶された入力音声データを、例えば
前記言語単位で選択的に再生して作成文書情報のチェッ
ク処理に利用するようにしたものである。
また前記文書ファイルに記憶された認識結果を規則合成
処理して音声出力するようにし、この認識結果の規則合
成による再生出力と前記入力音声データの再生出力との
対比によって上記チェック処理の容易化を図るようにし
たものである。
〔発明の効果〕
かくして本発明によれば、認識結果に応じて、その認識
結果を得た入力音声を再生し、これを七二りして上記認
識結果をチェックすることができるので、音声入力によ
り作成された文書情報のチェック処理、およびその修正
処理等を簡易に、且つ効率良く行うことが可能となる。
しかも入力音声が、その認識結果に対応して記憶され、
適宜これを再生することができるので、音声入力による
文書作成を一括して行うことができ、その文書作成効率
の向上を図ることが可能となる等の実用上多大なる効果
が奏せられる。
〔発明の実施例〕
以下、図面を参照して発明の一実施例装置につき説明す
る。
図は実施例装置の概略構成図であり、1はマイクロフォ
ンや増幅器等からなる音声入力部である。
この音声入力部1から入力される音声情報は、音声検出
部2にて音声区間検出される。制皿部3はこの音声区間
検出情報に従って以下に説明する音声認識処理の実行等
を制御する。
音声入力ailiから認識対象とする音声が入力される
と、例えば複数チャンネルのバンドパスフィルタ群から
なる音声分析部4は、その入力音声のスペクトル成分を
検出する等して該入力音声の特徴パラメータを求めてい
る。音声認識部5は、上記特徴パラメータの時系列から
その特徴ベクトルを検出し、その特徴ベクトルと音声辞
書6とを照合して各1M31対像カテゴリに対する類似
度を計算する等して、該入力音声を認識処理している。
言語処理部8は、このようにして求められる入力音声の
認識結果の系列を、言語辞I8を参照して言tB的に検
定し、例えば複数の認識候補の組合せから言語的に成立
する認識結果系列を、前記入力音声によって示される作
成文書情報として得ている。
このようにしてaSS理された1m結果が、ファイル管
理部9の管理の下で文17Fイル10に順に格納される
一方、入力音声に対する認識結果が文書ファイル10に
格納されるとき、その認識結果を得た前記入力音声、或
いはこの入力音声を分析処理してなる音声データが上記
a識結果に対応して音声ファイル11に格納される。こ
の音声ファイル11は、例えば入力音声データをディジ
タル化して記憶し、その記憶音声データを選択的に読出
して再生出力するものである。
しかして、文書作成に供する音声を一括入力し、その入
力音声に対する認識処理が終了すると、オペレータとの
対話形インターフェース部を形成する表示部12にて前
記文書ファイル10に格納された認識結果(作成された
文書情報)を表示し、そのチェックが行われる。
ここで、その表示された認識結果に対して、その認識結
果を得た入力音声を参照したい場合には、音声出力指示
部13から入力音声の参照を行うべき認識結果の特定と
、その入力音声の参照指示が与えられる。この指示情報
は、前記制御部3に与えられると共に、前記音声ファイ
ル11に与えられる。
この結果、前記ファイル管理部9のυ11INの下で、
前記音声ファイル11から上記指定された認識結果に対
応する入力音声データが音声出力部14に読出され、該
入力音声が再生出力される。この再生出力された音声に
よって、オペレータは認識結果の合否を判定して適宜そ
の修正を行うことになる。
この認識結果の修正は、例えば正しい認識カテゴリをキ
ーボード入力する等して行われ、この人力データによっ
て前記文書ファイル11に格納された該当認識結果が修
正されることになる。
尚、音声出力部14から出力された音声に従って、前記
文書ファイル10に格納された文1情報(認識結果)編
集処理が必要な場合には、その編集情報が編集情報入力
部15から入力される。この入力された編集情報に従っ
て前記ファイル管理部9の制御の下で、前記文書ファイ
ル10に格納された文書情報のIa集が行われる。この
場合、文書ファイル10に格納された認識結果の編集作
業に伴って、音声ファイル11に格納された音声データ
も、その認識結果に対応して編集処理される。
ところで本装置にあっては、必要に応じて前記文書ファ
イル10に格納された認識結果を規則合成部16に読出
し、該認識結果を規則合成処理してその音声データが求
められるようになっている。そしてその規則合成された
音声データを音声出力部17を介して音声出力し得るも
のとなっている。
この機能は、認識処理した結果を音声によってチェック
する場合に用いられるもので、例えば文書ファイル10
に格納された認識結果の系列が言語処理単位で順に規則
合成されて出力されるようになっている。この場合、制
御部3は、規則合成して音声出力した認識結果に対して
その認識結果を得た入力音声の参照が指示されると、上
記認識結果の規則合成による音声出力を打切る。そして
その打切られた音声の言より処理単位の数中位前の入力
音声データからの再生を開始する。
つまり、ファイル管理部9の制御の下で文書ファイル1
0からの認識結果を所定の言語単位毎に読出し、これを
規則合成して音声出力している時点で入力音声の参照が
指示されると、上記文古ファイル10からの認識結果の
読出しに代えて、前記音声ファイル11からの入力音声
データの読出しを開始する。この音声ファイル11から
の音声データの読出しは、上記認識結果の読出しの中止
が指示された言語処理単位の数単位前の言語処理単位か
ら行われる。
この結果、オペレータは、認識結果の音声出力を得た後
、その認識結果を得た入力音声を繰返し得ることが可能
となり、これによってその照合が行われる。
このように本装画によれば、入力音声を1!!識処理し
、その認識結果を順次文書ファイル10に格納する際に
、同時にその認識結果を得た入力音声データをg声ファ
イル11に格納し、これらを所定の言語処理単位で相互
に対応させて管理しているので、認識結果をチェック時
に、その認識結果を得た入力音声を容易に参照すること
が可能となる。
しかも所定の言語処理単位で、任意に入力音声を参照す
ることが可能となる。
故に、文書作成に供する音声データを一括入力し、その
認識処理を行わせた後、入力音声を適宜参照して認識結
果のチェックを簡易に、且つ効果的に行うこが可能とな
る。従って、音声の発声入力者が自ら認りI結果のチェ
ックを行うことが可能なことはもとより、秘1等の第3
者によって作成文書のチェックを行うことが可能となる
等、実用上多大なる効果が奏せられる。
尚、前記音声ファイル11に分析処理された入力音声デ
ータを格納する場合には、その分析音声データに従って
入力音声を再合成する処理が必要となることは云うまで
もない。また入力音声の認識処理方式や、入力音声デー
タの記憶形態等は、装置の仕様に応じて定めれば良いも
のである。要するに本発明は、その要旨を逸脱しない範
囲で種々変形して実施することができる。
【図面の簡単な説明】
図は本発明の一実施例装置の概略構成図である。 1・・・音声入力部、2・・・音声検出部、3・・・制
御部、4・・・音声分析部、5・・・音声11部、6・
・・音声辞書、7・・・言語処理部、8・・・言語辞1
.9・・・ファイル管理部、10・・・文書ファイル、
11・・・音声ファイル、12・・・表示部、13・・
・音声出力指示部、14・・・音声出力部、15・・・
編集情報入力部、1G・・・規則合成部、11・・・音
声出力部。

Claims (6)

    【特許請求の範囲】
  1. (1)所定の言語単位で発声入力された音声を分析する
    手段と、この音声の分析結果を音声辞書と照合して所定
    の音声処理単位に対する認識候補を求める手段と、この
    認識候補の系列を言語辞書と照合して前記所定の言語単
    位の入力音声に対する認識結果を求める手段と、この認
    識結果を記憶する文書ファイルと、上記認識結果を得た
    前記所定の言語単位の入力音声データを該認識結果に対
    応して記憶する音声ファイルと、この音声ファイルに記
    憶された入力音声データを再生して文書作成処理に利用
    する手段とを具備したことを特徴とする音声文書作成装
    置。
  2. (2)音声入力される所定の言語単位は、単語、分節、
    句または文等からなるものであり、音声辞書との照合に
    供される音声処理単位は、音声または音素等からなるも
    のである特許請求の範囲第1項記載の音声文書作成装置
  3. (3)音声ファイルに記憶された入力音声データは、選
    択的に再生されるものである特許請求の範囲第1項記載
    の音声文書作成装置。
  4. (4)文書ファイルに記憶された認識結果は、規則合成
    処理が施されて音声出力されるものである特許請求の範
    囲第1項記載の音声文書作成装置。
  5. (5)認識結果の規則合成による音声出力は、音声ファ
    イルからの入力音声データの再生と選択的に行われるも
    のである特許請求の範囲第4項記載の音声文書作成装置
  6. (6)入力音声データの再生、および認識結果の規則合
    成による再生は、入力された音声の所定の言語単位で行
    われるものである特許請求の範囲第1項または第4項記
    載の音声文書作成装置。
JP60253206A 1985-11-12 1985-11-12 音声文書作成装置 Expired - Lifetime JP2723214B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60253206A JP2723214B2 (ja) 1985-11-12 1985-11-12 音声文書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60253206A JP2723214B2 (ja) 1985-11-12 1985-11-12 音声文書作成装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP9086476A Division JP2835320B2 (ja) 1997-04-04 1997-04-04 音声文書作成装置

Publications (2)

Publication Number Publication Date
JPS62113264A true JPS62113264A (ja) 1987-05-25
JP2723214B2 JP2723214B2 (ja) 1998-03-09

Family

ID=17248027

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60253206A Expired - Lifetime JP2723214B2 (ja) 1985-11-12 1985-11-12 音声文書作成装置

Country Status (1)

Country Link
JP (1) JP2723214B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63317874A (ja) * 1987-06-19 1988-12-26 Sanyo Electric Co Ltd デイクテ−テイングマシン
JPH01161431A (ja) * 1987-12-17 1989-06-26 Sanyo Electric Co Ltd 文章作成システム
JPH02289026A (ja) * 1989-03-20 1990-11-29 Fujitsu Ltd 音声ワードプロセッサ

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54136134A (en) * 1978-04-13 1979-10-23 Toshiba Corp Aural typewriter
JPS59180629A (ja) * 1983-03-30 1984-10-13 Comput Basic Mach Technol Res Assoc 日本語音声入力装置
JPS59206238A (ja) * 1983-05-09 1984-11-22 Tokai Rika Co Ltd 車輌用ル−ムミラ−
JPS6059416A (ja) * 1983-09-12 1985-04-05 Toshiba Corp 日本語情報入力方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54136134A (en) * 1978-04-13 1979-10-23 Toshiba Corp Aural typewriter
JPS59180629A (ja) * 1983-03-30 1984-10-13 Comput Basic Mach Technol Res Assoc 日本語音声入力装置
JPS59206238A (ja) * 1983-05-09 1984-11-22 Tokai Rika Co Ltd 車輌用ル−ムミラ−
JPS6059416A (ja) * 1983-09-12 1985-04-05 Toshiba Corp 日本語情報入力方式

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63317874A (ja) * 1987-06-19 1988-12-26 Sanyo Electric Co Ltd デイクテ−テイングマシン
JPH01161431A (ja) * 1987-12-17 1989-06-26 Sanyo Electric Co Ltd 文章作成システム
JPH02289026A (ja) * 1989-03-20 1990-11-29 Fujitsu Ltd 音声ワードプロセッサ

Also Published As

Publication number Publication date
JP2723214B2 (ja) 1998-03-09

Similar Documents

Publication Publication Date Title
US7280968B2 (en) Synthetically generated speech responses including prosodic characteristics of speech inputs
JP3610083B2 (ja) マルチメディアプレゼンテーション装置および方法
EP0887788B1 (en) Voice recognition apparatus for converting voice data present on a recording medium into text data
KR20000057795A (ko) 음독이 미숙한 자용 및 표시기가 없는 장치용 음성 인식등록 방법 및 장치
JPS62239231A (ja) 口唇画像入力による音声認識方法
US8155963B2 (en) Autonomous system and method for creating readable scripts for concatenative text-to-speech synthesis (TTS) corpora
JPH08212228A (ja) 要約文作成装置および要約音声作成装置
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
JP2001282277A (ja) 音声情報処理装置及びその方法と記憶媒体
JPS62113264A (ja) 音声文書作成装置
Moëll et al. Speech data augmentation for improving phoneme transcriptions of aphasic speech using wav2vec 2.0 for the psst challenge
JPS6184771A (ja) 音声入力装置
JP2835320B2 (ja) 音声文書作成装置
JP3060276B2 (ja) 音声合成装置
Olson et al. Speech processing techniques and applications
Vadapalli An investigation of speaker independent phrase break models in End-to-End TTS systems
JP2612030B2 (ja) 文章読み上げ装置
Louw et al. The Speect text-to-speech system entry for the Blizzard Challenge 2013
JPS62119591A (ja) 文章読上げ装置
JP2001042883A (ja) テキスト音声合成装置
JP2757356B2 (ja) 単語音声認識方法および装置
JPS613241A (ja) 音声確認方式
JP2003173196A (ja) 音声合成方法およびその装置
JPH02251998A (ja) 音声合成装置
JP3363636B2 (ja) 音声合成に関わるアクセント制御装置及び方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term