JP2000250584A - ディクテーション装置およびディクテーション方法 - Google Patents

ディクテーション装置およびディクテーション方法

Info

Publication number
JP2000250584A
JP2000250584A JP11047132A JP4713299A JP2000250584A JP 2000250584 A JP2000250584 A JP 2000250584A JP 11047132 A JP11047132 A JP 11047132A JP 4713299 A JP4713299 A JP 4713299A JP 2000250584 A JP2000250584 A JP 2000250584A
Authority
JP
Japan
Prior art keywords
voice
screen
input
dictation
machine language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11047132A
Other languages
English (en)
Inventor
Chiyuko Yasujima
知郁子 安島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP11047132A priority Critical patent/JP2000250584A/ja
Publication of JP2000250584A publication Critical patent/JP2000250584A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】専門分野、例えば技術分野における論文であっ
ても容易にかつ速やかにディクテーションによってかな
漢字のテキスト文章とすることにある。 【解決手段】音声を入力し、入力した音声を機械語とし
て認識して画面に入力音声に対応して表示する音声認識
装置1を備え、この音声認識装置1は、音声を入力して
記録し、音声再生するレコーダー部3を有し、一体形ま
たは結合形のマイクロフォン4を有し、前記音声認識装
置1は前記マイクロフォン4を介して入力されて前記レ
コーダー部3に記録し、音声再生可能な音声に対応する
音声を表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力音声を文章と
して再生するディクテーション装置およびディクテーシ
ョン方法に関する。
【0002】
【従来の技術】喋った言葉を直接かな漢字まじりテキス
ト文に変換する音声による文章入力、いわゆるディクテ
ーション装置が一般に使用され、普及しつつある。様々
な騒音環境に素早く適合し、工場やオフィス、家庭など
の常に変化する環境に応じて高い認識で実用に供されて
いる。
【0003】
【発明が解決しようとする課題】オペレータ(話者)の
特徴を理解・学習することで、より速く、より正確なレ
スポンスが期待され、認識方法に適した辞書の採用が考
慮され、音声データに合致させることが行われている。
【0004】従来の装置・方法によれば、ディクテイタ
ーを固定することによって日常会話、日常使用文章、新
聞・雑誌文章などは速く、正確なレスポンスが行われる
ところである。しかしながら、専門分野、例えば工業・
産業上の技術文章などについてはその特異な専門性が故
に必ずしも認識率が高いとは言えず、実用されるところ
ではない。
【0005】まして、特許出願用の明細書のように発明
毎に発明者が異なる、つまりディクテイターが異なるよ
うな場合、実用され得るものではなかった。
【0006】一方テープレコーダあるいはCD ROM
などの装置はきわめて正確に記録され、ライターによる
耳を介しての人間の認識をそのまま文章にすることが行
われていて威力を発揮している。この方法によれば、ラ
イターは予め耳に入ってくる音声のいくつかについて、
かなあるいは漢字を認識しているためにかなりの精度で
文章化が可能である。しかしながら、この文章化にはか
なりの技術を要し、コンピュータを容易に操作できる人
であっても話しスピードと同一速度で文章化していくこ
とは不可能と言わざるを得ない。
【0007】本発明は、音声認識装置の機能を音声記録
装置による正確な記録を活用することによって充実し、
専門性のある音声であっても速やかにかな漢字まじりの
テキストに変換することのできる装置および方法を提供
することを目的とする。
【0008】
【課題を解決するための手段】本発明は、音声認識装置
に音声記録機能を持たせて、画面表示すると共に、記録
された音声(機械語として認識された音声ではない)を
再生し、ライターが害再生音声を基に画面上の文章を直
ちに修正するようにしたものである。専門分野における
技術論文には通常、文章は図面に沿って構成される。
【0009】例えば、特許の分野にあっては出願書類に
明細書および図面が添付される。ライターは、この図面
およびこの図面に記入された番号および部品名を認識し
ておくことによって再生された音声に該当するかな漢字
を精確に認識することが可能であり、再生された音声と
同一の機械語文章が並ぶ画面を見て、画面上の機械語文
章を音声認識装置の有する修正機能を使用して直ちに修
正することができる。修正された文章は画面上に表示さ
れると共にテキスト文として用紙に印字される。
【0010】本発明は、具体的には次に掲げる装置およ
び方法を提供する。
【0011】本発明は、音声を入力し、入力した音声を
機械語として認識して画面に入力音声に対応して表示す
る音声認識装置を備えたディクテーション装置におい
て、前記音声認識装置は、音声を入力して記録し、音声
再生する音声記録部を有し、一体形または結合形のマイ
クロフォンを有し、前記音声認識装置は、前記マイクロ
フォンを介して入力されて前記音声記録部に記録し、音
声再生可能な音声に対応する音声を表示するものである
ディクテーション装置を提供する。
【0012】本発明は、音声を入力し、入力した音声を
機械語として認識して画面に入力音声に対応して表示す
る音声認識装置を備えたディクテーション装置におい
て、前記音声認識装置は、音声を入力して記録し、音声
再生する音声記録部を有し、一体形または結合形のマイ
クロフォンを有し、前記音声認識装置は、前記マイクロ
フォンを介して入力されて前記音声記録部に記録し、音
声再生可能な音声に対応する音声を表示すると共に、前
記音声記録部に記録された音声のいくつかを単語として
入力表示するものであるディクテーション装置を提供す
る。
【0013】本発明は、音声を入力し、入力した音声を
機械語として認識して画面に入力音声に対応して表示す
る音声認識装置を使用するディクテーション方法におい
て、マイクロフォンを介して音声入力して一方は、機械
語として認識して画面表示し、同時に同じ音声によっ
て、他方は対応の文章を音声記録し、記録された音声に
基づいて、音声再生しながら画面表示の機械語文章の修
正を行うディクテーション方法を提供する。
【0014】
【発明の実施の形態】以下、本発明にかかる一実施例を
図面に基づいて説明する。
【0015】図1は、本発明の実施例の概略構成を示
す。
【0016】図において、ディクテーション装置は音声
認識装置1を備え、この音声認識装置1は、音声認識部
2および音声記録部(レコーダ)3およびマイクロフォ
ン4を有する。マイクロフォン4は一体形または結合形
として構成されており、発声された音声は同時に同じ話
し言葉として音声認識部2および音声記録部3に音声入
力部5、音声入力部11を介してそれぞれ入力される。
【0017】音声認識部2では、入力された音声は音声
認識制御部6において、音声の特徴が抽出され、騒音対
応制御がなされ、認識プロセス制御によって機械語とし
て認識される。この制御は一般的に知られるところであ
る。この機械語への変換には辞書部8で記憶した辞書が
使用される。
【0018】認識された機械語は、表示処理部7で表示
のための処理がなされ、図面部10において、画面表示
される。表示される画面は登録部9に登録される。
【0019】この段階で発明者による次の文章を音声認
識により画面表示すると次のようになる。一例を示す。
【0020】音声入力の例:“電子線源で発生した電子
線を静電レンズによって所定の電圧まで加速し、加速さ
れた電子線を収束レンズと対物レンズによって試料に平
行に照射し、偏向コイルによって電子線の試料に対する
入射角度を変更し、投影レンズによって試料の透過度を
拡大し、画像強度を撮影装置にて検出する電子顕微鏡装
置”
【0021】音声認識され機械語文章として画面表示さ
れる例:“電子線減で発生した電子線を静電レンズによ
って所定の電圧まで加速し、加速された電子線を集束レ
ンズと対物レンズによって市場に平行に照射し、変更コ
イルによって電子線の市場に対する入社角度を変更し、
東映レンズによって治療の透過度を拡大し、仮想共同を
撮影装置に摘出する電子顕微鏡装置。”
【0022】一方、音声記録部3にあっては、音声入力
部11に同時に入力された音声は、音声記録部12でテ
ープあるいはCD ROM手段によって精確に記録さ
れ、いつでも音声再生部13で再生可能とされる。テー
プレコーダあるいはCDプレーヤは周知事項であり、そ
の内容についてはこれ以上説明を要しない。
【0023】ライターは、図面部10に表示された画面
に表示された機械語による文章を再生した音声に基づい
て修正を加える。この場合に、図面部には同一の図面ま
たは図面を切換えて関連した機械・プラント・ブロック
・フローチャートなど図面が表示されてよい。この図面
には部品名が表示されるようにしておくことが望まし
く、このようにすることによって音声再生された言葉の
正しい単語であるかな漢字によって前述した機械語によ
る文章を修正することができる。
【0024】図2は、このような修正を行う場合のフロ
ーチャートを示す。
【0025】図において、一体化あるいは結合されたマ
イクロフォン4から音声が音声認識部2および音声記録
部3に同時に入力される(S1)。入力された音声は、
機械語に変換され(S2)、画面表示される(S3)。
機械語の修正が必要か判断し(S4)、YESの場合、
音声記録部3に記録された音声が再生される。ライター
はこの再生音声を耳で聞きながら画面上の機械語を含む
文章の修正を行う。この場合に、画面上に表示される機
械語を含む文章と再生音声とは同一のものである可能性
は専門分野の文章であればあるほど少ないが、同時録音
であるために文章として同一の態(てい)をなしてい
る。従って、ライターは機械語を含む文章のどの単語を
どのようなかな漢字に変換すべきか判断することがで
き、文章を修正できる(S6)。修正された文章はテキ
スト文章として表示および印字される(S7)。
【0026】修正された文章は、固定されなかったディ
テイターであっても先に示した音声入力の通り、あるい
はこれにかなり近い状態で画面表示され、印字されるこ
とになる。
【0027】
【発明の効果】以上のように本発明によれば、音声認識
装置の機能が拡充され、専門分野、例えば技術分野にお
ける論文であっても、ディクテイターが論文ごとに異な
るような場合であっても容易にかつ速やかにディクテー
ションによってかな漢字のテキスト文章とすることがで
き、オフィスの事務能率を向上させることができる。ま
たこのディクテーションは、専門能力のあるワープロ担
当を養成することなく、通常の事務担当によって実行す
ることができるメリットがある。
【図面の簡単な説明】
【図1】本発明の実施例の概略構成図。
【図2】フローチャート図。
【符号の説明】 1…音声認識装置、2…音声認識部、3…音声記録部、
4…マイクロフォン、5…音声入力部、6…音声認識制
御部、7…表示処理部、8…辞書部、9…登録部、10
…図面部、11…音声入力部、12…音声記録部、13
…音声再生部。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】音声を入力し、入力した音声を機械語とし
    て認識して画面に入力音声に対応して表示する音声認識
    装置を備えたディクテーション装置において、 前記音声認識装置は、音声を入力して記録し、音声再生
    する音声記録部を有し、 一体形または結合形のマイクロフォンを有し、 前記音声認識装置は、前記マイクロフォンを介して入力
    されて前記音声記録部に記録し、音声再生可能な音声に
    対応する音声を表示するものであることを特徴とするデ
    ィクテーション装置。
  2. 【請求項2】音声を入力し、入力した音声を機械語とし
    て認識して画面に入力音声に対応して表示する音声認識
    装置を備えたディクテーション装置において、 前記音声認識装置は、音声を入力して記録し、音声再生
    する音声記録部を有し、 一体形または結合形のマイクロフォンを有し、 前記音声認識装置は、前記マイクロフォンを介して入力
    されて前記音声記録部に記録し、音声再生可能な音声に
    対応する音声を表示すると共に、前記音声記録部に記録
    された音声のいくつかを単語として入力表示するもので
    あることを特徴とするディクテーション装置。
  3. 【請求項3】音声を入力し、入力した音声を機械語とし
    て認識して画面に入力音声に対応して表示する音声認識
    装置を使用するディクテーション方法において、 マイクロフォンを介して音声入力して一方は、機械語と
    して認識して画面表示し、同時に同じ音声によって、他
    方は対応の文章を音声記録し、 記録された音声に基づいて、音声再生しながら画面表示
    の機械語文章の修正を行うことを特徴とするディクテー
    ション方法。
JP11047132A 1999-02-24 1999-02-24 ディクテーション装置およびディクテーション方法 Pending JP2000250584A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11047132A JP2000250584A (ja) 1999-02-24 1999-02-24 ディクテーション装置およびディクテーション方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11047132A JP2000250584A (ja) 1999-02-24 1999-02-24 ディクテーション装置およびディクテーション方法

Publications (1)

Publication Number Publication Date
JP2000250584A true JP2000250584A (ja) 2000-09-14

Family

ID=12766614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11047132A Pending JP2000250584A (ja) 1999-02-24 1999-02-24 ディクテーション装置およびディクテーション方法

Country Status (1)

Country Link
JP (1) JP2000250584A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004529381A (ja) * 2001-03-29 2004-09-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 認識音声に対する同期再生中の文字編集
WO2011126716A2 (en) * 2010-03-30 2011-10-13 Nvoq Incorporated Dictation client feedback to facilitate audio quality
CN102512814A (zh) * 2011-12-12 2012-06-27 延安大学 一种基于语音识别的智能电子记分牌
JP2018072272A (ja) * 2016-11-02 2018-05-10 株式会社ニコン 装置、方法、およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004529381A (ja) * 2001-03-29 2004-09-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 認識音声に対する同期再生中の文字編集
WO2011126716A2 (en) * 2010-03-30 2011-10-13 Nvoq Incorporated Dictation client feedback to facilitate audio quality
WO2011126716A3 (en) * 2010-03-30 2011-12-29 Nvoq Incorporated Dictation client feedback to facilitate audio quality
CN102934160A (zh) * 2010-03-30 2013-02-13 Nvoq股份有限公司 用于提高音频质量的听写客户端反馈
CN102512814A (zh) * 2011-12-12 2012-06-27 延安大学 一种基于语音识别的智能电子记分牌
JP2018072272A (ja) * 2016-11-02 2018-05-10 株式会社ニコン 装置、方法、およびプログラム

Similar Documents

Publication Publication Date Title
US7143033B2 (en) Automatic multi-language phonetic transcribing system
US7383182B2 (en) Systems and methods for speech recognition and separate dialect identification
JP3935844B2 (ja) 入力された音声のトランスクリプションおよび表示
JP4570176B2 (ja) ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム
JP4558308B2 (ja) 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム
KR20140085440A (ko) 언어 학습 시스템 및 방법
JP2000250584A (ja) ディクテーション装置およびディクテーション方法
Mayar et al. Silence and its derivatives: Conversations across disciplines
JP2004325905A (ja) 外国語学習装置および外国語学習プログラム
TWI362017B (en) Intelligent conversion method with system for chinese and the international phonetic alphabet pa
JPH06337876A (ja) 文章読み上げ装置
JP2003162524A (ja) 言語処理装置
CN112786010A (zh) 语音合成系统、方法及非暂态计算机可读取媒体
Krason et al. Mouth and facial informativeness norms for 2276 English words
KR20140074459A (ko) 단어의 음절와 이미지 데이터 및 원어민의 발음 데이터를 이용한 단어 학습장치 및 방법
WO2023175768A1 (ja) 聴音支援装置、聴音支援方法、及びコンピュータ読み取り可能な記録媒体
JPH0130167B2 (ja)
JP2001265204A (ja) 連発発音式単語・熟語学習教材及びその作成方法
KR20240154836A (ko) 한국어 학습용 모바일 플랫폼
JPS60188995A (ja) 文章発声方法
TW594605B (en) Computer aided character meaning teaching system with accent prompt and method thereof
KR20140077081A (ko) 이미지 데이터 및 원어민의 발음 데이터를 이용한 영어 전치사 학습장치 및 방법
Miwa et al. Japanese spoken language learning system using java information technology.
Paul Voice-controlled computer software in emergency medicine
JPH07146919A (ja) 文書作成補助装置