JP2000123007A - 表示一体型タブレットおよび音声認識を利用したテープ起こし システム - Google Patents
表示一体型タブレットおよび音声認識を利用したテープ起こし システムInfo
- Publication number
- JP2000123007A JP2000123007A JP33186898A JP33186898A JP2000123007A JP 2000123007 A JP2000123007 A JP 2000123007A JP 33186898 A JP33186898 A JP 33186898A JP 33186898 A JP33186898 A JP 33186898A JP 2000123007 A JP2000123007 A JP 2000123007A
- Authority
- JP
- Japan
- Prior art keywords
- data
- converted
- character
- text
- handwriting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- User Interface Of Digital Computer (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【課題】 人の話をもとにして原稿をかくもの、つま
り対談・座談会・インタービュー・講演会・作家の口述
などは一度録音して、その録音テープを聞きながら人手
で原稿を作成してきた。しかしその状態では手書きの原
稿であり、実際にはそれをコンピュータに人手でキーボ
ードから入力して、やっとテキストデータが作られてい
た。テープ起こしについては全く人手に頼っていたわけ
である。この作業を何とかコンピュータ技術を用いて自
動化を計りたい。 【解決手段】この作業に音声認識とその誤認識を手書き
文字で補正し、それをさらに手書き文字認識の技術を用
いて、自動的にテキストファイルを作成することによ
り、テープ起こしの大幅な能率向上を可能にした。
り対談・座談会・インタービュー・講演会・作家の口述
などは一度録音して、その録音テープを聞きながら人手
で原稿を作成してきた。しかしその状態では手書きの原
稿であり、実際にはそれをコンピュータに人手でキーボ
ードから入力して、やっとテキストデータが作られてい
た。テープ起こしについては全く人手に頼っていたわけ
である。この作業を何とかコンピュータ技術を用いて自
動化を計りたい。 【解決手段】この作業に音声認識とその誤認識を手書き
文字で補正し、それをさらに手書き文字認識の技術を用
いて、自動的にテキストファイルを作成することによ
り、テープ起こしの大幅な能率向上を可能にした。
Description
【0001】
【発明の属する技術分野】この発明は、コンピュータ
(1)にマイク(5)から音声データを入力し、それを
コンピュータ上で動作する音声認識ソフト(3)により
テキストデータに変換させる。しかしながら音声認識自
体まだ完全な認識ができるわけではなく、誤認識するこ
とも少なくない。本発明では、テキストになったデータ
を表示一体型タブレット(2)上に表示していきなが
ら、誤認識部分について作業者が加筆訂正等の編集作業
を行う。ここで編集された結果は手書きのデータであ
り、まだテキストデータにはなっておらず、手書き文字
と音声認識によって変換されたテキストデータが混在し
た状態にある。次にこの手書き文字、テキスト混在のフ
ァイルを、コンピュータ上で動作する文字認識ソフト
(4)の処理によって手書き文字をテキストに変換す
る。最終的には話された内容がすべてテキストデータに
変換される。
(1)にマイク(5)から音声データを入力し、それを
コンピュータ上で動作する音声認識ソフト(3)により
テキストデータに変換させる。しかしながら音声認識自
体まだ完全な認識ができるわけではなく、誤認識するこ
とも少なくない。本発明では、テキストになったデータ
を表示一体型タブレット(2)上に表示していきなが
ら、誤認識部分について作業者が加筆訂正等の編集作業
を行う。ここで編集された結果は手書きのデータであ
り、まだテキストデータにはなっておらず、手書き文字
と音声認識によって変換されたテキストデータが混在し
た状態にある。次にこの手書き文字、テキスト混在のフ
ァイルを、コンピュータ上で動作する文字認識ソフト
(4)の処理によって手書き文字をテキストに変換す
る。最終的には話された内容がすべてテキストデータに
変換される。
【0002】
【従来の技術】従来、人の話をもとにして原稿をかくも
の、つまり対談・座談会・インタービュー・講演会・作
家の口述などは一度録音して、その録音テープを聞きな
がら人手で原稿を作成してきた。しかしその状態では手
書きの原稿であり、実際にはそれをコンピュータにまた
人手でキーボードから入力して、やっとテキストデータ
が作られていた。テープ起こしについては全く人手に頼
っていたわけである。
の、つまり対談・座談会・インタービュー・講演会・作
家の口述などは一度録音して、その録音テープを聞きな
がら人手で原稿を作成してきた。しかしその状態では手
書きの原稿であり、実際にはそれをコンピュータにまた
人手でキーボードから入力して、やっとテキストデータ
が作られていた。テープ起こしについては全く人手に頼
っていたわけである。
【0003】
【発明が解決しようとする課題】本発明は、テープ起こ
しという神経を高度に集中して行う作業をコンピュータ
システムの活用により、この作業の自動化を実現するこ
とを目指したものである。またテープ起こしに要する時
間を大幅に短縮できるため、取材したものを即座に原稿
にすることが可能になる。
しという神経を高度に集中して行う作業をコンピュータ
システムの活用により、この作業の自動化を実現するこ
とを目指したものである。またテープ起こしに要する時
間を大幅に短縮できるため、取材したものを即座に原稿
にすることが可能になる。
【0004】
【発明を解決するための手段】コンピュータ(1)にマ
イクから音声データを入力し、それをコンピュータ上で
動作する音声認識ソフト(3)によりテキストデータ
(6)に変換させる。変換されたテキストデータは表示
一体型タブレット(2)上に作られた桝目に1文字ずつ
配置されていく。作業者は音声を聞きながら、これをモ
ニターしていて誤認識部分があったなら削除・加筆等の
編集機能を使って修正していく。ここで作業者が編集し
た部分はこの段階では、テキストデータではなく、手書
き文字のままである。音声データが音声認識により変換
終了した状態では、手書きデータとテキストデータが混
在したファイル(7)が出来ている。本発明では、さら
に後処理として手書きデータとテキストデータが混在し
たファイルから手書き文字部分を文字認識ソフト(4)
よって認識処理を行い、手書き文字もテキストに変換す
る。最終的にすべて話された内容はテキストデータ
(8)に変換される。もちろん文字認識もパーフェクト
で誤認識がないかと言えば、必ずしもそうとは言えない
が、この場合、桝目の中の文字を変換するだけでいいの
で、極めて認識率も認識速度も高いものが実現できる。
イクから音声データを入力し、それをコンピュータ上で
動作する音声認識ソフト(3)によりテキストデータ
(6)に変換させる。変換されたテキストデータは表示
一体型タブレット(2)上に作られた桝目に1文字ずつ
配置されていく。作業者は音声を聞きながら、これをモ
ニターしていて誤認識部分があったなら削除・加筆等の
編集機能を使って修正していく。ここで作業者が編集し
た部分はこの段階では、テキストデータではなく、手書
き文字のままである。音声データが音声認識により変換
終了した状態では、手書きデータとテキストデータが混
在したファイル(7)が出来ている。本発明では、さら
に後処理として手書きデータとテキストデータが混在し
たファイルから手書き文字部分を文字認識ソフト(4)
よって認識処理を行い、手書き文字もテキストに変換す
る。最終的にすべて話された内容はテキストデータ
(8)に変換される。もちろん文字認識もパーフェクト
で誤認識がないかと言えば、必ずしもそうとは言えない
が、この場合、桝目の中の文字を変換するだけでいいの
で、極めて認識率も認識速度も高いものが実現できる。
【0005】
【発明の実施の形態】本発明の構成は、ハードウェア的
にはコンピュータ(1)と表示一体型タブレット(2)
それにマイク(5)で構成されるシンプルなものであ
る。またマイクで音声を入力する代りに、オリンパス光
学工業から発売されているデジタルボイスレコーダーを
使用すると録音された音声をPCカードスロットから入
力することもできる。いずれの場合も作業者は音声を聞
きながら、それが変換されていくようすをモニターしな
がら、過ちを訂正していく作業が必要である。この作業
は音声が進んでいくスピードで処理していかなかればな
らないが、ここにペン入力ができる表示一体型タブレッ
ト(2)が大きな役割を果たす。システム全体のコスト
を下げようとすれぱ、操作性が多少悪くなり、操作に慣
れが必要になるが、表示一体でない普通のタブレットと
ディスプレイ装置があればその構成でも可能である。
にはコンピュータ(1)と表示一体型タブレット(2)
それにマイク(5)で構成されるシンプルなものであ
る。またマイクで音声を入力する代りに、オリンパス光
学工業から発売されているデジタルボイスレコーダーを
使用すると録音された音声をPCカードスロットから入
力することもできる。いずれの場合も作業者は音声を聞
きながら、それが変換されていくようすをモニターしな
がら、過ちを訂正していく作業が必要である。この作業
は音声が進んでいくスピードで処理していかなかればな
らないが、ここにペン入力ができる表示一体型タブレッ
ト(2)が大きな役割を果たす。システム全体のコスト
を下げようとすれぱ、操作性が多少悪くなり、操作に慣
れが必要になるが、表示一体でない普通のタブレットと
ディスプレイ装置があればその構成でも可能である。
【0006】
【発明の効果】本発明は以上のような簡単な構成で、テ
ープ起こしという高度に神経を集中させる作業から人間
を解き放ち、しかも従来のやり方に比べ、著しい時間の
短縮が可能になる。しかも情報化時代にふさわしいテキ
ストデータが最終成果物として出来上がるので、ワープ
ロやDTPソフトにそのまま入力できたり、電子メール
で送信することも出来るというメリットは無視できな
い。
ープ起こしという高度に神経を集中させる作業から人間
を解き放ち、しかも従来のやり方に比べ、著しい時間の
短縮が可能になる。しかも情報化時代にふさわしいテキ
ストデータが最終成果物として出来上がるので、ワープ
ロやDTPソフトにそのまま入力できたり、電子メール
で送信することも出来るというメリットは無視できな
い。
【図1】本システムの全体像
【図2】音声入力からテキスト変換された具体例
【図3】誤認識を修正した具体例
【図4】手書き部分を文字認識処理でテキストに変換し
た具体例
た具体例
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 15/20 506A
Claims (1)
- 【請求項1】 コンピュータ(1)と表示一体型タブレ
ット(2)を組合わせ、音声認識ソフト(3)、文字認
識ソフト(4)を利用して話された内容を自動的にテキ
ストデータに変換するテープ起こしシステム
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33186898A JP2000123007A (ja) | 1998-10-16 | 1998-10-16 | 表示一体型タブレットおよび音声認識を利用したテープ起こし システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33186898A JP2000123007A (ja) | 1998-10-16 | 1998-10-16 | 表示一体型タブレットおよび音声認識を利用したテープ起こし システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000123007A true JP2000123007A (ja) | 2000-04-28 |
Family
ID=18248553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33186898A Pending JP2000123007A (ja) | 1998-10-16 | 1998-10-16 | 表示一体型タブレットおよび音声認識を利用したテープ起こし システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000123007A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006337970A (ja) * | 2005-06-02 | 2006-12-14 | Tetsuo Mizumoto | 音声入力自動化パソコン |
JP2014149612A (ja) * | 2013-01-31 | 2014-08-21 | Nippon Hoso Kyokai <Nhk> | 音声認識誤り修正装置およびそのプログラム |
JP2015091077A (ja) * | 2013-11-07 | 2015-05-11 | 日本電信電話株式会社 | 情報表示装置、方法及びプログラム |
-
1998
- 1998-10-16 JP JP33186898A patent/JP2000123007A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006337970A (ja) * | 2005-06-02 | 2006-12-14 | Tetsuo Mizumoto | 音声入力自動化パソコン |
JP2014149612A (ja) * | 2013-01-31 | 2014-08-21 | Nippon Hoso Kyokai <Nhk> | 音声認識誤り修正装置およびそのプログラム |
JP2015091077A (ja) * | 2013-11-07 | 2015-05-11 | 日本電信電話株式会社 | 情報表示装置、方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7260529B1 (en) | Command insertion system and method for voice recognition applications | |
KR101213835B1 (ko) | 음성 인식에 있어서 동사 에러 복원 | |
US6418410B1 (en) | Smart correction of dictated speech | |
US5960447A (en) | Word tagging and editing system for speech recognition | |
US6581033B1 (en) | System and method for correction of speech recognition mode errors | |
US6421643B1 (en) | Method and apparatus for directing an audio file to a speech recognition program that does not accept such files | |
EP2202722A2 (en) | Computer system with integrated telephony, handwriting and speech recognition functions | |
US5761641A (en) | Method and system for creating voice commands for inserting previously entered information | |
WO2003025904A1 (en) | Correcting a text recognized by speech recognition through comparison of phonetic sequences in the recognized text with a phonetic transcription of a manually input correction word | |
JP3104661B2 (ja) | 日本語文章作成装置 | |
US7421394B2 (en) | Information processing apparatus, information processing method and recording medium, and program | |
WO2019214628A1 (zh) | 一种语音识别的方法、文件处理方法及终端设备 | |
JP2000123007A (ja) | 表示一体型タブレットおよび音声認識を利用したテープ起こし システム | |
US20200037049A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
JPS63149699A (ja) | 音声入出力装置 | |
JPH11143864A (ja) | 日時表現正規化方法、日時表現正規化装置及び日時表現正規化プログラムを記録した記録媒体 | |
JP2004020739A (ja) | 議事録作成装置、議事録作成方法、議事録作成プログラム | |
JP2723214B2 (ja) | 音声文書作成装置 | |
WO2005052785A2 (en) | Method and device for transcribing an audio signal | |
JP3308929B2 (ja) | 音声入力機能付き情報処理装置 | |
WO2007052281A1 (en) | Method and system for selection of text for editing | |
CN112560404A (zh) | 文本编辑器语音识别方法及装置 | |
JP2003241786A (ja) | 音声入力テープ起こしシステム | |
JP2002116789A (ja) | データ変換システム、データ認識システム、データ加工システム、およびプログラムを記憶した記憶媒体 | |
JPS63249899A (ja) | 音声認識単語指定方式 |