JP2016534391A

JP2016534391A - 音声基盤再生情報生成及び認識方法及び記録媒体

Info

Publication number: JP2016534391A
Application number: JP2016533002A
Authority: JP
Inventors: スンビンパイク、
Original assignee: MTCOM CO., LTD.
Current assignee: MTCOM CO., LTD.
Priority date: 2013-08-07
Filing date: 2013-12-31
Publication date: 2016-11-04
Also published as: KR20150017634A; US20160180849A1; CN105531765A; KR101557829B1; US10083692B2; WO2015020285A1

Abstract

【課題】本発明は、音声基盤再生情報生成及び認識方法及び記録媒体を提供するものである。【解決手段】本発明は、音声を出力するための音声再生ファイルを再生情報に変換し、再生情報を認識する場合に上記音声再生ファイルが再生されて音声を出力するようにすることにより、音声再生ファイルを保存するための別途のストレージなしでも多様な分野で活用できる録取機能を提供することができる。【選択図】図１

Description

本発明は、音声を出力するための音声再生ファイルを再生情報に変換し、再生情報を認識する場合に上記音声再生ファイルが再生されて音声が出力されるようにするための方案に関する。

年々、携帯用電子機器（例：スマートパッド）の販売量及び使用量が大きく増加するにつれて、多様な分野で電子文書及び電子署名サービスを導入して活用している。

さらに、このような電子文書及び電子署名サービスは、政府のペーパーレス（Paperless）政策とかみ合って急速な増加傾向を見せている。

最近は、電子署名の法制化に関連して、電子署名の法的効力を補完するための手段として録取機能を導入することにより、契約または同意内容に対する顧客の否認を根本的に防止しようとする要求も増加している。

このような録取機能は、単に電子署名の法的効力を補完するための手段としてだけでなく、社会全般にわたって多様な分野で活用することができるため、このような録取機能を積極的に活用するための方案が要求されると言える。

本発明は、上記の事情を勘案して創出されたものであり、本発明で到逹しようとする目的は、音声を出力するための音声再生ファイルを再生情報に変換し、再生情報を認識する場合に上記音声再生ファイルが再生されて音声を出力するようにすることにより、音声再生ファイルを保存するための別途のストレージなしでも多様な分野で活用できる録取機能を提供することにある。

上記目的を達成するための本発明の第１観点による音声基盤再生情報生成方法は、音声を出力するために再生可能なように生成されたファイルである音声再生ファイルを確認する確認段階；及び、上記音声再生ファイルを再生情報に変換し、上記再生情報を認識する場合に上記再生情報に変換された音声再生ファイルが再生されるようにする変換段階；を含むことを特徴とする。

より具体的には、上記方法は、上記再生情報を特定電子文書のヘッダー情報として挿入するか、乃至は上記再生情報をバーコードイメージに変換して挿入する挿入段階を更に含むことを特徴とする。

より具体的には、上記再生情報には、上記音声再生ファイルを構成する各データのデータ値が含まれ、上記挿入段階は、上記再生情報を、上記音声再生ファイルを構成する各データのデータ値によって決定されるデータ識別子を含むように上記バーコードイメージに変換して電子文書に挿入することを特徴とする。

より具体的には、上記データ識別子は、上記音声再生ファイルを構成する各データのデータ値に対応する２以上の色相及び図形のうち少なくとも一つを含むように決定されることを特徴とする。

より具体的には、上記変換段階は、上記音声に関連するマルチメディア情報を出力するための再生ファイルであるマルチメディア情報再生ファイルを、上記音声再生ファイルと共に上記再生情報として変換し、上記マルチメディア情報には、上記音声に関連するテキスト、イメージ、及び動画のうち少なくとも何れか一つが含まれることを特徴とする。

上記目的を達成するための本発明の第２観点による音声基盤再生情報認識方法は、音声を出力するための再生ファイルである音声再生ファイルから変換された再生情報を認識する認識段階；上記認識された再生情報を上記音声再生ファイルに変換する変換段階；及び、上記変換された音声再生ファイルを再生して上記音声を出力する出力段階；を含むことを特徴とする。

より具体的には、上記認識段階は、電子文書のヘッダー情報として挿入された上記再生情報を認識するか、またはバーコードイメージとして変換されて電子文書に挿入された上記再生情報を認識することを特徴とする。

より具体的には、上記再生情報には、上記音声再生ファイルを構成する各データのデータ値が含まれ、上記認識段階は、上記バーコードイメージから上記音声再生ファイルを構成する各データのデータ値によって決定されるデータ識別子を認識することを特徴とする。

より具体的には、上記変換段階は、上記認識された再生情報を上記音声再生ファイルと共に上記音声に関連したマルチメディア情報を出力するためのマルチメディア情報再生ファイルに変換し、上記出力段階は、上記音声に関連するテキスト、イメージ、及び動画のうち少なくとも何れか一つを上記マルチメディア情報として出力することを特徴とする。

よって、本発明による音声基盤再生情報生成及び認識方法及び記録媒体によれば、音声を出力するための音声再生ファイルを再生情報に変換し、再生情報を認識する場合に上記再生情報に変換された音声再生ファイルが再生されて音声を出力するようにすることによって、音声再生ファイルを保存するための別途のストレージなしでも、電子署名の法的効力を補完するための手段としてだけでなく、社会全般にわたって多様な分野で活用できる録取機能を提供することができる。

本発明の一実施例による音声基盤再生情報生成及び認識システムの概略的な構成図である。本発明の一実施例による生成装置の概略的な構成図である。本発明の一実施例による認識装置の概略的な構成図である。本発明の他の実施例による生成装置での動作フローを説明するための概略的な流れ図である。本発明のまた他の実施例による認識装置での動作フローを説明するための概略的な流れ図である。

以下、添付図面を参照しながら本発明の一実施例について説明する。

図１は、本発明の一実施例による音声基盤再生情報生成及び照会システムを示した図面である。

図１に示されているように、本発明の一実施例による電子文書生成及び照会システムは、音声基盤再生情報を生成する生成装置１００、及び生成された再生情報を認識する認識装置２００を含む構成を有することができる。

ここで、生成装置１００は、音声を出力するために生成された音声再生ファイルを再生情報に変換する装置を言う。

このような生成装置１００は、例えば、アプリケーションまたはプログラミングされたソフトウェアモジュールの実行を通した一連の過程を介して音声再生ファイルを再生情報に変換することができる。

よって、生成装置１００は、アプリケーションまたはソフトウェアモジュールの実行が可能な使用者デバイスを称する。

例えば、生成装置１００は、スマートフォン、パーソナルコンピュータ（ＰＣ）、ノートブック、タブレットＰＣ、及びＰＤＡなどが該当し得る。

また、認識装置２００は、音声再生ファイルを変換した再生情報により、再生情報に変換された音声再生ファイルを再生して音声を出力する装置を言う。

このような認識装置２００は、先に言及した生成装置１００と同様、例えば、アプリケーションまたはプログラミングされたソフトウェアモジュールの実行を通した一連の過程を介して音声再生ファイルを再生情報に変換することができる。

したがって、認識装置２００も、アプリケーションまたはソフトウェアモジュールの実行が可能な使用者デバイスを称する。

一方、本発明の一実施例では、電子署名の法的効力を補完するための手段としてだけでなく、社会全般にわたって多様な分野で活用することができる録取機能を提案する。

しかし、録取機能を適用するためには、音声を保存することができる別途のストレージ（例：ＣＤ、ＵＳＢ）を追加導入して、録音しようとする音声を音声データとして保存する方式が一般的であった。

結局、音声が録音されたストレージを別途管理しなければならず、さらに録音された音声を聴取するためには、再生装置がストレージから音声データをリードして音声を出力しなければならないという不便が存在することになる。

よって、本発明の一実施例では、音声を出力するための音声再生ファイルを再生情報に変換し、再生情報を認識する場合に音声が出力されるようにするための方案を提案することにし、以下にこれを具体的に説明する。

先ず、生成装置１００は、音声再生ファイルを生成する機能を行う。

より具体的には、生成装置１００は、音声を再生可能な再生ファイルである音声再生ファイルとして生成することにより、認識装置２００乃至は別途の再生装置（図示せず）で、音声再生ファイルを再生する場合に音声が出力されることができるようにする。

また、生成装置１００は、再生情報に変換するための音声再生ファイルを確認する機能を行う。

より具体的には、生成装置１００は、自体で生成した音声再生ファイルを再生情報に変換するための対象として確認するか、乃至は別途の装置で既に生成された音声再生ファイルを再生情報に変換するための対象として確認することができる。

また、生成装置１００は、音声再生ファイルを再生情報に変換する機能を行う。

より具体的には、生成装置１００は、再生情報に変換するための音声再生ファイルが確認されれば、該当音声再生ファイルを再生情報に変換することにより、認識装置２００で再生情報を認識する場合に上記再生情報に変換された音声再生ファイルが再生されて音声が出力されることができるようにする。

このとき、生成装置１００は、再生情報を電子文書のヘッダー情報として挿入するか、乃至はバーコードイメージに変換して挿入することができるように、音声再生ファイルを構成する各データのデータ値が再生情報に含まれるように変換する。

また、生成装置１００は、音声再生ファイルから変換された再生情報を電子文書に挿入する機能を行う。

より具体的には、生成装置１００は、音声再生ファイルから変換された再生情報を電子文書のヘッダー情報として挿入するか、またはバーコードイメージに変換して電子文書に挿入することにより、認識装置２００で該当再生情報を認識して音声を出力することができるようにする。

一方、認識装置２００は、再生情報を認識する機能を行う。

より具体的には、認識装置２００は、電子文書のヘッダー情報として挿入されるか、または電子文書上にバーコードイメージに変換されて挿入された再生情報を認識することにより、再生情報に変換された音声再生ファイルが存在することを確認する。

このとき、認識装置２００は、バーコードイメージとして挿入された再生情報を認識する場合は、バーコードイメージにデータ識別子として適用された多数の色相または図形を認識することにより、再生情報に変換された音声再生ファイルが存在することを確認できる。

また、認識装置２００は、音声再生ファイルに変換する機能を行う。

より具体的には、認識装置２００は、再生情報に変換された音声再生ファイルが確認される場合、該当再生情報を音声再生ファイルに変換する。

このとき、認識装置２００は、バーコードイメージに挿入されたデータ識別子(例：色相、図形)を認識した認識結果を音声再生ファイルを構成する各データのデータ値に置換する方式を通して音声再生ファイルへの変換を行うことができる。

また、認識装置２００は、音声再生ファイルを再生する機能を行う。

より具体的には、認識装置２００は、再生情報から音声再生ファイルへの変換が完了すれば、変換された音声再生ファイルを再生することにより、音声を出力する。

このとき、認識装置２００は、再生情報から上記音声再生ファイルと共にマルチメディア情報再生ファイルが変換される場合、音声だけでなく音声に関連するテキスト、イメージ、及び動画などのマルチメディア情報を共に出力する。

以下、図２を参照して本発明の一実施例による生成装置１００の構成をより具体的に説明する。

すなわち、生成装置１００は、音声再生ファイルを生成する生成部１１０、再生情報に変換するための音声再生ファイルを確認する確認部１２０、及び音声再生ファイルを再生情報に変換する変換部１３０を含む構成を有する。

また、本発明の一実施例による生成装置１００は、上述の構成以外に、変換された再生情報を電子文書に挿入する挿入部１４０を更に含む構成を有することができる。

ここで、上述の生成部１１０、確認部１２０、変換部１３０及び挿入部１４０を含む生成装置１００の各構成は、プロセッサによって実行されるアプリケーションまたは、プログラミングされたソフトウェアモジュールの形態として具現されることができる。

まず、生成部１１０は、音声再生ファイルを生成する機能を行う。

より具体的には、生成部１１０は、音声を再生可能な再生ファイルである音声再生ファイルとして生成することにより、認識装置２００乃至は別途の再生装置（図示せず）で、音声再生ファイルを再生する場合に音声が出力されることができるようにする。

例えば、病医院、保険／金融会社、報道機関、雑誌社などで、契約書または同意書作成時、法的紛争を防ぐために、被契約者、または同意者の肉声を音声再生ファイルとして生成することができる。

他の例として、出版、レコード会社などで自社刊行物または著作物に対する広報のために、有名著者、芸能人、または声優などの声を音声再生ファイルとして生成することができる。

その他に、教育界でも、多様なサービス（例：学習教材、外国語など）に関連して、単語または文章の説明、乃至は発音、また問題解説などを目的に、該当する音声を音声再生ファイルとして生成することができる。

確認部１２０は、再生情報に変換するための音声再生ファイルを確認する機能を行う。

より具体的には、確認部１２０は、自体で生成した音声再生ファイルを再生情報に変換するための対象として確認するか、または別途の装置で既に生成された音声再生ファイルを再生情報に変換するための対象として確認することができる。

変換部１３０は、音声再生ファイルを再生情報に変換する機能を行う。

より具体的には、変換部１３０は、再生情報に変換するための音声再生ファイルが確認されると、該当音声再生ファイルを再生情報に変換することにより、認識装置２００で再生情報を認識する場合に上記再生情報に変換された音声再生ファイルが再生されて音声が出力されることができるようにする。

このとき、変換部１３０は、挿入部１４０で、再生情報を電子文書のヘッダー情報として挿入するか、乃至はバーコードイメージに変換して挿入することができるように、音声再生ファイルを構成する各データのデータ値が再生情報に含まれるように変換する。

一方、変換部１３０は、音声再生ファイルを再生情報に変換するにおいて、音声に関連するマルチメディア情報を出力するための再生ファイルであるマルチメディア情報再生ファイルを音声再生ファイルと共に上記再生情報として変換することができる。

ここで、マルチメディア情報には、例えば、テキスト、イメージ、及び動画などが含まれ得る。

よって、認識装置２００では再生情報を認識する場合、音声だけでなく、音声に関連するテキスト、イメージ、及び動画などのマルチメディア情報を共に出力することができる。

挿入部１４０は、音声再生ファイルから変換された再生情報を電子文書に挿入する機能を行う。

より具体的には、挿入部１４０は、音声再生ファイルから変換された再生情報を電子文書のヘッダー情報として挿入するか、またはバーコードイメージに変換して電子文書に挿入することにより、認識装置２００で該当再生情報を認識して音声を出力することができるようにする。

すなわち、挿入部１４０は、音声再生ファイルから変換された再生情報を電子文書のヘッダー情報として挿入することにより、認識装置２００で電子文書を閲覧する場合に、ヘッダー情報として挿入された再生情報を認識して音声を出力することができるようにする。

ここで、電子文書のヘッダー情報として挿入された再生情報の認識の場合、電子文書の閲覧過程でなされる多様なイベント（例：特定文書領域クリック、ドラッグなど）を通してなされ得るであろう。

そして、電子文書のヘッダー情報として挿入された再生情報は、該当電子文書が印刷される場合、印刷出力物上にバーコードイメージとして変換されて出力されることができるのは勿論である。

また、挿入部１４０は音声再生ファイルから変換された再生情報をバーコードイメージに変換して電子文書に挿入することにより、認識装置２００で電子文書に挿入されたバーコードイメージを認識して音声を出力することができるようにする。

このとき、挿入部１４０は、音声再生ファイルを構成する各データのデータ値に対応するデータ識別子を決定し、決定されたデータ識別子を含むようにバーコードイメージを構成する。

ここで、挿入部１４０は、各データのデータ値に対応する多数の色相または図形をデータ識別子として決定してバーコードイメージを構成する。

例えば、多数の色相をデータ識別子として決定する場合、バーコードイメージに適用される多数の色相各々は、例えば、濃度、彩度、明度のような色要素の決定を通して音声再生ファイルを構成する各データのデータ値を示すことができる。

他の例として、図形をデータ識別子として決定する場合、バーコードイメージに適用される図形の形及び組み合わせ、大きさなどの決定を通して音声再生ファイルを構成する各データのデータ値を示すことができる。

このように、挿入部１４０では再生情報を電子文書のヘッダー情報またはバーコードイメージとして挿入することにより、これを次のように社会全般にわたって多様に活用できるようにする。

例えば、病医院、保険／金融会社、報道機関、雑誌社などで、契約書または同意書作成時、電子文書または印刷出力物上に音声再生ファイルを変換した再生情報を挿入することにより、これを認識した認識装置２００では被契約者または同意者の肉声を出力するようにして、法的効力のある否認防止策として活用することができる。

他の例として、出版、レコード会社などで自社刊行物または著作物に音声再生ファイルを変換した再生情報を挿入することにより、これを認識した認識装置２００では有名著者、芸能人、または声優などの声が出力されて、新概念の広報手段として活用することができる。

その他に、教育界でも、多様なサービス（例：学習教材、外国語など）に関連するウェブページまたは印刷物などに再生情報を挿入することにより、これを認識した認識装置２００では単語または文章の説明、乃至は発音、また問題解説などに該当する音声を出力するようにして、教育手段として活用することができる。

以下、図３を参照して本発明の一実施例による認識装置２００の構成をより具体的に説明する。

すなわち、認識装置２００は、再生情報を認識する認識部２１０、認識された再生情報を音声再生ファイルに変換する変換部２２０、及び音声再生ファイルを再生して音声を出力する出力部２３０を含む構成を有する。

ここで、上述の認識部２１０、変換部２２０、及び出力部２３０を含む生成装置１００の各構成は、プロセッサによって実行されるアプリケーションまたは、プログラミングされたソフトウェアモジュールの形態として具現されることができる。

認識部２１０は、再生情報を認識する機能を行う。

より具体的には、認識部２１０は、電子文書のヘッダー情報として挿入されるか、または電子文書上にバーコードイメージに変換されて挿入された再生情報を認識することにより、再生情報に変換された音声再生ファイルが存在することを確認する。

このとき、認識部２１０は、バーコードイメージとして挿入された再生情報を認識する場合は、バーコードイメージにデータ識別子として適用された多数の色相または図形を認識することにより、再生情報に変換された音声再生ファイルが存在することを確認することができる。

変換部２２０は、音声再生ファイルに変換する機能を行う。

より具体的には、変換部２２０は、再生情報に変換された音声再生ファイルが確認される場合、該当再生情報を音声再生ファイルに変換する。

例えば、変換部２２０は、バーコードイメージに含まれたデータ識別子として多数の色相が適用された場合、上記多数の色相各々の色要素、例えば、濃度、彩度、明度などを確認し、確認された結果を音声再生ファイルを構成する各データのデータ値に置換することにより、音声再生ファイルへの変換を行うことができる。

他の例として、変換部２２０は、バーコードイメージに含まれたデータ識別子として図形が適用された場合、上記図形の形、組み合わせ、大きさを確認し、確認された結果を音声再生ファイルを構成する各データのデータ値に置換することにより、音声再生ファイルへの変換を行うことができる。

出力部２３０は、音声再生ファイルを再生する機能を行う。

より具体的には、出力部２３０は、再生情報から音声再生ファイルへの変換が完了すると、変換された音声再生ファイルを再生することにより、音声を出力する。

このとき、認識装置２００は、再生情報から上記音声再生ファイルと共にマルチメディア情報再生ファイルが変換される場合、音声だけでなく音声に関連するテキスト、イメージ、及び動画などのマルチメディア情報を共に出力することになる。

このように、出力部２３０では再生情報から変換された音声再生ファイルを再生して音声を出力することになり、これは次のように社会全般にわたって多様に活用されることができる。

例えば、病医院、保険／金融会社、報道機関、雑誌社などで、契約書または同意書作成時、電子文書または印刷出力物上に挿入された再生情報を認識する場合、被契約者または同意者の肉声を出力することにより、法的効力のある否認防止策として活用することができる。

他の例として、出版、レコード会社などで自社刊行物または著作物に挿入された再生情報を認識する場合、有名著者、芸能人、または声優などの声を出力することにより、新概念広報手段として活用することができる。

その他に、教育界でも、多様なサービス（例：学習教材、外国語など）に関連して挿入された再生情報を認識する場合、単語または文章の説明、乃至は発音、また問題解説などに該当する音声を出力することにより、教育手段として活用することができる。

以上、考察したように、本発明の一実施例による音声基盤再生情報生成及び認識システムによれば、音声を出力するための音声再生ファイルを再生情報に変換し、再生情報を認識する場合に上記再生情報に変換された音声再生ファイルが再生されて音声を出力するようにすることにより、音声再生ファイルを保存するための別途のストレージなしでも、電子署名の法的効力を補完するための手段としてだけでなく、社会全般にわたって多様な分野で活用できる録取機能を提供することができる。

以下、図４及び図５を参照して、本発明の一実施例による音声基盤再生情報生成及び認識方法を説明する。

ここで、説明の便宜のために、上述の図１及び図２に示されている構成は、該当参照番号を言及して説明する。

先ず、図４を参照して本発明の一実施例による生成装置１００での動作フローを説明する。

はじめに、生成部１１０は音声を再生可能な再生ファイルである音声再生ファイルとして生成することにより、認識装置２００乃至は別途の再生装置（図示せず）で、音声再生ファイルを再生する場合に音声が出力されることができるようにする（Ｓ１１０）。

それから、確認部１２０は、自体で生成した音声再生ファイルを再生情報に変換するための対象として確認するか、または別途の装置で既に生成された音声再生ファイルを再生情報に変換するための対象として確認する（Ｓ１２０）。

次に、変換部１３０は、再生情報に変換するための音声再生ファイルが確認されると、該当音声再生ファイルを再生情報に変換することにより、認識装置２００で再生情報を認識する場合に上記再生情報に変換された音声再生ファイルが再生されて音声が出力されることができるようにする（Ｓ１３０）。

その後、挿入部１４０は、音声再生ファイルから変換された再生情報をバーコードイメージに変換して電子文書に挿入することにより、認識装置２００で電子文書に挿入されたバーコードイメージを認識して音声を出力することができるようにする（Ｓ１４０〜Ｓ１６０、Ｓ１８０）。

このとき、挿入部１４０は、各データのデータ値に対応する多数の色相または図形をデータ識別子として決定してバーコードイメージを構成する。

一方、挿入部１４０は、音声再生ファイルから変換された再生情報を電子文書のヘッダー情報として挿入することにより、認識装置２００で電子文書を閲覧する場合に、ヘッダー情報として挿入された再生情報を認識して音声を出力することができるようにする（Ｓ１４０、Ｓ１７０〜Ｓ１８０）。

次に、図５を参照して本発明の一実施例による認識装置２００での動作フローを説明する。

先ず、認識部２１０は、電子文書のヘッダー情報として挿入されるか、または電子文書上にバーコードイメージに変換されて挿入された再生情報を認識することにより、再生情報に変換された音声再生ファイルが存在することを確認する（Ｓ２１０）。

それから、変換部２２０は、再生情報に変換された音声再生ファイルが確認される場合、該当再生情報を音声再生ファイルに変換する（Ｓ２２０）。

このとき、変換部２２０は、バーコードイメージに含まれたデータ識別子として多数の色相が適用された場合、上記多数の色相各々の色要素、例えば、濃度、彩度、明度などを確認し、確認された結果を音声再生ファイルを構成する各データのデータ値に置換することにより、音声再生ファイルへの変換を行うことができる。

そして、変換部２２０は、バーコードイメージに含まれたデータ識別子として図形が適用された場合は、上記図形の形、組み合わせ、大きさを確認し、確認された結果を音声再生ファイルを構成する各データのデータ値に置換することにより、音声再生ファイルへの変換を行うことができる。

その後、出力部２３０は、再生情報から音声再生ファイルへの変換が完了すると、変換された音声再生ファイルを再生することにより、音声を出力する（Ｓ２４０）。

以上、考察したように、本発明の一実施例による音声基盤再生情報生成及び認識方法によれば、音声を出力するための音声再生ファイルを再生情報に変換し、再生情報を認識する場合に上記再生情報に変換された音声再生ファイルが再生されて音声を出力するようにすることにより、音声再生ファイルを保存するための別途のストレージなしでも、電子署名の法的効力を補完するための手段としてだけでなく、社会全般にわたって多様な分野で活用できる録取機能を提供することができる。

一方、ここに提示された実施例に関連して説明された方法またはアルゴリズムの各段階は、ハードウェアで直接具現されるか、プロセッサによって実行されるソフトウェアモジュールで具現されるか、またはこれらの結合によって具現されることができる。ソフトウェアモジュールは、ＲＡＭメモリ、フラッシュメモリ、ＲＯＭメモリ、ＥＰＲＯＭメモリ、ＥＥＰＲＯＭメモリ、レジスタ、ハードディスク、移動式ディスク、ＣＤ−ＲＯＭ、または技術的に公知となっている任意の他の形態の保存媒体に常駐することができる。例示的な保存媒体はプロセッサと連結され、その結果、プロセッサは保存媒体から情報を読み取り、保存媒体に情報を記録することができる。代案として、保存媒体はプロセッサに統合され得る。プロセッサ及び保存媒体はＡＳＩＣ内に含まれることができる。ＡＳＩＣは使用者端末装置内に含まれることができる。

代案として、プロセッサ及び保存媒体は使用者端末装置内に個別の各コンポーネントとして含まれることができる。

以上、本発明について一実施例を参照して詳しく説明したが、本発明は上記実施例に限定されるものではなく、以下の特許請求の範囲で請求する本発明の要旨を逸脱することなく、本発明の属する技術分野において通常の知識を有する者ならば誰でも多様な変形または修正が可能な範囲まで本発明の技術的思想が及ぶと言える。

本発明の一実施例による音声基盤再生情報生成及び認識方法及び記録媒体によれば、音声を出力するための音声再生ファイルを再生情報に変換し、再生情報を認識する場合に上記音声再生ファイルが再生されて音声が出力されるようにするという点において、既存技術の限界を超えて関連技術に対する利用だけでなく適用される装置の市販または営業の可能性が十分なだけでなく、現実的に明白に実施することができる程度であるため、産業上の利用可能性のある発明である。

Claims

音声を出力するために再生可能なように生成されたファイルである音声再生ファイルを確認する確認段階；及び、
上記音声再生ファイルを再生情報に変換し、上記再生情報を認識する場合に上記再生情報に変換された音声再生ファイルが再生されるようにする変換段階；を含むことを特徴とする音声基盤再生情報生成方法。
上記音声基盤再生情報生成方法は、
上記再生情報を特定電子文書のヘッダー情報として挿入するか、乃至は上記再生情報をバーコードイメージに変換して挿入する挿入段階を更に含むことを特徴とする請求項１に記載の音声基盤再生情報生成方法。
上記再生情報には、
上記音声再生ファイルを構成する各データのデータ値が含まれ、
上記挿入段階は、
上記再生情報を、上記音声再生ファイルを構成する各データのデータ値によって決定されるデータ識別子を含むように上記バーコードイメージに変換して電子文書に挿入することを特徴とする請求項２に記載の音声基盤再生情報生成方法。
上記データ識別子は、
上記音声再生ファイルを構成する各データのデータ値に対応する２以上の色相及び図形のうち少なくとも一つを含むように決定されることを特徴とする請求項３に記載の音声基盤再生情報生成方法。
上記変換段階は、
上記音声に関連するマルチメディア情報を出力するための再生ファイルであるマルチメディア情報再生ファイルを、上記音声再生ファイルと共に上記再生情報として変換し、
上記マルチメディア情報には、
上記音声に関連するテキスト、イメージ、及び動画のうち少なくとも何れか一つが含まれることを特徴とする請求項１に記載の音声基盤再生情報生成方法。
音声を出力するための再生ファイルである音声再生ファイルから変換された再生情報を認識する認識段階；
上記認識された再生情報を上記音声再生ファイルに変換する変換段階；及び、
上記変換された音声再生ファイルを再生して上記音声を出力する出力段階；を含むことを特徴とする音声基盤再生情報認識方法。
上記認識段階は、
電子文書のヘッダー情報として挿入された上記再生情報を認識するか、またはバーコードイメージとして変換されて電子文書に挿入された上記再生情報を認識することを特徴とする請求項６に記載の音声基盤再生情報認識方法。
上記再生情報には、
上記音声再生ファイルを構成する各データのデータ値が含まれ、
上記認識段階は、
上記バーコードイメージから上記音声再生ファイルを構成する各データのデータ値によって決定されるデータ識別子を認識することを特徴とする請求項６に記載の音声基盤再生情報認識方法。
上記データ識別子は、
上記音声再生ファイルを構成する各データのデータ値に対応する２以上の色相及び図形のうち少なくとも一つを含むように決定されることを特徴とする請求項８に記載の音声基盤再生情報認識方法。
上記変換段階は、
上記認識された再生情報を上記音声再生ファイルと共に上記音声に関連したマルチメディア情報を出力するためのマルチメディア情報再生ファイルに変換し、
上記出力段階は、
上記音声に関連するテキスト、イメージ、及び動画のうち少なくとも何れか一つを上記マルチメディア情報として出力することを特徴とする請求項６に記載の音声基盤再生情報認識方法。
請求項１乃至請求項１０のうち何れか一項による方法の各段階を行なう命令を含むコンピューター読取可能媒体。