JP2016534391A - 音声基盤再生情報生成及び認識方法及び記録媒体 - Google Patents
音声基盤再生情報生成及び認識方法及び記録媒体 Download PDFInfo
- Publication number
- JP2016534391A JP2016534391A JP2016533002A JP2016533002A JP2016534391A JP 2016534391 A JP2016534391 A JP 2016534391A JP 2016533002 A JP2016533002 A JP 2016533002A JP 2016533002 A JP2016533002 A JP 2016533002A JP 2016534391 A JP2016534391 A JP 2016534391A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- reproduction
- information
- file
- reproduction information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000006243 chemical reaction Methods 0.000 claims description 35
- 238000003780 insertion Methods 0.000 claims description 17
- 230000037431 insertion Effects 0.000 claims description 17
- 238000012790 confirmation Methods 0.000 claims description 7
- 238000003860 storage Methods 0.000 abstract description 14
- 230000006870 function Effects 0.000 description 22
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 3
- 230000001502 supplementing effect Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K19/00—Record carriers for use with machines and with at least a part designed to carry digital markings
- G06K19/06—Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code
- G06K19/06009—Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking
- G06K19/06046—Constructional details
- G06K19/0614—Constructional details the marking being selective to wavelength, e.g. color barcode or barcodes only visible under UV or IR
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
- G06T1/005—Robust watermarking, e.g. average attack or collusion attack resistant
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L21/10—Transforming into visible information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L21/18—Details of the transformation process
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0062—Embedding of the watermark in text images, e.g. watermarking text documents using letter skew, letter distance or row distance
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
Claims (11)
- 音声を出力するために再生可能なように生成されたファイルである音声再生ファイルを確認する確認段階;及び、
上記音声再生ファイルを再生情報に変換し、上記再生情報を認識する場合に上記再生情報に変換された音声再生ファイルが再生されるようにする変換段階;を含むことを特徴とする音声基盤再生情報生成方法。 - 上記音声基盤再生情報生成方法は、
上記再生情報を特定電子文書のヘッダー情報として挿入するか、乃至は上記再生情報をバーコードイメージに変換して挿入する挿入段階を更に含むことを特徴とする請求項1に記載の音声基盤再生情報生成方法。 - 上記再生情報には、
上記音声再生ファイルを構成する各データのデータ値が含まれ、
上記挿入段階は、
上記再生情報を、上記音声再生ファイルを構成する各データのデータ値によって決定されるデータ識別子を含むように上記バーコードイメージに変換して電子文書に挿入することを特徴とする請求項2に記載の音声基盤再生情報生成方法。 - 上記データ識別子は、
上記音声再生ファイルを構成する各データのデータ値に対応する2以上の色相及び図形のうち少なくとも一つを含むように決定されることを特徴とする請求項3に記載の音声基盤再生情報生成方法。 - 上記変換段階は、
上記音声に関連するマルチメディア情報を出力するための再生ファイルであるマルチメディア情報再生ファイルを、上記音声再生ファイルと共に上記再生情報として変換し、
上記マルチメディア情報には、
上記音声に関連するテキスト、イメージ、及び動画のうち少なくとも何れか一つが含まれることを特徴とする請求項1に記載の音声基盤再生情報生成方法。 - 音声を出力するための再生ファイルである音声再生ファイルから変換された再生情報を認識する認識段階;
上記認識された再生情報を上記音声再生ファイルに変換する変換段階;及び、
上記変換された音声再生ファイルを再生して上記音声を出力する出力段階;を含むことを特徴とする音声基盤再生情報認識方法。 - 上記認識段階は、
電子文書のヘッダー情報として挿入された上記再生情報を認識するか、またはバーコードイメージとして変換されて電子文書に挿入された上記再生情報を認識することを特徴とする請求項6に記載の音声基盤再生情報認識方法。 - 上記再生情報には、
上記音声再生ファイルを構成する各データのデータ値が含まれ、
上記認識段階は、
上記バーコードイメージから上記音声再生ファイルを構成する各データのデータ値によって決定されるデータ識別子を認識することを特徴とする請求項6に記載の音声基盤再生情報認識方法。 - 上記データ識別子は、
上記音声再生ファイルを構成する各データのデータ値に対応する2以上の色相及び図形のうち少なくとも一つを含むように決定されることを特徴とする請求項8に記載の音声基盤再生情報認識方法。 - 上記変換段階は、
上記認識された再生情報を上記音声再生ファイルと共に上記音声に関連したマルチメディア情報を出力するためのマルチメディア情報再生ファイルに変換し、
上記出力段階は、
上記音声に関連するテキスト、イメージ、及び動画のうち少なくとも何れか一つを上記マルチメディア情報として出力することを特徴とする請求項6に記載の音声基盤再生情報認識方法。 - 請求項1乃至請求項10のうち何れか一項による方法の各段階を行なう命令を含むコンピューター読取可能媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130093846A KR101557829B1 (ko) | 2013-08-07 | 2013-08-07 | 음성 기반 재생정보 생성 및 인식 방법 및 기록 매체 |
KR10-2013-0093846 | 2013-08-07 | ||
PCT/KR2013/012418 WO2015020285A1 (ko) | 2013-08-07 | 2013-12-31 | 음성 기반 재생정보 생성 및 인식 방법 및 기록 매체 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016534391A true JP2016534391A (ja) | 2016-11-04 |
Family
ID=52461585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016533002A Pending JP2016534391A (ja) | 2013-08-07 | 2013-12-31 | 音声基盤再生情報生成及び認識方法及び記録媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10083692B2 (ja) |
JP (1) | JP2016534391A (ja) |
KR (1) | KR101557829B1 (ja) |
CN (1) | CN105531765A (ja) |
WO (1) | WO2015020285A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023166636A1 (ja) * | 2022-03-02 | 2023-09-07 | 日本電信電話株式会社 | 音声再生装置、音声再生方法および音声再生プログラム |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101705228B1 (ko) * | 2016-08-22 | 2017-02-09 | 백승빈 | 전자문서생성장치 및 그 동작 방법 |
CN112597319A (zh) * | 2020-12-16 | 2021-04-02 | 北京高德品创科技有限公司 | 多媒体文档的打印方法、读取方法、装置及电子设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0698290A (ja) * | 1992-06-11 | 1994-04-08 | Ricoh Co Ltd | スチルカメラ |
JPH08185533A (ja) * | 1994-12-28 | 1996-07-16 | Sharp Corp | 音情報処理装置 |
JPH10187409A (ja) * | 1996-12-26 | 1998-07-21 | Nec Corp | 音声変換印刷伝送システム |
JPH10257205A (ja) * | 1997-03-10 | 1998-09-25 | Murata Mach Ltd | 音声機能付き通信端末装置 |
JP2002016746A (ja) * | 2000-06-30 | 2002-01-18 | Tokyo Denshi Sekkei Kk | 画像データ生成装置、画像出力システム、画像データ生成方法、画像出力方法および記録媒体 |
JP2002057980A (ja) * | 2000-08-07 | 2002-02-22 | Hitachi Ltd | 画像音声記録装置 |
JP2003123103A (ja) * | 2001-10-10 | 2003-04-25 | Casio Comput Co Ltd | チケット処理システムおよびチケット処理方法 |
JP2003323585A (ja) * | 2002-04-30 | 2003-11-14 | Toppan Forms Co Ltd | 2次元コード読取方法および2次元コード読取システム並びにこれらに使用される2次元コードが付された物品 |
JP2003324682A (ja) * | 2002-05-08 | 2003-11-14 | Fuji Photo Film Co Ltd | 音声情報付プリント、音声情報付プリントの再生装置、デジタルカメラ、携帯端末、及び画像記録装置 |
KR20050049024A (ko) * | 2003-11-20 | 2005-05-25 | (주) 우리아이티 | 시각 장애인을 위한 2차원 바코드와 2차원 바코드리더기를 통한 도서의 음성 변환 출력 시스템 |
US20060249573A1 (en) * | 2005-05-06 | 2006-11-09 | Berkun Kenneth A | Systems and methods for generating, reading and transferring identifiers |
WO2009054363A1 (ja) * | 2007-10-25 | 2009-04-30 | Takahiro Saito | 情報コード |
KR20090048211A (ko) * | 2007-11-09 | 2009-05-13 | (주)드림투리얼리티 | 음원 재생이 가능한 문서 변환 및 실행 방법, 이를수행하는 기록 매체 및 이를 수행하는 프로그램 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5873735A (en) * | 1994-12-28 | 1999-02-23 | Sharp Kabushiki Kaisha | Information reproducer and information creating unit |
US5862270A (en) * | 1995-12-08 | 1999-01-19 | Matsushita Electric Industrial Co., Ltd. | Clock free two-dimensional barcode and method for printing and reading the same |
SE517445C2 (sv) * | 1999-10-01 | 2002-06-04 | Anoto Ab | Positionsbestämning på en yta försedd med ett positionskodningsmönster |
KR20020041683A (ko) | 2000-11-28 | 2002-06-03 | 오영택 | 바코드를 이용한 문답식 학습 장치 및 방법 |
US20030101058A1 (en) * | 2001-11-26 | 2003-05-29 | Kenneth Liou | Voice barcode scan device |
TWM256985U (en) * | 2002-03-13 | 2005-02-11 | Sunplus Technology Co Ltd | Audio generator with code-reading capability |
KR200287162Y1 (ko) | 2002-04-18 | 2002-08-30 | 이영우 | 바코드를 이용한 음성출력 장치 |
GB0402018D0 (en) * | 2004-01-30 | 2004-03-03 | Hewlett Packard Development Co | Use of physical media having the same position-identifying pattern in digital documentation production |
JP2006033080A (ja) * | 2004-07-12 | 2006-02-02 | Fuji Photo Film Co Ltd | 音声ファイル作成システム |
JP2006350664A (ja) * | 2005-06-15 | 2006-12-28 | Fuji Xerox Co Ltd | 文書処理装置 |
JP4673200B2 (ja) * | 2005-12-01 | 2011-04-20 | キヤノン株式会社 | 印刷処理システムおよび印刷処理方法 |
KR20080048159A (ko) * | 2006-11-28 | 2008-06-02 | 주식회사 마크애니 | 전자문서 자동 위변조 검증 시스템 |
JP4855965B2 (ja) * | 2007-02-14 | 2012-01-18 | 株式会社リコー | 画像処理装置、画像処理方法、画像処理プログラム及び画像処理システム |
JP4870599B2 (ja) * | 2007-03-16 | 2012-02-08 | 株式会社リコー | 画像処理システム、画像処理装置、画像処理方法及び画像処理プログラム |
US8477095B2 (en) * | 2007-10-05 | 2013-07-02 | Leapfrog Enterprises, Inc. | Audio book for pen-based computer |
JP4475325B2 (ja) * | 2007-12-21 | 2010-06-09 | 富士ゼロックス株式会社 | 画像処理装置、画像処理システム及び画像処理プログラム |
JP5304282B2 (ja) * | 2009-01-30 | 2013-10-02 | 富士ゼロックス株式会社 | 印刷情報変換装置、印刷装置、印刷システム及びプログラム |
US20140339296A1 (en) * | 2013-05-20 | 2014-11-20 | John B. McAdams | Barcode, barcode device, system, and method |
US9471824B2 (en) * | 2013-07-12 | 2016-10-18 | Qualcomm Incorporated | Embedded barcodes for displaying context relevant information |
-
2013
- 2013-08-07 KR KR1020130093846A patent/KR101557829B1/ko active IP Right Grant
- 2013-12-31 US US14/910,518 patent/US10083692B2/en active Active
- 2013-12-31 CN CN201380079625.5A patent/CN105531765A/zh active Pending
- 2013-12-31 JP JP2016533002A patent/JP2016534391A/ja active Pending
- 2013-12-31 WO PCT/KR2013/012418 patent/WO2015020285A1/ko active Application Filing
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0698290A (ja) * | 1992-06-11 | 1994-04-08 | Ricoh Co Ltd | スチルカメラ |
JPH08185533A (ja) * | 1994-12-28 | 1996-07-16 | Sharp Corp | 音情報処理装置 |
JPH10187409A (ja) * | 1996-12-26 | 1998-07-21 | Nec Corp | 音声変換印刷伝送システム |
JPH10257205A (ja) * | 1997-03-10 | 1998-09-25 | Murata Mach Ltd | 音声機能付き通信端末装置 |
JP2002016746A (ja) * | 2000-06-30 | 2002-01-18 | Tokyo Denshi Sekkei Kk | 画像データ生成装置、画像出力システム、画像データ生成方法、画像出力方法および記録媒体 |
JP2002057980A (ja) * | 2000-08-07 | 2002-02-22 | Hitachi Ltd | 画像音声記録装置 |
JP2003123103A (ja) * | 2001-10-10 | 2003-04-25 | Casio Comput Co Ltd | チケット処理システムおよびチケット処理方法 |
JP2003323585A (ja) * | 2002-04-30 | 2003-11-14 | Toppan Forms Co Ltd | 2次元コード読取方法および2次元コード読取システム並びにこれらに使用される2次元コードが付された物品 |
JP2003324682A (ja) * | 2002-05-08 | 2003-11-14 | Fuji Photo Film Co Ltd | 音声情報付プリント、音声情報付プリントの再生装置、デジタルカメラ、携帯端末、及び画像記録装置 |
KR20050049024A (ko) * | 2003-11-20 | 2005-05-25 | (주) 우리아이티 | 시각 장애인을 위한 2차원 바코드와 2차원 바코드리더기를 통한 도서의 음성 변환 출력 시스템 |
US20060249573A1 (en) * | 2005-05-06 | 2006-11-09 | Berkun Kenneth A | Systems and methods for generating, reading and transferring identifiers |
WO2009054363A1 (ja) * | 2007-10-25 | 2009-04-30 | Takahiro Saito | 情報コード |
KR20090048211A (ko) * | 2007-11-09 | 2009-05-13 | (주)드림투리얼리티 | 음원 재생이 가능한 문서 변환 및 실행 방법, 이를수행하는 기록 매체 및 이를 수행하는 프로그램 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023166636A1 (ja) * | 2022-03-02 | 2023-09-07 | 日本電信電話株式会社 | 音声再生装置、音声再生方法および音声再生プログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20150017634A (ko) | 2015-02-17 |
US20160180849A1 (en) | 2016-06-23 |
CN105531765A (zh) | 2016-04-27 |
KR101557829B1 (ko) | 2015-10-06 |
US10083692B2 (en) | 2018-09-25 |
WO2015020285A1 (ko) | 2015-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Schmidt Horning | Chasing sound: Technology, culture, and the art of studio recording from Edison to the LP | |
WO2016119370A1 (zh) | 一种实现录音的方法、装置和移动终端 | |
KR100366760B1 (ko) | 멀티미디어 파일 결합방법 | |
JP2007257629A (ja) | 共同で作成されるマスター・ドキュメントにサブ・ドキュメントをマージするためのシステムおよび方法 | |
CN105022749A (zh) | 一种基于安卓平台的文档演示实现方法 | |
JP2016534391A (ja) | 音声基盤再生情報生成及び認識方法及び記録媒体 | |
Turin et al. | Oral literature in the digital age: Archiving orality and connecting with communities | |
Kapur et al. | Programming for musicians and digital artists: Creating music with ChucK | |
KR20140025082A (ko) | Sns 디지털 오디오북 제작 시스템 및 방법 | |
Temmermans et al. | Towards an international standard to establish trust in media production, distribution and consumption | |
JP2007506387A5 (ja) | ||
KR20060088175A (ko) | 멀티 포맷을 갖는 전자책 파일 생성 방법 및 시스템 | |
WO2012102424A1 (ko) | 전자 그림책 편집 장치 및 방법 | |
JP4250983B2 (ja) | 連続データへのユーザデータ関連付け装置 | |
KR20110109488A (ko) | 인쇄 도서와 멀티미디어 콘텐츠 연동 시스템 및 방법 | |
Roeder | Art and digital records: paradoxes and problems of preservation | |
Webster | Above and beyond the file: Preserving digital environments | |
Mortensen et al. | The data cycle | |
WO2013018515A1 (ja) | 情報処理装置 | |
TWI724518B (zh) | 依據腳本模擬影音播放以產生多媒體履歷之系統及方法 | |
Carroll | Learning to see all over again: New approaches to working with multimodality | |
Komara | Digital Revolution Tamed: The Case of the Recording Industry. | |
TWI270000B (en) | Speech file generating system and method | |
Clement et al. | Digital Humanities: The Intersections of Sound and Method | |
Mifsud | Computational modelling of expressive music performance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170313 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170321 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170821 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180130 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180427 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180702 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180724 |