JP7048141B1 - プログラム、ファイル生成方法、情報処理装置、及び情報処理システム - Google Patents
プログラム、ファイル生成方法、情報処理装置、及び情報処理システム Download PDFInfo
- Publication number
- JP7048141B1 JP7048141B1 JP2022000623A JP2022000623A JP7048141B1 JP 7048141 B1 JP7048141 B1 JP 7048141B1 JP 2022000623 A JP2022000623 A JP 2022000623A JP 2022000623 A JP2022000623 A JP 2022000623A JP 7048141 B1 JP7048141 B1 JP 7048141B1
- Authority
- JP
- Japan
- Prior art keywords
- file
- note
- slide
- audio
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 17
- 230000010365 information processing Effects 0.000 title claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 53
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 53
- 238000013519 translation Methods 0.000 claims description 34
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 abstract description 15
- 230000006870 function Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/221—Parsing markup language streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04847—Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
- G10L13/0335—Pitch control
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
- Electrically Operated Instructional Devices (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1は、一実施形態に係るファイル生成システム1の概要を示す図である。ファイル生成システム1は、プレゼンテーションファイルから音声付きファイルを生成するサービス(以下「音声付きファイル生成サービス」という)を提供する。音声付きファイルとは、ユーザ端末20において音声を出力させるためのデータと、ユーザ端末20において映像を表示させるためのデータとが一体となったファイルをいう。音声付きファイルは、例えば、MPEG4など所定の形式で記述された動画ファイルである。ファイル生成システム1は、例えば、企業における社員教育又は教育機関における教育などの教育分野において用いられる。ファイル生成システム1は、サーバ10、ユーザ端末20、サーバ30、及びサーバ40を有する。サーバ10は、音声付きファイル生成サービスにおけるサーバとして機能するコンピュータ装置である。ユーザ端末20は、ファイル生成サービスにおけるクライアントとして機能するコンピュータ装置である。サーバ30は、テキスト(又は文字列)から音声を合成する(すなわちテキストを音声に変換する)音声合成サービスを提供するサーバである。サーバ40は、テキストを第1言語から第2言語に翻訳する翻訳サービスを提供するサーバである。
図4は、ファイル生成システム1の動作を例示するシーケンスチャートである。以下において、ファイル生成プログラム等のソフトウェアを処理の主体として記載することがあるが、これは、ファイル生成プログラムを実行しているCPU210等のハードウェア要素が、他のハードウェア要素と協働して処理を実行することを意味する。
本発明は上述の実施形態に限定されるものではなく、種々の変形実施が可能である。以下、変形例をいくつか説明する。以下の変形例に記載した事項の少なくとも一部が、他の一部と組み合わせて適用されてもよい。
Claims (13)
- コンピュータに、
各々がノートを含む複数のスライドを含むプレゼンテーションファイルの指定を受け付けるステップと、
前記複数のスライドのうち1つのスライドのノートの文字列を抽出するステップと、
前記ノートの音声合成により得られる音声データを取得するステップと、
前記音声データを再生するステップと、
前記ノートの文字列の編集指示を受け付けるステップと、
前記編集されたノートの文字列をスライドに書き込むステップと、
前記編集されたスライドを含む前記プレゼンテーションファイルを、前記プレゼンテーションファイルとは別の形式の音声付きファイルに変換するステップと
を実行させるためのプログラム。 - 前記コンピュータに、前記音声データを再生する際の音声の指定を受け付けるステップ
を実行させるための請求項1に記載のプログラム。 - 前記コンピュータに、前記ノートを音声合成する音声合成エンジンの指定を受け付けるステップを実行させ、
前記音声データを取得するステップにおいて、前記指定された音声合成エンジンから前記音声データが取得される
請求項1又は2に記載のプログラム。 - 前記コンピュータに、前記ノートを編集するためのUIオブジェクトを表示手段に表示させるステップ
を実行させるための請求項1乃至3のいずれか一項に記載のプログラム。 - 前記UIオブジェクトが、SSML(Speech Synthesis Markup Language)のタグを挿入するためのボタンを含む
請求項4に記載のプログラム。 - 前記UIオブジェクトが、前記音声データをテスト再生するためのボタンを含む
請求項4又は5に記載のプログラム。 - 前記UIオブジェクトが、前記音声付きファイルをテスト再生するためのボタンを含む
請求項4乃至6のいずれか一項に記載のプログラム。 - 前記コンピュータに、前記ノートの他言語への翻訳を取得するステップ
を実行させるための請求項1乃至7のいずれか一項に記載のプログラム。 - 前記コンピュータに、前記翻訳における翻訳先の言語の指定を受け付けるステップを実行させ、
前記翻訳を取得するステップにおいて、前記ノートの前記指定された言語への翻訳が取得される
請求項8に記載のプログラム。 - 前記音声付きファイルに変換するステップにおいて、前のスライドから次のスライドに切り替えるタイミングが、当該前のスライドのノートの音声データの時間長に応じて決められる
請求項1乃至9のいずれか一項に記載のプログラム。 - コンピュータが、各々がノートを含む複数のスライドを含むプレゼンテーションファイルの指定を受け付けるステップと、
前記コンピュータが、前記複数のスライドのうち1つのスライドのノートの文字列を抽出するステップと、
前記コンピュータが、前記ノートの音声合成により得られる音声データを取得するステップと、
前記コンピュータが、前記音声データを再生するステップと、
前記コンピュータが、前記ノートの文字列の編集指示を受け付けるステップと、
前記コンピュータが、前記編集されたノートの文字列をスライドに書き込むステップと、
前記コンピュータが、前記編集されたスライドを含む前記プレゼンテーションファイルを、前記プレゼンテーションファイルとは別の形式の音声付きファイルに変換するステップと
を有するファイル生成方法。 - 各々がノートを含む複数のスライドを含むプレゼンテーションファイルの指定を受け付けるファイル受け付け手段と、
前記複数のスライドのうち1つのスライドのノートの文字列を抽出する抽出手段と、
前記ノートの音声合成により得られる音声データを取得する取得手段と、
前記音声データを再生する再生手段と、
前記ノートの文字列の編集指示を受け付ける指示受け付け手段と、
前記編集されたノートの文字列をスライドに書き込む書き込み手段と、
前記編集されたスライドを含む前記プレゼンテーションファイルを、前記プレゼンテーションファイルとは別の形式の音声付きファイルに変換する変換手段と
を有する情報処理装置。 - 各々がノートを含む複数のスライドを含むプレゼンテーションファイルの指定を受け付けるファイル受け付け手段と、
前記複数のスライドのうち1つのスライドのノートの文字列を抽出する抽出手段と、
前記ノートの音声合成により得られる音声データを取得する取得手段と、
前記音声データを再生する再生手段と、
前記ノートの文字列の編集指示を受け付ける指示受け付け手段と、
前記編集されたノートの文字列をスライドに書き込む書き込み手段と、
前記編集されたスライドを含む前記プレゼンテーションファイルを、前記プレゼンテーションファイルとは別の形式の音声付きファイルに変換する変換手段と
を有する情報処理システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022000623A JP7048141B1 (ja) | 2022-01-05 | 2022-01-05 | プログラム、ファイル生成方法、情報処理装置、及び情報処理システム |
US18/274,447 US20240046035A1 (en) | 2022-01-05 | 2022-11-18 | Program, file generation method, information processing device, and information processing system |
PCT/JP2022/042797 WO2023132140A1 (ja) | 2022-01-05 | 2022-11-18 | プログラム、ファイル生成方法、情報処理装置、及び情報処理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022000623A JP7048141B1 (ja) | 2022-01-05 | 2022-01-05 | プログラム、ファイル生成方法、情報処理装置、及び情報処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7048141B1 true JP7048141B1 (ja) | 2022-04-05 |
JP2023100149A JP2023100149A (ja) | 2023-07-18 |
Family
ID=81259150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022000623A Active JP7048141B1 (ja) | 2022-01-05 | 2022-01-05 | プログラム、ファイル生成方法、情報処理装置、及び情報処理システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240046035A1 (ja) |
JP (1) | JP7048141B1 (ja) |
WO (1) | WO2023132140A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008083855A (ja) | 2006-09-26 | 2008-04-10 | Toshiba Corp | 機械翻訳を行う装置、システム、方法およびプログラム |
JP2013174958A (ja) | 2012-02-23 | 2013-09-05 | Canon Inc | テキスト読み上げ装置およびテキスト読み上げ方法 |
JP2015045873A (ja) | 2014-10-14 | 2015-03-12 | 株式会社東芝 | 音声学習装置、方法およびプログラム |
JP2020027132A (ja) | 2018-08-09 | 2020-02-20 | 富士ゼロックス株式会社 | 情報処理装置およびプログラム |
JP2020046842A (ja) | 2018-09-18 | 2020-03-26 | 富士ゼロックス株式会社 | 情報処理装置およびプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050135790A1 (en) * | 2003-12-23 | 2005-06-23 | Sandisk Corporation | Digital media player with resolution adjustment capabilities |
US8559732B2 (en) * | 2007-08-06 | 2013-10-15 | Apple Inc. | Image foreground extraction using a presentation application |
US8219899B2 (en) * | 2008-09-22 | 2012-07-10 | International Business Machines Corporation | Verbal description method and system |
KR20110055957A (ko) * | 2009-11-20 | 2011-05-26 | 김학식 | 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템 |
US10237082B2 (en) * | 2012-08-31 | 2019-03-19 | Avaya Inc. | System and method for multimodal interaction aids |
-
2022
- 2022-01-05 JP JP2022000623A patent/JP7048141B1/ja active Active
- 2022-11-18 WO PCT/JP2022/042797 patent/WO2023132140A1/ja active Application Filing
- 2022-11-18 US US18/274,447 patent/US20240046035A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008083855A (ja) | 2006-09-26 | 2008-04-10 | Toshiba Corp | 機械翻訳を行う装置、システム、方法およびプログラム |
JP2013174958A (ja) | 2012-02-23 | 2013-09-05 | Canon Inc | テキスト読み上げ装置およびテキスト読み上げ方法 |
JP2015045873A (ja) | 2014-10-14 | 2015-03-12 | 株式会社東芝 | 音声学習装置、方法およびプログラム |
JP2020027132A (ja) | 2018-08-09 | 2020-02-20 | 富士ゼロックス株式会社 | 情報処理装置およびプログラム |
JP2020046842A (ja) | 2018-09-18 | 2020-03-26 | 富士ゼロックス株式会社 | 情報処理装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2023100149A (ja) | 2023-07-18 |
WO2023132140A1 (ja) | 2023-07-13 |
US20240046035A1 (en) | 2024-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6181351B1 (en) | Synchronizing the moveable mouths of animated characters with recorded speech | |
US8249858B2 (en) | Multilingual administration of enterprise data with default target languages | |
US8594995B2 (en) | Multilingual asynchronous communications of speech messages recorded in digital media files | |
US20190196666A1 (en) | Systems and Methods Document Narration | |
US5875427A (en) | Voice-generating/document making apparatus voice-generating/document making method and computer-readable medium for storing therein a program having a computer execute voice-generating/document making sequence | |
US8498866B2 (en) | Systems and methods for multiple language document narration | |
US20080027726A1 (en) | Text to audio mapping, and animation of the text | |
US20100318362A1 (en) | Systems and Methods for Multiple Voice Document Narration | |
US20090271175A1 (en) | Multilingual Administration Of Enterprise Data With User Selected Target Language Translation | |
JP2000081892A (ja) | 効果音付加装置および効果音付加方法 | |
JPH11249867A (ja) | 音声ブラウザシステム | |
JP3789614B2 (ja) | ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体 | |
US8019591B2 (en) | Rapid automatic user training with simulated bilingual user actions and responses in speech-to-speech translation | |
JPH11109991A (ja) | マンマシンインターフェースシステム | |
US20080243510A1 (en) | Overlapping screen reading of non-sequential text | |
JP7048141B1 (ja) | プログラム、ファイル生成方法、情報処理装置、及び情報処理システム | |
CN113870833A (zh) | 语音合成相关系统、方法、装置及设备 | |
KR102020341B1 (ko) | 악보 구현 및 음원 재생 시스템 및 그 방법 | |
JP6903364B1 (ja) | サーバおよびデータ割り当て方法 | |
CN114783408A (zh) | 一种音频数据处理方法、装置、计算机设备以及介质 | |
US11250837B2 (en) | Speech synthesis system, method and non-transitory computer readable medium with language option selection and acoustic models | |
JP2020204683A (ja) | 電子出版物視聴覚システム、視聴覚用電子出版物作成プログラム、及び利用者端末用プログラム | |
JP2005266009A (ja) | データ変換プログラムおよびデータ変換装置 | |
JPH10254676A (ja) | 音声合成装置及びその方法 | |
JP2009086597A (ja) | テキスト音声変換サービスシステム及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220105 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220316 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7048141 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |