JP2022145065A - 情報処理装置、情報処理方法および情報処理プログラム - Google Patents
情報処理装置、情報処理方法および情報処理プログラム Download PDFInfo
- Publication number
- JP2022145065A JP2022145065A JP2021046314A JP2021046314A JP2022145065A JP 2022145065 A JP2022145065 A JP 2022145065A JP 2021046314 A JP2021046314 A JP 2021046314A JP 2021046314 A JP2021046314 A JP 2021046314A JP 2022145065 A JP2022145065 A JP 2022145065A
- Authority
- JP
- Japan
- Prior art keywords
- sensor
- data
- sensor data
- information processing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 70
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 238000000034 method Methods 0.000 claims description 24
- 238000004458 analytical method Methods 0.000 description 30
- 238000004891 communication Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 12
- 230000001360 synchronised effect Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 240000006829 Ficus sundaica Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
まず、実施形態に係る情報処理の一例について、図1を用いて説明する。図1は、実施形態に係る情報処理の一例を示す図である。
図2は、実施形態に係る情報処理システム1の構成例を示す図である。図2に例示するように、実施形態に係る情報処理システム1は、複数の端末装置10-1,10-2,10-3…と、サーバ装置100と、を含む。
次に、図3を用いて、端末装置10の構成例について説明する。図3は、実施形態に係る端末装置10の構成例を示すブロック図である。なお、図3では、端末装置10の説明に必要となる構成要素のみを示しており、一般的な構成要素についての記載を省略している。また、図3に示す端末装置10は、主に上記した「端末装置10-1」を想定している。
通信部11は、例えば、NIC(Network Interface Card)等によって実現される。通信部11は、ネットワークNと有線または無線で接続され、ネットワークNを介して、サーバ装置100との間で情報の送受信を行う。
HMI部12は、端末装置10を利用するユーザ等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、表示情報を表示するための表示部(例えば、液晶ディスプレイ等)、音声情報を出力するためのスピーカ部等を含む。
センサ部13は、端末装置10に搭載され、端末装置10が存在する空間における各種のコンテキストを示すセンシングデータを取得する1以上のセンサを含む。
記憶部14は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現され、図3の例では、記憶部14は、解析モデル記憶部14aを有する。
解析モデル記憶部14aは、後述する解析部15bによって実行される解析処理に用いられる各種の解析モデルを記憶する。解析モデルは、例えば、画像に写った被写体Sの口の動きから発話内容を識別するように学習されたDNN(Deep Neural Network)等である。
制御部15は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、端末装置10内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部15は、例えば、コントローラであり、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
取得部15aは、通信部11を介し、他の端末装置10が取得したコンテキストデータ(例えば、本実施形態では、端末装置10-2,10-3が取得した映像データおよび音声データ)を取得する。
解析部15bは、取得部15aによって取得されたコンテキストデータを解析する。ここで、解析部15bが実行する解析処理について、図4および図5を用いて説明する。図4は、実施形態に係る解析処理の処理説明図(その1)である。また、図5は、実施形態に係る解析処理の処理説明図(その2)である。
図3の説明に戻る。比較部15cは、解析部15bによって解析された解析結果を比較する。例えば、比較部15cは、図4および図5で抽出された同一のフレーズ同士を対応付ける。また、比較部15cは、比較した比較結果、すなわち映像データおよび音声データの対応結果をタイミング制御部15dへ通知する。
タイミング制御部15dは、比較部15cによる比較結果に基づいて、映像データおよび音声データの再生タイミングのタイミング制御を行う。具体的には、タイミング制御部15dは、映像データおよび音声データそれぞれのデータ長や、再生開始位置、再生速度(音声データの場合はピッチに対応)等を制御することによって、映像データおよび音声データを同期させる。
出力制御部15eは、HMI部12に対し、タイミング制御部15dによって同期するように制御された映像データおよび音声データを出力させる。
次に、実施形態に係る端末装置10が実行する処理手順について説明する。図6は、実施形態に係る端末装置10が実行する処理手順を示すフローチャートである。
ところで、これまでは、端末装置10が、実施形態に係る情報処理を実行する情報処理装置の一例である場合について説明してきたが、端末装置10をサーバ装置100に置き換えてもよい。
上述してきた実施形態に係る端末装置10やサーバ装置100は、例えば図8に示すような構成のコンピュータ1000によって実現される。以下、端末装置10を例に挙げて説明する。図8は、実施形態に係る端末装置10の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU(Central Processing Unit)1100、RAM(Random Access Memory)1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、およびメディアインターフェイス(I/F)1700を備える。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
実施形態に係る情報処理装置は、取得部15aと、比較部15cと、タイミング制御部15dとを備える。取得部15aは、端末装置10-2(「第1センサ」の一例に相当)によって取得された第1センサデータ、および、端末装置10-2とは異なる端末装置10-3(「第2センサ」の一例に相当)によって第1センサデータと同時期に取得された第2センサデータを取得する。比較部15cは、第1センサデータおよび第2センサデータがそれぞれ示すコンテキストを比較する。タイミング制御部15dは、比較部15cによる比較結果に基づいて、コンテキストが一致するように第1センサデータおよび第2センサデータのタイミングを制御する。
10 端末装置
11 通信部
12 HMI部
13 センサ部
14 記憶部
14a 解析モデル記憶部
15 制御部
15a 取得部
15b 解析部
15c 比較部
15d タイミング制御部
15e 出力制御部
100 サーバ装置
Claims (7)
- 第1センサによって取得された第1センサデータ、および、前記第1センサとは異なる第2センサによって前記第1センサデータと同時期に取得された第2センサデータを取得する取得部と、
前記第1センサデータおよび前記第2センサデータがそれぞれ示すコンテキストを比較する比較部と、
前記比較部による比較結果に基づいて、前記コンテキストが一致するように前記第1センサデータおよび前記第2センサデータのタイミングを制御するタイミング制御部と
を備えることを特徴とする情報処理装置。 - 前記第1センサデータは映像データであり、前記第2センサデータは音声データであって、
前記タイミング制御部は、
前記コンテキストが一致するように前記映像データおよび前記音声データが再生されるタイミングを制御する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記比較部は、
前記映像データに写る被写体の口の動きから発話内容を推定し、
前記タイミング制御部は、
前記発話内容と前記音声データを照合することによって、前記映像データおよび前記音声データが再生されるタイミングを制御する
ことを特徴とする請求項2に記載の情報処理装置。 - 前記比較部はさらに、
前記音声データから前記発話内容を推定し、
前記タイミング制御部は、
同一の前記発話内容が一致するように前記映像データおよび前記音声データが再生されるタイミングを制御する
ことを特徴とする請求項3に記載の情報処理装置。 - 前記タイミング制御部によって再生されるタイミングが制御された前記映像データおよび前記音声データに基づくマルチメディアデータを生成する生成部
をさらに備えることを特徴とする請求項2、3または4に記載の情報処理装置。 - コンピュータが実行する情報処理方法であって、
第1センサによって取得された第1センサデータ、および、前記第1センサとは異なる第2センサによって前記第1センサデータと同時期に取得された第2センサデータを取得する取得工程と、
前記第1センサデータおよび前記第2センサデータがそれぞれ示すコンテキストを比較する比較工程と、
前記比較工程における比較結果に基づいて、前記コンテキストが一致するように前記第1センサデータおよび前記第2センサデータのタイミングを制御するタイミング制御工程と
を含むことを特徴とする情報処理方法。 - 第1センサによって取得された第1センサデータ、および、前記第1センサとは異なる第2センサによって前記第1センサデータと同時期に取得された第2センサデータを取得する取得手順と、
前記第1センサデータおよび前記第2センサデータがそれぞれ示すコンテキストを比較する比較手順と、
前記比較手順による比較結果に基づいて、前記コンテキストが一致するように前記第1センサデータおよび前記第2センサデータのタイミングを制御するタイミング制御手順と
をコンピュータに実行させることを特徴とする情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021046314A JP7198303B2 (ja) | 2021-03-19 | 2021-03-19 | 情報処理装置、情報処理方法および情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021046314A JP7198303B2 (ja) | 2021-03-19 | 2021-03-19 | 情報処理装置、情報処理方法および情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022145065A true JP2022145065A (ja) | 2022-10-03 |
JP7198303B2 JP7198303B2 (ja) | 2022-12-28 |
Family
ID=83454332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021046314A Active JP7198303B2 (ja) | 2021-03-19 | 2021-03-19 | 情報処理装置、情報処理方法および情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7198303B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009092457A (ja) * | 2007-10-05 | 2009-04-30 | Sony Corp | 撮像装置、撮像装置における距離測定方法、およびプログラム |
JP2012182762A (ja) * | 2011-03-03 | 2012-09-20 | Nikon Corp | 撮像装置 |
JP2015012557A (ja) * | 2013-07-02 | 2015-01-19 | 日本電気株式会社 | 映像音声処理装置、映像音声処理システム、映像音声同期方法、プログラム |
-
2021
- 2021-03-19 JP JP2021046314A patent/JP7198303B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009092457A (ja) * | 2007-10-05 | 2009-04-30 | Sony Corp | 撮像装置、撮像装置における距離測定方法、およびプログラム |
JP2012182762A (ja) * | 2011-03-03 | 2012-09-20 | Nikon Corp | 撮像装置 |
JP2015012557A (ja) * | 2013-07-02 | 2015-01-19 | 日本電気株式会社 | 映像音声処理装置、映像音声処理システム、映像音声同期方法、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7198303B2 (ja) | 2022-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11158102B2 (en) | Method and apparatus for processing information | |
JP6505117B2 (ja) | 模写によるデジタル携帯情報端末の対話、および応答時のリッチなマルチメディア | |
KR20200124644A (ko) | 디바이스들 간의 상태 상호작용의 캡슐화 및 동기화 | |
US20170062010A1 (en) | Computerized system and method for formatted transcription of multimedia content | |
US11869508B2 (en) | Systems and methods for capturing, processing, and rendering one or more context-aware moment-associating elements | |
US9288594B1 (en) | Auditory environment recognition | |
CN111919249A (zh) | 词语的连续检测和相关的用户体验 | |
CN110534085B (zh) | 用于生成信息的方法和装置 | |
KR20160106075A (ko) | 오디오 스트림에서 음악 작품을 식별하기 위한 방법 및 디바이스 | |
CN112153460A (zh) | 一种视频的配乐方法、装置、电子设备和存储介质 | |
KR20200045852A (ko) | 음성 합성 또는 영상 편집을 통한 멀티미디어 컨텐츠 내 광고 서비스 플랫폼 및 음성 합성 서비스와 영상 편집 서비스를 제공하는 방법 | |
US20240205515A1 (en) | Information processing system, information processing method, and storage medium | |
US11308943B2 (en) | Systems and methods for aligning lyrics using a neural network | |
US20220391440A1 (en) | Content providing system, content providing method, and storage medium | |
JP7198303B2 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
US20190066676A1 (en) | Information processing apparatus | |
US20240038271A1 (en) | System and method for generating video in target language | |
CN111862933A (zh) | 用于生成合成语音的方法、装置、设备和介质 | |
US11475887B2 (en) | Systems and methods for aligning lyrics using a neural network | |
WO2020110744A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN112562733A (zh) | 媒体数据处理方法及装置、存储介质、计算机设备 | |
US11335326B2 (en) | Systems and methods for generating audible versions of text sentences from audio snippets | |
US20240331682A1 (en) | Systems and methods for real-time concert transcription and user-captured video tagging | |
US20240265925A1 (en) | Systems and Methods for Language Identification in Audio Content | |
US20240233776A9 (en) | Systems and methods for lyrics alignment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210916 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7198303 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |