JP6904255B2 - 情報処理システム及びプログラム - Google Patents
情報処理システム及びプログラム Download PDFInfo
- Publication number
- JP6904255B2 JP6904255B2 JP2017546443A JP2017546443A JP6904255B2 JP 6904255 B2 JP6904255 B2 JP 6904255B2 JP 2017546443 A JP2017546443 A JP 2017546443A JP 2017546443 A JP2017546443 A JP 2017546443A JP 6904255 B2 JP6904255 B2 JP 6904255B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- voice
- listening
- time
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 104
- 238000012545 processing Methods 0.000 claims description 165
- 230000005540 biological transmission Effects 0.000 claims description 46
- 238000004458 analytical method Methods 0.000 claims description 32
- 238000004364 calculation method Methods 0.000 claims description 22
- 239000000284 extract Substances 0.000 claims description 4
- 230000006870 function Effects 0.000 description 60
- 238000000034 method Methods 0.000 description 50
- 230000015572 biosynthetic process Effects 0.000 description 39
- 238000003786 synthesis reaction Methods 0.000 description 39
- 230000008569 process Effects 0.000 description 34
- 238000004891 communication Methods 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 11
- 230000001629 suppression Effects 0.000 description 10
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 9
- 230000004044 response Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000004904 shortening Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 210000005069 ears Anatomy 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001151 other effect Effects 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000009966 trimming Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 241000956207 Picola Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 210000003454 tympanic membrane Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/002—Programmed access in sequence to a plurality of record carriers or indexed parts, e.g. tracks, thereof, e.g. for editing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/005—Reproducing at a different information rate from the information rate of recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
- H04N21/2387—Stream processing in response to a playback request from an end-user, e.g. for trick-play
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/658—Transmission by the client directed to the server
- H04N21/6587—Control parameters, e.g. trick play commands, viewpoint selection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/78—Television signal recording using magnetic recording
- H04N5/782—Television signal recording using magnetic recording on tape
- H04N5/783—Adaptations for reproducing at a rate different from the recording rate
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/41—Detection or adaptation of hearing aid parameters or programs to listening situation, e.g. pub, forest
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Neurosurgery (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
1.第1の実施形態(分離型:補聴システム)
1.1.システム構成
(1)最小構成
(2)応用構成
1.2.聞き戻し再生処理
(1)聞き戻し再生開始のみ指示する場合
(2)聞き戻し再生終了指示がある場合
1.3.補足
(1)非定常雑音抑圧処理
(2)聞き戻し音声とリアルタイム音声との同時聴取
1.4.まとめ
2.第2の実施形態(一体型:補聴装置)
(1)最小構成
(2)応用構成
3.ハードウェア構成例
[1.1.システム構成]
まず、図1及び図2を参照して、本開示の第1の実施形態に係る補聴システムの機能構成について説明する。本実施形態に係る補聴システムは、音声を取得し、また、音声を出力する音響デバイス100と、音響デバイス100による音声の再生制御を行う情報処理デバイス200とからなる。
まず、図1に基づいて、本実施形態に係る補聴システムの最小限の機能構成を説明する。図1に示す補聴システムは、最小限の機能として、通常の補聴機能に加えて聞き戻し再生機能を実行可能にするものである。
音響デバイス100は、ユーザが耳に装着して使用する部材であり、例えば情報処理機能を備えるデバイスと接続して使用されるイヤホンあるいはヘッドホン等である。イヤホンの形状として、両耳装用の密閉型を想定しているが、本開示はかかる例に限定されない。音響デバイス100は、図1に示すように、音声入力部110と、音響デバイスデータ送信部120と、音響デバイスデータ受信部130と、信号合成切換部140と、音声出力部150とからなる。
情報処理デバイス200は、情報処理機能を備えるデバイスであり、例えば、音響デバイス100とペアリング可能なスマートフォン等の情報処理端末等である。情報処理デバイス200は、図1に示すように、聞き戻し再生処理部210と、制御入力部220と、第1の音声記憶部231と、第2の音声記憶部233とを備える。
次に、図2に基づいて、図1に示した最小構成の補聴システムをベースとして、さらに機能を追加した、補聴システムの一構成例を説明する。図2に示す補聴システムは、最小限の機能である補聴機能及び聞き戻し再生機能に加え、音声分析機能、ノイズキャンセル機能等を備える。以下では、図1に示した最初構成の補聴システムに対して新たに追加された機能について主に説明し、図1の補聴システムと同一の機能構成についての説明は省略する。
音響デバイス100は、図2に示すように、図1に示した音響デバイス100と同様、音声入力部110と、音響デバイスデータ送信部120と、音響デバイスデータ受信部130と、音声出力部150とを備える。さらに、図2の音響デバイス100は、音声特徴計算部121と、タイムスタンプ情報生成部123と、第1信号合成切換部141と、リアルタイム音声処理部143と、第2信号合成切換部145と、キャンセル信号生成部160とを備える。
情報処理デバイス200は、情報処理機能を備えるデバイスであり、例えば、音響デバイス100とペアリング可能なスマートフォン等の情報処理端末等である。情報処理デバイス200は、図2に示すように、聞き戻し再生処理部210と、制御入力部220と、第1の音声記憶部231と、第2の音声記憶部233とを備える。さらに、本実施形態に係る情報処理デバイス200は、情報提示部240を備えている。
以下、本実施形態に係る補聴システムによる聞き戻し再生処理について2つのケースを説明する。以下の2つのケースでは、聞き戻し開始位置からの戻り時間については「現在から5sec過去の音声から聞き戻す」といったように予め設定されているものとし、リアルタイム音声と聞き戻し音声との同時聴取はしないものとして説明する。また、追いかけ再生信号処理部213における短縮再生方法として、1倍速よりも速い速度での再生を行う例を用いて説明する。
まず、図4〜図8に基づいて、本実施形態に係る補聴システムによる聞き戻し再生処理について説明する。なお、図4は、本実施形態に係る補聴システムによる聞き戻し再生処理を示すフローチャートである。図5〜図8は、本実施形態に係る補聴システムによる聞き戻し再生処理を説明するための説明図である。なお、図5〜図8において、Tnowは現時刻の位置を示し、Tpは聞き戻し再生位置を示す。また、T1は聞き戻し再生操作が入力された時点を示し、T2はT1から設定された戻り時間だけ過去に遡った時点を示し、T3は聞き戻し再生位置が現時点に追いついた時点を示している。
次に、図9に基づいて、本実施形態に係る補聴システムによる聞き戻し再生処理の他のケースについて説明する。なお、図9は、聞き戻し再生終了指示がある場合の、聞き戻し再生処理を示すフローチャートである。すなわち、聞き戻し再生開始の操作入力があってから、ユーザの聞き戻し再生終了の操作入力を受けて、聞き戻し音声の短縮再生、リアルタイム音声の再生へと移行するケースを示している。以下では、図4に示した聞き戻し再生処理と異なる処理について主に説明し、同一処理については詳細な説明を省略する。
本実施形態に係る補聴システムでは、取得した音声信号を聞き戻し再生することができるため、音声信号を先読みした音声処理や、演算時間のかかる処理を実行することが可能となる。この結果、より高品質な音声強調が可能になる。
例えば、本実施形態に係る補聴システムでは、非定常雑音抑圧処理を実行することが可能である。例えば、キーボードのタイプ音やドアの開閉等、物同士が衝突したような非定常雑音は耳障りであり、抑圧すべき対象である。一方で、音声の子音部分は、音声の聞き取りに重要であるため、確実に再生する必要がある。しかし、音声の子音部分と上記衝突音等の非定常雑音とは、瞬間的に高域にエネルギーが集中するという共通の特徴があり、瞬時的な信号を観察しただけでは、両者を判別することは困難である。
聞き戻したい音声が長く、その間に自分が何かしらの応答を求められる場合には、聞き戻し音声とリアルタイム音声とを同時聴取する機能があるとよい。そこで、上記実施形態に係る補聴システムにおいて、聞き戻し音声再生の機能を有しつつ、聞き戻し音声とリアルタイム音声との同時聴取を実現することも可能である。
以上、本実施形態に係る補聴システムの構成と、これによる聞き戻し再生処理について説明した。本実施形態によれば、ユーザは音声に聞き逃しがあっても、会話の途中で即座に聞き直しすることができ、聞き戻し音声の再生と通常再生(すなわち、リアルタイム音声の聞き取り)とをスムーズに行き来できる。また、本実施形態に係る補聴システムにより、聞き取りやすい聞き戻し音声を提供することができる。
次に、図10及び図11に基づいて、本開示の第2の実施形態に係る補聴装置300について説明する。本実施形態に係る補聴装置300は、第1の実施形態に係る補聴システムを1つのデバイスにまとめた構成となっている。以下、本実施形態に係る補聴装置300の最小限構成と、最小限構成に対してノイズキャンセル機能等の機能が付加された場合の一構成例について、説明する。なお、図10は、図1に示した第1の実施形態の補聴システムの構成に対応しており、図11は、図2に示した第1の実施形態の補聴システムの構成に対応している。このため、各機能の詳細な説明は省略する。
まず、図10に基づいて、本実施形態に係る補聴装置300の最小限の機能構成を説明する。図10に示す補聴システムは、最小限の機能として、通常の補聴機能に加えて聞き戻し再生機能を実行可能にするものである。
次に、図11に基づいて、図10に示した最小構成の補聴システムをベースとして、さらに機能を追加した、補聴装置300の一構成例を説明する。図11に示す補聴装置300は、最小限の機能である補聴機能及び聞き戻し再生機能に加え、音声分析機能、ノイズキャンセル機能等を備える。以下では、図2に示した第1の実施形態に係る補聴システムと対比しつつ、図10に示した最初構成の補聴システムに対して新たに追加された機能について主に説明する。
最後に、上記実施形態に係る音響デバイス100、情報処理デバイス200、補聴装置300のハードウェア構成例について説明する。これらの機器は同様に構成することができるため、以下では、情報処理デバイス200を例として説明する。図12は、上実施形態に係る情報処理デバイス200のハードウェア構成を示すハードウェア構成図である。
(1)
録音された記録音声の聞き戻しを開始する聞き戻し開始指示に基づいて、当該聞き戻し開始指示が入力された聞き戻し開始時刻より所定時間遡った位置から現時刻に追いつくまで再生する再生処理部を備える、情報処理装置。
(2)
前記再生処理部は、前記記録音声を、前記聞き戻し開始時刻までは第1の再生速度で再生し、前記聞き戻し開始時刻から現時刻までは第2の再生速度で再生する、前記(1)に記載の情報処理装置。
(3)
前記聞き戻し開始時刻に到達する前に前記記録音声の聞き戻し終了指示が入力されたとき、前記再生処理部は、前記記録音声の再生位置を前記聞き戻し開始時刻に移動する、前記(2)に記載の情報処理装置。
(4)
前記第2の再生速度は、前記第1の再生速度以上である、前記(2)または(3)に記載の情報処理装置。
(5)
前記第2の再生速度は1倍速より速い、前記(2)〜(4)のいずれか1項に記載の情報処理装置。
(6)
前記再生処理部は、前記聞き戻し開始時刻から前記現時刻までの区間のうち少なくとも一部をスキップして再生する、前記(1)〜(5)に記載の情報処理装置。
(7)
スキップされるスキップ対象区間は、人の声の存在しない時間区間または無音区間である、前記(6)に記載の情報処理装置。
(8)
少なくとも前記記録音声の再生中にノイズキャンセリング機能を実行するキャンセル信号生成部をさらに備える、前記(1)〜(7)のいずれか1項に記載の情報処理装置。
(9)
前記記録音声を分析する音声分析処理部を備え、
前記再生処理部は、前記音声分析処理部による分析結果に基づいて音声強調処理を行う、前記(1)〜(8)のいずれか1項に記載の情報処理装置。
(10)
前記記録音声を分析する音声分析処理部と、
前記音声分析処理部による分析結果に基づいて、当該音声に関する情報を提示する情報提示部と、
を備える、前記(1)〜(8)のいずれか1項に記載の情報処理装置。
(11)
前記情報提示部は、取得された前記音声の音声波形をディスプレイに表示させる、前記(10)に記載の情報処理装置。
(12)
入力された音声に対して所定の音声の補正処理を行い、リアルタイム音声を出力するリアルタイム音声処理部を備える、前記(1)〜(11)のいずれか1項に記載の情報処理装置。
(13)
制御入力に基づいて、前記記録音声及び前記リアルタイム音声の再生処理を行う信号合成切換部をさらに備える、前記(12)に記載の情報処理装置。
(14)
前記信号合成切換部は、前記記録音声の再生時には、前記リアルタイム音声を再生しない、前記(13)に記載の情報処理装置。
(15)
音声を取得し、出力する第1のデバイスと、
前記第1のデバイスにて取得された記録音声の聞き戻しを開始する聞き戻し開始指示に基づいて、当該聞き戻し開始指示が入力された聞き戻し開始時刻より所定時間遡った位置から現時刻に追いつくまで再生させる再生処理部を備える第2のデバイスと、
を含む、情報処理システム。
(16)
前記第1のデバイスは、
前記第2のデバイスに対して送信するデータを圧縮して送信するデータ送信部と、
前記第2のデバイスから受信したデータを伸張するデータ受信部と、
をさらに備える、前記(15)に記載の情報処理システム。
(17)
前記第1のデバイスは、取得した音声の波形データに含まれる特徴量を計算する音声特徴計算部をさらに備え、
前記データ送信部は、前記特徴量を前記第2のデバイスへ送信する、前記(16)に記載の情報処理システム。
(18)
前記第1のデバイスは、取得した音声の波形データに含まれる特徴量を計算する音声特徴計算部をさらに備え、
前記データ送信部は、前記特徴量に基づいて、取得された音声のうち前記第2のデバイスに送信する音声区間を決定し、前記第2のデバイスへ送信する、前記(16)に記載の情報処理システム。
(19)
前記第2のデバイスは、記録音声の聞き戻し再生に関する情報を提示する情報提示部を備える、前記(15)〜(18)のいずれか1項に記載の情報処理システム。
(20)
コンピュータを、録音された記録音声の聞き戻しを開始する聞き戻し開始指示に基づいて、当該聞き戻し開始指示が入力された聞き戻し開始時刻より所定時間遡った位置から現時刻に追いつくまで再生する再生処理部として機能させる、プログラム。
110 音声入力部
120 音響デバイスデータ送信部
121 音声特徴計算部
123 タイムスタンプ情報生成部
130 音響デバイスデータ受信部
140 信号合成切換部
141 第1信号合成切換部
143 リアルタイム音声処理部
145 第2信号合成切換部
150 音声出力部
160 キャンセル信号生成部
200 情報処理デバイス
210 再生処理部
211 情報処理デバイスデータ受信部
212 音声分析処理部
213 再生信号処理部
215 情報処理デバイスデータ送信部
220 制御入力部
231 第1の音声記憶部
233 第2の音声記憶部
240 情報提示部
300 補聴装置
302 音声入出力部
304 再生処理部
310 音声入力部
320 再生信号処理部
321 音声分析処理部
330 信号合成切換部
331 第1信号合成切換部
333 リアルタイム音声処理部
335 第2信号合成切換部
340 制御入力部
350 音声出力部
361 第1の音声記憶部
363 第2の音声記憶部
370 キャンセル信号生成部
380 情報提示部
Claims (4)
- 音声を取得し、出力する第1のデバイスと、
前記第1のデバイスにて取得された記録音声の聞き戻しを開始する聞き戻し開始指示に基づいて、当該聞き戻し開始指示が入力された聞き戻し開始時刻より所定時間遡った位置から現時刻に追いつくまで再生させる再生処理部を備える第2のデバイスと、
を含み、
前記第1のデバイスは、
外部の音声をデジタルの波形データに変換する音声入力部と、
前記波形データを前記第2のデバイスに圧縮して送信するとともに、非可逆符号化を用いて、前記波形データを送るチャンネルおよび帯域を限定するデータ送信部と、
をさらに備え、
前記第1のデバイスは、前記再生処理部の動作に必要な特徴量であって、且つ、前記非可逆符号化前のオリジナルの前記波形データからしか得られない特徴量を、前記オリジナルの波形データから抽出する音声特徴計算部をさらに備え、
前記データ送信部は、前記特徴量を前記第2のデバイスへ送信し、
前記第2のデバイスは、前記データ送信部から入力された前記特徴量および前記波形データを分析し、前記再生処理部による処理に必要な情報を抽出する音声分析処理部をさらに備える
情報処理システム。 - 前記データ送信部は、前記特徴量に基づいて、取得された音声のうち前記第2のデバイスに送信する音声区間を決定し、前記第2のデバイスへ送信する、請求項1に記載の情報処理システム。
- 前記第2のデバイスは、記録音声の聞き戻し再生に関する情報を提示する情報提示部を備える、請求項1または請求項2に記載の情報処理システム。
- コンピュータを、
音声を取得し、出力する第1のデバイスと、
前記第1のデバイスにて取得された記録音声の聞き戻しを開始する聞き戻し開始指示に基づいて、当該聞き戻し開始指示が入力された聞き戻し開始時刻より所定時間遡った位置から現時刻に追いつくまで再生させる再生処理部を備える第2のデバイスと、して機能させ、
前記第1のデバイスは、
外部の音声をデジタルの波形データに変換する音声入力部と、
前記波形データを前記第2のデバイスに圧縮して送信するとともに、非可逆符号化を用いて、前記波形データを送るチャンネルおよび帯域を限定するデータ送信部と、
をさらに備え、
前記第1のデバイスは、前記再生処理部の動作に必要な特徴量であって、且つ、前記非可逆符号化前のオリジナルの前記波形データからしか得られない特徴量を、前記オリジナルの波形データから抽出する音声特徴計算部をさらに備え、
前記データ送信部は、前記特徴量を前記第2のデバイスへ送信し、
前記第2のデバイスは、前記データ送信部から入力された前記特徴量および前記波形データを分析し、前記再生処理部による処理に必要な情報を抽出する音声分析処理部をさらに備える、
プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015205389 | 2015-10-19 | ||
JP2015205389 | 2015-10-19 | ||
PCT/JP2016/074784 WO2017068858A1 (ja) | 2015-10-19 | 2016-08-25 | 情報処理装置、情報処理システム及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017068858A1 JPWO2017068858A1 (ja) | 2018-08-02 |
JP6904255B2 true JP6904255B2 (ja) | 2021-07-14 |
Family
ID=58556932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017546443A Active JP6904255B2 (ja) | 2015-10-19 | 2016-08-25 | 情報処理システム及びプログラム |
Country Status (5)
Country | Link |
---|---|
US (2) | US10666995B2 (ja) |
EP (1) | EP3367382A4 (ja) |
JP (1) | JP6904255B2 (ja) |
CN (1) | CN108028055A (ja) |
WO (1) | WO2017068858A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10666995B2 (en) | 2015-10-19 | 2020-05-26 | Sony Corporation | Information processing apparatus, information processing system, and program |
DK3649792T3 (da) * | 2018-06-08 | 2022-06-20 | Sivantos Pte Ltd | Fremgangsmåde til overførsel af en bearbejdningstilstand i en audiologisk tilpasningsapplikation til et høreapparat |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07129190A (ja) | 1993-09-10 | 1995-05-19 | Hitachi Ltd | 話速変換方法及び話速変換装置並びに電子装置 |
US5717818A (en) * | 1992-08-18 | 1998-02-10 | Hitachi, Ltd. | Audio signal storing apparatus having a function for converting speech speed |
JPH06259884A (ja) * | 1993-03-08 | 1994-09-16 | Sanyo Electric Co Ltd | 磁気再生装置 |
US6721710B1 (en) * | 1999-12-13 | 2004-04-13 | Texas Instruments Incorporated | Method and apparatus for audible fast-forward or reverse of compressed audio content |
CN1463441A (zh) * | 2001-04-20 | 2003-12-24 | 皇家菲利浦电子有限公司 | Mp3的特技播放 |
US6839446B2 (en) * | 2002-05-28 | 2005-01-04 | Trevor I. Blumenau | Hearing aid with sound replay capability |
JP2004104757A (ja) | 2002-07-16 | 2004-04-02 | Advanced Media Inc | 音声入力装置 |
JP2006203900A (ja) * | 2002-07-16 | 2006-08-03 | Advanced Media Inc | 音声認識サーバ及び音声認識システム |
JP2004205578A (ja) * | 2002-12-24 | 2004-07-22 | Toshiba Corp | 音声信号を無線通信する音声再生機器及び音声再生機器の消費電力制御方法 |
JP2005165183A (ja) * | 2003-12-05 | 2005-06-23 | Matsushita Electric Ind Co Ltd | 無線通信装置 |
JP4602204B2 (ja) * | 2005-08-31 | 2010-12-22 | ソニー株式会社 | 音声信号処理装置および音声信号処理方法 |
JP2007304933A (ja) * | 2006-05-12 | 2007-11-22 | Sony Corp | 情報処理システム、端末装置、情報処理方法、プログラム |
US8365235B2 (en) * | 2007-12-18 | 2013-01-29 | Netflix, Inc. | Trick play of streaming media |
US8416959B2 (en) * | 2009-08-17 | 2013-04-09 | SPEAR Labs, LLC. | Hearing enhancement system and components thereof |
US8515089B2 (en) * | 2010-06-04 | 2013-08-20 | Apple Inc. | Active noise cancellation decisions in a portable audio device |
US9749676B2 (en) * | 2010-06-08 | 2017-08-29 | Microsoft Technology Licensing, Llc | Virtual playback speed modification |
JP2012134919A (ja) | 2010-12-24 | 2012-07-12 | Panasonic Corp | 補聴器 |
JP2013114723A (ja) | 2011-11-30 | 2013-06-10 | Sony Corp | 情報処理装置、プログラムおよび情報処理方法 |
US9076427B2 (en) | 2012-05-10 | 2015-07-07 | Cirrus Logic, Inc. | Error-signal content controlled adaptation of secondary and leakage path models in noise-canceling personal audio devices |
US20150024348A1 (en) * | 2013-07-19 | 2015-01-22 | Starkey Laboratories, Inc. | System to visually display and demonstrate hearing assistance device features |
KR102172149B1 (ko) * | 2013-12-03 | 2020-11-02 | 주식회사 케이티 | 컨텐츠 재생 방법, 대사 구간 데이터 제공 방법 및 동영상 컨텐츠 재생 단말 |
US9380374B2 (en) * | 2014-01-17 | 2016-06-28 | Okappi, Inc. | Hearing assistance systems configured to detect and provide protection to the user from harmful conditions |
JP2015139083A (ja) * | 2014-01-22 | 2015-07-30 | 日東電工株式会社 | 聴覚補完システム及び聴覚補完方法 |
US9496000B2 (en) * | 2014-05-16 | 2016-11-15 | Comcast Cable Communications, Llc | Audio modification for adjustable playback rate |
KR102224568B1 (ko) * | 2014-08-27 | 2021-03-08 | 삼성전자주식회사 | 오디오 데이터 처리 방법과 이를 지원하는 전자 장치 |
US10666995B2 (en) | 2015-10-19 | 2020-05-26 | Sony Corporation | Information processing apparatus, information processing system, and program |
-
2016
- 2016-08-25 US US15/767,525 patent/US10666995B2/en active Active
- 2016-08-25 WO PCT/JP2016/074784 patent/WO2017068858A1/ja active Application Filing
- 2016-08-25 EP EP16857176.8A patent/EP3367382A4/en not_active Withdrawn
- 2016-08-25 JP JP2017546443A patent/JP6904255B2/ja active Active
- 2016-08-25 CN CN201680054421.XA patent/CN108028055A/zh active Pending
-
2020
- 2020-03-27 US US16/832,388 patent/US11081136B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3367382A1 (en) | 2018-08-29 |
US20200228849A1 (en) | 2020-07-16 |
US11081136B2 (en) | 2021-08-03 |
JPWO2017068858A1 (ja) | 2018-08-02 |
US20180293970A1 (en) | 2018-10-11 |
CN108028055A (zh) | 2018-05-11 |
EP3367382A4 (en) | 2019-07-10 |
WO2017068858A1 (ja) | 2017-04-27 |
US10666995B2 (en) | 2020-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190279610A1 (en) | Real-Time Audio Processing Of Ambient Sound | |
JP6646817B2 (ja) | 翻訳装置および翻訳方法 | |
US9037458B2 (en) | Systems, methods, apparatus, and computer-readable media for spatially selective audio augmentation | |
KR102513461B1 (ko) | 헤드폰 시스템 | |
CN110602594A (zh) | 具体环境声音提醒模式的耳机装置 | |
JP2018528479A (ja) | スーパー広帯域音楽のための適応雑音抑圧 | |
CN106170108B (zh) | 具有分贝提醒模式的耳机装置 | |
JP2009139592A (ja) | 音声処理装置、音声処理システム及び音声処理プログラム | |
CN110636402A (zh) | 具有本地通话情况确认模式的耳机装置 | |
WO2021176842A1 (ja) | 復号装置、復号方法、プログラム、符号化装置、符号化方法 | |
US20160267925A1 (en) | Audio processing apparatus that outputs, among sounds surrounding user, sound to be provided to user | |
US11081136B2 (en) | Information processing apparatus, information processing system, and program | |
WO2014194273A2 (en) | Systems and methods for enhancing targeted audibility | |
WO2020017518A1 (ja) | 音声信号処理装置 | |
JP4402644B2 (ja) | 発話抑制装置、発話抑制方法および発話抑制装置のプログラム | |
JP3308567B2 (ja) | ディジタル音声処理装置及びディジタル音声処理方法 | |
JP7284570B2 (ja) | 音声再生システムおよびプログラム | |
CN109360588B (zh) | 一种基于移动设备的音频处理方法及装置 | |
JP4458269B2 (ja) | ノイズキャンセルヘッドフォン | |
JP2009075280A (ja) | コンテンツ再生装置 | |
US20220092952A1 (en) | Decoding device, decoding method, and program | |
US20240029755A1 (en) | Intelligent speech or dialogue enhancement | |
JP7515128B2 (ja) | 耳装着型デバイス、及び、再生方法 | |
JP7158480B2 (ja) | 音声信号処理システム、及び音声信号処理装置 | |
JP2012194295A (ja) | 音声出力システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190208 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190214 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190222 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20190515 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190816 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210525 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210607 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6904255 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |