JPWO2017068858A1 - 情報処理装置、情報処理システム及びプログラム - Google Patents
情報処理装置、情報処理システム及びプログラム Download PDFInfo
- Publication number
- JPWO2017068858A1 JPWO2017068858A1 JP2017546443A JP2017546443A JPWO2017068858A1 JP WO2017068858 A1 JPWO2017068858 A1 JP WO2017068858A1 JP 2017546443 A JP2017546443 A JP 2017546443A JP 2017546443 A JP2017546443 A JP 2017546443A JP WO2017068858 A1 JPWO2017068858 A1 JP WO2017068858A1
- Authority
- JP
- Japan
- Prior art keywords
- unit
- voice
- information processing
- time
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 123
- 238000012545 processing Methods 0.000 claims abstract description 166
- 230000006870 function Effects 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 54
- 230000005540 biological transmission Effects 0.000 claims description 43
- 230000008569 process Effects 0.000 claims description 40
- 230000015572 biosynthetic process Effects 0.000 claims description 39
- 238000003786 synthesis reaction Methods 0.000 claims description 39
- 238000004458 analytical method Methods 0.000 claims description 36
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 2
- 238000003860 storage Methods 0.000 description 54
- 238000004364 calculation method Methods 0.000 description 16
- 230000005236 sound signal Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 230000008929 regeneration Effects 0.000 description 9
- 238000011069 regeneration method Methods 0.000 description 9
- 230000001629 suppression Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000004904 shortening Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 210000005069 ears Anatomy 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 239000012141 concentrate Substances 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000001151 other effect Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 241000956207 Picola Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 210000003454 tympanic membrane Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/002—Programmed access in sequence to a plurality of record carriers or indexed parts, e.g. tracks, thereof, e.g. for editing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/005—Reproducing at a different information rate from the information rate of recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
- H04N21/2387—Stream processing in response to a playback request from an end-user, e.g. for trick-play
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/658—Transmission by the client directed to the server
- H04N21/6587—Control parameters, e.g. trick play commands, viewpoint selection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/78—Television signal recording using magnetic recording
- H04N5/782—Television signal recording using magnetic recording on tape
- H04N5/783—Adaptations for reproducing at a rate different from the recording rate
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/41—Detection or adaptation of hearing aid parameters or programs to listening situation, e.g. pub, forest
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Neurosurgery (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Telephone Function (AREA)
Abstract
Description
1.第1の実施形態(分離型:補聴システム)
1.1.システム構成
(1)最小構成
(2)応用構成
1.2.聞き戻し再生処理
(1)聞き戻し再生開始のみ指示する場合
(2)聞き戻し再生終了指示がある場合
1.3.補足
(1)非定常雑音抑圧処理
(2)聞き戻し音声とリアルタイム音声との同時聴取
1.4.まとめ
2.第2の実施形態(一体型:補聴装置)
(1)最小構成
(2)応用構成
3.ハードウェア構成例
[1.1.システム構成]
まず、図1及び図2を参照して、本開示の第1の実施形態に係る補聴システムの機能構成について説明する。本実施形態に係る補聴システムは、音声を取得し、また、音声を出力する音響デバイス100と、音響デバイス100による音声の再生制御を行う情報処理デバイス200とからなる。
まず、図1に基づいて、本実施形態に係る補聴システムの最小限の機能構成を説明する。図1に示す補聴システムは、最小限の機能として、通常の補聴機能に加えて聞き戻し再生機能を実行可能にするものである。
音響デバイス100は、ユーザが耳に装着して使用する部材であり、例えば情報処理機能を備えるデバイスと接続して使用されるイヤホンあるいはヘッドホン等である。イヤホンの形状として、両耳装用の密閉型を想定しているが、本開示はかかる例に限定されない。音響デバイス100は、図1に示すように、音声入力部110と、音響デバイスデータ送信部120と、音響デバイスデータ受信部130と、信号合成切換部140と、音声出力部150とからなる。
情報処理デバイス200は、情報処理機能を備えるデバイスであり、例えば、音響デバイス100とペアリング可能なスマートフォン等の情報処理端末等である。情報処理デバイス200は、図1に示すように、聞き戻し再生処理部210と、制御入力部220と、第1の音声記憶部231と、第2の音声記憶部233とを備える。
次に、図2に基づいて、図1に示した最小構成の補聴システムをベースとして、さらに機能を追加した、補聴システムの一構成例を説明する。図2に示す補聴システムは、最小限の機能である補聴機能及び聞き戻し再生機能に加え、音声分析機能、ノイズキャンセル機能等を備える。以下では、図1に示した最初構成の補聴システムに対して新たに追加された機能について主に説明し、図1の補聴システムと同一の機能構成についての説明は省略する。
音響デバイス100は、図2に示すように、図1に示した音響デバイス100と同様、音声入力部110と、音響デバイスデータ送信部120と、音響デバイスデータ受信部130と、音声出力部150とを備える。さらに、図2の音響デバイス100は、音声特徴計算部121と、タイムスタンプ情報生成部123と、第1信号合成切換部141と、リアルタイム音声処理部143と、第2信号合成切換部145と、キャンセル信号生成部160とを備える。
情報処理デバイス200は、情報処理機能を備えるデバイスであり、例えば、音響デバイス100とペアリング可能なスマートフォン等の情報処理端末等である。情報処理デバイス200は、図2に示すように、聞き戻し再生処理部210と、制御入力部220と、第1の音声記憶部231と、第2の音声記憶部233とを備える。さらに、本実施形態に係る情報処理デバイス200は、情報提示部240を備えている。
以下、本実施形態に係る補聴システムによる聞き戻し再生処理について2つのケースを説明する。以下の2つのケースでは、聞き戻し開始位置からの戻り時間については「現在から5sec過去の音声から聞き戻す」といったように予め設定されているものとし、リアルタイム音声と聞き戻し音声との同時聴取はしないものとして説明する。また、追いかけ再生信号処理部213における短縮再生方法として、1倍速よりも速い速度での再生を行う例を用いて説明する。
まず、図4〜図8に基づいて、本実施形態に係る補聴システムによる聞き戻し再生処理について説明する。なお、図4は、本実施形態に係る補聴システムによる聞き戻し再生処理を示すフローチャートである。図5〜図8は、本実施形態に係る補聴システムによる聞き戻し再生処理を説明するための説明図である。なお、図5〜図8において、Tnowは現時刻の位置を示し、Tpは聞き戻し再生位置を示す。また、T1は聞き戻し再生操作が入力された時点を示し、T2はT1から設定された戻り時間だけ過去に遡った時点を示し、T3は聞き戻し再生位置が現時点に追いついた時点を示している。
次に、図9に基づいて、本実施形態に係る補聴システムによる聞き戻し再生処理の他のケースについて説明する。なお、図9は、聞き戻し再生終了指示がある場合の、聞き戻し再生処理を示すフローチャートである。すなわち、聞き戻し再生開始の操作入力があってから、ユーザの聞き戻し再生終了の操作入力を受けて、聞き戻し音声の短縮再生、リアルタイム音声の再生へと移行するケースを示している。以下では、図4に示した聞き戻し再生処理と異なる処理について主に説明し、同一処理については詳細な説明を省略する。
本実施形態に係る補聴システムでは、取得した音声信号を聞き戻し再生することができるため、音声信号を先読みした音声処理や、演算時間のかかる処理を実行することが可能となる。この結果、より高品質な音声強調が可能になる。
例えば、本実施形態に係る補聴システムでは、非定常雑音抑圧処理を実行することが可能である。例えば、キーボードのタイプ音やドアの開閉等、物同士が衝突したような非定常雑音は耳障りであり、抑圧すべき対象である。一方で、音声の子音部分は、音声の聞き取りに重要であるため、確実に再生する必要がある。しかし、音声の子音部分と上記衝突音等の非定常雑音とは、瞬間的に高域にエネルギーが集中するという共通の特徴があり、瞬時的な信号を観察しただけでは、両者を判別することは困難である。
聞き戻したい音声が長く、その間に自分が何かしらの応答を求められる場合には、聞き戻し音声とリアルタイム音声とを同時聴取する機能があるとよい。そこで、上記実施形態に係る補聴システムにおいて、聞き戻し音声再生の機能を有しつつ、聞き戻し音声とリアルタイム音声との同時聴取を実現することも可能である。
以上、本実施形態に係る補聴システムの構成と、これによる聞き戻し再生処理について説明した。本実施形態によれば、ユーザは音声に聞き逃しがあっても、会話の途中で即座に聞き直しすることができ、聞き戻し音声の再生と通常再生(すなわち、リアルタイム音声の聞き取り)とをスムーズに行き来できる。また、本実施形態に係る補聴システムにより、聞き取りやすい聞き戻し音声を提供することができる。
次に、図10及び図11に基づいて、本開示の第2の実施形態に係る補聴装置300について説明する。本実施形態に係る補聴装置300は、第1の実施形態に係る補聴システムを1つのデバイスにまとめた構成となっている。以下、本実施形態に係る補聴装置300の最小限構成と、最小限構成に対してノイズキャンセル機能等の機能が付加された場合の一構成例について、説明する。なお、図10は、図1に示した第1の実施形態の補聴システムの構成に対応しており、図11は、図2に示した第1の実施形態の補聴システムの構成に対応している。このため、各機能の詳細な説明は省略する。
まず、図10に基づいて、本実施形態に係る補聴装置300の最小限の機能構成を説明する。図10に示す補聴システムは、最小限の機能として、通常の補聴機能に加えて聞き戻し再生機能を実行可能にするものである。
次に、図11に基づいて、図10に示した最小構成の補聴システムをベースとして、さらに機能を追加した、補聴装置300の一構成例を説明する。図11に示す補聴装置300は、最小限の機能である補聴機能及び聞き戻し再生機能に加え、音声分析機能、ノイズキャンセル機能等を備える。以下では、図2に示した第1の実施形態に係る補聴システムと対比しつつ、図10に示した最初構成の補聴システムに対して新たに追加された機能について主に説明する。
最後に、上記実施形態に係る音響デバイス100、情報処理デバイス200、補聴装置300のハードウェア構成例について説明する。これらの機器は同様に構成することができるため、以下では、情報処理デバイス200を例として説明する。図12は、上実施形態に係る情報処理デバイス200のハードウェア構成を示すハードウェア構成図である。
(1)
録音された記録音声の聞き戻しを開始する聞き戻し開始指示に基づいて、当該聞き戻し開始指示が入力された聞き戻し開始時刻より所定時間遡った位置から現時刻に追いつくまで再生する再生処理部を備える、情報処理装置。
(2)
前記再生処理部は、前記記録音声を、前記聞き戻し開始時刻までは第1の再生速度で再生し、前記聞き戻し開始時刻から現時刻までは第2の再生速度で再生する、前記(1)に記載の情報処理装置。
(3)
前記聞き戻し開始時刻に到達する前に前記記録音声の聞き戻し終了指示が入力されたとき、前記再生処理部は、前記記録音声の再生位置を前記聞き戻し開始時刻に移動する、前記(2)に記載の情報処理装置。
(4)
前記第2の再生速度は、前記第1の再生速度以上である、前記(2)または(3)に記載の情報処理装置。
(5)
前記第2の再生速度は1倍速より速い、前記(2)〜(4)のいずれか1項に記載の情報処理装置。
(6)
前記再生処理部は、前記聞き戻し開始時刻から前記現時刻までの区間のうち少なくとも一部をスキップして再生する、前記(1)〜(5)に記載の情報処理装置。
(7)
スキップされるスキップ対象区間は、人の声の存在しない時間区間または無音区間である、前記(6)に記載の情報処理装置。
(8)
少なくとも前記記録音声の再生中にノイズキャンセリング機能を実行するキャンセル信号生成部をさらに備える、前記(1)〜(7)のいずれか1項に記載の情報処理装置。
(9)
前記記録音声を分析する音声分析処理部を備え、
前記再生処理部は、前記音声分析処理部による分析結果に基づいて音声強調処理を行う、前記(1)〜(8)のいずれか1項に記載の情報処理装置。
(10)
前記記録音声を分析する音声分析処理部と、
前記音声分析処理部による分析結果に基づいて、当該音声に関する情報を提示する情報提示部と、
を備える、前記(1)〜(8)のいずれか1項に記載の情報処理装置。
(11)
前記情報提示部は、取得された前記音声の音声波形をディスプレイに表示させる、前記(10)に記載の情報処理装置。
(12)
入力された音声に対して所定の音声の補正処理を行い、リアルタイム音声を出力するリアルタイム音声処理部を備える、前記(1)〜(11)のいずれか1項に記載の情報処理装置。
(13)
制御入力に基づいて、前記記録音声及び前記リアルタイム音声の再生処理を行う信号合成切換部をさらに備える、前記(12)に記載の情報処理装置。
(14)
前記信号合成切換部は、前記記録音声の再生時には、前記リアルタイム音声を再生しない、前記(13)に記載の情報処理装置。
(15)
音声を取得し、出力する第1のデバイスと、
前記第1のデバイスにて取得された記録音声の聞き戻しを開始する聞き戻し開始指示に基づいて、当該聞き戻し開始指示が入力された聞き戻し開始時刻より所定時間遡った位置から現時刻に追いつくまで再生させる再生処理部を備える第2のデバイスと、
を含む、情報処理システム。
(16)
前記第1のデバイスは、
前記第2のデバイスに対して送信するデータを圧縮して送信するデータ送信部と、
前記第2のデバイスから受信したデータを伸張するデータ受信部と、
をさらに備える、前記(15)に記載の情報処理システム。
(17)
前記第1のデバイスは、取得した音声の波形データに含まれる特徴量を計算する音声特徴計算部をさらに備え、
前記データ送信部は、前記特徴量を前記第2のデバイスへ送信する、前記(16)に記載の情報処理システム。
(18)
前記第1のデバイスは、取得した音声の波形データに含まれる特徴量を計算する音声特徴計算部をさらに備え、
前記データ送信部は、前記特徴量に基づいて、取得された音声のうち前記第2のデバイスに送信する音声区間を決定し、前記第2のデバイスへ送信する、前記(16)に記載の情報処理システム。
(19)
前記第2のデバイスは、記録音声の聞き戻し再生に関する情報を提示する情報提示部を備える、前記(15)〜(18)のいずれか1項に記載の情報処理システム。
(20)
コンピュータを、録音された記録音声の聞き戻しを開始する聞き戻し開始指示に基づいて、当該聞き戻し開始指示が入力された聞き戻し開始時刻より所定時間遡った位置から現時刻に追いつくまで再生する再生処理部として機能させる、プログラム。
110 音声入力部
120 音響デバイスデータ送信部
121 音声特徴計算部
123 タイムスタンプ情報生成部
130 音響デバイスデータ受信部
140 信号合成切換部
141 第1信号合成切換部
143 リアルタイム音声処理部
145 第2信号合成切換部
150 音声出力部
160 キャンセル信号生成部
200 情報処理デバイス
210 再生処理部
211 情報処理デバイスデータ受信部
212 音声分析処理部
213 再生信号処理部
215 情報処理デバイスデータ送信部
220 制御入力部
231 第1の音声記憶部
233 第2の音声記憶部
240 情報提示部
300 補聴装置
302 音声入出力部
304 再生処理部
310 音声入力部
320 再生信号処理部
321 音声分析処理部
330 信号合成切換部
331 第1信号合成切換部
333 リアルタイム音声処理部
335 第2信号合成切換部
340 制御入力部
350 音声出力部
361 第1の音声記憶部
363 第2の音声記憶部
370 キャンセル信号生成部
380 情報提示部
Claims (20)
- 録音された記録音声の聞き戻しを開始する聞き戻し開始指示に基づいて、当該聞き戻し開始指示が入力された聞き戻し開始時刻より所定時間遡った位置から現時刻に追いつくまで再生する再生処理部を備える、情報処理装置。
- 前記再生処理部は、前記記録音声を、前記聞き戻し開始時刻までは第1の再生速度で再生し、前記聞き戻し開始時刻から現時刻までは第2の再生速度で再生する、請求項1に記載の情報処理装置。
- 前記聞き戻し開始時刻に到達する前に前記記録音声の聞き戻し終了指示が入力されたとき、前記再生処理部は、前記記録音声の再生位置を前記聞き戻し開始時刻に移動する、請求項2に記載の情報処理装置。
- 前記第2の再生速度は、前記第1の再生速度以上である、請求項2に記載の情報処理装置。
- 前記第2の再生速度は1倍速より速い、請求項2に記載の情報処理装置。
- 前記再生処理部は、前記聞き戻し開始時刻から前記現時刻までの区間のうち少なくとも一部をスキップして再生する、請求項1に記載の情報処理装置。
- スキップされるスキップ対象区間は、人の声の存在しない時間区間または無音区間である、請求項6に記載の情報処理装置。
- 少なくとも前記記録音声の再生中にノイズキャンセリング機能を実行するキャンセル信号生成部をさらに備える、請求項1に記載の情報処理装置。
- 前記記録音声を分析する音声分析処理部を備え、
前記再生処理部は、前記音声分析処理部による分析結果に基づいて音声強調処理を行う、請求項1に記載の情報処理装置。 - 前記記録音声を分析する音声分析処理部と、
前記音声分析処理部による分析結果に基づいて、当該音声に関する情報を提示する情報提示部と、
を備える、請求項1に記載の情報処理装置。 - 前記情報提示部は、取得された前記音声の音声波形をディスプレイに表示させる、請求項10に記載の情報処理装置。
- 入力された音声に対して所定の音声の補正処理を行い、リアルタイム音声を出力するリアルタイム音声処理部を備える、請求項1に記載の情報処理装置。
- 制御入力に基づいて、前記記録音声及び前記リアルタイム音声の再生処理を行う信号合成切換部をさらに備える、請求項12に記載の情報処理装置。
- 前記信号合成切換部は、前記記録音声の再生時には、前記リアルタイム音声を再生しない、請求項13に記載の情報処理装置。
- 音声を取得し、出力する第1のデバイスと、
前記第1のデバイスにて取得された記録音声の聞き戻しを開始する聞き戻し開始指示に基づいて、当該聞き戻し開始指示が入力された聞き戻し開始時刻より所定時間遡った位置から現時刻に追いつくまで再生させる再生処理部を備える第2のデバイスと、
を含む、情報処理システム。 - 前記第1のデバイスは、
前記第2のデバイスに対して送信するデータを圧縮して送信するデータ送信部と、
前記第2のデバイスから受信したデータを伸張するデータ受信部と、
をさらに備える、請求項15に記載の情報処理システム。 - 前記第1のデバイスは、取得した音声の波形データに含まれる特徴量を計算する音声特徴計算部をさらに備え、
前記データ送信部は、前記特徴量を前記第2のデバイスへ送信する、請求項16に記載の情報処理システム。 - 前記第1のデバイスは、取得した音声の波形データに含まれる特徴量を計算する音声特徴計算部をさらに備え、
前記データ送信部は、前記特徴量に基づいて、取得された音声のうち前記第2のデバイスに送信する音声区間を決定し、前記第2のデバイスへ送信する、請求項16に記載の情報処理システム。 - 前記第2のデバイスは、記録音声の聞き戻し再生に関する情報を提示する情報提示部を備える、請求項15に記載の情報処理システム。
- コンピュータを、録音された記録音声の聞き戻しを開始する聞き戻し開始指示に基づいて、当該聞き戻し開始指示が入力された聞き戻し開始時刻より所定時間遡った位置から現時刻に追いつくまで再生する再生処理部として機能させる、プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015205389 | 2015-10-19 | ||
JP2015205389 | 2015-10-19 | ||
PCT/JP2016/074784 WO2017068858A1 (ja) | 2015-10-19 | 2016-08-25 | 情報処理装置、情報処理システム及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017068858A1 true JPWO2017068858A1 (ja) | 2018-08-02 |
JP6904255B2 JP6904255B2 (ja) | 2021-07-14 |
Family
ID=58556932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017546443A Active JP6904255B2 (ja) | 2015-10-19 | 2016-08-25 | 情報処理システム及びプログラム |
Country Status (5)
Country | Link |
---|---|
US (2) | US10666995B2 (ja) |
EP (1) | EP3367382A4 (ja) |
JP (1) | JP6904255B2 (ja) |
CN (1) | CN108028055A (ja) |
WO (1) | WO2017068858A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6904255B2 (ja) | 2015-10-19 | 2021-07-14 | ソニーグループ株式会社 | 情報処理システム及びプログラム |
DK3649792T3 (da) * | 2018-06-08 | 2022-06-20 | Sivantos Pte Ltd | Fremgangsmåde til overførsel af en bearbejdningstilstand i en audiologisk tilpasningsapplikation til et høreapparat |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06259884A (ja) * | 1993-03-08 | 1994-09-16 | Sanyo Electric Co Ltd | 磁気再生装置 |
JPH07129190A (ja) * | 1993-09-10 | 1995-05-19 | Hitachi Ltd | 話速変換方法及び話速変換装置並びに電子装置 |
JP2004205578A (ja) * | 2002-12-24 | 2004-07-22 | Toshiba Corp | 音声信号を無線通信する音声再生機器及び音声再生機器の消費電力制御方法 |
JP2005165183A (ja) * | 2003-12-05 | 2005-06-23 | Matsushita Electric Ind Co Ltd | 無線通信装置 |
JP2006203900A (ja) * | 2002-07-16 | 2006-08-03 | Advanced Media Inc | 音声認識サーバ及び音声認識システム |
US20110038496A1 (en) * | 2009-08-17 | 2011-02-17 | Spear Labs, Llc | Hearing enhancement system and components thereof |
JP2015517683A (ja) * | 2012-05-10 | 2015-06-22 | シラス ロジック、インコーポレイテッド | 雑音消去パーソナルオーディオデバイスにおける二次経路モデルおよび漏出経路モデルのエラー信号コンテンツ制御適応 |
JP2015139083A (ja) * | 2014-01-22 | 2015-07-30 | 日東電工株式会社 | 聴覚補完システム及び聴覚補完方法 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5717818A (en) * | 1992-08-18 | 1998-02-10 | Hitachi, Ltd. | Audio signal storing apparatus having a function for converting speech speed |
US6721710B1 (en) * | 1999-12-13 | 2004-04-13 | Texas Instruments Incorporated | Method and apparatus for audible fast-forward or reverse of compressed audio content |
JP2004524776A (ja) * | 2001-04-20 | 2004-08-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Mp3のトリック再生 |
US6839446B2 (en) * | 2002-05-28 | 2005-01-04 | Trevor I. Blumenau | Hearing aid with sound replay capability |
JP2004104757A (ja) | 2002-07-16 | 2004-04-02 | Advanced Media Inc | 音声入力装置 |
JP4602204B2 (ja) * | 2005-08-31 | 2010-12-22 | ソニー株式会社 | 音声信号処理装置および音声信号処理方法 |
JP2007304933A (ja) * | 2006-05-12 | 2007-11-22 | Sony Corp | 情報処理システム、端末装置、情報処理方法、プログラム |
US8365235B2 (en) * | 2007-12-18 | 2013-01-29 | Netflix, Inc. | Trick play of streaming media |
US8515089B2 (en) * | 2010-06-04 | 2013-08-20 | Apple Inc. | Active noise cancellation decisions in a portable audio device |
US9749676B2 (en) * | 2010-06-08 | 2017-08-29 | Microsoft Technology Licensing, Llc | Virtual playback speed modification |
JP2012134919A (ja) | 2010-12-24 | 2012-07-12 | Panasonic Corp | 補聴器 |
JP2013114723A (ja) | 2011-11-30 | 2013-06-10 | Sony Corp | 情報処理装置、プログラムおよび情報処理方法 |
US20150024348A1 (en) * | 2013-07-19 | 2015-01-22 | Starkey Laboratories, Inc. | System to visually display and demonstrate hearing assistance device features |
KR102172149B1 (ko) * | 2013-12-03 | 2020-11-02 | 주식회사 케이티 | 컨텐츠 재생 방법, 대사 구간 데이터 제공 방법 및 동영상 컨텐츠 재생 단말 |
US9380374B2 (en) * | 2014-01-17 | 2016-06-28 | Okappi, Inc. | Hearing assistance systems configured to detect and provide protection to the user from harmful conditions |
US9496000B2 (en) * | 2014-05-16 | 2016-11-15 | Comcast Cable Communications, Llc | Audio modification for adjustable playback rate |
KR102224568B1 (ko) * | 2014-08-27 | 2021-03-08 | 삼성전자주식회사 | 오디오 데이터 처리 방법과 이를 지원하는 전자 장치 |
JP6904255B2 (ja) | 2015-10-19 | 2021-07-14 | ソニーグループ株式会社 | 情報処理システム及びプログラム |
-
2016
- 2016-08-25 JP JP2017546443A patent/JP6904255B2/ja active Active
- 2016-08-25 US US15/767,525 patent/US10666995B2/en active Active
- 2016-08-25 WO PCT/JP2016/074784 patent/WO2017068858A1/ja active Application Filing
- 2016-08-25 CN CN201680054421.XA patent/CN108028055A/zh active Pending
- 2016-08-25 EP EP16857176.8A patent/EP3367382A4/en not_active Withdrawn
-
2020
- 2020-03-27 US US16/832,388 patent/US11081136B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06259884A (ja) * | 1993-03-08 | 1994-09-16 | Sanyo Electric Co Ltd | 磁気再生装置 |
JPH07129190A (ja) * | 1993-09-10 | 1995-05-19 | Hitachi Ltd | 話速変換方法及び話速変換装置並びに電子装置 |
JP2006203900A (ja) * | 2002-07-16 | 2006-08-03 | Advanced Media Inc | 音声認識サーバ及び音声認識システム |
JP2004205578A (ja) * | 2002-12-24 | 2004-07-22 | Toshiba Corp | 音声信号を無線通信する音声再生機器及び音声再生機器の消費電力制御方法 |
JP2005165183A (ja) * | 2003-12-05 | 2005-06-23 | Matsushita Electric Ind Co Ltd | 無線通信装置 |
US20110038496A1 (en) * | 2009-08-17 | 2011-02-17 | Spear Labs, Llc | Hearing enhancement system and components thereof |
JP2015517683A (ja) * | 2012-05-10 | 2015-06-22 | シラス ロジック、インコーポレイテッド | 雑音消去パーソナルオーディオデバイスにおける二次経路モデルおよび漏出経路モデルのエラー信号コンテンツ制御適応 |
JP2015139083A (ja) * | 2014-01-22 | 2015-07-30 | 日東電工株式会社 | 聴覚補完システム及び聴覚補完方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3367382A4 (en) | 2019-07-10 |
EP3367382A1 (en) | 2018-08-29 |
US20180293970A1 (en) | 2018-10-11 |
US11081136B2 (en) | 2021-08-03 |
CN108028055A (zh) | 2018-05-11 |
JP6904255B2 (ja) | 2021-07-14 |
WO2017068858A1 (ja) | 2017-04-27 |
US20200228849A1 (en) | 2020-07-16 |
US10666995B2 (en) | 2020-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11251763B2 (en) | Audio signal adjustment method, storage medium, and terminal | |
JP5962038B2 (ja) | 信号処理装置、信号処理方法、プログラム、信号処理システムおよび通信端末 | |
US20190279610A1 (en) | Real-Time Audio Processing Of Ambient Sound | |
US5794201A (en) | Digital acoustic signal processing apparatus | |
CN110602594A (zh) | 具体环境声音提醒模式的耳机装置 | |
JP2018528479A (ja) | スーパー広帯域音楽のための適応雑音抑圧 | |
JP2013501969A (ja) | 方法、システム及び機器 | |
WO2019033987A1 (zh) | 提示方法、装置、存储介质及终端 | |
EP3364638B1 (en) | Recording method, recording playing method and apparatus, and terminal | |
CN106170108B (zh) | 具有分贝提醒模式的耳机装置 | |
KR20190024775A (ko) | 헤드폰 시스템 | |
JP2009139592A (ja) | 音声処理装置、音声処理システム及び音声処理プログラム | |
JP2014515140A (ja) | 骨伝導振動子を備えるユーザインタフェースを制御するためのシステムおよび装置 | |
CN110636402A (zh) | 具有本地通话情况确认模式的耳机装置 | |
CN105704598A (zh) | 一种歌唱耳机 | |
US11081136B2 (en) | Information processing apparatus, information processing system, and program | |
WO2014194273A2 (en) | Systems and methods for enhancing targeted audibility | |
WO2020017518A1 (ja) | 音声信号処理装置 | |
JP3308567B2 (ja) | ディジタル音声処理装置及びディジタル音声処理方法 | |
JP7284570B2 (ja) | 音声再生システムおよびプログラム | |
JP4402644B2 (ja) | 発話抑制装置、発話抑制方法および発話抑制装置のプログラム | |
CN109360588B (zh) | 一种基于移动设备的音频处理方法及装置 | |
US7356153B2 (en) | Hearing assistive apparatus having sound replay capability | |
JP2009075280A (ja) | コンテンツ再生装置 | |
CN109360574B (zh) | 一种无线蓝牙系统改进的高级音频编码/解码方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190208 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190214 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190222 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20190515 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190816 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210525 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210607 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6904255 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |