JP2016001221A - 音声データ送信装置およびその動作方法 - Google Patents

音声データ送信装置およびその動作方法 Download PDF

Info

Publication number
JP2016001221A
JP2016001221A JP2014120506A JP2014120506A JP2016001221A JP 2016001221 A JP2016001221 A JP 2016001221A JP 2014120506 A JP2014120506 A JP 2014120506A JP 2014120506 A JP2014120506 A JP 2014120506A JP 2016001221 A JP2016001221 A JP 2016001221A
Authority
JP
Japan
Prior art keywords
voice
audio
audio data
network
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014120506A
Other languages
English (en)
Other versions
JP6297933B2 (ja
Inventor
滋 藤村
Shigeru Fujimura
滋 藤村
山田 智広
Tomohiro Yamada
智広 山田
宮原 伸二
Shinji Miyahara
伸二 宮原
優一 槙
Yuichi Maki
優一 槙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014120506A priority Critical patent/JP6297933B2/ja
Publication of JP2016001221A publication Critical patent/JP2016001221A/ja
Application granted granted Critical
Publication of JP6297933B2 publication Critical patent/JP6297933B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】クライアント−サーバモデルの音声認識システムにおいて、利用者が音声を入力してからテキストデータが得られるまでの時間を短く感じさせ、かつ、ネットワークの混雑助長を防止可能にするための技術を提供する。【解決手段】ネットワーク監視装置2から、ネットワークNにおける混雑状況を示す情報を取得し、取得した混雑状況を示す情報が予め定めた混雑状況より高いことを示すものか否かを判定する(S1)。ステップS1でNO、さらにステップS3でもNOと判定されたなら、利用履歴データベース12に記憶された音声の時間長が予め定めた時間長より長いか否かを判定する(S5)。ステップS1でYES、または、ステップS5でYESと判定されたなら、非圧縮音声データを圧縮し、音声認識装置3に送信する(S11)。ステップS5でNOと判定されたなら、非圧縮音声データをそのまま、音声認識装置3に送信する(S13)。【選択図】図5

Description

本発明は、音声データ送信装置およびその動作方法に関するものである。
各種の機器やサービスにとって、音声での入力手段を備えることは、利用者に対しての利便性を高めるという点で重要である。音声入力のためには、音声認識システムが必要となる。クライアント−サーバモデルの音声認識システムでは、音声データのサイズがテキストデータより大きいこともあり、特にネットワーク帯域が細い場合には、音声データの圧縮が必要となる。音声データの圧縮を考慮したクライアント−サーバモデルでの音声認識システムとしては、音声認識の精度も考慮した方法が提案されている(特許文献1参照)。
特開2006−350090号公報
クライアント−サーバモデルの音声認識システムでは、クライアント(端末)に音声が入力され、音声データがサーバ(音声認識装置)に送信され、テキストデータに変換され、端末にテキストデータが送信される。端末は予め音声データを圧縮することもある。
圧縮すれば、音声データの送信時間は短くなるが、圧縮と伸張の時間が必要となる。圧縮しなければ、音声データの送信時間は長くなるが、圧縮と伸張の時間が不要となる。両者はトレードオフの関係にある。
例えば、音声の時間長が長く、音声データの送信時間が比較的長くなるような場合は、圧縮と伸張の時間が占める割合は小さい。よって、利用者は、音声の時間長が長いのだから、テキストデータが得られるまでの時間が長いのは仕方がないと感じ、これを許容すると考えられる。
しかし、音声の時間長が短く、音声データの送信時間が比較的短くなるような場合は、圧縮と伸張の時間が大きな割合を占める。よって、利用者は、音声の時間長が短い割には、テキストデータが得られるまでの時間が長いと感じ、これを不満に思う可能性がある。例えば、計算能力の低い端末では、圧縮に長時間を要するので、利用者は、一層そう思う可能性がある。
また、音声データが送信されるネットワークは、状況や時間帯などによっては混雑する。混雑時に非圧縮の音声データを送信するのは、混雑を助長することになるので、避けるのが好ましい。
本発明は、上記の課題に鑑みてなされたものであり、その目的とするところは、クライアント−サーバモデルの音声認識システムにおいて、利用者が音声を入力してからテキストデータが得られるまでの時間を短く感じさせ、かつ、ネットワークの混雑助長を防止可能にするための技術を提供することにある。
上記の課題を解決するために、第1の本発明は、音声を入力する音声入力部と、過去に入力された音声の時間長が記憶される利用履歴データベースと、前記音声入力部に入力された音声の非圧縮音声データまたは該非圧縮音声データを圧縮した圧縮音声データをネットワークに送出する音声データ送信部とを備え、前記音声データ送信部は、前記ネットワークを監視するネットワーク監視装置から当該ネットワークにおける混雑状況を示す情報を取得し、当該混雑状況を示す情報および前記利用履歴データベースに記憶された音声の時間長に基づいて、前記音声入力部に入力された音声の非圧縮音声データを圧縮するか否かを判断することを特徴とする。
第2の本発明は、音声データ送信装置の動作方法であって、前記音声データ送信装置は、音声を入力する音声入力部と、過去に入力された音声の時間長が記憶される利用履歴データベースと、前記音声入力部に入力された音声の非圧縮音声データまたは該非圧縮音声データを圧縮した圧縮音声データをネットワークに送出する音声データ送信部とを備え、前記動作方法は、前記音声入力部が音声を入力するステップと、前記音声データ送信部が、前記ネットワークを監視するネットワーク監視装置から当該ネットワークにおける混雑状況を取得するステップと、前記音声データ送信部が、当該混雑状況および前記利用履歴データベースに記憶された音声の時間長に基づいて、前記音声入力部に入力された音声の非圧縮音声データを圧縮するか否かを判定するステップとを含む特徴とする。
本発明によれば、クライアント−サーバモデルの音声認識システムにおいて、利用者が音声を入力してからテキストデータが得られるまでの時間を短く感じさせ、かつ、ネットワークの混雑助長を防止できる。
本実施の形態に係る音声データ送信装置を含む音声認識システムの概略図である。 ストリーミング送信方式とファイル送信方式の比較を示す図である。 圧縮しながらのストリーミング送信を示す図である。 ネットワーク帯域と遅延の推定値を示す図である。 音声データ送信部13の処理の流れを示すフローチャートである。 利用履歴データベース12の形式の一例を示す図である。 ネットワーク監視装置2が圧縮の要否を音声データ送信部13に通知する場合に行う処理の一例を示すフローチャートである。
以下、本発明の実施の形態について図面を参照して説明する。
図1は、本実施の形態に係る音声データ送信装置を含む音声認識システムの概略図である。
音声認識システムは、クライアント−サーバモデルの音声認識システムであり、クライアントである音声データ送信装置1は、ネットワークNに接続され、ネットワークNには、ネットワーク監視装置2およびサーバである音声認識装置3が接続される。音声データ送信装置1は、例えば、携帯端末、スマートフォンである。
音声データ送信装置1は、音声を入力する音声入力部11、過去に入力された音声の時間長が記憶される利用履歴データベース12、音声入力部11に入力された音声の非圧縮音声データまたは非圧縮音声データを圧縮した圧縮音声データをネットワークNを介して音声認識装置3に送信する音声データ送信部13、音声認識装置3からネットワークNを介して音声認識の結果であるテキストデータを受信するテキストデータ受信部14を備える。
音声入力部11は、音声データ送信装置1内に組込まれているマイクを制御し、音声データ送信装置1の利用者の音声を入力し、音声を機械処理可能なデジタルデータである非圧縮音声データに変換し、音声データ送信部13に渡す。
ここで、近年広く普及しているスマートフォンにおいては、OSレベルでマイク等のハードウェア制御を行うためのソフトウェア開発者向けSDK(Software Development Kit)が用意されていることが多く、指定されたプログラミング言語で特定のインターフェイスを通してマイクから音声データを取得することができる。取得された音声データは、最も一般的な非圧縮デジタルオーディオデータフォーマットであるリニアパルス符号変調(リニアPCM)フォーマットで扱われることが多い。
また、近年では、スマートフォン上のアプリケーションの一つであるブラウザからも端末のマイク制御が可能になってきており、例えば、WebRTCに含まれるMediaStream APIとWeb Audio APIを組み合わせて利用することで、リニアPCMフォーマットの音声データを取得することが可能である。なお、WebRTC、Web Audio APIについては、共にW3Cで標準化に向けた議論が行われている(ただし、2014年4月時点)。
音声データ送信部13は、ネットワーク監視装置2からネットワークNの混雑状況、音声認識装置3から負荷状況を取得し、混雑状況と負荷状況と利用履歴データベース12に記憶された音声の時間長に基づき、音声を入力してからテキストデータが得られるまでの時間を利用者が短く感じるという状況を確保した上で、非圧縮音声データを必要ならば圧縮し、非圧縮音声データまたは圧縮した圧縮音声データをネットワークNを介して音声認識装置3に送信する。
ここで、圧縮するか否かが遅延に及ぼす影響について説明する。
音声を非圧縮音声データに変換(量子化)する際の量子化ビット数を16、チャンネル数を1、サンプリング周波数を16kHzとする。この場合、非圧縮音声データ(リニアPCM)のビットレートは256kbps(=16×1×16)となる。
非圧縮音声データの圧縮の方式については、既に様々な方式が提案されており、大きく可逆圧縮と非可逆圧縮に分けられる。通常、音声認識システムにおいては、例えば、音声データの品質に関しての要求がそれほど高くないこともあり、圧縮率を重視し非可逆圧縮を用いることが多かった。例えば、speexやopusなどである。ここでは、圧縮率を仮に10%とし、圧縮後の圧縮音声データのビットレートについては25.6kbpsとする。また、圧縮および伸長(圧縮されたデータを非圧縮の状態に戻すこと)に要する時間については、処理を行う端末の処理性能に大きく依存するが、現在広く普及しているパーソナルコンピュータ(PC)においては、概ね入力される音声の実時間長に対して1/10 〜 1/50程度であることが多い。一方で、スマートフォンを含む携帯端末においては、現状では、PCよりも処理能力が低いこともあり、ここでは、仮に圧縮に擁する時間を実時間長の1/2と仮定する。
クライアント−サーバモデルの音声認識システムでは、ストリーミング形式の音声データ送信方法を用いることが一般的である。ストリーミング形式を用いることで、発話終了を待たずに音声データの送信を開始できる。
図2に示す通り、発話終了後にまとめてデータを送信するファイル送信形式よりも音声データ全体のサーバへの到着を早めることが可能になる。結果として、利用者の発話終了後、すみやかに音声認識等の処理を開始できる。ストリーミング送信において、音声データを都度送信する際の単位をフレームと呼び、1フレームの時間的な長さは数十ms程度とすることが多い。ここでは、仮に50msとする。
ストリーミング形式での送信に圧縮を組み合わせた場合、処理のイメージは図3のようになる。
ここで、音声認識装置3において、最終的な認識結果(テキストデータ)を得るためには、音声データ(非圧縮音声データまたは圧縮音声データ)全体が音声認識装置3に到達していなければならない。発話終了から音声データ全体の音声認識装置3への到達に要する時間については、図2、3からも分かる通り、音声データの最終フレームのみを考慮することで十分である。
以上の考察より、非圧縮の場合、発話終了から音声認識装置3が音声認識処理を開始できるまでの時間(処理開始までの遅延、以降、単に遅延と示す)は次の式(1)で求めることができる。
Figure 2016001221
同様に、圧縮を行う場合については次の式(2)となる。
Figure 2016001221
ここで、一例として、ネットワーク帯域を25.6Mbpsとした場合、既に示したビットレート、圧縮処理時間、および、フレーム長を用いた上で、式(2)における伸長時間については、音声認識装置3が主としてサーバ側で構成されることを鑑み、処理能力が携帯端末と比較し大幅に高いことから、ここでは伸長時間を無視すると、遅延は圧縮を行った場合25.05ms圧縮を行わなかった場合0.5msとなり、非圧縮の方が音声認識処理開始までの遅延が小さくなることが分かる。
同様にして、ネットワーク帯域について複数のケースでの遅延をまとめたものが図4であり、ネットワーク帯域が細い場合は圧縮を行った方が遅延が小さく、ネットワーク帯域が太い場合は非圧縮の場合の方が遅延が小さい。
このような圧縮するか否かが遅延に及ぼす影響を考慮し、音声データ送信部13は図5に示す様な流れで、非圧縮音声データに対し、圧縮を行うか否かを決定する。
より具体的には、まず、音声データ送信部13は、ネットワーク監視装置2から、ネットワークNにおける混雑状況を示す情報を取得し、取得した混雑状況を示す情報が予め定めた混雑状況より高いことを示すものか否かを判定する(S1)。
例えば、ネットワーク監視装置2は、混雑状況を示す情報として圧縮の要否を音声データ送信部13に通知する。この場合のネットワーク監視装置2の処理内容については後述する。音声認識装置3から圧縮の要否が通知される場合、音声データ送信部13は、圧縮必要の通知か、圧縮不要の通知かを判定する(S1)。
なお、これに限らず、例えば、混雑状況を示す情報は混雑状況の高さを示す数値であってもよい。その場合、音声データ送信部13は、数値が予め定めた閾値より高いか否かを判定する(S1)。
なお、例えば、混雑状況を示す情報は、混雑状況の低さを示す数値(例えば、実効スループット)であってもよい。その場合、音声データ送信部13は、実効スループットが予め定めた閾値より低いか否かを判定する(S1)。
ステップS1でNOと判定されたなら、音声データ送信部13は、音声認識装置3から音声認識装置3における負荷状況を示す情報を取得し、取得した負荷状況を示す情報が予め定めた負荷状況より高いことを示すものか否かを判定する(S3)。
混雑状況と同様に、負荷状況を示す情報は、例えば、圧縮の要否である。例えば、音声認識装置3は、自身のネットワークインタフェースの利用率が予め定めた閾値より高いなら、圧縮が必要であると通知し、利用率が閾値以下なら、圧縮が不要であると通知する。
この場合、音声データ送信部13は、圧縮必要の通知か、圧縮不要の通知かを判定する(S3)。
なお、これに限らず、例えば、負荷状況を示す情報は負荷状況の高さを示す数値(前述の利用率など)であってもよい。この場合、音声データ送信部13は、数値が予め定めた閾値より高いか否かを判定する(S3)。
以上、2つの条件については、利用者が遅延を短く感じるようにするという目的に加え、ネットワークNの帯域を有効に使い、なるべく多くの利用者に音声認識装置3を利用してもらうという目的もある。つまり、ネットワークNの全体が空いている場合、音声認識装置3に十分な余裕がある場合には、利用者が遅延を短く感じるようにすべく、非圧縮音声データをやりとりする。
ステップS3でNOと判定されたなら、音声データ送信部13は、利用履歴データベース12に記憶された音声の時間長が予め定めた時間長より長いか否かを判定する(S5)。
記憶された音声の時間長が比較的長い場合、利用者は、その音声の音声認識に長時間を要することを経験的に把握している。よって、多少の遅延を利用者は許容するものと考えられる。
一方、記憶された音声の時間長が比較的短い場合、利用者にとって遅延が許容しがたいものとなると考えられる。
したがって、記憶された音声の時間長が短い場合、非圧縮音声データのままとし、遅延を小さくすることが有効と考えられる。
図6は、利用履歴データベース12の形式の一例を示す図である。
利用履歴データベース12には、過去に利用したサービス、利用日時、音声が入力されたかテキストデータが入力されたかのフラグ、入力データ(テキストデータが入力された場合はそのテキストデータが、一方、音声が入力された場合は音声認識された結果のテキストデータが保持される)、音声が入力された場合の音声の時間長を含む利用履歴が蓄積される。
ここで、ステップS5の判定に用いる音声の時間長の求め方を説明する。
具体的には、利用者が今音声入力を行おうとしているサービスの過去の利用履歴をn件(例えば、n=5)、利用履歴データベース12から取り出す。ここで、利用履歴データベース12から取り出す過去の利用履歴を、現在利用しようとしているサービスと同一のものという限定を行う例を示したが、当該限定を行わなくてもよい。
取り出したn件の利用履歴の中に、テキストデータが入力されたことを示すフラグを含む利用履歴がある場合には、入力データ(テキストデータ)を音節で表したものに変換した上で、ステップS5の判定に用いる音声の時間長を、以下の式(3)によって、求める。
Figure 2016001221
ここで、kは利用者ごとに異なる話すスピードに基づいた係数である。一例として、係数kは、利用履歴データベース12において、音声が入力されたことを示すフラグを含む利用履歴における音声の時間長と入力データに基づき、式(3)の関係性を利用し、最小二乗法によって求められる。
得られたn件の利用履歴における音声の時間長の平均値を、ステップS5の判定に用いる音声の時間長とする。
ステップS5では、これが予め定めた閾値Tp(例えば、Tp=5.0)より長いか否かを判定する。
なお、利用履歴データベース12から、音声入力を行おうとしているサービスの利用履歴を取り出す際に、例えば、過去300秒以内に入力された利用履歴に限定するといった時間的な制約を設けてもよい。
図5に戻り、音声データ送信部13は、ステップS1、S3でYESと判定されたなら、または、ステップS5で、利用履歴データベース12に記憶された音声の時間長が予め定めた時間長より長いと判定されたなら(S5:YES)、非圧縮音声データを圧縮し、音声認識装置3に送信し(S11)、処理を終える。
一方、音声データ送信部13は、ステップS5でNOと判定されたなら、非圧縮音声データをそのまま、音声認識装置3に送信し(S13)、処理を終える。
ステップS5でNOと判定されたなら、非圧縮音声データをそのまま、音声認識装置3に送信するので(S13)、利用者は音声を入力してからテキストデータが得られるまでの時間を短く感じられ、また、ステップS1でYESと判定されたなら、非圧縮音声データを圧縮し、音声認識装置3に送信するので(S11)、ネットワークNの混雑助長を防止できる。
図7は、ネットワーク監視装置2が圧縮の要否を音声データ送信部13に通知する場合に行う処理の一例を示すフローチャートである。音声データ送信装置1が携帯端末であり、携帯電話網に属する場合、ネットワーク監視装置2は、このフローチャートに従って圧縮の要否を音声データ送信部13に通知する。
ネットワーク監視装置2は、基地局から、基地局の通信範囲内に存在する端末数を取得し、これが予め定めた数より多いか否かを判定する(S101)。
ネットワーク監視装置2は、ステップS101でNOと判定されたなら、基地局から、ネットワークNの帯域使用率を取得し、これが予め定めた値より高いか否かを判定する(S103)。
ネットワーク監視装置2は、S101またはS103でYESと判定されたなら、音声データ送信部13に対し、圧縮が必要であると通知し(S105)、処理を終える。
ネットワーク監視装置2は、S103でNOと判定されたなら、音声データ送信部13に対し、圧縮が不要であると通知し(S107)、処理を終える。
音声認識装置3は、受信した非圧縮音声データに対し、または、圧縮音声データについては、伸長処理を行ったうえで、音声認識を行い、結果(テキストデータ)をネットワークNを介して、テキストデータ受信部14に送信する。
ここで、テキストデータに代え、このテキストデータを例えば、検索システムに入力して得た検索結果を送信することもできる。
以上のように、本実施の形態によれば、音声を入力してからテキストデータが得られるまでの時間を利用者が短く感じるという状況を確保することができ、かつ、ネットワークNの混雑助長を防止できる。
本実施の形態に係る技術は、特にネットワークNの帯域が太く(S1:YES)、かつ、音声認識装置3の負荷状況に余裕がある(S3:YES)場合に、ネットワークNの利用効率よりも、音声を入力してからテキストデータが得られるまでの時間を利用者が短く感じることを優先するので(S3:NO)、利用者にとってのサービスの体感品質を向上させることができる。
なお、本実施の形態の音声データ送信装置1としてコンピュータを機能させるためのコンピュータプログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に記録でき、また、インターネットなどの通信網を介して伝送させて、広く流通させることができる。
1 音声データ送信装置
2 ネットワーク監視装置
3 音声認識装置
11 音声入力部
12 利用履歴データベース
13 音声データ送信部
14 テキストデータ受信部

Claims (4)

  1. 音声を入力する音声入力部と、
    過去に入力された音声の時間長が記憶される利用履歴データベースと、
    前記音声入力部に入力された音声の非圧縮音声データまたは該非圧縮音声データを圧縮した圧縮音声データをネットワークに送出する音声データ送信部とを備え、
    前記音声データ送信部は、
    前記ネットワークを監視するネットワーク監視装置から当該ネットワークにおける混雑状況を示す情報を取得し、当該混雑状況を示す情報および前記利用履歴データベースに記憶された音声の時間長に基づいて、前記音声入力部に入力された音声の非圧縮音声データを圧縮するか否かを判断する
    ことを特徴とする音声データ送信装置。
  2. 前記利用履歴データベースは、音声を用いたサービスの利用ごとに、利用したサービスと当該サービスの利用にて用いた音声の時間長を対応づけて記憶するものであり、前記利用履歴データベースに記憶された音声の時間長は、前記利用履歴データベースにおいて、利用しようとするサービスと同じサービスについて記憶された音声の時間長の平均値であり、
    (1)取得した混雑状況を示す情報が予め定めた混雑状況以下を示すものである、または、(2)当該混雑状況を示す情報が当該予め定めた混雑状況より高いことを示すものであり、かつ前記平均値が予め定めた時間長より長いなら、前記音声入力部に入力された音声の非圧縮音声データを圧縮する一方、(3)当該混雑状況を示す情報が当該予め定めた混雑状況より高いことを示すものであり、かつ前記平均値が予め定めた時間長以下なら、前記音声入力部に入力された音声の非圧縮音声データを圧縮しない
    ことを特徴とする請求項1記載の音声データ送信装置。
  3. 音声データ送信装置の動作方法であって、
    前記音声データ送信装置は、
    音声を入力する音声入力部と、
    過去に入力された音声の時間長が記憶される利用履歴データベースと、
    前記音声入力部に入力された音声の非圧縮音声データまたは該非圧縮音声データを圧縮した圧縮音声データをネットワークに送出する音声データ送信部とを備え、
    前記動作方法は、
    前記音声入力部が音声を入力するステップと、
    前記音声データ送信部が、前記ネットワークを監視するネットワーク監視装置から当該ネットワークにおける混雑状況を取得するステップと、
    前記音声データ送信部が、当該混雑状況および前記利用履歴データベースに記憶された音声の時間長に基づいて、前記音声入力部に入力された音声の非圧縮音声データを圧縮するか否かを判定するステップと
    を含む特徴とする音声データ送信装置の動作方法。
  4. 請求項1または2記載の音声データ送信装置としてコンピュータを機能させるためのコンピュータプログラム。
JP2014120506A 2014-06-11 2014-06-11 音声データ送信装置およびその動作方法 Active JP6297933B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014120506A JP6297933B2 (ja) 2014-06-11 2014-06-11 音声データ送信装置およびその動作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014120506A JP6297933B2 (ja) 2014-06-11 2014-06-11 音声データ送信装置およびその動作方法

Publications (2)

Publication Number Publication Date
JP2016001221A true JP2016001221A (ja) 2016-01-07
JP6297933B2 JP6297933B2 (ja) 2018-03-20

Family

ID=55076850

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014120506A Active JP6297933B2 (ja) 2014-06-11 2014-06-11 音声データ送信装置およびその動作方法

Country Status (1)

Country Link
JP (1) JP6297933B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020245912A1 (ja) * 2019-06-04 2020-12-10
CN113079523A (zh) * 2020-01-06 2021-07-06 中国移动通信有限公司研究院 上行数据压缩udc的配置方法、装置、基站及终端
CN113763932A (zh) * 2021-05-13 2021-12-07 腾讯科技(深圳)有限公司 语音处理方法、装置、计算机设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7119698B2 (ja) 2018-07-24 2022-08-17 株式会社デンソー 車両用空調装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001094517A (ja) * 1999-09-20 2001-04-06 Matsushita Electric Ind Co Ltd 音声通信装置及び方法
JP2003099097A (ja) * 2001-09-26 2003-04-04 Mitsubishi Electric Corp 音響処理装置、音響処理方法、音響処理プログラム、照合処理装置、照合処理方法及び照合処理プログラム
US20030220794A1 (en) * 2002-05-27 2003-11-27 Canon Kabushiki Kaisha Speech processing system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001094517A (ja) * 1999-09-20 2001-04-06 Matsushita Electric Ind Co Ltd 音声通信装置及び方法
JP2003099097A (ja) * 2001-09-26 2003-04-04 Mitsubishi Electric Corp 音響処理装置、音響処理方法、音響処理プログラム、照合処理装置、照合処理方法及び照合処理プログラム
US20030220794A1 (en) * 2002-05-27 2003-11-27 Canon Kabushiki Kaisha Speech processing system

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020245912A1 (ja) * 2019-06-04 2020-12-10
WO2020245912A1 (ja) * 2019-06-04 2020-12-10 日本電信電話株式会社 音声認識制御装置、音声認識制御方法、およびプログラム
JP7168080B2 (ja) 2019-06-04 2022-11-09 日本電信電話株式会社 音声認識制御装置、音声認識制御方法、およびプログラム
CN113079523A (zh) * 2020-01-06 2021-07-06 中国移动通信有限公司研究院 上行数据压缩udc的配置方法、装置、基站及终端
CN113079523B (zh) * 2020-01-06 2023-01-13 中国移动通信有限公司研究院 上行数据压缩udc的配置方法、装置、基站及终端
CN113763932A (zh) * 2021-05-13 2021-12-07 腾讯科技(深圳)有限公司 语音处理方法、装置、计算机设备及存储介质
CN113763932B (zh) * 2021-05-13 2024-02-13 腾讯科技(深圳)有限公司 语音处理方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
JP6297933B2 (ja) 2018-03-20

Similar Documents

Publication Publication Date Title
US9445150B2 (en) Asynchronously streaming video of a live event from a handheld device
JP6297933B2 (ja) 音声データ送信装置およびその動作方法
US10693799B2 (en) Calling method and device, computer storage medium, and terminal
US10218856B2 (en) Voice signal processing method, related apparatus, and system
US20060094472A1 (en) Intelligent codec selection to optimize audio transmission in wireless communications
WO2016049987A1 (zh) 一种数据处理方法、装置及相关服务器
WO2010000161A1 (zh) 一种基于即时通讯系统的语音通话方法及装置
US9912617B2 (en) Method and apparatus for voice communication based on voice activity detection
CN111768790B (zh) 用于传输语音数据的方法和装置
JP2018049080A (ja) 通信システム、情報処理装置、プログラム、通信方法
JP5920466B2 (ja) 通信システムと方法とプログラム
US11197044B2 (en) Communication apparatus, media distribution system, media distribution method, and non-transitory computer readable medium
CN114245175A (zh) 视频转码方法、装置、电子设备及存储介质
EP2903224B1 (en) Method for transmitting audio information and packet communication system
JP7400042B2 (ja) 通信端末、及びプログラム
JP4120440B2 (ja) 通信処理装置、および通信処理方法、並びにコンピュータ・プログラム
CN115174538A (zh) 数据传输方法、装置、电子设备及计算机可读介质
CN114666776A (zh) 数据发送方法、装置、设备和可读存储介质
CN108989401B (zh) 闹钟设置方法、装置、终端、服务器及存储介质
WO2013182129A2 (zh) 一种云笔记实现方法及装置
CN114244911A (zh) 语音解析方法、装置、接收端设备及存储介质
CN109286922B (zh) 蓝牙提示音处理方法、系统、可读存储介质和蓝牙设备
CN109150400B (zh) 数据传输方法、装置、电子设备及计算机可读介质
CN111510555A (zh) 一种dect基站通信方法、装置及系统
KR100877883B1 (ko) 무선 데이터통신망별로 최적화된 스트리밍 서비스 제공방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160913

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170920

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180222

R150 Certificate of patent or registration of utility model

Ref document number: 6297933

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150