JP2019215449A - 会話補助装置、会話補助方法及びプログラム - Google Patents

会話補助装置、会話補助方法及びプログラム Download PDF

Info

Publication number
JP2019215449A
JP2019215449A JP2018112706A JP2018112706A JP2019215449A JP 2019215449 A JP2019215449 A JP 2019215449A JP 2018112706 A JP2018112706 A JP 2018112706A JP 2018112706 A JP2018112706 A JP 2018112706A JP 2019215449 A JP2019215449 A JP 2019215449A
Authority
JP
Japan
Prior art keywords
speaker
speech
unit
processing
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018112706A
Other languages
English (en)
Other versions
JP7026004B2 (ja
Inventor
良輔 青木
Ryosuke Aoki
良輔 青木
宗徳 小安
Munenori Koyasu
宗徳 小安
直樹 大島
Naoki Oshima
直樹 大島
直樹 武川
Naoki Takegawa
直樹 武川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018112706A priority Critical patent/JP7026004B2/ja
Priority to US16/973,285 priority patent/US11978443B2/en
Priority to PCT/JP2019/022720 priority patent/WO2019240035A1/ja
Publication of JP2019215449A publication Critical patent/JP2019215449A/ja
Application granted granted Critical
Publication of JP7026004B2 publication Critical patent/JP7026004B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】共通語となる言語に対する習熟度が異なる人の間でも、無理なく円滑な会話によるコミュニケーションを実現すること。【解決手段】発話者の発話速度を取得し、発話内容の音声認識を行なう音声認識部14と、取得された発話速度と基準となる発話速度との比較結果に基づいて、音声認識結果の一部を加工し、加工された音声認識結果の文字テキスト映像を発話者の通信端末TMへの映像に重畳して送信する通話音声処理部12とを備える。【選択図】 図1

Description

本発明は、会話補助装置、会話補助方法及びプログラムに関する。
遠隔地間での異文化交流が増加し、テレビ電話等の映像会話による母語話者(Native Speaker:以下「NS」と称する)と、非母語話者(Non−Native Speaker:以下「NNS」と称する)とのコミュニケーションの機会が増えている。
NSが話す母国語に不慣れなNNSにとっては、コミュニケーションに参加することが困難となる大きな理由の1つとして、NSの会話速度が速く、会話の聞き取りができないことが挙げられる。このような場合、NSがNNSの存在を認識した上で、意図的にゆっくりとしゃべることが、正常な会話を成立させる上では効果的であるが、NSにとっても、自分自身が日常と異なる速度で話すように制御することが難しい場合がある。
このような状況に対して、NSの会話速度を伸長して、ゆっくりとした聞き取り易い音声を生成し、NNSに伝える技術(非特許文献1)や、NSの会話中のキーワードをNNSに表示して伝えるようにした技術(非特許文献2)などが提案されている。
前者の、ゆっくりとした聞き取り易い音声を生成してNNSに伝える技術では、NNSがゆっくりと聞き取ることはできるものの、NSが会話を終了するタイミングに比して、NNSが会話の聞き取りを終了するタイミングが遅れることとなるため、NNSが返答するタイミングが図れず、円滑な会話が成立しないという不具合を生じる。
また後者の、キーワードをNNSに表示して伝えるようにした技術では、NNSが聞き取りと表示される文字情報の双方に意識を向ける必要があり、加えて、NSが会話を終了してからキーワードが表示により出力されるまでのタイムラグから、やはり円滑なコミュニケーションがとり難い、という不具合を生じる。
前述した如く、共通語となる言語に対する習熟度が異なる人の間では、円滑に会話を行なうことが困難であった。
本発明は前記のような実情に鑑みてなされたもので、その目的とするところは、共通語となる言語に対する習熟度が異なる人の間でも、無理なく円滑な会話によるコミュニケーションを実現することが可能な会話補助装置、会話補助方法及びプログラムを提供することにある。
本発明の一態様は、発話者の発話速度を取得する速度取得部と、前記発話者の発話内容を音声認識する音声認識部と、前記速度取得部により取得された発話速度と、基準となる発話速度との比較結果に基づいて、前記音声認識部により得られた認識結果の一部を加工する加工部と、前記加工部により加工された音声認識結果を前記発話者に提示させる提示部と、を備える。
本発明の一態様によれば、発話音声の認識結果を、例えば加工前の発話内容と加工後の発話内容とで「韻」を揃えながらも、適宜加工を施すことで、意図的に発話内容を異ならせたものでありながら、あたかも発話者の発話速度が速すぎるか、あるいは滑舌が悪いことで、システムが誤認識したかのような印象を与えることができ、これにより発話者に対し自然に発話速度を抑えるよう促すことが可能となる。
従って、共通語となる言語に対する習熟度が異なる人の間でも、無理なく円滑な会話によるコミュニケーションを実現することが可能となる。
本発明の一実施形態に係る通話システム全体の構成を示す図。 同実施形態に係る発話者への表示内容を決定する処理内容を示すフローチャート。
以下、本発明を、インターネット接続されたサーバ装置を仲介してのテレビ電話機能による通話システムに適用した場合の一実施形態を例にとって図面を参照して詳細に説明する。
図1は、この発明の位置実施形態に係る会話補助装置を備えた通話システム全体の構成を示す図である。同図において、2人の通話者がそれぞれ所持する通信端末TM,TMが、ネットワークNWを介して、会話補助装置としての通話補助サーバSVと接続される。
通信端末TMは、例えばスマートフォンやフューチャフォン、タブレット端末。パーソナルコンピュータ等、通話可能な通信端末であり、事前にインストールしていたプリケーションプログラムに基づいた通話機能を実行する。ネットワークNWは、基地局やインターネット等を含む。
通話補助サーバSVは、通話時にテレビ電話機能による通信端末TM,TM間の映像と音声の送受を制御するとともに、特に発話者側へは発話された音声から音声認識処理を実行し、その認識結果に基づいた文字テキストを映像化して、発話者への映像上に重畳して送信する。
通話補助サーバSVは、入出力制御部11、通話音声処理部12、通話音声ログ更新部13、音声認識部14、通話音声ログデータベース(DB)15、及び音声認識結果データベース(DB)16を有する。
これらの各機能部のうち、入出力制御部11、通話音声処理部12、通話音声ログ更新部13および音声認識部14は、いずれも例えば図示しないプログラムメモリに格納されたプログラムを、通話補助サーバSVが備えるプロセッサに実行させることにより実現される。
また、通話音声ログデータベース(DB)15、及び音声認識結果データベース(DB)16は、例えばHDD(Hard Disk Device)またはSSD(Solid State Device)等の随時書き込みおよび読み出しが可能な不揮発性のメモリに設けられる。
入出力制御部11は、ネットワークNWと通話音声処理部12、通話音声ログ更新部13、及び音声認識部14との間の各種データ等の転送を制御する。
通話音声処理部12は、通話音声ログ更新部13及び音声認識部14を用い、総合的に通話継続中の音声に関する各種処理を実行する。
通話音声ログ更新部13は、ネットワークNWを介して通信端末TM,TM間でやり取りされる通話の音声を、話者の識別情報及び時刻情報と関連付けて、通話音声ログデータベース15に随時一定時間分だけ蓄積して更新記憶させる。
音声認識部14は、通話音声処理部12の制御の下に、通話音声ログデータベース15に記憶される通話音声を読み出させて音声認識処理を実行し、その認識結果を音声認識結果データベース16に蓄積して更新記憶させる。
次に前記一実施形態の動作について説明する。
なお、通信端末TM,TM間でのテレビ電話機能による通話の開始時には、通話で使用する共通語となる言語でNSとなる側のユーザが操作する通信端末TMにおいて、例えばユーザによるマニュアル操作に応じて、後述する発話補助の字幕映像を重畳した表示を行なうものとする。
また、前述したようなNSとなる側のユーザによるマニュアル操作ではなく、通話中の発話速度の比較により、両者間の発話速度の差が一定の閾値を超えて著しく異なる場合に、より発話速度の速い側をNSのユーザであるものと自動的に判定して、判定した側の通信端末TMで発話補助の字幕表示を行なうよう設定しても良い。
通話補助サーバSVにおいては、通信端末TM,TM間での通話に際して、前述した如く、通話でやり取りされる音声のデータを入出力得制御部11、通話音声処理部12を介して通話音声ログ更新部13が随時、話者の識別情報及び時刻情報と関連付けて、通話音声ログデータベース15に蓄積して更新記憶させている。
この通話音声ログ更新部13での更新記憶の動作と平行して、通話音声処理部12は、特にNSとして設定された話者の音声データを用い、図2に示すような発話者に対する処理を実行する。
図2は、発話者に対して発話補助の表示を行なう際に表示内容を決定するための処理内容を示すフローチャートである。
通話音声処理部12は、通話音声ログ更新部13により通話音声ログデータベース15に記憶している最新のNSの発話者の音声データを読み出させて音声認識部14に転送させ、その発話速度を計測させた上で(ステップS101)、音声認識処理を実行させる(ステップS102)。
通話音声処理部12は、前記ステップS101で計測した発話速度を、予め設定されている、基準となる発話速度と比較した上で、その比較結果に応じた音声認識結果の発話者に対する提示を実行する(ステップS110)。
具体的には、まず、計測した発話速度が、基準となる発話速度より速いか否かを判断する(ステップS111)。
計測した発話速度が、基準となる発話速度と同じか、または基準となる発話速度より遅いと判断した場合(ステップS111のNO)、特にNSである発話者に対してそれより発話速度を下げるように促す必要はないものとして、前記音声認識処理により得た認識結果の文字テキストをそのまま加工せずに表示対象として決定する(ステップS112)。
また前記ステップS111において、計測した発話速度が、基準となる発話速度より速いと判断した場合(ステップS111のYES)、通話音声処理部12では、NSである発話者に対してそれより発話速度を下げるように促す必要が生じることになる。
したがって、通話音声処理部12は、次にその程度を認識するべく、計測した発話速度が、基準となる発話速度に応じた閾値、例えば基準となる発話速度に「1」より大きい一定の定数「1.5」を乗じた積による発話速度より大きいか否かにより、基準となる発話速度との差が大きいか否かを判断する(ステップS113)。
計測した発話速度が、基準となる発話速度よりは大きいが、当該閾値以下であり、基準となる発話速度との差はそれほど大きいものではないと判断した場合(ステップS113のNO)、通話音声処理部12では音声認識部14により音声認識した結果となる一連の文字テキストに対し、助詞の認識結果を意図的に違えた内容を表示対象として決定する(ステップS114)。
この場合、認識結果を違える前の助詞と違えた後の助詞とで「韻」を揃えるようにすることで、意図的に内容を違えたものでありながら、あたかも発話者の発話速度が速すぎるか、あるいは滑舌が悪いことでシステムが誤認識したかのような印象を与えることができ、発話者にきわめて自然に発話速度を抑えるよう暗に促すことができる。
また前記ステップS113において、計測した発話速度が、基準となる発話速度から算出した閾値より大きく、基準となる発話速度との差が大きいと判断した場合(ステップS113のYES)、通話音声処理部12では音声認識部14により音声認識した結果となる一連の文字テキストに対し、助詞のみならず単語部分に関しても認識結果を意図的に違えた内容を表示対象として決定する(ステップS115)。
この場合も、認識結果を違える前の助詞、単語と、違えた後の助詞、単語とで双方の「韻」をそれぞれ揃えるようにすることで、意図的に内容を違えたものでありながら、あたかも発話者の発話速度が速すぎるか、あるいは滑舌が悪いことでシステムが誤認識したかのような印象を与えることができ、発話者にきわめて自然に発話速度を抑えるよう暗に促すことができる。
こうして発話者に提示する音声認識の表示対象の決定を行なうと、以上で図2の処理を終了する。
通話音声処理部12では、前記ステップS112,S114,S115のいずれかにおいて表示対象として決定した音声認識結果の文字テキストを、適切と考えられる発話速度に従って字幕として映像データ化した上で、発話者の通信端末TMで表示する、通話相手を示す映像データ中の端部、例えば下端側に重畳合成した映像データを作成し、発話者の通信端末TMに送信して表示させる。
ここで、文字テキストを字幕として映像データ化する際に用いられる、適切な発話速度としては、例えばモーラ(拍)数に基づいた単位が考えられる。すなわち、モーラ数とは、音韻論上、一定の時間的な長さを持った音の文節単位とされている。例えば、外国人が日本語を聞き取る場合においては、モーラ数「5」程度が適切であると考えられている。
なお前記実施形態では、発話者の発話速度が基準となる発話速度よりもやや大きいと判断した場合に、音声認識結果中の助詞を違った内容に加工するものとして説明したが、本発明は加工対象としての品詞を限定するものではなく、その時点で共通語とされている言語にいて、発話者に対して、違和感なく自然に発話速度を抑えてもらうように促すことができるよう、部分的に異なる認識結果を提示できれば良い。
以上詳述した如く本実施形態によれば、認識結果を加工する前の助詞、単語と、加工した後の助詞、単語とで、例えば「韻」をそれぞれ揃えながら、適宜加工を施すようにすることで、意図的に内容を違えたものでありながら、あたかも発話者の発話速度が速すぎるか、あるいは滑舌が悪いことでシステムが誤認識したかのような印象を与えることができ、発話者にきわめて自然に発話速度を抑えるよう暗に促すことができる。したがって、共通語となる言語に対する習熟度が異なる人の間でも、無理なく円滑な会話によるコミュニケーションを実現することが可能となる。
また前記実施形態では、発話者の発話速度が、基準となる発話速度より大きかった場合に、それら速度の差を複数段階に分けて判断し、その度合いに応じて、音声認識の結果に対する加工の程度を複数段階に分けるようにしたので、発話者に対して提示する音声認識結果が、発話速度が遅くなる程に、発話した内容に近い音声認識の結果が提示されることになり、きわめて自然に、発話者に対してゆっくりと話すように促すことができる。
加えて前記実施形態では、加工の程度を複数段階に分けるに当たって、音声認識結果を構成する品詞に応じて加工を施すものとしたので、音声認識の結果に対して加工を施す際の装置側の処理負担を軽減して効率的に動作を継続できる。
なお前記実施形態では、インターネット接続されたサーバ装置を仲介して、2個の通信端末間でテレビ電話機能による通話を行なう場合について説明したが、本発明はそのような構成に限らず、例えばグループビデオチャットのように多人数間で映像と音声とをやり取りするシステム等にも適用することが可能である。
さらに、ネットワークに接続されたサーバ装置ではなく、各通信端末の装置内に事前にインストールしているアプリケーションプログラムにより、発話者に対する発話した音声認識の結果の提示を一部加工して実現するものとしても良い。その場合、発話者が有する通信端末の装置内で処理することができる。
その他、本願発明は、前記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は可能な限り適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、前記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適当な組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
11…入出力制御部、12…通話音声処理部、13…通話音声ログ更新部、14…音声認識部、15…通話音声ログデータベース(DB)、16…音声認識結果データベース(DB)、NW…ネットワーク、SV…通話補助サーバ、TM…通信端末

Claims (5)

  1. 発話者の発話速度を取得する速度取得部と、
    前記発話者の発話内容を音声認識する音声認識部と、
    前記速度取得部により取得された発話速度と、基準となる発話速度との比較結果に基づいて、前記音声認識部により得られた認識結果の一部を加工する加工部と、
    前記加工部により加工された音声認識結果を前記発話者に提示させる提示部と、
    を備える会話補助装置。
  2. 前記加工部は、前記速度取得部で取得した発話速度が、基準となる発話速度より速い場合に、それら速度の差の度合いに応じて、前記音声認識部で得た認識結果に対する加工の程度を複数段階に分けて加工する、請求項1記載の会話補助装置。
  3. 前記加工部は、前記認識結果に対する加工の程度を品詞に応じた複数段階に分けて加工する、請求項2記載の会話補助装置。
  4. 発話者の発話速度を取得する速度取得工程と、
    前記発話者の発話内容を音声認識する音声認識工程と、
    前記速度取得工程により取得された発話速度と、基準となる発話速度との比較結果に基づいて、前記音声認識工程により得られた認識結果の一部を加工する加工工程と、
    前記加工工程により加工された音声認識結果を前記発話者に提示させる提示工程と、
    を有する会話補助方法。
  5. 請求項1乃至3いずれかに記載の会話補助装置が備える各部の処理を、前記会話補助装置のプロセッサに実行させるプログラム。
JP2018112706A 2018-06-13 2018-06-13 会話補助装置、会話補助方法及びプログラム Active JP7026004B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018112706A JP7026004B2 (ja) 2018-06-13 2018-06-13 会話補助装置、会話補助方法及びプログラム
US16/973,285 US11978443B2 (en) 2018-06-13 2019-06-07 Conversation assistance device, conversation assistance method, and program
PCT/JP2019/022720 WO2019240035A1 (ja) 2018-06-13 2019-06-07 会話補助装置、会話補助方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018112706A JP7026004B2 (ja) 2018-06-13 2018-06-13 会話補助装置、会話補助方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2019215449A true JP2019215449A (ja) 2019-12-19
JP7026004B2 JP7026004B2 (ja) 2022-02-25

Family

ID=68841857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018112706A Active JP7026004B2 (ja) 2018-06-13 2018-06-13 会話補助装置、会話補助方法及びプログラム

Country Status (3)

Country Link
US (1) US11978443B2 (ja)
JP (1) JP7026004B2 (ja)
WO (1) WO2019240035A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021135515A1 (zh) * 2020-06-17 2021-07-08 平安科技(深圳)有限公司 音视频通话的处理方法、系统、编解码器及存储装置
JP2021162895A (ja) * 2020-03-30 2021-10-11 本田技研工業株式会社 会議支援システム、会議支援方法、およびプログラム
KR20220067179A (ko) * 2020-11-17 2022-05-24 주식회사 한글과컴퓨터 음성 인식 처리를 위한 음성 발화의 끝점을 사용자 맞춤형으로 검출하는 음성 인식 처리 장치 및 그 동작 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009171336A (ja) * 2008-01-17 2009-07-30 Nec Corp 携帯通信端末
JP2017097093A (ja) * 2015-11-20 2017-06-01 株式会社Jvcケンウッド 端末装置、通信方法
WO2018016139A1 (ja) * 2016-07-19 2018-01-25 ソニー株式会社 情報処理装置、および情報処理方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6785649B1 (en) * 1999-12-29 2004-08-31 International Business Machines Corporation Text formatting from speech
JP2010256391A (ja) * 2009-04-21 2010-11-11 Takeshi Hanamura 音声情報処理装置
US9344821B2 (en) * 2014-03-21 2016-05-17 International Business Machines Corporation Dynamically providing to a person feedback pertaining to utterances spoken or sung by the person
US9972342B2 (en) 2015-11-20 2018-05-15 JVC Kenwood Corporation Terminal device and communication method for communication of speech signals
CN109313900A (zh) * 2016-06-15 2019-02-05 索尼公司 信息处理设备和信息处理方法
JP6548045B2 (ja) * 2017-03-31 2019-07-24 本田技研工業株式会社 会議システム、会議システム制御方法、およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009171336A (ja) * 2008-01-17 2009-07-30 Nec Corp 携帯通信端末
JP2017097093A (ja) * 2015-11-20 2017-06-01 株式会社Jvcケンウッド 端末装置、通信方法
WO2018016139A1 (ja) * 2016-07-19 2018-01-25 ソニー株式会社 情報処理装置、および情報処理方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021162895A (ja) * 2020-03-30 2021-10-11 本田技研工業株式会社 会議支援システム、会議支援方法、およびプログラム
JP7316971B2 (ja) 2020-03-30 2023-07-28 本田技研工業株式会社 会議支援システム、会議支援方法、およびプログラム
WO2021135515A1 (zh) * 2020-06-17 2021-07-08 平安科技(深圳)有限公司 音视频通话的处理方法、系统、编解码器及存储装置
KR20220067179A (ko) * 2020-11-17 2022-05-24 주식회사 한글과컴퓨터 음성 인식 처리를 위한 음성 발화의 끝점을 사용자 맞춤형으로 검출하는 음성 인식 처리 장치 및 그 동작 방법
KR102442528B1 (ko) 2020-11-17 2022-09-13 주식회사 한글과컴퓨터 음성 인식 처리를 위한 음성 발화의 끝점을 사용자 맞춤형으로 검출하는 음성 인식 처리 장치 및 그 동작 방법

Also Published As

Publication number Publication date
US11978443B2 (en) 2024-05-07
US20210249007A1 (en) 2021-08-12
WO2019240035A1 (ja) 2019-12-19
JP7026004B2 (ja) 2022-02-25

Similar Documents

Publication Publication Date Title
US20210366471A1 (en) Method and system for processing audio communications over a network
US9280539B2 (en) System and method for translating speech, and non-transitory computer readable medium thereof
JP5750380B2 (ja) 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
WO2015125549A1 (ja) 情報処理装置
US20150170665A1 (en) Attribute-based audio channel arbitration
JP2015060332A (ja) 音声翻訳装置、音声翻訳方法およびプログラム
JP2017107078A (ja) 音声対話方法、音声対話装置及び音声対話プログラム
US11528568B1 (en) Assisted hearing aid with synthetic substitution
WO2019240035A1 (ja) 会話補助装置、会話補助方法及びプログラム
US20190129949A1 (en) Signal processing terminal and method
US10789954B2 (en) Transcription presentation
US11580954B2 (en) Systems and methods of handling speech audio stream interruptions
JP4752516B2 (ja) 音声対話装置および音声対話方法
JP2019176375A (ja) 動画出力装置、動画出力方法および動画出力プログラム
CN115171645A (zh) 一种配音方法、装置、电子设备以及存储介质
JP2010128766A (ja) 情報処理装置、情報処理方法、プログラム及び記憶媒体
US20200184973A1 (en) Transcription of communications
JP6401488B2 (ja) 外国語会話理解支援装置、外国語会話理解支援方法及びプログラム
JP2018081147A (ja) コミュニケーション装置、サーバ、制御方法、および情報処理プログラム
JP2015187738A (ja) 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
KR20210029383A (ko) 음성인식에 기반한 부가 서비스 제공 시스템 및 그 방법
JP7017755B2 (ja) 放送波受信装置、放送受信方法、及び、放送受信プログラム
CN110225364B (zh) 一种视频处理方法、装置、终端、服务器及存储介质
JP2016218200A (ja) 電子機器制御システム、サーバー、及び、端末装置
JP6169526B2 (ja) 特定音声抑圧装置、特定音声抑圧方法及びプログラム

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20180628

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201002

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211105

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220214

R150 Certificate of patent or registration of utility model

Ref document number: 7026004

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150