JP2023502386A - 対話方法及び電子機器 - Google Patents

対話方法及び電子機器 Download PDF

Info

Publication number
JP2023502386A
JP2023502386A JP2022528722A JP2022528722A JP2023502386A JP 2023502386 A JP2023502386 A JP 2023502386A JP 2022528722 A JP2022528722 A JP 2022528722A JP 2022528722 A JP2022528722 A JP 2022528722A JP 2023502386 A JP2023502386 A JP 2023502386A
Authority
JP
Japan
Prior art keywords
phoneme
conference group
user
conference
phoneme sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022528722A
Other languages
English (en)
Inventor
路波 続
育進 胡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Publication of JP2023502386A publication Critical patent/JP2023502386A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/401Support for services or applications wherein the services involve a main real-time session and one or more additional parallel real-time or time sensitive sessions, e.g. white board sharing or spawning of a subconference
    • H04L65/4015Support for services or applications wherein the services involve a main real-time session and one or more additional parallel real-time or time sensitive sessions, e.g. white board sharing or spawning of a subconference where at least one of the additional parallel sessions is real time or time sensitive, e.g. white board sharing, collaboration or spawning of a subconference
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/762Media network packet handling at the source 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/764Media network packet handling at the destination 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/39Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本発明は、対話方法及び電子機器を提供する。この方法は、ユーザによって入力されたターゲット会話メッセージを受信することと、前記ターゲット会話メッセージを第一の音素シーケンスに変換することと、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得ることと、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信することとを含み、そのうち、前記ターゲット会話メッセージは、音声メッセージ又はテキストメッセージである。【選択図】図1

Description

関連出願の相互参照
本出願は、2019年11月20日に中国で提出された中国特許出願番号No.201911140650.5の優先権を主張しており、同出願の内容の全ては、ここに参照として取り込まれる。
本発明は、通信技術分野に関し、特に対話方法及び電子機器に関する。
現在のリモートビデオ会議システムでは、異なる場所にいる人々が、一つの会議に同時に参加でき、会議の各参加者は、いずれも主会場の表示スクリーンを見ることができる。現在のリモートビデオ会議は、一般的に、オーディオ、ビデオ及び電子文書を会議の各参加者に直接送信する。このように、一つの時刻で一つのリモートビデオ会議のみに参加できる。そのため、従来技術では、電子機器を介してリモートビデオ会議に参加する時に会議に参加する数が限られるという問題がある。
本発明の実施例は、電子機器を介してビデオ会議に参加する時にビデオ会議数が限られるという問題を解決するための対話方法及び電子機器を提供する。
第一の方面によれば、本発明の実施例は、リモート会議の第一の送信端末に用いられる対話方法を提供する。前記方法は、ユーザによって入力されたターゲット会話メッセージを受信することと、前記ターゲット会話メッセージを第一の音素シーケンスに変換することと、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得ることと、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信することとを含み、そのうち、前記ターゲット会話メッセージは、音声メッセージ又はテキストメッセージである。
第二の方面によれば、本発明の実施例は、リモート会議の第一の受信端末に用いられる対話方法をさらに提供する。前記方法は、第一の会議グループにおける機器である第一の送信端末によって送信された第二の音素シーケンスを受信することと、前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得ることと、前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生することとを含むことを特徴とする。
第三の方面によれば、本発明の実施例は、リモート会議の第一の送信端末に用いられる電子機器をさらに提供する。前記電子機器は、ユーザによって入力されたターゲット会話メッセージを受信するための第一の受信モジュールと、前記ターゲット会話メッセージを第一の音素シーケンスに変換するための変換モジュールと、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得るための符号化モジュールと、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信するための第一の送信モジュールとを含み、そのうち、前記ターゲット会話メッセージは、音声メッセージ又はテキストメッセージであることを特徴とする。
第四の方面によれば、本発明の実施例は、リモート会議の第一の受信端末に用いられる電子機器をさらに提供する。前記電子機器は、第一の会議グループにおける機器である第一の送信端末によって送信された第二の音素シーケンスを受信するための第五の受信モジュールと、前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得るための第二の復号化モジュールと、前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生するための第二の制御モジュールとを含む。
第五の方面によれば、本発明の実施例は、電子機器をさらに提供する。前記電子機器は、プロセッサと、メモリと、前記メモリに記憶され、且つ前記プロセッサ上で運行できるコンピュータプログラムとを含み、前記コンピュータプログラムが前記プロセッサによって実行される時、上記対話方法のステップを実現させる。
第六の方面によれば、本発明の実施例は、コンピュータ可読記憶媒体をさらに提供する。前記コンピュータ可読記憶媒体にはコンピュータプログラムが記憶されており、前記コンピュータプログラムがプロセッサによって実行される時、上記対話方法のステップを実現させる。
本発明の実施例は、ユーザによって入力されたターゲット会話メッセージを受信し、前記ターゲット会話メッセージを第一の音素シーケンスに変換し、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得て、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信することにより、会話メッセージの送信を実現する。リモート会議の会話メッセージを音素シーケンスの形式で伝送することにより、音声伝送形式による制限を回避し、ユーザが複数のリモート会議に同時に参加することを可能にする。同時に、音素変換ルールを使用して、伝送された音素シーケンスを暗号化・符号化することにより、会話メッセージの伝送の安全性を向上させる。
本発明の実施例の技術案をより明瞭に説明するために、以下は、本発明の実施例の記述において使用される必要がある添付図面を簡単に紹介する。自明なことに、以下の記述における添付図面は、ただ本発明のいくつかの実施例に過ぎず、当業者にとって、創造的な労力を払わない前提で、それらの添付図面に基づき、他の添付図面を取得することもできる。
本発明の実施例による対話方法のフローチャートのその一である。 本発明の実施例による対話方法におけるリモート会議インターフェースの例を示す図のその一である。 本発明の実施例による対話方法におけるリモート会議インターフェースの例を示す図のその二である。 本発明の実施例による対話方法におけるリモート会議インターフェースの例を示す図のその三である。 本発明の実施例による対話方法におけるリモート会議インターフェースの例を示す図のその四である。 本発明の実施例による対話方法のフローチャートのその二である。 本発明の実施例による電子機器の構造図のその一である。 本発明の実施例による電子機器の構造図のその二である。 本発明の実施例による電子機器の構造図のその三である。
以下は、本発明の実施例における添付図面を結び付けながら、本発明の実施例における技術案を明瞭且つ完全に記述する。明らかに、記述された実施例は、本発明の一部の実施例であり、全部の実施例ではない。本発明における実施例に基づき、当業者が創造的な労力を払わない前提で得られたすべての他の実施例は、いずれも本発明の保護範囲に属する。
図1を参照する。図1は、本発明の実施例による対話方法のフローチャートであり、図1に示すように、以下のステップを含む。
ステップ101では、ユーザによって入力されたターゲット会話メッセージを受信する。
本発明の実施例による対話方法は、主に、リモート会議に用いられ、音声メッセージの伝送を制御するために用いられる。本実施例の対話方法は、リモート会議の第一の送信端末に用いられる。具体的には、リモート会議でターゲット会話メッセージを送信する参加者は、第一の送信端末であり、この第一の送信端末は、リモート会議の他の参加者によって送信された会話メッセージを受信してもよい。
上述した前記ターゲット会話メッセージが音声メッセージ又はテキストメッセージであることについては、選択的に、第一の送信端末のユーザは、音声送信が便利である状態においては、音声の形式でターゲット会話メッセージを入力してもよく、音声送信が不便である状態においては、テキストの形式でターゲット会話メッセージを入力してもよい。上記リモート会議は、ビデオ会議であってもよく、音声会議であってもよく、ここではさらに限定しない。
例えば、一実施例では、ユーザによる選択・入力のために音声入力モードとテキスト入力モードを設定してもよい。理解すべきことは、複数のリモート会議に参加する時、ユーザクライアントは、あるリモート会議を音声入力モードとして、他のリモート会議をテキスト入力モードとして選択する。すべてのリモート会議をいずれもテキスト入力モードに設定してもよい。本発明の実施例では、音声入力モードは、ローカルに収集された音声データをリモート会議の残りの各参加者にリアルタイムで伝送することを指す。
別の実施例では、音声入力コントロールを設定してもよく、操作コントロールを押すと、音声入力を行ってもよい。このように、リモート会議ごとに一つのコミュニケーションインターフェースを設定することができ、このコミュニケーションインターフェース上で残りの各参加者によって送信された音声から変換されたテキストメッセージを表示するとともに、音声入力コントロールとテキスト入力コントロールを表示し、ユーザは、テキスト又は音声の入力を選択的に行うことができる。理解すべきことは、このコミュニケーションインターフェースを同時に一つ又は複数表示してもよく、例えば、一つ表示する場合、操作を切り替えることにより、異なるリモート会議に対応するコミュニケーションインターフェースを切り替えて表示してもよい。
ステップ102では、前記ターゲット会話メッセージを第一の音素シーケンスに変換する。
本発明の実施例では、音素は、声母と、韻母と、全体認読音節とを含んでもよい。ターゲット会話メッセージが音声メッセージである場合、音声認識技術に基づき、ユーザによって入力されたターゲット会話メッセージに対して音声認識を行い、第一の音素シーケンスを得てもよい。ターゲット会話メッセージがテキストメッセージである場合、発音注記ツールによってターゲット会話メッセージに対して発音注記を行い、第一の音素シーケンスを得てもよい。
ステップ103では、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得る。
本発明の実施例では、上記第一の音素変換ルールは、暗号化ルールであり、又は音素マッピングルールとして理解されてもよく、第一の音素シーケンスにおける各音素を第一の音素変換ルールに従って別のマッピングに変換する。選択的に、第一の音素シーケンスと第二の音素シーケンスとの間は、一対一のマッピング関係であってもよく、一対多のマッピング関係であってもよく、ここではさらに限定しない。
選択的に、異なる会議グループに対応する音素変換ルールは、同じであってもよく、異なってもよく、ここではさらに限定しない。理解すべきことは、同一の会議グループ内の音素変換ルールは同じであるため、各参加者がいずれも音素を正しく復号化できることを保証できる。本発明の実施例では、音素変換ルールを使用して第一の音素シーケンスを暗号化・符号化することにより、各参加者のみが正しく復号化し、会議の内容を知ることできることを保証することができる。そのため、メッセージの送信の安全性を向上させ、会議の内容が他人に傍受されるのを防ぐことができる。上記会議グループとは、同一のリモート会議に参加するすべての参加者を指す。
理解すべきことは、声母は、b、p、m、f、d、t、n、l、g、k、h、j、q、x、zh、ch、sh、r、z、c、sの合計21個である。
韻母は、a、o、e、i、u、v、ai、ei、ui、ao、ou、iu、ie、ve、er、an、en、in、un、vn、ang、eng、ing、ongの24個である。各韻母が4つのトーンを有するため、韻母は、合計96個ある。
全体認読音節は、zhi、chi、shi、ri、zi、ci、si、yuan、ya、yao、yan、yang、yuan、yo、yong、wa、wai、wan、wang、wo、wengの21個である。
そのうち、y、wは、声母とされておらず、y、wと組み合わせることができる韻母は、全体認読音節とされており、一つの音素として見なされている。一つの字のピンインは、声母と韻母を組み合わせて構成されてもよく、一つの韻母であってもよく、又は一つの全体認読音節であってもよい。各全体認読音節が4つのトーンを有するため、全体認読音節は、合計84個ある。
声母は、単独で一つの字を表すことができない。そのため、音素符号化の時、声母は、声母に符号化されることしかできず、韻母は、韻母に符号化されることしかできず、全体認読音節は、全体認読音節に符号化されることしかできない。
順列組み合わせに応じて、声母は、2121種の符号化形式を有し、韻母は、9696種の符号化形式を有し、全体認読音節は、8484種の符号化形式を有する。最終的に(2121+9696+8484)種の符号化リスト(即ち上記音素変換ルール)を形成することが可能であるため、符号化リストの復号化は非常に困難になる。つまり、上記第一の音素変換ルールは、(2121+9696+8484)種の音素変換ルールのうちの一種である。そのため、本発明の実施例は、音素符号化ルールを使用して音素シーケンスを暗号化・符号化することにより、メッセージの伝送の安全性を向上させることができる。
例えば、一選択的な実施例では、ユーザによって入力されたターゲット会話メッセージは、「我的密碼隠蔵在這里(私のパスワードはここに隠されている)」ということであり、音声認識によって得られた上記第一の音素シーケンスは、「w o3 d e1 m i4 m a3 y ing3 c ang2 z ai4 zh e4 l i1」である。第一の音素シーケンスを第一の音素変換ルールに従って変換した第二の音素シーケンスは、「w o3 sh uo1 j in1 t ian1 d e1 t ian1 q i1 zh en1 h ao3」である。
ステップ104では、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信する。
本発明の実施例では、上記第一の受信端末は、上記第一の会議グループにおける第一の送信端末以外のすべての参加者であってもよく、つまり、本実施例では、ユーザによって入力されたターゲット会話メッセージに対して音素符号化を行った後にすべての参加者に送信してもよい。
理解すべきことは、一回のリモート会議は、主会場内に位置する参加者と、主会場外に位置する他の参加者とを含む。この第一の送信側は、第一の会議グループに対応するリモート会議の主会場内に位置する参加者であってもよく、他の会議グループに対応するリモート会議の主会場内に位置する参加者であってもよく、いずれのリモート会議の主会場内にも位置しない参加者であってもよい。
本発明の実施例は、ユーザによって入力されたターゲット会話メッセージを受信し、前記ターゲット会話メッセージを第一の音素シーケンスに変換し、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得て、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信することにより、会話メッセージの送信を実現する。リモート会議の会話メッセージを音素シーケンスの形式で伝送することにより、音声伝送形式による制限を回避し、ユーザが複数のリモート会議に同時に参加することを可能にする。同時に、音素変換ルールを使用して、伝送された音素シーケンスを暗号化・符号化することにより、会話メッセージの伝送の安全性を向上させる。
理解すべきことは、上記第一の音素変換ルールは、事前に約定されるものであってもよく、各参加者は、それをローカルに直接選択すればよく、また、特定の参加者(例えば、主会場の参加者又は他の参加者)は、音素変換ルールをランダムに選択した後に他の各参加者に送信してもよく、参加者が追加された時、追加された参加者は、特定の参加者に音素変換ルールを要求し、特定の参加者の許可を取得した後、特定の参加者は、音素変換ルールをこの追加された参加者に送信する。
説明すべきことは、ターゲット会話メッセージがテキストメッセージである場合、第一の送信端末は第一の会議グループで音声送信が不便であり、例えば、第一の送信端末は、他の会議グループで音声通話を行っており(例えば、他の会議グループに対応するリモート会議の主会場内に位置する)、又は第一の送信端末は現在の環境で音声送信が不適切である(他人と相談しており、会議の内容が他人に知られると良くない)と理解されてもよい。この時、第一の送信端末は、第一の会議グループにおける残りの各参加者に会話メッセージを音素の方式で送信する。
ターゲット会話メッセージが音声メッセージである場合、第一の送信端末は、第一の会議グループで音声送信が便利であると理解されてもよい。この時、第一の送信端末は、第一の会議グループで音声受信が不便である参加者に会話メッセージを音素の方式で送信してもよく、第一の会議グループで音声受信が便利である参加者に会話メッセージを音素又はオーディオの方式で送信してもよい。例えば、前記ターゲット会話メッセージが音声メッセージである場合、上記ステップ101の後、前記方法は、前記ターゲット会話メッセージをオーディオの方式で前記第一の会議グループの第二の受信端末に送信することをさらに含む。
本実施例では、上記第一の受信端末は、ユーザによって指定して送信される参加者(又はすべての参加者)のうちの聞き取りが不便である参加者であり、上記第二の受信端末は、ユーザによって指定して送信される参加者(又はすべての参加者)のうちの聞き取りが便利である参加者である。本実施例では、聞き取りが便利である参加者にターゲット会話メッセージをオーディオの方式で直接送信することにより、会話メッセージの送信の実効性を向上させることができる。この指定して送信される参加者は、主会場の参加者又は他の参加者であってもよい。
理解すべきことは、第一の送信端末は、会話メッセージの送信以外に、会話メッセージの受信に用いられてもよい。会話メッセージを受信する時、オーディオの方式で受信してもよく、音素の方式で受信してもよい。
例えば、一選択的な実施例では、前記方法は、第二の送信端末によって送信された第一のオーディオデータを受信することであって、前記第二の送信端末が第二の会議グループにおけるユーザに対応する機器であり、前記第二の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、前記第一のオーディオデータを再生することとをさらに含む。
説明すべきことは、一般的に、同一の時刻で、第一の送信端末が一つの会議グループのみでオーディオデータをオーディオの方式で送信又は受信でき、異なる時刻で、第一の送信端末が異なる会議グループに切り替えて音声通話を行うことができるため、上記第一の会議グループと第二の会議グループは、同一の会議グループ又は異なる会議グループであってもよい。異なる会議グループに切り替えて音声通話を行うことができず、且つ第一の送信端末が前記ターゲット会話メッセージを前記第一の会議グループの第二の受信端末にオーディオの方式で送信する場合、この時、第一の会議グループと第二の会議グループは、同一の会議グループである。
理解すべきことは、第一のオーディオデータを再生する時、デフォルトの人声を使用してもよく、送信ユーザの声を使用してもよい(例えば、声紋情報を一緒に送信してもよく、合成時に送信ユーザの声紋に従って合成してもよい)。一実施例では、各参加者の声紋情報を保存し、且つ会話メッセージを送信する時にユーザ識別子を追加してもよく、それにより、受信側は、ユーザ識別子に従って、音素合成時に使用された声紋情報を直接決定してもよい。このように、声紋情報の伝送を減少させることができる。具体的には、音声の認識中に声紋を認識することにより、ユーザ識別子を決定するように設定してもよい。
別の選択的な実施例では、前記方法は、第三の送信端末によって送信された第三の音素シーケンスを受信することであって、前記第三の送信端末が第三の会議グループにおけるユーザに対応する機器であり、前記第三の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、前記第三の会議グループに対応する第二の音素変換ルールに従って前記第三の音素シーケンスに対して音素復号化を行い、第四の音素シーケンスを得ることと、前記第四の音素シーケンスに対応するテキスト内容を表示し、又は前記第四の音素シーケンスによって合成された第二のオーディオデータを再生することとをさらに含む。
本発明の実施例では、第一の送信端末が聞き取りが不便である参加者である場合、前記第四の音素シーケンスに対応するテキスト内容を表示してもよい。第一の送信端末が聞き取りが便利である参加者である場合、前記第四の音素シーケンスによって合成された第二のオーディオデータを再生してもよい。具体的には、第四の音素シーケンスによって第二のオーディオデータを合成する方式は、関連技術を参照すればよく、ここではさらに限定しない。
説明すべきことは、一般的に、同一の時刻で、第一の送信端末が一つの会議グループのみでオーディオデータをオーディオの方式で送信又は受信でき、異なる時刻で、第一の送信端末が異なる会議グループに切り替えて音声通話を行うことができるため、上記第一の会議グループと第三の会議グループは、同一の会議グループ又は異なる会議グループであってもよい。異なる会議グループに切り替えて音声通話を行うことができず、且つ第一の送信端末が前記ターゲット会話メッセージを前記第一の会議グループの第二の受信端末にオーディオの方式で送信する場合、この時、第一の会議グループと第三の会議グループは、同一の会議グループである。
さらに、図2に示すように、第四の音素シーケンスに対応するテキスト内容を表示する時、この第四の音素シーケンスに対応する送信ユーザのユーザ情報をさらに表示してもよい。同時に、操作コントロール201をさらに表示してもよく、ユーザがこの操作コントロール201をクリックすると、この第四の音素シーケンスに対応するテキスト内容を音声の形式で再生してもよい。
選択的に、リモート会議の表示形式は、実際の必要に応じて設定されてもよく、例えば、一実施例では、以下は、折り畳み式スクリーンを備えた電子機器によるリモート会議の表示方式を詳細に説明する。選択的に、前述した、ユーザによって入力されたターゲット会話メッセージを受信することの前、前記方法は、前記第一の送信端末の第一の表示領域で第一のターゲット内容を表示し、第二の表示領域で第二のターゲット内容を表示することをさらに含み、そのうち、前記第一のターゲット内容は、電子プレゼンテーション文書、ビデオ情報及び会議チャットウィンドウのうちの少なくとも一つを含み、前記第二のターゲット内容は、電子プレゼンテーション文書、ビデオ情報及び会議チャットウィンドウのうちの少なくとも一つを含む。
本実施例では、同一の会議グループ内の会議チャットウィンドウの表示は、実際の必要に応じて設定されてもよく、例えば、会議グループ内の会議チャットウィンドウをソーシャルチャットグループの方式で表示してもよい。本実施例では、会議チャットウィンドウ内で表示された会話メッセージとは、具体的に、音素の方式で伝送された会話メッセージを指す。
上記電子プレゼンテーション文書は、PPT(PowerPoint)とwordなどのプレゼンテーション可能なマルチメディア文書であってもよい。図2~図5に示すように、以下は、具体的な実例を結び付けてリモート会議の対話インターフェースを詳細に説明する。
説明すべきことは、各参加者が会話メッセージをオーディオ方式で伝送するのが便利であるかどうかについては、各参加者によって手動で選択されてもよく、参加者の電子機器によって自動的に検出されてもよく、ここではさらに限定しない。各参加者が会話メッセージをオーディオ方式で伝送するのが便利であるかどうかの状態を決定する時、この状態を各参加者に送信してもよく、各参加者は、それぞれが会話メッセージをオーディオ方式で伝送するのが便利であるかどうかの状態を指定された参加者(例えば、主会場の参加者)に送信した後、主参加者は、この状態を各参加者に送信してもよい。
図2に示すように、第一の表示領域で単一会場ビデオウィンドウを表示してもよく、第二の表示領域で単一会場会議チャットウィンドウを表示してもよい。単一会場ビデオウィンドウにビデオウィンドウの表示形式を設定してもよく、単一会場のPPTのみを表示してもよく、単一会場の現場ビデオのみを表示してもよく、同時に単一会場のPPTと現場ビデオを表示してもよい。単一会場ビデオウィンドウの上方と単一会場会議チャットウィンドウの上方にいずれも会議の参加者を表示しており、本実施例ではリストの形式で表示し、リストにおいて、各行は、一つのリモート会議のすべての参加者を表す。ユーザは、対応するリスト上で操作することにより、単一会場会議チャットウィンドウ又は単一会場会議チャットウィンドウで表示された内容を切り替えてもよい。同時に、ユーザは、単一会場会議チャットウィンドウの上方のリストに基づいて会話メッセージが一回送信される参加者を選択してもよい。選択的に、リストにおいて、各参加者が会話メッセージをオーディオ方式で伝送するのが便利であるかどうかの状態をマーキングして表示してもよい。本実施例では、単一会場ビデオウィンドウと単一会場会議チャットウィンドウは、同一のリモート会議に属してもよく、異なるリモート会議に属してもよく、ここではさらに限定しない。
図3に示すように、第一の表示領域で単一会場ビデオウィンドウを表示してもよく、第二の表示領域で単一会場ビデオウィンドウを表示してもよい。選択的に、単一会場ビデオウィンドウにビデオウィンドウの表示形式を設定してもよく、単一会場のPPTのみを表示してもよく、単一会場の現場ビデオのみを表示してもよく、同時に単一会場のPPTと現場ビデオを表示してもよい。そして、第一の表示領域で単一会場ビデオウィンドウを表示し第二の表示領域で単一会場ビデオウィンドウを表示する表示形式は、同じであってもよく、異なってもよい。
図4に示すように、第一の表示領域で単一会場会議チャットウィンドウを表示してもよく、第二の表示領域で単一会場会議チャットウィンドウを表示してもよい。
図5に示すように、第一の表示領域でダブル会場ビデオウィンドウを表示してもよく、第二の表示領域で単一会場会議チャットウィンドウを表示してもよい。選択的に、ダブル会場ビデオウィンドウにビデオウィンドウの表示形式を設定してもよく、ダブル会場のPPTのみを表示してもよく、ダブル会場の現場ビデオのみを表示してもよく、同時にダブル会場のPPTと現場ビデオを表示してもよい。
説明すべきことは、同一の会議グループでは、グループにおける各ユーザに対応する機器によって使用された音素変換ルールは同じであり、具体的には、各機器のあるグループにおける音素変換ルールの決定方式は、実際の必要に応じて設定されてもよい。
例えば、一選択的な実施例では、前述した、ユーザによって入力されたターゲット会話メッセージを受信することの前、前記方法は、前記第一の音素変換ルールを決定することと、前記第一の音素変換ルールを第一の機器に送信することであって、前記第一の機器が前記第一の会議グループにおける第一のターゲットユーザ以外のユーザに対応する機器であり、前記第一のターゲットユーザが前記第一の送信端末に対応するユーザであることとをさらに含む。
本発明の実施例では、上記第一の送信端末を第一の音素変換ルールの决定側又は送信側とし、第一の送信端末は、第一の会議グループにおける他のユーザに第一の音素変換ルールを送信してもよい。この第一の送信端末は、第一の会議グループに対応する主会場内のある参加者に対応する機器であってもよい。言い換えれば、本発明の実施例では、主会場内の参加者は、音素変換ルールを決定した後、残りの参加者に転送してもよい。具体的には、第一の送信側は、一組の音素変換ルールを第一の音素変換ルールとしてランダムに生成してもよい。無論、他の実施例では、主会場以外のある参加者は、第一の音素変換ルールを生成した後、各参加者に送信してもよい。主会場以外のある参加者は、第一の音素変換ルールを生成し、第一の音素変換ルールを主会場の参加者に送信した後、主会場の参加者は、残りの各参加者に送信してもよい。
理解すべきことは、本実施例では、第一の送信端末は、第一の音素変換ルールを送信する際に、第一の会議グループにおける一部又は全部のユーザに送信してもよく、例えば、上記第一の機器はさらに、第一の送信端末によって選択された機器、又は予め設定される条件を満たすユーザに対応する機器であってもよく、この予め設定される条件は、ユーザレベルが予め設定されるレベルよりも大きいユーザであることであってもよい。このように、第一の音素変換ルールの送信の指向性を高め、会議の安全性を向上させる。
別の選択的な実施例では、前述した、ユーザによって入力されたターゲット会話メッセージを受信することの前、前記方法は、第一の機器によって送信された音素変換ルールを受信することであって、前記第一の機器が前記第一の会議グループにおける第一のターゲットユーザ以外のユーザに対応する機器であり、前記第一のターゲットユーザが前記第一の送信端末に対応するユーザであることと、前記第一の機器によって送信された音素変換ルールを前記第一の音素変換ルールとして決定することとをさらに含む。
本発明の実施例では、上記実施例との相違点は、第一の送信端末を第一の音素変換ルールの受信側とすることであり、この第一の送信端末は、第一の会議グループに対応する主会場内のある参加者、又は主会場外の参加者であってもよく、ここではさらに限定しない。
さらに、第一の送信端末は、第一の音素変換ルールを送信するように第一の機器に要求してもよく、第一の送信端末は、第一の機器によって送信された第一の音素変換ルールを受動的に受信してもよい。選択的に、この第一の送信端末は、予め設定される条件を満たすユーザに対応する機器であってもよく、この予め設定される条件は、ユーザレベルが予め設定されるレベルよりも大きいユーザであることであってもよい。このように、第一の音素変換ルールの送信の指向性を高め、会議の安全性を向上させる。
説明すべきことは、本発明の実施例で紹介された様々な選択的な実施の形態は、相互に組み合わせて実現されてもよく、別々に実現されてもよく、本発明の実施例ではそれを限定しない。
さらに、電子機器が拡張現実(Augmented Reality、AR)メガネに接続されるように設定してもよく、ARメガネを利用して現場のPPTとリモート会議のPPTを同時に見ることができるとともに、リモート会議で話している人のオーディオから変換されたテキストを見ることができる。
図6を参照すると、本発明の実施例は、別の対話方法を提供する。図6に示すように、この方法は、以下のステップを含む。
ステップ601では、第一の会議グループにおける機器である第一の送信端末によって送信された第二の音素シーケンスを受信する。
ステップ602では、前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得る。
ステップ603では、前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生する。
選択的に、前記方法は、第二の送信端末によって送信された第一のオーディオデータを受信することであって、前記第二の送信端末が第二の会議グループにおけるユーザに対応する機器であり、前記第二の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、前記第一のオーディオデータを再生することとをさらに含む。
選択的に、前記方法は、第三の送信端末によって送信された第三の音素シーケンスを受信することであって、前記第三の送信端末が第三の会議グループにおけるユーザに対応する機器であり、前記第三の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、前記第三の会議グループに対応する第二の音素変換ルールに従って前記第三の音素シーケンスに対して音素復号化を行い、第四の音素シーケンスを得ることと、前記第四の音素シーケンスに対応するテキスト内容を表示し、又は前記第四の音素シーケンスによって合成された第二のオーディオデータを再生することとをさらに含む。
選択的に、前述した、第一の送信端末によって送信された第二の音素シーケンスを受信することの前、前記方法は、前記第一の音素変換ルールを決定することと、前記第一の音素変換ルールを第二の機器に送信することであって、前記第二の機器が前記第一の会議グループにおける第二のターゲットユーザ以外のユーザに対応する機器であり、前記第二のターゲットユーザが前記第一の受信端末に対応するユーザであることとをさらに含む。
選択的に、前述した、第一の送信端末によって送信された第二の音素シーケンスを受信することの前、前記方法は、第二の機器によって送信された音素変換ルールを受信することであって、前記第二の機器が前記第一の会議グループにおける第二のターゲットユーザ以外のユーザに対応する機器であり、前記第二のターゲットユーザが前記第一の受信端末に対応するユーザであることと、前記第二の機器によって送信された音素変換ルールを前記第一の音素変換ルールとして決定することとをさらに含む。
説明すべきことは、本発明の実施例による対話方法は、リモート会議の第一の受信端末に用いられる。この第一の受信端末は、上記実施例による第一の送信端末に対応する受信端末であり、その具体的な実現は、上記実施例の第一の送信端末による第三の音素シーケンスの受信プロセスの記述を参照すればよく、ここではこれ以上しない。
本発明の実施例では、リモート会議の会話メッセージを音素シーケンスの形式で伝送することにより、音声伝送形式による制限を回避し、ユーザが複数のリモート会議に同時に参加することを可能にする。同時に、音素変換ルールを使用して、伝送された音素シーケンスを暗号化・符号化することにより、会話メッセージの伝送の安全性を向上させる。
図7を参照すると、図7は、本発明の実施例による電子機器の構造図である。この電子機器は、リモート会議の第一の送信端末に用いられる。図7に示すように、電子機器700は、ユーザによって入力されたターゲット会話メッセージを受信するための第一の受信モジュール701と、前記ターゲット会話メッセージを第一の音素シーケンスに変換するための変換モジュール702と、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得るための符号化モジュール703と、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信するための第一の送信モジュール704とを含み、そのうち、前記ターゲット会話メッセージは、音声メッセージ又はテキストメッセージである。
選択的に、前記ターゲット会話メッセージが音声メッセージである場合、前記電子機器は、前記ターゲット会話メッセージをオーディオの方式で前記第一の会議グループの第二の受信端末に送信するための第二の送信モジュールをさらに含む。
選択的に、前記電子機器700は、第二の送信端末によって送信された第一のオーディオデータを受信するための第二の受信モジュールであって、前記第二の送信端末が第二の会議グループにおけるユーザに対応する機器であり、前記第二の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループである第二の受信モジュールと、前記第一のオーディオデータを再生するための第一の再生モジュールとをさらに含む。
選択的に、前記電子機器700は、第三の送信端末によって送信された第三の音素シーケンスを受信するための第三の受信モジュールであって、前記第三の送信端末が第三の会議グループにおけるユーザに対応する機器であり、前記第三の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループである第三の受信モジュールと、前記第三の会議グループに対応する第二の音素変換ルールに従って前記第三の音素シーケンスに対して音素復号化を行い、第四の音素シーケンスを得るための第一の復号化モジュールと、前記第四の音素シーケンスに対応するテキスト内容を表示し、又は前記第四の音素シーケンスによって合成された第二のオーディオデータを再生するための第一の制御モジュールとをさらに含む。
選択的に、前記電子機器700は、前記第一の送信端末の第一の表示領域で第一のターゲット内容を表示し、第二の表示領域で第二のターゲット内容を表示するための表示モジュールをさらに含み、そのうち、前記第一のターゲット内容は、電子プレゼンテーション文書、ビデオ情報及び会議チャットウィンドウのうちの少なくとも一つを含み、前記第二のターゲット内容は、電子プレゼンテーション文書、ビデオ情報及び会議チャットウィンドウのうちの少なくとも一つを含む。
選択的に、前記電子機器700は、前記第一の音素変換ルールを決定するための第一の決定モジュールと、前記第一の音素変換ルールを第一の機器に送信するための第三の送信モジュールであって、前記第一の機器が前記第一の会議グループにおける第一のターゲットユーザ以外のユーザに対応する機器であり、前記第一のターゲットユーザが前記第一の送信端末に対応するユーザである第三の送信モジュールとをさらに含む。
選択的に、前記電子機器700は、第一の機器によって送信された音素変換ルールを受信するための第四の受信モジュールであって、前記第一の機器が前記第一の会議グループにおける第一のターゲットユーザ以外のユーザに対応する機器であり、前記第一のターゲットユーザが前記第一の送信端末に対応するユーザである第四の受信モジュールと、前記第一の機器によって送信された音素変換ルールを前記第一の音素変換ルールとして決定するための第四の送信モジュールとをさらに含む。
本発明の実施例による電子機器は、図1~図5の方法の実施例において電子機器によって実現された各プロセスを実現することができる。説明の繰り返しを回避するために、ここではこれ以上説明しない。
図8を参照すると、図8は、本発明の実施例による電子機器の構造図である。この電子機器は、リモート会議の第一の受信端末に用いられる。図8に示すように、電子機器800は、第一の送信端末によって送信された第二の音素シーケンスを受信するための第五の受信モジュール801であって、前記第一の送信端末が第一の会議グループにおける機器である第五の受信モジュール801と、前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得るための第二の復号化モジュール802と、前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生するための第二の制御モジュール803とを含む。
選択的に、前記電子機器800は、第二の送信端末によって送信された第一のオーディオデータを受信するための第六の受信モジュールであって、前記第二の送信端末が第二の会議グループにおけるユーザに対応する機器であり、前記第二の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループである第六の受信モジュールと、前記第一のオーディオデータを再生するための第二の再生モジュールとをさらに含む。
選択的に、前記電子機器800は、第三の送信端末によって送信された第三の音素シーケンスを受信するための第七の受信モジュールであって、前記第三の送信端末が第三の会議グループにおけるユーザに対応する機器であり、前記第三の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループである第七の受信モジュールと、前記第三の会議グループに対応する第二の音素変換ルールに従って前記第三の音素シーケンスに対して音素復号化を行い、第四の音素シーケンスを得るための第三の復号化モジュールと、前記第四の音素シーケンスに対応するテキスト内容を表示し、又は前記第四の音素シーケンスによって合成された第二のオーディオデータを再生するための第三の制御モジュールとをさらに含む。
選択的に、前記電子機器800は、前記第一の音素変換ルールを決定するための第二の決定モジュールと、前記第一の音素変換ルールを第二の機器に送信するための第五の送信モジュールであって、前記第二の機器が前記第一の会議グループにおける第二のターゲットユーザ以外のユーザに対応する機器であり、前記第二のターゲットユーザが前記第一の受信端末に対応するユーザである第五の送信モジュールとをさらに含む。
選択的に、前記電子機器800は、第二の機器によって送信された音素変換ルールを受信するための第八の受信モジュールであって、前記第二の機器が前記第一の会議グループにおける第二のターゲットユーザ以外のユーザに対応する機器であり、前記第二のターゲットユーザが前記第一の受信端末に対応するユーザである第八の受信モジュールと、前記第二の機器によって送信された音素変換ルールを前記第一の音素変換ルールとして決定するための第三の決定モジュールとをさらに含む。
本発明の実施例による電子機器は、図6の方法の実施例において電子機器によって実現された各プロセスを実現することができる。説明の繰り返しを回避するために、ここではこれ以上説明しない。
図9は、本発明の各実施例を実現する電子機器のハードウェア構造概略図である。
この電子機器900は、無線周波数ユニット901、ネットワークモジュール902、オーディオ出力ユニット903、入力ユニット904、センサ905、表示ユニット906、ユーザ入力ユニット907、インターフェースユニット908、メモリ909、プロセッサ910、及び電源911などの部材を含むが、それらに限らない。当業者であれば理解できるように、図9に示される電子機器の構造は、電子機器に対する限定を構成せず、電子機器は、図示される部材の数よりも多くまたは少ない部材、またはなんらかの部材の組み合わせ、または異なる部材の配置を含んでもよい。本発明の実施例では、電子機器は、携帯電話、タブレットパソコン、ノートパソコン、パームトップコンピュータ、車載端末、ウェアラブルデバイス、及び歩数計などを含むが、それらに限らない。
そのうち、無線周波数ユニット901は、ユーザによって入力されたターゲット会話メッセージを受信するために用いられる。
プロセッサ910は、前記ターゲット会話メッセージを第一の音素シーケンスに変換し、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得るために用いられる。
無線周波数ユニット901はさらに、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信するために用いられる。
又は、無線周波数ユニット901は、第一の会議グループにおける機器である第一の送信端末によって送信された第二の音素シーケンスを受信するために用いられる。
プロセッサ910は、前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得て、前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生するために用いられる。
説明すべきことは、本発明の実施例による電子機器は、図1と図6の方法の実施例において電子機器によって実現された各プロセスを実現することができる。説明の繰り返しを回避するために、ここではこれ以上説明しない。本発明の実施例では、リモート会議の会話メッセージを音素シーケンスの形式で伝送することにより、音声伝送形式による制限を回避し、ユーザが複数のリモート会議に同時に参加することを可能にする。同時に、音素変換ルールを使用して、伝送された音素シーケンスを暗号化・符号化することにより、会話メッセージの伝送の安全性を向上させる。
理解すべきことは、本発明の実施例では、無線周波数ユニット901は、情報の送受信または通話中の信号の送受信に用いられてもよい。具体的には、基地局からの下りリンクデータを受信してから、プロセッサ910に処理させてもよい。また、上りリンクデータを基地局に送信してもよい。一般的には、無線周波数ユニット901は、アンテナ、少なくとも一つの増幅器、送受信機、カプラ、低雑音増幅器、デュプレクサなどを含むが、それらに限らない。なお、無線周波数ユニット901は、無線通信システムやネットワークを介して他の機器との通信を行ってもよい。
電子機器は、ネットワークモジュール902によってユーザに無線のブロードバンドインターネットアクセスを提供し、例えば、ユーザへ電子メールの送受信、ウェブページの閲覧、ストリーミングメディアへのアクセスなどを支援する。
オーディオ出力ユニット903は、無線周波数ユニット901またはネットワークモジュール902によって受信されたまたはメモリ909に記憶されたオーディオデータをオーディオ信号に変換して、音声として出力することができる。そして、オーディオ出力ユニット903はさらに、電子機器900によって実行された特定の機能に関連するオーディオ出力(例えば、呼び信号受信音、メッセージ着信音など)を提供することができる。オーディオ出力ユニット903は、スピーカ、ブザー及び受話器などを含む。
入力ユニット904は、オーディオまたはビデオ信号を受信するために用いられる。入力ユニット904は、グラフィックスプロセッサ(Graphics Processing Unit、GPU)9041とマイクロホン9042を含んでもよい。グラフィックスプロセッサ9041は、ビデオキャプチャモードまたは画像キャプチャモードにおいて画像キャプチャ装置(例えば、カメラ)によって得られた静止画像またはビデオの画像データを処理する。処理された画像フレームは、表示ユニット906に表示されてもよい。グラフィックスプロセッサ9041によって処理された画像フレームは、メモリ909(または他の記憶媒体)に記憶されてもよく、または無線周波数ユニット901またはネットワークモジュール902を介して送信されてもよい。マイクロホン9042は、音声を受信することができるとともに、このような音声をオーディオデータとして処理することができる。処理されたオーディオデータは、電話の通話モードにおいて、無線周波数ユニット901を介して移動通信基地局に送信することが可能なフォーマットに変換して出力されてもよい。
電子機器900は、少なくとも一つのセンサ905、例えば、光センサ、モーションセンサ及び他のセンサをさらに含む。具体的には、光センサは、環境光センサ及び接近センサを含み、そのうち、環境光センサは、環境光の明暗に応じて、表示パネル9061の輝度を調整することができ、接近センサは、電子機器900が耳元に移動した時、表示パネル9061及び/又はバックライトをオフにすることができる。モーションセンサの一種として、加速度計センサは、各方向(一般的には、三軸)での加速度の大きさを検出することができ、静止時、重力の大きさ及び方向を検出することができ、電子機器姿勢(例えば、縦横スクリーン切り替え、関連ゲーム、磁力計姿勢校正)の識別、振動識別関連機能(例えば、歩数計、タップ)などに用いることができる。センサ905は、指紋センサ、圧力センサ、虹彩センサ、分子センサ、ジャイロ、気圧計、湿度計、温度計、赤外線センサなどをさらに含んでもよい。ここではこれ以上説明しない。
表示ユニット906は、ユーザによって入力された情報またはユーザに提供される情報を表示するために用いられる。表示ユニット906は、表示パネル9061を含んでもよい。液晶ディスプレイ(Liquid Crystal Display、LCD)、有機発光ダイオード(Organic Light-Emitting Diode、OLED)などの形式で表示パネル9061を配置してもよい。
ユーザ入力ユニット907は、入力された数字または文字情報の受信、電子機器のユーザによる設置及び機能制御に関するキー信号入力の発生に用いられてもよい。具体的には、ユーザ入力ユニット907は、タッチパネル9071および他の入力機器9072を含む。タッチパネル9071は、タッチスクリーンとも呼ばれ、その上または付近でのユーザによるタッチ操作(例えば、ユーザが指、タッチペンなどの任意の適切な物体または付属品を使用してタッチパネル9071上またはタッチパネル9071付近で行う操作)を収集することができる。タッチパネル9071は、タッチ検出装置とタッチコントローラの二つの部分を含んでもよい。そのうち、タッチ検出装置は、ユーザによるタッチ方位を検出し、タッチ操作による信号を検出し、信号をタッチコントローラに伝送する。タッチコントローラは、タッチ検出装置からタッチ情報を受信し、それをタッチポイント座標に変換してから、プロセッサ910に送信し、プロセッサ910から送信されてきた指令を受信して実行する。なお、抵抗式、静電容量式、赤外線及び表面音波などの様々なタイプを用いてタッチパネル9071を実現してもよい。タッチパネル9071以外、ユーザ入力ユニット907は、他の入力機器9072を含んでもよい。具体的には、他の入力機器9072は、物理的なキーボード、機能キー(例えば、ボリューム制御ボタン、スイッチボタンなど)、トラックボール、マウス、操作レバーを含んでもよいが、それらに限らない。ここではこれ以上説明しない。
さらに、タッチパネル9071は、表示パネル9061上に覆われてもよい。タッチパネル9071は、その上または付近でのタッチ操作を検出すると、プロセッサ910に伝送して、タッチイベントのタイプを特定し、その後、プロセッサ910は、タッチイベントのタイプに応じて表示パネル9061上で相応な視覚出力を提供する。図9では、タッチパネル9071と表示パネル9061は、二つの独立した部材として電子機器の入力と出力機能を実現するものであるが、なんらかの実施例では、タッチパネル9071と表示パネル9061を集積して電子機器の入力と出力機能を実現してもよい。具体的には、ここでは限定しない。
インターフェースユニット908は、外部装置と電子機器900との接続のためのインターフェースである。例えば、外部装置は、有線または無線ヘッドフォンポート、外部電源(または電池充電器)ポート、有線または無線データポート、メモリカードポート、識別モジュールを有する装置への接続用のポート、オーディオ入力/出力(I/O)ポート、ビデオI/Oポート、イヤホンポートなどを含んでもよい。インターフェースユニット908は、外部装置からの入力(例えば、データ情報、電力など)を受信するとともに、受信した入力を電子機器900内の一つまたは複数の素子に伝送するために用いられてもよく、または電子機器900と外部装置との間でデータを伝送するために用いられてもよい。
メモリ909は、ソフトウェアプログラム及び各種のデータを記憶するために用いられてもよい。メモリ909は、主に記憶プログラム領域および記憶データ領域を含んでもよい。そのうち、記憶プログラム領域は、オペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラム(例えば、音声再生機能、画像再生機能など)などを記憶することができ、記憶データ領域は、携帯電話の使用によって作成されるデータ(例えば、オーディオデータ、電話帳など)などを記憶することができる。なお、メモリ909は、高速ランダムアクセスメモリを含んでもよく、非揮発性メモリ、例えば、少なくとも一つの磁気ディスクメモリデバイス、フラッシュメモリデバイス、または他の揮発性ソリッドステートメモリデバイスをさらに含んでもよい。
プロセッサ910は、電子機器の制御センターであり、各種のインターフェースと線路によって電子機器全体の各部分に接続され、メモリ909内に記憶されたソフトウェアプログラム及び/又はモジュールを運行又は実行すること、及びメモリ909内に記憶されたデータを呼び出し、電子機器の各種の機能を実行し、データを処理することにより、電子機器全体をモニタリングする。プロセッサ910は、一つまたは複数の処理ユニットを含んでもよい。好ましくは、プロセッサ910は、アプリケーションプロセッサとモデムプロセッサを集積してもよい。そのうち、アプリケーションプロセッサは、主にオペレーティングシステム、ユーザインターフェースおよびアプリケーションプログラムなどを処理するためのものであり、モデムプロセッサは、主に無線通信を処理するためのものである。理解できるように、上記モデムプロセッサは、プロセッサ910に集積されなくてもよい。
電子機器900はさらに、各部材に電力を供給する電源911(例えば、電池)を含んでもよい。選択的に、電源911は、電源管理システムによってプロセッサ910にロジック的に接続されてもよい。それにより、電源管理システムによって充放電管理及び消費電力管理などの機能を実現することができる。
また、電子機器900は、いくつかの示されていない機能モジュールを含む。ここではこれ以上説明しない。
選択的に、本発明の実施例は、電子機器をさらに提供する。プロセッサ910と、メモリ909と、メモリ909に記憶され、且つ前記プロセッサ910上で運行できるコンピュータプログラムとを含み、このコンピュータプログラムがプロセッサ910によって実行される時、上記対話方法の実施例の各プロセスを実現させ、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここではこれ以上説明しない。
本発明の実施例は、コンピュータ可読記憶媒体をさらに提供する。コンピュータ可読記憶媒体にはコンピュータプログラムが記憶されており、このコンピュータプログラムがプロセッサによって実行される時、対話方法の実施例の各プロセスを実現させ、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここではこれ以上説明しない。そのうち、前記コンピュータ可読記憶媒体は、例えば、読み取り専用メモリ(Read-Only Memory、ROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、磁気ディスクまたは光ディスクなどである。
当業者であれば意識できるように、本明細書に開示された実施例を結び付けて記述された様々な例のユニット及びアルゴリズムステップは、電子ハードウェアまたはコンピュータソフトウェアと電子ハードウェアとの組み合わせで実現されてもよい。これらの機能が、ハードウェア方式で実行されるか、ソフトウェア方式で実行されるかは、技術案の特定の応用及び設計拘束条件によるものである。当業者は、各特定の応用に対して異なる方法を使用して、記述された機能を実現することができるが、このような実現は、本発明の範囲を超えていると考えるべきではない。
当業者が明確に理解できるように、記述の利便性および簡潔性のために、以上に記述されたシステム、装置、およびユニットの具体的な作動プロセスは、前記方法の実施例における対応するプロセスを参照すればよい。ここではこれ以上説明しない。
本出願によって提供される実施例では、理解すべきことは、掲示された装置および方法は、他の方式によって実現されてもよい。例えば、以上に記述された装置の実施例は、単なる例示的なものであり、例えば、前記ユニットの区分は、単なる論理的機能区分であり、実際に実現する時、他の区分方式があってもよい。例えば、複数のユニットまたはコンポーネントは、別のシステムに結合されてもよく、または集積されてもよく、またはいくつかの特徴が無視されてもよく、または実行されなくてもよい。また、表示又は討論された同士間の結合又は直接結合又は通信接続は、いくつかのインターフェース、装置又はユニットによる間接の結合又は通信接続であってもよく、電気的、機械的、又は他の形式であってもよい。
前記分離された部品として説明されるユニットは、物理的に分離されてもよく、または物理的に分離されなくてもよく、ユニットとして表示される部品は、物理的なユニットであってもよく、または、物理的なユニットでなくてもよく、すなわち、一つの場所に位置してもよく、または複数のネットワークユニットに分布されてもよい。実際の必要に応じて、そのうちの一部又は全部のユニットを選択して、本発明の実施例の方案の目的を実現することができる。
また、本発明の各実施例における各機能ユニットは、一つの処理ユニットに集積されてもよく、各ユニットが物理的に単独に存在してもよく、二つ以上のユニットが一つのユニットに集積されてもよい。
前記機能は、ソフトウェア機能ユニットの形式で実現され、且つ独立した製品として販売又は使用される場合、一つのコンピュータ可読記憶媒体に記憶されてもよい。このような理解を踏まえて、本発明の技術案は、実質には、又は従来技術に寄与した部分又はこの技術案に関する部分がソフトウェア製品の形式によって表われてもよい。このコンピュータソフトウェア製品は、一つの記憶媒体に記憶され、一台のコンピュータ機器(パソコン、サーバ、又はネットワーク機器などであってもよい)に本発明の各実施例に記載の方法の全部又は一部のステップを実行させるための若干の指令を含む。前記記憶媒体は、Uディスク、リムーバブルハードディスク、ROM、RAM、磁気ディスク又は光ディスク等の様々なプログラムコードを記憶可能な媒体を含む。
以上に記載の内容は、本発明の具体的な実施の形態に過ぎず、本発明の保護範囲は、それに限らない。いかなる当業者が、本発明に掲示される技術的範囲内に、容易に想到できる変形又は置き換えは、いずれも、本発明の保護範囲内に含まれるべきである。そのため、本発明の保護範囲は、特許請求の範囲の保護範囲を基準とすべきである。

Claims (16)

  1. リモート会議の第一の送信端末に用いられる対話方法であって、
    ユーザによって入力されたターゲット会話メッセージを受信することと、
    前記ターゲット会話メッセージを第一の音素シーケンスに変換することと、
    第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得ることと、
    前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信することとを含み、
    そのうち、前記ターゲット会話メッセージは、音声メッセージ又はテキストメッセージである、ことを特徴とする対話方法。
  2. 前記ターゲット会話メッセージが音声メッセージである場合、前述した、ユーザによって入力されたターゲット会話メッセージを受信することの後、前記方法は、
    前記ターゲット会話メッセージをオーディオの方式で前記第一の会議グループの第二の受信端末に送信することをさらに含む、ことを特徴とする請求項1に記載の方法。
  3. 前記方法は、
    第二の送信端末によって送信された第一のオーディオデータを受信することであって、前記第二の送信端末が第二の会議グループにおけるユーザに対応する機器であり、前記第二の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、
    前記第一のオーディオデータを再生することとをさらに含む、ことを特徴とする請求項1に記載の方法。
  4. 前記方法は、
    第三の送信端末によって送信された第三の音素シーケンスを受信することであって、前記第三の送信端末が第三の会議グループにおけるユーザに対応する機器であり、前記第三の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、
    前記第三の会議グループに対応する第二の音素変換ルールに従って前記第三の音素シーケンスに対して音素復号化を行い、第四の音素シーケンスを得ることと、
    前記第四の音素シーケンスに対応するテキスト内容を表示し、又は前記第四の音素シーケンスによって合成された第二のオーディオデータを再生することとをさらに含む、ことを特徴とする請求項1~3のいずれか1項に記載の方法。
  5. 前述した、ユーザによって入力されたターゲット会話メッセージを受信することの前に、前記方法は、
    前記第一の送信端末の第一の表示領域で第一のターゲット内容を表示し、第二の表示領域で第二のターゲット内容を表示することをさらに含み、
    そのうち、前記第一のターゲット内容は、電子プレゼンテーション文書、ビデオ情報及び会議チャットウィンドウのうちの少なくとも一つを含み、前記第二のターゲット内容は、電子プレゼンテーション文書、ビデオ情報及び会議チャットウィンドウのうちの少なくとも一つを含む、ことを特徴とする請求項1に記載の方法。
  6. 前述した、ユーザによって入力されたターゲット会話メッセージを受信することの前に、前記方法は、
    前記第一の音素変換ルールを決定することと、
    前記第一の音素変換ルールを第一の機器に送信することであって、前記第一の機器が前記第一の会議グループにおける第一のターゲットユーザ以外のユーザに対応する機器であり、前記第一のターゲットユーザが前記第一の送信端末に対応するユーザであることとをさらに含む、ことを特徴とする請求項1に記載の方法。
  7. 前述した、ユーザによって入力されたターゲット会話メッセージを受信することの前、前記方法は、
    第一の機器によって送信された音素変換ルールを受信することであって、前記第一の機器が前記第一の会議グループにおける第一のターゲットユーザ以外のユーザに対応する機器であり、前記第一のターゲットユーザが前記第一の送信端末に対応するユーザであることと、
    前記第一の機器によって送信された音素変換ルールを前記第一の音素変換ルールとして決定することとをさらに含む、ことを特徴とする請求項1に記載の方法。
  8. リモート会議の第一の受信端末に用いられる対話方法であって、
    第一の会議グループにおける機器である第一の送信端末によって送信された第二の音素シーケンスを受信することと、
    前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得ることと、
    前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生することとを含む、ことを特徴とする対話方法。
  9. 前記方法は、
    第二の送信端末によって送信された第一のオーディオデータを受信することであって、前記第二の送信端末が第二の会議グループにおけるユーザに対応する機器であり、前記第二の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、
    前記第一のオーディオデータを再生することとをさらに含む、ことを特徴とする請求項8に記載の方法。
  10. 前記方法は、
    第三の送信端末によって送信された第三の音素シーケンスを受信することであって、前記第三の送信端末が第三の会議グループにおけるユーザに対応する機器であり、前記第三の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、
    前記第三の会議グループに対応する第二の音素変換ルールに従って前記第三の音素シーケンスに対して音素復号化を行い、第四の音素シーケンスを得ることと、
    前記第四の音素シーケンスに対応するテキスト内容を表示し、又は前記第四の音素シーケンスによって合成された第二のオーディオデータを再生することとをさらに含む、ことを特徴とする請求項8又は9に記載の方法。
  11. 前述した、第一の送信端末によって送信された第二の音素シーケンスを受信することの前、前記方法は、
    前記第一の音素変換ルールを決定することと、
    前記第一の音素変換ルールを第二の機器に送信することであって、前記第二の機器が前記第一の会議グループにおける第二のターゲットユーザ以外のユーザに対応する機器であり、前記第二のターゲットユーザが前記第一の受信端末に対応するユーザであることとをさらに含む、ことを特徴とする請求項8に記載の方法。
  12. 前述した、第一の送信端末によって送信された第二の音素シーケンスを受信することの前、前記方法は、
    第二の機器によって送信された音素変換ルールを受信することであって、前記第二の機器が前記第一の会議グループにおける第二のターゲットユーザ以外のユーザに対応する機器であり、前記第二のターゲットユーザが前記第一の受信端末に対応するユーザであることと、
    前記第二の機器によって送信された音素変換ルールを前記第一の音素変換ルールとして決定することとをさらに含む、ことを特徴とする請求項8に記載の方法。
  13. リモート会議の第一の送信端末に用いられる電子機器であって、
    ユーザによって入力されたターゲット会話メッセージを受信するための第一の受信モジュールと、
    前記ターゲット会話メッセージを第一の音素シーケンスに変換するための変換モジュールと、
    第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得るための符号化モジュールと、
    前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信するための第一の送信モジュールとを含み、
    そのうち、前記ターゲット会話メッセージは、音声メッセージ又はテキストメッセージである、ことを特徴とする電子機器。
  14. リモート会議の第一の受信端末に用いられる電子機器であって、
    第一の会議グループにおける機器である第一の送信端末によって送信された第二の音素シーケンスを受信するための第五の受信モジュールと、
    前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得るための第二の復号化モジュールと、
    前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生するための第二の制御モジュールとを含む、ことを特徴とする電子機器。
  15. プロセッサと、メモリと、前記メモリに記憶され、且つ前記プロセッサ上で運行できるコンピュータプログラムとを含み、前記コンピュータプログラムが前記プロセッサによって実行される時、請求項1~12のいずれか1項に記載の対話方法のステップを実現させる、ことを特徴とする電子機器。
  16. コンピュータプログラムが記憶されているコンピュータ可読記憶媒体であって、前記コンピュータプログラムがプロセッサによって実行される時、請求項1~12のいずれか1項に記載の対話方法のステップを実現させる、ことを特徴とするコンピュータ可読記憶媒体。
JP2022528722A 2019-11-20 2020-11-17 対話方法及び電子機器 Pending JP2023502386A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201911140650.5 2019-11-20
CN201911140650.5A CN111147444B (zh) 2019-11-20 2019-11-20 一种交互方法及电子设备
PCT/CN2020/129320 WO2021098675A1 (zh) 2019-11-20 2020-11-17 交互方法及电子设备

Publications (1)

Publication Number Publication Date
JP2023502386A true JP2023502386A (ja) 2023-01-24

Family

ID=70517185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022528722A Pending JP2023502386A (ja) 2019-11-20 2020-11-17 対話方法及び電子機器

Country Status (6)

Country Link
US (1) US20220277730A1 (ja)
EP (1) EP4064280A4 (ja)
JP (1) JP2023502386A (ja)
KR (1) KR20220104772A (ja)
CN (1) CN111147444B (ja)
WO (1) WO2021098675A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111147444B (zh) * 2019-11-20 2021-08-06 维沃移动通信有限公司 一种交互方法及电子设备
CN114157991B (zh) * 2020-08-18 2023-04-25 成都鼎桥通信技术有限公司 群组呼叫的录音记录播放方法及设备
CN112069816A (zh) * 2020-09-14 2020-12-11 深圳市北科瑞声科技股份有限公司 中文标点符号添加方法和系统及设备
CN112532912A (zh) * 2020-11-20 2021-03-19 北京搜狗科技发展有限公司 一种视频处理方法、装置和电子设备
CN113178187A (zh) * 2021-04-26 2021-07-27 北京有竹居网络技术有限公司 一种语音处理方法、装置、设备及介质、程序产品
CN114442502B (zh) * 2022-01-27 2024-02-06 北京声智科技有限公司 信息交互方法、系统及电子设备

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0071716B1 (en) * 1981-08-03 1987-08-26 Texas Instruments Incorporated Allophone vocoder
JP2834260B2 (ja) * 1990-03-07 1998-12-09 三菱電機株式会社 音声のスペクトル包絡パラメータ符号化装置
CN1120469C (zh) * 1998-02-03 2003-09-03 西门子公司 传输语音数据的方法
US6073094A (en) * 1998-06-02 2000-06-06 Motorola Voice compression by phoneme recognition and communication of phoneme indexes and voice features
EP1215659A1 (en) * 2000-12-14 2002-06-19 Nokia Corporation Locally distibuted speech recognition system and method of its operation
US6789066B2 (en) * 2001-09-25 2004-09-07 Intel Corporation Phoneme-delta based speech compression
US7136811B2 (en) * 2002-04-24 2006-11-14 Motorola, Inc. Low bandwidth speech communication using default and personal phoneme tables
US20050273327A1 (en) * 2004-06-02 2005-12-08 Nokia Corporation Mobile station and method for transmitting and receiving messages
US8204748B2 (en) * 2006-05-02 2012-06-19 Xerox Corporation System and method for providing a textual representation of an audio message to a mobile device
US20080126093A1 (en) * 2006-11-28 2008-05-29 Nokia Corporation Method, Apparatus and Computer Program Product for Providing a Language Based Interactive Multimedia System
GB0623915D0 (en) * 2006-11-30 2007-01-10 Ibm Phonetic decoding and concatentive speech synthesis
US8301447B2 (en) * 2008-10-10 2012-10-30 Avaya Inc. Associating source information with phonetic indices
CN101789871B (zh) * 2009-01-23 2012-10-03 国际商业机器公司 支持多个同时在线会议的方法、服务器端及客户端设备
CN103796181A (zh) * 2012-11-05 2014-05-14 华为技术有限公司 一种发送消息的播放方法、系统及相关设备
US9609272B2 (en) * 2013-05-02 2017-03-28 Avaya Inc. Optimized video snapshot
CN103474075B (zh) * 2013-08-19 2016-12-28 科大讯飞股份有限公司 语音信号发送方法及系统、接收方法及系统
GB201517331D0 (en) * 2015-10-01 2015-11-18 Chase Information Technology Services Ltd And Cannings Nigel H System and method for preserving privacy of data in a cloud
CN105430208A (zh) * 2015-10-23 2016-03-23 小米科技有限责任公司 语音会话方法、装置及终端设备
CN105679306B (zh) * 2016-02-19 2019-07-09 云知声(上海)智能科技有限公司 语音合成中预测基频帧的方法及系统
CN107767205A (zh) * 2016-08-23 2018-03-06 阿里巴巴集团控股有限公司 评价信息的展示系统、方法、客户端及处理方法、服务器
CN108986790A (zh) * 2018-09-29 2018-12-11 百度在线网络技术(北京)有限公司 语音识别联系人的方法和装置
CN109558853B (zh) * 2018-12-05 2021-05-25 维沃移动通信有限公司 一种音频合成方法及终端设备
CN109859737A (zh) * 2019-03-28 2019-06-07 深圳市升弘创新科技有限公司 通讯加密方法、系统及计算机可读存储介质
CN110113316B (zh) * 2019-04-12 2022-10-14 深圳壹账通智能科技有限公司 会议接入方法、装置、设备及计算机可读存储介质
CN111147444B (zh) * 2019-11-20 2021-08-06 维沃移动通信有限公司 一种交互方法及电子设备

Also Published As

Publication number Publication date
CN111147444B (zh) 2021-08-06
EP4064280A1 (en) 2022-09-28
US20220277730A1 (en) 2022-09-01
KR20220104772A (ko) 2022-07-26
CN111147444A (zh) 2020-05-12
WO2021098675A1 (zh) 2021-05-27
EP4064280A4 (en) 2023-01-11

Similar Documents

Publication Publication Date Title
JP2023502386A (ja) 対話方法及び電子機器
WO2021036566A1 (zh) 信息处理方法、装置、电子设备及介质
EP2574220B1 (en) Hand-held communication aid for individuals with auditory, speech and visual impairments
KR101633208B1 (ko) 인스턴트 통신 음성 인식 방법 및 단말기
WO2014008843A1 (zh) 一种声纹特征模型更新方法及终端
CN102597914A (zh) 用于语音到文本转换的触觉增加的系统和方法
WO2019233325A1 (zh) 提示方法及移动终端
US9397850B2 (en) Conference system and associated signalling method
WO2021012900A1 (zh) 控制振动的方法、装置、移动终端及计算机可读存储介质
US10741172B2 (en) Conference system, conference system control method, and program
WO2019201271A1 (zh) 通话处理方法及移动终端
KR100713518B1 (ko) 캐릭터 연동 방법 및 이를 위한 이동통신단말기
CN107919138A (zh) 一种语音中的情绪处理方法及移动终端
KR20190068024A (ko) 통화 중 인공지능 서비스를 제공하기 위한 방법 및 그 전자 장치
CN103945065A (zh) 消息提醒的方法及装置
CN108134736B (zh) 建群方法及装置
CN110457716B (zh) 一种语音输出方法及移动终端
WO2016157993A1 (ja) 情報処理装置、情報処理方法およびプログラム
US20080043934A1 (en) Communication device for visually impaired persons
WO2021238844A1 (zh) 音频输出方法及电子设备
WO2021098708A1 (zh) 通话方法及终端设备
WO2018035873A1 (zh) 音频数据处理方法、终端设备和存储介质
CN107645604B (zh) 一种通话处理方法及移动终端
CN112700783A (zh) 通讯的变声方法、终端设备和存储介质
KR20110050483A (ko) 통신 방법, 통신 관련 시스템 및 관련 변환부

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230725

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240325