JP2023502386A

JP2023502386A - 対話方法及び電子機器

Info

Publication number: JP2023502386A
Application number: JP2022528722A
Authority: JP
Inventors: 路波続; 育進胡
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Mobile Communication Co Ltd
Priority date: 2019-11-20
Filing date: 2020-11-17
Publication date: 2023-01-24
Also published as: CN111147444B; EP4064280A1; US20220277730A1; KR20220104772A; CN111147444A; WO2021098675A1; EP4064280A4

Abstract

本発明は、対話方法及び電子機器を提供する。この方法は、ユーザによって入力されたターゲット会話メッセージを受信することと、前記ターゲット会話メッセージを第一の音素シーケンスに変換することと、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得ることと、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信することとを含み、そのうち、前記ターゲット会話メッセージは、音声メッセージ又はテキストメッセージである。【選択図】図１

Description

関連出願の相互参照

本出願は、２０１９年１１月２０日に中国で提出された中国特許出願番号Ｎｏ．２０１９１１１４０６５０．５の優先権を主張しており、同出願の内容の全ては、ここに参照として取り込まれる。

本発明は、通信技術分野に関し、特に対話方法及び電子機器に関する。

現在のリモートビデオ会議システムでは、異なる場所にいる人々が、一つの会議に同時に参加でき、会議の各参加者は、いずれも主会場の表示スクリーンを見ることができる。現在のリモートビデオ会議は、一般的に、オーディオ、ビデオ及び電子文書を会議の各参加者に直接送信する。このように、一つの時刻で一つのリモートビデオ会議のみに参加できる。そのため、従来技術では、電子機器を介してリモートビデオ会議に参加する時に会議に参加する数が限られるという問題がある。

本発明の実施例は、電子機器を介してビデオ会議に参加する時にビデオ会議数が限られるという問題を解決するための対話方法及び電子機器を提供する。

第一の方面によれば、本発明の実施例は、リモート会議の第一の送信端末に用いられる対話方法を提供する。前記方法は、ユーザによって入力されたターゲット会話メッセージを受信することと、前記ターゲット会話メッセージを第一の音素シーケンスに変換することと、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得ることと、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信することとを含み、そのうち、前記ターゲット会話メッセージは、音声メッセージ又はテキストメッセージである。

第二の方面によれば、本発明の実施例は、リモート会議の第一の受信端末に用いられる対話方法をさらに提供する。前記方法は、第一の会議グループにおける機器である第一の送信端末によって送信された第二の音素シーケンスを受信することと、前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得ることと、前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生することとを含むことを特徴とする。

第三の方面によれば、本発明の実施例は、リモート会議の第一の送信端末に用いられる電子機器をさらに提供する。前記電子機器は、ユーザによって入力されたターゲット会話メッセージを受信するための第一の受信モジュールと、前記ターゲット会話メッセージを第一の音素シーケンスに変換するための変換モジュールと、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得るための符号化モジュールと、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信するための第一の送信モジュールとを含み、そのうち、前記ターゲット会話メッセージは、音声メッセージ又はテキストメッセージであることを特徴とする。

第四の方面によれば、本発明の実施例は、リモート会議の第一の受信端末に用いられる電子機器をさらに提供する。前記電子機器は、第一の会議グループにおける機器である第一の送信端末によって送信された第二の音素シーケンスを受信するための第五の受信モジュールと、前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得るための第二の復号化モジュールと、前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生するための第二の制御モジュールとを含む。

第五の方面によれば、本発明の実施例は、電子機器をさらに提供する。前記電子機器は、プロセッサと、メモリと、前記メモリに記憶され、且つ前記プロセッサ上で運行できるコンピュータプログラムとを含み、前記コンピュータプログラムが前記プロセッサによって実行される時、上記対話方法のステップを実現させる。

第六の方面によれば、本発明の実施例は、コンピュータ可読記憶媒体をさらに提供する。前記コンピュータ可読記憶媒体にはコンピュータプログラムが記憶されており、前記コンピュータプログラムがプロセッサによって実行される時、上記対話方法のステップを実現させる。

本発明の実施例は、ユーザによって入力されたターゲット会話メッセージを受信し、前記ターゲット会話メッセージを第一の音素シーケンスに変換し、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得て、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信することにより、会話メッセージの送信を実現する。リモート会議の会話メッセージを音素シーケンスの形式で伝送することにより、音声伝送形式による制限を回避し、ユーザが複数のリモート会議に同時に参加することを可能にする。同時に、音素変換ルールを使用して、伝送された音素シーケンスを暗号化・符号化することにより、会話メッセージの伝送の安全性を向上させる。

本発明の実施例の技術案をより明瞭に説明するために、以下は、本発明の実施例の記述において使用される必要がある添付図面を簡単に紹介する。自明なことに、以下の記述における添付図面は、ただ本発明のいくつかの実施例に過ぎず、当業者にとって、創造的な労力を払わない前提で、それらの添付図面に基づき、他の添付図面を取得することもできる。
本発明の実施例による対話方法のフローチャートのその一である。本発明の実施例による対話方法におけるリモート会議インターフェースの例を示す図のその一である。本発明の実施例による対話方法におけるリモート会議インターフェースの例を示す図のその二である。本発明の実施例による対話方法におけるリモート会議インターフェースの例を示す図のその三である。本発明の実施例による対話方法におけるリモート会議インターフェースの例を示す図のその四である。本発明の実施例による対話方法のフローチャートのその二である。本発明の実施例による電子機器の構造図のその一である。本発明の実施例による電子機器の構造図のその二である。本発明の実施例による電子機器の構造図のその三である。

以下は、本発明の実施例における添付図面を結び付けながら、本発明の実施例における技術案を明瞭且つ完全に記述する。明らかに、記述された実施例は、本発明の一部の実施例であり、全部の実施例ではない。本発明における実施例に基づき、当業者が創造的な労力を払わない前提で得られたすべての他の実施例は、いずれも本発明の保護範囲に属する。

図１を参照する。図１は、本発明の実施例による対話方法のフローチャートであり、図１に示すように、以下のステップを含む。

ステップ１０１では、ユーザによって入力されたターゲット会話メッセージを受信する。

本発明の実施例による対話方法は、主に、リモート会議に用いられ、音声メッセージの伝送を制御するために用いられる。本実施例の対話方法は、リモート会議の第一の送信端末に用いられる。具体的には、リモート会議でターゲット会話メッセージを送信する参加者は、第一の送信端末であり、この第一の送信端末は、リモート会議の他の参加者によって送信された会話メッセージを受信してもよい。

上述した前記ターゲット会話メッセージが音声メッセージ又はテキストメッセージであることについては、選択的に、第一の送信端末のユーザは、音声送信が便利である状態においては、音声の形式でターゲット会話メッセージを入力してもよく、音声送信が不便である状態においては、テキストの形式でターゲット会話メッセージを入力してもよい。上記リモート会議は、ビデオ会議であってもよく、音声会議であってもよく、ここではさらに限定しない。

例えば、一実施例では、ユーザによる選択・入力のために音声入力モードとテキスト入力モードを設定してもよい。理解すべきことは、複数のリモート会議に参加する時、ユーザクライアントは、あるリモート会議を音声入力モードとして、他のリモート会議をテキスト入力モードとして選択する。すべてのリモート会議をいずれもテキスト入力モードに設定してもよい。本発明の実施例では、音声入力モードは、ローカルに収集された音声データをリモート会議の残りの各参加者にリアルタイムで伝送することを指す。

別の実施例では、音声入力コントロールを設定してもよく、操作コントロールを押すと、音声入力を行ってもよい。このように、リモート会議ごとに一つのコミュニケーションインターフェースを設定することができ、このコミュニケーションインターフェース上で残りの各参加者によって送信された音声から変換されたテキストメッセージを表示するとともに、音声入力コントロールとテキスト入力コントロールを表示し、ユーザは、テキスト又は音声の入力を選択的に行うことができる。理解すべきことは、このコミュニケーションインターフェースを同時に一つ又は複数表示してもよく、例えば、一つ表示する場合、操作を切り替えることにより、異なるリモート会議に対応するコミュニケーションインターフェースを切り替えて表示してもよい。

ステップ１０２では、前記ターゲット会話メッセージを第一の音素シーケンスに変換する。

本発明の実施例では、音素は、声母と、韻母と、全体認読音節とを含んでもよい。ターゲット会話メッセージが音声メッセージである場合、音声認識技術に基づき、ユーザによって入力されたターゲット会話メッセージに対して音声認識を行い、第一の音素シーケンスを得てもよい。ターゲット会話メッセージがテキストメッセージである場合、発音注記ツールによってターゲット会話メッセージに対して発音注記を行い、第一の音素シーケンスを得てもよい。

ステップ１０３では、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得る。

本発明の実施例では、上記第一の音素変換ルールは、暗号化ルールであり、又は音素マッピングルールとして理解されてもよく、第一の音素シーケンスにおける各音素を第一の音素変換ルールに従って別のマッピングに変換する。選択的に、第一の音素シーケンスと第二の音素シーケンスとの間は、一対一のマッピング関係であってもよく、一対多のマッピング関係であってもよく、ここではさらに限定しない。

選択的に、異なる会議グループに対応する音素変換ルールは、同じであってもよく、異なってもよく、ここではさらに限定しない。理解すべきことは、同一の会議グループ内の音素変換ルールは同じであるため、各参加者がいずれも音素を正しく復号化できることを保証できる。本発明の実施例では、音素変換ルールを使用して第一の音素シーケンスを暗号化・符号化することにより、各参加者のみが正しく復号化し、会議の内容を知ることできることを保証することができる。そのため、メッセージの送信の安全性を向上させ、会議の内容が他人に傍受されるのを防ぐことができる。上記会議グループとは、同一のリモート会議に参加するすべての参加者を指す。

理解すべきことは、声母は、ｂ、ｐ、ｍ、ｆ、ｄ、ｔ、ｎ、ｌ、ｇ、ｋ、ｈ、ｊ、ｑ、ｘ、ｚｈ、ｃｈ、ｓｈ、ｒ、ｚ、ｃ、ｓの合計２１個である。

韻母は、ａ、ｏ、ｅ、ｉ、ｕ、ｖ、ａｉ、ｅｉ、ｕｉ、ａｏ、ｏｕ、ｉｕ、ｉｅ、ｖｅ、ｅｒ、ａｎ、ｅｎ、ｉｎ、ｕｎ、ｖｎ、ａｎｇ、ｅｎｇ、ｉｎｇ、ｏｎｇの２４個である。各韻母が４つのトーンを有するため、韻母は、合計９６個ある。

全体認読音節は、ｚｈｉ、ｃｈｉ、ｓｈｉ、ｒｉ、ｚｉ、ｃｉ、ｓｉ、ｙｕａｎ、ｙａ、ｙａｏ、ｙａｎ、ｙａｎｇ、ｙｕａｎ、ｙｏ、ｙｏｎｇ、ｗａ、ｗａｉ、ｗａｎ、ｗａｎｇ、ｗｏ、ｗｅｎｇの２１個である。

そのうち、ｙ、ｗは、声母とされておらず、ｙ、ｗと組み合わせることができる韻母は、全体認読音節とされており、一つの音素として見なされている。一つの字のピンインは、声母と韻母を組み合わせて構成されてもよく、一つの韻母であってもよく、又は一つの全体認読音節であってもよい。各全体認読音節が４つのトーンを有するため、全体認読音節は、合計８４個ある。

声母は、単独で一つの字を表すことができない。そのため、音素符号化の時、声母は、声母に符号化されることしかできず、韻母は、韻母に符号化されることしかできず、全体認読音節は、全体認読音節に符号化されることしかできない。

順列組み合わせに応じて、声母は、２１^２１種の符号化形式を有し、韻母は、９６^９６種の符号化形式を有し、全体認読音節は、８４^８４種の符号化形式を有する。最終的に（２１^２１＋９６^９６＋８４^８４）種の符号化リスト（即ち上記音素変換ルール）を形成することが可能であるため、符号化リストの復号化は非常に困難になる。つまり、上記第一の音素変換ルールは、（２１^２１＋９６^９６＋８４^８４）種の音素変換ルールのうちの一種である。そのため、本発明の実施例は、音素符号化ルールを使用して音素シーケンスを暗号化・符号化することにより、メッセージの伝送の安全性を向上させることができる。

例えば、一選択的な実施例では、ユーザによって入力されたターゲット会話メッセージは、「我的密碼隠蔵在這里（私のパスワードはここに隠されている）」ということであり、音声認識によって得られた上記第一の音素シーケンスは、「ｗｏ３ｄｅ１ｍｉ４ｍａ３ｙｉｎｇ３ｃａｎｇ２ｚａｉ４ｚｈｅ４ｌｉ１」である。第一の音素シーケンスを第一の音素変換ルールに従って変換した第二の音素シーケンスは、「ｗｏ３ｓｈｕｏ１ｊｉｎ１ｔｉａｎ１ｄｅ１ｔｉａｎ１ｑｉ１ｚｈｅｎ１ｈａｏ３」である。

ステップ１０４では、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信する。

本発明の実施例では、上記第一の受信端末は、上記第一の会議グループにおける第一の送信端末以外のすべての参加者であってもよく、つまり、本実施例では、ユーザによって入力されたターゲット会話メッセージに対して音素符号化を行った後にすべての参加者に送信してもよい。

理解すべきことは、一回のリモート会議は、主会場内に位置する参加者と、主会場外に位置する他の参加者とを含む。この第一の送信側は、第一の会議グループに対応するリモート会議の主会場内に位置する参加者であってもよく、他の会議グループに対応するリモート会議の主会場内に位置する参加者であってもよく、いずれのリモート会議の主会場内にも位置しない参加者であってもよい。

理解すべきことは、上記第一の音素変換ルールは、事前に約定されるものであってもよく、各参加者は、それをローカルに直接選択すればよく、また、特定の参加者（例えば、主会場の参加者又は他の参加者）は、音素変換ルールをランダムに選択した後に他の各参加者に送信してもよく、参加者が追加された時、追加された参加者は、特定の参加者に音素変換ルールを要求し、特定の参加者の許可を取得した後、特定の参加者は、音素変換ルールをこの追加された参加者に送信する。

説明すべきことは、ターゲット会話メッセージがテキストメッセージである場合、第一の送信端末は第一の会議グループで音声送信が不便であり、例えば、第一の送信端末は、他の会議グループで音声通話を行っており（例えば、他の会議グループに対応するリモート会議の主会場内に位置する）、又は第一の送信端末は現在の環境で音声送信が不適切である（他人と相談しており、会議の内容が他人に知られると良くない）と理解されてもよい。この時、第一の送信端末は、第一の会議グループにおける残りの各参加者に会話メッセージを音素の方式で送信する。

ターゲット会話メッセージが音声メッセージである場合、第一の送信端末は、第一の会議グループで音声送信が便利であると理解されてもよい。この時、第一の送信端末は、第一の会議グループで音声受信が不便である参加者に会話メッセージを音素の方式で送信してもよく、第一の会議グループで音声受信が便利である参加者に会話メッセージを音素又はオーディオの方式で送信してもよい。例えば、前記ターゲット会話メッセージが音声メッセージである場合、上記ステップ１０１の後、前記方法は、前記ターゲット会話メッセージをオーディオの方式で前記第一の会議グループの第二の受信端末に送信することをさらに含む。

本実施例では、上記第一の受信端末は、ユーザによって指定して送信される参加者（又はすべての参加者）のうちの聞き取りが不便である参加者であり、上記第二の受信端末は、ユーザによって指定して送信される参加者（又はすべての参加者）のうちの聞き取りが便利である参加者である。本実施例では、聞き取りが便利である参加者にターゲット会話メッセージをオーディオの方式で直接送信することにより、会話メッセージの送信の実効性を向上させることができる。この指定して送信される参加者は、主会場の参加者又は他の参加者であってもよい。

理解すべきことは、第一の送信端末は、会話メッセージの送信以外に、会話メッセージの受信に用いられてもよい。会話メッセージを受信する時、オーディオの方式で受信してもよく、音素の方式で受信してもよい。

例えば、一選択的な実施例では、前記方法は、第二の送信端末によって送信された第一のオーディオデータを受信することであって、前記第二の送信端末が第二の会議グループにおけるユーザに対応する機器であり、前記第二の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、前記第一のオーディオデータを再生することとをさらに含む。

説明すべきことは、一般的に、同一の時刻で、第一の送信端末が一つの会議グループのみでオーディオデータをオーディオの方式で送信又は受信でき、異なる時刻で、第一の送信端末が異なる会議グループに切り替えて音声通話を行うことができるため、上記第一の会議グループと第二の会議グループは、同一の会議グループ又は異なる会議グループであってもよい。異なる会議グループに切り替えて音声通話を行うことができず、且つ第一の送信端末が前記ターゲット会話メッセージを前記第一の会議グループの第二の受信端末にオーディオの方式で送信する場合、この時、第一の会議グループと第二の会議グループは、同一の会議グループである。

理解すべきことは、第一のオーディオデータを再生する時、デフォルトの人声を使用してもよく、送信ユーザの声を使用してもよい（例えば、声紋情報を一緒に送信してもよく、合成時に送信ユーザの声紋に従って合成してもよい）。一実施例では、各参加者の声紋情報を保存し、且つ会話メッセージを送信する時にユーザ識別子を追加してもよく、それにより、受信側は、ユーザ識別子に従って、音素合成時に使用された声紋情報を直接決定してもよい。このように、声紋情報の伝送を減少させることができる。具体的には、音声の認識中に声紋を認識することにより、ユーザ識別子を決定するように設定してもよい。

別の選択的な実施例では、前記方法は、第三の送信端末によって送信された第三の音素シーケンスを受信することであって、前記第三の送信端末が第三の会議グループにおけるユーザに対応する機器であり、前記第三の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、前記第三の会議グループに対応する第二の音素変換ルールに従って前記第三の音素シーケンスに対して音素復号化を行い、第四の音素シーケンスを得ることと、前記第四の音素シーケンスに対応するテキスト内容を表示し、又は前記第四の音素シーケンスによって合成された第二のオーディオデータを再生することとをさらに含む。

本発明の実施例では、第一の送信端末が聞き取りが不便である参加者である場合、前記第四の音素シーケンスに対応するテキスト内容を表示してもよい。第一の送信端末が聞き取りが便利である参加者である場合、前記第四の音素シーケンスによって合成された第二のオーディオデータを再生してもよい。具体的には、第四の音素シーケンスによって第二のオーディオデータを合成する方式は、関連技術を参照すればよく、ここではさらに限定しない。

説明すべきことは、一般的に、同一の時刻で、第一の送信端末が一つの会議グループのみでオーディオデータをオーディオの方式で送信又は受信でき、異なる時刻で、第一の送信端末が異なる会議グループに切り替えて音声通話を行うことができるため、上記第一の会議グループと第三の会議グループは、同一の会議グループ又は異なる会議グループであってもよい。異なる会議グループに切り替えて音声通話を行うことができず、且つ第一の送信端末が前記ターゲット会話メッセージを前記第一の会議グループの第二の受信端末にオーディオの方式で送信する場合、この時、第一の会議グループと第三の会議グループは、同一の会議グループである。

さらに、図２に示すように、第四の音素シーケンスに対応するテキスト内容を表示する時、この第四の音素シーケンスに対応する送信ユーザのユーザ情報をさらに表示してもよい。同時に、操作コントロール２０１をさらに表示してもよく、ユーザがこの操作コントロール２０１をクリックすると、この第四の音素シーケンスに対応するテキスト内容を音声の形式で再生してもよい。

選択的に、リモート会議の表示形式は、実際の必要に応じて設定されてもよく、例えば、一実施例では、以下は、折り畳み式スクリーンを備えた電子機器によるリモート会議の表示方式を詳細に説明する。選択的に、前述した、ユーザによって入力されたターゲット会話メッセージを受信することの前、前記方法は、前記第一の送信端末の第一の表示領域で第一のターゲット内容を表示し、第二の表示領域で第二のターゲット内容を表示することをさらに含み、そのうち、前記第一のターゲット内容は、電子プレゼンテーション文書、ビデオ情報及び会議チャットウィンドウのうちの少なくとも一つを含み、前記第二のターゲット内容は、電子プレゼンテーション文書、ビデオ情報及び会議チャットウィンドウのうちの少なくとも一つを含む。

本実施例では、同一の会議グループ内の会議チャットウィンドウの表示は、実際の必要に応じて設定されてもよく、例えば、会議グループ内の会議チャットウィンドウをソーシャルチャットグループの方式で表示してもよい。本実施例では、会議チャットウィンドウ内で表示された会話メッセージとは、具体的に、音素の方式で伝送された会話メッセージを指す。

上記電子プレゼンテーション文書は、ＰＰＴ（ＰｏｗｅｒＰｏｉｎｔ）とｗｏｒｄなどのプレゼンテーション可能なマルチメディア文書であってもよい。図２～図５に示すように、以下は、具体的な実例を結び付けてリモート会議の対話インターフェースを詳細に説明する。

説明すべきことは、各参加者が会話メッセージをオーディオ方式で伝送するのが便利であるかどうかについては、各参加者によって手動で選択されてもよく、参加者の電子機器によって自動的に検出されてもよく、ここではさらに限定しない。各参加者が会話メッセージをオーディオ方式で伝送するのが便利であるかどうかの状態を決定する時、この状態を各参加者に送信してもよく、各参加者は、それぞれが会話メッセージをオーディオ方式で伝送するのが便利であるかどうかの状態を指定された参加者（例えば、主会場の参加者）に送信した後、主参加者は、この状態を各参加者に送信してもよい。

図２に示すように、第一の表示領域で単一会場ビデオウィンドウを表示してもよく、第二の表示領域で単一会場会議チャットウィンドウを表示してもよい。単一会場ビデオウィンドウにビデオウィンドウの表示形式を設定してもよく、単一会場のＰＰＴのみを表示してもよく、単一会場の現場ビデオのみを表示してもよく、同時に単一会場のＰＰＴと現場ビデオを表示してもよい。単一会場ビデオウィンドウの上方と単一会場会議チャットウィンドウの上方にいずれも会議の参加者を表示しており、本実施例ではリストの形式で表示し、リストにおいて、各行は、一つのリモート会議のすべての参加者を表す。ユーザは、対応するリスト上で操作することにより、単一会場会議チャットウィンドウ又は単一会場会議チャットウィンドウで表示された内容を切り替えてもよい。同時に、ユーザは、単一会場会議チャットウィンドウの上方のリストに基づいて会話メッセージが一回送信される参加者を選択してもよい。選択的に、リストにおいて、各参加者が会話メッセージをオーディオ方式で伝送するのが便利であるかどうかの状態をマーキングして表示してもよい。本実施例では、単一会場ビデオウィンドウと単一会場会議チャットウィンドウは、同一のリモート会議に属してもよく、異なるリモート会議に属してもよく、ここではさらに限定しない。

図３に示すように、第一の表示領域で単一会場ビデオウィンドウを表示してもよく、第二の表示領域で単一会場ビデオウィンドウを表示してもよい。選択的に、単一会場ビデオウィンドウにビデオウィンドウの表示形式を設定してもよく、単一会場のＰＰＴのみを表示してもよく、単一会場の現場ビデオのみを表示してもよく、同時に単一会場のＰＰＴと現場ビデオを表示してもよい。そして、第一の表示領域で単一会場ビデオウィンドウを表示し第二の表示領域で単一会場ビデオウィンドウを表示する表示形式は、同じであってもよく、異なってもよい。

図４に示すように、第一の表示領域で単一会場会議チャットウィンドウを表示してもよく、第二の表示領域で単一会場会議チャットウィンドウを表示してもよい。

図５に示すように、第一の表示領域でダブル会場ビデオウィンドウを表示してもよく、第二の表示領域で単一会場会議チャットウィンドウを表示してもよい。選択的に、ダブル会場ビデオウィンドウにビデオウィンドウの表示形式を設定してもよく、ダブル会場のＰＰＴのみを表示してもよく、ダブル会場の現場ビデオのみを表示してもよく、同時にダブル会場のＰＰＴと現場ビデオを表示してもよい。

説明すべきことは、同一の会議グループでは、グループにおける各ユーザに対応する機器によって使用された音素変換ルールは同じであり、具体的には、各機器のあるグループにおける音素変換ルールの決定方式は、実際の必要に応じて設定されてもよい。

例えば、一選択的な実施例では、前述した、ユーザによって入力されたターゲット会話メッセージを受信することの前、前記方法は、前記第一の音素変換ルールを決定することと、前記第一の音素変換ルールを第一の機器に送信することであって、前記第一の機器が前記第一の会議グループにおける第一のターゲットユーザ以外のユーザに対応する機器であり、前記第一のターゲットユーザが前記第一の送信端末に対応するユーザであることとをさらに含む。

本発明の実施例では、上記第一の送信端末を第一の音素変換ルールの决定側又は送信側とし、第一の送信端末は、第一の会議グループにおける他のユーザに第一の音素変換ルールを送信してもよい。この第一の送信端末は、第一の会議グループに対応する主会場内のある参加者に対応する機器であってもよい。言い換えれば、本発明の実施例では、主会場内の参加者は、音素変換ルールを決定した後、残りの参加者に転送してもよい。具体的には、第一の送信側は、一組の音素変換ルールを第一の音素変換ルールとしてランダムに生成してもよい。無論、他の実施例では、主会場以外のある参加者は、第一の音素変換ルールを生成した後、各参加者に送信してもよい。主会場以外のある参加者は、第一の音素変換ルールを生成し、第一の音素変換ルールを主会場の参加者に送信した後、主会場の参加者は、残りの各参加者に送信してもよい。

理解すべきことは、本実施例では、第一の送信端末は、第一の音素変換ルールを送信する際に、第一の会議グループにおける一部又は全部のユーザに送信してもよく、例えば、上記第一の機器はさらに、第一の送信端末によって選択された機器、又は予め設定される条件を満たすユーザに対応する機器であってもよく、この予め設定される条件は、ユーザレベルが予め設定されるレベルよりも大きいユーザであることであってもよい。このように、第一の音素変換ルールの送信の指向性を高め、会議の安全性を向上させる。

別の選択的な実施例では、前述した、ユーザによって入力されたターゲット会話メッセージを受信することの前、前記方法は、第一の機器によって送信された音素変換ルールを受信することであって、前記第一の機器が前記第一の会議グループにおける第一のターゲットユーザ以外のユーザに対応する機器であり、前記第一のターゲットユーザが前記第一の送信端末に対応するユーザであることと、前記第一の機器によって送信された音素変換ルールを前記第一の音素変換ルールとして決定することとをさらに含む。

本発明の実施例では、上記実施例との相違点は、第一の送信端末を第一の音素変換ルールの受信側とすることであり、この第一の送信端末は、第一の会議グループに対応する主会場内のある参加者、又は主会場外の参加者であってもよく、ここではさらに限定しない。

さらに、第一の送信端末は、第一の音素変換ルールを送信するように第一の機器に要求してもよく、第一の送信端末は、第一の機器によって送信された第一の音素変換ルールを受動的に受信してもよい。選択的に、この第一の送信端末は、予め設定される条件を満たすユーザに対応する機器であってもよく、この予め設定される条件は、ユーザレベルが予め設定されるレベルよりも大きいユーザであることであってもよい。このように、第一の音素変換ルールの送信の指向性を高め、会議の安全性を向上させる。

説明すべきことは、本発明の実施例で紹介された様々な選択的な実施の形態は、相互に組み合わせて実現されてもよく、別々に実現されてもよく、本発明の実施例ではそれを限定しない。

さらに、電子機器が拡張現実（ＡｕｇｍｅｎｔｅｄＲｅａｌｉｔｙ、ＡＲ）メガネに接続されるように設定してもよく、ＡＲメガネを利用して現場のＰＰＴとリモート会議のＰＰＴを同時に見ることができるとともに、リモート会議で話している人のオーディオから変換されたテキストを見ることができる。

図６を参照すると、本発明の実施例は、別の対話方法を提供する。図６に示すように、この方法は、以下のステップを含む。

ステップ６０１では、第一の会議グループにおける機器である第一の送信端末によって送信された第二の音素シーケンスを受信する。

ステップ６０２では、前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得る。

ステップ６０３では、前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生する。

選択的に、前記方法は、第二の送信端末によって送信された第一のオーディオデータを受信することであって、前記第二の送信端末が第二の会議グループにおけるユーザに対応する機器であり、前記第二の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、前記第一のオーディオデータを再生することとをさらに含む。

選択的に、前記方法は、第三の送信端末によって送信された第三の音素シーケンスを受信することであって、前記第三の送信端末が第三の会議グループにおけるユーザに対応する機器であり、前記第三の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、前記第三の会議グループに対応する第二の音素変換ルールに従って前記第三の音素シーケンスに対して音素復号化を行い、第四の音素シーケンスを得ることと、前記第四の音素シーケンスに対応するテキスト内容を表示し、又は前記第四の音素シーケンスによって合成された第二のオーディオデータを再生することとをさらに含む。

選択的に、前述した、第一の送信端末によって送信された第二の音素シーケンスを受信することの前、前記方法は、前記第一の音素変換ルールを決定することと、前記第一の音素変換ルールを第二の機器に送信することであって、前記第二の機器が前記第一の会議グループにおける第二のターゲットユーザ以外のユーザに対応する機器であり、前記第二のターゲットユーザが前記第一の受信端末に対応するユーザであることとをさらに含む。

選択的に、前述した、第一の送信端末によって送信された第二の音素シーケンスを受信することの前、前記方法は、第二の機器によって送信された音素変換ルールを受信することであって、前記第二の機器が前記第一の会議グループにおける第二のターゲットユーザ以外のユーザに対応する機器であり、前記第二のターゲットユーザが前記第一の受信端末に対応するユーザであることと、前記第二の機器によって送信された音素変換ルールを前記第一の音素変換ルールとして決定することとをさらに含む。

説明すべきことは、本発明の実施例による対話方法は、リモート会議の第一の受信端末に用いられる。この第一の受信端末は、上記実施例による第一の送信端末に対応する受信端末であり、その具体的な実現は、上記実施例の第一の送信端末による第三の音素シーケンスの受信プロセスの記述を参照すればよく、ここではこれ以上しない。

本発明の実施例では、リモート会議の会話メッセージを音素シーケンスの形式で伝送することにより、音声伝送形式による制限を回避し、ユーザが複数のリモート会議に同時に参加することを可能にする。同時に、音素変換ルールを使用して、伝送された音素シーケンスを暗号化・符号化することにより、会話メッセージの伝送の安全性を向上させる。

図７を参照すると、図７は、本発明の実施例による電子機器の構造図である。この電子機器は、リモート会議の第一の送信端末に用いられる。図７に示すように、電子機器７００は、ユーザによって入力されたターゲット会話メッセージを受信するための第一の受信モジュール７０１と、前記ターゲット会話メッセージを第一の音素シーケンスに変換するための変換モジュール７０２と、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得るための符号化モジュール７０３と、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信するための第一の送信モジュール７０４とを含み、そのうち、前記ターゲット会話メッセージは、音声メッセージ又はテキストメッセージである。

選択的に、前記ターゲット会話メッセージが音声メッセージである場合、前記電子機器は、前記ターゲット会話メッセージをオーディオの方式で前記第一の会議グループの第二の受信端末に送信するための第二の送信モジュールをさらに含む。

選択的に、前記電子機器７００は、第二の送信端末によって送信された第一のオーディオデータを受信するための第二の受信モジュールであって、前記第二の送信端末が第二の会議グループにおけるユーザに対応する機器であり、前記第二の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループである第二の受信モジュールと、前記第一のオーディオデータを再生するための第一の再生モジュールとをさらに含む。

選択的に、前記電子機器７００は、第三の送信端末によって送信された第三の音素シーケンスを受信するための第三の受信モジュールであって、前記第三の送信端末が第三の会議グループにおけるユーザに対応する機器であり、前記第三の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループである第三の受信モジュールと、前記第三の会議グループに対応する第二の音素変換ルールに従って前記第三の音素シーケンスに対して音素復号化を行い、第四の音素シーケンスを得るための第一の復号化モジュールと、前記第四の音素シーケンスに対応するテキスト内容を表示し、又は前記第四の音素シーケンスによって合成された第二のオーディオデータを再生するための第一の制御モジュールとをさらに含む。

選択的に、前記電子機器７００は、前記第一の送信端末の第一の表示領域で第一のターゲット内容を表示し、第二の表示領域で第二のターゲット内容を表示するための表示モジュールをさらに含み、そのうち、前記第一のターゲット内容は、電子プレゼンテーション文書、ビデオ情報及び会議チャットウィンドウのうちの少なくとも一つを含み、前記第二のターゲット内容は、電子プレゼンテーション文書、ビデオ情報及び会議チャットウィンドウのうちの少なくとも一つを含む。

選択的に、前記電子機器７００は、前記第一の音素変換ルールを決定するための第一の決定モジュールと、前記第一の音素変換ルールを第一の機器に送信するための第三の送信モジュールであって、前記第一の機器が前記第一の会議グループにおける第一のターゲットユーザ以外のユーザに対応する機器であり、前記第一のターゲットユーザが前記第一の送信端末に対応するユーザである第三の送信モジュールとをさらに含む。

選択的に、前記電子機器７００は、第一の機器によって送信された音素変換ルールを受信するための第四の受信モジュールであって、前記第一の機器が前記第一の会議グループにおける第一のターゲットユーザ以外のユーザに対応する機器であり、前記第一のターゲットユーザが前記第一の送信端末に対応するユーザである第四の受信モジュールと、前記第一の機器によって送信された音素変換ルールを前記第一の音素変換ルールとして決定するための第四の送信モジュールとをさらに含む。

本発明の実施例による電子機器は、図１～図５の方法の実施例において電子機器によって実現された各プロセスを実現することができる。説明の繰り返しを回避するために、ここではこれ以上説明しない。

図８を参照すると、図８は、本発明の実施例による電子機器の構造図である。この電子機器は、リモート会議の第一の受信端末に用いられる。図８に示すように、電子機器８００は、第一の送信端末によって送信された第二の音素シーケンスを受信するための第五の受信モジュール８０１であって、前記第一の送信端末が第一の会議グループにおける機器である第五の受信モジュール８０１と、前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得るための第二の復号化モジュール８０２と、前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生するための第二の制御モジュール８０３とを含む。

選択的に、前記電子機器８００は、第二の送信端末によって送信された第一のオーディオデータを受信するための第六の受信モジュールであって、前記第二の送信端末が第二の会議グループにおけるユーザに対応する機器であり、前記第二の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループである第六の受信モジュールと、前記第一のオーディオデータを再生するための第二の再生モジュールとをさらに含む。

選択的に、前記電子機器８００は、第三の送信端末によって送信された第三の音素シーケンスを受信するための第七の受信モジュールであって、前記第三の送信端末が第三の会議グループにおけるユーザに対応する機器であり、前記第三の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループである第七の受信モジュールと、前記第三の会議グループに対応する第二の音素変換ルールに従って前記第三の音素シーケンスに対して音素復号化を行い、第四の音素シーケンスを得るための第三の復号化モジュールと、前記第四の音素シーケンスに対応するテキスト内容を表示し、又は前記第四の音素シーケンスによって合成された第二のオーディオデータを再生するための第三の制御モジュールとをさらに含む。

選択的に、前記電子機器８００は、前記第一の音素変換ルールを決定するための第二の決定モジュールと、前記第一の音素変換ルールを第二の機器に送信するための第五の送信モジュールであって、前記第二の機器が前記第一の会議グループにおける第二のターゲットユーザ以外のユーザに対応する機器であり、前記第二のターゲットユーザが前記第一の受信端末に対応するユーザである第五の送信モジュールとをさらに含む。

選択的に、前記電子機器８００は、第二の機器によって送信された音素変換ルールを受信するための第八の受信モジュールであって、前記第二の機器が前記第一の会議グループにおける第二のターゲットユーザ以外のユーザに対応する機器であり、前記第二のターゲットユーザが前記第一の受信端末に対応するユーザである第八の受信モジュールと、前記第二の機器によって送信された音素変換ルールを前記第一の音素変換ルールとして決定するための第三の決定モジュールとをさらに含む。

本発明の実施例による電子機器は、図６の方法の実施例において電子機器によって実現された各プロセスを実現することができる。説明の繰り返しを回避するために、ここではこれ以上説明しない。

図９は、本発明の各実施例を実現する電子機器のハードウェア構造概略図である。

この電子機器９００は、無線周波数ユニット９０１、ネットワークモジュール９０２、オーディオ出力ユニット９０３、入力ユニット９０４、センサ９０５、表示ユニット９０６、ユーザ入力ユニット９０７、インターフェースユニット９０８、メモリ９０９、プロセッサ９１０、及び電源９１１などの部材を含むが、それらに限らない。当業者であれば理解できるように、図９に示される電子機器の構造は、電子機器に対する限定を構成せず、電子機器は、図示される部材の数よりも多くまたは少ない部材、またはなんらかの部材の組み合わせ、または異なる部材の配置を含んでもよい。本発明の実施例では、電子機器は、携帯電話、タブレットパソコン、ノートパソコン、パームトップコンピュータ、車載端末、ウェアラブルデバイス、及び歩数計などを含むが、それらに限らない。

そのうち、無線周波数ユニット９０１は、ユーザによって入力されたターゲット会話メッセージを受信するために用いられる。

プロセッサ９１０は、前記ターゲット会話メッセージを第一の音素シーケンスに変換し、第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得るために用いられる。

無線周波数ユニット９０１はさらに、前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信するために用いられる。

又は、無線周波数ユニット９０１は、第一の会議グループにおける機器である第一の送信端末によって送信された第二の音素シーケンスを受信するために用いられる。

プロセッサ９１０は、前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得て、前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生するために用いられる。

説明すべきことは、本発明の実施例による電子機器は、図１と図６の方法の実施例において電子機器によって実現された各プロセスを実現することができる。説明の繰り返しを回避するために、ここではこれ以上説明しない。本発明の実施例では、リモート会議の会話メッセージを音素シーケンスの形式で伝送することにより、音声伝送形式による制限を回避し、ユーザが複数のリモート会議に同時に参加することを可能にする。同時に、音素変換ルールを使用して、伝送された音素シーケンスを暗号化・符号化することにより、会話メッセージの伝送の安全性を向上させる。

理解すべきことは、本発明の実施例では、無線周波数ユニット９０１は、情報の送受信または通話中の信号の送受信に用いられてもよい。具体的には、基地局からの下りリンクデータを受信してから、プロセッサ９１０に処理させてもよい。また、上りリンクデータを基地局に送信してもよい。一般的には、無線周波数ユニット９０１は、アンテナ、少なくとも一つの増幅器、送受信機、カプラ、低雑音増幅器、デュプレクサなどを含むが、それらに限らない。なお、無線周波数ユニット９０１は、無線通信システムやネットワークを介して他の機器との通信を行ってもよい。

電子機器は、ネットワークモジュール９０２によってユーザに無線のブロードバンドインターネットアクセスを提供し、例えば、ユーザへ電子メールの送受信、ウェブページの閲覧、ストリーミングメディアへのアクセスなどを支援する。

オーディオ出力ユニット９０３は、無線周波数ユニット９０１またはネットワークモジュール９０２によって受信されたまたはメモリ９０９に記憶されたオーディオデータをオーディオ信号に変換して、音声として出力することができる。そして、オーディオ出力ユニット９０３はさらに、電子機器９００によって実行された特定の機能に関連するオーディオ出力（例えば、呼び信号受信音、メッセージ着信音など）を提供することができる。オーディオ出力ユニット９０３は、スピーカ、ブザー及び受話器などを含む。

入力ユニット９０４は、オーディオまたはビデオ信号を受信するために用いられる。入力ユニット９０４は、グラフィックスプロセッサ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、ＧＰＵ）９０４１とマイクロホン９０４２を含んでもよい。グラフィックスプロセッサ９０４１は、ビデオキャプチャモードまたは画像キャプチャモードにおいて画像キャプチャ装置（例えば、カメラ）によって得られた静止画像またはビデオの画像データを処理する。処理された画像フレームは、表示ユニット９０６に表示されてもよい。グラフィックスプロセッサ９０４１によって処理された画像フレームは、メモリ９０９（または他の記憶媒体）に記憶されてもよく、または無線周波数ユニット９０１またはネットワークモジュール９０２を介して送信されてもよい。マイクロホン９０４２は、音声を受信することができるとともに、このような音声をオーディオデータとして処理することができる。処理されたオーディオデータは、電話の通話モードにおいて、無線周波数ユニット９０１を介して移動通信基地局に送信することが可能なフォーマットに変換して出力されてもよい。

電子機器９００は、少なくとも一つのセンサ９０５、例えば、光センサ、モーションセンサ及び他のセンサをさらに含む。具体的には、光センサは、環境光センサ及び接近センサを含み、そのうち、環境光センサは、環境光の明暗に応じて、表示パネル９０６１の輝度を調整することができ、接近センサは、電子機器９００が耳元に移動した時、表示パネル９０６１及び／又はバックライトをオフにすることができる。モーションセンサの一種として、加速度計センサは、各方向（一般的には、三軸）での加速度の大きさを検出することができ、静止時、重力の大きさ及び方向を検出することができ、電子機器姿勢（例えば、縦横スクリーン切り替え、関連ゲーム、磁力計姿勢校正）の識別、振動識別関連機能（例えば、歩数計、タップ）などに用いることができる。センサ９０５は、指紋センサ、圧力センサ、虹彩センサ、分子センサ、ジャイロ、気圧計、湿度計、温度計、赤外線センサなどをさらに含んでもよい。ここではこれ以上説明しない。

表示ユニット９０６は、ユーザによって入力された情報またはユーザに提供される情報を表示するために用いられる。表示ユニット９０６は、表示パネル９０６１を含んでもよい。液晶ディスプレイ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ、ＬＣＤ）、有機発光ダイオード（ＯｒｇａｎｉｃＬｉｇｈｔ－ＥｍｉｔｔｉｎｇＤｉｏｄｅ、ＯＬＥＤ）などの形式で表示パネル９０６１を配置してもよい。

ユーザ入力ユニット９０７は、入力された数字または文字情報の受信、電子機器のユーザによる設置及び機能制御に関するキー信号入力の発生に用いられてもよい。具体的には、ユーザ入力ユニット９０７は、タッチパネル９０７１および他の入力機器９０７２を含む。タッチパネル９０７１は、タッチスクリーンとも呼ばれ、その上または付近でのユーザによるタッチ操作（例えば、ユーザが指、タッチペンなどの任意の適切な物体または付属品を使用してタッチパネル９０７１上またはタッチパネル９０７１付近で行う操作）を収集することができる。タッチパネル９０７１は、タッチ検出装置とタッチコントローラの二つの部分を含んでもよい。そのうち、タッチ検出装置は、ユーザによるタッチ方位を検出し、タッチ操作による信号を検出し、信号をタッチコントローラに伝送する。タッチコントローラは、タッチ検出装置からタッチ情報を受信し、それをタッチポイント座標に変換してから、プロセッサ９１０に送信し、プロセッサ９１０から送信されてきた指令を受信して実行する。なお、抵抗式、静電容量式、赤外線及び表面音波などの様々なタイプを用いてタッチパネル９０７１を実現してもよい。タッチパネル９０７１以外、ユーザ入力ユニット９０７は、他の入力機器９０７２を含んでもよい。具体的には、他の入力機器９０７２は、物理的なキーボード、機能キー（例えば、ボリューム制御ボタン、スイッチボタンなど）、トラックボール、マウス、操作レバーを含んでもよいが、それらに限らない。ここではこれ以上説明しない。

さらに、タッチパネル９０７１は、表示パネル９０６１上に覆われてもよい。タッチパネル９０７１は、その上または付近でのタッチ操作を検出すると、プロセッサ９１０に伝送して、タッチイベントのタイプを特定し、その後、プロセッサ９１０は、タッチイベントのタイプに応じて表示パネル９０６１上で相応な視覚出力を提供する。図９では、タッチパネル９０７１と表示パネル９０６１は、二つの独立した部材として電子機器の入力と出力機能を実現するものであるが、なんらかの実施例では、タッチパネル９０７１と表示パネル９０６１を集積して電子機器の入力と出力機能を実現してもよい。具体的には、ここでは限定しない。

インターフェースユニット９０８は、外部装置と電子機器９００との接続のためのインターフェースである。例えば、外部装置は、有線または無線ヘッドフォンポート、外部電源（または電池充電器）ポート、有線または無線データポート、メモリカードポート、識別モジュールを有する装置への接続用のポート、オーディオ入力／出力（Ｉ／Ｏ）ポート、ビデオＩ／Ｏポート、イヤホンポートなどを含んでもよい。インターフェースユニット９０８は、外部装置からの入力（例えば、データ情報、電力など）を受信するとともに、受信した入力を電子機器９００内の一つまたは複数の素子に伝送するために用いられてもよく、または電子機器９００と外部装置との間でデータを伝送するために用いられてもよい。

メモリ９０９は、ソフトウェアプログラム及び各種のデータを記憶するために用いられてもよい。メモリ９０９は、主に記憶プログラム領域および記憶データ領域を含んでもよい。そのうち、記憶プログラム領域は、オペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラム（例えば、音声再生機能、画像再生機能など）などを記憶することができ、記憶データ領域は、携帯電話の使用によって作成されるデータ（例えば、オーディオデータ、電話帳など）などを記憶することができる。なお、メモリ９０９は、高速ランダムアクセスメモリを含んでもよく、非揮発性メモリ、例えば、少なくとも一つの磁気ディスクメモリデバイス、フラッシュメモリデバイス、または他の揮発性ソリッドステートメモリデバイスをさらに含んでもよい。

プロセッサ９１０は、電子機器の制御センターであり、各種のインターフェースと線路によって電子機器全体の各部分に接続され、メモリ９０９内に記憶されたソフトウェアプログラム及び／又はモジュールを運行又は実行すること、及びメモリ９０９内に記憶されたデータを呼び出し、電子機器の各種の機能を実行し、データを処理することにより、電子機器全体をモニタリングする。プロセッサ９１０は、一つまたは複数の処理ユニットを含んでもよい。好ましくは、プロセッサ９１０は、アプリケーションプロセッサとモデムプロセッサを集積してもよい。そのうち、アプリケーションプロセッサは、主にオペレーティングシステム、ユーザインターフェースおよびアプリケーションプログラムなどを処理するためのものであり、モデムプロセッサは、主に無線通信を処理するためのものである。理解できるように、上記モデムプロセッサは、プロセッサ９１０に集積されなくてもよい。

電子機器９００はさらに、各部材に電力を供給する電源９１１（例えば、電池）を含んでもよい。選択的に、電源９１１は、電源管理システムによってプロセッサ９１０にロジック的に接続されてもよい。それにより、電源管理システムによって充放電管理及び消費電力管理などの機能を実現することができる。

また、電子機器９００は、いくつかの示されていない機能モジュールを含む。ここではこれ以上説明しない。

選択的に、本発明の実施例は、電子機器をさらに提供する。プロセッサ９１０と、メモリ９０９と、メモリ９０９に記憶され、且つ前記プロセッサ９１０上で運行できるコンピュータプログラムとを含み、このコンピュータプログラムがプロセッサ９１０によって実行される時、上記対話方法の実施例の各プロセスを実現させ、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここではこれ以上説明しない。

本発明の実施例は、コンピュータ可読記憶媒体をさらに提供する。コンピュータ可読記憶媒体にはコンピュータプログラムが記憶されており、このコンピュータプログラムがプロセッサによって実行される時、対話方法の実施例の各プロセスを実現させ、且つ同じ技術的効果を達成することができる。説明の繰り返しを回避するために、ここではこれ以上説明しない。そのうち、前記コンピュータ可読記憶媒体は、例えば、読み取り専用メモリ（Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ、ＲＯＭ）、ランダムアクセスメモリ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ、ＲＡＭ）、磁気ディスクまたは光ディスクなどである。

当業者であれば意識できるように、本明細書に開示された実施例を結び付けて記述された様々な例のユニット及びアルゴリズムステップは、電子ハードウェアまたはコンピュータソフトウェアと電子ハードウェアとの組み合わせで実現されてもよい。これらの機能が、ハードウェア方式で実行されるか、ソフトウェア方式で実行されるかは、技術案の特定の応用及び設計拘束条件によるものである。当業者は、各特定の応用に対して異なる方法を使用して、記述された機能を実現することができるが、このような実現は、本発明の範囲を超えていると考えるべきではない。

当業者が明確に理解できるように、記述の利便性および簡潔性のために、以上に記述されたシステム、装置、およびユニットの具体的な作動プロセスは、前記方法の実施例における対応するプロセスを参照すればよい。ここではこれ以上説明しない。

本出願によって提供される実施例では、理解すべきことは、掲示された装置および方法は、他の方式によって実現されてもよい。例えば、以上に記述された装置の実施例は、単なる例示的なものであり、例えば、前記ユニットの区分は、単なる論理的機能区分であり、実際に実現する時、他の区分方式があってもよい。例えば、複数のユニットまたはコンポーネントは、別のシステムに結合されてもよく、または集積されてもよく、またはいくつかの特徴が無視されてもよく、または実行されなくてもよい。また、表示又は討論された同士間の結合又は直接結合又は通信接続は、いくつかのインターフェース、装置又はユニットによる間接の結合又は通信接続であってもよく、電気的、機械的、又は他の形式であってもよい。

前記分離された部品として説明されるユニットは、物理的に分離されてもよく、または物理的に分離されなくてもよく、ユニットとして表示される部品は、物理的なユニットであってもよく、または、物理的なユニットでなくてもよく、すなわち、一つの場所に位置してもよく、または複数のネットワークユニットに分布されてもよい。実際の必要に応じて、そのうちの一部又は全部のユニットを選択して、本発明の実施例の方案の目的を実現することができる。

また、本発明の各実施例における各機能ユニットは、一つの処理ユニットに集積されてもよく、各ユニットが物理的に単独に存在してもよく、二つ以上のユニットが一つのユニットに集積されてもよい。

前記機能は、ソフトウェア機能ユニットの形式で実現され、且つ独立した製品として販売又は使用される場合、一つのコンピュータ可読記憶媒体に記憶されてもよい。このような理解を踏まえて、本発明の技術案は、実質には、又は従来技術に寄与した部分又はこの技術案に関する部分がソフトウェア製品の形式によって表われてもよい。このコンピュータソフトウェア製品は、一つの記憶媒体に記憶され、一台のコンピュータ機器（パソコン、サーバ、又はネットワーク機器などであってもよい）に本発明の各実施例に記載の方法の全部又は一部のステップを実行させるための若干の指令を含む。前記記憶媒体は、Ｕディスク、リムーバブルハードディスク、ＲＯＭ、ＲＡＭ、磁気ディスク又は光ディスク等の様々なプログラムコードを記憶可能な媒体を含む。

以上に記載の内容は、本発明の具体的な実施の形態に過ぎず、本発明の保護範囲は、それに限らない。いかなる当業者が、本発明に掲示される技術的範囲内に、容易に想到できる変形又は置き換えは、いずれも、本発明の保護範囲内に含まれるべきである。そのため、本発明の保護範囲は、特許請求の範囲の保護範囲を基準とすべきである。

Claims

リモート会議の第一の送信端末に用いられる対話方法であって、
ユーザによって入力されたターゲット会話メッセージを受信することと、
前記ターゲット会話メッセージを第一の音素シーケンスに変換することと、
第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得ることと、
前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信することとを含み、
そのうち、前記ターゲット会話メッセージは、音声メッセージ又はテキストメッセージである、ことを特徴とする対話方法。
前記ターゲット会話メッセージが音声メッセージである場合、前述した、ユーザによって入力されたターゲット会話メッセージを受信することの後、前記方法は、
前記ターゲット会話メッセージをオーディオの方式で前記第一の会議グループの第二の受信端末に送信することをさらに含む、ことを特徴とする請求項１に記載の方法。
前記方法は、
第二の送信端末によって送信された第一のオーディオデータを受信することであって、前記第二の送信端末が第二の会議グループにおけるユーザに対応する機器であり、前記第二の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、
前記第一のオーディオデータを再生することとをさらに含む、ことを特徴とする請求項１に記載の方法。
前記方法は、
第三の送信端末によって送信された第三の音素シーケンスを受信することであって、前記第三の送信端末が第三の会議グループにおけるユーザに対応する機器であり、前記第三の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、
前記第三の会議グループに対応する第二の音素変換ルールに従って前記第三の音素シーケンスに対して音素復号化を行い、第四の音素シーケンスを得ることと、
前記第四の音素シーケンスに対応するテキスト内容を表示し、又は前記第四の音素シーケンスによって合成された第二のオーディオデータを再生することとをさらに含む、ことを特徴とする請求項１～３のいずれか１項に記載の方法。
前述した、ユーザによって入力されたターゲット会話メッセージを受信することの前に、前記方法は、
前記第一の送信端末の第一の表示領域で第一のターゲット内容を表示し、第二の表示領域で第二のターゲット内容を表示することをさらに含み、
そのうち、前記第一のターゲット内容は、電子プレゼンテーション文書、ビデオ情報及び会議チャットウィンドウのうちの少なくとも一つを含み、前記第二のターゲット内容は、電子プレゼンテーション文書、ビデオ情報及び会議チャットウィンドウのうちの少なくとも一つを含む、ことを特徴とする請求項１に記載の方法。
前述した、ユーザによって入力されたターゲット会話メッセージを受信することの前に、前記方法は、
前記第一の音素変換ルールを決定することと、
前記第一の音素変換ルールを第一の機器に送信することであって、前記第一の機器が前記第一の会議グループにおける第一のターゲットユーザ以外のユーザに対応する機器であり、前記第一のターゲットユーザが前記第一の送信端末に対応するユーザであることとをさらに含む、ことを特徴とする請求項１に記載の方法。
前述した、ユーザによって入力されたターゲット会話メッセージを受信することの前、前記方法は、
第一の機器によって送信された音素変換ルールを受信することであって、前記第一の機器が前記第一の会議グループにおける第一のターゲットユーザ以外のユーザに対応する機器であり、前記第一のターゲットユーザが前記第一の送信端末に対応するユーザであることと、
前記第一の機器によって送信された音素変換ルールを前記第一の音素変換ルールとして決定することとをさらに含む、ことを特徴とする請求項１に記載の方法。
リモート会議の第一の受信端末に用いられる対話方法であって、
第一の会議グループにおける機器である第一の送信端末によって送信された第二の音素シーケンスを受信することと、
前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得ることと、
前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生することとを含む、ことを特徴とする対話方法。
前記方法は、
第二の送信端末によって送信された第一のオーディオデータを受信することであって、前記第二の送信端末が第二の会議グループにおけるユーザに対応する機器であり、前記第二の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、
前記第一のオーディオデータを再生することとをさらに含む、ことを特徴とする請求項８に記載の方法。
前記方法は、
第三の送信端末によって送信された第三の音素シーケンスを受信することであって、前記第三の送信端末が第三の会議グループにおけるユーザに対応する機器であり、前記第三の会議グループと前記第一の会議グループとが同一の会議グループ又は異なる会議グループであることと、
前記第三の会議グループに対応する第二の音素変換ルールに従って前記第三の音素シーケンスに対して音素復号化を行い、第四の音素シーケンスを得ることと、
前記第四の音素シーケンスに対応するテキスト内容を表示し、又は前記第四の音素シーケンスによって合成された第二のオーディオデータを再生することとをさらに含む、ことを特徴とする請求項８又は９に記載の方法。
前述した、第一の送信端末によって送信された第二の音素シーケンスを受信することの前、前記方法は、
前記第一の音素変換ルールを決定することと、
前記第一の音素変換ルールを第二の機器に送信することであって、前記第二の機器が前記第一の会議グループにおける第二のターゲットユーザ以外のユーザに対応する機器であり、前記第二のターゲットユーザが前記第一の受信端末に対応するユーザであることとをさらに含む、ことを特徴とする請求項８に記載の方法。
前述した、第一の送信端末によって送信された第二の音素シーケンスを受信することの前、前記方法は、
第二の機器によって送信された音素変換ルールを受信することであって、前記第二の機器が前記第一の会議グループにおける第二のターゲットユーザ以外のユーザに対応する機器であり、前記第二のターゲットユーザが前記第一の受信端末に対応するユーザであることと、
前記第二の機器によって送信された音素変換ルールを前記第一の音素変換ルールとして決定することとをさらに含む、ことを特徴とする請求項８に記載の方法。
リモート会議の第一の送信端末に用いられる電子機器であって、
ユーザによって入力されたターゲット会話メッセージを受信するための第一の受信モジュールと、
前記ターゲット会話メッセージを第一の音素シーケンスに変換するための変換モジュールと、
第一の会議グループに対応する第一の音素変換ルールに従って前記第一の音素シーケンスに対して音素符号化を行い、第二の音素シーケンスを得るための符号化モジュールと、
前記第二の音素シーケンスを前記第一の会議グループの第一の受信端末に送信するための第一の送信モジュールとを含み、
そのうち、前記ターゲット会話メッセージは、音声メッセージ又はテキストメッセージである、ことを特徴とする電子機器。
リモート会議の第一の受信端末に用いられる電子機器であって、
第一の会議グループにおける機器である第一の送信端末によって送信された第二の音素シーケンスを受信するための第五の受信モジュールと、
前記第一の会議グループに対応する第一の音素変換ルールに従って前記第二の音素シーケンスを復号化し、第一の音素シーケンスを得るための第二の復号化モジュールと、
前記第一の音素シーケンスに対応するテキスト内容を表示し、又は前記第一の音素シーケンスによって合成された第二のオーディオデータを再生するための第二の制御モジュールとを含む、ことを特徴とする電子機器。
プロセッサと、メモリと、前記メモリに記憶され、且つ前記プロセッサ上で運行できるコンピュータプログラムとを含み、前記コンピュータプログラムが前記プロセッサによって実行される時、請求項１～１２のいずれか１項に記載の対話方法のステップを実現させる、ことを特徴とする電子機器。
コンピュータプログラムが記憶されているコンピュータ可読記憶媒体であって、前記コンピュータプログラムがプロセッサによって実行される時、請求項１～１２のいずれか１項に記載の対話方法のステップを実現させる、ことを特徴とするコンピュータ可読記憶媒体。