JP6573676B2 - 多者通話において音声をテキストに変換するための方法および装置 - Google Patents
多者通話において音声をテキストに変換するための方法および装置 Download PDFInfo
- Publication number
- JP6573676B2 JP6573676B2 JP2017540583A JP2017540583A JP6573676B2 JP 6573676 B2 JP6573676 B2 JP 6573676B2 JP 2017540583 A JP2017540583 A JP 2017540583A JP 2017540583 A JP2017540583 A JP 2017540583A JP 6573676 B2 JP6573676 B2 JP 6573676B2
- Authority
- JP
- Japan
- Prior art keywords
- terminal
- identifier
- session
- text
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 66
- 238000006243 chemical reaction Methods 0.000 claims description 192
- 238000005070 sampling Methods 0.000 claims description 43
- 230000005540 biological transmission Effects 0.000 claims description 13
- 238000012217 deletion Methods 0.000 claims description 5
- 230000037430 deletion Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000011664 signaling Effects 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
- H04L67/146—Markers for unambiguous identification of a particular session, e.g. session cookie or URL-encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/64—Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/60—Medium conversion
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
Description
少なくとも2つの端末によって送信された音声−テキスト変換要求を受信するステップであって、音声−テキスト変換要求が、第1の識別子および第2の識別子を含む、ステップと、
少なくとも2つの端末によって送信された音声−テキスト変換要求において、同じ第1の識別子または同じ第2の識別子を有する端末が同じセッションを有するように、少なくとも2つの端末にセッションを割り当てるステップと、
1回の多者通話において少なくとも1つの端末によって送信される、サンプリングレートが8KHzよりも大きい音声ストリームを、パケット交換ドメインを用いて受信するステップであって、多者通話が、1回のセッションに対応する、ステップと、
音声ストリームをテキストに変換するステップと、
多者通話において端末にテキストを送信するステップと
を含む。
データベースが、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子を含む場合、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子に対応する、データベース内のセッションを第1の端末に割り当てるステップであって、第1の端末が、少なくとも2つの端末のうちのいずれかの端末であり、データベースが、少なくとも1つのセッションおよび該少なくとも1つのセッションに対応する端末識別子を含む、ステップと、
データベースが、第2の端末によって送信された音声−テキスト変換要求の第1の識別子および第2の識別子を含まず、第2の端末によって送信された音声−テキスト変換要求の第1の識別子が、第3の端末によって送信された音声−テキスト変換要求の第1の識別子と同じであり、かつ第2の端末によって送信された音声−テキスト変換要求の第2の識別子が、第3の端末によって送信された音声−テキスト変換要求の第2の識別子と同じである場合、第2の端末および第3の端末に同じ新しいセッションを割り当てるステップと
を含む。
割り当てられたセッションが新しいセッションである場合、割り当てられたセッションと少なくとも2つの端末の識別子との対応関係を確立し、対応関係をデータベースに追加するステップ、または
割り当てられたセッションがデータベース内のセッションである場合、追加された識別子が割り当てられたセッションに対応するように、少なくとも2つの端末の識別子のうちにあり、かつデータベースに含まれない端末の識別子をデータベースに追加するステップ
をさらに含む。
第5の端末によって送信された終了メッセージを受信するステップと、
データベースから第5の端末の識別子を削除するステップと、
セッションに対応する端末の識別子がデータベースにおいて空である場合、データベースからセッションを削除するステップと
をさらに含む。
少なくとも2つの端末によって送信された音声−テキスト変換要求を受信するように構成された第1の受信ユニットであって、音声−テキスト変換要求が、第1の識別子および第2の識別子を含む、第1の受信ユニットと、
少なくとも2つの端末によって送信された音声−テキスト変換要求において、同じ第1の識別子または同じ第2の識別子を有する端末が同じセッションを有するように、少なくとも2つの端末にセッションを割り当てるように構成された割当ユニットと、
1回の多者通話において少なくとも1つの端末によって送信される、サンプリングレートが8KHzよりも大きい音声ストリームを、パケット交換ドメインを用いて受信するように構成された第2の受信ユニットであって、多者通話が、1回のセッションに対応する、第2の受信ユニットと、
音声ストリームをテキストに変換するように構成された変換ユニットと、
多者通話において端末にテキストを送信するように構成された送信ユニットと
を含む。
データベースが、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子を含む場合、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子に対応する、データベース内のセッションを第1の端末に割り当てることであって、第1の端末が、少なくとも2つの端末のうちのいずれかの端末であり、データベースが、少なくとも1つのセッションおよび該少なくとも1つのセッションに対応する端末識別子を含む、ことと、
データベースが、第2の端末によって送信された音声−テキスト変換要求の第1の識別子および第2の識別子を含まず、第2の端末によって送信された音声−テキスト変換要求の第1の識別子が、第3の端末によって送信された音声−テキスト変換要求の第1の識別子と同じであり、かつ第2の端末によって送信された音声−テキスト変換要求の第2の識別子が、第3の端末によって送信された音声−テキスト変換要求の第2の識別子と同じである場合、第2の端末および第3の端末に同じ新しいセッションを割り当てることと
を行うように構成される。
割り当てられたセッションが新しいセッションである場合、割り当てられたセッションと少なくとも2つの端末の識別子との対応関係を確立し、対応関係をデータベースに追加するように構成された追加ユニットであって、
割り当てられたセッションがデータベース内のセッションである場合、追加された識別子が割り当てられたセッションに対応するように、少なくとも2つの端末の識別子のうちにあり、かつデータベースに含まれない端末の識別子をデータベースに追加するようにさらに構成された追加ユニット
をさらに含む。
第5の端末によって送信された終了メッセージを受信するように構成された第3の受信ユニットと、
データベースから第5の端末の識別子を削除するように構成された削除ユニットであって、
セッションに対応する端末の識別子がデータベースにおいて空である場合、データベースからセッションを削除するようにさらに構成された削除ユニットと
をさらに含む。
少なくとも2つの端末によって送信された音声−テキスト変換要求を受信するように構成された第1の受信器であって、音声−テキスト変換要求が、第1の識別子および第2の識別子を含む、第1の受信器と、
少なくとも2つの端末によって送信された音声−テキスト変換要求において、同じ第1の識別子または同じ第2の識別子を有する端末が同じセッションを有するように、少なくとも2つの端末にセッションを割り当てるように構成されたプロセッサと、
1回の多者通話において少なくとも1つの端末によって送信される、サンプリングレートが8KHzよりも大きい音声ストリームを、パケット交換ドメインを用いて受信するように構成された第2の受信器であって、多者通話が、1回のセッションに対応する、第2の受信器とを含み、
プロセッサが、音声ストリームをテキストに変換するようにさらに構成され、
多者通話において端末にテキストを送信するように構成された送信器
をさらに含む。
データベースが、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子を含む場合、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子に対応する、データベース内のセッションを第1の端末に割り当てることであって、第1の端末が、少なくとも2つの端末のうちのいずれかの端末であり、データベースが、少なくとも1つのセッションおよび該少なくとも1つのセッションに対応する端末識別子を含む、ことと、
データベースが、第2の端末によって送信された音声−テキスト変換要求の第1の識別子および第2の識別子を含まず、第2の端末によって送信された音声−テキスト変換要求の第1の識別子が、第3の端末によって送信された音声−テキスト変換要求の第1の識別子と同じであり、かつ第2の端末によって送信された音声−テキスト変換要求の第2の識別子が、第3の端末によって送信された音声−テキスト変換要求の第2の識別子と同じである場合、第2の端末および第3の端末に同じ新しいセッションを割り当てることと
を行うようにさらに構成される。
プロセッサは、割り当てられたセッションが新しいセッションである場合、割り当てられたセッションと少なくとも2つの端末の識別子との対応関係を確立し、対応関係をデータベースに追加するようにさらに構成され、
プロセッサは、割り当てられたセッションがデータベース内のセッションである場合、追加された識別子が割り当てられたセッションに対応するように、少なくとも2つの端末の識別子のうちにあり、かつデータベースに含まれない端末の識別子をデータベースに追加するようにさらに構成される。
第5の端末によって送信された終了メッセージを受信するように構成された第3の受信器をさらに含み、
プロセッサは、データベースから第5の端末の識別子を削除するようにさらに構成され、
プロセッサは、セッションに対応する端末の識別子がデータベースにおいて空である場合、データベースからセッションを削除するようにさらに構成される。
本発明の実施形態1は、多者通話において音声をテキストに変換するための方法を提供する。図2に示すように、本方法は、以下のステップを含んでもよい。
「議論にはどこが比較的適していると思いますか。
第1会議室が比較的適していると思います。
本社が比較的適していると思います。」
本発明の実施形態2は、多者通話において音声をテキストに変換するための方法を提供する。図3に示すように、本方法は、以下のステップを含んでもよい。
第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子に対応する、データベース内のセッションが、第1の端末に割り当てられる。
「Xiao Ming(111):どこで契約書に署名しましょうか。
Xiao Hong(222):あなたの会社で契約書に署名しましょう。」
第1の端末に対応するセッションに対応する、データベース内のすべての端末に、第1の端末が参加したプロセスの、各端末の通話のテキストを送信することをさらに含んでもよい。
本発明の実施形態3は、多者通話において音声をテキストに変換するための方法を提供する。
Zhang San(123):どこで会議を行いましょうか。
Li Si(456):本社の第1会議室で行いましょう。
Zhang San(123):どこで会議を行いましょうか。
Li Si(456):本社の第1会議室で行いましょう。
Zhang San(123):どこで会議を行いましょうか。
Li Si(456):本社の第1会議室で行いましょう。
本発明の実施形態4は、多者通話において音声をテキストに変換するための装置50を提供する。装置50は、前述の実施形態ではサーバの一部または全部である。図5に示すように、多者通話において音声をテキストに変換するための装置50は、
少なくとも2つの端末によって送信された音声−テキスト変換要求を受信するように構成された第1の受信ユニット501であって、音声−テキスト変換要求が、第1の識別子および第2の識別子を含む、第1の受信ユニット501と、
少なくとも2つの端末によって送信された音声−テキスト変換要求において、同じ第1の識別子または同じ第2の識別子を有する端末が同じセッションを有するように、少なくとも2つの端末にセッションを割り当てるように構成された割当ユニット502と、
1回の多者通話において少なくとも1つの端末によって送信される、サンプリングレートが8KHzよりも大きい音声ストリームを、パケット交換ドメインを用いて受信するように構成された第2の受信ユニット503であって、多者通話が、1回のセッションに対応する、第2の受信ユニット503と、
音声ストリームをテキストに変換するように構成された変換ユニット504と、
多者通話において端末にテキストを送信するように構成された送信ユニット505と
を含んでもよい。
第1の端末が、少なくとも2つの端末のうちのいずれかの端末であり、データベースが、少なくとも1つのセッションおよび少なくとも1つのセッションに対応する端末識別子を含むとき、データベースが、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子を含む場合、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子に対応する、データベース内のセッションを第1の端末に割り当て、
データベースが、第2の端末によって送信された音声−テキスト変換要求の第1の識別子および第2の識別子を含まず、第2の端末によって送信された音声−テキスト変換要求の第1の識別子が、第3の端末によって送信された音声−テキスト変換要求の第1の識別子と同じであり、第2の端末によって送信された音声−テキスト変換要求の第2の識別子が、第3の端末によって送信された音声−テキスト変換要求の第2の識別子と同じである場合、第2の端末および第3の端末に同じ新しいセッションを割り当てる
ように特に構成されてもよい。
割り当てられたセッションが新しいセッションである場合、割り当てられたセッションと少なくとも2つの端末の識別子との対応関係を確立し、この対応関係をデータベースに追加するように構成された追加ユニット506であって、
割り当てられたセッションがデータベース内のセッションである場合、追加された識別子が割り当てられたセッションに対応するように、少なくとも2つの端末の識別子のうちにあり、かつデータベースに含まれない端末識別子をデータベースに追加するようにさらに構成されてもよい追加ユニット506
をさらに含んでもよい。
第5の端末によって送信された終了メッセージを受信するように構成された第3の受信ユニット507と、
データベースから第5の端末の識別子を削除するように構成された削除ユニット508であって、
セッションに対応する端末の識別子がデータベースにおいて空である場合、データベースからセッションを削除するようにさらに構成されてもよい削除ユニット508と
をさらに含んでもよい。
本発明の実施形態5は、多者通話において音声をテキストに変換するための装置50を提供する。装置50は、前述の実施形態ではサーバの一部または全部である。図7に示すように、多者通話において音声をテキストに変換するための装置50は、
少なくとも1つのプロセッサ701と、装置間の接続および相互通信を実施するように構成された少なくとも1つの通信バス702と、第1の受信器703と、第2の受信器704と、送信器705とを含んでもよい。
第1の端末が、少なくとも2つの端末のうちのいずれかの端末であり、データベースが、少なくとも1つのセッションおよび少なくとも1つのセッションに対応する端末識別子を含むとき、データベースが、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子を含む場合、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子に対応する、データベース内のセッションを第1の端末に割り当て、
データベースが、第2の端末によって送信された音声−テキスト変換要求の第1の識別子および第2の識別子を含まず、第2の端末によって送信された音声−テキスト変換要求の第1の識別子が、第3の端末によって送信された音声−テキスト変換要求の第1の識別子と同じであり、第2の端末によって送信された音声−テキスト変換要求の第2の識別子が、第3の端末によって送信された音声−テキスト変換要求の第2の識別子と同じである場合、第2の端末および第3の端末に同じ新しいセッションを割り当てる
ように特にさらに構成されてもよい。
割り当てられたセッションが新しいセッションである場合、割り当てられたセッションと少なくとも2つの端末の識別子との対応関係を確立し、この対応関係をデータベースに追加するか、または
割り当てられたセッションがデータベース内のセッションである場合、追加された識別子が割り当てられたセッションに対応するように、少なくとも2つの端末の識別子のうちにあり、かつデータベースに含まれない端末識別子をデータベースに追加する
ようにさらに構成されてもよい。
第5の端末によって送信された終了メッセージを受信するように構成された第3の受信器706をさらに含んでもよい。
501 第1の受信ユニット
502 割当ユニット
503 第2の受信ユニット
504 変換ユニット
505 送信ユニット
506 追加ユニット
507 第3の受信ユニット
508 削除ユニット
701 プロセッサ
702 通信バス
703 第1の受信器
704 第2の受信器
705 送信器
706 第3の受信器
Claims (17)
- サーバに適用される、多者通話において音声をテキストに変換するための方法であって、
少なくとも2つの端末によって送信された音声−テキスト変換要求を受信するステップであって、前記音声−テキスト変換要求が、第1の識別子および第2の識別子を含む、ステップと、
前記少なくとも2つの端末によって送信された前記音声−テキスト変換要求において、同じ第1の識別子または同じ第2の識別子を有する端末が同じセッションを有するように、前記少なくとも2つの端末にセッションを割り当てるステップと、
1回の多者通話において少なくとも1つの端末によって送信される、サンプリングレートが8KHzよりも大きい音声ストリームを、パケット交換ドメインを用いて受信するステップであって、前記多者通話が、1回のセッションに対応する、ステップと、
前記音声ストリームをテキストに変換するステップと、
前記多者通話において端末に前記テキストを送信するステップと
を含む方法。 - 前記少なくとも2つの端末にセッションを割り当てる前記ステップが、
データベースが、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子を含む場合、前記第1の端末によって送信された前記音声−テキスト変換要求の前記第1の識別子または前記第2の識別子に対応する、前記データベース内のセッションを前記第1の端末に割り当てるステップであって、前記第1の端末が、前記少なくとも2つの端末のうちのいずれかの端末であり、前記データベースが、少なくとも1つのセッションおよび該少なくとも1つのセッションに対応する端末識別子を含む、ステップと、
前記データベースが、第2の端末によって送信された音声−テキスト変換要求の第1の識別子および第2の識別子を含まず、前記第2の端末によって送信された前記音声−テキスト変換要求の前記第1の識別子が、第3の端末によって送信された音声−テキスト変換要求の第1の識別子と同じであり、かつ前記第2の端末によって送信された前記音声−テキスト変換要求の前記第2の識別子が、前記第3の端末によって送信された前記音声−テキスト変換要求の第2の識別子と同じである場合、前記第2の端末および前記第3の端末に同じ新しいセッションを割り当てるステップと
を含む、請求項1に記載の方法。 - 前記少なくとも2つの端末にセッションを割り当てる前記ステップの後に、
割り当てられたセッションが新しいセッションである場合、前記割り当てられたセッションと前記少なくとも2つの端末の識別子との対応関係を確立し、前記対応関係をデータベースに追加するステップ、または
前記割り当てられたセッションが前記データベース内のセッションである場合、追加された識別子が前記割り当てられたセッションに対応するように、前記少なくとも2つの端末の前記識別子のうちにあり、かつ前記データベースに含まれない端末の識別子を前記データベースに追加するステップ
をさらに含む、請求項1または2に記載の方法。 - 1回の多者通話において少なくとも1つの端末によって送信される、サンプリングレートが8KHzよりも大きい音声ストリームを、パケット交換ドメインを用いて受信する前記ステップの後に、
第5の端末によって送信された終了メッセージを受信するステップと、
データベースから前記第5の端末の識別子を削除するステップと、
セッションに対応する端末の識別子が前記データベースにおいて空である場合、前記データベースから前記セッションを削除するステップと
をさらに含む、請求項1から3のいずれか一項に記載の方法。 - 前記テキストが、前記少なくとも1つの端末の識別子を含むか、または、前記テキストが、前記少なくとも1つの端末の識別子およびユーザ名を含む、請求項1から4のいずれか一項に記載の方法。
- 多者通話において音声をテキストに変換するための装置であって、
少なくとも2つの端末によって送信された音声−テキスト変換要求を受信するように構成された第1の受信ユニットであって、前記音声−テキスト変換要求が、第1の識別子および第2の識別子を含む、第1の受信ユニットと、
前記少なくとも2つの端末によって送信された前記音声−テキスト変換要求において、同じ第1の識別子または同じ第2の識別子を有する端末が同じセッションを有するように、前記少なくとも2つの端末にセッションを割り当てるように構成された割当ユニットと、
1回の多者通話において少なくとも1つの端末によって送信される、サンプリングレートが8KHzよりも大きい音声ストリームを、パケット交換ドメインを用いて受信するように構成された第2の受信ユニットであって、前記多者通話が、1回のセッションに対応する、第2の受信ユニットと、
前記音声ストリームをテキストに変換するように構成された変換ユニットと、
前記多者通話において端末に前記テキストを送信するように構成された送信ユニットと
を備える装置。 - 前記割当ユニットが、
データベースが、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子を含む場合、前記第1の端末によって送信された前記音声−テキスト変換要求の前記第1の識別子または前記第2の識別子に対応する、前記データベース内のセッションを前記第1の端末に割り当てることであって、前記第1の端末が、前記少なくとも2つの端末のうちのいずれかの端末であり、前記データベースが、少なくとも1つのセッションおよび該少なくとも1つのセッションに対応する端末識別子を含む、ことと、
前記データベースが、第2の端末によって送信された音声−テキスト変換要求の第1の識別子および第2の識別子を含まず、前記第2の端末によって送信された前記音声−テキスト変換要求の前記第1の識別子が、第3の端末によって送信された音声−テキスト変換要求の第1の識別子と同じであり、かつ前記第2の端末によって送信された前記音声−テキスト変換要求の前記第2の識別子が、前記第3の端末によって送信された前記音声−テキスト変換要求の第2の識別子と同じである場合、前記第2の端末および前記第3の端末に同じ新しいセッションを割り当てることと
を行うようにさらに構成される、請求項6に記載の装置。 - 割り当てられたセッションが新しいセッションである場合、前記割り当てられたセッションと前記少なくとも2つの端末の識別子との対応関係を確立し、前記対応関係をデータベースに追加するように構成された追加ユニットであって、
前記割り当てられたセッションが前記データベース内のセッションである場合、追加された識別子が前記割り当てられたセッションに対応するように、前記少なくとも2つの端末の前記識別子のうちにあり、かつ前記データベースに含まれない端末の識別子を前記データベースに追加するようにさらに構成された追加ユニット
をさらに備える、請求項6または7に記載の装置。 - 第5の端末によって送信された終了メッセージを受信するように構成された第3の受信ユニットと、
データベースから前記第5の端末の識別子を削除するように構成された削除ユニットであって、
セッションに対応する端末の識別子が前記データベースにおいて空である場合、前記データベースから前記セッションを削除するようにさらに構成された削除ユニットと
をさらに備える、請求項6から8のいずれか一項に記載の装置。 - 前記テキストが、前記少なくとも1つの端末の識別子を含むか、または、前記テキストが、前記少なくとも1つの端末の識別子およびユーザ名を含む、請求項6から9のいずれか一項に記載の装置。
- 多者通話において音声をテキストに変換するための装置であって、
少なくとも2つの端末によって送信された音声−テキスト変換要求を受信するように構成された第1の受信器であって、前記音声−テキスト変換要求が、第1の識別子および第2の識別子を含む、第1の受信器と、
前記少なくとも2つの端末によって送信された前記音声−テキスト変換要求において、同じ第1の識別子または同じ第2の識別子を有する端末が同じセッションを有するように、前記少なくとも2つの端末にセッションを割り当てるように構成されたプロセッサと、
1回の多者通話において少なくとも1つの端末によって送信される、サンプリングレートが8KHzよりも大きい音声ストリームを、パケット交換ドメインを用いて受信するように構成された第2の受信器であって、前記多者通話が、1回のセッションに対応する、第2の受信器と
を備え、
前記プロセッサが、前記音声ストリームをテキストに変換するようにさらに構成され、
前記装置が、
前記多者通話において端末に前記テキストを送信するように構成された送信器
をさらに備える、装置。 - 前記プロセッサが、
データベースが、第1の端末によって送信された音声−テキスト変換要求の第1の識別子または第2の識別子を含む場合、前記第1の端末によって送信された前記音声−テキスト変換要求の前記第1の識別子または前記第2の識別子に対応する、前記データベース内のセッションを前記第1の端末に割り当てることであって、前記第1の端末が、前記少なくとも2つの端末のうちのいずれかの端末であり、前記データベースが、少なくとも1つのセッションおよび該少なくとも1つのセッションに対応する端末識別子を含む、ことと、
前記データベースが、第2の端末によって送信された音声−テキスト変換要求の第1の識別子および第2の識別子を含まず、前記第2の端末によって送信された前記音声−テキスト変換要求の前記第1の識別子が、第3の端末によって送信された音声−テキスト変換要求の第1の識別子と同じであり、かつ前記第2の端末によって送信された前記音声−テキスト変換要求の前記第2の識別子が、前記第3の端末によって送信された前記音声−テキスト変換要求の第2の識別子と同じである場合、前記第2の端末および前記第3の端末に同じ新しいセッションを割り当てることと
を行うようにさらに構成される、請求項11に記載の装置。 - 前記プロセッサが、
割り当てられたセッションが新しいセッションである場合、前記割り当てられたセッションと前記少なくとも2つの端末の識別子との対応関係を確立し、前記対応関係をデータベースに追加することと、
前記割り当てられたセッションが前記データベース内のセッションである場合、追加された識別子が前記割り当てられたセッションに対応するように、前記少なくとも2つの端末の前記識別子のうちにあり、かつ前記データベースに含まれない端末の識別子を前記データベースに追加することと
を行うようにさらに構成される、請求項11または12に記載の装置。 - 第5の端末によって送信された終了メッセージを受信するように構成された第3の受信器
をさらに備え、
前記プロセッサが、データベースから前記第5の端末の識別子を削除するようにさらに構成され、
前記プロセッサが、セッションに対応する端末の識別子が前記データベースにおいて空である場合、前記データベースから前記セッションを削除するようにさらに構成される、請求項11から13のいずれか一項に記載の装置。 - 前記テキストが、前記少なくとも1つの端末の識別子を含むか、または、前記テキストが、前記少なくとも1つの端末の識別子およびユーザ名を含む、請求項11から14のいずれか一項に記載の装置。
- 請求項1から5のいずれか一項に記載の方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
- 請求項1から5のいずれか一項に記載の方法をコンピュータに実行させるプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2015/071966 WO2016119226A1 (zh) | 2015-01-30 | 2015-01-30 | 一种多方通话中语音转文本的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018509056A JP2018509056A (ja) | 2018-03-29 |
JP6573676B2 true JP6573676B2 (ja) | 2019-09-11 |
Family
ID=56542220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017540583A Active JP6573676B2 (ja) | 2015-01-30 | 2015-01-30 | 多者通話において音声をテキストに変換するための方法および装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US10825459B2 (ja) |
EP (1) | EP3244600B1 (ja) |
JP (1) | JP6573676B2 (ja) |
KR (1) | KR101987123B1 (ja) |
CN (1) | CN106105175B (ja) |
RU (1) | RU2677878C1 (ja) |
WO (1) | WO2016119226A1 (ja) |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020133342A1 (en) | 2001-03-16 | 2002-09-19 | Mckenna Jennifer | Speech to text method and system |
US7158764B2 (en) | 2001-12-13 | 2007-01-02 | Electronic Data Systems Corporation | System and method for sending high fidelity sound between wireless units |
US7236580B1 (en) * | 2002-02-20 | 2007-06-26 | Cisco Technology, Inc. | Method and system for conducting a conference call |
JP2005012484A (ja) * | 2003-06-19 | 2005-01-13 | Nec Engineering Ltd | 音声会議システム |
US7130401B2 (en) * | 2004-03-09 | 2006-10-31 | Discernix, Incorporated | Speech to text conversion system |
US8027276B2 (en) * | 2004-04-14 | 2011-09-27 | Siemens Enterprise Communications, Inc. | Mixed mode conferencing |
US20060282265A1 (en) * | 2005-06-10 | 2006-12-14 | Steve Grobman | Methods and apparatus to perform enhanced speech to text processing |
CN100442789C (zh) | 2006-03-16 | 2008-12-10 | 华为技术有限公司 | 一种多方通信的实现方法及系统 |
US8817668B2 (en) * | 2006-09-15 | 2014-08-26 | Microsoft Corporation | Distributable, scalable, pluggable conferencing architecture |
WO2008066836A1 (en) | 2006-11-28 | 2008-06-05 | Treyex Llc | Method and apparatus for translating speech during a call |
CN101068271A (zh) | 2007-06-26 | 2007-11-07 | 华为技术有限公司 | 电话纪要生成系统、通信终端、媒体服务器及方法 |
US9025751B2 (en) * | 2008-10-01 | 2015-05-05 | Avaya Inc. | System and method of managing conference calls through the use of filtered lists of participants |
US8542807B2 (en) * | 2009-02-09 | 2013-09-24 | Applied Minds, Llc | Method and apparatus for establishing a data link based on a pots connection |
US20110195739A1 (en) | 2010-02-10 | 2011-08-11 | Harris Corporation | Communication device with a speech-to-text conversion function |
US8559606B2 (en) * | 2010-12-07 | 2013-10-15 | Microsoft Corporation | Multimodal telephone calls |
US8510398B2 (en) * | 2010-12-10 | 2013-08-13 | At&T Intellectual Property I, Lp | Apparatus and method for managing message communication |
US9420431B2 (en) * | 2011-03-08 | 2016-08-16 | General Motors Llc | Vehicle telematics communication for providing hands-free wireless communication |
US8918197B2 (en) * | 2012-06-13 | 2014-12-23 | Avraham Suhami | Audio communication networks |
US9110891B2 (en) * | 2011-12-12 | 2015-08-18 | Google Inc. | Auto-translation for multi user audio and video |
EP2627063A1 (en) * | 2012-02-13 | 2013-08-14 | Alcatel Lucent | A telephony system with a background recapitulation feature |
JP6201279B2 (ja) * | 2012-03-22 | 2017-09-27 | 日本電気株式会社 | サーバ、サーバの制御方法および制御プログラム、情報処理システム、情報処理方法、携帯端末、携帯端末の制御方法および制御プログラム |
US8675854B2 (en) * | 2012-05-01 | 2014-03-18 | Mitel Networks Corporation | Multi-modal communications with conferencing and clients |
JP6303324B2 (ja) * | 2013-08-09 | 2018-04-04 | 株式会社リコー | 通信システム、管理装置、通信方法およびプログラム |
CN104700836B (zh) * | 2013-12-10 | 2019-01-29 | 阿里巴巴集团控股有限公司 | 一种语音识别方法和系统 |
-
2015
- 2015-01-30 JP JP2017540583A patent/JP6573676B2/ja active Active
- 2015-01-30 CN CN201580003322.4A patent/CN106105175B/zh active Active
- 2015-01-30 US US15/547,465 patent/US10825459B2/en active Active
- 2015-01-30 WO PCT/CN2015/071966 patent/WO2016119226A1/zh active Application Filing
- 2015-01-30 EP EP15879434.7A patent/EP3244600B1/en active Active
- 2015-01-30 KR KR1020177024009A patent/KR101987123B1/ko active IP Right Grant
- 2015-01-30 RU RU2017129888A patent/RU2677878C1/ru active
Also Published As
Publication number | Publication date |
---|---|
KR20170108121A (ko) | 2017-09-26 |
US10825459B2 (en) | 2020-11-03 |
EP3244600B1 (en) | 2022-06-22 |
EP3244600A4 (en) | 2018-01-17 |
CN106105175A (zh) | 2016-11-09 |
JP2018509056A (ja) | 2018-03-29 |
KR101987123B1 (ko) | 2019-06-10 |
CN106105175B (zh) | 2019-05-21 |
EP3244600A1 (en) | 2017-11-15 |
RU2677878C1 (ru) | 2019-01-22 |
US20170372701A1 (en) | 2017-12-28 |
WO2016119226A1 (zh) | 2016-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8175243B2 (en) | Systems and methods for facilitating teleconferencing without pre-reservation of conference resources | |
US9571788B2 (en) | Communication systems, communication devices, and related methods for routing calls between communication devices having users with different abilities | |
WO2015106592A1 (zh) | 分配坐席的方法、cti设备、终端和分配坐席的系统 | |
US10187529B2 (en) | Systems and methods for conducting conference calls | |
US8755507B2 (en) | Providing multilevel conference call participants | |
US20140098947A1 (en) | Ad hoc meeting initiation | |
CN111866207B (zh) | 一种音视频会议系统号码分配方法及系统 | |
US11089541B2 (en) | Managing communication sessions with respect to multiple transport media | |
EP1505766A1 (en) | Improved group communication system | |
US10917443B2 (en) | Telephone communication system and method for dynamic assignment of IP-PBXs | |
US20100189240A1 (en) | Contacting a person outside of a teleconference without leaving the teleconference | |
JP6573676B2 (ja) | 多者通話において音声をテキストに変換するための方法および装置 | |
JP2008148169A (ja) | 通信装置、通信システム及びそれらに用いる通信方法並びにそのプログラム | |
US10623448B2 (en) | Audio data transfer device and audio data transfer method | |
JP2013251733A (ja) | 電話システム、サーバ装置及び制御方法 | |
JP2013207331A (ja) | ビデオ会議対応ip電話装置及びその呼接続方法 | |
US20050063524A1 (en) | Communication system and method | |
JP2009100093A (ja) | 通信システム、連続発信制御装置、通信制御方法、及びプログラム | |
CN118677867A (zh) | 基于ip-pbx的实时聊天通话方法、系统、装置及存储介质 | |
CN106453265B (zh) | Ip呼叫的调度方法及调度系统、ippbx、服务器 | |
JP6417839B2 (ja) | 転送制御プログラム、転送制御装置、および、転送制御方法 | |
JP2008136091A (ja) | 保留音源装置 | |
WO2016155541A1 (zh) | 一种网络电话的通话方法、设备及系统 | |
JP2019193103A (ja) | 交換機、交換方法及びプログラム | |
JP2018110349A (ja) | 通信装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170908 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170908 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190722 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190813 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6573676 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |