JP7180687B2 - 処理システム、処理方法及びプログラム - Google Patents
処理システム、処理方法及びプログラム Download PDFInfo
- Publication number
- JP7180687B2 JP7180687B2 JP2020559735A JP2020559735A JP7180687B2 JP 7180687 B2 JP7180687 B2 JP 7180687B2 JP 2020559735 A JP2020559735 A JP 2020559735A JP 2020559735 A JP2020559735 A JP 2020559735A JP 7180687 B2 JP7180687 B2 JP 7180687B2
- Authority
- JP
- Japan
- Prior art keywords
- target
- estimation
- interpreter
- call
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 145
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000000034 method Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 13
- 230000000977 initiatory effect Effects 0.000 claims 3
- 238000010586 diagram Methods 0.000 description 20
- 238000010801 machine learning Methods 0.000 description 13
- 238000013500 data storage Methods 0.000 description 11
- 238000000605 extraction Methods 0.000 description 9
- 238000012546 transfer Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/428—Arrangements for placing incoming calls on hold
- H04M3/4285—Notifying, informing or entertaining a held party while on hold, e.g. Music On Hold
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2242/00—Special services or facilities
- H04M2242/12—Language recognition, selection or translation arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Business, Economics & Management (AREA)
- Machine Translation (AREA)
- Telephone Function (AREA)
Description
言語推定対象の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得手段と、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定手段と、
前記推定手段による推定結果を出力する結果出力手段と、
前記推定結果の正誤判定を行う判定手段と、
前記判定手段により正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力手段と、
を有する処理システムが提供される。
コンピュータが、
言語推定対象の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得工程と、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定工程と、
前記推定工程での推定結果を出力する結果出力工程と、
前記推定結果の正誤判定を行う判定工程と、
前記判定工程で正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力工程と、
を実行する処理方法が提供される。
コンピュータを、
言語推定対象の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得手段、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定手段、
前記推定手段による推定結果を出力する結果出力手段、
前記推定結果の正誤判定を行う判定手段、
前記判定手段により正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力手段、
として機能させるプログラムが提供される。
まず、本実施形態の処理システムの概要を説明する。処理システムは、機械学習で生成した推定モデルと、言語推定対象の音声を記録した音声データ又はその音声の特徴量とに基づき、言語推定対象の音声の言語を推定する。次いで、処理システムは、推定結果を出力するとともに、推定結果の正誤判定を行う。そして、正しいと判定された推定結果と、言語推定対象の音声を記録した音声データ又はその音声の特徴量とを、推定モデルを生成するための学習データとして出力する。
本実施形態の処理システム10は、通話手段を有し、通話相手の音声を対象音声とする点等が第1の実施形態と異なる。
本実施形態の処理システム10は、第2の実施形態と同様の構成を有し、第1及び第2の実施形態と異なる手段で推定結果の正誤判定を行う点で、第1及び第2の実施形態と異なる。
本実施形態の処理システム10は、第2の実施形態と同様の構成を有し、第1乃至第3の実施形態と異なる手段で推定結果の正誤判定を行う点で、第1乃至第3の実施形態と異なる。
本実施形態の処理システム10は、第2の実施形態と同様の構成を有し、第1乃至第4の実施形態と異なる手段で推定結果の正誤判定を行う点で、第1乃至第4の実施形態と異なる。
1. 言語推定対象の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得手段と、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定手段と、
前記推定手段による推定結果を出力する結果出力手段と、
前記推定結果の正誤判定を行う判定手段と、
前記判定手段により正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力手段と、
を有する処理システム。
2. 1に記載の処理システムにおいて、
通話手段を有し、
前記取得手段は、通話相手の音声を記録した前記対象音声データ、又は、前記通話相手の音声の特徴を示す前記対象特徴量を取得し、
複数の言語各々の通訳担当者及び連絡先情報を登録した通訳者情報を参照し、前記推定結果で示される言語の前記通訳担当者を抽出する通訳担当者抽出手段と、
抽出された前記通訳担当者を示す情報を出力する通訳担当者出力手段と、
通話相手との通話を保留し、抽出された前記通訳担当者の中から指定された前記通訳担当者との通話を開始させる通話制御手段と、
を有する処理システム。
3. 2に記載の処理システムにおいて、
前記通話制御手段は、前記通話相手との通話を保留し、指定された前記通訳担当者との通話を開始させた後、所定の入力を受付けると、前記通話相手及び前記通訳担当者を含む三者通話を開始し、
前記判定手段は、前記三者通話が開始されてからの経過時間が所定時間を超えた場合、前記推定結果が正しいと判定する処理システム。
4. 2に記載の処理システムにおいて、
前記通話制御手段は、前記通話相手との通話を保留し、指定された前記通訳担当者との通話を開始させた後、前記対象音声データを再生し、再生音を前記通訳担当者の通話端末に送信し、その後に所定の入力を受付けると、前記通話相手及び前記通訳担当者を含む三者通話を開始させ、
前記判定手段は、前記三者通話が開始されると、前記推定結果が正しいと判定する処理システム。
5. 2から4のいずれかに記載の処理システムにおいて、
前記通話制御手段は、前記通話相手との通話を保留にしている間、前記推定結果で示される言語で所定のメッセージを出力する保留音を再生し、再生音を前記通話相手の通話端末に送信し、
前記判定手段は、前記保留音を再生中に前記通話相手から所定の入力を受付け、前記通話相手の入力が第1の入力である場合、前記推定結果が正しいと判定し、前記通話相手の入力が第2の入力である場合、前記推定結果が正しくないと判定する処理システム。
6. 5に記載の処理システムにおいて、
前記判定手段は、所定の期限までに前記通話相手の入力がない場合、前記推定結果が正しくないと判定する処理システム。
7. 5又は6に記載の処理システムにおいて、
前記通話制御手段は、前記推定結果が複数の言語を含む場合、信頼度が最も高い言語の前記メッセージを再生し、前記通話相手の入力が第2の入力である場合、又は、所定の期限までに前記通話相手の入力がない場合には、次に信頼度が高い言語の前記メッセージを再生する処理システム。
8. コンピュータが、
言語推定対象の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得工程と、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定工程と、
前記推定工程での推定結果を出力する結果出力工程と、
前記推定結果の正誤判定を行う判定工程と、
前記判定工程で正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力工程と、
を実行する処理方法。
9. コンピュータを、
言語推定対象の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得手段、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定手段、
前記推定手段による推定結果を出力する結果出力手段、
前記推定結果の正誤判定を行う判定手段、
前記判定手段により正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力手段、
として機能させるプログラム。
Claims (11)
- 通話手段と、
言語推定対象の音声であって、通話相手の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得手段と、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定手段と、
前記推定手段による推定結果を出力する結果出力手段と、
複数の言語各々の通訳担当者及び連絡先情報を登録した通訳者情報を参照し、前記推定結果で示される言語の前記通訳担当者を抽出する通訳担当者抽出手段と、
抽出された前記通訳担当者を示す情報を出力する通訳担当者出力手段と、
前記通話相手との通話を保留し、抽出された前記通訳担当者の中から指定された前記通訳担当者との通話を開始させ、その後に所定の入力を受付けると、前記通話相手及び前記通訳担当者を含む三者通話を開始させる通話制御手段と、
前記三者通話が開始されてからの経過時間が所定時間を超えた場合、前記推定結果が正しいと判定する判定手段と、
前記判定手段により正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力手段と、
を有する処理システム。 - 通話手段と、
言語推定対象の音声であって、通話相手の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得手段と、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定手段と、
前記推定手段による推定結果を出力する結果出力手段と、
複数の言語各々の通訳担当者及び連絡先情報を登録した通訳者情報を参照し、前記推定結果で示される言語の前記通訳担当者を抽出する通訳担当者抽出手段と、
抽出された前記通訳担当者を示す情報を出力する通訳担当者出力手段と、
通話相手との通話を保留し、抽出された前記通訳担当者の中から指定された前記通訳担当者との通話を開始させた後、前記対象音声データを再生し、再生音を前記通訳担当者の通話端末に送信し、その後に所定の入力を受付けると、前記通話相手及び前記通訳担当者を含む三者通話を開始させる通話制御手段と、
前記三者通話が開始されると、前記推定結果が正しいと判定する判定手段と、
前記判定手段により正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力手段と、
を有する処理システム。 - 通話手段と、
言語推定対象の音声であって、通話相手の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得手段と、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定手段と、
前記推定手段による推定結果を出力する結果出力手段と、
複数の言語各々の通訳担当者及び連絡先情報を登録した通訳者情報を参照し、前記推定結果で示される言語の前記通訳担当者を抽出する通訳担当者抽出手段と、
抽出された前記通訳担当者を示す情報を出力する通訳担当者出力手段と、
通話相手との通話を保留し、抽出された前記通訳担当者の中から指定された前記通訳担当者との通話を開始させ、前記通話相手との通話を保留にしている間、前記推定結果で示される言語で所定のメッセージを出力する保留音を再生し、再生音を前記通話相手の通話端末に送信する通話制御手段と、
前記保留音を再生中に前記通話相手から所定の入力を受付け、前記通話相手の入力が第1の入力である場合、前記推定結果が正しいと判定し、前記通話相手の入力が第2の入力である場合、前記推定結果が正しくないと判定する判定手段と、
前記判定手段により正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力手段と、
を有する処理システム。 - 請求項3に記載の処理システムにおいて、
前記判定手段は、所定の期限までに前記通話相手の入力がない場合、前記推定結果が正しくないと判定する処理システム。 - 請求項3又は4に記載の処理システムにおいて、
前記通話制御手段は、前記推定結果が複数の言語を含む場合、信頼度が最も高い言語の前記メッセージを再生し、前記通話相手の入力が第2の入力である場合、又は、所定の期限までに前記通話相手の入力がない場合には、次に信頼度が高い言語の前記メッセージを再生する処理システム。 - コンピュータが、
通話工程と、
言語推定対象の音声であって、通話相手の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得工程と、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定工程と、
前記推定工程での推定結果を出力する結果出力工程と、
複数の言語各々の通訳担当者及び連絡先情報を登録した通訳者情報を参照し、前記推定結果で示される言語の前記通訳担当者を抽出する通訳担当者抽出工程と、
抽出された前記通訳担当者を示す情報を出力する通訳担当者出力工程と、
前記通話相手との通話を保留し、抽出された前記通訳担当者の中から指定された前記通訳担当者との通話を開始させ、その後に所定の入力を受付けると、前記通話相手及び前記通訳担当者を含む三者通話を開始させる通話制御工程と、
前記三者通話が開始されてからの経過時間が所定時間を超えた場合、前記推定結果が正しいと判定する判定工程と、
前記判定工程で正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力工程と、
を実行する処理方法。 - コンピュータが、
通話工程と、
言語推定対象の音声であって、通話相手の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得工程と、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定工程と、
前記推定工程での推定結果を出力する結果出力工程と、
複数の言語各々の通訳担当者及び連絡先情報を登録した通訳者情報を参照し、前記推定結果で示される言語の前記通訳担当者を抽出する通訳担当者抽出手段と、
抽出された前記通訳担当者を示す情報を出力する通訳担当者出力手段と、
通話相手との通話を保留し、抽出された前記通訳担当者の中から指定された前記通訳担当者との通話を開始させた後、前記対象音声データを再生し、再生音を前記通訳担当者の通話端末に送信し、その後に所定の入力を受付けると、前記通話相手及び前記通訳担当者を含む三者通話を開始させる通話制御手段と、
前記三者通話が開始されると、前記推定結果が正しいと判定する判定工程と、
前記判定工程で正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力工程と、
を実行する処理方法。 - コンピュータが、
通話工程と、
言語推定対象の音声であって、通話相手の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得工程と、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定工程と、
前記推定工程での推定結果を出力する結果出力工程と、
複数の言語各々の通訳担当者及び連絡先情報を登録した通訳者情報を参照し、前記推定結果で示される言語の前記通訳担当者を抽出する通訳担当者抽出手段と、
抽出された前記通訳担当者を示す情報を出力する通訳担当者出力手段と、
通話相手との通話を保留し、抽出された前記通訳担当者の中から指定された前記通訳担当者との通話を開始させ、前記通話相手との通話を保留にしている間、前記推定結果で示される言語で所定のメッセージを出力する保留音を再生し、再生音を前記通話相手の通話端末に送信する通話制御手段と、
前記保留音を再生中に前記通話相手から所定の入力を受付け、前記通話相手の入力が第1の入力である場合、前記推定結果が正しいと判定し、前記通話相手の入力が第2の入力である場合、前記推定結果が正しくないと判定する判定工程と、
前記判定工程で正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力工程と、
を実行する処理方法。 - コンピュータを、
通話手段、
言語推定対象の音声であって、通話相手の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得手段、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定手段、
前記推定手段による推定結果を出力する結果出力手段、
複数の言語各々の通訳担当者及び連絡先情報を登録した通訳者情報を参照し、前記推定結果で示される言語の前記通訳担当者を抽出する通訳担当者抽出手段、
抽出された前記通訳担当者を示す情報を出力する通訳担当者出力手段、
前記通話相手との通話を保留し、抽出された前記通訳担当者の中から指定された前記通訳担当者との通話を開始させ、その後に所定の入力を受付けると、前記通話相手及び前記通訳担当者を含む三者通話を開始させる通話制御手段、
前記三者通話が開始されてからの経過時間が所定時間を超えた場合、前記推定結果が正しいと判定する判定手段、
前記判定手段により正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力手段、
として機能させるプログラム。 - コンピュータを、
通話手段、
言語推定対象の音声であって、通話相手の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得手段、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定手段、
前記推定手段による推定結果を出力する結果出力手段、
複数の言語各々の通訳担当者及び連絡先情報を登録した通訳者情報を参照し、前記推定結果で示される言語の前記通訳担当者を抽出する通訳担当者抽出手段、
抽出された前記通訳担当者を示す情報を出力する通訳担当者出力手段、
通話相手との通話を保留し、抽出された前記通訳担当者の中から指定された前記通訳担当者との通話を開始させた後、前記対象音声データを再生し、再生音を前記通訳担当者の通話端末に送信し、その後に所定の入力を受付けると、前記通話相手及び前記通訳担当者を含む三者通話を開始させる通話制御手段、
前記三者通話が開始されると、前記推定結果が正しいと判定する判定手段、
前記判定手段により正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力手段、
として機能させるプログラム。 - コンピュータを、
通話手段、
言語推定対象の音声であって、通話相手の音声である対象音声を記録した対象音声データ、又は、前記対象音声の特徴を示す対象特徴量を取得する取得手段、
音声を記録した音声データ又は前記音声の特徴を示す音声特徴量から前記音声の言語を推定する推定モデルと、前記対象音声データ又は前記対象特徴量とに基づき、前記対象音声の言語を推定する推定手段、
前記推定手段による推定結果を出力する結果出力手段、
複数の言語各々の通訳担当者及び連絡先情報を登録した通訳者情報を参照し、前記推定結果で示される言語の前記通訳担当者を抽出する通訳担当者抽出手段、
抽出された前記通訳担当者を示す情報を出力する通訳担当者出力手段、
通話相手との通話を保留し、抽出された前記通訳担当者の中から指定された前記通訳担当者との通話を開始させ、前記通話相手との通話を保留にしている間、前記推定結果で示される言語で所定のメッセージを出力する保留音を再生し、再生音を前記通話相手の通話端末に送信する通話制御手段、
前記保留音を再生中に前記通話相手から所定の入力を受付け、前記通話相手の入力が第1の入力である場合、前記推定結果が正しいと判定し、前記通話相手の入力が第2の入力である場合、前記推定結果が正しくないと判定する判定手段、
前記判定手段により正しいと判定された前記推定結果と、前記対象音声データ又は前記対象特徴量とを、前記推定モデルを生成するための学習データとして出力する学習データ出力手段、
として機能させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018231461 | 2018-12-11 | ||
JP2018231461 | 2018-12-11 | ||
PCT/JP2019/036062 WO2020121616A1 (ja) | 2018-12-11 | 2019-09-13 | 処理システム、処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020121616A1 JPWO2020121616A1 (ja) | 2021-10-14 |
JP7180687B2 true JP7180687B2 (ja) | 2022-11-30 |
Family
ID=71077181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020559735A Active JP7180687B2 (ja) | 2018-12-11 | 2019-09-13 | 処理システム、処理方法及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (2) | US11503161B2 (ja) |
EP (1) | EP3896687A4 (ja) |
JP (1) | JP7180687B2 (ja) |
WO (1) | WO2020121616A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114638237A (zh) * | 2020-12-15 | 2022-06-17 | 华为云计算技术有限公司 | 一种实现同声传译的方法、装置及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003032373A (ja) | 2001-07-11 | 2003-01-31 | Contents Station:Kk | 三者間通話を可能とする多言語オペレートシステム |
US20070121903A1 (en) | 2005-09-13 | 2007-05-31 | Language Line Services, Inc. | Systems and methods for providing a language interpretation line |
JP2010021692A (ja) | 2008-07-09 | 2010-01-28 | Metemu:Kk | 電話を使用した通訳システム |
US20120010886A1 (en) | 2010-07-06 | 2012-01-12 | Javad Razavilar | Language Identification |
JP2012103554A (ja) | 2010-11-11 | 2012-05-31 | Advanced Telecommunication Research Institute International | 音声言語識別装置の学習装置、音声言語の識別装置、及びそれらのためのプログラム |
JP2018128575A (ja) | 2017-02-08 | 2018-08-16 | 日本電信電話株式会社 | 話し終わり判定装置、話し終わり判定方法およびプログラム |
JP2018128576A (ja) | 2017-02-08 | 2018-08-16 | 日本電信電話株式会社 | 用件判定装置、用件判定方法およびプログラム |
JP2018174416A (ja) | 2017-03-31 | 2018-11-08 | 日本電気株式会社 | 多言語振分装置、多言語振分方法、及びプログラム |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6424989B1 (en) * | 1991-09-20 | 2002-07-23 | Venson M. Shaw | Object-oriented transaction computing system |
US6188429B1 (en) * | 1997-09-19 | 2001-02-13 | Netergy Networks, Inc | Video TTY device and method for videocommunication |
AU1610201A (en) * | 1999-11-19 | 2001-05-30 | Intervoice Limited Partnership | Autonomously administering enhanced telephony services |
EP1545110A4 (en) * | 2002-09-27 | 2006-05-03 | Ginganet Corp | TELEPHONE INTERPRETATION SYSTEM |
US20070206761A1 (en) * | 2004-10-12 | 2007-09-06 | Anders Joseph C | Comparative tone return time three-way call detect |
US8023626B2 (en) * | 2005-09-13 | 2011-09-20 | Language Line Services, Inc. | System and method for providing language interpretation |
US7792276B2 (en) * | 2005-09-13 | 2010-09-07 | Language Line Services, Inc. | Language interpretation call transferring in a telecommunications network |
US20070239625A1 (en) * | 2006-04-05 | 2007-10-11 | Language Line Services, Inc. | System and method for providing access to language interpretation |
US7773738B2 (en) * | 2006-09-22 | 2010-08-10 | Language Line Services, Inc. | Systems and methods for providing relayed language interpretation |
US20100120404A1 (en) * | 2008-11-12 | 2010-05-13 | Bernal Andrzej | Method for providing translation services |
JP5544279B2 (ja) | 2010-11-11 | 2014-07-09 | 株式会社神戸製鋼所 | 学習支援システム、学習支援システムの学習履歴集計方法、及びコンピュータプログラム |
US9253329B1 (en) * | 2011-06-10 | 2016-02-02 | West Corporation | Services via a conference bridge |
US9025760B1 (en) * | 2011-06-10 | 2015-05-05 | West Corporation | Apparatus and method for connecting a translator and a customer |
KR20150103972A (ko) * | 2014-03-04 | 2015-09-14 | 삼성전자주식회사 | 전자 장치의 촬영 기능과 통화 기능을 제어하는 방법 및 이를 구현한 전자 장치 |
US9614969B2 (en) * | 2014-05-27 | 2017-04-04 | Microsoft Technology Licensing, Llc | In-call translation |
US20150347399A1 (en) * | 2014-05-27 | 2015-12-03 | Microsoft Technology Licensing, Llc | In-Call Translation |
US20160170970A1 (en) * | 2014-12-12 | 2016-06-16 | Microsoft Technology Licensing, Llc | Translation Control |
JP2017143322A (ja) * | 2016-02-08 | 2017-08-17 | 日本Did株式会社 | 通訳システム及び通訳管理装置 |
US20190102713A1 (en) * | 2017-10-03 | 2019-04-04 | Avaya Inc. | Split enterprise/provider workflows |
-
2019
- 2019-09-13 EP EP19895333.3A patent/EP3896687A4/en not_active Withdrawn
- 2019-09-13 JP JP2020559735A patent/JP7180687B2/ja active Active
- 2019-09-13 WO PCT/JP2019/036062 patent/WO2020121616A1/ja unknown
- 2019-09-13 US US17/312,170 patent/US11503161B2/en active Active
-
2022
- 2022-10-03 US US17/958,543 patent/US11818300B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003032373A (ja) | 2001-07-11 | 2003-01-31 | Contents Station:Kk | 三者間通話を可能とする多言語オペレートシステム |
US20070121903A1 (en) | 2005-09-13 | 2007-05-31 | Language Line Services, Inc. | Systems and methods for providing a language interpretation line |
JP2010021692A (ja) | 2008-07-09 | 2010-01-28 | Metemu:Kk | 電話を使用した通訳システム |
US20120010886A1 (en) | 2010-07-06 | 2012-01-12 | Javad Razavilar | Language Identification |
JP2012103554A (ja) | 2010-11-11 | 2012-05-31 | Advanced Telecommunication Research Institute International | 音声言語識別装置の学習装置、音声言語の識別装置、及びそれらのためのプログラム |
JP2018128575A (ja) | 2017-02-08 | 2018-08-16 | 日本電信電話株式会社 | 話し終わり判定装置、話し終わり判定方法およびプログラム |
JP2018128576A (ja) | 2017-02-08 | 2018-08-16 | 日本電信電話株式会社 | 用件判定装置、用件判定方法およびプログラム |
JP2018174416A (ja) | 2017-03-31 | 2018-11-08 | 日本電気株式会社 | 多言語振分装置、多言語振分方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2020121616A1 (ja) | 2020-06-18 |
JPWO2020121616A1 (ja) | 2021-10-14 |
US11503161B2 (en) | 2022-11-15 |
US20220014628A1 (en) | 2022-01-13 |
US20230027992A1 (en) | 2023-01-26 |
US11818300B2 (en) | 2023-11-14 |
EP3896687A4 (en) | 2022-01-26 |
EP3896687A1 (en) | 2021-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI310503B (en) | Method and apparatus for use in automating access to one or more services accessible throngh a communication system, and machine readable medium recording related instructions | |
US11762629B2 (en) | System and method for providing a response to a user query using a visual assistant | |
US11363140B2 (en) | Systems and methods for operating an interactive voice response system | |
JP2010526349A (ja) | 自動案内システムの文法調整 | |
US9172795B1 (en) | Phone call context setting | |
US20090296906A1 (en) | Image sharing system | |
KR102535790B1 (ko) | 보류 상태를 관리하기 위한 방법 및 장치 | |
JP2012503364A (ja) | 無線機器に対する既定の応答方法及び装置 | |
JP2019197977A (ja) | 問い合わせ処理方法、システム、端末、自動音声対話装置、表示処理方法、通話制御方法、及び、プログラム | |
CN110943908A (zh) | 语音消息发送方法、电子设备及介质 | |
JP7180687B2 (ja) | 処理システム、処理方法及びプログラム | |
US10178230B1 (en) | Methods and systems for communicating supplemental data to a callee via data association with a software-as-a-service application | |
JP2017216672A (ja) | 通話装置 | |
US20180054526A1 (en) | Interactive voicemail message and response tagging system for improved response quality and information retrieval | |
JP2015036826A (ja) | コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム | |
JP2018160798A (ja) | 通信装置、通信方法、および、通信プログラム | |
JP7103681B2 (ja) | 音声認識プログラム、音声認識方法、音声認識装置および音声認識システム | |
JP2007025036A (ja) | 音声対話処理方法及びシステム並びにそのためのプログラム | |
JP2016082365A (ja) | 情報処理システム、コミュニケーション処理方法、及びそのためのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221031 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7180687 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |