JP2016192599A - ビデオ会議システムと音声認識技術を組み合わせた装置および方法 - Google Patents
ビデオ会議システムと音声認識技術を組み合わせた装置および方法 Download PDFInfo
- Publication number
- JP2016192599A JP2016192599A JP2015070342A JP2015070342A JP2016192599A JP 2016192599 A JP2016192599 A JP 2016192599A JP 2015070342 A JP2015070342 A JP 2015070342A JP 2015070342 A JP2015070342 A JP 2015070342A JP 2016192599 A JP2016192599 A JP 2016192599A
- Authority
- JP
- Japan
- Prior art keywords
- data
- video conference
- speech
- terminal
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 27
- 238000005516 engineering process Methods 0.000 title abstract description 4
- 238000012937 correction Methods 0.000 claims abstract description 72
- 238000012552 review Methods 0.000 abstract description 3
- 238000013500 data storage Methods 0.000 description 33
- 238000013519 translation Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
前記ビデオ会議端末から第1の入力音声データを受信する手段と、
前記入力音声データに基づいて発言データを作成する手段と、
前記発言データを前記ビデオ会議端末および前記コンピュータ端末に送信する手段と、
前記コンピュータ端末から前記発言データに対する修正データを受信する手段と、
前記修正データに基づいて前記発言データを修正する手段と、
前記発言データの修正データを前記ビデオ会議端末および前記コンピュータ端末に送信する手段と
を備えたことを特徴とする。
前記コンピュータ端末から第2の入力音声データを受信する手段と
前記第1の入力音声データと前記第2の入力音声データとを照合する手段と、
前記第1の入力音声データと前記第2の入力音声データとの照合により両音声データが対応する場合、前記両音声データに基づいて、前記発言の発話者を特定する手段と
をさらに備えたことを特徴とする。
前記発話者と、前記修正データに係る修正者とが同一であるか否かを判定し、
前記発話者と前記修正者とが同一である場合に実行され、
前記装置は、
前記発話者と前記修正者とが異なる場合、前記発話者が用いる前記コンピュータ端末に修正可否に関する問合せを送信する手段と、
前記問合せに対する回答を受信する手段と
をさらに備え、前記修正データに基づいて前記発言データを修正することは、
前記回答が修正可能であることを示す場合に実行される
ことを特徴とする。
Claims (8)
- ビデオ会議の共有データを出力する複数のビデオ会議端末、前記ビデオ会議の出席者が個々に持つ複数のコンピュータ端末、および音声認識サーバコンピュータ装置を少なくとも備えたビデオ会議システムにおいて、会議音声など任意の発言を入力音声データとして音声認識し、前記出席者に音声認識した前記発言を修正させる前記装置であって、前記装置は、
前記ビデオ会議端末から多地点接続装置(MCU)を介して第1の入力音声データを受信する手段と、
前記第1の入力音声データに対して音声認識し、発言テキストを含む発言データを作成する手段と、
前記発言データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信する手段と、
前記コンピュータ端末から前記発言データに対する修正データを受信する手段と、
前記修正データに基づいて前記発言データを修正する手段と、
前記発言データの修正データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信する手段と
を備えたことを特徴とする装置。 - 前記装置は、
前記コンピュータ端末から第2の入力音声データを受信する手段と
前記第1の入力音声データと前記第2の入力音声データとを照合する手段と、
前記第1の入力音声データと前記第2の入力音声データとの照合により両音声データが対応する場合、前記第2の入力音声データに基づいて、前記発言の発話者を特定する手段と
をさらに備えたことを特徴とする請求項1に記載の装置。 - 前記修正データを送信した前記コンピュータ端末に基づく修正者と前記発話者とが同一であるか否かを判定する手段と、
前記修正者と前記発話者とが同一であるか否かの判定の結果、前記発話者と前記修正者が同一でない場合に、前記発話者の用いる前記コンピュータ端末に前記修正データに基づく修正可否に関する問合せを送信する手段と、
前記問合せに対する回答を受信する手段と
をさらに備え、
前記発言データを修正することは、前記修正者と前記発話者とが同一であるか否かの判定により前記修正者と前記発話者とが同一であると判定された場合、または前記回答が修正可能であることを示す場合に実行される
ことを特徴とする請求項2に記載の装置。 - 1つの前記ビデオ会議端末と複数の前記コンピュータ端末とが同一の地点に存在することを特徴とする請求項1乃至3のうちのいずれかに記載の装置。
- 前記装置は、
予め登録された、前記ビデオ会議端末および前記コンピュータ端末ごとの使用言語データに基づいて前記第1の入力音声データおよび前記第2の入力音声データの使用言語を特定する手段と、
前記特定された使用言語に基づいて、前記ビデオ会議端末および前記コンピュータ端末に送信するために、前記ビデオ会議端末および前記コンピュータ端末ごとに前記発言データを翻訳し、前記発言テキストを翻訳した翻訳テキストを作成する手段と、
前記特定された使用言語に基づいて、前記ビデオ会議端末および前記コンピュータ端末に送信すべき前記する前記翻訳テキストを選択する手段と
をさらに備えたことを特徴とする請求項1乃至4のうちのいずれかに記載の装置。 - ビデオ会議の共有データを出力する複数のビデオ会議端末、前記ビデオ会議の出席者が個々に持つ複数のコンピュータ端末、および音声認識サーバコンピュータ装置を少なくとも備えたビデオ会議システムにおいて、会議音声など任意の発言を入力音声データとして音声認識し、前記出席者に音声認識した前記発言を修正させる方法であって、前記方法は、
前記ビデオ会議端末から多地点接続装置(MCU)を介して第1の入力音声データを受信するステップと、
前記第1の入力音声データに対して音声認識し、発言テキストを含む発言データを作成するステップと、
前記発言データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信するステップと、
前記コンピュータ端末から前記発言データに対する修正データを受信するステップと、
前記修正データに基づいて前記発言データを修正するステップと、
前記発言データの修正データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信するステップと
を備えたことを特徴とする方法。 - ビデオ会議の共有データを出力する複数のビデオ会議端末、前記ビデオ会議の出席者が個々に持つ複数のコンピュータ端末、および音声認識サーバコンピュータ装置を少なくとも備えたビデオ会議システムにおいて、会議音声など任意の発言を入力音声データとして音声認識し、前記出席者に音声認識した前記発言を修正させる方法をコンピュータに実行させるプログラムであって、前記プログラムは、前記コンピュータによって実行されると、前記コンピュータに、
前記ビデオ会議端末から多地点接続装置(MCU)を介して第1の入力音声データを受信させ、
前記第1の入力音声データに対して音声認識し、発言テキストを含む発言データを作成させ、
前記発言データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信させ、
前記コンピュータ端末から前記発言データに対する修正データを受信させ、
前記修正データに基づいて前記発言データを修正させ、
前記発言データの修正データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信させる
ことを特徴とするプログラム。 - ビデオ会議の共有データを出力する複数のビデオ会議端末、前記ビデオ会議の出席者が個々に持つ複数のコンピュータ端末、および音声認識サーバコンピュータ装置を少なくとも備えたビデオ会議システムにおいて、会議音声など任意の発言を入力音声データとして音声認識し、前記出席者に音声認識した前記発言を修正させる方法をコンピュータに実行させるコンピュータ実行可能命令を記憶したコンピュータ可読記憶媒体、前記方法は、
前記ビデオ会議端末から多地点接続装置(MCU)を介して第1の入力音声データを受信するステップと、
前記第1の入力音声データに対して音声認識し、発言テキストを含む発言データを作成するステップと、
前記発言データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信するステップと、
前記コンピュータ端末から前記発言データに対する修正データを受信するステップと、
前記修正データに基づいて前記発言データを修正するステップと、
前記発言データの修正データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信するステップと
を備えたことを特徴とするコンピュータ可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015070342A JP6507010B2 (ja) | 2015-03-30 | 2015-03-30 | ビデオ会議システムと音声認識技術を組み合わせた装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015070342A JP6507010B2 (ja) | 2015-03-30 | 2015-03-30 | ビデオ会議システムと音声認識技術を組み合わせた装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016192599A true JP2016192599A (ja) | 2016-11-10 |
JP6507010B2 JP6507010B2 (ja) | 2019-04-24 |
Family
ID=57245843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015070342A Active JP6507010B2 (ja) | 2015-03-30 | 2015-03-30 | ビデオ会議システムと音声認識技術を組み合わせた装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6507010B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106604125A (zh) * | 2016-12-29 | 2017-04-26 | 北京奇艺世纪科技有限公司 | 一种视频字幕的确定方法及装置 |
WO2019044520A1 (ja) * | 2017-08-31 | 2019-03-07 | ヤマハ株式会社 | 情報提供方法および情報提供装置 |
CN111435981A (zh) * | 2019-01-11 | 2020-07-21 | 华为技术有限公司 | 通话处理方法及装置 |
CN113591491A (zh) * | 2020-04-30 | 2021-11-02 | 阿里巴巴集团控股有限公司 | 语音翻译文本校正系统、方法、装置及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004080486A (ja) * | 2002-08-20 | 2004-03-11 | Toppan Printing Co Ltd | 議事録作成システム、議事録データ作成方法、議事録データ作成プログラム |
JP2005295015A (ja) * | 2004-03-31 | 2005-10-20 | Hitachi Kokusai Electric Inc | 映像会議システム |
JP2006050500A (ja) * | 2004-08-09 | 2006-02-16 | Jfe Systems Inc | 会議支援システム |
JP2008139969A (ja) * | 2006-11-30 | 2008-06-19 | Fuji Xerox Co Ltd | 議事録作成装置、会議情報管理システム及びプログラム |
JP2011125006A (ja) * | 2009-12-08 | 2011-06-23 | Internatl Business Mach Corp <Ibm> | n−Way選択的言語処理を用いたリアルタイムVoIPコミュニケーションのためのシステムおよび方法 |
JP2011209731A (ja) * | 2010-03-30 | 2011-10-20 | Polycom Inc | ビデオ会議に翻訳を追加するための方法及びシステム |
-
2015
- 2015-03-30 JP JP2015070342A patent/JP6507010B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004080486A (ja) * | 2002-08-20 | 2004-03-11 | Toppan Printing Co Ltd | 議事録作成システム、議事録データ作成方法、議事録データ作成プログラム |
JP2005295015A (ja) * | 2004-03-31 | 2005-10-20 | Hitachi Kokusai Electric Inc | 映像会議システム |
JP2006050500A (ja) * | 2004-08-09 | 2006-02-16 | Jfe Systems Inc | 会議支援システム |
JP2008139969A (ja) * | 2006-11-30 | 2008-06-19 | Fuji Xerox Co Ltd | 議事録作成装置、会議情報管理システム及びプログラム |
JP2011125006A (ja) * | 2009-12-08 | 2011-06-23 | Internatl Business Mach Corp <Ibm> | n−Way選択的言語処理を用いたリアルタイムVoIPコミュニケーションのためのシステムおよび方法 |
JP2011209731A (ja) * | 2010-03-30 | 2011-10-20 | Polycom Inc | ビデオ会議に翻訳を追加するための方法及びシステム |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106604125A (zh) * | 2016-12-29 | 2017-04-26 | 北京奇艺世纪科技有限公司 | 一种视频字幕的确定方法及装置 |
CN106604125B (zh) * | 2016-12-29 | 2019-06-14 | 北京奇艺世纪科技有限公司 | 一种视频字幕的确定方法及装置 |
WO2019044520A1 (ja) * | 2017-08-31 | 2019-03-07 | ヤマハ株式会社 | 情報提供方法および情報提供装置 |
JPWO2019044520A1 (ja) * | 2017-08-31 | 2019-11-07 | ヤマハ株式会社 | 情報提供方法および情報提供装置 |
CN111033461A (zh) * | 2017-08-31 | 2020-04-17 | 雅马哈株式会社 | 信息提供方法及信息提供装置 |
US11790913B2 (en) | 2017-08-31 | 2023-10-17 | Yamaha Corporation | Information providing method, apparatus, and storage medium, that transmit related information to a remote terminal based on identification information received from the remote terminal |
CN111435981A (zh) * | 2019-01-11 | 2020-07-21 | 华为技术有限公司 | 通话处理方法及装置 |
CN111435981B (zh) * | 2019-01-11 | 2021-06-08 | 华为技术有限公司 | 通话处理方法及装置 |
CN113591491A (zh) * | 2020-04-30 | 2021-11-02 | 阿里巴巴集团控股有限公司 | 语音翻译文本校正系统、方法、装置及设备 |
CN113591491B (zh) * | 2020-04-30 | 2023-12-26 | 阿里巴巴集团控股有限公司 | 语音翻译文本校正系统、方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6507010B2 (ja) | 2019-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4423327B2 (ja) | 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体 | |
JP4466665B2 (ja) | 議事録作成方法、その装置及びそのプログラム | |
US11776541B2 (en) | Communicating announcements | |
WO2015096564A1 (zh) | 一种在线语音翻译方法和装置 | |
US10170122B2 (en) | Speech recognition method, electronic device and speech recognition system | |
JP6507010B2 (ja) | ビデオ会議システムと音声認識技術を組み合わせた装置および方法 | |
EP3779971A1 (en) | Method for recording and outputting conversation between multiple parties using voice recognition technology, and device therefor | |
JP2008225191A (ja) | 議事録作成方法、その装置及びそのプログラム | |
US10535337B2 (en) | Method for correcting false recognition contained in recognition result of speech of user | |
JP6597527B2 (ja) | 音声認識装置および音声認識方法 | |
US20140358543A1 (en) | Linked-work assistance apparatus, method and program | |
US11978443B2 (en) | Conversation assistance device, conversation assistance method, and program | |
JP3141833B2 (ja) | ネットワークアクセスシステム | |
JP5030868B2 (ja) | 会議音声録音システム | |
WO2018043137A1 (ja) | 情報処理装置及び情報処理方法 | |
JP2018045001A (ja) | 音声認識システム、情報処理装置、プログラム、音声認識方法 | |
JP2016006607A (ja) | 対話型通信システム、端末装置およびプログラム | |
JP2018174439A (ja) | 会議支援システム、会議支援方法、会議支援装置のプログラム、および端末のプログラム | |
JP2007241130A (ja) | 声紋認識を利用するシステムと装置 | |
JP2007140048A (ja) | 音声認識システム | |
JP2010109898A (ja) | 撮影制御装置、撮影制御方法及びプログラム | |
JP7058588B2 (ja) | 会話システムおよび会話プログラム | |
US20180211661A1 (en) | Speech recognition apparatus with cancellation period | |
JP2005283972A (ja) | 音声認識方法及びこの音声認識方法を利用した情報提示方法と情報提示装置 | |
US20230066829A1 (en) | Server device, conference assistance system, and conference assistance method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6507010 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |