JP6507010B2 - ビデオ会議システムと音声認識技術を組み合わせた装置および方法 - Google Patents
ビデオ会議システムと音声認識技術を組み合わせた装置および方法 Download PDFInfo
- Publication number
- JP6507010B2 JP6507010B2 JP2015070342A JP2015070342A JP6507010B2 JP 6507010 B2 JP6507010 B2 JP 6507010B2 JP 2015070342 A JP2015070342 A JP 2015070342A JP 2015070342 A JP2015070342 A JP 2015070342A JP 6507010 B2 JP6507010 B2 JP 6507010B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- speech
- video conference
- terminal
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 29
- 238000005516 engineering process Methods 0.000 title description 3
- 238000012937 correction Methods 0.000 claims description 84
- 238000013519 translation Methods 0.000 claims description 19
- 230000005540 biological transmission Effects 0.000 claims description 9
- 238000013500 data storage Methods 0.000 description 34
- 230000008569 process Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Description
前記ビデオ会議端末から第1の入力音声データを受信する手段と、
前記入力音声データに基づいて発言データを作成する手段と、
前記発言データを前記ビデオ会議端末および前記コンピュータ端末に送信する手段と、
前記コンピュータ端末から前記発言データに対する修正データを受信する手段と、
前記修正データに基づいて前記発言データを修正する手段と、
前記発言データの修正データを前記ビデオ会議端末および前記コンピュータ端末に送信する手段と
を備えたことを特徴とする。
前記コンピュータ端末から第2の入力音声データを受信する手段と
前記第1の入力音声データと前記第2の入力音声データとを照合する手段と、
前記第1の入力音声データと前記第2の入力音声データとの照合により両音声データが対応する場合、前記両音声データに基づいて、前記発言の発話者を特定する手段と
をさらに備えたことを特徴とする。
前記発話者と、前記修正データに係る修正者とが同一であるか否かを判定し、
前記発話者と前記修正者とが同一である場合に実行され、
前記装置は、
前記発話者と前記修正者とが異なる場合、前記発話者が用いる前記コンピュータ端末に修正可否に関する問合せを送信する手段と、
前記問合せに対する回答を受信する手段と
をさらに備え、前記修正データに基づいて前記発言データを修正することは、
前記回答が修正可能であることを示す場合に実行される
ことを特徴とする。
Claims (8)
- ビデオ会議の共有データを出力する複数のビデオ会議端末、前記ビデオ会議の出席者が個々に持つ複数のコンピュータ端末、および音声認識サーバコンピュータ装置を少なくとも備えたビデオ会議システムにおいて、会議音声を含む任意の発言を入力音声データとして音声認識し、前記出席者に音声認識した前記発言を修正させる前記装置であって、前記装置は、
前記ビデオ会議端末から多地点接続装置(MCU)を介して第1の入力音声データを受信する手段と、
前記第1の入力音声データに対して音声認識し、発言テキストを含む発言データを作成する手段と、
前記発言データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信する手段と、
前記コンピュータ端末から前記発言データに対する修正データを受信する手段と、
前記修正データに基づいて前記発言データを修正する手段と、
前記発言データの修正データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信する手段と
を備えたことを特徴とする装置。 - 前記装置は、
前記コンピュータ端末から第2の入力音声データを受信する手段と
前記第1の入力音声データと前記第2の入力音声データとを照合する手段と、
前記第1の入力音声データと前記第2の入力音声データとの照合により両音声データが対応する場合、前記第2の入力音声データに基づいて、前記発言の発話者を特定する手段と
をさらに備えたことを特徴とする請求項1に記載の装置。 - 前記修正データを送信した前記コンピュータ端末に基づく修正者と前記発話者とが同一であるか否かを判定する手段と、
前記修正者と前記発話者とが同一であるか否かの判定の結果、前記発話者と前記修正者が同一でない場合に、前記発話者の用いる前記コンピュータ端末に前記修正データに基づく修正可否に関する問合せを送信する手段と、
前記問合せに対する回答を受信する手段と
をさらに備え、
前記発言データを修正することは、前記修正者と前記発話者とが同一であるか否かの判定により前記修正者と前記発話者とが同一であると判定された場合、または前記回答が修正可能であることを示す場合に実行される
ことを特徴とする請求項2に記載の装置。 - 1つの前記ビデオ会議端末と複数の前記コンピュータ端末とが同一の地点に存在することを特徴とする請求項1乃至3のうちのいずれか一項に記載の装置。
- 前記装置は、
予め登録された、前記ビデオ会議端末および前記コンピュータ端末ごとの使用言語データに基づいて前記第1の入力音声データの使用言語を特定する手段と、
前記特定された使用言語に基づいて、前記ビデオ会議端末および前記コンピュータ端末に送信するために、前記ビデオ会議端末および前記コンピュータ端末ごとに前記発言データを翻訳し、前記発言テキストを翻訳した翻訳テキストを作成する手段と、
前記特定された使用言語に基づいて、前記ビデオ会議端末および前記コンピュータ端末に送信すべき前記翻訳テキストを選択する手段と
をさらに備えたことを特徴とする請求項1乃至4のうちのいずれか一項に記載の装置。 - ビデオ会議の共有データを出力する複数のビデオ会議端末、前記ビデオ会議の出席者が個々に持つ複数のコンピュータ端末、および音声認識サーバコンピュータ装置を少なくとも備えたビデオ会議システムにおいて、会議音声を含む任意の発言を入力音声データとして音声認識し、前記出席者に音声認識した前記発言を修正させる方法であって、前記方法は、
前記ビデオ会議端末から多地点接続装置(MCU)を介して第1の入力音声データを受信するステップと、
前記第1の入力音声データに対して音声認識し、発言テキストを含む発言データを作成するステップと、
前記発言データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信するステップと、
前記コンピュータ端末から前記発言データに対する修正データを受信するステップと、
前記修正データに基づいて前記発言データを修正するステップと、
前記発言データの修正データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信するステップと
を備えたことを特徴とする方法。 - ビデオ会議の共有データを出力する複数のビデオ会議端末、前記ビデオ会議の出席者が個々に持つ複数のコンピュータ端末、および音声認識サーバコンピュータ装置を少なくとも備えたビデオ会議システムにおいて、会議音声を含む任意の発言を入力音声データとして音声認識し、前記出席者に音声認識した前記発言を修正させる方法をコンピュータに実行させるプログラムであって、前記プログラムは、前記コンピュータによって実行されると、前記コンピュータに、
前記ビデオ会議端末から多地点接続装置(MCU)を介して第1の入力音声データを受信させ、
前記第1の入力音声データに対して音声認識し、発言テキストを含む発言データを作成させ、
前記発言データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信させ、
前記コンピュータ端末から前記発言データに対する修正データを受信させ、
前記修正データに基づいて前記発言データを修正させ、
前記発言データの修正データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信させる
ことを特徴とするプログラム。 - ビデオ会議の共有データを出力する複数のビデオ会議端末、前記ビデオ会議の出席者が個々に持つ複数のコンピュータ端末、および音声認識サーバコンピュータ装置を少なくとも備えたビデオ会議システムにおいて、会議音声を含む任意の発言を入力音声データとして音声認識し、前記出席者に音声認識した前記発言を修正させる方法をコンピュータに実行させるコンピュータ実行可能命令を記憶したコンピュータ可読記憶媒体であって、前記方法は、
前記ビデオ会議端末から多地点接続装置(MCU)を介して第1の入力音声データを受信するステップと、
前記第1の入力音声データに対して音声認識し、発言テキストを含む発言データを作成するステップと、
前記発言データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信するステップと、
前記コンピュータ端末から前記発言データに対する修正データを受信するステップと、
前記修正データに基づいて前記発言データを修正するステップと、
前記発言データの修正データを前記コンピュータ端末に、および前記MCUを介して前記ビデオ会議端末に送信するステップと
を備えたことを特徴とするコンピュータ可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015070342A JP6507010B2 (ja) | 2015-03-30 | 2015-03-30 | ビデオ会議システムと音声認識技術を組み合わせた装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015070342A JP6507010B2 (ja) | 2015-03-30 | 2015-03-30 | ビデオ会議システムと音声認識技術を組み合わせた装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016192599A JP2016192599A (ja) | 2016-11-10 |
JP6507010B2 true JP6507010B2 (ja) | 2019-04-24 |
Family
ID=57245843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015070342A Active JP6507010B2 (ja) | 2015-03-30 | 2015-03-30 | ビデオ会議システムと音声認識技術を組み合わせた装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6507010B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106604125B (zh) * | 2016-12-29 | 2019-06-14 | 北京奇艺世纪科技有限公司 | 一种视频字幕的确定方法及装置 |
JP6614395B2 (ja) * | 2017-08-31 | 2019-12-04 | ヤマハ株式会社 | 情報提供方法および情報提供装置 |
CN111435981B (zh) * | 2019-01-11 | 2021-06-08 | 华为技术有限公司 | 通话处理方法及装置 |
CN113591491B (zh) * | 2020-04-30 | 2023-12-26 | 阿里巴巴集团控股有限公司 | 语音翻译文本校正系统、方法、装置及设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004080486A (ja) * | 2002-08-20 | 2004-03-11 | Toppan Printing Co Ltd | 議事録作成システム、議事録データ作成方法、議事録データ作成プログラム |
JP2005295015A (ja) * | 2004-03-31 | 2005-10-20 | Hitachi Kokusai Electric Inc | 映像会議システム |
JP2006050500A (ja) * | 2004-08-09 | 2006-02-16 | Jfe Systems Inc | 会議支援システム |
JP5003125B2 (ja) * | 2006-11-30 | 2012-08-15 | 富士ゼロックス株式会社 | 議事録作成装置及びプログラム |
US8279861B2 (en) * | 2009-12-08 | 2012-10-02 | International Business Machines Corporation | Real-time VoIP communications using n-Way selective language processing |
US20110246172A1 (en) * | 2010-03-30 | 2011-10-06 | Polycom, Inc. | Method and System for Adding Translation in a Videoconference |
-
2015
- 2015-03-30 JP JP2015070342A patent/JP6507010B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016192599A (ja) | 2016-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4466666B2 (ja) | 議事録作成方法、その装置及びそのプログラム | |
US8676577B2 (en) | Use of metadata to post process speech recognition output | |
US7899670B1 (en) | Server-based speech recognition | |
JP6507010B2 (ja) | ビデオ会議システムと音声認識技術を組み合わせた装置および方法 | |
KR102141116B1 (ko) | 음성 대화 서비스를 지원하는 인터페이스 장치 및 방법 | |
US11776541B2 (en) | Communicating announcements | |
US10170122B2 (en) | Speech recognition method, electronic device and speech recognition system | |
JP2008225068A (ja) | 議事録作成方法、その装置及びそのプログラム | |
JP2018045001A (ja) | 音声認識システム、情報処理装置、プログラム、音声認識方法 | |
US20220343914A1 (en) | Method and system of generating and transmitting a transcript of verbal communication | |
US20180068659A1 (en) | Voice recognition device and voice recognition method | |
JP3141833B2 (ja) | ネットワークアクセスシステム | |
US20140358543A1 (en) | Linked-work assistance apparatus, method and program | |
JP5030868B2 (ja) | 会議音声録音システム | |
US20180286388A1 (en) | Conference support system, conference support method, program for conference support device, and program for terminal | |
JP2017120616A (ja) | 機械翻訳方法、及び、機械翻訳システム | |
JP2020507165A (ja) | データ可視化のための情報処理方法及び装置 | |
JP2010109898A (ja) | 撮影制御装置、撮影制御方法及びプログラム | |
JP2019215449A (ja) | 会話補助装置、会話補助方法及びプログラム | |
WO2018020828A1 (ja) | 翻訳装置および翻訳システム | |
WO2016129188A1 (ja) | 音声認識処理装置、音声認識処理方法およびプログラム | |
JPWO2018043137A1 (ja) | 情報処理装置及び情報処理方法 | |
JP2013178384A (ja) | 音声認識用辞書登録システム、音声認識システム、音声認識サービスシステム、方法およびプログラム | |
JP7058052B2 (ja) | コンピュータシステム、画面共有方法及びプログラム | |
JP2017134162A (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6507010 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |