JP2018106148A - 多重話者音声認識修正システム - Google Patents
多重話者音声認識修正システム Download PDFInfo
- Publication number
- JP2018106148A JP2018106148A JP2017225548A JP2017225548A JP2018106148A JP 2018106148 A JP2018106148 A JP 2018106148A JP 2017225548 A JP2017225548 A JP 2017225548A JP 2017225548 A JP2017225548 A JP 2017225548A JP 2018106148 A JP2018106148 A JP 2018106148A
- Authority
- JP
- Japan
- Prior art keywords
- text
- speaker
- voice
- unit
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012937 correction Methods 0.000 title claims abstract description 104
- 238000001514 detection method Methods 0.000 claims abstract description 25
- 238000012795 verification Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 abstract description 14
- 230000005236 sound signal Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000007689 inspection Methods 0.000 description 5
- 229920001621 AMOLED Polymers 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 241000277269 Oncorhynchus masou Species 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/685—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L21/10—Transforming into visible information
- G10L21/12—Transforming into visible information by displaying time domain information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L2013/083—Special characters, e.g. punctuation marks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Library & Information Science (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- User Interface Of Digital Computer (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
10 入力部
20 表示部
21 第1表示窓
22 第2表示窓
23 第3表示窓
24 第4表示窓
25 第5表示窓
26 第6表示窓
30 保存部
40 音声再生部
50 通信部
60 制御部
100 音声信号検出部
200 音声認識部
300 テキスト修正部
400 音声合成部
500 検収部
600 多重話者音声認識修正システム
Claims (4)
- 複数の話者の各々が具備する複数のマイクロからそれぞれ音声信号が入力されると、前記音声信号が入力される時点から入力が中止される時点までのそれぞれの音声セッションを検出する音声信号検出部と;
前記音声信号検出部から時間情報およびマイク識別情報を含むそれぞれの音声セッションを伝達されて、それぞれのテキストに変換する音声認識部と;
前記音声信号検出部から前記音声セッションを伝達されて、前記音声信号が入力される時点の順に合成する音声合成部と;
前記音声認識部から音声認識されたそれぞれのテキストを伝達され、前記マイク識別情報を変更するための話者情報を入力され、前記音声信号が入力される時点の順に前記話者情報と音声認識されたテキストを羅列して表示し、前記複数の話者を撮影した映像を出力し、前記映像に各々の話者を識別し得る話者タグを表示し、前記音声合成部から合成された音声を前記音声認識されたテキストと共に出力し、音声認識されたテキストの修正のための情報を入力されるテキスト修正部と;を含み、
前記テキスト修正部は、前記音声認識されたテキストをリアルタイム表示しつつ、表示されるテキストの話者情報とマッチングされる話者タグを識別するように強調するリアルタイム入力モードと、前記リアルタイム入力モードで音声認識されたテキストの修正のための情報が入力されると、修正されるテキストの話者情報とマッチングされる話者タグを識別するように強調する修正モードと、各話者タグに対して選択信号が入力されると、選択された話者タグとマッチングされる話者に対する音声セッションを時間帯別に音声認識したテキストまたは音声を出力する話者別プレイモードとを含み、
前記テキスト修正部は、前記音声認識されたテキストの修正のための情報を入力されると、テキストの表示を一時停止し、修正を完了した後、既定の時間だけ以前に戻ってテキスト表示を再開し、
前記テキスト修正部は、各マイク識別情報に該当する方言、外来語、感動詞または嘆詞を含む話者の特徴情報を前記音声認識部にあらかじめ伝達し、
前記音声認識部は、前記テキスト修正部から伝達された前記特徴情報を反映して、前記方言を標準語に変換したり、外来語を固有語に変換したり、話者の固有習慣である感動詞または嘆詞を削除して前記テキスト修正部に伝達することを特徴とする多重話者音声認識修正システム。 - 前記テキスト修正部は、前記音声認識部から伝達されたテキストに対して語尾の有無を判断して文章記号を表示することを特徴とする請求項1に記載の多重話者音声認識修正システム。
- 前記複数の話者の各々に音声認識部から音声認識された結果と前記テキスト修正部から修正された結果を表示する検収部;
をさらに含むことを特徴とする請求項1に記載の多重話者音声認識修正システム。 - 前記検収部は、修正のための情報を入力されたり、検収完了信号を入力されて、前記テキスト修正部に伝達することを特徴とする請求項3に記載の多重話者音声認識修正システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20160168758 | 2016-12-12 | ||
KR1020160176567A KR101818980B1 (ko) | 2016-12-12 | 2016-12-22 | 다중 화자 음성 인식 수정 시스템 |
KR10-2016-0176567 | 2016-12-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018106148A true JP2018106148A (ja) | 2018-07-05 |
JP6463825B2 JP6463825B2 (ja) | 2019-02-06 |
Family
ID=61066712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017225548A Expired - Fee Related JP6463825B2 (ja) | 2016-12-12 | 2017-11-24 | 多重話者音声認識修正システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10276164B2 (ja) |
JP (1) | JP6463825B2 (ja) |
KR (1) | KR101818980B1 (ja) |
CN (1) | CN108231065A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020184007A (ja) * | 2019-05-07 | 2020-11-12 | 株式会社チェンジ | 情報処理装置、音声テキスト化システム、音声テキスト化方法および音声テキスト化プログラム |
JP2020201909A (ja) * | 2019-06-13 | 2020-12-17 | 株式会社リコー | 表示端末、共用システム、表示制御方法およびプログラム |
US11651779B2 (en) | 2020-05-08 | 2023-05-16 | Sharp Kabushiki Kaisha | Voice processing system, voice processing method, and storage medium storing voice processing program |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10319364B2 (en) | 2017-05-18 | 2019-06-11 | Telepathy Labs, Inc. | Artificial intelligence-based text-to-speech system and method |
US10923121B2 (en) * | 2017-08-11 | 2021-02-16 | SlackTechnologies, Inc. | Method, apparatus, and computer program product for searchable real-time transcribed audio and visual content within a group-based communication system |
US10567515B1 (en) * | 2017-10-26 | 2020-02-18 | Amazon Technologies, Inc. | Speech processing performed with respect to first and second user profiles in a dialog session |
KR102460491B1 (ko) * | 2017-12-06 | 2022-10-31 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
KR102076565B1 (ko) * | 2018-10-11 | 2020-02-12 | 주식회사 한글과컴퓨터 | 화자 식별 노이즈의 삽입을 통해 발화자의 식별이 가능하게 하는 음성 처리 장치 및 그 동작 방법 |
CN109600299B (zh) * | 2018-11-19 | 2021-06-25 | 维沃移动通信有限公司 | 一种消息发送方法及终端 |
EP3940695A4 (en) * | 2019-03-15 | 2022-03-30 | Fujitsu Limited | EDITING SUPPORT PROGRAM, EDITING SUPPORT METHOD AND EDITING SUPPORT DEVICE |
KR102061291B1 (ko) * | 2019-04-25 | 2019-12-31 | 이봉규 | 5g 통신 기반 스마트 회의 시스템 및 로보틱 처리 자동화를 통한 회의 지원 방법 |
KR102147811B1 (ko) | 2020-01-14 | 2020-08-25 | 김승모 | 회의장 발언자 음성인식 및 문자정보변환시스템 |
CN111161711B (zh) * | 2020-04-01 | 2020-07-03 | 支付宝(杭州)信息技术有限公司 | 对流式语音识别文本进行断句的方法及装置 |
EP3951775A4 (en) * | 2020-06-16 | 2022-08-10 | Minds Lab Inc. | PROCEDURE FOR GENERATION OF SPEAKER MARKED TEXT |
CN112164396A (zh) * | 2020-09-28 | 2021-01-01 | 北京百度网讯科技有限公司 | 语音控制方法、装置、电子设备及存储介质 |
CN112201275B (zh) * | 2020-10-09 | 2024-05-07 | 深圳前海微众银行股份有限公司 | 声纹分割方法、装置、设备及可读存储介质 |
US11830496B2 (en) * | 2020-12-01 | 2023-11-28 | Microsoft Technology Licensing, Llc | Generating and providing inclusivity data insights for evaluating participants in a communication |
CN113413613B (zh) * | 2021-06-17 | 2024-06-25 | 网易(杭州)网络有限公司 | 一种游戏内语音聊天的优化方法、装置、电子设备及介质 |
US11763242B2 (en) * | 2021-12-09 | 2023-09-19 | Z21 Labs, Inc. | Automatic evaluation of recorded interactions |
US20230351123A1 (en) * | 2022-04-29 | 2023-11-02 | Zoom Video Communications, Inc. | Providing multistream machine translation during virtual conferences |
CN115376490A (zh) * | 2022-08-19 | 2022-11-22 | 北京字跳网络技术有限公司 | 一种语音识别方法、装置及电子设备 |
CN115662437B (zh) * | 2022-12-28 | 2023-04-18 | 广东保伦电子股份有限公司 | 一种多话筒同时使用场景下的语音转写方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000352995A (ja) * | 1999-06-14 | 2000-12-19 | Canon Inc | 会議音声処理方法および記録装置、情報記憶媒体 |
JP2005165066A (ja) * | 2003-12-03 | 2005-06-23 | Internatl Business Mach Corp <Ibm> | 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム |
JP2005164656A (ja) * | 2003-11-28 | 2005-06-23 | Mitsubishi Electric Corp | 音声認識装置及び音声認識プログラム |
JP2005202014A (ja) * | 2004-01-14 | 2005-07-28 | Sony Corp | 音声信号処理装置、音声信号処理方法および音声信号処理プログラム |
JP2006301223A (ja) * | 2005-04-20 | 2006-11-02 | Ascii Solutions Inc | 音声認識システム及び音声認識プログラム |
JP2009288567A (ja) * | 2008-05-29 | 2009-12-10 | Ricoh Co Ltd | 議事録作成装置、議事録作成方法、議事録作成プログラム、議事録作成システム |
JP2010060850A (ja) * | 2008-09-04 | 2010-03-18 | Nec Corp | 議事録作成支援装置、議事録作成支援方法、議事録作成支援用プログラム及び議事録作成支援システム |
JP2013073323A (ja) * | 2011-09-27 | 2013-04-22 | Nec Commun Syst Ltd | 会議データの統合管理方法および装置 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5636325A (en) * | 1992-11-13 | 1997-06-03 | International Business Machines Corporation | Speech synthesis and analysis of dialects |
US5897616A (en) * | 1997-06-11 | 1999-04-27 | International Business Machines Corporation | Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases |
US5913196A (en) * | 1997-11-17 | 1999-06-15 | Talmor; Rita | System and method for establishing identity of a speaker |
US6064963A (en) * | 1997-12-17 | 2000-05-16 | Opus Telecom, L.L.C. | Automatic key word or phrase speech recognition for the corrections industry |
US6477491B1 (en) * | 1999-05-27 | 2002-11-05 | Mark Chandler | System and method for providing speaker-specific records of statements of speakers |
US7236931B2 (en) * | 2002-05-01 | 2007-06-26 | Usb Ag, Stamford Branch | Systems and methods for automatic acoustic speaker adaptation in computer-assisted transcription systems |
US7292975B2 (en) * | 2002-05-01 | 2007-11-06 | Nuance Communications, Inc. | Systems and methods for evaluating speaker suitability for automatic speech recognition aided transcription |
EP1889255A1 (en) * | 2005-05-24 | 2008-02-20 | Loquendo S.p.A. | Automatic text-independent, language-independent speaker voice-print creation and speaker recognition |
US9300790B2 (en) * | 2005-06-24 | 2016-03-29 | Securus Technologies, Inc. | Multi-party conversation analyzer and logger |
US7693717B2 (en) * | 2006-04-12 | 2010-04-06 | Custom Speech Usa, Inc. | Session file modification with annotation using speech recognition or text to speech |
KR101328928B1 (ko) | 2006-10-26 | 2013-11-14 | 엘지전자 주식회사 | 이동통신 단말기의 회의록 작성 방법 |
JP5030868B2 (ja) * | 2008-06-10 | 2012-09-19 | 株式会社日立製作所 | 会議音声録音システム |
US8566088B2 (en) | 2008-11-12 | 2013-10-22 | Scti Holdings, Inc. | System and method for automatic speech to text conversion |
JP5533854B2 (ja) * | 2009-03-31 | 2014-06-25 | 日本電気株式会社 | 音声認識処理システム、および音声認識処理方法 |
US8209174B2 (en) * | 2009-04-17 | 2012-06-26 | Saudi Arabian Oil Company | Speaker verification system |
US9043474B2 (en) * | 2010-01-20 | 2015-05-26 | Microsoft Technology Licensing, Llc | Communication sessions among devices and interfaces with mixed capabilities |
US8849666B2 (en) * | 2012-02-23 | 2014-09-30 | International Business Machines Corporation | Conference call service with speech processing for heavily accented speakers |
GB2502944A (en) * | 2012-03-30 | 2013-12-18 | Jpal Ltd | Segmentation and transcription of speech |
KR101939253B1 (ko) * | 2012-05-21 | 2019-01-16 | 엘지전자 주식회사 | 음성 녹음 중에 탐색을 용이하게 하는 방법 및 이를 구현한 전자기기 |
KR20140077514A (ko) | 2012-12-14 | 2014-06-24 | 박종봉 | 회의록 관리장치 |
JP6327848B2 (ja) * | 2013-12-20 | 2018-05-23 | 株式会社東芝 | コミュニケーション支援装置、コミュニケーション支援方法およびプログラム |
KR20150089168A (ko) | 2014-01-27 | 2015-08-05 | 최재용 | 인공지능을 활용한 언어분석 방법 및 시스템 |
JP6242773B2 (ja) * | 2014-09-16 | 2017-12-06 | 株式会社東芝 | 会議情報蓄積装置、方法およびプログラム |
KR20160035884A (ko) | 2014-09-24 | 2016-04-01 | 삼성전자주식회사 | 회의 진행 장치 및 회의 진행 방법 |
CN105632498A (zh) * | 2014-10-31 | 2016-06-01 | 株式会社东芝 | 生成会议记录的方法、装置和系统 |
CN105810207A (zh) * | 2014-12-30 | 2016-07-27 | 富泰华工业(深圳)有限公司 | 会议记录装置及其自动生成会议记录的方法 |
KR20160108874A (ko) | 2015-03-09 | 2016-09-21 | 주식회사셀바스에이아이 | 대화록 자동 생성 방법 및 장치 |
CN105429851B (zh) * | 2015-11-10 | 2018-08-21 | 河海大学 | 一种基于即时通信的多人协同录音系统及识别方法 |
-
2016
- 2016-12-22 KR KR1020160176567A patent/KR101818980B1/ko active IP Right Grant
-
2017
- 2017-11-24 JP JP2017225548A patent/JP6463825B2/ja not_active Expired - Fee Related
- 2017-11-28 US US15/823,937 patent/US10276164B2/en active Active
- 2017-12-11 CN CN201711307751.8A patent/CN108231065A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000352995A (ja) * | 1999-06-14 | 2000-12-19 | Canon Inc | 会議音声処理方法および記録装置、情報記憶媒体 |
JP2005164656A (ja) * | 2003-11-28 | 2005-06-23 | Mitsubishi Electric Corp | 音声認識装置及び音声認識プログラム |
JP2005165066A (ja) * | 2003-12-03 | 2005-06-23 | Internatl Business Mach Corp <Ibm> | 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム |
JP2005202014A (ja) * | 2004-01-14 | 2005-07-28 | Sony Corp | 音声信号処理装置、音声信号処理方法および音声信号処理プログラム |
JP2006301223A (ja) * | 2005-04-20 | 2006-11-02 | Ascii Solutions Inc | 音声認識システム及び音声認識プログラム |
JP2009288567A (ja) * | 2008-05-29 | 2009-12-10 | Ricoh Co Ltd | 議事録作成装置、議事録作成方法、議事録作成プログラム、議事録作成システム |
JP2010060850A (ja) * | 2008-09-04 | 2010-03-18 | Nec Corp | 議事録作成支援装置、議事録作成支援方法、議事録作成支援用プログラム及び議事録作成支援システム |
JP2013073323A (ja) * | 2011-09-27 | 2013-04-22 | Nec Commun Syst Ltd | 会議データの統合管理方法および装置 |
Non-Patent Citations (1)
Title |
---|
呉浩東他: "統合的言い換え表現の抽出", 情報処理学会研究報告, vol. 2005, no. 73, JPN6018047755, 22 July 2005 (2005-07-22), pages 43 - 46, ISSN: 0003932339 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020184007A (ja) * | 2019-05-07 | 2020-11-12 | 株式会社チェンジ | 情報処理装置、音声テキスト化システム、音声テキスト化方法および音声テキスト化プログラム |
JP2020201909A (ja) * | 2019-06-13 | 2020-12-17 | 株式会社リコー | 表示端末、共用システム、表示制御方法およびプログラム |
JP7314635B2 (ja) | 2019-06-13 | 2023-07-26 | 株式会社リコー | 表示端末、共用システム、表示制御方法およびプログラム |
US11651779B2 (en) | 2020-05-08 | 2023-05-16 | Sharp Kabushiki Kaisha | Voice processing system, voice processing method, and storage medium storing voice processing program |
Also Published As
Publication number | Publication date |
---|---|
CN108231065A (zh) | 2018-06-29 |
JP6463825B2 (ja) | 2019-02-06 |
KR101818980B1 (ko) | 2018-01-16 |
US20180182396A1 (en) | 2018-06-28 |
US10276164B2 (en) | 2019-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6463825B2 (ja) | 多重話者音声認識修正システム | |
US11887590B2 (en) | Voice enablement and disablement of speech processing functionality | |
EP3469592B1 (en) | Emotional text-to-speech learning system | |
US10878824B2 (en) | Speech-to-text generation using video-speech matching from a primary speaker | |
JP5750380B2 (ja) | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム | |
US11687526B1 (en) | Identifying user content | |
KR101819459B1 (ko) | 음성 인식 오류 수정을 지원하는 음성 인식 시스템 및 장치 | |
JP5731998B2 (ja) | 対話支援装置、対話支援方法および対話支援プログラム | |
CN109543021B (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
CN110047481A (zh) | 用于语音识别的方法和装置 | |
JP2021529337A (ja) | 音声認識技術を利用した多者間対話記録/出力方法及びこのため装置 | |
JP2016062357A (ja) | 音声翻訳装置、方法およびプログラム | |
JP2011504624A (ja) | 自動同時通訳システム | |
KR20190032557A (ko) | 음성 기반 통신 | |
JP6832503B2 (ja) | 情報提示方法、情報提示プログラム及び情報提示システム | |
JPH10326176A (ja) | 音声対話制御方法 | |
JP2010128766A (ja) | 情報処理装置、情報処理方法、プログラム及び記憶媒体 | |
KR102472921B1 (ko) | 음향 신호를 사용자 인터페이스에 시각적으로 표시하는 사용자 인터페이싱 방법 및 장치 | |
JP5713782B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
Harada et al. | VoiceLabel: using speech to label mobile sensor data | |
KR101920653B1 (ko) | 비교음 생성을 통한 어학학습방법 및 어학학습프로그램 | |
JP2016186646A (ja) | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム | |
JP6696878B2 (ja) | 音声処理装置、ウェアラブル端末、携帯端末、および音声処理方法 | |
JP2015187738A (ja) | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム | |
KR102471678B1 (ko) | 음향 신호를 사용자 인터페이스에 시각적으로 표시하는 사용자 인터페이싱 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6463825 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |