JPWO2017038794A1 - 音声認識結果表示装置、音声認識結果表示方法、音声認識結果表示プログラム - Google Patents
音声認識結果表示装置、音声認識結果表示方法、音声認識結果表示プログラム Download PDFInfo
- Publication number
- JPWO2017038794A1 JPWO2017038794A1 JP2017538034A JP2017538034A JPWO2017038794A1 JP WO2017038794 A1 JPWO2017038794 A1 JP WO2017038794A1 JP 2017538034 A JP2017538034 A JP 2017538034A JP 2017538034 A JP2017538034 A JP 2017538034A JP WO2017038794 A1 JPWO2017038794 A1 JP WO2017038794A1
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- recognition result
- character string
- client terminal
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000000605 extraction Methods 0.000 claims abstract description 33
- 239000000284 extract Substances 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 3
- 230000007717 exclusion Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
以下、本発明の第1の実施形態について図面を参照して説明する。
101…入出力部
102…表示制御部
103…表示部
200…音声認識結果表示装置
201…音声データ入力部
202…音声データ出力部
203…キーワード抽出部
204…キーワード重要度算出部
205…記憶部
206…キーワード検索部
300…音声認識サーバー
301…入力部
302…音声認識処理部
303…出力部
400…ネットワーク
500、600、700…音声認識結果表示画面
501、601…時間軸
502、602…操作ポインタ
603…発話情報
604、605…発話数情報
Claims (7)
- 音声データに対する音声認識処理の結果をクライアント端末画面に表示する音声認識結果表示装置であって、
前記音声認識処理の結果である音声テキストデータから、所定のタイミングで前記音声テキストデータに含まれる文字列を抽出するキーワード抽出手段と、
前記音声テキストデータと、前記キーワード抽出手段で抽出した前記文字列とを記録する記憶部と、
前記クライアント端末からの音声認識結果の表示要求に基づき、前記クライアント端末から指定された所定時間における音声テキストデータから抽出された前記文字列を前記記憶部から検索するキーワード検索手段と、を有し、
前記キーワード検索手段で検索された前記文字列をキーワードとして前記クライアント端末画面に表示することを特徴とする音声認識結果表示装置。 - 前記キーワード抽出手段で抽出された前記文字列の出現頻度に基づき、前記文字列に対する重みを算出するキーワード重要度算出手段を有し、
前記記憶部は、前記キーワード重要度算出手段で算出された前記重みを前記文字列と紐付けて記録し、
前記クライアント端末からの音声認識結果の表示要求に基づき、前記クライアント端末から指定された所定時間における音声テキストデータから前記キーワード検索手段で抽出した前記文字列を、前記重みに応じて形式を変えて前記クライアント端末画面に表示することを特徴とする請求項1に記載の音声認識結果表示装置。 - 前記クライアント端末画面に表示する前記重みに応じた形式は、大きさまたは色であることを特徴とする請求項2に記載の音声認識結果表示装置。
- 前記記憶部は、前記キーワード抽出手段で音声テキストデータから文字列を抽出した時間を記録し、前記クライアント端末からの音声認識結果の表示要求に基づき、前記クライアント端末から指定された所定時間における音声テキストデータから前記キーワード検索手段で抽出した前記文字列をキーワードとして前記文字列を抽出した時間に対応した位置に表示することを特徴とする請求項1乃至請求項3に記載の音声認識結果表示装置。
- 前記キーワード検索手段は、前記クライアント端末画面に表示されたキーワードの指定操作による音声認識結果の発話情報の表示要求に基づき、前記クライアント端末から指定されたキーワードを含む音声テキストデータを前記記憶部から検索し、検索した結果を前記クライアント端末画面の指定キーワードの近傍に前記音声テキストデータを表示することを特徴とする請求項1乃至請求項4に記載の音声認識結果表示装置。
- 音声データに対する音声認識処理の結果をクライアント端末画面に表示する音声認識結果表示方法であって、
前記音声認識処理の結果である音声テキストデータから、所定のタイミングで前記音声テキストデータに含まれる文字列を抽出するステップと、
前記音声テキストデータと、前記音声テキストデータから抽出した前記文字列とを記憶部に記録するステップと、
前記クライアント端末からの音声認識結果の表示要求に基づき、前記クライアント端末から指定された所定時間における音声テキストデータから抽出された前記文字列を前記記憶部から検索するステップと、を有し、
前記記憶部から検索された文字列をキーワードとして前記クライアント端末画面に表示することを特徴とする音声認識結果表示方法。 - 音声データに対する音声認識処理の結果をクライアント端末画面に表示する音声認識結果表示装置によって実行されるプログラムであって、
前記音声認識処理の結果である音声テキストデータから、所定のタイミングで前記音声テキストデータに含まれる文字列を抽出するキーワード抽出機能と、
前記音声テキストデータと、前記キーワード抽出手段で抽出した前記文字列とを記録する記録機能と、
前記クライアント端末からの音声認識結果の表示要求に基づき、前記記録機能で記録された情報から、前記クライアント端末から指定された所定時間における音声テキストデータから抽出された前記文字列を検索するキーワード検索機能と、を有し、
前記キーワード検索機能で検索された前記文字列をキーワードとして前記クライアント端末画面に表示させることを特徴とする音声認識結果表示プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015171542 | 2015-08-31 | ||
JP2015171542 | 2015-08-31 | ||
PCT/JP2016/075271 WO2017038794A1 (ja) | 2015-08-31 | 2016-08-30 | 音声認識結果表示装置、音声認識結果表示方法、音声認識結果表示プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017038794A1 true JPWO2017038794A1 (ja) | 2018-01-25 |
JP6524242B2 JP6524242B2 (ja) | 2019-06-05 |
Family
ID=58187612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017538034A Active JP6524242B2 (ja) | 2015-08-31 | 2016-08-30 | 音声認識結果表示装置、音声認識結果表示方法、音声認識結果表示プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6524242B2 (ja) |
WO (1) | WO2017038794A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6737398B2 (ja) | 2017-03-24 | 2020-08-05 | ヤマハ株式会社 | 重要単語抽出装置、関連会議抽出システム、及び重要単語抽出方法 |
JP7053824B2 (ja) * | 2017-11-17 | 2022-04-12 | Line株式会社 | 会話の流れ情報を提供するためのコンピュータプログラム及びシステム |
JP6969040B2 (ja) * | 2017-12-18 | 2021-11-24 | 一般社団法人 教育環境デザイン研究所 | 授業改善のためのネットワークシステム |
WO2019130817A1 (ja) * | 2017-12-25 | 2019-07-04 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置及び発話解析方法 |
JP7098949B2 (ja) * | 2018-02-14 | 2022-07-12 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
CN111970257B (zh) * | 2020-08-04 | 2022-01-11 | 腾讯科技(深圳)有限公司 | 一种文稿显示控制方法、装置、电子设备和存储介质 |
JP6953597B1 (ja) * | 2020-09-17 | 2021-10-27 | ベルフェイス株式会社 | 情報処理装置、プログラム及び情報処理方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004007358A (ja) * | 2002-03-28 | 2004-01-08 | Fujitsu Ltd | 同期コンテンツ情報生成プログラム、同期コンテンツ情報生成装置および同期コンテンツ情報生成方法 |
JP2005064600A (ja) * | 2003-08-15 | 2005-03-10 | Toshiba Corp | 情報処理装置、情報処理方法、およびプログラム |
WO2006085565A1 (ja) * | 2005-02-08 | 2006-08-17 | Nippon Telegraph And Telephone Corporation | 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体 |
JP2006276754A (ja) * | 2005-03-30 | 2006-10-12 | Mitsubishi Electric Information Systems Corp | オペレータ業務支援システム |
JP2008009552A (ja) * | 2006-06-27 | 2008-01-17 | Nippon Telegr & Teleph Corp <Ntt> | インデクス生成装置、インデクス生成方法およびインデクス生成プログラム |
JP2014229075A (ja) * | 2013-05-22 | 2014-12-08 | キヤノン株式会社 | 文書情報に関連する音声情報を抽出するシステム |
JP2014241016A (ja) * | 2013-06-11 | 2014-12-25 | 株式会社東芝 | インデックス作成装置、インデックス作成システム、インデックス作成方法、及び、インデックス作成プログラム |
-
2016
- 2016-08-30 WO PCT/JP2016/075271 patent/WO2017038794A1/ja active Application Filing
- 2016-08-30 JP JP2017538034A patent/JP6524242B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004007358A (ja) * | 2002-03-28 | 2004-01-08 | Fujitsu Ltd | 同期コンテンツ情報生成プログラム、同期コンテンツ情報生成装置および同期コンテンツ情報生成方法 |
JP2005064600A (ja) * | 2003-08-15 | 2005-03-10 | Toshiba Corp | 情報処理装置、情報処理方法、およびプログラム |
WO2006085565A1 (ja) * | 2005-02-08 | 2006-08-17 | Nippon Telegraph And Telephone Corporation | 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体 |
JP2006276754A (ja) * | 2005-03-30 | 2006-10-12 | Mitsubishi Electric Information Systems Corp | オペレータ業務支援システム |
JP2008009552A (ja) * | 2006-06-27 | 2008-01-17 | Nippon Telegr & Teleph Corp <Ntt> | インデクス生成装置、インデクス生成方法およびインデクス生成プログラム |
JP2014229075A (ja) * | 2013-05-22 | 2014-12-08 | キヤノン株式会社 | 文書情報に関連する音声情報を抽出するシステム |
JP2014241016A (ja) * | 2013-06-11 | 2014-12-25 | 株式会社東芝 | インデックス作成装置、インデックス作成システム、インデックス作成方法、及び、インデックス作成プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6524242B2 (ja) | 2019-06-05 |
WO2017038794A1 (ja) | 2017-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017038794A1 (ja) | 音声認識結果表示装置、音声認識結果表示方法、音声認識結果表示プログラム | |
US11810554B2 (en) | Audio message extraction | |
US11509726B2 (en) | Encapsulating and synchronizing state interactions between devices | |
US9646609B2 (en) | Caching apparatus for serving phonetic pronunciations | |
US20170277993A1 (en) | Virtual assistant escalation | |
US9697871B2 (en) | Synchronizing recorded audio content and companion content | |
US20150193379A1 (en) | System and method for cognizant time-based reminders | |
US10599469B2 (en) | Methods to present the context of virtual assistant conversation | |
CN107577385A (zh) | 媒体环境中的智能自动化助理 | |
CN103136326A (zh) | 与媒体一起呈现评论的系统和方法 | |
CN107680581A (zh) | 用于名称发音的系统和方法 | |
US11527251B1 (en) | Voice message capturing system | |
TWI807428B (zh) | 一同管理與語音檔有關的文本轉換記錄和備忘錄的方法、系統及電腦可讀記錄介質 | |
JP5586754B1 (ja) | 情報処理装置及びその制御方法、コンピュータプログラム | |
US8994774B2 (en) | Providing information to user during video conference | |
CN104572716A (zh) | 影音文件播放的系统及其方法 | |
US20140278404A1 (en) | Audio merge tags | |
WO2018043137A1 (ja) | 情報処理装置及び情報処理方法 | |
JP2013092912A (ja) | 情報処理装置、情報処理方法、並びにプログラム | |
WO2023210340A1 (ja) | 学習装置および学習方法 | |
JPWO2019098036A1 (ja) | 情報処理装置、情報処理端末、および情報処理方法 | |
KR102446300B1 (ko) | 음성 기록을 위한 음성 인식률을 향상시키는 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체 | |
CN113241061B (zh) | 语音识别结果的处理方法、装置、电子设备和存储介质 | |
AU2017100208B4 (en) | A caching apparatus for serving phonetic pronunciations | |
JP2023129020A (ja) | 端末装置、情報処理方法、および情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20171018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190426 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6524242 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |