JP7110057B2 - 音声認識システム - Google Patents
音声認識システム Download PDFInfo
- Publication number
- JP7110057B2 JP7110057B2 JP2018193388A JP2018193388A JP7110057B2 JP 7110057 B2 JP7110057 B2 JP 7110057B2 JP 2018193388 A JP2018193388 A JP 2018193388A JP 2018193388 A JP2018193388 A JP 2018193388A JP 7110057 B2 JP7110057 B2 JP 7110057B2
- Authority
- JP
- Japan
- Prior art keywords
- file
- speaker
- speech
- data
- recognition system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
音声認識システム1は、周囲の音を入力する集音部2と、この集音部2から入力した音データのデータ加工を行うことで音声ファイルFを生成し、この音声ファイルFを文字変換サーバ及び話者特定サーバに送信し、文章ファイルWと話者Hの特定結果を受信する処理部3と、処理部3の処理結果を表示するモニタ部4から構成される。
2 集音部
3 処理部
4 モニタ部
5 文字変換サーバ
6 話者特定サーバ
IN インターネット
Claims (4)
- 周囲の音を入力する集音部から入力した音声データを含む音データを、データ加工することにより音声ファイルを生成する処理部と、該処理部の処理結果を表示するモニタ部とから構成される音声認識システムであって、
前記処理部はインターネットを介して自己学習機能を備えた文字変換サーバ及び話者特定サーバと接続しており、
前記音声ファイルを前記文字変換サーバに送信して、前記文字変換サーバから前記音声ファイルをテキスト化した文章ファイルを受信し、
前記音声ファイル及び話者のユーザID情報を前記話者特定サーバに送信して、前記音声ファイルに対する前記話者の特定結果を受信し、
前記音声ファイルに対応する前記文章ファイル及び前記話者の特定結果を前記モニタ部に表示することを特徴とする音声認識システム。 - 前記音データから人間の発声の周波数のみを抽出した音声データを生成し、前記話者の発言と発言との間の無音状態が所定時間以上の場合に前記音声データを区切り、区切れた直前の音声データに基づいて、前記音声ファイルを生成することを特徴とする請求項1に記載の音声認識システム。
- 前記音声データを所定間隔でサンプリングして、中心周波数の特性の判別により、前記話者ごとの前記音声ファイルを生成することを特徴とする請求項2に記載の音声認識システム。
- 前記モニタ部は前記音声ファイルに対応する前記文章ファイルと前記特定結果の前記話者とを対応付けて時系列順に表示することを特徴とする請求項1~3の何れか1項に記載の音声認識システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018193388A JP7110057B2 (ja) | 2018-10-12 | 2018-10-12 | 音声認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018193388A JP7110057B2 (ja) | 2018-10-12 | 2018-10-12 | 音声認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020060735A JP2020060735A (ja) | 2020-04-16 |
JP7110057B2 true JP7110057B2 (ja) | 2022-08-01 |
Family
ID=70220234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018193388A Active JP7110057B2 (ja) | 2018-10-12 | 2018-10-12 | 音声認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7110057B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014206896A (ja) | 2013-04-15 | 2014-10-30 | Yamagata Intech株式会社 | 情報処理装置、及び、プログラム |
JP2017003611A (ja) | 2015-06-04 | 2017-01-05 | シャープ株式会社 | 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法 |
WO2019187521A1 (ja) | 2018-03-28 | 2019-10-03 | 株式会社村田製作所 | 音声情報送信装置、音声情報送信方法、音声情報送信プログラム、音声情報解析システム及び音声情報解析サーバ |
-
2018
- 2018-10-12 JP JP2018193388A patent/JP7110057B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014206896A (ja) | 2013-04-15 | 2014-10-30 | Yamagata Intech株式会社 | 情報処理装置、及び、プログラム |
JP2017003611A (ja) | 2015-06-04 | 2017-01-05 | シャープ株式会社 | 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法 |
WO2019187521A1 (ja) | 2018-03-28 | 2019-10-03 | 株式会社村田製作所 | 音声情報送信装置、音声情報送信方法、音声情報送信プログラム、音声情報解析システム及び音声情報解析サーバ |
Also Published As
Publication number | Publication date |
---|---|
JP2020060735A (ja) | 2020-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108922538B (zh) | 会议信息记录方法、装置、计算机设备及存储介质 | |
CN105489221B (zh) | 一种语音识别方法及装置 | |
US9293133B2 (en) | Improving voice communication over a network | |
KR20210008510A (ko) | 뉴럴 네트워크들을 사용하여 대상 화자의 음성으로 텍스트로부터의 스피치의 합성 | |
CN105593936B (zh) | 用于文本转语音性能评价的系统和方法 | |
CN110149805A (zh) | 双向语音翻译系统、双向语音翻译方法和程序 | |
US9711167B2 (en) | System and method for real-time speaker segmentation of audio interactions | |
WO2019119279A1 (en) | Method and apparatus for emotion recognition from speech | |
CN111798821A (zh) | 声音转换方法、装置、可读存储介质及电子设备 | |
WO2018081970A1 (en) | System and method for text-to-speech performance evaluation | |
US20230317095A1 (en) | Systems and methods for pre-filtering audio content based on prominence of frequency content | |
CN111462727A (zh) | 用于生成语音的方法、装置、电子设备和计算机可读介质 | |
CN111868823A (zh) | 一种声源分离方法、装置及设备 | |
JP2023548157A (ja) | 通話およびオーディオメッセージからのその他の話者の音声フィルタリング | |
CN112382266A (zh) | 一种语音合成方法、装置、电子设备及存储介质 | |
JP7110057B2 (ja) | 音声認識システム | |
EP2541544A1 (en) | Voice sample tagging | |
JP7296214B2 (ja) | 音声認識システム | |
JP7339151B2 (ja) | 音声合成装置、音声合成プログラム及び音声合成方法 | |
CN114758668A (zh) | 语音增强模型的训练方法和语音增强方法 | |
CN113299309A (zh) | 语音翻译方法及装置、计算机可读介质和电子设备 | |
CN111582708A (zh) | 医疗信息的检测方法、系统、电子设备及计算机可读存储介质 | |
JP7055327B2 (ja) | 会話収集装置、会話収集システム及び会話収集方法 | |
CN111179943A (zh) | 一种对话辅助设备及获取信息的方法 | |
Hatem et al. | Human Speaker Recognition Based Database Method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210915 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220623 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220628 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220720 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7110057 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |