JP6429294B2 - 音声認識処理装置、音声認識処理方法およびプログラム - Google Patents
音声認識処理装置、音声認識処理方法およびプログラム Download PDFInfo
- Publication number
- JP6429294B2 JP6429294B2 JP2016574636A JP2016574636A JP6429294B2 JP 6429294 B2 JP6429294 B2 JP 6429294B2 JP 2016574636 A JP2016574636 A JP 2016574636A JP 2016574636 A JP2016574636 A JP 2016574636A JP 6429294 B2 JP6429294 B2 JP 6429294B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speech recognition
- permutation
- recognition result
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Description
認識要求送受信手段14は、ステップS03で保持していた順列番号を用いて、順列番号記憶手段13のフィールドT1311の順列番号を検索し、値が一致するレコードのフィールドT1312に音声認識結果を、図11に示すように格納する。
3 音声認識サーバ
6 ネットワーク
11 音声採取手段
12 音声分割手段
13 順列番号記憶手段
14 認識要求送受信手段
15 認識結果集約手段
16 認識結果表示手段
21 マイク
22 表示部
Claims (9)
- 入力される音声を音声データとして取得する音声採取手段と、
前記音声データを複数の音声データ片に分割し、該複数の音声データ片のそれぞれに前記音声採取手段に入力された順番にしたがって順列番号を割り当てる音声分割手段と、
前記順列番号を記憶する記憶手段と、
予め設定された複数の通信ポートに前記順列番号を対応づけながら前記音声データ片を振り分けてネットワークを介して音声認識サーバに送信し、前記音声データ片が該音声認識サーバによって認識処理された結果である音声認識結果を該音声認識サーバから前記通信ポートを介して受信すると、受信した音声認識結果に該通信ポートに対応づけた順列番号を割り当て、割り当てた順列番号に一致する順列番号が記憶される前記記憶手段の領域に該音声認識結果を格納する認識要求送受信手段と、
前記順列番号とともに前記記憶手段に格納された前記音声認識結果を該順列番号にしたがって並べた認識結果文を生成する認識結果集約手段と、
生成された前記認識結果文を表示する表示手段と、
を有する音声認識処理装置。 - 請求項1に記載の音声認識処理装置において、
前記認識要求送受信手段は、
前記複数の通信ポートのうち、前記音声認識サーバからの認識結果受信待ちになっていない通信ポートに、次の認識処理対象の前記音声データ片を振り分ける、音声認識処理装置。 - 請求項1または2に記載の音声認識処理装置において、
前記音声分割手段は、
前記音声採取手段が取得した音声データを分割する際、該音声データにおいて人の音声情報が存在しない部分および息継ぎの部分を検出し、検出した部分で挟まれる領域の音声データを前記音声データ片として抽出する、音声認識処理装置。 - 情報処理装置による音声認識処理方法であって、
入力される音声を音声データとして取得し、
前記音声データを複数の音声データ片に分割して、該複数の音声データ片のそれぞれに前記音声データを取得した順番にしたがって順列番号を割り当て、
前記順列番号を記憶手段に記憶し、
予め設定された複数の通信ポートに前記順列番号を対応づけながら前記音声データ片を振り分けてネットワークを介して音声認識サーバに送信し、
前記音声データ片が該音声認識サーバによって認識処理された結果である音声認識結果を該音声認識サーバから前記通信ポートを介して受信すると、受信した音声認識結果に該通信ポートに対応づけた順列番号を割り当て、
割り当てた順列番号に一致する順列番号が記憶される前記記憶手段の領域に該音声認識結果を格納し、
前記順列番号とともに前記記憶手段に格納された前記音声認識結果を該順列番号にしたがって並べた認識結果文を生成し、
生成された前記認識結果文を表示する、音声認識処理方法。 - 請求項4に記載の音声認識処理方法において、
前記複数の通信ポートのうち、前記音声認識サーバからの認識結果受信待ちになっていない通信ポートに、次の認識処理対象の前記音声データ片を振り分ける、音声認識処理方法。 - 請求項4または5に記載の音声認識処理方法において、
前記取得した音声データを分割する際、該音声データにおいて人の音声情報が存在しない部分および息継ぎの部分を検出し、検出した部分で挟まれる領域の音声データを前記音声データ片として抽出する、音声認識処理方法。 - コンピュータに、
入力される音声を音声データとして取得する手順と、
前記音声データを複数の音声データ片に分割して、該複数の音声データ片のそれぞれに前記音声データを取得した順番にしたがって順列番号を割り当てる手順と、
前記順列番号を記憶手段に記憶する手順と、
予め設定された複数の通信ポートに前記順列番号を対応づけながら前記音声データ片を振り分けてネットワークを介して音声認識サーバに送信する手順と、
前記音声データ片が該音声認識サーバによって認識処理された結果である音声認識結果を該音声認識サーバから前記通信ポートを介して受信すると、受信した音声認識結果に該通信ポートに対応づけた順列番号を割り当てる手順と、
割り当てた順列番号に一致する順列番号が記憶される前記記憶手段の領域に該音声認識結果を格納する手順と、
前記順列番号とともに前記記憶手段に格納された前記音声認識結果を該順列番号にしたがって並べた認識結果文を生成する手順と、
生成された前記認識結果文を表示する手順を実行させるためのプログラム。 - 請求項7に記載のプログラムにおいて、
前記複数の通信ポートのうち、前記音声認識サーバからの認識結果受信待ちになっていない通信ポートに、次の認識処理対象の前記音声データ片を振り分ける手順を有するプログラム。 - 請求項7または8に記載のプログラムにおいて、
前記取得した音声データを分割する手順で、該音声データにおいて人の音声情報が存在しない部分および息継ぎの部分を検出し、検出した部分で挟まれる領域の音声データを前記音声データ片として抽出する処理を有するプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015023836 | 2015-02-10 | ||
JP2015023836 | 2015-02-10 | ||
PCT/JP2015/086000 WO2016129188A1 (ja) | 2015-02-10 | 2015-12-24 | 音声認識処理装置、音声認識処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016129188A1 JPWO2016129188A1 (ja) | 2017-11-09 |
JP6429294B2 true JP6429294B2 (ja) | 2018-11-28 |
Family
ID=56614333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016574636A Active JP6429294B2 (ja) | 2015-02-10 | 2015-12-24 | 音声認識処理装置、音声認識処理方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6429294B2 (ja) |
WO (1) | WO2016129188A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019090917A (ja) * | 2017-11-14 | 2019-06-13 | 株式会社情報環境デザイン研究所 | 音声テキスト化装置、方法、及びコンピュータプログラム |
JP2020184007A (ja) * | 2019-05-07 | 2020-11-12 | 株式会社チェンジ | 情報処理装置、音声テキスト化システム、音声テキスト化方法および音声テキスト化プログラム |
CN113053380B (zh) * | 2021-03-29 | 2023-12-01 | 海信电子科技(武汉)有限公司 | 服务器及语音识别方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4483428B2 (ja) * | 2004-06-25 | 2010-06-16 | 日本電気株式会社 | 音声認識/合成システム、同期制御方法、同期制御プログラム、および同期制御装置 |
JP2008107624A (ja) * | 2006-10-26 | 2008-05-08 | Kddi Corp | 文字起こしシステム |
US8019608B2 (en) * | 2008-08-29 | 2011-09-13 | Multimodal Technologies, Inc. | Distributed speech recognition using one way communication |
JP2012190088A (ja) * | 2011-03-09 | 2012-10-04 | Nec Corp | 音声記録装置、方法及びプログラム |
JP5811642B2 (ja) * | 2011-07-05 | 2015-11-11 | ヤマハ株式会社 | 音声記録サーバ装置及び音声記録システム |
-
2015
- 2015-12-24 WO PCT/JP2015/086000 patent/WO2016129188A1/ja active Application Filing
- 2015-12-24 JP JP2016574636A patent/JP6429294B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JPWO2016129188A1 (ja) | 2017-11-09 |
WO2016129188A1 (ja) | 2016-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10586541B2 (en) | Communicating metadata that identifies a current speaker | |
CN112115706B (zh) | 文本处理方法、装置、电子设备及介质 | |
JP6327848B2 (ja) | コミュニケーション支援装置、コミュニケーション支援方法およびプログラム | |
KR20170030297A (ko) | 자연어 처리 시스템, 자연어 처리 장치, 자연어 처리 방법 및 컴퓨터 판독가능 기록매체 | |
JP2008225068A (ja) | 議事録作成方法、その装置及びそのプログラム | |
US9196253B2 (en) | Information processing apparatus for associating speaker identification information to speech data | |
CN106713111B (zh) | 一种添加好友的处理方法、终端及服务器 | |
JP2018045001A (ja) | 音声認識システム、情報処理装置、プログラム、音声認識方法 | |
JP6429294B2 (ja) | 音声認識処理装置、音声認識処理方法およびプログラム | |
CN114168710A (zh) | 一种会议记录的生成方法、装置、系统、设备及存储介质 | |
JP2018045639A (ja) | 対話ログ分析装置、対話ログ分析方法およびプログラム | |
WO2019123854A1 (ja) | 翻訳装置、翻訳方法、及びプログラム | |
JPWO2018037956A1 (ja) | 情報処理装置及び情報処理方法 | |
WO2018198807A1 (ja) | 翻訳装置 | |
JP2014149571A (ja) | コンテンツ検索装置 | |
KR20160131730A (ko) | 자연어 처리 시스템, 자연어 처리 장치, 자연어 처리 방법 및 컴퓨터 판독가능 기록매체 | |
JP2004348552A (ja) | 音声文書検索装置および方法およびプログラム | |
US20200243092A1 (en) | Information processing device, information processing system, and computer program product | |
JP6260138B2 (ja) | コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム | |
CN113221514A (zh) | 文本处理方法、装置、电子设备和存储介质 | |
CN111582708A (zh) | 医疗信息的检测方法、系统、电子设备及计算机可读存储介质 | |
JP2016024378A (ja) | 情報処理装置、その制御方法及びプログラム | |
JP2019109424A (ja) | 計算機、言語解析方法、及びプログラム | |
US20230069287A1 (en) | Server device, conference assistance system, conference assistance method, and non-transitory computer readable storage medium | |
JP7243145B2 (ja) | 情報処理装置、情報処理システム及び情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170728 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170728 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181002 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181025 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6429294 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |