JP6883471B2 - 収音装置、収音方法、収音プログラム、ディクテーション方法及び情報処理装置 - Google Patents
収音装置、収音方法、収音プログラム、ディクテーション方法及び情報処理装置 Download PDFInfo
- Publication number
- JP6883471B2 JP6883471B2 JP2017094467A JP2017094467A JP6883471B2 JP 6883471 B2 JP6883471 B2 JP 6883471B2 JP 2017094467 A JP2017094467 A JP 2017094467A JP 2017094467 A JP2017094467 A JP 2017094467A JP 6883471 B2 JP6883471 B2 JP 6883471B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- sound collecting
- information processing
- sound
- processing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 121
- 238000000034 method Methods 0.000 title claims description 106
- 238000004891 communication Methods 0.000 claims description 67
- 230000008569 process Effects 0.000 claims description 64
- 238000012545 processing Methods 0.000 claims description 26
- 238000006243 chemical reaction Methods 0.000 description 20
- 238000012546 transfer Methods 0.000 description 17
- 230000005236 sound signal Effects 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 230000007613 environmental effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 210000003811 finger Anatomy 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- JOYRKODLDBILNP-UHFFFAOYSA-N Ethyl urethane Chemical compound CCOC(N)=O JOYRKODLDBILNP-UHFFFAOYSA-N 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000004745 nonwoven fabric Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/193—Formal grammars, e.g. finite state automata, context free grammars or word networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0638—Interactive procedures
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Circuit For Audible Band Transducer (AREA)
- Machine Translation (AREA)
Description
なお、特許文献1においては、話者を認識して音声認識を行うシステムにおいて、話者認識機能をオフにした場合でも、ユーザの嗜好を特定する技術が開示されている。
(第1の実施の形態)
図1は本発明の第1の実施の形態に係る収音装置及び情報処理装置によって構成されるディクテーションシステムを示すブロック図である。
収音装置10には通信部5が設けられている。通信部5は、制御部1に制御されて、外部機器との間で有線又は無線によるデータの送信及び受信が可能である。例えば、通信部5としては、Wifi等の無線LANやブルートゥース(登録商標)等による無線通信が可能に構成されている。制御部1は、通信部5を介して、収音部2によって取得した音声信号を外部機器に送信することができるようになっている。
この通信部5は、音声などリアルタイム性が要求されるリアルタイム通信(アイソクロナス転送)や機器の制御コマンドをやり取りするコントロール通信、ファイル化された情報をやり取りするファイル転送(バルク転送)などに対応しており、これらを時系列で行っても、並列で行ってもよい。これらは通信方式に応じてどのように行うかは取捨選択可能となっている。
つまり通信部22は、音声などリアルタイム性が要求されるリアルタイム通信(アイソクロナス転送)や機器の制御コマンドをやり取りするコントロール通信、ファイル化された情報をやり取りするファイル転送(バルク転送)などに対応しており、これらを時系列で行っても、並列で行ってもよい。これらは通信方式に応じてどのように行うかは取捨選択可能となっている。
このユーザ情報は、システム全体の管理者が設定可能でもよく、収音装置の専有者、所持者、管理者、情報処理装置の所持者、管理者が設定可能でもよい。これはセキュリティレベルに応じて選択可能で、ユーザ情報を一方の機器から要求して、もう一方の機器が送信して取得するようなやり取りを行っても良い。つまり、ディクテーションを実行する情報処理装置のユーザ要求に基づいて音声認識処理に用いる個人辞書の提供の可否を判定してもよいし、厳密にユーザの照合などをもとに可否を判定してもよい。
いま、収音装置10と情報処理装置20の専有者が同一(以下、単に専有者同一ともいう)ではない(専有者不一致)ものとする。この場合には、制御部1は、処理をステップS5に移行して、ユーザの発話による音声入力を行い、収音した音声を送信する。即ち、制御部1は、指向性制御部2bを制御して、例えば、ユーザ操作に基づく指向性を設定した状態で、マイク部2aにより発話を収音させる。例えば、制御部1は、収音範囲を狭くして、所定のビーム方向に設定した状態で音声記録を開始する。例えば、ビーム方向としては、図2の角度θの方向をビーム方向としてもよい。
次に、収音装置10と情報処理装置20の専有者が同一であるものとする。この場合には、制御部1は、ステップS4からステップS11に移行して、ユーザの発話による音声入力を行い、収音した音声を送信した後、ステップS12において個人辞書の更新処理が発生しているか否かを判定する。なお、ステップS11の音声入力及び送信処理はステップS5と同様の処理である。この場合には、専有者同一であるので、収音装置10の記録部6に記録されている個人辞書と同一の情報が情報処理装置20の記録部24に記録されていると考えられるので、個人辞書の提供処理は省略される。
つまり、マイクロホンと通信する通信部と、前記収音部において収音された音声に対するディクテーションを実行するために音声認識処理に用いる個人辞書を、上記通信部を介して取得する制御部とを具備したことを特徴とする情報処理装置を提供して、専有マイクロホン装置を所持するユーザが、どのPCを使っても、正確な音声認識処理を実行可能にしている。
図6は本発明の第2の実施の形態に係る収音装置を示すブロック図である。図6において図1と同一の構成要素には同一符号を付して説明を省略する。本実施の形態は、図1の通信部5としてUSB規格のコントローラであるUSB通信部5aを採用した例を示している。USB通信部5aは、図示しないUSBケーブルを介して図1の情報処理装置20の通信部22に接続される。
図8及び図9は変形例を示すフローチャートである。図8は収音装置の動作を示し、図9はディクテーション処理を図示しないクラウド上のコンピュータにおいて実施する場合のディクテーション動作を示している。図8及び図9において夫々図4及び5と同一の手順には同一符号を付して説明を省略する。
また、上記各実施の形態においては、収音装置は、収音した音声にノイズキャンセル処理や所定の音質調整した後の音声データを、情報処理装置にそのまま出力する例について説明したが、個人辞書を有していることから、個人辞書を用いて専有者の発声の特徴を補正した後、情報処理装置20に出力するようになっていてもよい。この場合には、情報処理装置において、個人辞書を用いることなく、高精度の音声認識処理が可能となる可能性がある。
また、上記各実施の形態の形態においては、収音装置と情報処理装置の専有者が不一致の場合に個人辞書を収音装置から情報処理装置に転送し、専有者同一の場合に個人辞書の更新データを情報処理装置から収音装置に転送する例について説明したが、収音装置は、情報処理装置に接続されたことによって個人辞書を情報処理装置に転送するようになっていてもよく、ユーザ情報に拘わらず情報処理装置からの要求に従って個人辞書を情報処理装置に転送するようになっていてもよい。また、情報処理装置は、収音装置に接続されたことによって個人辞書の更新データを収音装置に転送するようになっていてもよく、ユーザ情報に拘わらず収音装置からの要求に従って個人辞書の更新データを収音装置に転送するようになっていてもよい。
Claims (11)
- 音を収音するマイクロホンにより構成された収音部と、
前記収音部において収音された音声に対するディクテーション時の音声認識処理に用いる個人辞書を記録する記録部と、
前記収音部において収音された音声に対するディクテーションを実行する情報処理装置への前記個人辞書の提供を制御する制御部と、
前記収音部において収音された音声を前記情報処理装置に送信すると共に、前記制御部に制御されて前記個人辞書を前記情報処理装置に送信する通信部と、を具備し、
前記制御部は、前記情報処理装置のユーザ情報に基づいて、前記情報処理装置への前記個人辞書の提供の可否を決定することを特徴とする収音装置。 - 前記制御部は、前記情報処理装置の要求に基づいて、前記情報処理装置への前記個人辞書の提供の可否を決定することを特徴とする請求項1に記載の収音装置。
- 前記情報処理装置の音声認識処理における学習の結果更新された個人辞書の更新データの記録の可否を判定する判定部と、
前記記録部を読み取り専用に設定すると共に、前記判定部によって前記更新データの記録可が判定された期間にのみ前記記録部を書き込み許可に設定する書込み許可制御部とを具備したことを特徴とする請求項1又は2に記載の収音装置。 - 前記判定部は、前記情報処理装置のユーザ情報に基づいて、前記更新データの記録の可否を判定することを特徴とする請求項3に記載の収音装置。
- 前記判定部は、前記情報処理装置の要求に基づいて、前記更新データの記録の可否を判定することを特徴とする請求項3に記載の収音装置。
- 前記記録部は、前記情報処理装置によってマウントされ、
前記書込み許可制御部は、読み取り専用の設定と前記書き込み許可の設定との切換えに際して、前記記録部のマウントを一時的に解除することを特徴とする請求項3に記載の収音装置。 - マイクロホンにより構成された収音部によって音を収音する手順と、
前記収音部において収音された音声に対するディクテーションを実行する情報処理装置の前記ディクテーションにおいて採用される音声認識処理に用いる個人辞書の前記情報処理装置への提供の可否を判定する手順と、
前記収音部において収音された音声を前記情報処理装置に送信すると共に、前記提供の可否の判定結果に基づいて、前記個人辞書を前記情報処理装置に送信する通信手順とを具備し、
前記提供の判定する手順は、前記情報処理装置のユーザ情報に基づいて、前記個人辞書の前記情報処理装置への提供の可否を判定することを特徴とする収音方法。 - コンピュータに、
マイクロホンにより構成された収音部によって音を収音する手順と、
前記収音部において収音された音声に対するディクテーションを実行する情報処理装置の前記ディクテーションにおいて採用される音声認識処理に用いる個人辞書の前記情報処理装置への提供の可否を判定する手順と、
前記収音部において収音された音声を前記情報処理装置に送信すると共に、前記提供の可否の判定結果に基づいて、前記個人辞書を前記情報処理装置に送信する通信手順とを実行させるための収音プログラム。 - 収音部を有する収音装置から送信された音声を受信する手順と、
前記収音装置から前記音声に対するディクテーションにおいて採用する音声認識処理に用いる個人辞書を受信する手順と、
受信した音声に対するディクテーション処理によってドキュメントを生成する手順と、
生成されたドキュメントに対する学習処理の結果更新した個人辞書の更新データを前記収音装置に送信する手順と、を具備し、
前記個人辞書を受信する手順は、前記収音装置のユーザ情報に基づいて、前記個人辞書の受信の可否を決定することを特徴とするディクテーション方法。 - 前記送信する手順は、前記収音装置のユーザ情報に基づいて、前記更新データの前記収音装置への送信の可否を決定することを特徴とする請求項9に記載のディクテーション方法。
- 音を収音するマイクロホンにより構成された収音装置と通信する通信部と、
前記収音装置において収音された音声に対するディクテーションを実行するために前記ディクテーションにおいて採用される音声認識処理に用いる個人辞書を上記通信部を介して取得する制御部と、を具備し、
前記制御部は、前記収音装置のユーザ情報に基づいて、前記個人辞書の取得の可否を決定することを特徴とする情報処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017094467A JP6883471B2 (ja) | 2017-05-11 | 2017-05-11 | 収音装置、収音方法、収音プログラム、ディクテーション方法及び情報処理装置 |
US15/969,004 US10777187B2 (en) | 2017-05-11 | 2018-05-02 | Sound collection apparatus, sound collection method, sound collection program, dictation method, information processing apparatus, and recording medium recording information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017094467A JP6883471B2 (ja) | 2017-05-11 | 2017-05-11 | 収音装置、収音方法、収音プログラム、ディクテーション方法及び情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018189904A JP2018189904A (ja) | 2018-11-29 |
JP6883471B2 true JP6883471B2 (ja) | 2021-06-09 |
Family
ID=64097945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017094467A Active JP6883471B2 (ja) | 2017-05-11 | 2017-05-11 | 収音装置、収音方法、収音プログラム、ディクテーション方法及び情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10777187B2 (ja) |
JP (1) | JP6883471B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827799B (zh) * | 2019-11-21 | 2022-06-10 | 百度在线网络技术(北京)有限公司 | 用于处理语音信号的方法、装置、设备和介质 |
JP7472803B2 (ja) | 2021-01-21 | 2024-04-23 | トヨタ自動車株式会社 | 電動車両の制御装置、電動車両、および、電動車両の制御方法 |
JP7541412B1 (ja) | 2023-05-22 | 2024-08-28 | 株式会社ブルーオーシャンシステム | データ入力支援装置および方法,データ内容音声入力システム,記録管理装置,ならびに振り分け方法 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0375860A (ja) * | 1989-08-18 | 1991-03-29 | Hitachi Ltd | パーソナライズド端末 |
JP3474596B2 (ja) | 1992-12-07 | 2003-12-08 | 富士写真フイルム株式会社 | 音声記録装置 |
US6064959A (en) * | 1997-03-28 | 2000-05-16 | Dragon Systems, Inc. | Error correction in speech recognition |
US6195641B1 (en) * | 1998-03-27 | 2001-02-27 | International Business Machines Corp. | Network universal spoken language vocabulary |
JP2000322088A (ja) * | 1999-05-14 | 2000-11-24 | Hitachi Ltd | 音声認識マイクおよび音声認識システムならびに音声認識方法 |
US6640098B1 (en) * | 2000-02-14 | 2003-10-28 | Action Engine Corporation | System for obtaining service-related information for local interactive wireless devices |
JP3581648B2 (ja) * | 2000-11-27 | 2004-10-27 | キヤノン株式会社 | 音声認識システム、情報処理装置及びそれらの制御方法、プログラム |
US7027987B1 (en) * | 2001-02-07 | 2006-04-11 | Google Inc. | Voice interface for a search engine |
US20030120493A1 (en) * | 2001-12-21 | 2003-06-26 | Gupta Sunil K. | Method and system for updating and customizing recognition vocabulary |
JP2004045591A (ja) * | 2002-07-10 | 2004-02-12 | Mitsubishi Heavy Ind Ltd | 音声認識方法及び特定話者音響辞書の提供方法 |
EP1665086A4 (en) * | 2003-08-15 | 2009-09-02 | Silverbrook Res Pty Ltd | IMPROVING ACCURACY IN DIGITAL COLOR SEARCH |
JP4562373B2 (ja) * | 2003-10-20 | 2010-10-13 | 三洋電機株式会社 | データ処理装置 |
US7376561B2 (en) * | 2004-02-23 | 2008-05-20 | Louis Ralph Rennillo | Real-time transcription system |
US7826945B2 (en) * | 2005-07-01 | 2010-11-02 | You Zhang | Automobile speech-recognition interface |
JP4680714B2 (ja) * | 2005-08-03 | 2011-05-11 | パナソニック株式会社 | 音声認識装置および音声認識方法 |
ES2276617B1 (es) * | 2005-12-01 | 2008-06-16 | Colaboradores En Tecnologia Para La Empresa, S.L. | Sistema de control inalambrico de dispositivos mediante un aparato con telefono movil. |
CN101443732A (zh) * | 2006-05-12 | 2009-05-27 | 皇家飞利浦电子股份有限公司 | 用于从第一自适应数据处理版本转换至第二自适应数据处理版本的方法 |
WO2008007688A1 (fr) * | 2006-07-13 | 2008-01-17 | Nec Corporation | Terminal téléphonique ayant une fonction de reconnaissance vocale, dispositif de support de mise à jour de dictionnaire de reconnaissance vocale, et procédé de support associé |
TWI502380B (zh) * | 2007-03-29 | 2015-10-01 | Nokia Corp | 配合預測式本文輸入使用之方法、裝置、伺服器、系統及電腦程式產品 |
US8775175B1 (en) * | 2012-06-01 | 2014-07-08 | Google Inc. | Performing dictation correction |
JP5706384B2 (ja) * | 2012-09-24 | 2015-04-22 | 株式会社東芝 | 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム |
JP2014106523A (ja) * | 2012-11-30 | 2014-06-09 | Aisin Aw Co Ltd | 音声入力対応装置及び音声入力対応プログラム |
TWI508057B (zh) * | 2013-07-15 | 2015-11-11 | Chunghwa Picture Tubes Ltd | 語音辨識系統以及方法 |
US9640181B2 (en) * | 2013-12-27 | 2017-05-02 | Kopin Corporation | Text editing with gesture control and natural speech |
US20150334346A1 (en) * | 2014-05-16 | 2015-11-19 | Elwha Llc | Systems and methods for automatically connecting a user of a hands-free intercommunication system |
JP2016024212A (ja) * | 2014-07-16 | 2016-02-08 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
JP6226911B2 (ja) | 2015-06-04 | 2017-11-08 | シャープ株式会社 | サーバ装置、システム、音声認識機能を管理するための方法、および、情報通信端末を制御するためのプログラム |
US20160379630A1 (en) * | 2015-06-25 | 2016-12-29 | Intel Corporation | Speech recognition services |
JP2017079040A (ja) * | 2015-10-22 | 2017-04-27 | オリンパス株式会社 | 情報端末及びそのデータ秘匿化処理方法 |
EP3455719A1 (en) * | 2016-05-10 | 2019-03-20 | Google LLC | Implementations for voice assistant on devices |
-
2017
- 2017-05-11 JP JP2017094467A patent/JP6883471B2/ja active Active
-
2018
- 2018-05-02 US US15/969,004 patent/US10777187B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018189904A (ja) | 2018-11-29 |
US20180330716A1 (en) | 2018-11-15 |
US10777187B2 (en) | 2020-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11496827B2 (en) | Microphone natural speech capture voice dictation system and method | |
JP6513749B2 (ja) | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム | |
US9275638B2 (en) | Method and apparatus for training a voice recognition model database | |
US20190101991A1 (en) | Vein scanning device for automatic gesture and finger recognition | |
JP6883471B2 (ja) | 収音装置、収音方法、収音プログラム、ディクテーション方法及び情報処理装置 | |
CN111524501B (zh) | 语音播放方法、装置、计算机设备及计算机可读存储介质 | |
US20100178956A1 (en) | Method and apparatus for mobile voice recognition training | |
JP4622384B2 (ja) | ロボット、ロボット制御装置、ロボットの制御方法およびロボットの制御用プログラム | |
US20180122025A1 (en) | Wireless earpiece with a legal engine | |
CN112735429B (zh) | 确定歌词时间戳信息的方法和声学模型的训练方法 | |
CN109346057A (zh) | 一种智能儿童玩具的语音处理系统 | |
WO2014182453A2 (en) | Method and apparatus for training a voice recognition model database | |
JP2018191145A (ja) | 収音装置、収音方法、収音プログラム及びディクテーション方法 | |
CN110830368A (zh) | 即时通讯消息发送方法及电子设备 | |
JP2009515260A5 (ja) | ||
CN111223475B (zh) | 语音数据生成方法、装置、电子设备及存储介质 | |
KR20120127773A (ko) | 음성인식 정보검색 시스템 및 그 방법 | |
WO2020079918A1 (ja) | 情報処理装置及び情報処理方法 | |
US10785562B1 (en) | Position-aware recording devices able to provide context to speech | |
US10963548B2 (en) | Information acquisition device, information acquisition system, and information acquisition method | |
TW200813748A (en) | Pen-type computer and generating method | |
KR20200056754A (ko) | 개인화 립 리딩 모델 생성 방법 및 장치 | |
KR20200045821A (ko) | 전자의무기록에 기반하여 대화서비스를 제공하는 전자 장치 및 방법 | |
WO2019142447A1 (ja) | 情報処理装置および情報処理方法 | |
US20190267002A1 (en) | Intelligent system for creating and editing work instructions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200327 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20200327 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210420 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210510 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6883471 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |