JP2021077142A - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP2021077142A JP2021077142A JP2019203801A JP2019203801A JP2021077142A JP 2021077142 A JP2021077142 A JP 2021077142A JP 2019203801 A JP2019203801 A JP 2019203801A JP 2019203801 A JP2019203801 A JP 2019203801A JP 2021077142 A JP2021077142 A JP 2021077142A
- Authority
- JP
- Japan
- Prior art keywords
- display
- character string
- display character
- unit
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 79
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000000034 method Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 25
- 230000008859 change Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000004984 smart glass Substances 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
図1は、通信システムSの概要を説明するための図である。通信システムSは、動画及び音声の通信を行うためのシステムであり、情報処理装置1と、情報処理装置2とを備える。情報処理装置1と情報処理装置2とは、アクセスポイント3及びネットワークNを介して、動画及び音声を送受信することができる。
図3は、情報処理装置1の構成を示すブロック図である。情報処理装置1は、図2に示したマイクロホン11、カメラ12、ライト13、スピーカ14及びディスプレイ15の他に、通信部16、記憶部17及び制御部18を有する。
上記のとおり、情報処理装置1は、ディスプレイ15に表示された複数の表示文字列のうち、ユーザU1が発した音声により特定される入力文字列に最も近い表示文字列に対応する処理を実行する。しかしながら、情報処理装置1が使用される場所によっては、周囲の人の会話の中に、表示文字列と同一又は類似する文字列が含まれやすい場合があり、このような場合には、情報処理装置1を使用しているユーザU1の意図に反した表示文字列が選択されてしまうことがある。
図9は、制御部18による表示文字列変更処理の流れを示すフローチャートである。図9に示すフローチャートは、図5(b)に示したコントロールパネルが表示されている状態から開始している。
以上説明したように、情報処理装置1は、動画を表示しているディスプレイ15に、それぞれ異なる複数の表示文字列を表示させる表示制御部181と、マイクロホン11に入力された音声を認識した音声が示す入力文字列に相対的に近い表示文字列を選択する選択部184と、選択部184が選択した表示文字列に対応し、動画に影響を与える処理を実行する処理実行部185とを有する。情報処理装置1がこのような構成を有することで、情報処理装置1を使用するユーザU1が、表示されている文字列を発することで所望の操作をすることができるので、音声による装置の操作が正しく行われやすくなる。
2 情報処理装置
3 アクセスポイント
11 マイクロホン
12 カメラ
13 ライト
14 スピーカ
14 ディスプレイ
15 ディスプレイ
15 表示部
16 通信部
17 記憶部
18 制御部
181 表示制御部
182 撮像制御部
183 音声処理部
184 選択部
185 処理実行部
Claims (10)
- 動画を表示している表示部に、それぞれ異なる複数の表示文字列を表示させる表示制御部と、
所定のマイクロホンに入力された音声を認識する音声処理部と、
前記複数の表示文字列のうち前記音声処理部が認識した音声が示す入力文字列に相対的に近い表示文字列を選択する選択部と、
前記選択部が選択した前記表示文字列に対応し、前記動画に影響を与える処理を実行する処理実行部と、
を有する情報処理装置。 - 前記複数の表示文字列と複数の処理内容とを関連付けて記憶する記憶部をさらに有し、
前記選択部は、前記複数の処理内容から一つの処理内容を選択する操作を受け付け、選択された前記一つの前記処理内容に関連付けて前記記憶部に記憶された前記表示文字列を変更する、
請求項1に記載の情報処理装置。 - 前記表示制御部は、前記一つの処理内容に関連付けられた複数の表示文字列候補を前記表示部に表示させ、
前記選択部は、前記複数の表示文字列候補から選択された一つの表示文字列候補を前記一つの処理内容に関連付けられた前記表示文字列に変更する、
請求項2に記載の情報処理装置。 - 前記選択部は、前記情報処理装置が使用される環境を特定し、特定した環境に基づいて複数の表示文字列候補から前記表示文字列を選択する、
請求項1から3のいずれか一項に記載の情報処理装置。 - 前記選択部は、前記複数の表示文字列候補のうち、特定した環境において使用される頻度が高い文字列との類似度が相対的に低い前記表示文字列候補を前記表示文字列として選択する、
請求項4に記載の情報処理装置。 - 前記選択部は、前記複数の表示文字列候補のうち、特定した環境において使用される頻度が高い文字列との類似度が相対的に低い一以上の前記表示文字列候補を前記表示部に表示させ、前記表示部に表示させた前記一以上の表示文字列候補から選択された前記表示文字列候補を前記表示文字列として選択する、
請求項4又は5に記載の情報処理装置。 - 前記選択部は、前記表示文字列を他の表示文字列に変更する操作を受け付け、前記他の表示文字列が、特定した環境で使用される文字列と類似すると判定した場合に警報を出力する、
請求項4から6のいずれか一項に記載の情報処理装置。 - 前記表示制御部は、環境を特定するための複数の環境候補を前記表示部に表示させ、
前記選択部は、前記複数の環境候補から選択された一つの環境候補を前記情報処理装置が使用される環境として特定する、
請求項4から7のいずれか一項に記載の情報処理装置。 - コンピュータが実行する、
表示部に動画を表示させるステップと、
前記表示部に動画を表示させている間に、それぞれ異なる複数の表示文字列を表示させるステップと、
所定のマイクロホンに入力された音声を認識するステップと、
前記複数の表示文字列のうち認識した音声が示す入力文字列に最も近い表示文字列を選択するステップと、
選択した前記表示文字列に対応し、前記動画に影響を与える処理を実行するステップと、
を有する情報処理方法。 - コンピュータを、
動画を表示している表示部に、それぞれ異なる複数の表示文字列を表示させる表示制御部、
所定のマイクロホンに入力された音声を認識する音声処理部、
前記複数の表示文字列のうち前記音声処理部が認識した音声が示す入力文字列に最も近い表示文字列を選択する選択部、及び
前記選択部が選択した前記表示文字列に対応し、前記動画に影響を与える処理を実行する処理実行部、
として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019203801A JP6703177B1 (ja) | 2019-11-11 | 2019-11-11 | 情報処理装置、情報処理方法及びプログラム |
PCT/JP2020/020138 WO2021095289A1 (ja) | 2019-11-11 | 2020-05-21 | 情報処理装置、情報処理方法及びプログラム |
US17/662,661 US20220262369A1 (en) | 2019-11-11 | 2022-05-10 | Information processing apparatus, information processing method and storage medium storing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019203801A JP6703177B1 (ja) | 2019-11-11 | 2019-11-11 | 情報処理装置、情報処理方法及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020081906A Division JP2021077327A (ja) | 2020-05-07 | 2020-05-07 | 情報処理装置、情報処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6703177B1 JP6703177B1 (ja) | 2020-06-03 |
JP2021077142A true JP2021077142A (ja) | 2021-05-20 |
Family
ID=70858141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019203801A Active JP6703177B1 (ja) | 2019-11-11 | 2019-11-11 | 情報処理装置、情報処理方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220262369A1 (ja) |
JP (1) | JP6703177B1 (ja) |
WO (1) | WO2021095289A1 (ja) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003162296A (ja) * | 2001-11-28 | 2003-06-06 | Nissan Motor Co Ltd | 音声入力装置 |
JP2004086150A (ja) * | 2002-06-28 | 2004-03-18 | Denso Corp | 音声制御装置 |
JP2005227686A (ja) * | 2004-02-16 | 2005-08-25 | Sharp Corp | 音声認識装置、音声認識プログラムおよび記録媒体。 |
JP2006251699A (ja) * | 2005-03-14 | 2006-09-21 | Denso Corp | 音声認識装置 |
JP2007142957A (ja) * | 2005-11-21 | 2007-06-07 | National Institute Of Information & Communication Technology | 遠隔対話方法及び装置 |
JP2008145693A (ja) * | 2006-12-08 | 2008-06-26 | Canon Inc | 情報処理装置及び情報処理方法 |
JP2013041580A (ja) * | 2011-08-05 | 2013-02-28 | Samsung Electronics Co Ltd | 電子装置及びその制御方法 |
JP2017102516A (ja) * | 2015-11-30 | 2017-06-08 | セイコーエプソン株式会社 | 表示装置、通信システム、表示装置の制御方法、及び、プログラム |
-
2019
- 2019-11-11 JP JP2019203801A patent/JP6703177B1/ja active Active
-
2020
- 2020-05-21 WO PCT/JP2020/020138 patent/WO2021095289A1/ja active Application Filing
-
2022
- 2022-05-10 US US17/662,661 patent/US20220262369A1/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003162296A (ja) * | 2001-11-28 | 2003-06-06 | Nissan Motor Co Ltd | 音声入力装置 |
JP2004086150A (ja) * | 2002-06-28 | 2004-03-18 | Denso Corp | 音声制御装置 |
JP2005227686A (ja) * | 2004-02-16 | 2005-08-25 | Sharp Corp | 音声認識装置、音声認識プログラムおよび記録媒体。 |
JP2006251699A (ja) * | 2005-03-14 | 2006-09-21 | Denso Corp | 音声認識装置 |
JP2007142957A (ja) * | 2005-11-21 | 2007-06-07 | National Institute Of Information & Communication Technology | 遠隔対話方法及び装置 |
JP2008145693A (ja) * | 2006-12-08 | 2008-06-26 | Canon Inc | 情報処理装置及び情報処理方法 |
JP2013041580A (ja) * | 2011-08-05 | 2013-02-28 | Samsung Electronics Co Ltd | 電子装置及びその制御方法 |
JP2017102516A (ja) * | 2015-11-30 | 2017-06-08 | セイコーエプソン株式会社 | 表示装置、通信システム、表示装置の制御方法、及び、プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20220262369A1 (en) | 2022-08-18 |
JP6703177B1 (ja) | 2020-06-03 |
WO2021095289A1 (ja) | 2021-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6570651B2 (ja) | 音声対話装置および音声対話方法 | |
CN106463114B (zh) | 信息处理设备、控制方法及程序存储单元 | |
US7421655B2 (en) | Presenting information indicating input modalities | |
US7236611B2 (en) | Gesture activated home appliance | |
WO2016157662A1 (ja) | 情報処理装置、制御方法、およびプログラム | |
KR20150112337A (ko) | 디스플레이 장치 및 그 사용자 인터랙션 방법 | |
KR102193029B1 (ko) | 디스플레이 장치 및 그의 화상 통화 수행 방법 | |
US20140333964A1 (en) | Image forming apparatus, method for guidance on operation method by image forming apparatus, and system | |
KR102218640B1 (ko) | 디스플레이 장치 및 디스플레이 장치의 제어 방법 | |
WO2018061173A1 (ja) | Tv会議システム、tv会議方法、およびプログラム | |
JPWO2017175442A1 (ja) | 情報処理装置、および情報処理方法 | |
WO2021095289A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2021077327A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US20230100151A1 (en) | Display method, display device, and display system | |
JP7468360B2 (ja) | 情報処理装置および情報処理方法 | |
KR20190053727A (ko) | 전자장치 및 그 제어방법 | |
JP5041754B2 (ja) | 静止画像表示切替システム | |
JP7246913B2 (ja) | 情報処理システム、情報処理装置、及び情報処理方法 | |
US20230223019A1 (en) | Information processing device, information processing method, and program | |
WO2019017033A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7289243B2 (ja) | 表示装置、表示システム、及び表示方法 | |
JP2006331153A (ja) | 情報機器及び情報機器システム | |
JP2021180369A (ja) | 作業者端末、遠隔作業支援装置、作業支援システム | |
JP2021092924A (ja) | 音声操作システム、画像形成装置、音声操作方法、音声操作サーバ、および、音声操作プログラム | |
JP2023136193A (ja) | 会議システムの処理方法及び会議システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191120 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20191120 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20191122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200406 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200421 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200507 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6703177 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |