JP4736511B2 - 情報提供方法および情報提供装置 - Google Patents
情報提供方法および情報提供装置 Download PDFInfo
- Publication number
- JP4736511B2 JP4736511B2 JP2005108145A JP2005108145A JP4736511B2 JP 4736511 B2 JP4736511 B2 JP 4736511B2 JP 2005108145 A JP2005108145 A JP 2005108145A JP 2005108145 A JP2005108145 A JP 2005108145A JP 4736511 B2 JP4736511 B2 JP 4736511B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- information providing
- information
- input
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 41
- 230000008859 change Effects 0.000 claims description 8
- 230000002123 temporal effect Effects 0.000 claims 6
- 238000010219 correlation analysis Methods 0.000 description 16
- 238000001514 detection method Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Controls And Circuits For Display Device (AREA)
Description
図1は、本発明による情報提供装置の構成を示している。本装置は、街頭など大勢の公衆が集まる場所において、案内や広告などの情報を主として映像によって提供する目的で設置するためのものである。音声入力部102は、マイクロフォンおよびそれに付属するアナログ−デジタル変換器などから成り、マイクロフォンの近辺にいる人(以下ユーザと呼ぶ)の声を取り込み、計算機等により処理可能な形式のデータへの変換を行なう。画像入力部104は、本発明の実施に必須のものではないが、カメラおよびそれに付属するデータ処理装置から成り、ユーザの様子を静止画や動画などの画像情報として取得する。こうして得られたデータは、対象者属性解析部106および音声・映像相関解析部108に送られる。
対象者属性解析、音声・映像相関解析、注視情報整理、出力映像選択などの処理は、演算装置によってそれぞれ所定のプログラムを実行することにより実現される。
ワードスポットモジュール316では、出力映像データ118に付随して送られてくるキーワード情報308と音声データとを照らし合わせ、音声データ中にキーワードが含まれるかどうかを判定する。
空間的属性解析においては、複数のマイクからの入力に対して、振幅検出910と位相差検出912の二つのモジュールによって処理が行なわれ、それらの結果を元に位置判定914のモジュールがユーザの位置を推定する。このとき、マイク等の機器が実際にどのような位置関係で配置されているかを示す機器配置情報DB916を参照する。位置判定のもっとも単純な動作方法としては、位相差検出の結果を無視し、振幅検出の結果から、最も大きな振幅を示したマイクを選び、そのマイクの位置を機器配置情報DBで確認するというやり方がある。より精緻な方法としては、音のエネルギーが音源からの距離の2乗に反比例するという性質を利用し、振幅検出の結果から各マイクと音源との距離を推定することも可能である。また、音の伝達を平面波で近似できることから、位相差検出によって二つのマイクの間に到達した音の位相差を検出し、その音の波長と比較することによって、音源の方向を推定することもできる。これらの手法により得られる値は、雑音の影響などもあって必ずしも正確なものではないが、複数の推定結果を組み合わせることにより信頼度を増すことが可能である。この他、複数のマイクを用いた音源位置推定のアルゴリズムについては、例えば、小林他"複数マイク自由配置による複数話者位置推定"(電子情報通信学会論文誌A,Vol.J82-A,No.2,pp.193-200,1999)(非特許文献3)などの文献に詳しい。なお、画像データ302が使用可能な場合には、これを直接用いたユーザの位置判定も併用することが可能である。
302 入力された画像データ、304 入力された音声データ、306 出力映像データに付与されたキーワード情報、308 出力映像データに付与されたシーン情報、310 出力映像データに付与された周波数情報、312 視線方向を推定するモジュール、314 ワードスポットを行なうモジュール、316 シーン分割を行なうモジュール、318 周波数解析を行なうモジュール、320 シーン照合を行なうモジュール、322 周波数照合を行なうモジュール、324 最終的な相関判定を行なうモジュール、
902 空間的属性解析の処理、904 属人的属性解析の処理、906 振幅検出を行なうモジュール、908 位相差検出を行なうモジュール、910 位置判定を行なうモジュール、912 個々のマイク等の機器の配置情報のデータベース、914 言語識別を行なうモジュール
916 性識別を行なうモジュール、918 年齢識別を行なうモジュール、920 言語別の音声モデルデータ、922 性別の音声モデルデータ、924 年代別の音声モデルデータ。
Claims (8)
- 映像表示装置に表示される映像により情報を提供する方法であって、
映像表示装置の周囲にいる人の音声を音声入力装置により入力する第1のステップと、
演算部により、提供している映像の時間的変化と前記入力された音声の時間的変化の相関を調べることにより前記周囲にいる人の注視度を判断する第2のステップと、を備え、
前記第2のステップとして、
前記入力された音声と前記映像表示装置に表示される映像データに付随して送られてくるキーワード情報とを照らし合わせ、音声データ中にキーワードが含まれるかどうかを判定するキーワード判定ステップ、
前記入力された音声及び前記映像データをシーン分割し、シーン分割された音声データのシーン境界の時間軸上の位置と、シーン分割された映像データのシーン境界の時間軸上の位置との時間的相関を判定するシーン照合ステップ、および、
前記入力された音声を周波数解析して全パワー、特定帯域パワー、基本周波数のパラメータを取得し、前記映像データに付随して送られてくる全パワー期待値、特定帯域パワー期待値、基本周波数期待値のデータと比較して類似度を求める周波数照合ステップ、
の3種類のステップのうち一つ以上を含む情報提供方法。 - 請求項1の情報提供方法であって、
前記演算部により、前記注視度に基づいて次に出力する映像を記憶部に格納された映像から選択する第3のステップを有することを特徴とする情報提供方法。 - 請求項2記載の情報提供方法であって、
前記第1のステップにおいて異なる位置に設置される複数の音声入力装置で音声を入力し、前記演算部により該複数の音声入力装置からの入力に基づいて前記周囲にいる人の位置を推定する第4のステップを有し、
前記第3のステップでは、前記推定された位置に対応する前記映像表示装置の表示画面上の位置に、前記制御の結果である映像を、前記制御結果以外の映像と重ねて表示することを特徴とする情報提供方法。 - 請求項2記載の情報提供方法であって、
前記注視度に基づいて出力した映像に対する操作入力を入力装置から受け付ける第5のステップと、該操作入力に基づいて前記次に出力する映像を前記記憶部に格納された映像から選択する第6のステップを有することを特徴とする情報提供方法。 - 映像により情報を提供する映像表示部と、該映像表示部の周囲にいる人の音声を入力する音声入力部と、提供している映像の時間的変化と前記入力された音声の時間的変化の相関を調べることにより前記周囲にいる人の注視度を判断する演算部と、を備え、
前記演算部には、
前記入力された音声と前記映像表示部に表示される映像データに付随して送られてくるキーワード情報とを照らし合わせ、音声データ中にキーワードが含まれるかどうかを判定するワードスポット部、
前記入力された音声及び前記映像データをシーン分割し、シーン分割された音声データのシーン境界の時間軸上の位置と、シーン分割された映像データのシーン境界の時間軸上の位置との時間的相関を判定するシーン照合部、および、
前記入力された音声を周波数解析して全パワー、特定帯域パワー、基本周波数のパラメータを、前記映像データに付随して送られてくる全パワー期待値、特定帯域パワー期待値、基本周波数期待値のデータと比較して類似度を求める周波数照合部、
のうち一つ以上を含む情報提供装置。 - 請求項5記載の情報提供装置であって、更に記憶部を有し、前記演算部は、前記注視度に基づいて次に出力する映像を前記記憶部に格納された映像から選択することを特徴とする情報提供装置。
- 請求項6記載の情報提供装置であって、前記音声入力部は、異なる位置に設置される複数のマイクを含み、
前記演算部は、前記異なる位置に設置される複数の音声入力装置からの入力に基づいて前記周囲にいる人の位置を推定し、前記推定された位置に対応する前記映像表示部の表示画面上の位置に、前記制御の結果である映像を、前記制御結果以外の映像と重ねて表示するよう制御を行うことを特徴とする情報提供装置。 - 請求項6記載の情報提供装置であって、前記注視度に基づいて出力した映像に対する操作入力を受け付けるユーザ入力部を有し、前記演算部は、該操作入力に基づいて前記次に出力する映像を前記記憶部に格納された映像から選択する情報提供装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005108145A JP4736511B2 (ja) | 2005-04-05 | 2005-04-05 | 情報提供方法および情報提供装置 |
CN2006100024251A CN1848106B (zh) | 2005-04-05 | 2006-01-27 | 信息提供方法及信息提供装置 |
US11/342,556 US20060224438A1 (en) | 2005-04-05 | 2006-01-31 | Method and device for providing information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005108145A JP4736511B2 (ja) | 2005-04-05 | 2005-04-05 | 情報提供方法および情報提供装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006285115A JP2006285115A (ja) | 2006-10-19 |
JP2006285115A5 JP2006285115A5 (ja) | 2008-03-06 |
JP4736511B2 true JP4736511B2 (ja) | 2011-07-27 |
Family
ID=37071703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005108145A Expired - Fee Related JP4736511B2 (ja) | 2005-04-05 | 2005-04-05 | 情報提供方法および情報提供装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20060224438A1 (ja) |
JP (1) | JP4736511B2 (ja) |
CN (1) | CN1848106B (ja) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090132275A1 (en) * | 2007-11-19 | 2009-05-21 | Searete Llc, A Limited Liability Corporation Of The State Of Delaware | Determining a demographic characteristic of a user based on computational user-health testing |
JP4479801B2 (ja) * | 2008-01-30 | 2010-06-09 | ブラザー工業株式会社 | 情報処理装置、情報処理方法及びプログラム |
US9110890B2 (en) * | 2008-02-15 | 2015-08-18 | International Business Machines Corporation | Selecting a language encoding of a static communication in a virtual universe |
US8577685B2 (en) * | 2008-10-24 | 2013-11-05 | At&T Intellectual Property I, L.P. | System and method for targeted advertising |
JP5595027B2 (ja) * | 2009-12-11 | 2014-09-24 | 三菱電機株式会社 | 情報表示処理装置 |
US8675981B2 (en) * | 2010-06-11 | 2014-03-18 | Microsoft Corporation | Multi-modal gender recognition including depth data |
JP2012133250A (ja) * | 2010-12-24 | 2012-07-12 | Sony Corp | 音情報表示装置、音情報表示方法およびプログラム |
GB2501067B (en) | 2012-03-30 | 2014-12-03 | Toshiba Kk | A text to speech system |
JP5668017B2 (ja) * | 2012-05-11 | 2015-02-12 | 東芝テック株式会社 | 情報提供装置とそのプログラムおよび情報提供システム |
US10111013B2 (en) * | 2013-01-25 | 2018-10-23 | Sense Intelligent | Devices and methods for the visualization and localization of sound |
US9105026B1 (en) | 2013-09-30 | 2015-08-11 | Square, Inc. | Rolling interface transition for mobile display |
JP2015111214A (ja) * | 2013-12-06 | 2015-06-18 | 株式会社リコー | 情報処理システム、情報処理装置、プロジェクタ、情報処理方法、及びプログラム |
US9635392B2 (en) | 2014-04-16 | 2017-04-25 | Sony Corporation | Method and system for displaying information |
US9324065B2 (en) | 2014-06-11 | 2016-04-26 | Square, Inc. | Determining languages for a multilingual interface |
US10496970B2 (en) | 2015-12-29 | 2019-12-03 | Square, Inc. | Animation management in applications |
WO2017163719A1 (ja) * | 2016-03-23 | 2017-09-28 | 日本電気株式会社 | 出力制御装置、出力制御方法、およびプログラム |
US10430835B2 (en) * | 2016-04-14 | 2019-10-01 | Google Llc | Methods, systems, and media for language identification of a media content item based on comments |
JP6422477B2 (ja) * | 2016-12-21 | 2018-11-14 | 本田技研工業株式会社 | コンテンツ提供装置、コンテンツ提供方法およびコンテンツ提供システム |
US10380579B1 (en) | 2016-12-22 | 2019-08-13 | Square, Inc. | Integration of transaction status indications |
JP6600374B2 (ja) * | 2018-03-01 | 2019-10-30 | ヤマハ株式会社 | 情報処理方法、情報処理装置およびプログラム |
US11178465B2 (en) | 2018-10-02 | 2021-11-16 | Harman International Industries, Incorporated | System and method for automatic subtitle display |
JP6923029B1 (ja) * | 2020-03-17 | 2021-08-18 | 大日本印刷株式会社 | 表示装置、表示システム、コンピュータプログラム及び表示方法 |
CN112632622B (zh) * | 2020-12-31 | 2022-08-26 | 重庆电子工程职业学院 | 电子档案安全管理系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06110417A (ja) * | 1992-09-28 | 1994-04-22 | Ricoh Co Ltd | 販売支援装置 |
JPH0981309A (ja) * | 1995-09-13 | 1997-03-28 | Toshiba Corp | 入力装置 |
WO2004064393A1 (ja) * | 2003-01-15 | 2004-07-29 | Matsushita Electric Industrial Co., Ltd. | 放送受信方法、放送受信システム、記録媒体、及びプログラム |
JP2005341138A (ja) * | 2004-05-26 | 2005-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 映像要約方法及びプログラム及びそのプログラムを格納した記憶媒体 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69830295T2 (de) * | 1997-11-27 | 2005-10-13 | Matsushita Electric Industrial Co., Ltd., Kadoma | Steuerungsverfahren |
US7120880B1 (en) * | 1999-02-25 | 2006-10-10 | International Business Machines Corporation | Method and system for real-time determination of a subject's interest level to media content |
US6873710B1 (en) * | 2000-06-27 | 2005-03-29 | Koninklijke Philips Electronics N.V. | Method and apparatus for tuning content of information presented to an audience |
JP3644502B2 (ja) * | 2001-02-06 | 2005-04-27 | ソニー株式会社 | コンテンツ受信装置およびコンテンツ呈示制御方法 |
US8139793B2 (en) * | 2003-08-27 | 2012-03-20 | Sony Computer Entertainment Inc. | Methods and apparatus for capturing audio signals based on a visual image |
WO2004064022A1 (en) * | 2003-01-14 | 2004-07-29 | Alterface S.A. | Kiosk system |
JP2004280673A (ja) * | 2003-03-18 | 2004-10-07 | Takenaka Komuten Co Ltd | 情報提供装置 |
US7501995B2 (en) * | 2004-11-24 | 2009-03-10 | General Electric Company | System and method for presentation of enterprise, clinical, and decision support information utilizing eye tracking navigation |
-
2005
- 2005-04-05 JP JP2005108145A patent/JP4736511B2/ja not_active Expired - Fee Related
-
2006
- 2006-01-27 CN CN2006100024251A patent/CN1848106B/zh not_active Expired - Fee Related
- 2006-01-31 US US11/342,556 patent/US20060224438A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06110417A (ja) * | 1992-09-28 | 1994-04-22 | Ricoh Co Ltd | 販売支援装置 |
JPH0981309A (ja) * | 1995-09-13 | 1997-03-28 | Toshiba Corp | 入力装置 |
WO2004064393A1 (ja) * | 2003-01-15 | 2004-07-29 | Matsushita Electric Industrial Co., Ltd. | 放送受信方法、放送受信システム、記録媒体、及びプログラム |
JP2005341138A (ja) * | 2004-05-26 | 2005-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 映像要約方法及びプログラム及びそのプログラムを格納した記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2006285115A (ja) | 2006-10-19 |
CN1848106A (zh) | 2006-10-18 |
CN1848106B (zh) | 2011-03-23 |
US20060224438A1 (en) | 2006-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4736511B2 (ja) | 情報提供方法および情報提供装置 | |
CN109446876B (zh) | 手语信息处理方法、装置、电子设备和可读存储介质 | |
US11423909B2 (en) | Word flow annotation | |
US20190371327A1 (en) | Systems and methods for operating an output device | |
JP7118697B2 (ja) | 注視点推定処理装置、注視点推定モデル生成装置、注視点推定処理システム、注視点推定処理方法、プログラム、および注視点推定モデル | |
JP6737398B2 (ja) | 重要単語抽出装置、関連会議抽出システム、及び重要単語抽出方法 | |
US20220262091A1 (en) | Image alignment method and device therefor | |
CN112653902A (zh) | 说话人识别方法、装置及电子设备 | |
CN112632349B (zh) | 展区指示方法、装置、电子设备及存储介质 | |
US20230048330A1 (en) | In-Vehicle Speech Interaction Method and Device | |
JP2017064853A (ja) | ロボット、コンテンツ決定装置、コンテンツ決定方法、及びプログラム | |
JP2012216167A (ja) | 環境地図生成装置及びプログラム | |
JP2013257418A (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
US20200098012A1 (en) | Recommendation Method and Reality Presenting Device | |
WO2010140254A1 (ja) | 映像音声出力装置及び音声定位方法 | |
WO2021070681A1 (ja) | 関心度評価システムおよび関心度評価方法 | |
CN111554269A (zh) | 一种语音取号方法、系统及存储介质 | |
WO2024009748A1 (ja) | 情報処理装置、情報処理方法、および記録媒体 | |
JP2020086808A (ja) | 情報処理装置、広告出力方法、及びプログラム | |
US20230101693A1 (en) | Sound processing apparatus, sound processing system, sound processing method, and non-transitory computer readable medium storing program | |
US20230377558A1 (en) | Gaze-based and augmented automatic interpretation method and system | |
KR101914665B1 (ko) | 피사체 자동 인식기능을 통한 부가정보 표시 영상 제공장치 | |
KR20230045814A (ko) | 인공 지능 기반의 양방향 안내 장치 및 방법 | |
JP2023115649A (ja) | 分析システム、情報処理装置、分析方法、及びプログラム | |
CN113903335A (zh) | 一种用户意图识别方法、用户意图识别装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080118 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100713 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110418 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4736511 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |