JP2005346259A5 - - Google Patents

Download PDF

Info

Publication number
JP2005346259A5
JP2005346259A5 JP2004163362A JP2004163362A JP2005346259A5 JP 2005346259 A5 JP2005346259 A5 JP 2005346259A5 JP 2004163362 A JP2004163362 A JP 2004163362A JP 2004163362 A JP2004163362 A JP 2004163362A JP 2005346259 A5 JP2005346259 A5 JP 2005346259A5
Authority
JP
Japan
Prior art keywords
setting
data
information
sound
sound information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004163362A
Other languages
English (en)
Other versions
JP4429081B2 (ja
JP2005346259A (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from JP2004163362A external-priority patent/JP4429081B2/ja
Priority to JP2004163362A priority Critical patent/JP4429081B2/ja
Priority to US11/139,261 priority patent/US20050267749A1/en
Priority to AT05253344T priority patent/ATE553430T1/de
Priority to EP05253344A priority patent/EP1603028B1/en
Priority to KR1020050046243A priority patent/KR100733095B1/ko
Priority to CNB2005100742337A priority patent/CN100454388C/zh
Publication of JP2005346259A publication Critical patent/JP2005346259A/ja
Publication of JP2005346259A5 publication Critical patent/JP2005346259A5/ja
Publication of JP4429081B2 publication Critical patent/JP4429081B2/ja
Application granted granted Critical
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Claims (14)

  1. データに関連付ける音情報を取得する取得手段と、
    前記取得手段で取得した音情報を処理の対象とするか否かを設定する設定手段と、
    前記データ、前記音情報及び前記設定手段で設定した結果を関連付ける関連付け手段とを備えたことを特徴とする情報処理装置。
  2. 前記処理は、データ検索、音声認識または音分類のいずれかであることを特徴とする請求項1記載の情報処理装置。
  3. 前記処理は音声認識であり、
    前記取得手段で取得した音情報が音声であるかを識別する識別手段を更に備え、
    前記設定手段は、前記識別手段で前記音情報が音声であると識別された場合に前記音情報を音声認識の対象とするよう設定することを特徴とする請求項1記載の情報処理装置。
  4. 前記識別手段で前記音情報が音声でないと識別された場合に、前記音情報を音分類の対象として設定する分類設定手段を更に備えたことを特徴とする請求項3記載の情報処理装置。
  5. データに関連付ける音情報を取得する取得手段と、
    前記取得手段で取得した音情報を音声認識の対象とするか否かを設定する設定手段と、
    前記設定手段で音声認識の対象とすると設定された場合に、前記音情報を音声認識し、音声認識した結果と前記データとを関連付けて記憶し、前記設定手段で音声認識の対象としないよう設定された場合に、前記音情報を前記データと関連付けて記憶する記憶手段とを備えたことを特徴とする情報処理装置。
  6. データ、該データに関連付けられた音情報及び該音情報をデータ検索に利用するか否かを設定した設定情報とを受信する受信手段と、
    前記受信手段で受信した設定情報がデータ検索に利用する設定となっている設定情報に対応する音情報に関連付けられているデータを、該音情報に基づいて検索する検索手段とを備えたことを特徴とする情報処理装置。
  7. データ、該データに関連付けられた音情報及び該音情報を音声認識の対象とするか否かを設定した設定情報とを受信する受信手段と、
    前記受信手段で受信した設定情報が音声認識の対象とする設定となっている場合に、前記音情報を音声認識する音声認識手段と、
    前記音声認識手段で認識された結果を前記データに関連付けて記憶する記憶手段とを備えたことを特徴とする情報処理装置。
  8. データ、該データに関連付けられた音情報及び該音情報を音分類の対象とするか否かを設定した設定情報を受信する受信手段と、
    前記受信手段で受信した設定情報が音分類の対象とする設定となっている場合に、前記音情報を音の属性に分類する分類手段と、
    前記分類手段において分類された音の属性を文字列として、前記音情報に関連付けられた前記データに関連付けて記憶する記憶手段とを備えたことを特徴とする情報処理装置。
  9. データに関連付ける音情報を取得する取得ステップと、
    前記取得ステップで取得した音情報を処理の対象とするか否かを設定する設定ステップと、
    前記データ、前記音情報及び前記設定ステップで設定した結果を関連付けてメモリに記憶する記憶ステップとを備えたことを特徴とする情報処理方法。
  10. データに関連付ける音情報を取得する取得ステップと、
    前記取得ステップで取得した音情報を音声認識の対象とするか否かを設定する設定ステップと、
    前記設定ステップで音声認識の対象とするよう設定された場合に、前記音情報を音声認識し、音声認識した結果と前記データとを関連付けてメモリに記憶し、前記設定ステップで音声認識の対象としないよう設定された場合に、前記データと前記音情報を関連付けてメモリに記憶する記憶ステップとを備えたことを特徴とする情報処理方法。
  11. データ、該データに関連付けられた音情報及び該音情報をデータ検索に利用するか否かを設定した設定情報とを受信する受信ステップと、
    前記受信ステップで受信した設定情報がデータ検索に利用する設定となっている設定情報に対応する音情報に関連付けられているデータを、該音情報に基づいて検索する検索ステップとを備えたことを特徴とする情報処理方法。
  12. データ、該データに関連付けられた音情報及び該音情報を音声認識の対象とするか否かを設定した設定情報とを受信する受信ステップと、
    前記受信ステップで受信した設定情報が音声認識の対象とする設定となっている場合に、前記音情報を音声認識する音声認識ステップと、
    前記音声認識ステップで認識された結果を前記データに関連付けてメモリに記憶する記憶ステップとを備えたことを特徴とする情報処理方法。
  13. データ、該データに関連付けられた音情報及び該音情報を音分類の対象とするか否かを設定した設定情報を受信する受信ステップと、
    前記受信ステップで受信した設定情報が音分類の対象とする設定となっている場合に、前記音情報を音の属性に分類する分類ステップと、
    前記分類ステップにおいて分類された音の属性を文字列として、前記音情報に関連付けられた前記データに関連付けてメモリに記憶する記憶ステップとを備えたことを特徴とする情報処理方法。
  14. 請求項9乃至13のいずれかに記載の情報処理方法をコンピュータに実行させるための制御プログラム。
JP2004163362A 2004-06-01 2004-06-01 情報処理装置及び情報処理方法 Expired - Fee Related JP4429081B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2004163362A JP4429081B2 (ja) 2004-06-01 2004-06-01 情報処理装置及び情報処理方法
US11/139,261 US20050267749A1 (en) 2004-06-01 2005-05-27 Information processing apparatus and information processing method
KR1020050046243A KR100733095B1 (ko) 2004-06-01 2005-05-31 정보 처리 장치 및 정보 처리 방법
EP05253344A EP1603028B1 (en) 2004-06-01 2005-05-31 Information processing apparatus and information processing method
AT05253344T ATE553430T1 (de) 2004-06-01 2005-05-31 Dispositif de traitement d'information et procede de traitement d'information
CNB2005100742337A CN100454388C (zh) 2004-06-01 2005-05-31 信息处理设备和信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004163362A JP4429081B2 (ja) 2004-06-01 2004-06-01 情報処理装置及び情報処理方法

Publications (3)

Publication Number Publication Date
JP2005346259A JP2005346259A (ja) 2005-12-15
JP2005346259A5 true JP2005346259A5 (ja) 2006-08-10
JP4429081B2 JP4429081B2 (ja) 2010-03-10

Family

ID=34941523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004163362A Expired - Fee Related JP4429081B2 (ja) 2004-06-01 2004-06-01 情報処理装置及び情報処理方法

Country Status (6)

Country Link
US (1) US20050267749A1 (ja)
EP (1) EP1603028B1 (ja)
JP (1) JP4429081B2 (ja)
KR (1) KR100733095B1 (ja)
CN (1) CN100454388C (ja)
AT (1) ATE553430T1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9166823B2 (en) * 2005-09-21 2015-10-20 U Owe Me, Inc. Generation of a context-enriched message including a message component and a contextual attribute
US8275399B2 (en) 2005-09-21 2012-09-25 Buckyball Mobile Inc. Dynamic context-data tag cloud
US9042921B2 (en) 2005-09-21 2015-05-26 Buckyball Mobile Inc. Association of context data with a voice-message component
US8509827B2 (en) 2005-09-21 2013-08-13 Buckyball Mobile Inc. Methods and apparatus of context-data acquisition and ranking
US8509826B2 (en) 2005-09-21 2013-08-13 Buckyball Mobile Inc Biosensor measurements included in the association of context data with a text message
US8489132B2 (en) 2005-09-21 2013-07-16 Buckyball Mobile Inc. Context-enriched microblog posting
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
KR100856407B1 (ko) 2006-07-06 2008-09-04 삼성전자주식회사 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법
JP5053950B2 (ja) * 2008-07-29 2012-10-24 キヤノン株式会社 情報処理方法、情報処理装置、プログラムおよび記憶媒体
US20120102066A1 (en) * 2009-06-30 2012-04-26 Nokia Corporation Method, Devices and a Service for Searching
US20110314401A1 (en) 2010-06-22 2011-12-22 Thermoteknix Systems Ltd. User-Profile Systems and Methods for Imaging Devices and Imaging Devices Incorporating Same

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4951079A (en) * 1988-01-28 1990-08-21 Konica Corp. Voice-recognition camera
WO1995010915A1 (en) * 1993-10-12 1995-04-20 Orad, Inc. Sports event video
US5675390A (en) * 1995-07-17 1997-10-07 Gateway 2000, Inc. Home entertainment system combining complex processor capability with a high quality display
JPH09135417A (ja) * 1995-11-10 1997-05-20 Ricoh Co Ltd デジタルスチルビデオカメラ
US5960447A (en) * 1995-11-13 1999-09-28 Holt; Douglas Word tagging and editing system for speech recognition
US5930749A (en) * 1996-02-02 1999-07-27 International Business Machines Corporation Monitoring, identification, and selection of audio signal poles with characteristic behaviors, for separation and synthesis of signal contributions
US5903892A (en) * 1996-05-24 1999-05-11 Magnifi, Inc. Indexing of media content on a network
US5995936A (en) * 1997-02-04 1999-11-30 Brais; Louis Report generation system and method for capturing prose, audio, and video by voice command and automatically linking sound and image to formatted text locations
KR20010022052A (ko) * 1997-07-23 2001-03-15 칼 하인쯔 호르닝어 이미지 시퀀스의 탐색 특성을 저장하기 위한 방법
US6128446A (en) * 1997-12-11 2000-10-03 Eastman Kodak Company Method and apparatus for annotation of photographic film in a camera
US20020036694A1 (en) * 1998-05-07 2002-03-28 Merril Jonathan R. Method and system for the storage and retrieval of web-based educational materials
US6714909B1 (en) * 1998-08-13 2004-03-30 At&T Corp. System and method for automated multimedia content indexing and retrieval
JP3252282B2 (ja) * 1998-12-17 2002-02-04 松下電器産業株式会社 シーンを検索する方法及びその装置
US6462778B1 (en) * 1999-02-26 2002-10-08 Sony Corporation Methods and apparatus for associating descriptive data with digital image files
US6434520B1 (en) * 1999-04-16 2002-08-13 International Business Machines Corporation System and method for indexing and querying audio archives
US6442518B1 (en) * 1999-07-14 2002-08-27 Compaq Information Technologies Group, L.P. Method for refining time alignments of closed captions
JP4320487B2 (ja) * 1999-09-03 2009-08-26 ソニー株式会社 情報処理装置および方法、並びにプログラム格納媒体
US7053938B1 (en) * 1999-10-07 2006-05-30 Intel Corporation Speech-to-text captioning for digital cameras and associated methods
KR100367824B1 (ko) * 2000-02-18 2003-01-10 주식회사 메세지 베이 아시아 인터넷을 통한 컨텐츠 서비스 방법
US6499016B1 (en) * 2000-02-28 2002-12-24 Flashpoint Technology, Inc. Automatically storing and presenting digital images using a speech-based command language
US6901362B1 (en) * 2000-04-19 2005-05-31 Microsoft Corporation Audio segmentation and classification
KR20000058970A (ko) * 2000-07-07 2000-10-05 손종모 동영상 정보제공과 검색 방법
AU2001288469A1 (en) * 2000-08-28 2002-03-13 Emotion, Inc. Method and apparatus for digital media management, retrieval, and collaboration
US6760042B2 (en) * 2000-09-15 2004-07-06 International Business Machines Corporation System and method of processing MPEG streams for storyboard and rights metadata insertion
US6738427B2 (en) * 2000-09-15 2004-05-18 International Business Machines Corporation System and method of processing MPEG streams for timecode packet insertion
US6934756B2 (en) * 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
CN1175398C (zh) * 2000-11-18 2004-11-10 中兴通讯股份有限公司 一种从噪声环境中识别出语音和音乐的声音活动检测方法
JP2002223401A (ja) * 2001-01-29 2002-08-09 Fuji Photo Film Co Ltd デジタルカメラのデータ処理方法
US7221405B2 (en) * 2001-01-31 2007-05-22 International Business Machines Corporation Universal closed caption portable receiver
US6970185B2 (en) * 2001-01-31 2005-11-29 International Business Machines Corporation Method and apparatus for enhancing digital images with textual explanations
US7013273B2 (en) * 2001-03-29 2006-03-14 Matsushita Electric Industrial Co., Ltd. Speech recognition based captioning system
US6820055B2 (en) * 2001-04-26 2004-11-16 Speche Communications Systems and methods for automated audio transcription, translation, and transfer with text display software for manipulating the text
US20020184196A1 (en) * 2001-06-04 2002-12-05 Lehmeier Michelle R. System and method for combining voice annotation and recognition search criteria with traditional search criteria into metadata
JP4240867B2 (ja) * 2001-09-28 2009-03-18 富士フイルム株式会社 電子アルバム編集装置
JP2003204282A (ja) * 2002-01-07 2003-07-18 Toshiba Corp 無線通信機能付きヘッドセット、これを用いたコミュニケーション記録システム、およびコミュニケーション制御方式を選択可能なヘッドセットシステム
US7165029B2 (en) * 2002-05-09 2007-01-16 Intel Corporation Coupled hidden Markov model for audiovisual speech recognition
US6693663B1 (en) * 2002-06-14 2004-02-17 Scott C. Harris Videoconferencing systems with recognition ability
CN1188804C (zh) * 2002-11-15 2005-02-09 郑方 一种声纹识别方法
US6834265B2 (en) * 2002-12-13 2004-12-21 Motorola, Inc. Method and apparatus for selective speech recognition
US7324943B2 (en) * 2003-10-02 2008-01-29 Matsushita Electric Industrial Co., Ltd. Voice tagging, voice annotation, and speech recognition for portable devices with optional post processing
GB2409365B (en) * 2003-12-19 2009-07-08 Nokia Corp Image handling
US20050192808A1 (en) * 2004-02-26 2005-09-01 Sharp Laboratories Of America, Inc. Use of speech recognition for identification and classification of images in a camera-equipped mobile handset

Similar Documents

Publication Publication Date Title
CN105512348B (zh) 用于处理视频和相关音频的方法和装置及检索方法和装置
CN107274916B (zh) 基于声纹信息对音频/视频文件进行操作的方法及装置
CN108197282B (zh) 文件数据的分类方法、装置及终端、服务器、存储介质
US20190370283A1 (en) Systems and methods for consolidating recorded content
US20200135158A1 (en) System and Method of Reading Environment Sound Enhancement Based on Image Processing and Semantic Analysis
KR102241972B1 (ko) 환경 콘텍스트를 이용한 질문 답변
US9741343B1 (en) Voice interaction application selection
JP2006527425A5 (ja)
CN103500579B (zh) 语音识别方法、装置及系统
CN101533401B (zh) 声音数据检索系统以及声音数据的检索方法
WO2011092793A1 (ja) データ処理装置
KR20140093957A (ko) 상호작용 멀티-모달 이미지 검색 기법
DE602005018545D1 (de) Verfahren zur bearbeitung von postgut mit optischer zeichenerkennung ocr
CN107293307A (zh) 音频检测方法及装置
JP2005346259A5 (ja)
JP2016102920A (ja) 文書記録システム及び文書記録プログラム
CN106055570A (zh) 一种基于音频数据的视频检索的装置及其视频检索方法
TW202018696A (zh) 語音識別方法、裝置及計算設備
CN104599692A (zh) 录音方法及装置,录音内容搜索方法及装置
CN103236261A (zh) 一种特定人语音识别的方法
US20120035919A1 (en) Voice recording device and method thereof
JP2007080184A5 (ja)
WO2020233381A1 (zh) 基于语音识别的服务请求方法、装置及计算机设备
JP2009519538A (ja) デジタル・ファイルの集合の中からデジタル・ファイルにアクセスする方法および装置
CN112784056B (zh) 一种基于视频智能识别及智能语义搜索的短视频生成方法