JP2000184258A - 音声認識注釈を有するデジタル・カメラ - Google Patents

音声認識注釈を有するデジタル・カメラ

Info

Publication number
JP2000184258A
JP2000184258A JP11349712A JP34971299A JP2000184258A JP 2000184258 A JP2000184258 A JP 2000184258A JP 11349712 A JP11349712 A JP 11349712A JP 34971299 A JP34971299 A JP 34971299A JP 2000184258 A JP2000184258 A JP 2000184258A
Authority
JP
Japan
Prior art keywords
data
digital camera
voice
image
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11349712A
Other languages
English (en)
Other versions
JP3272336B2 (ja
Inventor
Besutisu Vikutorusu
ヴィクトルス・ベスティス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2000184258A publication Critical patent/JP2000184258A/ja
Application granted granted Critical
Publication of JP3272336B2 publication Critical patent/JP3272336B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8233Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a character code signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4223Cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4334Recording operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8146Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
    • H04N21/8153Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics comprising still images, e.g. texture, background image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32128Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title attached to the image data, e.g. file header, transmitted message header, information on the same page or in the same computer file as the image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2101/00Still video cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0084Digital still camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3261Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal
    • H04N2201/3264Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal of sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3261Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal
    • H04N2201/3266Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal of text or character information, e.g. text accompanying an image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3274Storage or retrieval of prestored additional information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Graphics (AREA)
  • Studio Devices (AREA)

Abstract

(57)【要約】 (修正有) 【課題】写真ごとに音声注釈を記録可能で、しかも写真
がカメラから転送される時写真ごとに文字注釈を含める
デジタル・カメラを得る。 【解決手段】デジタル・カメラは、画像を構成する光を
受け、該画像を表す画像データを出力するように作動可
能な画像感知装置と、画像データを記憶可能な第一のメ
モリと、音声を受け音声データを出力するように作動可
能な音声感知装置と、音声データを記憶するように作動
可能な第二のメモリと、文字データを記憶するように作
動可能な第三のメモリと、デジタル・カメラが外部電力
を供給時、第二のメモリにアクセスし、記憶した音声を
文字データに変換し、文字データを第三のメモリに記憶
可能な音声認識装置とを含む。例えば音声認識装置は画
像捕捉ルーチン音声記録ルーチンおよび音声認識ルーチ
ンを実行するように作動可能なマイクロプロセッサを含
む。マイクロプロセッサはさらに、データ転送ルーチン
を実行するように作動可能である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は電子写真に関し、特
に、外部電力を供給されると、記録された音声注釈を文
字注釈に変換するデジタル・カメラに関する。
【0002】
【従来の技術】デジタル・カメラは、プロおよびアマチ
ュア両方の写真として一般的になった。デジタル・カメ
ラがより一般的になるにつれ、カメラの洗練度は増し、
追加機能を可能にする。たとえば、デジタル・カメラの
中には、ユーザが音声注釈を記録することを可能にする
ものもある。しかし、写真がプリントされるとき、記録
された音声は、プリントされる写真上に有用に表示する
ことができないため、音声注釈は失われる。写真を撮影
したとき音声注釈を記録することができ、しかも、写真
をプリントまたは転送するとき文字注釈を写真に含める
方法が必要である。
【0003】
【発明が解決しようとする課題】本発明は、写真ごとに
音声注釈を記録することができ、しかも、写真がカメラ
から転送されるとき、そのような写真ごとに文字注釈を
含めるデジタル・カメラである。
【0004】
【課題を解決するための手段】本発明のデジタル・カメ
ラは、画像を構成する光を受け、その画像を表す画像デ
ータを出力するように作動することができる画像感知装
置と、画像データを記憶するように作動することができ
る第一のメモリと、音声を受け、その音声を表す音声デ
ータを出力するように作動することができる音声感知装
置と、音声データを記憶するように作動することができ
る第二のメモリと、文字データを記憶するように作動す
ることができる第三のメモリと、デジタル・カメラが外
部電力を供給されると、第二のメモリにアクセスし、記
憶された音声データを文字データに変換し、文字データ
を第三のメモリに記憶するように作動することができる
音声認識装置とを含む。音声−文字変換プロセスは数値
計算であり、電力を消費するため、変換は、外部電力が
供給されるまで延期される。
【0005】本発明は、デジタル・カメラが外部装置に
通信接続されているとき、第一のメモリおよび第三のメ
モリにアクセスし、記憶された画像データおよび記憶さ
れた文字データを転送するように作動することができる
入出力アダプタをさらに含む。
【0006】画像データが写真を表し、記録された音声
データが、その写真に関連する音声注釈を表し、文字デ
ータが、その写真に関連する文字注釈であることが好ま
しい。
【0007】一つの実施態様では、音声認識装置は、画
像捕捉ルーチン、音声記録ルーチンおよび音声認識ルー
チンを実行するように作動することができるマイクロプ
ロセッサを含む。マイクロプロセッサはさらに、データ
転送ルーチンを実行するように作動することもできる。
【0008】一つの実施態様では、外部電力および通信
接続が受け台アセンブリによって提供される。
【0009】
【発明の実施の形態】本発明のデジタル・カメラ・シス
テム100を図1に示す。システム100は、デジタル
・カメラ102および受け台アセンブリ104を含む。
受け台アセンブリ104は、カメラ102を受ける受け
台106を含み、受け台をカメラに取り付けることを可
能にする。受け台アセンブリ104は、充電、データ転
送および音声認識の各プロセスの間にカメラ102への
電力およびデータ接続を提供する電源コネクタ108お
よびデータ・コネクタ110を含む。電力は、電源11
2によって給電ケーブル114を介して電源コネクタ1
08に供給される。電源112は、壁取り付け装置でも
よいし、自動車の電源アダプタでもよいし、バッテリ給
電式装置でもよい。データは、データ・ケーブル116
を介して転送することができる。このデータ・ケーブル
は、データ・コネクタ110に接続し、外部装置、たと
えばパーソナル・コンピュータ119または通信装置、
たとえば無線システム120、ケーブル・モデム12
2、ADSL(非対称型デジタル加入者網)モデム12
4、ローカル・エリア・ネットワーク・インタフェース
装置126、ISDN(サービス総合デジタル網)イン
タフェース装置128もしくは音声回線モデム130へ
の通信接続を提供する。無線システム120は、無線ネ
ットワークに通信接続されたモデムおよび無線トランシ
ーバを含む。写真を撮り、音声注釈を記録した後でカメ
ラを受け台に戻すと、充電、データ転送および音声認識
の各プロセスが実行される。
【0010】一つの実施態様では、通信装置120〜1
30は、インターネット134を介して宛先コンピュー
タ・システムまたはサーバ132に対する直接アクセス
を提供する。もう一つの実施態様では、通信装置120
〜130は、中間システム136に対するアクセスを提
供する。中間システムは、サーバまたは他のコンピュー
タ・システムであってもよく、カメラ102からのデー
タ転送の利便性および速度を改善するために使用され
る。
【0011】あるいはまた、受け台106を使用しなく
てもよい。むしろ、電源コネクタ108およびデータ・
コネクタ110を直接カメラに取り付けてもよい。コネ
クタは、別個に取り付けてもよいし、一つのアセンブリ
に組み合わせてもよい。
【0012】本発明のデジタル・カメラ102を図2に
示す。デジタル・カメラ102は、画像を構成する光を
受け、その画像を表すデジタル画像データを出力する画
像感知装置201を含む。画像感知装置201は通常、
画像を画像センサ204に合焦させるレンズ202を含
む。通常は電荷結合素子(CCD)または相補形MOS
素子である画像センサ204は、画像を表す信号をA/
D変換器206に出力し、このA/D変換器が、信号を
デジタル化することによってそれをデジタル画像データ
に変換し、そのデジタル画像データをマイクロプロセッ
サ208に出力する。デジタル・カメラ102はまた、
音声、たとえばスピーチを受け、その音声を表すデジタ
ル音声データを出力する音声感知装置209を含む。マ
イクロフォン210が、音声、通常は発話された語を感
知し、感知した音声を表す信号をA/D変換器212に
出力し、A/D変換器がその信号をデジタル化し、デジ
タル音声データをマイクロプロセッサ208に出力す
る。マイクロプロセッサ208は、デジタル画像および
音声データをメモリ214に記憶する。メモリ214は
通常、半導体メモリ、たとえばRAMまたはフラッシュ
・メモリである。メモリ214は、カメラ102に内蔵
されていてもよいし、脱着可能な不揮発性メモリ、たと
えばフラッシュ・メモリ・カードであってもよいし、デ
ィスク記憶装置、たとえばフロッピー・ディスクもしく
は他の脱着可能な媒体ドライブまたはデジタル・カメラ
102に内蔵または取り付けられたハード・ドライブで
あってもよい。
【0013】デジタル・カメラ102は、データ・コネ
クタ110およびデータ・ケーブル116を介してカメ
ラとの間でデータを転送するための、コネクタ217を
含む入出力アダプタ216を含む。デジタル・カメラ1
02はまた、バッテリ・調整・充電回路およびコネクタ
219を含む電源218を含む。これは、デジタル・カ
メラ102を電源112によって電源ケーブル114お
よび電源コネクタ108を介して給電することを可能に
する。他の周知の部品、たとえばファインダ、シャッタ
・スイッチなどは図示しない。
【0014】マイクロプロセッサ208は、撮影した写
真ごとの画像データをメモリ214中の画像データ・ブ
ロック220に記憶する。ブロック220中の画像デー
タは通常、メモリ空間を節約するために圧縮される。マ
イクロプロセッサ208は、記憶された各画像に関する
記録された音声(スピーチ)データを記録音声データ・
ブロック222に記憶する。通常、記録される音声デー
タもまた圧縮される。記憶された各画像に関連する文字
データもまた、メモリ214中の認識文字注釈データ・
ブロック223に記憶される。記憶される文字データ
は、以下に説明するように、記録された音声データに対
して音声認識を実行することによって生成される。
【0015】スピーチだけでなく、いかなる音声をもデ
ジタル・カメラ102によって記録し、記憶することが
できることが理解されよう。記録された音声は、メモリ
214中の記録音声データ・ブロック222に記憶され
る。記録された音声は、記録された音声データとして処
理され、記録された音声に対して音声認識が試みられ
る。この状況では、音声認識は働かず、デジタル・カメ
ラ102をして、記録された音声が音声データではない
と認識させる。すると、記録された音声は、音声データ
としてではなく、単に、記録された音声データとして処
理される。
【0016】一つの実施態様では、音声認識は、音声認
識ユニット224により、音声認識データ225を使用
して実行される。通常、音声認識は、デジタル信号プロ
セッサ(DSP)を使用して実行される。DSPの使用
は、有意な費用でリアルタイムまたは近リアルタイムの
認識を可能にする。しかし、本発明では、カメラが受け
台に戻されるまで認識は実行されないため、リアルタイ
ム音声認識は必要ない。たとえば、本発明の別の実施態
様では、音声認識ユニット222は使用されず、音声認
識は、音声認識ルーチン226を実行するマイクロプロ
セッサ208により、音声認識データ225を使用して
実行される。この実施態様は、リアルタイム認識を提供
しないが、音声認識ユニット222の費用を節約させ
る。
【0017】音声認識プロセスの出力は文字データであ
り、この文字データは、認識文字注釈データ・ブロック
223に記憶される。
【0018】デジタル・カメラ102はまた、マイクロ
プロセッサ208によって実行されるソフトウェア・ル
ーチンを含む。画像/音声捕捉ルーチン228は、デジ
タル写真を撮り、音声注釈を記録し、データを圧縮し、
画像データ・ブロック220および記録音声データ・ブ
ロック222に記憶するプロセスを制御する。音声認識
ルーチン228は、記録音声データ・ブロック222に
記憶された音声注釈を認識し、文字注釈を生成し、それ
らを認識文字注釈データ・ブロック223に記憶するプ
ロセスを制御する。データ転送ルーチン230は、デー
タをデジタル・カメラ102から転送するプロセスを制
御する。
【0019】音声認識データ225は通常、デジタル・
カメラ102に内蔵されたRAMに記憶される。しか
し、音声認識データ224は、カメラをカスタマイズし
て特定の音声または言語を認識させることができるよ
う、脱着可能なメモリに記憶することもできる。ソフト
ウェア・ルーチン226〜230は通常、不揮発性メモ
リ、たとえばROMまたはフラッシュ・メモリに記憶さ
れる。
【0020】デジタル・カメラ・システム100は、図
3に示すように作動させる。ステップ302で、カメラ
を受け台106から取り外す。ステップ304で、カメ
ラを使用して1枚以上の写真を撮り、一つ以上の音声注
釈を記録する。マイクロプロセッサ208が画像/音声
捕捉ルーチン228を実行して、各写真を撮り、画像デ
ータを圧縮し、その画像データをメモリ214中の画像
データ・ブロック220に記憶する。同様に、マイクロ
プロセッサ208は、画像/音声捕捉ルーチン228を
実行して、各音声注釈を記録し、音声データを圧縮し、
音声データをメモリ214中の記録音声データ・ブロッ
ク222に記憶する。
【0021】カメラ102は、写真撮影セッションが完
了するまで、写真を撮り、音声注釈を記録するために使
用することができる。写真撮影セッションは、メモリ2
14が満杯になったか、バッテリ電荷が低くなったか、
ユーザが所望の写真を撮ったとき、完了することができ
る。セッションが完了すると、ステップ306で、カメ
ラ102を受け台106に配置すると、電源コネクタ1
08およびデータ・コネクタ110の両方をカメラ10
2に取り付けることができる。受け台106を使用しな
いならば、最低でも、電源コネクタ108をカメラ10
2に取り付けなければならない。通常は、データ・コネ
クタ110もこの時点で接続するが、そうする必要はな
い。
【0022】マイクロプロセッサ208は、カメラ10
2が外部電力を供給されたことを検出する。検出は、周
知の技術によって達成することができる。たとえば、電
源回路218が、電源コネクタ219および信号マイク
ロプロセッサ208上の外部電力の存在を検出すること
ができる。他の周知の技術を使用することもできる。
【0023】マイクロプロセッサ208は、カメラ10
2が外部電力を供給されたことを検出すると、ステップ
308で、音声認識ルーチン226を実行して、記憶さ
れた音声注釈を文字に変換する。音声認識ルーチンの詳
細は、デジタル・カメラの実施態様に依存する。音声認
識ユニット224を含む実施態様では、マイクロプロセ
ッサ208は、ユニット224に合図して音声認識を開
始させる。すると、音声認識ユニット224は、音声認
識データ225を使用して、記憶された音声注釈を文字
に変換し、認識した文字をブロック223に記憶する。
音声認識が完了すると、音声認識ユニット224は、マ
イクロプロセッサ208に完了を合図する。
【0024】音声認識ユニット225を含まない実施態
様では、音声認識ルーチン226は、マイクロプロセッ
サ208をして、音声認識データ225を使用して、記
憶された音声注釈の文字への変換を実行させるコードを
含む。マイクロプロセッサ208はまた、認識した文字
をブロック223に記憶する。
【0025】音声認識が完了すると、ステップ310
で、データ・コネクタ110がカメラ102に取り付け
られているならば、マイクロプロセッサ208は、記憶
した画像および文字データをデータ・ケーブル116を
介して付属装置に転送する。データ・コネクタ102が
取り付けられていないならば、カメラ102は、画像お
よび文字データをのちの転送に備えて記憶することがで
きる。あるいはまた、メモリ214が取り外し可能であ
るならば、メモリ214を取り外すことによって画像お
よび文字データを移してもよい。付属装置は通常、パー
ソナル・コンピュータまたはワークステーションである
が、ローカルもしくはワイド・エリア・ネットワーク、
サーバ、メインフレームもしくはミニコンピュータ、通
信装置などであってもよい。
【0026】音声認識注釈は、関連する注釈を修正する
情報との組み合わせによってさらに強化することができ
る。修正情報は、カメラのユーザが、カメラによって表
示されるメニューを操作するか、カメラによってそのよ
うなものとして認識されるキーワードを発することによ
って指定することができる。たとえば、注釈は、注釈に
関連する写真の解説、写っている場所の名称、写真撮影
された時間、写っている人の名前などとして指定するこ
とができる。ユーザは、各写真または写真群の受取人の
名前、住所、eメール・アドレスなどを指定する情報を
入力することもできる。ユーザはまた、各写真または写
真群の受取人ごとに異なる解説、場所、名前などの情報
を入力してもよい。
【0027】メモリ214に記憶されるデータのフォー
マットの例を図4に示す。この例では、撮影された各写
真からの画像データが画像データのブロックとして記憶
されている。たとえば、写真1からの画像データはブロ
ック402に記憶され、写真Nからの画像データはブロ
ック404に記憶されている。画像データ402〜40
4のすべてのブロックは隣接して記憶される。撮影され
た各写真に関連する記録された音声データは、記録され
た音声データのブロックとして記憶される。たとえば、
写真1に関連する音声注釈から記録された音声データは
ブロック406に記憶され、写真Nに関連する音声注釈
から記録された音声データはブロック408に記憶され
ている。記録された音声データ406〜408のすべて
のブロックは隣接して記憶される。撮影された各写真に
関連する変換された文字注釈データは、文字データのブ
ロックとして記憶される。たとえば、写真1に関連する
変換された文字注釈データはブロック410に記憶さ
れ、写真Nに関連する変換された文字注釈データはブロ
ック412に記憶されている。変換された文字注釈デー
タ410〜412のすべてのブロックは隣接して記憶さ
れる。
【0028】メモリ214に記憶されるデータのフォー
マットのもう一つの例を図5に示す。図4と同様に、各
写真からの画像データ、各写真に関連する記録された音
声データおよび各写真に関連する変換された文字注釈デ
ータは、それぞれデータのブロックとして記憶されてい
る。たとえば、写真1からの画像データはブロック50
2として記憶され、写真1に関連する記録された音声デ
ータはブロック504として記憶され、写真1に関連す
る変換された文字データはブロック506として記憶さ
れている。しかし、この例では、写真からの画像データ
は、その写真に関連する記録された音声データおよび変
換された文字データと隣接して記憶される。たとえば、
すべて写真1に関連するブロック502、504および
506が隣接して記憶されている。同様に、すべて写真
Nに関連するブロック508、510および512が隣
接して記憶されている。
【0029】図4および5は、使用することができるデ
ータ記憶フォーマットの二つの例にすぎない。画像デー
タ、記録された音声データおよび変換された文字データ
の間の関係を維持する他のフォーマットを使用してもよ
い。たとえば、周知のファイル・システムを使用しても
よい。
【0030】本発明の具体的な実施態様を記載したが、
当業者であれば、記載した実施態様と等価である他の実
施態様があることを理解するであろう。したがって、本
発明は、例示した具体的な実施態様によって限定され
ず、請求の範囲によってのみ限定されることを理解しな
ければならない。
【0031】まとめとして、本発明の構成に関して以下
の事項を開示する。 (1)画像を構成する光を受け、前記画像を表す画像デ
ータを出力するように作動することができる画像感知装
置と、前記画像データを記憶するように作動することが
できる第一のメモリと、音声を受け、前記音声を表す音
声データを出力するように作動することができる音声感
知装置と、前記音声データを記憶するように作動するこ
とができる第二のメモリと、文字データを記憶するよう
に作動することができる第三のメモリと、デジタル・カ
メラに外部電力が供給されると、前記第二のメモリにア
クセスし、記憶された前記音声データを文字データに変
換し、前記文字データを前記第三のメモリに記憶するよ
うに作動することができる音声認識装置と、を含むデジ
タル・カメラ。 (2)前記デジタル・カメラが外部装置に通信接続され
ている場合、前記第一のメモリおよび前記第三のメモリ
にアクセスし、記憶された前記画像データおよび記憶さ
れた前記文字データを転送するように作動することがで
きる入出力アダプタをさらに含む上記(1)記載のデジ
タル・カメラ。 (3)前記画像データが写真を表し、前記音声データ
が、前記写真に関連する音声注釈を表し、前記文字デー
タが、前記写真に関連する文字注釈である上記(1)記
載のデジタル・カメラ。 (4)前記文字注釈を修正する情報をさらに含む上記
(3)記載のデジタル・カメラ。 (5)前記音声認識装置が、画像捕捉ルーチン、音声記
録ルーチンおよび音声認識ルーチンを実行するように作
動することができるマイクロプロセッサを含む上記
(1)記載のデジタル・カメラ。 (6)前記マイクロプロセッサがさらに、データ転送ル
ーチンを実行するように作動することができる上記
(5)記載のデジタル・カメラ。 (7)外部電力および通信接続が受け台アセンブリによ
って提供される上記(1)記載のデジタル・カメラ。 (8)デジタル・カメラを作動させる方法であって、画
像を構成する光を受け、前記画像を表す画像データを出
力するステップと、前記画像データを記憶するステップ
と、音声を受け、前記音声を表す音声データを出力する
ステップと、前記音声データを記憶するステップと、前
記デジタル・カメラに外部電力が供給されると、記憶さ
れた前記音声データを文字データに変換するステップ
と、前記文字データを記憶するステップと、を含むこと
を特徴とする方法。 (9)前記デジタル・カメラが外部装置に通信接続され
ているとき、記憶された前記画像データおよび記憶され
た前記文字データを転送するステップをさらに含む上記
(8)記載の方法。 (10)前記画像データが写真を表し、前記音声データ
が、前記写真に関連する音声注釈を表し、前記文字デー
タが、前記写真に関連する文字注釈である上記(8)記
載の方法。 (11)前記文字注釈を修正する情報をさらに含む上記
(10)記載の方法。 (12)前記変換ステップが、画像捕捉ルーチン、音声
記録ルーチンおよび音声認識ルーチンを実行するように
作動することができる前記デジタル・カメラ中のマイク
ロプロセッサを使用して前記変換を実行するステップを
含む上記(8)記載の方法。 (13)前記マイクロプロセッサがさらに、データ転送
ルーチンを実行するように作動することができる上記
(12)記載の方法。 (14)外部電力および通信接続を受け台アセンブリに
よって提供するステップをさらに含む上記(8)記載の
方法。 (15)画像を構成する光を受け、前記画像を表す画像
データを出力するための手段と、前記画像データを記憶
するための手段と、音声を受け、前記音声を表す音声デ
ータを出力するための手段と、前記音声データを記憶す
るための手段と、デジタル・カメラが外部電力を供給さ
れると、記憶された前記記録された音声データを文字デ
ータに変換するための手段と、前記文字データを記憶す
るための手段と、を含むことを特徴とするデジタル・カ
メラ。 (16)前記デジタル・カメラが外部装置に通信接続さ
れているとき、記憶された前記画像データおよび記憶さ
れた前記文字データを転送するための手段をさらに含む
上記(15)記載のデジタル・カメラ。 (17)前記画像データが写真を表し、前記音声データ
が、前記写真に関連する音声注釈を表し、前記文字デー
タが、前記写真に関連する文字注釈である上記(15)
記載のデジタル・カメラ。 (18)前記文字注釈を修正する情報をさらに含む上記
(17)記載のデジタル・カメラ。 (19)前記変換手段が、画像捕捉ルーチン、音声記録
ルーチンおよび音声認識ルーチンを実行するように作動
することができるマイクロプロセッサを含む上記(1
5)記載のデジタル・カメラ。 (20)前記マイクロプロセッサがさらに、データ転送
ルーチンを実行するように作動することができる上記
(19)記載のデジタル・カメラ。 (21)外部電力および通信を提供するための手段をさ
らに含む上記(15)記載のデジタル・カメラ。
【図面の簡単な説明】
【図1】本発明のデジタル・カメラ・システム100を
示す図である。
【図2】図1に示すデジタル・カメラを例示するブロッ
ク図である。
【図3】図1に示すシステムの動作のプロセスを示す流
れ図である。
【図4】図2に示すメモリに記憶されるデータのフォー
マットを例示する図である。
【図5】図2に示すメモリに記憶されるデータのフォー
マットを例示するもう一つの図である。
【符号の説明】
102 デジタル・カメラ 201 画像感知装置 206 A/D変換器 208 マイクロプロセッサ 209 音声感知装置 210 マイクロフォン 212 A/D変換器 214 メモリ 216 入出力アダプタ 218 電源 224 音声認識ユニット

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】画像を構成する光を受け、前記画像を表す
    画像データを出力するように作動することができる画像
    感知装置と、 前記画像データを記憶するように作動することができる
    第一のメモリと、 音声を受け、前記音声を表す音声データを出力するよう
    に作動することができる音声感知装置と、 前記音声データを記憶するように作動することができる
    第二のメモリと、 文字データを記憶するように作動することができる第三
    のメモリと、 デジタル・カメラに外部電力が供給されると、前記第二
    のメモリにアクセスし、記憶された前記音声データを文
    字データに変換し、前記文字データを前記第三のメモリ
    に記憶するように作動することができる音声認識装置
    と、を含むデジタル・カメラ。
  2. 【請求項2】前記デジタル・カメラが外部装置に通信接
    続されている場合、前記第一のメモリおよび前記第三の
    メモリにアクセスし、記憶された前記画像データおよび
    記憶された前記文字データを転送するように作動するこ
    とができる入出力アダプタをさらに含む請求項1記載の
    デジタル・カメラ。
  3. 【請求項3】前記画像データが写真を表し、前記音声デ
    ータが、前記写真に関連する音声注釈を表し、前記文字
    データが、前記写真に関連する文字注釈である請求項1
    記載のデジタル・カメラ。
  4. 【請求項4】前記文字注釈を修正する情報をさらに含む
    請求項3記載のデジタル・カメラ。
  5. 【請求項5】前記音声認識装置が、画像捕捉ルーチン、
    音声記録ルーチンおよび音声認識ルーチンを実行するよ
    うに作動することができるマイクロプロセッサを含む請
    求項1記載のデジタル・カメラ。
  6. 【請求項6】前記マイクロプロセッサがさらに、データ
    転送ルーチンを実行するように作動することができる請
    求項5記載のデジタル・カメラ。
  7. 【請求項7】外部電力および通信接続が受け台アセンブ
    リによって提供される請求項1記載のデジタル・カメ
    ラ。
  8. 【請求項8】デジタル・カメラを作動させる方法であっ
    て、 画像を構成する光を受け、前記画像を表す画像データを
    出力するステップと、 前記画像データを記憶するステップと、 音声を受け、前記音声を表す音声データを出力するステ
    ップと、 前記音声データを記憶するステップと、 前記デジタル・カメラに外部電力が供給されると、記憶
    された前記音声データを文字データに変換するステップ
    と、 前記文字データを記憶するステップと、を含むことを特
    徴とする方法。
  9. 【請求項9】前記デジタル・カメラが外部装置に通信接
    続されているとき、記憶された前記画像データおよび記
    憶された前記文字データを転送するステップをさらに含
    む請求項8記載の方法。
  10. 【請求項10】前記画像データが写真を表し、前記音声
    データが、前記写真に関連する音声注釈を表し、前記文
    字データが、前記写真に関連する文字注釈である請求項
    8記載の方法。
  11. 【請求項11】前記文字注釈を修正する情報をさらに含
    む請求項10記載の方法。
  12. 【請求項12】前記変換ステップが、画像捕捉ルーチ
    ン、音声記録ルーチンおよび音声認識ルーチンを実行す
    るように作動することができる前記デジタル・カメラ中
    のマイクロプロセッサを使用して前記変換を実行するス
    テップを含む請求項8記載の方法。
  13. 【請求項13】前記マイクロプロセッサがさらに、デー
    タ転送ルーチンを実行するように作動することができる
    請求項12記載の方法。
  14. 【請求項14】外部電力および通信接続を受け台アセン
    ブリによって提供するステップをさらに含む請求項8記
    載の方法。
  15. 【請求項15】画像を構成する光を受け、前記画像を表
    す画像データを出力するための手段と、 前記画像データを記憶するための手段と、 音声を受け、前記音声を表す音声データを出力するため
    の手段と、 前記音声データを記憶するための手段と、 デジタル・カメラが外部電力を供給されると、記憶され
    た前記記録された音声データを文字データに変換するた
    めの手段と、 前記文字データを記憶するための手段と、を含むことを
    特徴とするデジタル・カメラ。
  16. 【請求項16】前記デジタル・カメラが外部装置に通信
    接続されているとき、記憶された前記画像データおよび
    記憶された前記文字データを転送するための手段をさら
    に含む請求項15記載のデジタル・カメラ。
  17. 【請求項17】前記画像データが写真を表し、前記音声
    データが、前記写真に関連する音声注釈を表し、前記文
    字データが、前記写真に関連する文字注釈である請求項
    15記載のデジタル・カメラ。
  18. 【請求項18】前記文字注釈を修正する情報をさらに含
    む請求項17記載のデジタル・カメラ。
  19. 【請求項19】前記変換手段が、画像捕捉ルーチン、音
    声記録ルーチンおよび音声認識ルーチンを実行するよう
    に作動することができるマイクロプロセッサを含む請求
    項15記載のデジタル・カメラ。
  20. 【請求項20】前記マイクロプロセッサがさらに、デー
    タ転送ルーチンを実行するように作動することができる
    請求項19記載のデジタル・カメラ。
  21. 【請求項21】外部電力および通信を提供するための手
    段をさらに含む請求項15記載のデジタル・カメラ。
JP34971299A 1998-12-16 1999-12-09 音声認識注釈を有するデジタル・カメラ Expired - Fee Related JP3272336B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/213,313 US6721001B1 (en) 1998-12-16 1998-12-16 Digital camera with voice recognition annotation
US09/213313 1998-12-16

Publications (2)

Publication Number Publication Date
JP2000184258A true JP2000184258A (ja) 2000-06-30
JP3272336B2 JP3272336B2 (ja) 2002-04-08

Family

ID=22794600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34971299A Expired - Fee Related JP3272336B2 (ja) 1998-12-16 1999-12-09 音声認識注釈を有するデジタル・カメラ

Country Status (2)

Country Link
US (2) US6721001B1 (ja)
JP (1) JP3272336B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100379263C (zh) * 2001-04-06 2008-04-02 索尼公司 数字摄像机
CN105813548A (zh) * 2013-12-12 2016-07-27 欧莱雅 用于评估至少一个面部临床体征的方法
CN113113043A (zh) * 2021-04-09 2021-07-13 中国工商银行股份有限公司 语音转图像方法及装置

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7016595B1 (en) * 1999-05-28 2006-03-21 Nikon Corporation Television set capable of controlling external device and image storage controlled by television set
JP3777922B2 (ja) * 1999-12-09 2006-05-24 コニカミノルタフォトイメージング株式会社 デジタル撮像装置、それを備えた画像処理システム、画像処理装置、デジタル撮像方法および記録媒体
US6542295B2 (en) * 2000-01-26 2003-04-01 Donald R. M. Boys Trinocular field glasses with digital photograph capability and integrated focus function
US8345105B2 (en) * 2000-03-06 2013-01-01 Sony Corporation System and method for accessing and utilizing ancillary data with an electronic camera device
JP2001333378A (ja) * 2000-03-13 2001-11-30 Fuji Photo Film Co Ltd 画像処理機及びプリンタ
JP4124402B2 (ja) * 2000-03-31 2008-07-23 株式会社リコー 画像入力装置
JP2002209175A (ja) * 2000-10-16 2002-07-26 Canon Inc 撮像装置の外部記憶装置及びその制御方法、撮像装置及びその制御方法
US7032182B2 (en) * 2000-12-20 2006-04-18 Eastman Kodak Company Graphical user interface adapted to allow scene content annotation of groups of pictures in a picture database to promote efficient database browsing
JP4434502B2 (ja) * 2001-01-19 2010-03-17 富士フイルム株式会社 デジタルカメラ
US7656426B2 (en) * 2001-04-06 2010-02-02 Sony Corporation Digital camera and data transfer method from a record medium
JP2002359761A (ja) * 2001-05-31 2002-12-13 Asahi Optical Co Ltd デジタルカメラ用クレードル
US7075579B2 (en) * 2001-06-05 2006-07-11 Eastman Kodak Company Docking station assembly for transmitting digital files
JP4812190B2 (ja) * 2001-06-20 2011-11-09 オリンパス株式会社 画像ファイル装置
US20040201681A1 (en) * 2001-06-21 2004-10-14 Jack Chen Multimedia data file producer combining image and sound information together in data file
US7158175B2 (en) * 2001-11-30 2007-01-02 Eastman Kodak Company System including a digital camera and a docking unit for coupling to the internet
GB2383247A (en) * 2001-12-13 2003-06-18 Hewlett Packard Co Multi-modal picture allowing verbal interaction between a user and the picture
GB0129787D0 (en) * 2001-12-13 2002-01-30 Hewlett Packard Co Method and system for collecting user-interest information regarding a picture
US20030133015A1 (en) * 2001-12-17 2003-07-17 Jackel Lawrence David Web-connected interactive digital camera
US20030204403A1 (en) * 2002-04-25 2003-10-30 Browning James Vernard Memory module with voice recognition system
US7398209B2 (en) 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7843495B2 (en) * 2002-07-10 2010-11-30 Hewlett-Packard Development Company, L.P. Face recognition in a digital imaging system accessing a database of people
US8064650B2 (en) * 2002-07-10 2011-11-22 Hewlett-Packard Development Company, L.P. File management of digital images using the names of people identified in the images
US7693720B2 (en) 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
KR100458642B1 (ko) * 2002-09-19 2004-12-03 삼성테크윈 주식회사 휴대용 디지털 장치에서 대표-음성을 이용하여데이터-파일들을 관리하는 방법
FR2844935B1 (fr) * 2002-09-25 2005-01-28 Canon Kk Transcodage de donnees numeriques
US20040085454A1 (en) * 2002-11-04 2004-05-06 Ming-Zhen Liao Digital camera capable of transforming the audio input to its picture immediately into a readable illustration and transmitting same
US7324943B2 (en) * 2003-10-02 2008-01-29 Matsushita Electric Industrial Co., Ltd. Voice tagging, voice annotation, and speech recognition for portable devices with optional post processing
US20050114131A1 (en) * 2003-11-24 2005-05-26 Kirill Stoimenov Apparatus and method for voice-tagging lexicon
JP4018678B2 (ja) * 2004-08-13 2007-12-05 キヤノン株式会社 データ管理方法および装置
US20060092291A1 (en) * 2004-10-28 2006-05-04 Bodie Jeffrey C Digital imaging system
JP4396511B2 (ja) * 2004-12-20 2010-01-13 ソニー株式会社 プリントシステム
US7627638B1 (en) * 2004-12-20 2009-12-01 Google Inc. Verbal labels for electronic messages
JP2006197115A (ja) * 2005-01-12 2006-07-27 Fuji Photo Film Co Ltd 撮像装置及び画像出力装置
FR2881910B1 (fr) * 2005-02-09 2007-05-25 Eastman Kodak Co Equipement de prise de vue et procede de transmission d'images par reseau local
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7620549B2 (en) 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
US7634409B2 (en) * 2005-08-31 2009-12-15 Voicebox Technologies, Inc. Dynamic speech sharpening
US7529772B2 (en) * 2005-09-27 2009-05-05 Scenera Technologies, Llc Method and system for associating user comments to a scene captured by a digital imaging device
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US8467672B2 (en) * 2005-10-17 2013-06-18 Jeffrey C. Konicek Voice recognition and gaze-tracking for a camera
US20070250526A1 (en) * 2006-04-24 2007-10-25 Hanna Michael S Using speech to text functionality to create specific user generated content metadata for digital content files (eg images) during capture, review, and/or playback process
US8375283B2 (en) * 2006-06-20 2013-02-12 Nokia Corporation System, device, method, and computer program product for annotating media files
US8301995B2 (en) * 2006-06-22 2012-10-30 Csr Technology Inc. Labeling and sorting items of digital data by use of attached annotations
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US8396280B2 (en) * 2006-11-29 2013-03-12 Honeywell International Inc. Apparatus and method for inspecting assets in a processing or other environment
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US8438214B2 (en) * 2007-02-23 2013-05-07 Nokia Corporation Method, electronic device, computer program product, system and apparatus for sharing a media object
US20090002497A1 (en) * 2007-06-29 2009-01-01 Davis Joel C Digital Camera Voice Over Feature
US8059882B2 (en) 2007-07-02 2011-11-15 Honeywell International Inc. Apparatus and method for capturing information during asset inspections in a processing or other environment
JP5144424B2 (ja) * 2007-10-25 2013-02-13 キヤノン株式会社 撮像装置及び情報処理方法
US20090107212A1 (en) * 2007-10-30 2009-04-30 Honeywell International Inc. Process field instrument with integrated sensor unit and related system and method
US8385588B2 (en) * 2007-12-11 2013-02-26 Eastman Kodak Company Recording audio metadata for stored images
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
EP2225758A2 (en) * 2007-12-21 2010-09-08 Koninklijke Philips Electronics N.V. Method and apparatus for playing pictures
US8589161B2 (en) * 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US9383225B2 (en) * 2008-06-27 2016-07-05 Honeywell International Inc. Apparatus and method for reading gauges and other visual indicators in a process control system or other data collection system
US8941740B2 (en) * 2008-09-05 2015-01-27 Honeywell International Inc. Personnel field device for process control and other systems and related method
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US9502025B2 (en) 2009-11-10 2016-11-22 Voicebox Technologies Corporation System and method for providing a natural language content dedication service
US9171541B2 (en) 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
US8462231B2 (en) * 2011-03-14 2013-06-11 Mark E. Nusbaum Digital camera with real-time picture identification functionality
US9247306B2 (en) * 2012-05-21 2016-01-26 Intellectual Ventures Fund 83 Llc Forming a multimedia product using video chat
US20140078331A1 (en) * 2012-09-15 2014-03-20 Soundhound, Inc. Method and system for associating sound data with an image
CN104683683A (zh) * 2013-11-29 2015-06-03 英业达科技有限公司 拍摄影像的系统及其方法
US9984457B2 (en) 2014-03-26 2018-05-29 Sectra Ab Automated grossing image synchronization and related viewers and workstations
US9898459B2 (en) 2014-09-16 2018-02-20 Voicebox Technologies Corporation Integration of domain information into state transitions of a finite state transducer for natural language processing
WO2016044290A1 (en) 2014-09-16 2016-03-24 Kennewick Michael R Voice commerce
US9747896B2 (en) 2014-10-15 2017-08-29 Voicebox Technologies Corporation System and method for providing follow-up responses to prior natural language inputs of a user
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
WO2018023106A1 (en) 2016-07-29 2018-02-01 Erik SWART System and method of disambiguating natural language processing requests
US10489633B2 (en) 2016-09-27 2019-11-26 Sectra Ab Viewers and related methods, systems and circuits with patch gallery user interfaces

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6084630A (en) * 1991-03-13 2000-07-04 Canon Kabushiki Kaisha Multimode and audio data compression
US5498949A (en) * 1993-08-16 1996-03-12 Eastman Kodak Company Rechargeable device with operational inhibit during recharging
US5546145A (en) * 1994-08-30 1996-08-13 Eastman Kodak Company Camera on-board voice recognition
US5692225A (en) 1994-08-30 1997-11-25 Eastman Kodak Company Voice recognition of recorded messages for photographic printers
US5737491A (en) 1996-06-28 1998-04-07 Eastman Kodak Company Electronic imaging system capable of image capture, local wireless transmission and voice recognition
US6031526A (en) * 1996-08-08 2000-02-29 Apollo Camera, Llc Voice controlled medical text and image reporting system
US5940121A (en) * 1997-02-20 1999-08-17 Eastman Kodak Company Hybrid camera system with electronic album control
US6469738B1 (en) * 1997-02-26 2002-10-22 Sanyo Electric Co., Ltd. Frames allowable to be shot in a digital still camera
US6181883B1 (en) * 1997-06-20 2001-01-30 Picostar, Llc Dual purpose camera for VSC with conventional film and digital image capture modules

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100379263C (zh) * 2001-04-06 2008-04-02 索尼公司 数字摄像机
CN105813548A (zh) * 2013-12-12 2016-07-27 欧莱雅 用于评估至少一个面部临床体征的方法
CN105813548B (zh) * 2013-12-12 2020-04-24 欧莱雅 用于评估至少一个面部临床体征的方法
CN113113043A (zh) * 2021-04-09 2021-07-13 中国工商银行股份有限公司 语音转图像方法及装置

Also Published As

Publication number Publication date
US6721001B1 (en) 2004-04-13
USRE41602E1 (en) 2010-08-31
JP3272336B2 (ja) 2002-04-08

Similar Documents

Publication Publication Date Title
JP3272336B2 (ja) 音声認識注釈を有するデジタル・カメラ
KR100856407B1 (ko) 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법
JP2000232599A (ja) ディジタル・カメラ、動作方法、コンピュータ可読記録媒体、コンピュータ・システム、自動及びディジタル写真
US8462231B2 (en) Digital camera with real-time picture identification functionality
JP2006515138A (ja) 移動電話システムにおけるマルチメディアデータ及び関連する注釈データの格納及び検索
US20070236583A1 (en) Automated creation of filenames for digital image files using speech-to-text conversion
JP2002511717A (ja) デジタル画像撮像装置のための方法及びシステム
JP2000194533A (ja) 音声コマンド注釈方法
US20060036441A1 (en) Data-managing apparatus and method
WO2015074203A1 (zh) 一种图片展示方法及装置、终端设备
CN111564157A (zh) 会议记录优化方法、装置、设备及存储介质
KR20040051528A (ko) 디지털 카메라
US20220215050A1 (en) Picture Search Method and Device
JP2005346259A (ja) 情報処理装置及び情報処理方法
JP5246592B2 (ja) 情報処理端末、情報処理方法、及び情報処理プログラム
JP4295540B2 (ja) 音声記録方法および装置、デジタルカメラ、並びに画像再生方法および装置
JP2003309798A (ja) 撮像機能を備えた電子機器、画像データ出力システム、および画像データ出力方法
JP2004078837A (ja) 情報処理装置およびその制御方法、ならびにプログラム
JP2005184469A (ja) デジタルスチルカメラ
JP2003333470A (ja) デジタルカメラのデータ管理方法
JP2003348524A (ja) 通信機能付きデジタルカメラ
JPH11355627A (ja) デジタルスチルカメラ
JP3183220B2 (ja) ディジタルカメラ画像のコメント入力装置
JP2004208276A (ja) 撮像装置
TWI375462B (en) Digital camera and image name setting method

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
R150 Certificate of patent or registration of utility model

Ref document number: 3272336

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090125

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090125

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090125

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100125

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100125

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110125

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120125

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130125

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees