JP4438194B2 - 携帯電話機及び未整理の視覚情報処理方法 - Google Patents

携帯電話機及び未整理の視覚情報処理方法 Download PDF

Info

Publication number
JP4438194B2
JP4438194B2 JP2000229604A JP2000229604A JP4438194B2 JP 4438194 B2 JP4438194 B2 JP 4438194B2 JP 2000229604 A JP2000229604 A JP 2000229604A JP 2000229604 A JP2000229604 A JP 2000229604A JP 4438194 B2 JP4438194 B2 JP 4438194B2
Authority
JP
Japan
Prior art keywords
search
visual information
information
audio
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000229604A
Other languages
English (en)
Other versions
JP2002041529A (ja
Inventor
敦夫 滑川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000229604A priority Critical patent/JP4438194B2/ja
Publication of JP2002041529A publication Critical patent/JP2002041529A/ja
Application granted granted Critical
Publication of JP4438194B2 publication Critical patent/JP4438194B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は携帯電話機及び携帯電話機に用いて好適な未整理の視覚情報処理方法に関する。
【0002】
【従来の技術】
従来から、携帯電話機或は送受信機能を有するPDA(個人情報端末)1等では図10に示す様に動画や静止画像を撮像するデジタルビデオカメラ2、静止画像等を撮影可能なデジタルスチールカメラ3、携帯電話機1に内蔵の撮像カメラ15からの映像情報やインターネット網4からのテキスト情報等(本発明では映像情報及びテキスト情報等の表示装置上に映出される情報を視覚情報として定義して、以下、視覚情報と記す)を容易に取得することが可能になっている。
【0003】
例えば、デジタルビデオカメラ2と携帯電話機1との間ではUSB:IEEE1394(Universal Serial Bus:Instituteof Electrical and Electronics Engineers 1394)等のインタフェースを介して有線による接続によって、またデジタルスチールカメラ3と携帯電話機1間ではBluetooth(近距離での無線による送受信接続用インタフェース)等のインタフェースを介する無線による送受信によって、更に、インターネット網4の各ウェブ(Web)サイト5a,5b,5c‥‥からの各種テキストデータや図形、映像データ等の視覚情報は携帯電話基地局6及び電波塔7を介して無線によって容易にダウンロードが可能であり、携帯電話機〔本発明では携帯電話端末、(64kbps)携帯情報端末、(164kbps〜384kbps)、カーマルチメディア端末(64kbps,128kbps,144kbps)、携帯用のマルチメディア端末(2Mbps)等を含めて、携帯電話機として説明を進める。〕にメモリスティックやフラッシュメモリ等の小型メモリカードやBluetooth用の送受信用カード等が搭載可能とされ、大量の視覚情報を携帯電話機のメモリ内に格納可能で且つPDA等でも送受信が可能と成されている。
【0004】
【発明が解決しようとする課題】
上述の携帯電話機1ではLCD等の表示装置8の表示面が極めて小さく、且つテンキー等の操作部9のキー数が少ないために、例えば小型メモリカード内に格納した未整理の複数の視覚情報ファイルを検索するためにタイトルや説明情報をキーを介して入力しようとすると、一般の比較的大きな表示装置及び文字入力用のキーボードを有するものに比べて操作性が悪く、且つ、長時間を要する課題があった。
【0005】
本発明は叙上の課題を解決するためになされたものであり、発明が解決しようとする課題は携帯電話機が有する基本機能である音声送受信機能から音声ファイルを作成し、この音声ファイルを複数の視覚情報ファイルにタイトルとして添付することで所定の画像等の視覚情報を容易に検索可能な携帯電話機及び未整理の視覚情報処理方法を提供しようとするものである。
【0006】
【課題を解決するための手段】
発明の携帯電話機は、複数の未整理の視覚情報をファイルに取得する視覚情報取得手段と、未整理の視覚情報ファイルに対応する検索用音声情報を作成する検索用音声情報作成手段と、視覚情報と上記検索用音声情報を記憶する記憶手段と、視覚情報と検索用音声情報を記憶手段内にマージ或はリンクさせる検索ファイル作成手段と、音声再生手段と、表示手段と、キー入力手段と、上記視覚情報の検索時に、上記記憶手段に記憶されている上記検索用音声情報を順番に上記音声再生手段から再生させるとともに、現在再生されている検索用音声情報に上記マージ或はリンクされている上記視覚情報が検索対象の視覚情報であるか否かの入力を促す表示を上記表示手段に行わせ、検索対象の視覚情報であることを示す入力が上記キー入力手段によって行われた場合には、上記記憶手段に記憶されている当該視覚情報を上記表示手段に表示させる検索処理手段とを具備して成るものである。
【0008】
また本発明の携帯電話機は、上記検索処理手段は、現在再生されている検索用音声情報に上記マージ或はリンクされている上記視覚情報が検索対象の視覚情報であるか、直前に再生した検索用音声情報に戻るか、または次の検索用音声情報に移るかの入力を促す表示を上記表示手段に行わせ、直前に再生した検索用音声情報に戻ることを示す入力が上記キー入力手段によって行われた場合には、直前に再生した検索用音声情報を再び上記音声再生手段から再生させるように成したものである。
また本発明の携帯電話機は、上記音声再生手段の再生速度を高速或は低速に可変可能な再生速度可変手段を有するように成したものである。
【0009】
本発明の未整理の視覚情報処理方法は、携帯電話機に設けられた制御手段が、複数の未整理の視覚情報をファイルに取得する視覚情報取得ステップと上記制御手段が、未整理の視覚情報ファイルに対応する検索用音声情報を作成する検索用音声情報作成ステップと上記制御手段が、視覚情報と検索用音声情報を記憶手段内にマージ或はリンクさせる検索ファイル作成ステップと、上記制御手段が、上記視覚情報の検索時に、上記記憶手段に記憶されている上記検索用音声情報を順番に音声再生手段から再生させるとともに、現在再生されている検索用音声情報に上記マージ或はリンクされている上記視覚情報が検索対象の視覚情報であるか否かの入力を促す表示を表示手段に行わせ、検索対象の視覚情報であるとの入力がキー入力手段によって行われた場合には、上記記憶手段に記憶されている当該視覚情報を上記表示手段に表示させる検索処理ステップとを具備してなるものである。
【0010】
本発明の携帯電話機及び未整理の視覚情報処理方法によれば記憶手段に格納された複数の視覚情報を検索する際に携帯電話機では入力し難いテキストデータとして入力することなく、容易に入力可能な音声をタイトル、説明情報として添付することが可能で、複数の視覚情報の整理、検索を容易にすることが出来る
【0012】
また本発明の携帯電話機によれば、音声情報ファイルを作成する際に、再生速度制御可能な音声コーデックを使用することにより、検索時間を短縮化することができる。
【0013】
【発明の実施の形態】
以下、本発明の携帯電話機及び未整理の視覚情報処理方法を図1乃至図9によって説明する。
【0014】
図1は本発明の携帯電話機の機能ブロック図、図2は本発明の携帯電話機のブロック図、図3乃至図6は動作説明用のフローチャート図、図7乃至図9はファイル説明図である。
【0015】
本発明に用いる携帯電話機1は図2のブロック図に示す様に送受信用アンテナ30、RFブロック31、変復調ブロック32を含む送受信用無線部、スピーカ33、デジタル−アナログ変換器(D/A)34を含む音声及びダイヤラ信号放音用の音声出力部とマイクロホン35、アナログ−デジタル変換器(A/D)36を含む音声入力部を有する音声コーデック部39、キーボードを含む小さな操作部9、LCD等の小さな表示部8、マイクロコンピュータ(CPU)、デジタルシグナルプロセッサ(DSP)等のシステム及び伝送制御用のプロセッサ部37とプログラム・データ用のROM,RAM等の内蔵メモリ部38、メモリカード等の外部メモリ部11a,11b、携帯電話機1内蔵の撮像カメラ15及び画像コーデック部40を有し、これら各部分はバスを介してプロセッサ37に接続されている。
【0016】
外部メモリ(メモリ・スティックカード、PCカード、スマート・メディアカード、ミニチュアカード、コンパクト・フラッシュカード)11a,11bは携帯電話機1の外筺に設けたカード挿入用のスロットを介して着脱自在と成されている。
【0017】
上述のハードウェア構成に於ける、本発明の機能ブロックを図1に示す。図1に於いて、画像情報等の視覚情報ファイル27と音声情報ファイル28は外部メモリ11a,11b内に格納される。
【0018】
図1では二つの外部メモリ11a,11bとして書かれているが1つのメモリでよく、外部メモリ11a,11bでなく携帯電話機1に内蔵された内蔵メモリ(内蔵メモリ部38以外)であってもよい。
【0019】
図10で説明した様にデジタルビデオカメラ2、デジタルスチルカメラ3、イメージスキャナ等の他のデバイス12(図1参照)から取り出された静止画や動画等の画像情報とインタラネットやインターネット等13のパーソナルコンピュータやPDA等から取り出された図形、表、テキスト情報及び画像情報と図形、表、テキスト情報を組合せた組合せ情報が視覚情報として外部入力部14に供給される。
【0020】
外部入力部14は物理的にはUSBであったり、無線で送受信されるデジタルデータをベースバンドのデジタルデータに変換するBluetooth用のモデムであったりする。これら視覚情報を取得するための制御ソフトウェアはプロセッサ37内に含まれ、これらを含めて外部入力部14としている。
【0021】
内蔵画像デバイスは携帯電話機1内蔵のCCD、CMOSセンサ等の撮像カメラ15であり、画像ファイル作成部16は図2の画像コーデック部40と上述の外部入力部14に対応しているので内蔵画像デバイス15の出力を外部入力部に供給するようにしてもよい。
【0022】
メモリ11aに格納された画像情報、テキスト情報等の視覚情報ファイル27は画像表示・選択部17及びテキスト表示・選択部23によりLCD等の表示部8上に表示、選択される。
【0023】
次に音声ファイル作成部19は携帯電話機1内にすでに備わっている機能としての音声入力デバイス(マイクロホン)35及び音声コーデック部39並びに音声再生・選択部22等を利用する。
【0024】
一般に携帯電話機1では図2に示す様にマイクロホン35から入力した音声情報信号はA/D36でデジタルデータに変換後に決められた音声コーデック・フォーマットに音声コーデック部39でエンコードし、そのデジタルデータを無線で送信可能な様に変復調部32及びRFブロック部31を介してアンテナ30より送信する。
【0025】
また、アンテナ30で受信した信号はRFブロック部31及び変復調部32で復調してデジタルデータに戻し、音声コーデック部39で音声コーデックフォーマットに従ってデコードし、D/A34でアナログ信号に変換してスピーカ33に出力される。
【0026】
本発明は、音声ファイル作成部19により音声コーデック・フォーマットにエンコードしてメモリ11bに音声情報ファイル28としてファイルさせ、この音声情報ファイル28をデコードし、再生、選択する音声再生、選択部22(音声コーデック部39)を用いて画像情報、テキスト情報等の複数の未処理の視覚情報に説明情報、検索情報としてのタイトルを添付(マージ)させる音声ファイル添付部24を設けて、iモードやEZ−Webなどと称されるインターネット網からダウンロードした複数の未整理の視覚情報を整理し、検索を容易にしようとするものである。
【0027】
従来から、複数の未整理の視覚情報を扱う際に、ユーザがインデックス番号やファイル名等の検索情報を入力することなく、自動的にファイルの区別を行なうためダウンロード時や視覚情報の作成順に通しのインデックス番号を付加するとか、ファイルへのダウンロードや作成時のタイムスタンプをファイル名とする方法があるが、必要な視覚情報を探す際には順次画像等の視覚情報を表示部8に表示しなくてはならず面倒である。そこで単純なインデックス番号やタイムスタンプのファイル名でなく、より効率良くファイルを整理するために、ユーザが識別するためのタイトルをつけることが必要になるのだが携帯電話機ではキーがパーソナルコンピュータ等に比べて少なく文字タイトルの入力も容易でない。
【0028】
本発明は、携帯電話機の基本機能である音声ファイルが容易に作成できる部分に着目し、この音声ファイルを、整理が必要な複数の画像等のファイルにタイトル或は画像等ファイルの説明として添付する機能を新たに追加することで上記問題を解決しようとするものである。
【0029】
図3は上述の音声情報ファイルを視覚情報の1つである画像情報ファイルにタイトル等の検索情報として添付するためのプロセッサ(以下CPUと記す)37による音声ファイル添付処理のフローチャートを示すものである。
【0030】
図3の第1ステップS1 ではデジタルビデオカメラ2、デジタルスチルカメラ3等の他のデバイス12からUSBやBluetooth等で取得した画像情報或はインターネット網等13からのテキスト情報、図形情報等の視覚情報をダウンロードする。
【0031】
第2ステップS2 ではダウンロード時刻に基づいて自動的にファイル名やタイムスタンプ等が付加される。
【0032】
この状態で表示部8にはダウンロードした画像8aや画像8aを保存するか否かの質問文8bが表示される。
【0033】
第3ステップS3 ではCPU37はダウンロードした画像を保存するか否かを判断する。ユーザは表示部8上の質問文8bの0(はい)、1(いいえ)をクリックする。NOであれば第4ステップS4 に進み画像8aを表示して終了し、YESであれば第5ステップS5 に進められる。
【0034】
第5ステップS5 では音声入力メッセージの表示が成され、表示部8にはダウンロード画像8aと共に「音声を入力して下さい」等のメッセージ8cが表示される。
【0035】
第6ステップS6 ではユーザが表示部8の画像8aを視ながら画像8aに対応した検索用タイトル、説明文等をマイクロホン35を介して音声で例えば「逗子海岸の夕日」等と入力する。
【0036】
第7ステップS7 ではCPU37は音声コーデック部39及びD/A34を介してスピーカ33から「逗子海岸の夕日」と再生する。
【0037】
第8ステップS8 では音声再生音がOKか否かをユーザに求め、表示部8に「OKですか」の質問文8dを表示する。ユーザは「1」或は「0」をクリックすることでNOであれば第5ステップS5 の頭に戻されるが、YESであれば第9ステップS9 に進む。
【0038】
第9ステップS9 では音声情報ファイルを画像等の視覚情報ファイルとマージすることで図7に示す様に1つのファイルに併合させる。
【0039】
図7は音声ファイル添付部24で視覚情報ファイル27と音声情報ファイル28を1つにまとめたファイル・イメージを示すものであり、50は第2ステップS2 で自動生成されたファイル名等のテキスト索引部、51は第6ステップS6 で音声情報ファイル27に格納した「逗子海岸の夕日」等の音声情報ファイル、52は第1ステップS1 でデジタルビデオカメラ3等から取得した画像8aを格納した画像等の視覚情報ファイルである。尚ファイル名50は00年03月01日16時25分00秒(000301162500,PCK)の様なタイムスタンプであってもよい。
【0040】
この様に音声情報ファイル51と視覚情報ファイル52をマージして1つのファイルとした後に終了に至ることになる。
【0041】
次に、上述の様にマージした複数の未整理の視覚情報ファイルから所定の視覚情報を検索する場合のフローチャートを図4に示す。
【0042】
図4に於いて、第1ステップST1 ではCPU37は音声タイトルを再生するか否かを表示部8に表示する。例えば表示部8の画面上には「音声を再生しますか」等の質問文8eが表示される。ユーザはYESでは「0」をクリックし、NOでは「1」をクリックする。
【0043】
第1ステップST1 でNOであれば第2ステップST2 に進んで従来一般に行なわれている様な複数の画像等の視覚情報ファイルを順次、表示させ、これら表示画像を見ながら所定の視覚情報検索を行なう様な従来の処理が行なわれる。
【0044】
第1ステップST1 がYESであれば、第3ステップST3 でCPU37はスピーカ33を介して視覚情報ファイルにマージした音声タイトルを順番に再生する。
【0045】
この様な再生時に音声を単純に通常の速度で再生するステップ(第5ステップST5 )の場合、入力時に文字で入力する場合に比べれば音声で入力するので入力方法は容易であるが、検索時には画像を順番に見に行く第2ステップST2 に比べて時間がかかってしまう可能性があるので、第4ステップST4 で早聞き操作を行なうか否かを判断させる。
【0046】
この早聞機能は図1の音声再生、選択部22内に設けられた再生速度可変制御部22aで行ない、この音声コーデックはMPEG−4(Moving Picture Experts Group−4:オーディオビジュアルオブジェクト符号化規格)HVXC(armonic ector ecitation oding)を用いることで早聞き、遅聞き再生を容易に行なうことが出来る。
【0047】
パラメトリック符号化であるHVXCでの音声符号化のビットレートは2kbps〜4kbpsであるが可変ビットレートモードによって1.2kbps程度まで使用可能である。人間の声等の有声音をスペクトル分布させるとハーモニックと呼ばれる一様な信号になるがHVXCではこの中から位相情報を捨てたハーモニック振幅列として周波数や振幅(ピッチ)等を量子化しているので再生側で認識可能で、速度やピッチの制御・変更が容易に可能となっている。
【0048】
この場合、早聞き、遅聞きに対応するキー操作は例えば「早聞きしますか」等の質問文8fが表示部8の画面上に表示され、「0」:はい、「1」:いいえのいずれかをクリックすることで早聞き操作か否かの判断が成され、NOでは上記した様に第5ステップST5 の通常再生が行なわれ、YESでは第6ステップST6 によって速度可変制御部22aで早聞き、遅聞き等の再生が成される。
【0049】
第5ステップST5 及び第6ステップST6 終了後は第7ステップST7 に進んで再生された音声タイトルに対応した画像等の視覚情報でOKか否かを判断する。
【0050】
即ち、表示部8の画面には「この音声に対応する画面ですか」と「0」:はい、「1」:戻る、「2」:次へ等の質問文8gが表示される。従って、例えば「逗子海岸の夕日」と云う音声タイトルが再生されたらYESとし「0」をクリックすることで第8ステップST8 に進む。NOでは第4ステップST4 の頭に戻され、「1」のクリックでは元の早聞きが再度再生され、「2」のクリックでは次の音声タイトルが再生される。
【0051】
第8ステップST8 では対応する画像等の視覚情報ファイルの「逗子海岸の夕日」に対応した画像8aが表示部8に表示されてファイル検索、再生表示終了に至る。
【0052】
上述の検索方法によれば、所定の未整理の複数の視覚情報から所定の視覚情報を音声タイトルを開いて高速に検索することが出来る。
【0053】
更に図3で説明した音声情報ファイル添付処理の第1ステップS1 乃至第8ステップS8 に続けて、図1の機能ブロックに示す様に音声認識テキスト変換部25及び音声ファイル並び替え部26を介して、29で示す様なイメージのテキスト索引付音声ファイルを作成することで視覚情報を効率よく検索整理可能な携帯電話機及び未整理の視覚情報処理方法を図5及び図6並びに図8及び図9によって説明する。
【0054】
図1の音声認識・テキスト変換部25ではメモリ11bの音声情報ファイル28から取り出した音声情報をテキスト(文字)に変換する。ここで重要なのは通常の会話をすべて正しくテキストへ変換するには、プロセッサ能力、メモリ容量を考えても携帯電話機に搭載するのは困難を要するので、ここでの音声認識・テキスト変換部24は、音声情報ファイルを(例えば辞書順に)並び替えるために必要な音声情報ファイルの先頭の一部(一単語程度)のみをテキストに変換するだけの機能でよい。この様にテキスト変換されたテキスト索引付音声情報のファイル29はテキストタグ(例えば辞書順)を元の並び替えが音声情報ファイルの並び替え部26で行なわれる。
【0055】
図5に於いては、携帯電話機1のモード設定時に索引(インデックス)作成モードになっていることを前提とし、図3で説明した第1〜第8ステップS1 〜S8 での音声ファイル添付処理が終了した第8ステップS8 がYESの状態から第1ステップSTE1 のインデックス作成モードか否かをCPU37は判断し、インデックスを作成しない場合は第2ステップSTE2 から第3ステップSTE3 に進んで音声情報ファイルを画像等の視覚情報ファイルとマージさせて終了に至る。
【0056】
一方、インデックス作成モードがYESであれば第4ステップSTE4 に進んで音声情報ファイルの先頭部を切り出し、音声認識する。
【0057】
第5ステップSTE5 では音声認識結果から「逗子海岸の夕日」の一部「ズシカイガン」と云うインデックスを作成する。
【0058】
第6ステップSTE6 ではインデックス、音声情報ファイルを画像等の視覚情報ファイルとマージする。
【0059】
第7ステップSTE7 では検索のために画像等の視覚情報ファイルのインデックスによるソートが行なわれる。例えば辞書順に並び替えが行なわれた後にインデックス作成処理終了に至る。
【0060】
上述ではインデックスによる並び替えを第7ステップSTE7 で行なったが、第6ステップS6 の音声情報ファイル作成時に並び替えたり、第7ステップS7 での音声再生時に選択された(例えば「ズ」で始まる音声を指定)音声が再生できればテキストのインデックスが付けられたまま並び替えることなくメモリ11b上に保存されていてもよい。
【0061】
上述のインデックス作成処理の第6ステップSTE6 でインデックス、音声情報ファイル、画像等の視覚情報ファイルのマージで作成した1つのファイルのイメージは図7に示す様に例えば「ズシカイガン」の様なインデックス53が付加される。
【0062】
この様な1つのファイル内に3つの各ファイル(インデックス、音声情報、視覚情報)をまとめた場合、一度作成した1つのファイルに対し、例えば音声情報ファイルだけを付け替え(関連付けの変更)る場合に、プロセッサの負荷が大きくなり、メモリの利用効率も悪くなる。
【0063】
そこでテキストのタグファイルを作成し、複数のファイルをリンクさせることで検索を容易にし、メモリも小容量化可能にすることも出来る。これを図8及び図9を用いて説明する。
【0064】
図8(A)の27は図3の第1ステップS1 でダウンロード等により取得した画像等の視覚情報ファイルであり、例えば000426190000.jpgは取得日時にしたがって自動的に第2ステップS2 で付加したファイル名であるが携帯電話機1でのファイル名と重複しない様にしている。
【0065】
図8(B)の28は図3の第6ステップS6 で作成した「逗子海岸の夕日」という音声情報ファイルであり、例えば00042190200.wavは音声情報ファイルのファイル名である。
【0066】
図8(C)の53は音声情報ファイル28の先頭から音声認識により音声からテキストに変換し、図5の第5ステップSTE5 で作成した「ズシカイガン」と云うインデックスファイルであり、000426190200.txtはインデックス作成時のファイル名である。
【0067】
本発明では上述の視覚情報ファイル27、音声情報ファイル28、インデックスファイル53のファイルをリンクするテキストインデックスタグファイル54を作成する。このテキストインデックスタグファイルを作成する際にファイル名を新たに作成してもよいが図8(C)に示すインデックスファイルは既にテキストなのでこのファイル名を修正したファイル名000426190200.headを作成しリンク情報として〈TITLE〉,〈VOICE〉,〈CONTENTS〉等のタグを定義し、ここに各ファイル名を記述する様にする。
【0068】
又、テキストインデックスタグファイル54をユーザ独自の仕様でなく、国際標準であるXML(Extensible Markup Language)のタグが定義可能なマークアップ言語で記述することによって、携帯電話機に限定されることなく、インターネット上のWebサイト、他のユーザのパーソナルコンピュータ、その他XML記述を認識できる機器でもテキストインデックスタグファイルのリンク情報が認識でき、音声情報ファイル、画像等の視覚情報ファイルをテキストインデックスタグファイルと一緒に配布・管理することで、異なるメディア(音声と画像等の視覚情報)のファイルをまとめて扱うことが、インターネット上のWebサイト、他のユーザのパーソナルコンピュータ、その他XML記述を認識できる機器上で容易になる。
【0069】
図6は、インデックスが付加されたファイル(インデックスモード)でのファイル検索再生、表示のフローチャートを示すものであり、第1ステップSTEP1 ではインデックスを表示するか否かの判断が成された、NOであれば第2ステップSTEP2 で従来の画像表示による検索或は図3で説明した音声タイトルによる検索が行なわれる。
【0070】
第1ステップSTEP1 がYESの場合は、第3ステップSTEP3 に進んでインデックスの一覧表8hを表示部8に表示するか、インデックスの最初の文字を表示する。
【0071】
第4ステップSTEP4 では表示部8の該当する番号、例えば「4」を入力するか、ファイルの多いときは1頁で一覧できないので最初の文字「ズシカイガン」の「ズ」のみを入力する。
【0072】
第5ステップSTEP5 では対応する画像8a等の視覚情報ファイルの表示と音声タイトルが再生される。即ち、表示部8には画像8aと「ズシカイガン」の文字8iが表示されると同時に音声タイトルも再生されて終了に至る。
【0073】
上述の様なインデックスモードでの視覚情報ファイルの検索は
(1)テキストインデックスタグファイル54のタグ〈TITLE〉の中身の一覧表を表示する。
(2)同じテキストインデックスがある場合等は音声ファイルを再生する。
2段階にすることで単純に音声ファイルを再生して探すよりも検索効率を上げることが可能となる。
また、テキストインデックスタグファイル54を設けることで音声情報ファイル28と視覚情報ファイル27を別々に存在させたままでリンクを変更するだけで関連付けの変更が容易に行なえる。更に、音声情報ファイルと視覚情報ファイルの関連付けを1:1だけでなく1つの音声情報ファイルに対して複数の画像等の視覚情報ファイルや、複数の音声情報ファイルを1つの視覚情報ファイルに関連付けすることが可能となり、メモリを節約可能となる。
【0074】
【発明の効果】
本発明の携帯電話機及び未整理の視覚情報の処理方法によれば、(1)インターネット等と接続して得た複数の視覚情報ファイルや、端末内蔵あるいは外部の画像デバイスから入力した複数の視覚情報ファイルについて、携帯電話機では困難なテキスト入力をすることなく、容易に入力可能な音声をタイトル、説明情報として添付することにより、複数の視覚情報ファイルの整理が可能となる。
(2)音声情報ファイルを作成する際に、再生速度制御可能な音声コーデック(例えばMPEG−4 HVXC)を使用することにより、検索時間を短縮化することが出来る。等の多くの効果を奏する。
【図面の簡単な説明】
【図1】本発明の携帯電話機の機能ブロック図である。
【図2】本発明の携帯電話機のブロック図である。
【図3】本発明の音声情報ファイル添付時のフローチャートである。
【図4】本発明のファイル検索時のフローチャートである。
【図5】本発明のインデックス作成時のフローチャートである。
【図6】本発明のインデックスモードのファイル検索時のフローチャートである。
【図7】本発明の音声情報ファイル添付時のファイルのイメージ図である。
【図8】本発明に用いる各ファイルの説明図である。
【図9】本発明のテキストインデックスタグファイルのイメージ図である。
【図10】従来の情報取得方法説明図である。
【符号の説明】
1‥‥携帯電話機、8‥‥表示部、11a,11b‥‥メモリ、14‥‥外部入力部、16‥‥画像ファイル作成部、19‥‥音声ファイル作成部、22‥‥音声情報ファイル添付部、25‥‥音声認識テキスト変換部、27‥‥視覚情報ファイル、28‥‥音声情報ファイル、33‥‥スピーカ、35‥‥マイクロホン

Claims (5)

  1. 複数の未整理の視覚情報をファイルに取得する視覚情報取得手段と、
    上記未整理の視覚情報ファイルに対応する検索用音声情報を作成する検索用音声情報作成手段と、
    上記視覚情報と上記検索用音声情報を記憶する記憶手段と、
    上記視覚情報と上記検索用音声情報を上記記憶手段内にマージ或はリンクさせる検索ファイル作成手段と
    音声再生手段と、
    表示手段と、
    キー入力手段と、
    上記視覚情報の検索時に、上記記憶手段に記憶されている上記検索用音声情報を順番に上記音声再生手段から再生させるとともに、現在再生されている検索用音声情報に上記マージ或はリンクされている上記視覚情報が検索対象の視覚情報であるか否かの入力を促す表示を上記表示手段に行わせ、検索対象の視覚情報であることを示す入力が上記キー入力手段によって行われた場合には、上記記憶手段に記憶されている当該視覚情報を上記表示手段に表示させる検索処理手段とを具備して成
    携帯電話機。
  2. 上記検索処理手段は、現在再生されている検索用音声情報に上記マージ或はリンクされている上記視覚情報が検索対象の視覚情報であるか、直前に再生した検索用音声情報に戻るか、または次の検索用音声情報に移るかの入力を促す表示を上記表示手段に行わせ、直前に再生した検索用音声情報に戻ることを示す入力が上記キー入力手段によって行われた場合には、直前に再生した検索用音声情報を再び上記音声再生手段から再生させる
    請求項記載の携帯電話機。
  3. 上記音声再生手段の再生速度を高速或は低速に可変可能な再生速度可変手段を有する
    請求項1または請求項2記載の携帯電話機。
  4. 携帯電話機に設けられた制御手段が、複数の未整理の視覚情報をファイルに取得する視覚情報取得ステップと、
    上記制御手段が、上記未整理の視覚情報ファイルに対応する検索用音声情報を作成する検索用音声情報作成ステップと、
    上記制御手段が、上記視覚情報と上記検索用音声情報を記憶手段内にマージ或はリンクさせる検索ファイル作成ステップと
    上記制御手段が、上記視覚情報の検索時に、上記記憶手段に記憶されている上記検索用音声情報を順番に音声再生手段から再生させるとともに、現在再生されている検索用音声情報に上記マージ或はリンクされている上記視覚情報が検索対象の視覚情報であるか否かの入力を促す表示を表示手段に行わせ、検索対象の視覚情報であるとの入力がキー入力手段によって行われた場合には、上記記憶手段に記憶されている当該視覚情報を上記表示手段に表示させる検索処理ステップとを具備して成
    未整理の視覚情報処理方法。
  5. 上記検索処理ステップでは、現在再生されている検索用音声情報に上記マージ或はリンクされている上記視覚情報が検索対象の視覚情報であるか、直前に再生した検索用音声情報に戻るか、または次の検索用音声情報に移るかの入力を促す表示を上記表示手段に行わせ、直前に再生した検索用音声情報に戻ることを示す入力が上記キー入力手段によって行われた場合には、直前に再生した検索用音声情報を再び上記音声再生手段から再生させる
    請求項4記載の未整理の視覚情報処理方法。
JP2000229604A 2000-07-28 2000-07-28 携帯電話機及び未整理の視覚情報処理方法 Expired - Fee Related JP4438194B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000229604A JP4438194B2 (ja) 2000-07-28 2000-07-28 携帯電話機及び未整理の視覚情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000229604A JP4438194B2 (ja) 2000-07-28 2000-07-28 携帯電話機及び未整理の視覚情報処理方法

Publications (2)

Publication Number Publication Date
JP2002041529A JP2002041529A (ja) 2002-02-08
JP4438194B2 true JP4438194B2 (ja) 2010-03-24

Family

ID=18722695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000229604A Expired - Fee Related JP4438194B2 (ja) 2000-07-28 2000-07-28 携帯電話機及び未整理の視覚情報処理方法

Country Status (1)

Country Link
JP (1) JP4438194B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030369A (ja) * 2002-06-27 2004-01-29 Yamaha Corp ファイル管理方法、ファイル管理装置およびプログラム
JP4862143B2 (ja) * 2007-04-25 2012-01-25 株式会社Jvcケンウッド 再生装置、プログラム、及び再生方法
TWI496470B (zh) * 2008-03-05 2015-08-11 Univ Nat Central Digital stethoscope for extensive collection of clinical lung tone signals
JP2019135609A (ja) * 2018-02-05 2019-08-15 東京瓦斯株式会社 文字入力支援システム、文字入力支援制御装置、文字入力支援プログラム

Also Published As

Publication number Publication date
JP2002041529A (ja) 2002-02-08

Similar Documents

Publication Publication Date Title
US7221901B2 (en) Image server and image display system
US7162197B2 (en) Picture book production system, server for producing picture book, and recording medium
JP2006085681A (ja) データ転換及びシェアのシステム及び方法
US20080170075A1 (en) Display controller, display control method, display control program, and mobile terminal device
JP2001256162A (ja) 情報処理端末およびコンテンツ取得システム
US20080022845A1 (en) Portable electronic device with a song selcetion function
US6700049B2 (en) Music data providing apparatus, music data receiving apparatus, music data reproducing apparatus, and music data providing method
WO2005043405A1 (ja) データ処理装置、データ処理方法、およびデータ処理プログラム
JP4438194B2 (ja) 携帯電話機及び未整理の視覚情報処理方法
KR20110053397A (ko) 검색 키워드를 이용한 멀티미디어 파일 검색 방법 및 그 휴대기기
US20060089736A1 (en) Music reproducing apparatus, mobile phone conversation apparatus, music reproducing system, and operating method thereof
CN1300158A (zh) 便携式无线通信终端及其表现风格的处理方法
JP2007058103A (ja) 歌詞ダウンロード機能付き携帯端末装置
JP4845683B2 (ja) コンテンツ再生方法及び通信端末装置
US6823046B2 (en) Telephone answering device, and method for telephone answering by acquiring procedure files stating various answering functions realized by telephone answering device thereof
JPH10322478A (ja) 音声によるハイパーテキストアクセス装置
JP3440015B2 (ja) コンテンツ登録装置、および、そのプログラムを記録した記録媒体
KR20050030711A (ko) 바코드 인식을 이용한 멀티미디어 컨텐츠 재생 기능을가지는 무선통신단말기 및 그 방법
KR100754630B1 (ko) 정보 단말기에서 사용되는 컨텐츠 데이터를 관리하는 장치및 방법
JP2004342044A (ja) 携帯端末のカスタマイズシステム、管理サーバ、携帯端末、並びに携帯端末のプログラム
KR101099998B1 (ko) 서버와 이동통신 단말기 간의 개선된 데이터 교환 시스템및 방법
JP5248051B2 (ja) 電子機器
KR100629868B1 (ko) 이동통신 단말기의 도움말 제공 방법
TW410509B (en) Method and device of incoming call alert function for mobile phone
KR20110103626A (ko) 휴대용 단말기에서 멀티미디어 데이터에 대한 태그 정보를 제공하기 위한 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091215

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091228

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees