JP2008009465A - サーバ利用により画像データから文字・音声データを取得する方法 - Google Patents

サーバ利用により画像データから文字・音声データを取得する方法 Download PDF

Info

Publication number
JP2008009465A
JP2008009465A JP2005068313A JP2005068313A JP2008009465A JP 2008009465 A JP2008009465 A JP 2008009465A JP 2005068313 A JP2005068313 A JP 2005068313A JP 2005068313 A JP2005068313 A JP 2005068313A JP 2008009465 A JP2008009465 A JP 2008009465A
Authority
JP
Japan
Prior art keywords
data
image data
web page
server
information terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005068313A
Other languages
English (en)
Inventor
Kazuya Kamata
一也 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KAZENOMORI KOBO KK
Original Assignee
KAZENOMORI KOBO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KAZENOMORI KOBO KK filed Critical KAZENOMORI KOBO KK
Priority to JP2005068313A priority Critical patent/JP2008009465A/ja
Priority to PCT/JP2006/304348 priority patent/WO2006095722A1/ja
Priority to JP2007507120A priority patent/JPWO2006095722A1/ja
Publication of JP2008009465A publication Critical patent/JP2008009465A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】
情報端末上の画像データを通信ネットワーク経由でサーバにウェブページを通じて送信し、画像解析結果(テキストデータ及び音声データ)を情報端末がウェブページを通じて取得することを可能とする。
【解決手段】
画像データからの意味情報の抽出、テキストデータの生成、音声データへの変換は、サーバ上で行う。情報端末は、画像データをウェブページを通じて通信ネットワーク経由でサーバに送信する。サーバは、ウェブページを通じて受信した画像データから文字や図形等の意味情報を抽出し、テキストデータと音声データに変換し、ウェブページを通じて情報端末に送信する。情報端末は、ウェブページを通じてテキストデータと音声データを取得することによって、画像データのテキストデータ化と音声データ化を実現する。
【選択図】 図1

Description

本発明は、通信ネットワークに接続された情報端末から画像データをウェブページを通じてサーバに送信し、サーバ上で画像の解析・意味情報データの抽出を行い、得られた意味情報データをテキストデータ及び音声データに変換し、テキストデータと音声データを情報端末がウェブページを通じてサーバから受け取るための方法に関する。
従来、画像データ内の意味情報データのテキストデータ化及びテキストデータの音声データ化の一連の処理は、パーソナルコンピュータ等の情報端末上の専用ソフトウェアを使用することにより実現されていた(関連する技術の一例として、特許文献1及び特許文献2を参照)。
特開平05−333891号公報 特開平11−119790号公報
しかしながら、以上の技術によれば、パーソナルコンピュータ等の情報端末自体が移動性・携帯性の点で劣ることから、使用場所等の使用条件に制限があった。昨今は、情報端末として携帯型コンピュータ及び携帯可能な電話機等があらわれたが、移動性・携帯性の点では優れるものの、画像解析及びテキストデータから音声データへの変換処理には大きな処理能力が必要とされ、処理能力の面で十分ではない。
そこで、本発明は、通信ネットワークに接続された情報端末上の画像データをウェブページを通じてサーバに送信し、サーバ上で画像解析、画像データ内の意味情報データの抽出、テキストデータ及び音声データへの変換を行うことで、場所や時間に制約を受けずにどのような環境でも画像データからのテキストデータ及び音声データの獲得を可能とすることを課題とする。
以上の課題を解決するために、第一発明は、通信ネットワークに接続された情報端末上の画像データをウェブページを通じてサーバに送信し、サーバ上で画像の解析(画像データのノイズの除去、上下向きの補正、傾きの補正、文字部と図形部の分離、各文字段落部の切り出し等の前処理)、画像データ内の意味情報データの抽出を行い、抽出された意味情報データをテキストデータ及び音声データに変換し、得られたテキストデータと音声データを情報端末にウェブページを通じて送信し、情報端末が受信したテキストデータを表示、音声データを再生することを特徴とする方法である。
また、第二発明は、第一発明において、通信ネットワークに接続された情報端末に内蔵あるいは付属する画像取込装置によって取得された画像データをウェブページを通じてサーバに送信することを特徴とする方法である。
また、第三発明は、第二発明において、通信ネットワークに接続されたカメラ機能を有した携帯可能な電話機によって撮影取得された画像データをウェブページを通じてサーバに送信することを特徴とする方法である。
また、第四発明は、第一の発明または第二の発明または第三の発明における方法を実現するシステムである。
また、第五発明は、第一の発明または第二の発明または第三の発明における方法を実現するサーバである。
また、第六発明は、第一の発明または第二の発明または第三の発明における方法を実現するサーバ上のプログラムである。
サーバが接続されている通信ネットワークに接続できる情報端末であれば、いかなる場所、時間でも画像データからテキストデータ及び音声データへの変換をすることができることから、日常の多くの場面で画像情報から文字・音声情報を獲得することができる。
本発明の一実施形態を、図1に示す。
図1は、本発明におけるシステム構成の例を表している。情報端末11及びサーバ13は、通信ネットワーク12に接続されている。情報端末11上の画像データをウェブページ14を通じて、サーバ13に送信する。サーバ13は、ウェブページ14を通じて、情報端末11から画像データを受信する。サーバ13は、ウェブページ14を通じて受信した画像データを処理プログラム15により画像解析(画像データのノイズの除去、上下向きの補正、傾きの補正、文字部と図形部の分離、各文字段落部の切り出し等の前処理)し画像データ内の文字や図形等の意味情報データを抽出する。サーバ13は、抽出した意味情報データを処理プログラム15によりテキストデータ及び音声データに変換する。サーバ13は、ウェブページ14を通じて、テキストデータ及び音声データを情報端末11に送信する。情報端末11は、ウェブページ14を通じて、サーバ13からテキストデータ及び音声データを受信する。情報端末11は、ウェブページ14を通じて受信したテキストデータを表示及び音声データを再生する。
図1の情報端末11上の画像データは、情報端末11に内蔵あるいは付属する画像取込装置によって取得された画像データも含む。
図2は、本発明における動作の一例を示すシーケンス図である。サーバは、通常、情報端末からのアクセス待ちの状態にある(ステップ31)。情報端末は、サーバにウェブページを通じてアクセスをする(ステップ21)。サーバは、情報端末からのアクセスを検出すると画像データの受信待ちになる(ステップ32)。情報端末は、画像データをサーバに送信する(ステップ22)。情報端末は、サーバからのテキストデータ、音声データの受信待ちとなる(ステップ23)。サーバは、情報端末から画像データを受信する(ステップ33)。サーバは、受信した画像データを解析(画像データのノイズの除去、上下向きの補正、傾きの補正、文字部と図形部の分離、各文字段落部の切り出し等の前処理)する(ステップ34)。サーバは、画像データから文字や図形等の意味情報データを取得する(ステップ35)。サーバは、意味情報データからテキストデータを取得する(ステップ36)。サーバは、テキストデータを音声データに変換する(ステップ37)。サーバは、テキストデータ及び音声データを情報端末に送信する(ステップ38)。送信後、サーバは、情報端末のアクセス待ちとなる(ステップ31)。情報端末は、ウェブページを通じてサーバからテキストデータ及び音声データを受信する(ステップ24)。情報端末は、テキストデータを表示及び音声データを再生する(ステップ25)。
図3は、本発明におけるカメラ機能を有した携帯可能な電話機を使用した場合の動作の一例を示すシーケンス図である。サーバは、通常、情報端末からのアクセス待ちの状態にある(ステップ51)。携帯可能な電話機に付属するカメラにより撮影を行う(ステップ40)。携帯可能な電話機は、サーバにウェブページを通じてアクセスをする(ステップ41)。サーバは、携帯可能な電話機からのアクセスを検出すると画像データの受信待ちになる(ステップ52)。携帯可能な電話機は、画像データをサーバに送信する(ステップ42)。携帯可能な電話機は、サーバからのテキストデータ、音声データの受信待ちとなる(ステップ43)。サーバは、携帯可能な電話機から画像データを受信する(ステップ53)。サーバは、受信した画像データを解析(画像データのノイズの除去、上下向きの補正、傾きの補正、文字部と図形部の分離、各文字段落部の切り出し等の前処理)する(ステップ54)。サーバは、画像データから文字や図形等の意味情報データを取得する(ステップ55)。サーバは、意味情報データからテキストデータを取得する(ステップ56)。サーバは、テキストデータを音声データに変換する(ステップ57)。サーバは、テキストデータ及び音声データを携帯可能な電話機に送信する(ステップ58)。送信後、サーバは、携帯可能な電話機のアクセス待ちとなる(ステップ51)。携帯可能な電話機は、ウェブページを通じてサーバからテキストデータ及び音声データを受信する(ステップ44)。携帯可能な電話機は、テキストデータを表示及び音声データを再生する(ステップ45)。
本発明は、携帯可能な電話機や携帯型コンピュータ等の情報端末に搭載されたカメラによって撮影された画像データを、テキストデータ及び音声データへ変換ができることから、視覚障害者(全盲者及び弱視者)あるいは視力の衰えた高齢者が、情報端末からウェブページにアクセスすることによって、画像データ内の意味情報を文字データ及び音声データとして、いつでもどこでも獲得する方法に利用できる。
本発明の一実施形態を示す構成図である。 本発明における動作の一例を示すシーケンス図である。 本発明における動作の他の一例を示すシーケンス図である。
符号の説明
11:情報端末
12:通信ネットワーク
13:サーバ
14:ウェブページ
15:処理プログラム
S21〜S25:ステップ番号
S31〜S38:ステップ番号
S40〜S45:ステップ番号
S51〜S58:ステップ番号

Claims (6)

  1. 通信ネットワークに接続された情報端末上の画像データを、ウェブページ記述言語で作成されたウェブページを通じて、通信ネットワークに接続されたサーバに送信し、サーバ上の処理プログラムにて画像データの解析(画像データのノイズの除去、上下向きの補正、傾きの補正、文字部と図形部の分離、各文字段落部の切り出し等の前処理)及び画像データ内の意味情報データの抽出を行い、抽出された意味情報データをテキストデータ及び音声データに変換し、得られたテキストデータ及び音声データを、ウェブページを通じて情報端末に送信し、情報端末が受信したテキストデータを表示、音声データを再生することを特徴とする、サーバ利用により画像データから文字・音声データを取得する方法。
  2. 通信ネットワークに接続された情報端末に内蔵あるいは付属する画像取込装置によって取得された画像データを、ウェブページ記述言語で作成されたウェブページを通じて、通信ネットワークに接続されたサーバに送信することを特徴とする請求項1記載の方法。
  3. 通信ネットワークに接続されたカメラ機能を有した携帯可能な電話機によって撮影取得された画像データを、ウェブページ記述言語で作成されたウェブページを通じて、通信ネットワークに接続されたサーバに送信することを特徴とする請求項2記載の方法。
  4. 通信ネットワークに接続された情報端末上の画像データを、ウェブページ記述言語で作成されたウェブページを通じて、通信ネットワークに接続されたサーバに送信し、サーバ上の処理プログラムにて画像データの解析(画像データのノイズの除去、上下向きの補正、傾きの補正、文字部と図形部の分離、各文字段落部の切り出し等の前処理)及び画像データ内の意味情報データの抽出を行い、抽出された意味情報データをテキストデータ及び音声データに変換し、得られたテキストデータ及び音声データを、ウェブページを通じて情報端末に送信し、情報端末が受信したテキストデータを表示、音声データを再生することを特徴とする請求項1または請求項2または請求項3記載のシステム。
  5. 通信ネットワークに接続された情報端末上の画像データを、ウェブページ記述言語で作成されたウェブページを通じて受信し、画像データの解析(画像データのノイズの除去、上下向きの補正、傾きの補正、文字部と図形部の分離、各文字段落部の切り出し等の前処理)及び画像データ内の意味情報データの抽出を行い、抽出された意味情報データをテキストデータ及び音声データに変換し、得られたテキストデータ及び音声データを、ウェブページを通じて情報端末に送信することを特徴とする請求項1または請求項2または請求項3記載のサーバ。
  6. 通信ネットワークに接続された情報端末上の画像データを、ウェブページ記述言語で作成されたウェブページを通じて受信し、画像データの解析(画像データのノイズの除去、上下向きの補正、傾きの補正、文字部と図形部の分離、各文字段落部の切り出し等の前処理)及び画像データ内の意味情報データの抽出を行い、抽出された意味情報データをテキストデータ及び音声データに変換し、得られたテキストデータ及び音声データを、ウェブページを通じて情報端末に送信することを特徴とする請求項1または請求項2または請求項3記載のサーバ上のプログラム。

JP2005068313A 2005-03-11 2005-03-11 サーバ利用により画像データから文字・音声データを取得する方法 Pending JP2008009465A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005068313A JP2008009465A (ja) 2005-03-11 2005-03-11 サーバ利用により画像データから文字・音声データを取得する方法
PCT/JP2006/304348 WO2006095722A1 (ja) 2005-03-11 2006-03-07 サーバ利用により画像データから文字・音声データを取得する方法
JP2007507120A JPWO2006095722A1 (ja) 2005-03-11 2006-03-07 サーバ利用により画像データから文字・音声データを取得する方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005068313A JP2008009465A (ja) 2005-03-11 2005-03-11 サーバ利用により画像データから文字・音声データを取得する方法

Publications (1)

Publication Number Publication Date
JP2008009465A true JP2008009465A (ja) 2008-01-17

Family

ID=36953316

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2005068313A Pending JP2008009465A (ja) 2005-03-11 2005-03-11 サーバ利用により画像データから文字・音声データを取得する方法
JP2007507120A Pending JPWO2006095722A1 (ja) 2005-03-11 2006-03-07 サーバ利用により画像データから文字・音声データを取得する方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2007507120A Pending JPWO2006095722A1 (ja) 2005-03-11 2006-03-07 サーバ利用により画像データから文字・音声データを取得する方法

Country Status (2)

Country Link
JP (2) JP2008009465A (ja)
WO (1) WO2006095722A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110018803A (zh) * 2017-12-11 2019-07-16 东芝泰格有限公司 维护数据提供系统、服务器及信息处理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11167532A (ja) * 1997-12-02 1999-06-22 Canon Inc データ加工システムおよび装置、データ加工方法、記録媒体
JPH11249867A (ja) * 1998-02-27 1999-09-17 Nippon Telegr & Teleph Corp <Ntt> 音声ブラウザシステム
JP2002175176A (ja) * 2000-12-07 2002-06-21 Canon Inc 情報提示装置および提示方法
JP2003284016A (ja) * 2002-03-26 2003-10-03 Sony Corp 情報提供装置及び方法
JP2003319033A (ja) * 2002-04-18 2003-11-07 Ntt Docomo Inc 携帯通信端末情報入力システム、携帯通信端末、携帯通信端末用プログラム、解析サーバ、及び、携帯通信端末情報入力方法
JP2003324480A (ja) * 2002-05-07 2003-11-14 Fuji Photo Film Co Ltd メール中継装置
JP2004056356A (ja) * 2002-07-18 2004-02-19 Fujitsu Ltd 画像データ処理装置及び方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003296330A (ja) * 2002-04-05 2003-10-17 Matsushita Electric Ind Co Ltd 情報取得通信システム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11167532A (ja) * 1997-12-02 1999-06-22 Canon Inc データ加工システムおよび装置、データ加工方法、記録媒体
JPH11249867A (ja) * 1998-02-27 1999-09-17 Nippon Telegr & Teleph Corp <Ntt> 音声ブラウザシステム
JP2002175176A (ja) * 2000-12-07 2002-06-21 Canon Inc 情報提示装置および提示方法
JP2003284016A (ja) * 2002-03-26 2003-10-03 Sony Corp 情報提供装置及び方法
JP2003319033A (ja) * 2002-04-18 2003-11-07 Ntt Docomo Inc 携帯通信端末情報入力システム、携帯通信端末、携帯通信端末用プログラム、解析サーバ、及び、携帯通信端末情報入力方法
JP2003324480A (ja) * 2002-05-07 2003-11-14 Fuji Photo Film Co Ltd メール中継装置
JP2004056356A (ja) * 2002-07-18 2004-02-19 Fujitsu Ltd 画像データ処理装置及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110018803A (zh) * 2017-12-11 2019-07-16 东芝泰格有限公司 维护数据提供系统、服务器及信息处理方法

Also Published As

Publication number Publication date
WO2006095722A1 (ja) 2006-09-14
JPWO2006095722A1 (ja) 2008-08-14

Similar Documents

Publication Publication Date Title
CN110730952B (zh) 处理网络上的音频通信的方法和系统
WO2019184499A1 (zh) 一种视频通话的方法、设备和计算机存储介质
EP2175647A1 (en) Apparatus and method for providing emotion expression service in mobile communication terminal
KR100678209B1 (ko) 휴대단말기의 이미지 제어방법
AU2003264435B2 (en) A videophone sign language interpretation assistance device and a sign language interpretation system using the same.
EP2574220A2 (en) Hand-held communication aid for individuals with auditory, speech and visual impairments
JP2005267146A (ja) 画像認識機能を利用した電子メール作成方法および装置
US10459534B2 (en) System and method for large data augmented reality applications on smartglasses
US9959083B2 (en) System and method for sharing screen
US9110888B2 (en) Service server apparatus, service providing method, and service providing program for providing a service other than a telephone call during the telephone call on a telephone
JP4649640B2 (ja) 画像処理方法、画像処理装置、及びコンテンツ作成システム
US20230247131A1 (en) Presentation of communications
JP2008009465A (ja) サーバ利用により画像データから文字・音声データを取得する方法
JP5321247B2 (ja) シンクライアントシステム、シンクライアントシステムの制御方法、シンクライアント端末の制御プログラム及びサーバの制御プログラム
JP2005151073A (ja) Tv電話機能付き携帯端末装置
KR20150025750A (ko) 사용자 단말 장치 및 그 양방향 번역 방법
JP2932027B2 (ja) テレビ電話装置
WO2020188885A1 (ja) 情報処理方法、プログラム、端末
JP4824595B2 (ja) データ送受信装置及びデータ送受信方法
JP6680031B2 (ja) 会議用装置、送信方法、およびコンピュータプログラム
JP2013073309A (ja) 画像注目領域抽出方法、並びに当該方法を実現する電子機器、システム、及びプログラム
US20060078314A1 (en) Webcam communication system using handheld device with camera and method thereof
US20230178081A1 (en) Display control system, display control method and information storage medium
JP7152454B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム
JP2005284757A (ja) 電子メールの利用により画像情報から文字・音声情報を取得する方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100629

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110712

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111108