JP2008009465A - サーバ利用により画像データから文字・音声データを取得する方法 - Google Patents
サーバ利用により画像データから文字・音声データを取得する方法 Download PDFInfo
- Publication number
- JP2008009465A JP2008009465A JP2005068313A JP2005068313A JP2008009465A JP 2008009465 A JP2008009465 A JP 2008009465A JP 2005068313 A JP2005068313 A JP 2005068313A JP 2005068313 A JP2005068313 A JP 2005068313A JP 2008009465 A JP2008009465 A JP 2008009465A
- Authority
- JP
- Japan
- Prior art keywords
- data
- image data
- web page
- server
- information terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 13
- 238000004891 communication Methods 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000000926 separation method Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 abstract description 5
- 238000010191 image analysis Methods 0.000 abstract description 3
- 239000000284 extract Substances 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 2
- 208000010415 Low Vision Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000004303 low vision Effects 0.000 description 1
- 230000004304 visual acuity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4938—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Telephonic Communication Services (AREA)
Abstract
情報端末上の画像データを通信ネットワーク経由でサーバにウェブページを通じて送信し、画像解析結果(テキストデータ及び音声データ)を情報端末がウェブページを通じて取得することを可能とする。
【解決手段】
画像データからの意味情報の抽出、テキストデータの生成、音声データへの変換は、サーバ上で行う。情報端末は、画像データをウェブページを通じて通信ネットワーク経由でサーバに送信する。サーバは、ウェブページを通じて受信した画像データから文字や図形等の意味情報を抽出し、テキストデータと音声データに変換し、ウェブページを通じて情報端末に送信する。情報端末は、ウェブページを通じてテキストデータと音声データを取得することによって、画像データのテキストデータ化と音声データ化を実現する。
【選択図】 図1
Description
12:通信ネットワーク
13:サーバ
14:ウェブページ
15:処理プログラム
S21〜S25:ステップ番号
S31〜S38:ステップ番号
S40〜S45:ステップ番号
S51〜S58:ステップ番号
Claims (6)
- 通信ネットワークに接続された情報端末上の画像データを、ウェブページ記述言語で作成されたウェブページを通じて、通信ネットワークに接続されたサーバに送信し、サーバ上の処理プログラムにて画像データの解析(画像データのノイズの除去、上下向きの補正、傾きの補正、文字部と図形部の分離、各文字段落部の切り出し等の前処理)及び画像データ内の意味情報データの抽出を行い、抽出された意味情報データをテキストデータ及び音声データに変換し、得られたテキストデータ及び音声データを、ウェブページを通じて情報端末に送信し、情報端末が受信したテキストデータを表示、音声データを再生することを特徴とする、サーバ利用により画像データから文字・音声データを取得する方法。
- 通信ネットワークに接続された情報端末に内蔵あるいは付属する画像取込装置によって取得された画像データを、ウェブページ記述言語で作成されたウェブページを通じて、通信ネットワークに接続されたサーバに送信することを特徴とする請求項1記載の方法。
- 通信ネットワークに接続されたカメラ機能を有した携帯可能な電話機によって撮影取得された画像データを、ウェブページ記述言語で作成されたウェブページを通じて、通信ネットワークに接続されたサーバに送信することを特徴とする請求項2記載の方法。
- 通信ネットワークに接続された情報端末上の画像データを、ウェブページ記述言語で作成されたウェブページを通じて、通信ネットワークに接続されたサーバに送信し、サーバ上の処理プログラムにて画像データの解析(画像データのノイズの除去、上下向きの補正、傾きの補正、文字部と図形部の分離、各文字段落部の切り出し等の前処理)及び画像データ内の意味情報データの抽出を行い、抽出された意味情報データをテキストデータ及び音声データに変換し、得られたテキストデータ及び音声データを、ウェブページを通じて情報端末に送信し、情報端末が受信したテキストデータを表示、音声データを再生することを特徴とする請求項1または請求項2または請求項3記載のシステム。
- 通信ネットワークに接続された情報端末上の画像データを、ウェブページ記述言語で作成されたウェブページを通じて受信し、画像データの解析(画像データのノイズの除去、上下向きの補正、傾きの補正、文字部と図形部の分離、各文字段落部の切り出し等の前処理)及び画像データ内の意味情報データの抽出を行い、抽出された意味情報データをテキストデータ及び音声データに変換し、得られたテキストデータ及び音声データを、ウェブページを通じて情報端末に送信することを特徴とする請求項1または請求項2または請求項3記載のサーバ。
- 通信ネットワークに接続された情報端末上の画像データを、ウェブページ記述言語で作成されたウェブページを通じて受信し、画像データの解析(画像データのノイズの除去、上下向きの補正、傾きの補正、文字部と図形部の分離、各文字段落部の切り出し等の前処理)及び画像データ内の意味情報データの抽出を行い、抽出された意味情報データをテキストデータ及び音声データに変換し、得られたテキストデータ及び音声データを、ウェブページを通じて情報端末に送信することを特徴とする請求項1または請求項2または請求項3記載のサーバ上のプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005068313A JP2008009465A (ja) | 2005-03-11 | 2005-03-11 | サーバ利用により画像データから文字・音声データを取得する方法 |
PCT/JP2006/304348 WO2006095722A1 (ja) | 2005-03-11 | 2006-03-07 | サーバ利用により画像データから文字・音声データを取得する方法 |
JP2007507120A JPWO2006095722A1 (ja) | 2005-03-11 | 2006-03-07 | サーバ利用により画像データから文字・音声データを取得する方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005068313A JP2008009465A (ja) | 2005-03-11 | 2005-03-11 | サーバ利用により画像データから文字・音声データを取得する方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008009465A true JP2008009465A (ja) | 2008-01-17 |
Family
ID=36953316
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005068313A Pending JP2008009465A (ja) | 2005-03-11 | 2005-03-11 | サーバ利用により画像データから文字・音声データを取得する方法 |
JP2007507120A Pending JPWO2006095722A1 (ja) | 2005-03-11 | 2006-03-07 | サーバ利用により画像データから文字・音声データを取得する方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007507120A Pending JPWO2006095722A1 (ja) | 2005-03-11 | 2006-03-07 | サーバ利用により画像データから文字・音声データを取得する方法 |
Country Status (2)
Country | Link |
---|---|
JP (2) | JP2008009465A (ja) |
WO (1) | WO2006095722A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110018803A (zh) * | 2017-12-11 | 2019-07-16 | 东芝泰格有限公司 | 维护数据提供系统、服务器及信息处理方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11167532A (ja) * | 1997-12-02 | 1999-06-22 | Canon Inc | データ加工システムおよび装置、データ加工方法、記録媒体 |
JPH11249867A (ja) * | 1998-02-27 | 1999-09-17 | Nippon Telegr & Teleph Corp <Ntt> | 音声ブラウザシステム |
JP2002175176A (ja) * | 2000-12-07 | 2002-06-21 | Canon Inc | 情報提示装置および提示方法 |
JP2003284016A (ja) * | 2002-03-26 | 2003-10-03 | Sony Corp | 情報提供装置及び方法 |
JP2003319033A (ja) * | 2002-04-18 | 2003-11-07 | Ntt Docomo Inc | 携帯通信端末情報入力システム、携帯通信端末、携帯通信端末用プログラム、解析サーバ、及び、携帯通信端末情報入力方法 |
JP2003324480A (ja) * | 2002-05-07 | 2003-11-14 | Fuji Photo Film Co Ltd | メール中継装置 |
JP2004056356A (ja) * | 2002-07-18 | 2004-02-19 | Fujitsu Ltd | 画像データ処理装置及び方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003296330A (ja) * | 2002-04-05 | 2003-10-17 | Matsushita Electric Ind Co Ltd | 情報取得通信システム |
-
2005
- 2005-03-11 JP JP2005068313A patent/JP2008009465A/ja active Pending
-
2006
- 2006-03-07 JP JP2007507120A patent/JPWO2006095722A1/ja active Pending
- 2006-03-07 WO PCT/JP2006/304348 patent/WO2006095722A1/ja active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11167532A (ja) * | 1997-12-02 | 1999-06-22 | Canon Inc | データ加工システムおよび装置、データ加工方法、記録媒体 |
JPH11249867A (ja) * | 1998-02-27 | 1999-09-17 | Nippon Telegr & Teleph Corp <Ntt> | 音声ブラウザシステム |
JP2002175176A (ja) * | 2000-12-07 | 2002-06-21 | Canon Inc | 情報提示装置および提示方法 |
JP2003284016A (ja) * | 2002-03-26 | 2003-10-03 | Sony Corp | 情報提供装置及び方法 |
JP2003319033A (ja) * | 2002-04-18 | 2003-11-07 | Ntt Docomo Inc | 携帯通信端末情報入力システム、携帯通信端末、携帯通信端末用プログラム、解析サーバ、及び、携帯通信端末情報入力方法 |
JP2003324480A (ja) * | 2002-05-07 | 2003-11-14 | Fuji Photo Film Co Ltd | メール中継装置 |
JP2004056356A (ja) * | 2002-07-18 | 2004-02-19 | Fujitsu Ltd | 画像データ処理装置及び方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110018803A (zh) * | 2017-12-11 | 2019-07-16 | 东芝泰格有限公司 | 维护数据提供系统、服务器及信息处理方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2006095722A1 (ja) | 2006-09-14 |
JPWO2006095722A1 (ja) | 2008-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110730952B (zh) | 处理网络上的音频通信的方法和系统 | |
WO2019184499A1 (zh) | 一种视频通话的方法、设备和计算机存储介质 | |
EP2175647A1 (en) | Apparatus and method for providing emotion expression service in mobile communication terminal | |
KR100678209B1 (ko) | 휴대단말기의 이미지 제어방법 | |
AU2003264435B2 (en) | A videophone sign language interpretation assistance device and a sign language interpretation system using the same. | |
EP2574220A2 (en) | Hand-held communication aid for individuals with auditory, speech and visual impairments | |
JP2005267146A (ja) | 画像認識機能を利用した電子メール作成方法および装置 | |
US10459534B2 (en) | System and method for large data augmented reality applications on smartglasses | |
US9959083B2 (en) | System and method for sharing screen | |
US9110888B2 (en) | Service server apparatus, service providing method, and service providing program for providing a service other than a telephone call during the telephone call on a telephone | |
JP4649640B2 (ja) | 画像処理方法、画像処理装置、及びコンテンツ作成システム | |
US20230247131A1 (en) | Presentation of communications | |
JP2008009465A (ja) | サーバ利用により画像データから文字・音声データを取得する方法 | |
JP5321247B2 (ja) | シンクライアントシステム、シンクライアントシステムの制御方法、シンクライアント端末の制御プログラム及びサーバの制御プログラム | |
JP2005151073A (ja) | Tv電話機能付き携帯端末装置 | |
KR20150025750A (ko) | 사용자 단말 장치 및 그 양방향 번역 방법 | |
JP2932027B2 (ja) | テレビ電話装置 | |
WO2020188885A1 (ja) | 情報処理方法、プログラム、端末 | |
JP4824595B2 (ja) | データ送受信装置及びデータ送受信方法 | |
JP6680031B2 (ja) | 会議用装置、送信方法、およびコンピュータプログラム | |
JP2013073309A (ja) | 画像注目領域抽出方法、並びに当該方法を実現する電子機器、システム、及びプログラム | |
US20060078314A1 (en) | Webcam communication system using handheld device with camera and method thereof | |
US20230178081A1 (en) | Display control system, display control method and information storage medium | |
JP7152454B2 (ja) | 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム | |
JP2005284757A (ja) | 電子メールの利用により画像情報から文字・音声情報を取得する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100629 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101101 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110712 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111108 |