JP2005529743A - 音声合成を使用して郵便物を処理する方法 - Google Patents
音声合成を使用して郵便物を処理する方法 Download PDFInfo
- Publication number
- JP2005529743A JP2005529743A JP2004514920A JP2004514920A JP2005529743A JP 2005529743 A JP2005529743 A JP 2005529743A JP 2004514920 A JP2004514920 A JP 2004514920A JP 2004514920 A JP2004514920 A JP 2004514920A JP 2005529743 A JP2005529743 A JP 2005529743A
- Authority
- JP
- Japan
- Prior art keywords
- operator
- video coding
- image
- speech synthesis
- interpretation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B07—SEPARATING SOLIDS FROM SOLIDS; SORTING
- B07C—POSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
- B07C3/00—Sorting according to destination
- B07C3/20—Arrangements for facilitating the visual reading of addresses, e.g. display arrangements coding stations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/987—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Sorting Of Articles (AREA)
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
- Devices For Executing Special Programs (AREA)
Abstract
本発明は、郵便物の画像3をビデオコ−ディング装置1上に表示すること、前記表示に基づいてオペレータ4にビデオコーディング装置を介して郵便の宛先情報を提供することを要求することからなる、郵便物を処理する方法に関する。前記方法は、オペレータがオペレータに音声合成で伝えられる解釈のメッセージと同時に画像に現れた宛先を読みむように、オペレータに音声合成によって要求されることを特徴とする。
Description
本発明は、郵便物の画像がビデオコ−ディング装置上に提示され、前記提示に基づいて、オペレータはビデオコーディング装置を介して郵便の宛先情報を提供することを要求される、郵便物を処理する方法に関する。
手紙、平坦な物体、または小包タイプの郵便物を自動的に仕分けするプロセスには、通常、各対象物のデジタル画像の入力が含まれる。次いで、光学式文字認識(OCR)処理が前記画像に適用され、郵便物上に現れた受取人の宛先が確認される。こうした認識処理は失敗することがある。すなわち、非常に信用度が低い解釈が提供されることがあり、または選択が不可能な複数の解釈が提供されることがある。用語「解釈」は、たとえば受取人の宛先(通りの名前、会社または人の名前、地番、私書箱の番号など)の認識されない部分に対応する。
こうした失敗の場合、オペレータが宛先情報を提供するために、すなわちオペレータが提案された解釈のうちの1つを確認するために、対象物のデジタル画像がビデオコーディング装置のスクリーン上に提示される。この目的で、画像および解釈が同時に表示されて、オペレータは、各解釈を画像に現れた宛先と比較することによって選択を行う。こうした仕分け装置での高生産性を考慮すると、こうした操作はオペレータにとって面倒である。なぜならオペレータは、各郵便物について宛先情報を提供するために数回スクリーンから読み取らなければならないからである。
本発明の目的は、オペレータの快適性を向上し、処理時間を短縮するように既存のビデオコーディング方法に改善をもたらすことである。
本発明はこの目的で、郵便物の画像がビデオコーディング装置に提示され、前記提示に基づいて、オペレータはビデオコーディング装置を介して郵便の宛先情報を提供することを要求される方法であって、要求がオペレータに音声合成で伝えられることを特徴とする郵便物を処理する方法を提供する。この方法では、オペレータは画像に現れた宛先を読み、同時に前記オペレータに音声合成で解釈が伝えられる。有利には、この解釈はヘッドホンによってオペレータに提案される。複数の解釈が可能な場合は、その解釈がオペレータに順次伝えられることによって提案される。
本発明を以下でより詳細に単独の図を参照して説明する。この図は、本発明の方法を実施するビデオコーディング装置を示す概略図である。
本発明の基本概念では、音声合成を使用して、オペレータがオペレータに提示された画像に現れた宛先を読み、同時に解釈が前記オペレータに音声合成によって伝えられるようになされている。
より具体的には、単独の図は、郵便仕分け装置のコンピュータ化された管理システムに接続され、郵便物のデジタル画像3をオペレータ4に表示するためのスクリーン2を備えたビデオコーディング装置1を示す。このビデオコーディング装置は、コンピュータ化された管理システムから、画像3に適用された光学式文字認識処理により得られた1つまたは複数の解釈を受信する。本発明では、この解釈が音声合成によってオペレータに提案されて、オペレータに画像3で提示された宛先と前記オペレータに伝えられた解釈を比較することによって、オペレータ4が提案された解釈を確認または拒絶することによって宛先情報を提供するようになされている。有利には、装置は、オペレータがキーボード5の単一のキーを押すことによって伝えられた解釈を確認することができるように構成される。
ビデオコーディング装置は、中央処理装置7に接続されてオペレータ4の作業環境を改善するためのヘッドホン6を備えることができる。こうしたヘッドホン6を使用することによって、様々なビデオコーディング装置を同じビデオコーディング室内に配備して、オペレータが互いに邪魔することなく、各装置上で音声合成と共に操作することができるようになる。
単独の図で示した例では、ビデオコーディング装置は、音声合成プログラムが装備されたコンピュータであり、サウンドカードを介してヘッドホン6に接続されている。したがって、仕分け装置の管理システムに接続されたビデオコーディング装置は、テキストメッセージ形式である文字認識処理から得られた解釈をヘッドホン6でオペレータに可聴の音声信号に変換するのに適している。現在、こうした音声合成プログラムは市販されている。有利には、選択される音声合成プログラムは、複数の言語で作動できるものである。たとえばベルギーなど2言語が使用される国では、受取人の宛先がフランス語またはフラマン語で書かれることがある。したがって、音声合成プログラムでは、OCR処理によって与えられた結果に応じて、フランス語またはフラマン語で読むことが不可欠である。
OCR処理が失敗した場合、前記OCR処理により、それぞれ解釈に関連付けた信頼度と共に複数の可能な解釈を送信することができる。その場合、オペレータが正しい解釈を確認して処理から発生した不明瞭さを解明するまで、様々な解釈が順にオペレータに伝えられる。有利には、様々な解釈が信頼度の降下する順にオペレータに伝えられて、最初に伝えられた解釈が正しいものである可能性が最も高いようにする。オペレータが提案された解釈を全て拒絶した場合、有利には、オペレータが画像から読み取ることができる宛先を手作業で入力することをオペレータに提案するように管理システムを構成することができる。
オペレータが情報を考慮する速度を向上させるため、処理で認識されない宛先または宛先の一部をブロックまたは他の方法で元の画像から抜き出すことができる。単独の図を参照すると、デジタル画像3は宛先ブロックに相当するものであり、そのブロック内で通りの名前8に相当する単語が破線で囲まれて、これが確認するように残された部分であることをオペレータに示している。したがって、様々な解釈を伝えることが、複数の通りの名前を伝えることに低減され、それによってビデオコーディングへの追加の時間を省くことができる。
本発明は、ビデオコーディング装置へのコード化された手動入力にも適用することができる。たとえば、自動OCR処理から得られた提案された解釈がどれもオペレータによって確認されない場合に、コード化された手動入力を用いることができる。入力時間を短縮するには、オペレータは認識されない宛先ラインの一部または「抜粋」のみをキーボードに入力する。次いで、管理プログラムにより前記抜粋に値が割り当てられるが、同じ抜粋に複数の解釈が可能である。その場合、ビデオコーディング装置は、オペレータが入力した抜粋に対応する様々な解釈を順に伝えることによって、オペレータに音声合成で相談するように構成される。より具体的には、オペレータがたとえば装置のキーボードを使用して入力することを望む解釈をオペレータが確認するまで、様々な解釈が次々に伝えられる。
実際、図で示したビデオコーディング装置1は、「Windows(登録商標) NT、2000」オペレーティングシステムで実行される多重タスク処理アプリケーションソフトウェアの制御下にある。このアプリケーションは、(手紙、平坦な物体、および小包用の)仕分け機械、自動OCR宛先認識システム、バーコード読取り装置などで構成される仕分けシステムの一部である画像サーバおよびスーパーバイザシステムを含む比較的広範囲のセットの一部である。
スーパーバイザシステムは、第1に格納された画像および画像サーバの結果ベースを制御かつ管理し、第2にビデオコーディングオペレータのコーディングタスクへの接続および割当てを管理するためのウィンドウおよびプルダウンメニューを有する、「Windows(登録商標)」型のグラフィックスソフトウェアアプリケーションである。
画像サーバは、仕分けプロセスの上流側に存在する宛先認識OCRシステムによって完全に解明されない画像を入力として受信する。画像が完全に解明されない場合、OCRシステムは、決定に成功した部分的結果を画像サーバに伝送する。(情報なし、郵便番号、通りに関する様々な仮定、通りの名前は決定されたが通りの番号が決定されないなど)得られた結果に応じて、画像サーバは、処理すべき画像を別個の画像キューに格納する。次いで、この構成で、コーディングコンソールを画像の特定のキューに割り当てて、ビデオコーディングをより有効にすることが可能になる。画像サーバは、前記画像をコーディングコンソールに送信し、結果を受信する。この結果によって、画像サーバは各画像の処理を継続するか停止するかについての判断を行うことができるようになる。画像サーバは、前記結果を結果ベースに格納して、仕分け装置に伝送する。ビデオコーディングシステムの様々な要素(スーパーバイザソフトウェア、コーディングコンソール、画像サーバ)は、Transmission Control Protocol/Internet Protocol(TCP/IP)通信プロトコルを使用してメッセージを交換することによって互いに通信する。
郵便データベースはビデオコーディング装置1にインストールされる。このデータベースは、宛先を解明するためのコーディングタスクでビデオコーディングソフトウェアによって使用される。郵便データベースは、上流側に位置するOCRシステムで使用されるデータベースと同一である。音声合成は、ライブラリの形でビデオコーディングソフトウェアアプリケーションに組み込まれた機能であり、ライブラリはとりわけ、サンプリング周波数、使用言語、およびサウンドカードの通信プロトコルの調整を可能にするものである。
オペレータがビデオコーディングコンソールに接続する場合、オペレータによってなされた接続要求はスーパーバイザシステムに伝送され、接続要求が受諾されると、スーパーバイザシステムは、通信チャネルを介してコンソールに、スーパーバイザによってコンソールに割り当てられた画像キューの(したがってコーディングタスクの)リストを伝送する。次いで、他の通信チャネルを介して、コンソール内のビデオコーディングソフトウェアにより、完全に解明されない宛先の画像を自動OCR処理の結果に関するデータと共に検索する要求を画像サーバに伝送する。便利なことにこうしたデータには、以下の情報が含まれる。
宛先のコンポーネントのブロックの画像の座標:外側の仕分けライン、内側の仕分けライン、アドレスラインなど、
前記ブロック内で自動的に認識された情報:郵便番号、都市、通り、通りのリストなど、主にテキストの形である情報、および
(通りの名前の抜粋の入力、通りの名前の確認など)ビデオコーディングで実行すべきタスクのタイプに関する情報、である。
前記ブロック内で自動的に認識された情報:郵便番号、都市、通り、通りのリストなど、主にテキストの形である情報、および
(通りの名前の抜粋の入力、通りの名前の確認など)ビデオコーディングで実行すべきタスクのタイプに関する情報、である。
画像をビデオコーディング装置のスクリーン2上に表示した後、ビデオコーディングソフトウェアにより、実行すべきタスクのタイプに関する情報を抜粋し、宛先ブロックの座標を使用してビデオコーディングによる処理が必要な任意の宛先情報の周りに(図で破線で示した)フレームを描く。前記情報は、テキスト形式でビデオコーディングソフトウェアで使用可能であり、そのアクセス機能の1つを介して音声合成ライブラリに送信されて、ヘッドホン6を介して音声の形で再生される。
音声合成ライブラリに送信されるテキストと並行して、ビデオコーディングソフトウェアにより、音声合成プロセス中にオペレータによって押し下げられたキーボード5のキーを走査する。
この追加の音声合成機能によって、画像を表示するタスクが、確認すべき解釈を伝えるタスクと並行して実行されるため、ビデオコーディングの生産性を著しく向上させることができるようになる。したがって、音声合成を使用しないビデオコーディングシステムの生産性と比較して、約10%ビデオコーディングの生産性を高めることが可能になる。
Claims (5)
- 郵便物の画像(3)がビデオコーディング装置(1)上に提示され、前記提示に基づいて、オペレータ(4)はビデオコーディング装置を介して郵便の宛先情報を提供することを要求される方法であって、要求が音声合成によってオペレータ(5)に伝えられることを特徴とする郵便物を処理する方法。
- 要求がヘッドホン(6)を介して音声合成によってオペレータ(4)に伝えられる請求項1に記載の方法。
- オペレータは音声合成によって郵便物の郵便宛先の不明瞭さを解明することを要求される請求項1または2に記載の方法。
- オペレータはビデオコーディング装置のキーボード(5)の単一のキーを押すことによって宛先情報を提供する請求項1、2または3に記載の方法。
- オペレータが、前記キーボード(5)の前記キーを押すことによって、音声合成によって前記オペレータに伝えられる解釈を確認する請求項3および4に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0207581A FR2841160B1 (fr) | 2002-06-19 | 2002-06-19 | Procede de traitement d'objets postaux utilisant la synthese vocale |
PCT/FR2003/001764 WO2004000472A1 (fr) | 2002-06-19 | 2003-06-12 | Procede de traitement d'objets postaux utilisant la synthese vocale |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005529743A true JP2005529743A (ja) | 2005-10-06 |
Family
ID=29719884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004514920A Pending JP2005529743A (ja) | 2002-06-19 | 2003-06-12 | 音声合成を使用して郵便物を処理する方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20050119898A1 (ja) |
EP (1) | EP1526926B1 (ja) |
JP (1) | JP2005529743A (ja) |
AT (1) | ATE382438T1 (ja) |
AU (1) | AU2003253068A1 (ja) |
CA (1) | CA2487130A1 (ja) |
DE (1) | DE60318448T2 (ja) |
ES (1) | ES2297215T3 (ja) |
FR (1) | FR2841160B1 (ja) |
WO (1) | WO2004000472A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012085003A1 (en) | 2010-12-22 | 2012-06-28 | Katholieke Universiteit Leuven, K.U. Leuven R&D | 2-hydroxyisoquinoline-1,3(2h,4h)-diones and related compounds useful as hiv replication inhibitors |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4921107A (en) * | 1988-07-01 | 1990-05-01 | Pitney Bowes Inc. | Mail sortation system |
US5558232A (en) * | 1994-01-05 | 1996-09-24 | Opex Corporation | Apparatus for sorting documents |
US5677834A (en) * | 1995-01-26 | 1997-10-14 | Mooneyham; Martin | Method and apparatus for computer assisted sorting of parcels |
WO2003005289A1 (en) * | 1997-03-03 | 2003-01-16 | Keith Whited | Storage, retrieval and display system for marine specimens |
DE19718805C2 (de) * | 1997-05-03 | 1999-11-04 | Siemens Ag | Verfahren und Anordnung zum Erkennen von Verteilinformationen |
US6327343B1 (en) * | 1998-01-16 | 2001-12-04 | International Business Machines Corporation | System and methods for automatic call and data transfer processing |
EP1004207A1 (en) * | 1998-02-03 | 2000-05-31 | Koninklijke Philips Electronics N.V. | Method of switching of coded video sequences and corresponding device |
US6976032B1 (en) * | 1999-11-17 | 2005-12-13 | Ricoh Company, Ltd. | Networked peripheral for visitor greeting, identification, biographical lookup and tracking |
US6867875B1 (en) * | 1999-12-06 | 2005-03-15 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for simplifying fax transmissions using user-circled region detection |
US6466847B1 (en) * | 2000-09-01 | 2002-10-15 | Canac Inc | Remote control system for a locomotive using voice commands |
US6823084B2 (en) * | 2000-09-22 | 2004-11-23 | Sri International | Method and apparatus for portably recognizing text in an image sequence of scene imagery |
-
2002
- 2002-06-19 FR FR0207581A patent/FR2841160B1/fr not_active Expired - Fee Related
-
2003
- 2003-06-12 AU AU2003253068A patent/AU2003253068A1/en not_active Abandoned
- 2003-06-12 CA CA002487130A patent/CA2487130A1/fr not_active Abandoned
- 2003-06-12 EP EP03760724A patent/EP1526926B1/fr not_active Expired - Lifetime
- 2003-06-12 US US10/473,421 patent/US20050119898A1/en not_active Abandoned
- 2003-06-12 JP JP2004514920A patent/JP2005529743A/ja active Pending
- 2003-06-12 AT AT03760724T patent/ATE382438T1/de not_active IP Right Cessation
- 2003-06-12 ES ES03760724T patent/ES2297215T3/es not_active Expired - Lifetime
- 2003-06-12 WO PCT/FR2003/001764 patent/WO2004000472A1/fr active IP Right Grant
- 2003-06-12 DE DE60318448T patent/DE60318448T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
AU2003253068A1 (en) | 2004-01-06 |
WO2004000472A1 (fr) | 2003-12-31 |
ES2297215T3 (es) | 2008-05-01 |
CA2487130A1 (fr) | 2003-12-31 |
DE60318448D1 (de) | 2008-02-14 |
US20050119898A1 (en) | 2005-06-02 |
WO2004000472A8 (fr) | 2005-03-10 |
EP1526926A1 (fr) | 2005-05-04 |
FR2841160A1 (fr) | 2003-12-26 |
ATE382438T1 (de) | 2008-01-15 |
FR2841160B1 (fr) | 2004-07-23 |
EP1526926B1 (fr) | 2008-01-02 |
DE60318448T2 (de) | 2009-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6909789B1 (en) | Method of processing postal matters | |
US5734568A (en) | Data processing system for merger of sorting information and redundancy information to provide contextual predictive keying for postal addresses | |
CA2309453C (en) | Method and system for recognizing routing information on mail items | |
JP2001523161A (ja) | 配送情報を認識する方法および装置 | |
EP1325494A1 (en) | Voice-enabled directory look-up | |
KR20010030737A (ko) | 우편물에 대한 배달 정보를 인식하기 위한 방법 및 장치 | |
CA2465232C (en) | Method and device for reading postal article inscriptions or document inscriptions | |
JP2005529743A (ja) | 音声合成を使用して郵便物を処理する方法 | |
US8655013B2 (en) | Virtual remote encoding system | |
CN109961320A (zh) | 一种基于计算机网络开发运营意见反馈收集系统 | |
JP3333368B2 (ja) | 通信ネットワーク利用の郵便システム | |
CN113728379A (zh) | 交流管理装置 | |
JP2001029895A (ja) | ビデオコーディングシステム | |
JP3016410B2 (ja) | 指令地図伝送システム | |
JP2001113233A (ja) | 郵便区分機、郵便区分システム及び郵便区分方法 | |
CN114493513B (zh) | 一种基于语音处理的酒店管理方法、装置和电子设备 | |
JP2002056344A (ja) | 情報処理装置、情報処理方法、紙葉類区分装置、および紙葉類区分方法 | |
JPH11122356A (ja) | 契約業務サポートシステム、契約業務サポート方法 | |
JP2001310159A (ja) | 郵便物の転送申請処理システム及び配達状況通知システム | |
JP2003108650A (ja) | コールセンタシステムおよび応対者選定方法およびリクエストに対する対応者選定のためのコンピュータプログラム | |
JP3292997B2 (ja) | 個人宛情報伝達システム | |
JPH06121967A (ja) | 宛名入力区分装置 | |
JP2001025713A (ja) | 郵便区分システム | |
JPH09314067A (ja) | 郵便物処理装置及びその宛先コード特定方法 | |
JPH11305641A (ja) | 作業指示・支援システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081028 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090407 |