JP2015215889A - リフロー型電子書籍生成方法及びウェブサイトシステム - Google Patents
リフロー型電子書籍生成方法及びウェブサイトシステム Download PDFInfo
- Publication number
- JP2015215889A JP2015215889A JP2015090314A JP2015090314A JP2015215889A JP 2015215889 A JP2015215889 A JP 2015215889A JP 2015090314 A JP2015090314 A JP 2015090314A JP 2015090314 A JP2015090314 A JP 2015090314A JP 2015215889 A JP2015215889 A JP 2015215889A
- Authority
- JP
- Japan
- Prior art keywords
- reflow
- paragraph
- electronic book
- characters
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/106—Display of layout of documents; Previewing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0483—Interaction with page-structured environments, e.g. book metaphor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04842—Selection of displayed objects or displayed text elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
Abstract
Description
図4に示すように、1段落目の最終行と2段落目の1行目間の行間D4は、段落内の各行の行間と異なるため、行間D3、D4の違いによってオリジナル段落はどの行を含むかを判断して対応の行を直結してリフロー型段落を形成できる。前述インデント距離は、1行目のみに限らず、段落全体にあることもできる(例えばインデント距離D5)。
第2のブラウザーウィンドウ912は、対応の識別したリフロー型段落914を表示する。認識過程中において算出した某リフロー型段落914の認識信頼度が閾値より低く、更に手作業による確認を必要とする場合、第1のブラウザーウィンドウ911において該対応のオリジナル段落913をマークする。マーク方法は、ハイライト(highlight)、枠で囲み、下線引き、文字色の調整等とすることができる。これを介してユーザは、優先して間違った可能性のあるところを校閲して校正速度を加速できる。
ユーザは、異なるデバイス選択ボタン917をクリックしてその電子書籍の異なる表示装置上における表示画面を見ると共にこれをもって編集調整できる。編集ツールバー920は、ユーザに第2のブラウザーウィンドウ912内で表示されるリフロー型段落914を編集することができる。例えば、文字フォント、太字/斜体、文字サイズ、揃え方、及びその他のスタイル又はフォーマット等を調整できる。
ユーザが「次の段落」の段落マーク選択ボタン918をクリックした場合、第1のブラウザーウィンドウ911及び第2のブラウザーウィンドウ912は、次のマークされた認識信頼度が閾値より低いリフロー型段落をいずれも表示できる(ここでは、「段落3」のリフロー型段落914とする)。ユーザが左側のページめくり選択ボタン919をクリックした場合、第2のブラウザーウィンドウ912に表示される内容は、クリックする前に表示された内容の前のリフロー型段落914(つまり、前のページをめくる)である。ユーザが右側のページめくり選択ボタン919をクリックした場合、第2のブラウザーウィンドウ912に表示される内容は、クリックする前に表示された内容の続き(つまり、次のページをめくる)である。よって、ユーザは、ページめくり選択ボタン919を通じて、順次第2のブラウザーウィンドウ912内のリフロー型段落914を見ることができる。
902 章節
903 ページ番号
904 コメント
905 上マージン
906 下マージン
907 左マージン
908 右マージン
910 編集インターフェース
911 第1のブラウザーウィンドウ
912 第2のブラウザーウィンドウ
913 オリジナル段落
914 リフロー型段落
915 拡大ボタン
916 縮小ボタン
917 デバイス選択ボタン
918 段落マーク選択ボタン
919 ページめくり選択ボタン
920 編集ツールバー
921 保存ボタン
930 ウェブサイトシステム
931 ネットワーク受信モジュール
932 画像識別モジュール
933 ウェブサイトインターフェースモジュール
940 クライアントデバイス
D1、D5 インデント距離
D2 字間
D3、D4 行間
S100 少なくとも1つのページ内容を含む電子ファイルを受信する
S200 ページ内容上の少なくとも1つのオリジナル段落の書字方向に沿って複数行に並べられる複数文字を識別する
S201 各ページ内容中の複数文字を識別すると共に横座標と縦座標とを備えるニ次元座標を統計する
S202 複数文字の縦座標の多いものによって上下マージンを決定し、また複数文字の横座標の多いものによって左右マージンを決定する
S203 各ページ内容中の上下マージンと左右マージン内に位置する複数文字を本文として定義する
S300 該複数行の並ぶ形式を識別する
S400 並ぶ形式によって複数行の複数文字を直結して少なくとも1つのリフロー型段落となると共に各リフロー型段落に対応する認識信頼度を計算する
S401 オリジナル段落のインデント距離を検出する
S402 オリジナル段落のインデント距離によって本文に対応するリフロー型段落を並べる
S500 リフロー型段落の複数文字を編集インターフェースに表示し、また閾値に基づいて認識信頼度が閾値より低いリフロー型段落をマークする
S600 ユーザが編集インターフェース内でマークされたリフロー型段落を確認又は修正する
S700 全てのリフロー型段落をリフロー型電子書籍ファイルとして保存する
Claims (10)
- 少なくとも1つのページ内容を含む電子ファイルを受信するステップと、
前記ページ内容上の少なくとも1つのオリジナル段落の書字方向に沿って複数行に並べられる複数文字を識別するステップと、
前記複数行の並ぶ形式を識別するステップと、
前記並ぶ形式によって前記複数行の前記複数文字を直結して少なくとも1つのリフロー型段落とすると共に各前記リフロー型段落に対応する認識信頼度を計算するステップと、
前記リフロー型段落の複数文字を編集インターフェースに表示し、また閾値に基づいて前記認識信頼度が閾値より低いリフロー型段落をマークするステップと、
ユーザが前記編集インターフェース内でマークされた前記少なくとも1つのリフロー型段落を確認又は修正するステップと、
全ての前記少なくとも1つのリフロー型段落をリフロー型電子書籍ファイルとして保存するステップと、
を含むことを特徴とするリフロー型電子書籍生成方法。 - 前記少なくとも1つのページ内容上の複数文字を識別するステップは、
各前記少なくとも1つのページ内容中の前記複数文字を識別すると共に横座標と縦座標とを備えるニ次元座標を統計するステップと、
前記複数文字の前記縦座標の多いものによって上下マージンを決定し、また前記複数文字の横座標の多いものによって左右マージンを決定するステップと、
各前記少なくとも1つのページ内容中の前記上下マージンと前記左右マージン内に位置する前記複数文字を本文として定義するステップと、
を含むことを特徴とする請求項1に記載のリフロー型電子書籍生成方法。 - 前記並ぶ形式によって前記複数行の前記複数文字を直結して少なくとも1つのリフロー型段落とするステップは、
前記少なくとも1つのオリジナル段落のインデント距離を検出するステップと、
前記少なくとも1つのオリジナル段落のインデント距離に基づき、前記本文に対応する前記少なくとも1つのリフロー型段落を並べるステップと、
を更に含むことを特徴とする請求項2に記載のリフロー型電子書籍生成方法。 - 画像或いはフォームを非テキスト領域として識別することと、各前記非テキスト領域の間隔を識別することと、間隔がデフォルト値より小さい非テキスト領域を合併することと、を包括する非テキスト領域識別ステップを更に含むことを特徴とする請求項1に記載のリフロー型電子書籍生成方法。
- 前記少なくとも1つのリフロー型段落の前記複数文字を編集インターフェースに表示するステップにおいて、前記編集インターフェースは、複数の表示装置に対応し、前記ユーザに前記複数の表示装置のいずれかで表示する前記少なくとも1つのリフロー型段落の画面表示を選択させるデバイスオプションを備え、前記複数の表示装置の表示画面サイズが異なることを特徴とする請求項1に記載のリフロー型電子書籍生成方法。
- ユーザがアップロードした少なくとも1つのページ内容を含む電子ファイルを受信するネットワーク受信モジュールと、
前記少なくとも1つのページ内容上の書字方向に沿って複数行に並べられる複数文字を識別し、また前記複数行の並ぶ形式を識別し、前記並ぶ形式によって前記複数行の前記複数文字を直結して少なくとも1つのリフロー型段落となると共に各前記少なくとも1つのリフロー型段落に対応する認識信頼度を計算する画像識別モジュール、
前記少なくとも1つのリフロー型段落の前記複数文字を表示し、また閾値に基づいて前記認識信頼度が前記閾値より低い前記リフロー型段落をマークするための編集インターフェースを備えるウェブサイトインターフェースモジュールと、
を含むことを特徴とするリフロー型電子書籍を生成するウェブサイトシステム。 - 前記編集インターフェースは、並列の第1のブラウザーウィンドウと第2のブラウザーウィンドウとを有し、前記第1のブラウザーウィンドウは前記少なくとも1つのページ内容を表示し、前記第2のブラウザーウィンドウが対応の識別を経た前記少なくとも1つのリフロー型段落を表示することを特徴とする請求項6に記載のリフロー型電子書籍を生成するウェブサイトシステム。
- 前記編集インターフェースは、複数の表示装置に対応するデバイスオプションと編集ツールセットとを更に含み、前記デバイスオプションは前記ユーザに対応の前記複数の表示装置のいずれかで表示する前記少なくとも1つのリフロー型段落の画面を前記第2のブラウザーウィンドウに表示することを選択させ、前記複数の表示装置の表示画面サイズが異なり、前記編集ツールセットは前記第2のブラウザーウィンドウ内で表示される前記少なくとも1つのリフロー型段落の編集に用いられることを特徴とする請求項6に記載のリフロー型電子書籍を生成するウェブサイトシステム。
- 前記編集インターフェースは、全ての識別を経た前記少なくとも1つのリフロー型段落をリフロー型電子書籍ファイルとして保存するための保存ボタンを更に含むことを特徴とする請求項6に記載のリフロー型電子書籍を生成するウェブサイトシステム。
- 前記編集インターフェースは、順次にマークされた前記少なくとも1つのリフロー型段落を前記第2のブラウザーウィンドウに表示するためのスキップボタンを更に含むことを特徴とする請求項6に記載のリフロー型電子書籍を生成するウェブサイトシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW103116324 | 2014-05-07 | ||
TW103116324A TWI533194B (zh) | 2014-05-07 | 2014-05-07 | 流式電子書產生之方法及網站系統 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015215889A true JP2015215889A (ja) | 2015-12-03 |
Family
ID=54367974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015090314A Pending JP2015215889A (ja) | 2014-05-07 | 2015-04-27 | リフロー型電子書籍生成方法及びウェブサイトシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20150324340A1 (ja) |
JP (1) | JP2015215889A (ja) |
CN (1) | CN105095166B (ja) |
TW (1) | TWI533194B (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150370761A1 (en) * | 2014-06-24 | 2015-12-24 | Keepsayk LLC | Display layout editing system and method using dynamic reflow |
CN105718554A (zh) * | 2016-01-19 | 2016-06-29 | 深圳市天朗时代科技有限公司 | 文档的协同转换方法及系统 |
TWI581175B (zh) * | 2016-05-13 | 2017-05-01 | Image display method | |
KR101890831B1 (ko) * | 2017-01-11 | 2018-09-28 | 주식회사 펍플 | 전자책 서비스 제공방법 및 그를 위한 컴퓨터 프로그램 |
US10409895B2 (en) * | 2017-10-17 | 2019-09-10 | Qualtrics, Llc | Optimizing a document based on dynamically updating content |
US10261987B1 (en) * | 2017-12-20 | 2019-04-16 | International Business Machines Corporation | Pre-processing E-book in scanned format |
US11295061B2 (en) * | 2020-02-05 | 2022-04-05 | Amazon Technologies, Inc. | Dynamic layout adjustment for reflowable content |
CN112257412B (zh) * | 2020-09-25 | 2023-12-01 | 科大讯飞股份有限公司 | 篇章解析方法、电子设备及存储装置 |
CN112965646B (zh) * | 2021-03-05 | 2021-09-14 | 广州文石信息科技有限公司 | 一种流式文档子目录页码计算方法及装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5541566A (en) * | 1978-09-20 | 1980-03-24 | Casio Comput Co Ltd | Error position detection system |
JPS57137971A (en) * | 1981-02-20 | 1982-08-25 | Ricoh Co Ltd | Picture area extracting method |
JPH05282296A (ja) * | 1992-03-31 | 1993-10-29 | Toshiba Corp | 文書作成支援装置 |
JPH11250041A (ja) * | 1998-02-27 | 1999-09-17 | Toshiba Corp | 文書処理装置および文書処理方法 |
JP2000293671A (ja) * | 1999-04-09 | 2000-10-20 | Canon Inc | 画像処理方法、装置及び記憶媒体 |
JP2002041500A (ja) * | 2000-07-24 | 2002-02-08 | Media System:Kk | コンテンツ作成装置およびコンテンツ作成プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US20030014445A1 (en) * | 2001-07-13 | 2003-01-16 | Dave Formanek | Document reflowing technique |
JP2009531789A (ja) * | 2006-03-29 | 2009-09-03 | アマゾン・テクノロジーズ・インコーポレイテツド | 種々のサイズのディスプレイ上にレンダリングするための画像に基づくリフロー可能なファイルの生成 |
JP2009531790A (ja) * | 2006-03-28 | 2009-09-03 | アマゾン・テクノロジーズ・インコーポレイテツド | ディジタル画像における非リフローコンテンツの効率的な処理 |
JP2012230623A (ja) * | 2011-04-27 | 2012-11-22 | Fujifilm Corp | 文書ファイル表示装置、方法およびプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7272258B2 (en) * | 2003-01-29 | 2007-09-18 | Ricoh Co., Ltd. | Reformatting documents using document analysis information |
US7574048B2 (en) * | 2004-09-03 | 2009-08-11 | Microsoft Corporation | Freeform digital ink annotation recognition |
US7788580B1 (en) * | 2006-03-28 | 2010-08-31 | Amazon Technologies, Inc. | Processing digital images including headers and footers into reflow content |
US8866920B2 (en) * | 2008-05-20 | 2014-10-21 | Pelican Imaging Corporation | Capturing and processing of images using monolithic camera array with heterogeneous imagers |
JP2010123002A (ja) * | 2008-11-20 | 2010-06-03 | Canon Inc | 文書画像レイアウト装置 |
CN102541819B (zh) * | 2010-12-27 | 2015-03-04 | 北大方正集团有限公司 | 一种电子文档阅读模式处理的方法及装置 |
US8515176B1 (en) * | 2011-12-20 | 2013-08-20 | Amazon Technologies, Inc. | Identification of text-block frames |
CN102890670B (zh) * | 2012-09-10 | 2015-11-25 | 北京京东世纪贸易有限公司 | 用于在版式阅读和流式阅读方式之间切换的方法和系统 |
US20140215308A1 (en) * | 2013-01-31 | 2014-07-31 | Adobe Systems Incorporated | Web Page Reflowed Text |
US9710440B2 (en) * | 2013-08-21 | 2017-07-18 | Microsoft Technology Licensing, Llc | Presenting fixed format documents in reflowed format |
US10296570B2 (en) * | 2013-10-25 | 2019-05-21 | Palo Alto Research Center Incorporated | Reflow narrative text objects in a document having text objects and graphical objects, wherein text object are classified as either narrative text object or annotative text object based on the distance from a left edge of a canvas of display |
-
2014
- 2014-05-07 TW TW103116324A patent/TWI533194B/zh not_active IP Right Cessation
-
2015
- 2015-01-28 CN CN201510043022.0A patent/CN105095166B/zh not_active Expired - Fee Related
- 2015-04-27 JP JP2015090314A patent/JP2015215889A/ja active Pending
- 2015-04-30 US US14/700,221 patent/US20150324340A1/en not_active Abandoned
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5541566A (en) * | 1978-09-20 | 1980-03-24 | Casio Comput Co Ltd | Error position detection system |
JPS57137971A (en) * | 1981-02-20 | 1982-08-25 | Ricoh Co Ltd | Picture area extracting method |
JPH05282296A (ja) * | 1992-03-31 | 1993-10-29 | Toshiba Corp | 文書作成支援装置 |
JPH11250041A (ja) * | 1998-02-27 | 1999-09-17 | Toshiba Corp | 文書処理装置および文書処理方法 |
JP2000293671A (ja) * | 1999-04-09 | 2000-10-20 | Canon Inc | 画像処理方法、装置及び記憶媒体 |
JP2002041500A (ja) * | 2000-07-24 | 2002-02-08 | Media System:Kk | コンテンツ作成装置およびコンテンツ作成プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US20030014445A1 (en) * | 2001-07-13 | 2003-01-16 | Dave Formanek | Document reflowing technique |
JP2009531790A (ja) * | 2006-03-28 | 2009-09-03 | アマゾン・テクノロジーズ・インコーポレイテツド | ディジタル画像における非リフローコンテンツの効率的な処理 |
JP2009531789A (ja) * | 2006-03-29 | 2009-09-03 | アマゾン・テクノロジーズ・インコーポレイテツド | 種々のサイズのディスプレイ上にレンダリングするための画像に基づくリフロー可能なファイルの生成 |
JP2012230623A (ja) * | 2011-04-27 | 2012-11-22 | Fujifilm Corp | 文書ファイル表示装置、方法およびプログラム |
Non-Patent Citations (1)
Title |
---|
石谷 康人 : "創発的計算に基づく文書画像からの論理要素の抽出−ドキュメントリーダによる既存文書のディジタル化−", 電子情報通信学会技術研究報告, vol. 第98巻第42号, JPN6016025258, 13 May 1998 (1998-05-13), JP, pages 55 - 62, ISSN: 0003349743 * |
Also Published As
Publication number | Publication date |
---|---|
US20150324340A1 (en) | 2015-11-12 |
CN105095166A (zh) | 2015-11-25 |
TW201543337A (zh) | 2015-11-16 |
CN105095166B (zh) | 2017-11-17 |
TWI533194B (zh) | 2016-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2015215889A (ja) | リフロー型電子書籍生成方法及びウェブサイトシステム | |
JP6282116B2 (ja) | キャプチャーされた画像データのスプレッドシートとの関連付け | |
US9280952B2 (en) | Selective display of OCR'ed text and corresponding images from publications on a client device | |
CN104978317B (zh) | 网页生成方法及装置、网站生成方法及建站服务器 | |
US10671805B2 (en) | Digital processing and completion of form documents | |
US11113464B2 (en) | Synchronizing data-entry fields with corresponding image regions | |
KR102369604B1 (ko) | 고정 포맷 문서를 리플로우 포맷으로 프리젠트하는 기법 | |
US20140229426A1 (en) | Electronic blueprint system and method | |
US9542363B2 (en) | Processing of page-image based document to generate a re-targeted document for different display devices which support different types of user input methods | |
US11783610B2 (en) | Document structure identification using post-processing error correction | |
US20160026858A1 (en) | Image based search to identify objects in documents | |
US20100238195A1 (en) | Systems and Methods for Reviewing Digital Pen Data | |
US10552535B1 (en) | System for detecting and correcting broken words | |
JP2005011340A (ja) | オブジェクト上の注釈をグループ化することによりオブジェクトを選択する方法、システム、プログラム、及び、コンピュータ可読記憶媒体 | |
US20170132462A1 (en) | Document checking support apparatus, document checking support system, and non-transitory computer readable medium | |
CN113744830A (zh) | 一种报告生成方法、装置、电子设备及存储介质 | |
CN111222368A (zh) | 一种识别文档段落的方法、装置及电子设备 | |
CN109656652B (zh) | 网页图表绘制方法、装置、计算机设备和存储介质 | |
JP5980990B2 (ja) | データ校正プラットフォームサーバー | |
US20200026749A1 (en) | Pdf extraction with text-based key | |
WO2016018682A1 (en) | Processing image to identify object for insertion into document | |
US20200150855A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
JP6676121B2 (ja) | データ入力装置及びデータ入力プログラム | |
CN112784526A (zh) | 一种文档页面调整方法及装置 | |
US20220292716A1 (en) | Technologies for detecting crop marks in electronic documents using reference images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20160506 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20160506 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160705 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170214 |