JP2014186395A - 文書作成支援装置、方法およびプログラム - Google Patents

文書作成支援装置、方法およびプログラム Download PDF

Info

Publication number
JP2014186395A
JP2014186395A JP2013059113A JP2013059113A JP2014186395A JP 2014186395 A JP2014186395 A JP 2014186395A JP 2013059113 A JP2013059113 A JP 2013059113A JP 2013059113 A JP2013059113 A JP 2013059113A JP 2014186395 A JP2014186395 A JP 2014186395A
Authority
JP
Japan
Prior art keywords
character string
document
priority
type
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2013059113A
Other languages
English (en)
Inventor
Mitsuo Nunome
光生 布目
Masaru Suzuki
優 鈴木
Masayuki Okamoto
昌之 岡本
Kenta Cho
健太 長
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2013059113A priority Critical patent/JP2014186395A/ja
Priority to US14/186,761 priority patent/US20140289238A1/en
Priority to CN201410092798.7A priority patent/CN104077346A/zh
Publication of JP2014186395A publication Critical patent/JP2014186395A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • G06V30/387Matching; Classification using human interaction, e.g. selection of the best displayed recognition candidate

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】ユーザの文書作成を効率的に支援することができる。
【解決手段】本実施形態に係る文書作成支援装置は、判定部、検索部および提示部を含む。判定部は、処理対象の文字列である対象文字列を文字認識した文字認識結果と、該対象文字列が文書中のどの位置に出現するかを示す位置情報とを含む特徴量に基づいて、該対象文字列を含む文書の種別である文書種別を判定する。検索部は、前記対象文字列に関連する関連文字列を検索するための検索条件を満たす場合、前記文書種別に応じて優先度が設定された該関連文字列の検索元となるデータベースから該関連文字列を検索し、前記優先度に基づくスコアが高い順に該関連文字列を得る。提示部は、前記優先度に基づくスコアが高い順に前記関連文字列を提示する。
【選択図】図1

Description

本発明の実施形態は、文書作成支援装置、方法およびプログラムに関する。
近年、ハードウェアおよびソフトウェアの計算機環境が飛躍的に向上している。特に、小型端末の広がりや性能向上と共に、従来では処理性能や記憶容量の不足などから現実的ではなかったタブレット形式の手書き端末や、紙と鉛筆との操作性を模したソフトウェアが普及している。
手書き端末および手書きに関するソフトウェアの増加に応じて、手書き情報を画像として保存するだけではなく、手書き情報を電子テキストとして認識しておく手書き文字認識技術も普及している。手書き情報を電子テキストとして認識した結果を保存しておくことで、検索および再利用に活用できる。また、ネットワーク環境に接続して作成した文書を公開したり、他人と共有したりする手法も一般的に普及している。
特開2004−133565号公報 特開平9−91293号公報
手書き文書作成時には、一般的なキーボードによる電子テキスト作成とは異なり、ユーザがペンやスタイラスなどを用いて自由な筆記で入力することができる。そのため、ユーザが誤って覚えている単語や曖昧性の高いキーワードやフレーズを入力しても、仮名漢字変換機能による候補の制約などが働かないため、ユーザ自身が誤りに気づかないことが想定される。さらに、ユーザが文字列を省略した形式で入力したような場合は、ユーザ自身で後日に見直すときに内容が思い出せない場合や、文書を共有するときなどに他人が内容を把握できないことも想定される。
また、手書き文字認識は、一般に活字OCR(optical character reader)などと比較して文字認識の精度が十分ではない。よって、手書き情報を文字認識した電子テキストを検索する場合に、文字認識誤りのために、ユーザが書いたつもりの文書が検索できない、または電子テキストが正しく分類されていないという状況も生じる。
このような文字認識誤りを、いわばインターネットの多数決で修正する手法もあり、一般的なキーワードについては誤りの修正が期待できる。しかしながら、個人の手書きメモなどの用途を考えた場合、必ずしもインターネットのヒット件数が有効に働くとは限らない。すなわち、個人メモを想定した単語や省略語に関してはインターネットのヒット件数が多い単語が適切な候補とはいえず、さらには、文書が共有されるような、チームや部署内の独自用語や専門用語の補間や修正に関しても、適切な候補を提示することができない。さらに、多数決で修正する手法では、前後に共起する複合的な単語やフレーズや、文書内で離れた位置に出現する単語やフレーズに対しても、適切な候補を提示することができない。
本開示は、上述の課題を解決するためになされたものであり、ユーザの文書作成を効率的に支援することができる文書作成支援装置、方法およびプログラムを提供することを目的とする。
本実施形態に係るコンテンツ作成支援装置は、判定部、検索部および提示部を含む。判定部は、処理対象の文字列である対象文字列を文字認識した文字認識結果と、該対象文字列が文書中のどの位置に出現するかを示す位置情報とを含む特徴量に基づいて、該対象文字列を含む文書の種別である文書種別を判定する。検索部は、前記対象文字列に関連する関連文字列を検索するための検索条件を満たす場合、前記文書種別に応じて優先度が設定された該関連文字列の検索元となるデータベースから該関連文字列を検索し、前記優先度に基づくスコアが高い順に該関連文字列を得る。提示部は、前記優先度に基づくスコアが高い順に前記関連文字列を提示する。
第本実施形態に係る文書作成支援装置を示すブロック図。 文書作成支援装置の動作を示すフローチャート。 特徴抽出部で判定される検索条件の一例を示す図。 文書種別の生成処理を示すフローチャート。 種別判定部における種別判定処理を示すフローチャート。 対応表生成処理を示すフローチャート。 候補検索部における検索処理を示すフローチャート。 候補検索部におけるスコア算出処理の具体例を示す図。 提示部に表示されるユーザインタフェースの一例を示す図。 文字認識精度に応じたユーザインタフェースの一例を示す図。 文字列のリサイズ処理を示す図。
以下、図面を参照しながら本実施形態に係る文書作成支援装置、方法およびプログラムについて詳細に説明する。なお、以下の実施形態では、同一の参照符号を付した部分は同様の動作をおこなうものとして、重複する説明を適宜省略する。
本実施形態に係る文書作成支援装置について図1のブロック図を参照して説明する。
本実施形態に係る文書作成支援装置100は、特徴抽出部101、種別判定部102、候補検索部103、候補選択部104、変換部105、提示部106、文書種別データベース107(以下、文書種別DB107という)、共起フレーズデータベース108(以下、共起フレーズDB108という)、ユーザ入力履歴データベース109(以下、ユーザ入力履歴DB109という)、共起語辞書データベース110(以下、共起語辞書DB110という)、グループ共有辞書データベース111(以下、グループ共有辞書DB111という)およびフォントデータベース112(以下、フォントDB112という)を含む。
特徴抽出部101は、外部から文書を受け取り、文書中における処理の対象となる対象文字列について文字認識処理を行なった文字認識結果と、対象文字列が文書中のどのような位置に出現するかを示す位置情報とを、対象文字列を含む文書の特徴量として抽出する。位置情報は、例えば、文書中の対象文字列の位置、および対象文字列を含む行およびパラグラフのブロックの位置に関する情報を取得すればよい。
また、特徴抽出部101が受け取る文書がユーザによる手書きストロークである場合は、特徴抽出部101が、手書きストロークに対して手書き文字認識処理を行なう。その後、特徴抽出部101は、それぞれの手書きストロークの集合である対象文字列の文字認識結果と位置情報とを対象文字列を含む文書の特徴量として抽出する。なお、文字認識処理については、一般的な文字認識処理を行えばよいのでここでの説明を省略する。
また、特徴抽出部101は、対象文字列に対して関連文字列を検索するための条件である検索条件を満たすかどうかを判定する。関連文字列は、対象文字列に関する修正候補の文字列または補間候補の文字列を示す。特徴抽出部101は、検索条件を満たすと判定した場合、特徴量を種別判定部102に送る。なお、検索条件については、図2および図3を参照して後述する。
種別判定部102は、特徴抽出部101から特徴量を受け取り、後述する文書種別DB107を参照して、特徴量に基づいて対象文字列を含む文書の種別である文書種別を判定する。文書種別は、例えば、日記、手紙、論文、といった一般的文書や、議事録メモ、社内メモ、買い物リストなどといった個人的な文書が挙げられる。
候補検索部103は、種別判定部102から特徴量と文書種別とを受け取る。候補検索部103は、検索元となる後述する共起フレーズDB108、ユーザ入力履歴DB109、共起語辞書DB110およびグループ共有辞書DB111から、対象文字列に関連する文字列を、文書種別に応じて設定されるデータベースの優先度に基づいて検索し、優先度に基づくスコアが高い順に1以上の関連文字列を得る。
候補選択部104は、候補検索部103から1以上の関連文字列を受け取る。候補選択部104は、ユーザからの指示により関連文字列を選択して選択文字列を得る。
変換部105は、候補選択部104から選択文字列を受け取り、選択文字列のフォントを後述するフォントDB112に格納されるフォントに変換する。また、選択文字列および対象文字列が表示される領域が指定されており、かつ現在のフォントサイズでは選択文字列および対象文字列を表示するときに領域外にはみ出る場合は、領域内に収まるように選択文字列および対象文字列のフォントサイズを調整する。
提示部106は、候補検索部103から対象文字列および関連文字列を受け取り、対象文字列および関連文字列をディスプレイなどに提示する。この際、関連文字列は、優先度に基づくスコアが高い順に提示する。また、提示部106は、ユーザからの指示により選択文字列が得られた場合は、変換部105からフォントが変換された選択文字列、またはフォントが変換され、かつフォントサイズが調整された選択文字列および対象文字列を受け取り、対象文字列と選択文字列とを提示する。
文書種別DB107は、文書種別ごとに、文書種別の識別子(ID)と基準特徴量とを対応付けて格納する。基準特徴量は、文書種別の決定するための基準となる特徴量である。基準特徴量については図5を参照して後述する。
共起フレーズDB108は、web文書などをコーパスとして、一般的な新語および未知語で共起語の組み合わせをそれぞれ対応付けて格納する。
ユーザ入力履歴DB109は、ユーザが入力したキーワードおよびフレーズの履歴から共起語の組み合わせを格納する。
共起語辞書DB110は、一般的な共起語、ことわざ、季語の対応、係り受け、文法的な制約などを格納する。
グループ共有辞書DB111は、特的のグループやメンバ間で用いる、ユーザが属するグループで共通して用いられる特有の単語、記号などを格納する。
フォントDB112は、ユーザの手書きストロークに基づくフォント、および、一般的な活字のフォントをフォント情報として格納する。
次に、文書作成支援装置100の動作について図2のフローチャートを参照して説明する。
なお、図2の例では、ユーザから手書きストロークを受け取り、処理する例を示すが、キーボード入力などによる活字の文字列で構成される文書でも同様に処理すればよい。
ステップS201では、特徴抽出部101が、ユーザが入力した手書きストロークを取得する。手書きストロークに対して手書き文字認識処理を行ない、抽出結果としてテキスト文字列が得られる場合は、テキスト文字列を取得する。
ステップS202では、特徴抽出部101が、手書きストロークを文字認識した文字認識結果と位置情報とを抽出して、対象文字列を含む文書の特徴量を得る。
ステップS203では、特徴抽出部101が、検索条件が満たされるかどうかを判定する。検索条件は、本実施形態では、例えば、ユーザから特定のアクションが入力されること、特定の文字列が入力されること、手書きストロークを取得してからユーザからの入力がないまま一定期間が経過することを条件とし、いずれか1つを満たせば検索条件を満たすとすればよい。検索条件が満たされる場合は、ステップS204に進み、検索条件が満たされない場合は、ステップS201に戻り、手書きストロークの取得を継続する。
ステップS204では、種別判定部102が、対象文字列を含む文書に対する種別判定処理を行ない、文書種別を判定する。種別判定処理については、図4および図5を参照して後述する。
ステップS205では、候補検索部103が、文書種別の判定結果に基づいて、対象文字列を含む文書の文書種別に応じて優先度が設定されたデータベースから対象文字列に関する文字列を検索し、優先度に基づくスコアが高い順に関連文字列を得る。候補検索部103の検索処理については図6および図7を参照して後述する。
ステップS206では、提示部106が、対象文字列と1以上の関連文字列とを提示する。
ステップS207では、候補選択部104が、ユーザからの指示に基づいて1以上の関連文字列から文字列を選択し、選択文字列を得る。
ステップS208では、変換部105が、フォントDB112を参照して、選択文字列をユーザの手書きフォントに変換する。このようにすることで、手書きストロークにより表現される対象文字列と、挿入される選択文字列との文書中の整合性を図ることができる。
ステップS209では、変換部105が、挿入先である指定領域に、フォントが変換された選択文字列を挿入する場合、文字列が指定領域外にはみ出さないかどうかを判定する。文字列が指定領域外にはみ出る場合はステップS210に進み、文字列が領域外にはみ出ない、すなわち文字列が領域内に収まる場合は、ステップS211に進む。
ステップS210では、変換部105が、指定領域内に収まるように、対象文字列と選択文字列とのフォントサイズを調整する。
ステップS211では、提示部106が、対象文字列と選択文字列とを文書の指定領域に挿入する。以上で本実施形態の文書作成支援装置の動作を終了する。
なお、ステップS204における文書種別の判定については、文書を作成するアプリケーションの種類などを参照することでユーザが作成する文書の文書種別が予めわかっている場合は、文書種別を1度判定するだけでもよい。この場合、文書種別を1度判定したのち、再びステップS204の処理を行わず、ステップS203の処理の後にステップS205の処理を行うようにすればよい。また、ステップS208において、選択文字列を手書きフォントに変更する場合を示したが、これに限らず、一般的な活字フォントに変換してもよい。こうすることで、対象文字列について補間された箇所を容易に把握することができる。
次に、特徴抽出部101で判定される検索条件の一例について図3を参照して説明する。
図3(a)は、ユーザからストロークの入力がないまま一定時間経過した場合に検索条件を満たす例を示す。一定時間が経過した場合とは、例えば、システムが予め設定した時間、またはユーザが設定する3s(秒)や10s(秒)といった時間であり、この間にストロークやその他の操作などユーザからの入力が無い場合である。なお、この時間は固定値でもよいし、ユーザが文字列を記入する速度と、ある文字列を入力してから次の文字列を入力するまでの時間を示すユーザのポーズの傾向を取得した上で、候補を提示するのに適切なポーズ長を動的に決定してもよい。
図3(b)は、特定の文字列が入力された場合に検索条件を満たす例を示す。特定の文字列入力がある場合とは、文の切れ目である句読点や、終端の括弧などの記号が記入された場合である。また、テキスト認識結果に形態素解析を適用し、得られた品詞に固有名詞や用言など特定のパターンが出現した場合に検索条件を満たすとしてもよい。
図3(a)および図3(b)に示すように、一定時間が経過したことまたは特定の文字列が入力されたことを検索条件とすれば、ユーザ自身が誤りに気づかない場合に関連文字列を提示することができる。
図3(c)は、曖昧部分の指定としてユーザからのアクションを取得した場合に検索条件を満たす例を示す。例えば、対象文字列の前後で補間候補となる文字列を想起する位置に、スクラッチを書き込んだり、複数回連続タップしたり、おおまかな範囲に対し、アンダーラインを往復させるなどのアクションが入力された場合に検索条件を満たすとすればよい。図3(c)に示すようなアクションは、ユーザが対象文字列に関して何か他の共起語があることは理解しているが、どのような語であるかを思い出せないまたはうろ覚えである場合に見られるアクションである。よって、このようなアクションが入力されたときに関連文字列を提示できるようにすればよい。
図3(d)および図3(e)は、部分指定の例となるようなユーザからのアクションの入力を検索条件とする場合である。例えば、出力の指定を行うために、文字列に相当する数の空白を丸で書き込んだり、関連するキーワードを展開する対象文字列を丸で囲ってマーキングする入力例が考えられる。ユーザからのアクションやマーキングはこれに限定されるものではなく、ストロークまたはアクションとして解釈可能であり、かつ検索処理のトリガとしてシステムが解釈できるものであれば、ユーザ定義のものを含む任意の形式でよい。
次に、文書種別DB107に予め格納される文書種別の生成処理について図4のフローチャートを参照して説明する。図4に示す処理は、対象文字列が入力される前に、文書種別を予め設定するための予備処理である。
ステップS401では、文書種別DB107に格納する文書種別を定義する。例えば、メモ、日記、買い物リスト、論文といった分類を文書種別とすればよく、文書種別の定義は、ユーザが設定してもよいし、予め数種類の文書種別を用意してもよい。
ステップS402では、文書種別に応じた例文となる文書である基準文書を収集する。例えば、メモ、日記、論文といった文書種別に応じて、ユーザの実際のメモ、日記、論文を用意しておけばよい。なお、基準文書の収集は、ユーザが所持するデータだけではなく、文書種別の名称をキーワードとしてwebで検索し、適当な文書を基準文書として収集してもよい。
ステップS403では、特徴抽出部101が、基準文書の特徴量である基準特徴量を抽出する。基準特徴量は、上述した特徴抽出部101における特徴量の抽出処理と同様の処理で抽出すればよい。基準特徴量は、例えば、基準文書の単語や複合語、品詞文字列、数量表現などの出現の有無、および、それらの出現位置を特徴量ベクトルとして含めばよい。
ステップS404では、種別判定部102が、基準文書の基準特徴量と文書種別とを対応付けて格納する。また、基準特徴量と文書種別とを教師データとして学習させてもよい。なお、前段の手書きストロークの結果に手書き文字認識処理を適用して得られたテキスト抽出結果に対しては、種別判定部102が形態素解析を適用し、品詞情報や係り受け解析結果も取得しておく。ここで、入力がペンによるストローク情報ではなく、キーボードなどによりテキスト文字列として与えられる場合でも、手書き文字認識の結果得られたテキスト文字列と同じように処理を行えばよい。なお、学習に関しては、特徴量を弁別できる手段として自然言語処理で用いられるSVM(Support Vector Machine)やCRF(Conditional Random Fields)、ANN(Artificial Neural Network)など一般的な弁別器を用いればよい。
ステップS405では、特徴抽出部101が、基準特徴量と文書種別との対応付けを学習した学習結果であるモデルを文書種別DB107に格納する。以上で、文書種別の生成処理を完了する。
次に、種別判定部102における種別判定処理について図5のフローチャートを参照して説明する。
ステップS501では、文書種別DB107から基準特徴量を読み込む。
ステップS502では、対象文字列を含む文書から抽出した特徴量と、文書種別DB107に格納される文書種別ごとの基準特徴量とを、それぞれ比較して類似度を算出する。
ステップS503では、基準特徴量のうち、対象文字列を含む文書の特徴量と基準特徴量との類似度が最も高い基準特徴量と対応付けられる種別を、対象文字列を含む文書の文書種別として判定する。以上で種別判定処理を終了する。
次に、種別判定部102において予め生成される対応表生成処理について図6のフローチャートを参照して説明する。図6に示す処理は、対象文字列が入力される前に、文書種別に応じたデータベースの優先度を予め設定するための予備処理である。
ステップS601では、文書種別DB107から文書種別および基準特徴量を取得する。
ステップS602では、参照可能なデータベースからリストを取得する。参照可能なデータベースは、システムからアクセス(読み込み)可能なデータベースである。本実施形態では、共起フレーズDB108、ユーザ入力履歴DB109、共起語辞書DB110、グループ共有辞書DB111のデータベースがあるとする。これらの利用可能なデータベースは、設定時に探索したり、明示的に格納場所とデータベースの特徴とをリストとしてシステムに与えることで、リストが取得可能であるとする。
ステップS603では、リストに基づいて各データベースと各文書種別との類似度を比較する。一例として、各文書種別に対応する基準特徴量における高頻度語の集合を、各文書種別を代表する「文書」と想定することによって、文書ベクトルを生成できる。よって、文書種別の文書ベクトルと、各データベースに格納されている単語をベクトルとした文書ベクトルとの間で、例えばコサイン類似度を計算することにより類似度を比較することができる。
ステップS604では、文書種別とデータベースとの間の類似度に基づいて、類似度の高い順にデータベースを抽出した類似対応表を生成し、保持する。すなわち、類似度が高いほど優先度が高く設定される。類似対応表は、例えば表1のように文書種別に応じて優先して検索すべきデータベースが把握できればよい。
Figure 2014186395
なお、ある文書種別には特定のデータベースを使う、という対応付けを人手で作成してもよい。また、図6に示す対応表生成処理により得られる対応表は、文書種別が決定されれば、検索元となるデータベースが決定できるので、検索処理において毎回必要になる訳ではない。よって、予め出力済みのものを参照してもよく、サーバから配信されるなどでシステムが読み込み可能な状態になっていればよい。
このように文書種別に応じて検索元となるデータベースの優先度を設定することで、文書に応じて適切な関連文字列を検索することができる。例えば、買い物リストであれば、以前にユーザが購入した商品が含まれる可能性が高いので、ユーザ入力履歴DBの優先度を高く設定すればよいし、議事録メモであれば、グループ内での専門用語が含まれる可能性が高いので、グループ共有辞書の優先度を高く設定すればよい。
次に、候補検索部103における検索処理について図7のフローチャートを参照して説明する。
ステップS701では、文書種別とデータベースとの類似対応表を読み込む。
ステップS702では、種別判定部102から検索クエリとなる対象文字列を取得する。
ステップS703では、類似対応表に基づいて優先度の高い順にデータベースを選択する。
ステップS704では、ステップS703で選択されたデータベースから対象文字列を検索クエリとして検索し、データベースの中で対象文字列の修正候補となるような文字列、さらに、キーワードの共起語や他の表記バリエーションとなる文字列があれば、これらの文字列を関連文字列として取得する。さらに、取得した関連文字列について、データベース間の優先度を考慮したスコアを算出する。
ステップS705では、検索対象となるデータベースについて全てチェックしたどうかを判定する。検索対象となるデータベースについて全てチェックした場合はステップS706に進み、データベースについて全てチェックしていない、すなわちまだチェックしていないデータベースがあれば、ステップS703に戻り、同様の処理を繰り返す。
ステップS706では、算出したスコアに従って関連文字列を並び替える。以上で、候補検索部103における検索処理を終了する。
次に、候補検索部103におけるスコア算出処理の具体例について図8を参照して説明する。
図8の例では、文書中の対象文字列として「どうぶつ」を取得した場合を想定する。また、対象文字列を検索するデータベースとしては、同音異表記変換に関するデータベースA、一般文書からの統計量によって共起頻度が記載された共起フレーズデータベースB、ユーザやグループ間の入力履歴から、隣接する単語の共起情報を算出して蓄積するユーザ入力履歴データベースC、の3つを用意する例を示す。
データベース間の優先度を考慮しない場合には、対象文字列「どうぶつ」に関連する関連文字列のスコアは、図8(a)に示すように各データベース内でのスコアが高い順にソートされる。各データベース内でのスコアは、共起頻度数を正規化したものを予め算出しておく。図8(a)の例では、3つのデータベースから、スコアが高い順に関連文字列を取得すると、データベースA「動物 0.8」、データベースC「動物たち 0.6」、データベースB「どうぶつの森 0.5」、データベースB「動物占い 0.4」となる。
ここで、類似対応表を参照して、文書種別に基づく各データベースの重み値をそれぞれのスコアに乗算する。ここでは、データベースA「0.1」、データベースB「0.6」およびデータベースC「0.3」に設定する。各関連文字列のスコアとデータベース間の重み付けとを掛け合わせた結果が、図8(b)のテーブルになる。
図8(b)に示すテーブルは、関連文字列801、元のスコア802、重み値803および更新後スコア804がそれぞれ対応付けられる。
関連文字列801は、辞書から抽出される対象文字列に関連する文字列である。
元のスコア802は、関連文字列が属するそれぞれのデータベース内での類似度のスコアである。
重み値803は、データベース間の優先度に応じて決定された重み値である。
更新後スコア804は、元のスコア802と重み値803とに基づいた更新後のスコアであり、関連文字列が格納されているデータベース名も共に示す。
データベース間の優先度を考慮すると、例えば、データベースAに格納される関連文字列「動物 0.8」は、データベースAの重み値803が「0.1」であるので、更新後スコア804は、0.8×0.1=0.08となる。同様に、データベースBに格納される関連文字列「動物の森 0.5」は、データベースBの重み値803が「0.6」であるので、更新後スコア804は、0.5×0.6=0.30となる。
データベースAに格納される「動物」のほうがデータベースBに格納される関連文字列「動物の森」よりも元のスコアは高い。しかし、データベースBのほうがデータベースAよりも優先度が高いので、データベースBに格納される「動物の森」が他の関連文字列よりもスコアが高くなる。このようにデータベース間の優先度を考慮することで、処理対象の文書の種別に応じた適切な文字列をユーザに提示することができる。
次に、提示部に表示されるユーザインタフェースの一例について図9を参照して説明する。
図9(a)は、対象文字列を含む文書の文書種別が買い物リストである場合を示し、図9(b)は、対象文字列を含む文書の文書種別が一般文書である場合を示す。
図9(a)の例では、表1に示すように、文書種別が買い物リストであるときのデータベースの優先度は、共起フレーズDB、ユーザ入力履歴DB、共起語辞書DBの順であるため、それぞれ対象文字列901「どうぶつの里」に対する共起語として、スコアに基づいて関連文字列902「さあこい」「おいでよ」「みんなの」が提示される。
また、図9(b)の例では、同じキーワードであるが文書種別が異なり、文書種別が一般文書だった場合の候補として、「さあこい」「横浜」「海浜公園」「絶滅危惧」などとともに、対象文字列中の「どうぶつ」の変換候補として「動物」が関連文字列902として提示される。
ユーザは、これらの候補に対して、ユーザが意図する関連文字列をペンでタップしたり、チェックするなどして確定することで関連文字列を選択し、選択文字列を決定できる。
次に、文字認識精度に応じたユーザインタフェースの出力例について図10を参照して説明する。
図10(a)では「どうぶつ」という手書きストロークが「どうぶつ」と正しく文字認識されている場合の結果であり、図9(b)に示す文書種別が一般文書と同じような候補が出現する。
一方、図10(b)では、「どうぶつ」の文字認識結果が「どらぶつ」となり、文字認識結果が誤っている場合の例を示す。
「どらぶつ」で接辞書引きができないことから誤認識であると判定されるが、誤認識であることを直接ユーザに明示しない。この場合、「どらぶつ」と文字列として距離の近い「どうぶつ」や他の認識候補である「どらぷつ」などの語に展開して、これらの文字列を関連文字列として情報を保持し、検索などにはこれらの候補の単語も含めてマッチングを行えばよい。
また、ユーザが対象文字列「どうぶつの里」の表示領域に下線を引くなどにより、検索条件が満たされた場合には、認識結果「どらぶつ」を提示し、ユーザに修正および確認を促してもよい。
次に、変換部105における文字列のリサイズ処理について図11を参照して説明する。
選択文字列の挿入先となる指定領域(テキストエリア)には、長さや高さ、周辺の図形や罫線、論理構造といった制約が存在する場合がある。図11(a)では、表の内部(セル)に記載した文字列が補間されて挿入される例を示す。対象文字列1101「どうぶつの里」というユーザのストロークは、セル1102のフォントサイズを考慮して書かれた大きさの文字であるが、関連文字列1103「いこうよ」をそのまま挿入した場合には、文字列がセルをはみ出てしまう。よって、ユーザが関連文字列1103「いこうよ」を確定し、さらに書きかけの「どうぶつの里」を書き終えた時点で、1つのフレーズ1104「いこうよどうぶつの里」のフォントサイズをまとめて変更し、文書のセル1102の内部に収まるようにフレーズ1104を縮小して挿入する。
図11(b)では、図形1105の内部に文字列を記載する例を示す。図11(b)についても同様に、関連文字列1103の確定時に直ちに関連文字列1103が挿入されるわけではなく、図形内部のフレーズ1104が書き終わるのを待ち、フレーズ1104が書き終わった時点でフレーズ1104全体の文字サイズを縮小する。
なお、文字列をリサイズすることに限らず、文字列のサイズを変更せずにセルまたは図形のサイズを変更するようにしてもよい。また、フォントサイズが変更された場合には、変更箇所を容易に把握できるように文字色を変更してもよい。
このように、ユーザの手書きの癖やオリジナル記号などの特徴的なストロークを考慮して、文字認識誤りなどを強制的にシステムが修正したり、ユーザが自然に書き進めたりすることができる。また、対象文字列と文書中で距離が離れて共起する語についても関連文字列として提示することができる。例えば、文書種別が手紙であれば、あいさつ語として、冒頭に拝啓、末尾に敬具といったような文書中の距離が離れる単語セットについても、関連文字列としてユーザに提示することができる。さらに、手書きストロークに関連する単語の検索などにも利用することができる。
以上に示した本実施形態に係る文書作成支援装置によれば、ユーザの記入誤りまたは文字列の曖昧性があると想定される文字列に対し、文書の種別に応じて参照するデータベースを変更することで、文書の内容に基づいた適切な候補を提示することができる。また、選択文字列を挿入する際にユーザの手書きフォントに変更して文書に挿入したり、指定領域内に収まるように文字列のフォントサイズを変更して挿入することで、ユーザは選択作業のみで、所望の文字列を文書中に挿入することができ、ユーザの文書作成を効率的に支援することができる。
上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した文書作成支援装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RW、Blu−ray(登録商標)Discなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の文書作成支援装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行なうことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100・・・文書作成支援装置、101・・・特徴抽出部、102・・・種別判定部、103・・・候補検索部、104・・・候補選択部、105・・・変換部、106・・・提示部、107・・・文書種別データベース(DB)、108・・・共起フレーズデータベース(DB)、109・・・ユーザ入力履歴データベース(DB)、110・・・共起語辞書データベース(DB)、111・・・グループ共有辞書データベース(DB)、112・・・フォントデータベース(DB)、801・・・関連文字列、802・・・元のスコア、803・・・重み値、804・・・更新後スコア、901、1101・・・対象文字列、902,1103・・・関連文字列、1102・・・セル、1104・・・フレーズ、1105・・・図形。

Claims (9)

  1. 処理対象の文字列である対象文字列を文字認識した文字認識結果と、該対象文字列が文書中のどの位置に出現するかを示す位置情報とを含む特徴量に基づいて、該対象文字列を含む文書の種別である文書種別を判定する判定部と、
    前記対象文字列に関連する関連文字列を検索するための検索条件を満たす場合、前記文書種別に応じて優先度が設定された該関連文字列の検索元となるデータベースから該関連文字列を検索し、前記優先度に基づくスコアが高い順に該関連文字列を得る検索部と、
    前記優先度に基づくスコアが高い順に前記関連文字列を提示する提示部と、を具備することを特徴とする文書作成支援装置。
  2. 前記対象文字列が手書きストロークである場合、該手書きストロークを文字認識した文字認識結果と該手書きストロークにより表現される文字列の位置情報とを、前記特徴量として抽出する抽出部をさらに具備することを特徴とする請求項1に記載の文書作成支援装置。
  3. ユーザからの指示により選択された関連文字列である選択文字列を前記文書中の指定領域に挿入する場合、該指定領域内に収まるように前記対象文字列および前記選択文字列のフォントの大きさを変更して挿入する変換部をさらに具備することを特徴とする請求項1または請求項2に記載の文書作成支援装置。
  4. 前記変換部は、前記選択文字列を、前記ユーザの手書きフォントに変換して前記文書中に挿入することを特徴とする請求項3に記載の文書作成支援装置。
  5. 前記検索部は、前記文字認識結果として予め設定された文字列および品詞の出現パターンが認識されるか、ユーザの手書きストロークにより前記対象文字列に対するアクションが入力されるか、該手書きストロークを取得後ユーザからの入力がないまま第1期間経過するかのいずれか1つを満たすことにより、前記検索条件を満たすと判定することを特徴とする請求項1から請求項4のいずれか1項に記載の文書作成支援装置。
  6. 前記1以上のデータベースは、複数のユーザ間で共有される文書中に出現する文字列に基づいて生成されるデータベースを含むことを特徴とする請求項1から請求項5のいずれか1項に記載の文書作成支援装置。
  7. 前記提示部は、前記文字認識結果に応じて、提示する関連文字列を変更することを特徴とする請求項1から請求項5のいずれか1項に記載の文書作成支援装置。
  8. 処理対象の文字列である対象文字列を文字認識した文字認識結果と、該対象文字列が文書中のどの位置に出現するかを示す位置情報とを含む特徴量に基づいて、該対象文字列を含む文書の種別である文書種別を判定し、
    前記対象文字列に関連する関連文字列を検索するための検索条件を満たす場合、前記文書種別に応じて優先度が設定された該関連文字列の検索元となるデータベースから該関連文字列を検索し、前記優先度に基づくスコアが高い順に該関連文字列を得、
    前記優先度に基づくスコアが高い順に前記関連文字列を提示することを特徴とする文書作成支援方法。
  9. コンピュータを、
    処理対象の文字列である対象文字列を文字認識した文字認識結果と、該対象文字列が文書中のどの位置に出現するかを示す位置情報とを含む特徴量に基づいて、該対象文字列を含む文書の種別である文書種別を判定する判定手段と、
    前記対象文字列に関連する関連文字列を検索するための検索条件を満たす場合、前記文書種別に応じて優先度が設定された該関連文字列の検索元となるデータベースから該関連文字列を検索し、前記優先度に基づくスコアが高い順に該関連文字列を得る検索手段と、
    前記優先度に基づくスコアが高い順に前記関連文字列を提示する提示手段として機能させるための文書作成支援プログラム。
JP2013059113A 2013-03-21 2013-03-21 文書作成支援装置、方法およびプログラム Abandoned JP2014186395A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013059113A JP2014186395A (ja) 2013-03-21 2013-03-21 文書作成支援装置、方法およびプログラム
US14/186,761 US20140289238A1 (en) 2013-03-21 2014-02-21 Document creation support apparatus, method and program
CN201410092798.7A CN104077346A (zh) 2013-03-21 2014-03-13 文档制作支援装置、方法及程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013059113A JP2014186395A (ja) 2013-03-21 2013-03-21 文書作成支援装置、方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2014186395A true JP2014186395A (ja) 2014-10-02

Family

ID=51569928

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013059113A Abandoned JP2014186395A (ja) 2013-03-21 2013-03-21 文書作成支援装置、方法およびプログラム

Country Status (3)

Country Link
US (1) US20140289238A1 (ja)
JP (1) JP2014186395A (ja)
CN (1) CN104077346A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020187677A (ja) * 2019-05-17 2020-11-19 株式会社日立システムズ 文字一致性確認システム、文字一致性確認装置、文字一致性確認方法及び文字一致性確認プログラム
JP7525125B1 (ja) 2023-09-01 2024-07-30 株式会社コンテンシャル コンテンツの生成方法、そのプログラムおよび情報処理装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6094400B2 (ja) * 2013-06-25 2017-03-15 ソニー株式会社 情報処理装置、情報処理方法、および情報処理プログラム
US9940510B2 (en) * 2013-09-27 2018-04-10 Hewlett-Packard Development Company, L.P. Device for identifying digital content
JP5664813B1 (ja) * 2014-06-10 2015-02-04 富士ゼロックス株式会社 デザイン管理装置及びプログラム
CN106021572B (zh) * 2016-05-31 2019-05-31 北京百度网讯科技有限公司 二元特征词典的构建方法和装置
CN106293462B (zh) * 2016-08-04 2019-11-26 广州视睿电子科技有限公司 一种文字显示方法及装置
JP7095264B2 (ja) * 2017-11-13 2022-07-05 富士通株式会社 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法
WO2020059527A1 (ja) * 2018-09-20 2020-03-26 富士フイルム株式会社 フォント作成装置、フォント作成方法及びフォント作成プログラム
CN113569106B (zh) * 2021-06-16 2023-10-13 东风汽车集团股份有限公司 一种can数据识别方法、装置和设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7917519B2 (en) * 2005-10-26 2011-03-29 Sizatola, Llc Categorized document bases
JP2007219615A (ja) * 2006-02-14 2007-08-30 Sony Corp 検索装置、検索方法、プログラム
CN101226596B (zh) * 2007-01-15 2012-02-01 夏普株式会社 文档图像处理装置以及文档图像处理方法
US7769646B2 (en) * 2007-06-20 2010-08-03 Sureprep, Llc Efficient work flow system and method for processing taxpayer source documents
US8869070B2 (en) * 2008-12-30 2014-10-21 T-Mobile Usa, Inc. Handwriting manipulation for conducting a search over multiple databases
KR20110110557A (ko) * 2010-04-01 2011-10-07 삼성전자주식회사 검색 시스템 및 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020187677A (ja) * 2019-05-17 2020-11-19 株式会社日立システムズ 文字一致性確認システム、文字一致性確認装置、文字一致性確認方法及び文字一致性確認プログラム
WO2020235298A1 (ja) * 2019-05-17 2020-11-26 株式会社日立システムズ 文字一致性確認システム、文字一致性確認装置、文字一致性確認方法及び文字一致性確認プログラム
JP7236928B2 (ja) 2019-05-17 2023-03-10 株式会社日立システムズ 文字一致性確認システム、文字一致性確認装置、文字一致性確認方法及び文字一致性確認プログラム
JP7525125B1 (ja) 2023-09-01 2024-07-30 株式会社コンテンシャル コンテンツの生成方法、そのプログラムおよび情報処理装置

Also Published As

Publication number Publication date
US20140289238A1 (en) 2014-09-25
CN104077346A (zh) 2014-10-01

Similar Documents

Publication Publication Date Title
JP2014186395A (ja) 文書作成支援装置、方法およびプログラム
JP5997217B2 (ja) 言語変換において複数の読み方の曖昧性を除去する方法
KR101650112B1 (ko) 음역을 위한 기계 학습
CN112035730B (zh) 一种语义检索方法、装置及电子设备
US11210468B2 (en) System and method for comparing plurality of documents
JP5462001B2 (ja) 文脈上の入力方法
CN107870901B (zh) 从翻译源原文生成相似文的方法、记录介质、装置以及系统
CN105095204B (zh) 同义词的获取方法及装置
TWI536181B (zh) 在多語文本中的語言識別
US11068653B2 (en) System and method for context-based abbreviation disambiguation using machine learning on synonyms of abbreviation expansions
Bellare et al. Learning extractors from unlabeled text using relevant databases
JP6817556B2 (ja) 類似文生成方法、類似文生成プログラム、類似文生成装置及び類似文生成システム
Prabhakar et al. Machine transliteration and transliterated text retrieval: a survey
JP4266222B2 (ja) 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体
Guellil et al. The role of transliteration in the process of arabizi translation/sentiment analysis
Romero et al. Modern vs diplomatic transcripts for historical handwritten text recognition
Xiong et al. Extended HMM and ranking models for Chinese spelling correction
Aziz et al. Urdu spell checker: A scarce resource language
Yang et al. Spell Checking for Chinese.
Wang et al. Chinese text error correction suggestion generation based on SoundShape code
JP5298834B2 (ja) 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
JP7415495B2 (ja) 文書処理プログラム、文書処理装置、及び文書処理方法
CN112560493B (zh) 命名实体纠错方法、装置、计算机设备和存储介质
CN113722447B (zh) 一种基于多策略匹配的语音搜索方法
Alam et al. Improving accessibility of archived raster dictionaries of complex script languages

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150915

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20160810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160816