JP6417649B2 - 文章処理装置、文章表示システム、プログラム - Google Patents

文章処理装置、文章表示システム、プログラム Download PDF

Info

Publication number
JP6417649B2
JP6417649B2 JP2013172530A JP2013172530A JP6417649B2 JP 6417649 B2 JP6417649 B2 JP 6417649B2 JP 2013172530 A JP2013172530 A JP 2013172530A JP 2013172530 A JP2013172530 A JP 2013172530A JP 6417649 B2 JP6417649 B2 JP 6417649B2
Authority
JP
Japan
Prior art keywords
word
sentence
dictionary
text
environment information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013172530A
Other languages
English (en)
Other versions
JP2015041284A (ja
Inventor
敦 鯉沼
敦 鯉沼
俊行 手塚
俊行 手塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2013172530A priority Critical patent/JP6417649B2/ja
Priority to US14/456,005 priority patent/US9519637B2/en
Priority to CN201410419596.9A priority patent/CN104424166B/zh
Publication of JP2015041284A publication Critical patent/JP2015041284A/ja
Application granted granted Critical
Publication of JP6417649B2 publication Critical patent/JP6417649B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Description

本発明は、文章を処理する文章処理装置に関する。
表示装置や情報処理装置の低下価格化等に伴い、表示装置を利用した情報提供が進んでいる。例えば、街中では表示装置としてデジタルサイネージを用いて店情報や商品情報を表示している。また、駅では表示装置としてLEDや液晶ディスプレイを用いて運行状況、発車時刻、注意報などを表示している。この他にも、表示装置を用いて広告やニュースを表示することが一般に行われるようになっている。
しかしながら、従来は、表示装置が不特定多数の者により判読されることが考慮されておらず、文章の判読性が良好とは言えない場合があった。このような不都合については、文章の判読性を考慮して文章のいい回しを変える技術が考案されている(例えば、特許文献1参照。)。特許文献1では、読者の読解力を想定して、漢字をかなに変換したり、言い回しを変更する文章変換装置が開示されている。
しかしながら、特許文献1に記載された文章変換装置では、想定される読者用の文章が表示されている間、別の読者は文章を判読できないという問題がある。
図1は、特許文献1による文章変換例を示す図の一例である。原文である「メロスは激怒した。」に対し、言い回しの異なる部分文章データ154b、154cが準備されている。部分文章データ154bは、小学5年生から中学1年生までの読者が理解可能な言い回しであり、部分文章データ154cは、小学4年生以下の読者が理解可能な言い回しである。したがって、部分文章データ154bが表示されている間、小学4年生以下の読者は内容を理解できないおそれがある。
本発明は、上記課題に鑑み、複数の読者が理解可能な文章を作成する文章処理装置を提供することを目的とする。
本発明は、文章を処理する文章処理装置であって、前記文章を読む者を指示するための環境情報であって、文章取得手段が取得した文章が表示され、前記文章の読者として想定されるターゲットが存在する施設を指定する情報である環境情報を取得する環境情報取得手段と、前記文章を取得する文章取得手段と、前記文章から1つ以上の単語を抽出する単語抽出手段と、前記文章から抽出された単語を、前記環境情報取得手段が取得した環境情報により特定される、前記施設に特有の単語が登録された辞書により変換して、前記文章を残したまま前記文章の単語に変換後の単語を併記する単語併記手段と、を有し、前記環境情報により特定された辞書は、難解な単語を分かりやすい表現に変換するための辞書であり、前記単語併記手段は前記文章から抽出された難解な単語を分かりやすい表現に変換して、前記文章の単語に変換後の単語を併記し、前記単語併記手段は、前記環境情報取得手段が取得した環境情報に紐づけられている前記辞書において、前記文章から抽出された単語に対応づけられている辞書登録単語を読み出し、前記文章から抽出された単語に前記辞書登録単語を併記する、ことを特徴とする。
複数の読者が理解可能な文章を作成する文章処理装置を提供することができる。
特許文献1による文章変換例を示す図の一例である。 本実施形態の文章処理装置による単語の変換例を説明する図の一例である。 文章処理装置の構成例を示す図である。 文章処理装置のハードウェア構成図の一例である。 本実施形態の文章処理装置による文章変換の概略を説明する図の一例である。 文章処理装置の機能ブロック図の一例である。 形態素解析部による形態素解析の一例を説明する図である。 環境辞書、ひらがな辞書、表現辞書、カタカナ辞書を模式的に説明する図の一例である。 重要単語辞書の一例と外国語辞書の一例を示す図である。 環境辞書と外国語辞書23の紐づけの別の一例を示す図である。 文章処理装置の動作手順を示すフローチャート図の一例である。 図11のステップS300の詳細な手順を示すフローチャート図の一例である。 ひらがな変換の処理手順を説明するフローチャート図の一例である。 教育漢字変換の処理手順を説明するフローチャート図の一例である。 英語変換の処理手順を説明するフローチャート図の一例である。 中国語変換の処理手順を説明するフローチャート図の一例である。 表現変換の処理手順を説明するフローチャート図の一例である。 表現変換とひらがな変換を連続して行う処理手順を説明するフローチャート図の一例である。 外国語変換を複数回行う処理手順を説明するフローチャート図の一例である。 変換文章の一例を示す図である。
以下、本発明を実施するための形態について図面を参照しながら説明する。
図2(a)は、本実施形態の文章処理装置による単語の変換例を説明する図の一例である。本実施形態の文章処理装置は、主に以下の3つの方法で単語を変換する。
1.難しい漢字を平仮名/カタカナで表示
2.難しい表現を簡単な表現で表示
3.重要な単語を外国語で表示
上記1.2の変換により各単語の意味を例えば低年齢層が理解可能な単語に変換できる。また、3の変換により各単語の意味を外国人が理解可能な単語に変換できる。
図2(b)は、本実施形態の文章処理装置により変換された文章の一例を示す図である。原文は日本人の成人が読むことが想定された「コリー社は、お客様のワークスタイル・イノベーションを実現するITソリューションをご提供いたします。」であるとする。
表示装置が表示する原文を幼児が読む可能性がある場合、文章処理装置は次のように変換する。
「コリー社(しゃ)は、お客様(おきゃくさま)の仕事の内容・新しい技術(しごとのないよう・あたらしいぎじゅつ)を作る(つくる)お仕事(しごと)をご提供(ていきょう)いたします。」
また、表示装置が表示する原文を米国人が読む可能性がある場合、文章処理装置は次のように変換する。
「コリー社(cory)は、お客様(customer)のワークスタイル・イノベーション(workstyle・innovation)を実現する(make)ITソリューション(solution)をご提供(give)いたします。」
すなわち、文章処理装置は、文章を読むことが想定される読者に応じて、原文の単語を別の単語に変換し、元の単語と変換後の単語を併記する。併記することで、日本人の成人だけではなく、想定されるターゲット(読者のことであり、例えば外国人/子供などである)も同時に文章を理解できる。
以下、原文を読むことが想定されている読者をメインターゲット、それ以外の読者を想定ターゲットと称する。また、文章処理装置のユーザが想定ターゲットを指示するための情報を環境情報と称する。メインターゲットは、例えば日本人の成人であるが、原文を読むと想定される読者によって変わりうる。想定ターゲットは、幼児、小学生、中学生、外国人などである。
〔構成例〕
図3は、文章処理装置又は文章表示システムの構成例を示す図である。図3(a)では、スタンドアローンのPC(Personal Computer)が文章処理装置100の主要な構成要素である。文章処理装置100は、ユーザが入力した環境情報又は外部から取得した環境情報に応じて単語を別の単語に変換し、原文の単語に変換後の単語を併記することで変換文章を作成する。文章処理装置100は変換文章を内蔵する表示装置に表示する。
なお、文章処理装置100は、PCの他、スマートフォン、タブレットPC、PDA(Personal Digital Assistant)、プリンターや複合機を含む画像形成装置など、情報処理装置であればよい。
図3(b)は文章処理装置100とディスプレイ200が接続された文章表示システム700の構成例を示す。文章処理装置100とディスプレイ200は例えばHDMI(登録商標)などの映像ケーブル150を介して接続されている。文章処理装置100は図3(a)と同様に変換文章を作成し、ディスプレイ200に表示する。
図3(c)は文章表示システム700の構成例を示す図である。この文章表示システム700では、文章処理装置100と端末300がネットワーク400を介して接続されており、端末300にディスプレイ200が接続されている。端末300は例えばPCなどの情報処理装置である。文章処理装置100は図3(a)と同様に変換文章を作成し端末300に送信する。端末300は変換文章を受信してディスプレイ200に表示する。なお、ネットワーク400は、LANやWAN、若しくは、携帯電話網などの一般公衆回線、又は、これらを組み合わせたものである。
図3(d)は文章表示システム700の構成例を示す図である。図3(d)では、PC500と文章処理装置100がネットワーク400を介して接続されている。また、PC500にはディスプレイ200が接続されている。この形態では、PC500がサーバとしての文章処理装置100に原文と環境情報を送信し、文章処理装置100が変換文章を作成してPC500に送信する。PC500は変換文章をディスプレイ200に表示する。この態様は、クライアントサーバタイプ、又は、クラウド型の文章表示システム700である。
図3(e)は文章表示システム700の構成例を示す図である。図3(e)では、PC500と文章処理装置100がネットワーク400を介して接続されている。また、文章処理装置100にはディスプレイ200が接続されている。この形態では、PC500が文章処理装置100に原文と環境情報を送信し、文章処理装置100が変換文章を作成する。文章処理装置100は変換文章をディスプレイ200に表示する。この態様は、リモート操作タイプの文章表示システム700である。
このように、文章処理装置100や文章表示システム700には種々の形態があるが、本実施形態の文章処理装置100は本発明の範囲内で種々の変形及び改良が可能である。なお、以下では、主に図3(b)の形態の文章処理装置100について説明する。
図4は、文章処理装置100のハードウェア構成図の一例を示す。文章処理装置100は、それぞれバスで相互に接続されているCPU101、RAM102、ROM103、記憶媒体装着部104、ディスプレイI/F105、ネットワークカード106、入力装置107、及び、HDD108を有する。CPU101は、OSやプログラムをHDD108から読み出して実行することで種々の機能を提供すると共に、文章処理装置100が行う処理を統括的に制御する。
RAM102はCPU101がプログラムを実行する際に必要なデータを一時保管する作業メモリ(主記憶メモリ)になり、ROM103はBIOS(Basic Input Output System)やOSを起動するためのプログラム、設定ファイル等が記憶されている。
記憶媒体装着部104には記憶媒体110が着脱可能であり、記憶媒体110に記録されたプログラムを読み込み、HDD108に記憶させる。また、記憶媒体装着部104は、HDD108に記憶されたデータを記憶媒体110に書き込むこともできる。記憶媒体110は例えば、USBメモリ、SDメモリカード、DVD−ROM、CD−ROM等である。
入力装置107は、キーボード、マウス、タッチパネル、タッチパッド、又は、音声入力装置などの1つ以上であり、文章処理装置100のユーザの様々な操作指示を受け付ける。
HDD108は、SSD等の不揮発メモリでもよく、OS、プログラム、後述する各種の辞書、及び、各種のファイルが記憶されている。なお、HDD108は、文章処理装置100が内蔵するほかに、文章処理装置100がアクセス可能なネットワーク上に配置されていてもよい。
ディスプレイI/F105は、内蔵する表示装置のほかディスプレイ200と接続されており、変換文章を内蔵する表示装置やディスプレイ200に表示する。ディスプレイ200としては汎用的な表示装置を使用でき、例えば液晶ディスプレイ、プラズマディスプレイ、有機ELディスプレイなどがある。
ネットワークカード106は、ネットワーク400に接続するための通信装置であり、例えば、イーサネット(登録商標)カードである。
なお、プログラムは、記憶媒体110に格納された状態又は不図示のサーバからダウンロードして文章処理装置100等に配布される。プログラムの配布形態は、インストール用に圧縮されていても、実行可能状態でもよい。
また、サーバとしての文章処理装置100、端末300、PC500のハードウェア構成図は図4と同様であるため詳細は省略する。
〔文章変換の概略〕
図5は、本実施形態の文章処理装置100による文章変換の概略を説明する図の一例である。文章処理装置100は、表示S/W(スイッチ)の押下を契機に主に以下の2つの処理を行う。
(i) 環境情報の入力/取得
(ii) 単語/表現の変換
環境情報の入力/取得では、環境情報が入力されるか又は外部から送信される。環境情報と共に、又は、前後して原文である文章も入力又は取得される。
単語/表現の変換では、文節辞書21、単語辞書22、ひらがな辞書26、外国語辞書23、及び、表現辞書24(日本の子供用、米国の子供用などがある)が使用される。なお、単語/表現の変換に使用される辞書はこれらが全てではない。
文節辞書 :原文を形態素解析するための辞書である。
単語辞書 :同じく形態素解析に使用され一般的な単語が登録されている。
ひらがな辞書:漢字をひらがなに変換するための辞書である。
外国語辞書 :日本語を外国語に変換するための辞書である。
表現辞書 :難解な単語や漢字を分かりやすい表現に変換するための辞書である。日本語には日本語の分かりやすい表現があり、英語には(米国人用には)英語の分かりやすい表現がある。
どの辞書を検索するかは環境情報により指定されている。文章処理装置100は、原文に形態素解析を施して単語(品詞レベル)に分解し、該単語で環境情報が指定する辞書(例えば、ひらがな辞書、外国語辞書、又は、表現辞書の1つ以上)を検索して、原文の単語を別の単語に変換する。そして、原文の単語に変換後の単語を併記することで変換文章を作成する。これにより、原文を読むメインターゲットだけではなく、環境情報で指定される想定ターゲットも同時に文章を理解できる文章を作成できる。
〔機能、データベースについて〕
図6は、文章処理装置の機能ブロック図の一例である。文章処理装置100は、環境設定部11、形態素解析部12、文章最適化部13、及び、画像変換部14を有する。これらの各機能は、CPU101がHDD108に記憶されたプログラムを実行し、各種のハードウェアと協働することで実現されている。
環境設定部11は、入力装置107から環境情報の入力を受け付ける。環境情報は、主に想定ターゲットそのものの場合と、ディスプレイ200の場所により間接的に想定ターゲットを指定する場合がある。
想定ターゲットそのものの環境情報:小学生、中学生、中国人、米国人など
場所により間接的に想定ターゲットを指定する環境情報:小学校、病院など
環境設定部11は、予め登録されている想定ターゲット又は場所を表示して、ユーザが入力装置107を操作して選択した想定ターゲット又は場所を受け付ける。または、選択を受け付けるのではなく、想定ターゲット又は場所の入力を直接受け付けてもよい。いずれの場合も、環境設定部11はファイルとして受信した環境情報を受け付けることができる。
なお、環境設定部11は、環境情報の設定を独立に受け付けるのではなく、原文と共に環境情報を受け付けてもよい。この場合、ユーザは、例えば、原文の先頭に予め定められたフォーマットで環境情報又は環境情報の識別情報を添付する。
形態素解析部12は、文節辞書21や単語辞書22を用いて原文に対し形態素解析を行い、原文を文節毎に区切る。文節間の区切りは、「,(カンマ)」、「 (空白)」、「:」などでよい。原文は、例えば入力装置107から入力される。すなわち、ユーザは、キーボード、マウス、マイク等から原文を入力することができる。また、原文はファイルとして外部から送信されてもよい。文章処理装置100はネットワークカード106により外部のPCから原文(例えばテキストファイルとして記憶されている)を受信する。また、原文は予めHDD108に記憶されていたり、記憶媒体110に記憶されている場合があり、文章処理装置100はこれらから原文を読み出すことができる。
文章最適化部13は、環境情報に応じて外国語辞書23や表現辞書24などの辞書を使い分け、変換文章を作成する。文章最適化部13は、例えば、環境情報が中国人ならば、外国語辞書23で単語に中国語を併記する。また、環境情報が幼児ならば、表現辞書24で単語に分かりやすい表現を併記する。この他、環境情報が小学生の場合に、ひらがな辞書で漢字にひらがなを併記する場合などもある。
また、画像変換部14は、変換文章の文字コードをラスタライズしてビットマップデータに変換してディスプレイ200に表示する。
〔形態素解析〕
図7は、形態素解析部12による形態素解析の一例を説明する図である。形態素解析とは文章を意味のある単語に区切り、辞書を利用して品詞を判別することである。ただし、本実施形態では品詞の判別まで行わなくてもよく、形態素解析部12を抽出すればよく、単語レベルに分解できればよい。
文節辞書21には句読点や助詞が登録されている。すなわち、「に」「は」「の」「です」「、」「。」「・」「(空白)」等が登録されている。助詞は文節の区切りに現れることが多いので、助詞に着目することで文節に区切り、文節内に単語や表現が含まれているか否かを判定できる。
また、単語辞書22には単語が登録されている。単語辞書22は日本語として一般的な単語が登録されていればよいため、いわゆる国語辞典から単語を抜き出したものを単語辞書22として使用できる。単語辞書22には、名詞、固有名詞、動詞、カタカナ語、簡単な英語、などが登録されている。
形態素解析部12は、文節に区切られた原文から単語辞書22に登録されている単語を検出して原文を区切る。文節辞書21で文節に区切り、単語辞書22で単語に区切ることで、原文を形態素に区切ることができる。
例えば、原文が「コリー社は、お客様のワークスタイル・イノベーションを実現するITソリューションをご提供いたします」の場合、以下のように形態素に分解される。1つめは形態素を「,(カンマ)」で区切り、2つめは形態素を「△(カンマ)」で区切っている。
1.「コリー社,は,お客様,の,ワークスタイル,・,イノベーション,を,実現,する,IT,ソリューション,を,ご提供,いたします」
2.「コリー社△は、△お客様△の△ワークスタイル△・△イノベーション△を△実現△する△IT△ソリューション△を△ご提供△いたします」
なお、このような方法の他、汎用的な形態素解析エンジンで形態素解析してもよい。また、形態素解析を文章処理装置100が行うのではなく、外部のサービスを利用してもよい。この場合、文章処理装置100は、例えばクラウドサービスや、ネットワーク上のサーバに原文を送信することで、形態素に分解された原文を取得することができる。
〔変換文章の作成〕
図8は、環境辞書31、ひらがな辞書26、表現辞書24、カタカナ辞書27を模式的に説明する図の一例である。環境辞書31には、様々な環境情報が収録されている。上記のように、環境情報は、例えば想定ターゲット又は表示装置であるディスプレイ200の場所である。これらの辞書に登録されている単語が特許請求の範囲の辞書登録単語の一例である。
環境辞書31の全ての環境情報は、1つ以上の辞書と紐づけされている。文章最適化部13はこの紐づけを利用して辞書を選択し、原文に含まれる単語を別の単語に変換する。
例えば、環境情報が「幼児」の場合、ひらがな辞書26、表現辞書24、及び、カタカナ辞書27の3つの辞書と紐づけられている。このように、環境辞書31の環境情報にn個(2以上)の辞書が紐づけられている場合、文章最適化部13は1つの単語から3つの変換が可能になる。しかしながら、必ずしも全ての辞書を参照して別の単語に変換する必要があるとは限らないので、ユーザは、環境情報の入力の際にオプション設定することができる。オプション設定としてユーザは、任意の変換を指定したり(ひらがな辞書26、表現辞書24、カタカナ辞書27の選択)、2つ以上の変換を組み合わせて指定することができる。
ひらがな辞書26には一般的な単語の漢字(例えば、単語辞書に登録されている単語)の読み仮名が平仮名で登録されている。同様の辞書として不図示だが、小学生用のひらがな辞書26、中学生用のひらがな辞書26も存在する。
カタカナ辞書27についても同様に、一般的な単語の漢字の読み仮名がカタカナで登録されている。同様の辞書として不図示だが、小学生用のカタカナ辞書27、中学生用のカタカナ辞書27も存在する。
表現辞書24には一般的な単語の分かりやすい表現、かみ砕いた表現が登録されている。同様の辞書として不図示だが、小学生用の表現辞書24、中学生用の表現辞書24も存在する。また、外国語用の表現辞書24も存在する。
また、図示するように、一部の環境情報は重要単語辞書32及び外国語辞書23と紐づけられている。すなわち、「中国人」「韓国人」「米国人」という環境情報は重要単語辞書32と外国語辞書23に紐づけられている。重要単語辞書32に登録されている単語は、紐づけられている外国語辞書23により変換(翻訳)される。例えば、環境情報が「中国人」の場合、原文のうち重要単語辞書32に登録されている重要単語は、次述する中国語辞書322により中国語に変換される。環境情報が「韓国人」「米国人」の場合も同様である。
図9は、重要単語辞書32の一例と外国語辞書23の一例を示す図である。重要単語辞書32には、外国人が文章を判読する上で重要と思われる単語が登録されている。すなわち、外国人が文章の内容を理解する上でポイントとなる単語である。重要単語をリストアップしておくことで、全ての単語を外国語に変換する必要をなくし読みやすい変換文章を作成できる。
文章最適化部13は、原文に重要単語辞書32に登録されている単語が含まれる場合、該単語を、環境情報に紐づけられている外国語辞書23で外国語に変換する。例えば英単語辞書321、中国語辞書322、及び、韓国語辞書323が、外国語辞書23の一例である。この他、フランス語辞書、ロシア語辞書などを有していてもよく、外国語辞書23の辞書はこれらに限られない。
なお、1つの原文を複数の外国語辞書23で変換することもできる。例えば、想定ターゲットが米国人と中国人の場合、英単語辞書321で単語を変換して単語に英語を併記し、さらに中国語辞書322で単語を変換して単語に英語と中国語を併記する。
重要単語辞書32では各単語に重複しないキー(番号)が付与されている。同様に、外国語辞書23の各辞書の外国語にもキーが付与されている。重要単語辞書32と外国語辞書23の各単語は、このキーで紐づけられている。したがって、文章最適化部13は重要単語辞書32のキーと同じキーを有する単語を外国語辞書23から読み出せばよい。
なお、キーは番号の他、アルファベット、記号、文字など、重要単語辞書32と外国語辞書23の各単語を一意に紐づけられる識別情報であればよい。
図10は、環境辞書31と外国語辞書23の紐づけの別の一例を示す図である。重要単語辞書32に登録されている単語は、外国語辞書23により翻訳されるが、外国人にも幼児から青年まで種々の年齢層がある。そこで、重要単語辞書32が紐づけられている環境情報には、最適な翻訳が可能となるように、複数の環境情報と紐づけられた外国語辞書23が用意されている。複数の環境情報は、例えば中国人と小学生、中国人と中学生など、重要単語辞書32が紐づけられている環境情報と想定ターゲットの環境情報である。
図示するように複数の環境情報の組み合わせに対し、小中学生用中国語辞書3221、小中学生用韓国辞書3231、小中学生用英語辞書3211、などを用意しておくことで、想定ターゲットに応じて最適な翻訳が可能になる。
この場合、ユーザは、用意されている外国語辞書23の種類に応じて複数の環境情報(例えば、中国人・小学生)を入力することができる。
同様の組み合わせは、想定ターゲットの環境情報の組み合わせだけでなく、文章が表示される場所の環境情報と想定ターゲットの環境情報においても可能である。すなわち、例えば、「中国人」と「学校」という場所の環境情報を小中学生用中国語辞書3221と紐づけておけば、中国人の小中学生に最適な翻訳が可能になる。
また、外国人に限られず、「日本人」という環境情報を重要単語辞書32に紐づけておき、「日本人」と「病院」という場所の環境情報を病院用辞書(不図示)に紐づけておくことができる。この場合、原文に含まれる病院に特有の単語を変換できるため、ディスプレイ200が表示する文章を日本人にとっても理解しやすい文章に変換できる。
また、中国人・小学生・病院などのように3つの環境情報を1つの外国語辞書23に紐づけてもよい。辞書の種類を増やすことで、想定ターゲットを細分化してより適切な単語の変換が可能になる。一方、ユーザが、想定ターゲットを絞りにくいと考えた場合は、入力する環境情報の数を制限するので(例えば、中国人・小学生という入力が可能でも中国人だけ入力する)、幅広い想定ターゲットに対応した変換も可能となる。
〔動作手順〕
図11は、文章処理装置100の動作手順を示すフローチャート図の一例である。
S100:まず、環境設定部11は環境情報の入力を受け付ける。なお、想定ターゲットが固定的である場合、環境情報は予め設定されていてもよい。
また、ユーザは原文と共に環境情報を設定することができる。例えば、以下のように設定する。
「幼児:コリー社はお客様の・・・・・・・」
また、以下のように環境情報の識別情報にて設定してもよい。
「02:コリー社はお客様の・・・・・・・」
この「02」が環境情報の識別情報である。
このような設定方法は、リアルタイムに(高頻度に)想定ターゲットが変わる場合に有効である。例えば図3(f)の態様では、PC500が繰り返し原文を文章処理装置100に送信し、文章処理装置100は受信した原文をリアルタイムに表示する場合がある。この場合、原文の先頭に環境情報が添付されていれば、文章処理装置100は、常に、環境情報を先に取得して、環境情報に続く原文を環境情報に応じて変換するので、リアルタイムに想定ターゲットに最適化した変換文章を表示可能となる。
S200:形態素解析部12は原文として文章の入力を受け付ける。形態素解析部12は原文に形態素解析を施す。
S300:文章最適化部13が単語に分割された原文から変換文章を作成する。この処理の詳細は次述する。
S400:画像変換部14は変換文章を画像に変換する。すなわち、ラスタライズしてビットマップデータなどに可視化する。
S500:文章処理装置100は変換文章をディスプレイ200に表示する。
S600:この後、文章処理装置100は表示する文章が残っているか否かを判断する。原文の最後は、予め定められている特殊な符号「¥¥」や「Eof」が付与されている。「・・・・・・ご提供いたします\\」という原文の場合、文章処理装置100は「\\」を検出して表示を終了する。
図12は、ステップS300の詳細な手順を示すフローチャート図の一例である。
文章最適化部13は、まず、環境情報が重要単語辞書32に紐づけられているか否かを判定する(S301)。
環境情報が重要単語辞書32に紐づけられている場合(S301のYes)、文章最適化部13は、原文の重要単語を、環境情報に紐付いている辞書で変換する(S302)。具体的には、環境情報=「米国人」の場合は英語変換を行い、環境情報=「中国人」の場合は中国語変換を行い、環境情報=「中国人・小学生」の場合は小学生用の中国語に変換する。
環境情報が重要単語辞書32に紐づけられていない場合(S301のNo)、文章最適化部13は、環境情報に紐付いている辞書で単語を変換する(S303)。1つの環境情報に複数の辞書が紐付いている場合は、環境情報に紐付いている各辞書で変換する。上記オプション設定で1つの変換が指定されている場合は、指定された変換のみを行う。例えば、オプション設定でひらがな変換が指定されている場合はひらがな変換のみを行う。オプション設定で、ひらがな変換と表現変換が指定されている場合は、表現変換に続いてひらがな変換を行う。どちらの変換を先に行うかは辞書に優先順位が設定されている。これにより、言語の単語を表現変換した後にひらがなに変換することができる。また、オプション設定で、表現辞書24で表現を変換した後に外国語辞書23で外国語に変換することもできる。
図13は、ひらがな変換の処理手順を説明するフローチャート図の一例である。
文章最適化部13は、単語順を1つ大きくする(S1101)。原文は形態素に分解されているので、原文の先頭から各形態素に連番が付されている。なお、単語順は図13の処理開始前に初期化されている。
文章最適化部13は、単語順の単語が漢字か否かを判定する(S1102)。漢字か否かは文字コードが漢字領域に含まれるか否か(ある範囲にはいるか否か)により判定できる。
単語が漢字でない場合(S1102のNo)、ひらがなに変換する必要がないのでステップS1101の処理に戻る。
単語が漢字である場合(S1102のYes)、文章最適化部13は漢字をひらがなに変換する(S1103)。文章最適化部13は、原文の単語の文字コードによりひらがな辞書26を検索し、単語のひらがなを取得する。
そして、文章最適化部13は、単語の後にひらがなを挿入する(S1104)。これにより、原文の漢字とひらがなを併記することができる。
文章最適化部13は、原文の最後の単語まで変換したか否かを判定する(S1105)。最後でない場合は、ステップS1101から処理を繰り返し、最後の場合は、ひらがな変換処理を終了する。
例えば、「お客」という単語をひらがなに変換する場合、以下のようになる。
「お客」の文字コード(UTF-16)は「304a, 5ba2」である。これがひらがなに変換された場合、「きゃく」の文字コードは「304d, 3083, 304f」となる。したがって、「お客」の後に「きゃく」を併記した場合、文字コードは以下のように表すことができる。実際には、「()」も文字コードで表されるが、ここでは「()」のままとした。
お客(きゃく)=304a, 5ba2,(304d, 3083, 304f)
図14は、教育漢字変換の処理手順を説明するフローチャート図の一例である。教育漢字とは日本の小学校6年間に教育される漢字である。よって、想定ターゲット(環境情報)が中学生の場合、教育漢字は変換する必要がない。
文章最適化部13は、単語順を1つ大きくする(S2101)。原文は形態素に分解されているので、原文の先頭から各形態素に連番が付されている。なお、単語順は直前に図14の処理開始前に初期化されている。
文章最適化部13は、単語順の単語が教育漢字か否かを判定する(S2102)。教育漢字か否かは、文字コードが予めリストに登録されている1006文字の教育漢字の文字コードと一致するか否かにより判定できる。
単語が教育漢字である場合(S2102のYes)、ひらがなに変換する必要がないのでステップS2101の処理に戻る。
単語が教育漢字でない場合(S2102のNo)、中学生に読めないおそれがあるので、文章最適化部13は漢字をひらがなに変換する(S2103)。文章最適化部13は、原文の単語の文字コードによりひらがな辞書26を検索し、単語のひらがなを取得する。
そして、文章最適化部13は、単語の後にひらがなを挿入する(S2104)。これにより、原文の漢字とひらがなを併記することができる。
文章最適化部13は、原文の最後の単語まで変換したか否かを判定する(S2105)。最後でない場合は、ステップS2101から処理を繰り返し、最後の場合は、教育漢字変換処理を終了する。
例えば、「微」という単語をひらがなに変換する場合、以下のようになる。
「微」という単語は教育漢字でないので、ひらがなに変換される。「微」の文字コードは「5fae」である。「微」がひらがなに変換された場合、「び」の文字コードは「3073」となる。したがって、「微」の後に「び」を併記した場合、文字コードは以下のように表すことができる。実際には、「()」も文字コードで表されるが、ここでは「()」のままとした。
微(び)=5fae(3073)
図15は、英語変換の処理手順を説明するフローチャート図の一例である。すなわち、環境情報が重要単語辞書32に紐づけられているとする。
文章最適化部13は、単語順を1つ大きくする(S3101)。原文は形態素に分解されているので、原文の先頭から各形態素に連番が付されている。なお、単語順は直前に図15の処理開始前に初期化されている。
文章最適化部13は、単語順の単語が重要単語辞書32に登録されているか否かを判定する(S3102)。この判定は、原文の単語と同じ単語が重要単語辞書32に登録されているか否かを検索すればよい。
単語が重要単語辞書32に登録されていない場合(S3102のNo)、英語に変換する必要がないのでステップS3101の処理に戻る。
単語が重要単語辞書32に登録されている場合(S3102のYes)、文章最適化部13は単語を英語に変換する(S3103)。文章最適化部13は、原文の単語の文字コードにより英単語辞書321を検索し、単語の英語を取得する。
そして、文章最適化部13は、単語の後に英語を挿入する(S3104)。これにより、原文の単語と英語を併記することができる。
文章最適化部13は、原文の最後の単語まで変換したか否かを判定する(S3105)。最後でない場合は、ステップS3101から処理を繰り返し、最後の場合は、英語変換処理を終了する。
例えば、「お客」が重要単語の場合、「お客」は「customer」に変換される。「customer」の文字コードは「ff54, ff4f, ff4d,ff45, ff52」である。 したがって、「お客」の後に「customer」を併記した場合、文字コードは以下のように表すことができる。実際には、「()」も文字コードで表されるが、ここでは「()」のままとした。
お客(customer)=304a, 5ba2(ff54, ff4f, ff4d,ff45, ff52)
図16は、中国語変換の処理手順を説明するフローチャート図の一例である。すなわち、環境情報が重要単語辞書32に紐づけられているとする。
文章最適化部13は、単語順を1つ大きくする(S4101)。原文は形態素に分解されているので、原文の先頭から各形態素に連番が付されている。なお、単語順は直前に図16の処理開始前に初期化されている。
文章最適化部13は、単語順の単語が重要単語辞書32に登録されているか否かを判定する(S4102)。この判定は、単語と同じ単語が重要単語辞書32に登録されているか否かを検索すればよい。
単語が重要単語辞書32に登録されていない場合(S4102のNo)、中国語に変換する必要がないのでステップS4101の処理に戻る。
単語が重要単語辞書32に登録されている場合(S4102のYes)、文章最適化部13は単語を中国語に変換する(S4103)。文章最適化部13は、原文の単語の文字コードにより中国語辞書322を検索し、単語の中国語を取得する。
そして、文章最適化部13は、単語の後に中国語を挿入する(S4104)。これにより、原文の単語と中国語を併記することができる。
文章最適化部13は、原文の最後の単語まで変換したか否かを判定する(S4105)。最後でない場合は、ステップS4101から処理を繰り返し、最後の場合は、中国語変換処理を終了する。
例えば、「お客」が重要単語の場合、「お客」は
Figure 0006417649
に変換される。
Figure 0006417649
の文字コードは「7357,5ba2」である。したがって、「お客」の後に
Figure 0006417649
を併記した場合、文字コードは以下のように表すことができる。実際には、「()」
も文字コードで表されるが、ここでは「()」のままとした。
Figure 0006417649
図17は、表現変換の処理手順を説明するフローチャート図の一例である。すなわち、環境情報が表現辞書24に紐づけられているとする。
文章最適化部13は、単語順を1つ大きくする(S5101)。原文は形態素に分解されているので、原文の先頭から各形態素に連番が付されている。なお、単語順は直前に図17の処理開始前に初期化されている。
文章最適化部13は、単語順の単語が表現辞書24に登録されているか否かを判定する(S5102)。この判定は、単語と同じ単語が表現辞書24に登録されているか否かを検索すればよい。
単語が表現辞書24に登録されていない場合(S5102のNo)、表現を変換する必要がないのでステップS5101の処理に戻る。
単語が表現辞書24に登録されている場合(S5102のYes)、文章最適化部13は単語の表現を変換する(S5103)。文章最適化部13は、原文の単語の文字コードに紐付いている表現を取得する。
そして、文章最適化部13は、単語の後に表現を挿入する(S5104)。これにより、原文の単語と表現を併記することができる。
文章最適化部13は、原文の最後の単語まで変換したか否かを判定する(S5105)。最後でない場合は、ステップS5101から処理を繰り返し、最後の場合は、表現変換処理を終了する。
例えば、「イノベーション(30a4,30ce,30d9,2015,30b7,30e7,30f3」が単語の場合、「イノベーション」は「新しいぎじゅつ」に変換される。「新しいぎじゅつ」の文字コードは「65b0,3057, 3044,304e,3058,3085,3064」である。 したがって、「イノベーション」の後に「新しいぎじゅつ」を併記した場合、文字コードは以下のように表すことができる。実際には、「()」も文字コードで表されるが、ここでは「()」のままとした。
イノベーション(新しいぎじゅつ)=30a4,30ce,30d9,2015,30b7,30e7,30f3(65b0,3057, 3044,304e,3058,3085,3064)
図18は、表現変換とひらがな変換を連続して行う処理手順を説明するフローチャート図の一例である。すなわち、環境情報に、表現辞書24とひらがな辞書26が紐づけられているとする。
ステップS6101〜ステップS6105の処理は図17とほぼ同じである。図18ではステップS6104において単語と表現が併記されているのではなく、置き換えられている。
また、文章の最後まで到達すると、単語順が初期化されている(S6106)。このステップS6106までの処理により、原文「コリー社は、お客様のワークスタイル・イノベーションを実現するITソリューションをご提供いたします」は、「コリー社は、お客様の仕事の内容・新しい技術を作るお仕事をご提供します」と変換される。
続いて文章最適化部13は「コリー社は、お客様の仕事の内容・新しい技術を作るお仕事をご提供します」をひらがな変換する。
ステップS6107〜ステップS6111の処理は図13と同じである。この処理により「コリー社は、お客様の仕事の内容・新しい技術を作るお仕事をご提供します」という変換文章は、「コリー社(しゃ)は、お客様(おきゃくさま)の仕事(しごと)の内容(ないよう)・新しい(あたらしい)技術(ぎじゅつ)を作る(つくる)お仕事(しごと)をご提供(ていきょう)します」という文章に変換される。
図19は、外国語変換を複数回行う処理手順を説明するフローチャート図の一例である。すなわち、重要単語辞書32に紐づけられた複数の環境情報が入力されたものとする。
ステップS7101〜ステップS7105の処理は図15,16とほぼ同じである。図19では、ステップS7100で変数nに環境情報の数が設定されている。
その後、処理が文章の最後まで到達すると、変数n−1が"0"になったか否かが判定される(S7106)。
変数n−1が"0"でない場合は、入力された別の環境情報に基づき単語を変換すべきなので、文章最適化部13はnを1つ小さくし単語順を初期化して(S7107)、ステップS7101からの処理を繰り返す。
例えば、環境情報が「米国人・中国人」の場合、以下の変換文章が得られる。
Figure 0006417649
〔表示例〕
図20(a)は原文の一例を示す。
図20(b)は幼児用変換の一例であり、ひらがな変換された変換文章である。幼児用の変換文章では漢字にひらがなが併記されている。
図20(c)は中学生用変換の一例であり、表現変換された変換文章である。中学生用の変換文章では単語にその表現が併記されている。
図20(d)は幼児用変換の一例であり、表現変換された後にひらがな変換された変換文章である。この幼児用の変換文章では、表現変換により残っている漢字にひらがなが併記されている。
図20(e)は米国人用変換の一例であり、重要単語が英単語に変換された変換文章である。米国人用の変換文章では重要単語に英単語が併記されている。
図20(f)は中国人用変換の一例であり、重要単語が中国語に変換された変換文章である。中国人用の変換文章では重要単語に中国語が併記されている。
図20(g)は米国人・中国人用変換の一例であり、重要単語が英単語と中国語に変換された変換文章である。米国人・中国人用の変換文章では重要単語に英単語・中国語が併記されている。
このような変換は、文章最適化部13は異なる外国語辞書23で文章を変換すればよい。米国人・中国人用の文章は、英単語辞書321で原文を変換した後、さらに中国語辞書322で変換した場合の表示例を示す。したがって、重要単語と、英語と中国語に変換された重要単語とが併記される。例えば「コリー社」は「cory、光理」と併記され、「お客様」は
Figure 0006417649
と併記され、「仕事」は「Work、工作」と併記され、「技術」は「technology、技術」と併記され、「作る」は「Make、造」と併記され、「ご提供」は「Give、提供」と併記されている。
なお、図20のように単語の後に変換された単語を併記するのでなく、原文の単語の上側又は下側に変換された単語を併記してもよい。この場合、ルビ(ふりがな)のように原文より小さいサイズの文字で併記することで、読者が読みやすくなる。
また、上記の他、単語として動詞が出現した場合、言語によっては動詞とその後に続く名詞の順序を前後逆に表示してもよい。例えば、文章処理装置100が原文「ITソリューションをご提供いたします」を英語、中国語に変換する場合、以下のようになる。
英語:ITソリューションをご提供します(give solution)いたします。
中国語:ITソリューションをご提供(提供 解決方案)いたします。
ソリューションに対応する「solution」「解決方案」が、動詞である「提供(give、提供)」よりも後に出現している。これにより、英語、中国語の語順に近くなり、英語を話す人や中国人にとって理解しやすくなる。
以上説明したように、本実施形態の文章処理装置100は、環境情報に応じて単語を別の単語に変換し、原文の単語に変換後の単語を併記することで、日本人の成人と想定されるターゲットが同時に理解できる文章を表示できる。
なお、以上説明した本実施形態は本発明の範囲を限定するものではなく、図3に示した態様はもとより、文章処理装置100の各機能は、ネットワーク上に存在する情報処理装置が有していればよい。例えば、ディスプレイ200が形態素解析部12や文章最適化部13を有していてもよいし、文章処理装置100の各機能を複数の情報処理装置が有していてもよい。
また、本実施形態で使用した辞書は文章処理装置100が有している必要はなく、文章処理装置100がアクセス可能なネットワーク上に配置されていればよい。
11 環境設定部
12 形態素解析部
13 文章最適化部
14 画像変換部
100 文章処理装置
200 ディスプレイ
700 文章表示システム
特開2011‐227849 号公報

Claims (8)

  1. 文章を処理する文章処理装置であって、
    前記文章を読む者を指示するための環境情報であって、文章取得手段が取得した文章が表示され、前記文章の読者として想定されるターゲットが存在する施設を指定する情報である環境情報を取得する環境情報取得手段と、
    前記文章を取得する文章取得手段と、
    前記文章から1つ以上の単語を抽出する単語抽出手段と、
    前記文章から抽出された単語を、前記環境情報取得手段が取得した環境情報により特定される、前記施設に特有の単語が登録された辞書により変換して、前記文章を残したまま前記文章の単語に変換後の単語を併記する単語併記手段と、を有し、
    前記環境情報により特定された辞書は、難解な単語を分かりやすい表現に変換するための辞書であり、前記単語併記手段は前記文章から抽出された難解な単語を分かりやすい表現に変換して、前記文章の単語に変換後の単語を併記し、
    前記単語併記手段は、前記環境情報取得手段が取得した環境情報に紐づけられている前記辞書において、前記文章から抽出された単語に対応づけられている辞書登録単語を読み出し、前記文章から抽出された単語に前記辞書登録単語を併記する、
    ことを特徴とする文章処理装置。
  2. 前記環境情報取得手段が取得した環境情報に、単語が登録された単語辞書が紐づけられている場合、
    前記単語併記手段は、前記環境情報取得手段が取得した環境情報に紐づけられている前記辞書において、前記文章から抽出された単語のうち前記単語辞書に登録されている単語に対応づけられている辞書登録単語を読み出し、前記文章から抽出された単語に前記辞書登録単語を併記する、ことを特徴とする請求項に記載の文章処理装置。
  3. 前記環境情報取得手段が取得した環境情報に2つの前記辞書が紐づけられている場合、
    前記単語併記手段は、前記文章から抽出された単語に対応づけられている第1の辞書登録単語を第1の前記辞書から読み出して前記文章から抽出された単語と置き換え、
    単語が前記第1の辞書登録単語と置き換えられた前記文章に含まれる前記第1の辞書登録単語に対応づけられている第2の辞書登録単語を第2の前記辞書から読み出して、前記文章に含まれる前記第1の辞書登録単語に、前記第2の辞書登録単語を併記する、
    ことを特徴とする請求項1又は2に記載の文章処理装置。
  4. 前記環境情報取得手段が複数の環境情報を取得した場合、
    前記単語併記手段は、前記環境情報取得手段が取得した第1の環境情報に紐づけられている第1の前記辞書において、前記文章から抽出された単語に対応づけられている第1の辞書登録単語を読み出し、前記文章から抽出された単語に前記第1の辞書登録単語を併記し、
    前記環境情報取得手段が取得した第2の環境情報に紐づけられている第2の前記辞書において、前記文章から抽出された単語に対応づけられている第2の辞書登録単語を読み出し、前記文章から抽出された単語に、前記第1の辞書登録単語及び前記第2の辞書登録単語を併記する、ことを特徴とする請求項1又は2に記載の文章処理装置。
  5. 前記環境情報取得手段は、前記文章取得手段が取得する文章の先頭に添付された環境情報を取得し、
    前記単語併記手段は、環境情報が添付された文章に対し、前記文章から抽出された単語に変換後の単語を併記する、
    ことを特徴とする請求項1〜4のいずれか1項に記載の文章処理装置。
  6. 前記単語併記手段は、前記文章から抽出された1つの単語に対し、N(>1)以上の変換後の単語を併記することを特徴とする請求項1に記載の文章処理装置。
  7. 文章を表示する文章表示システムであって、
    前記文章を読む者を指示するための環境情報であって、文章取得手段が取得した文章が表示され、前記文章の読者として想定されるターゲットが存在する施設を指定する情報である環境情報を取得する環境情報取得手段と、
    前記文章を取得する文章取得手段と、
    前記文章から1つ以上の単語を抽出する単語抽出手段と、
    前記文章から抽出された単語を、前記環境情報取得手段が取得した環境情報により特定される、前記施設に特有の単語が登録された辞書により変換して、前記文章を残したまま前記文章の単語に変換後の単語を併記する単語併記手段と、
    前記単語併記手段が変換後の単語を併記した前記文章を表示する表示手段と、を有し、
    前記環境情報により特定された辞書は、難解な単語を分かりやすい表現に変換するための辞書であり、前記単語併記手段は前記文章から抽出された難解な単語を分かりやすい表現に変換して、前記文章の単語に変換後の単語を併記し、
    前記単語併記手段は、前記環境情報取得手段が取得した環境情報に紐づけられている前記辞書において、前記文章から抽出された単語に対応づけられている辞書登録単語を読み出し、前記文章から抽出された単語に前記辞書登録単語を併記する、ことを特徴とする文章表示システム。
  8. 文章を処理する情報処理装置を、
    前記文章を読む者を指示するための環境情報であって、文章取得手段が取得した文章が表示され、前記文章の読者として想定されるターゲットが存在する施設を指定する情報である環境情報を取得する環境情報取得手段と、
    前記文章を取得する文章取得手段と、
    前記文章から1つ以上の単語を抽出する単語抽出手段と、
    前記文章から抽出された単語を、前記環境情報取得手段が取得した環境情報により特定される、前記施設に特有の単語が登録された辞書により変換して、前記文章を残したまま前記文章の単語に変換後の単語を併記する単語併記手段、として機能させ
    前記環境情報により特定された辞書は、難解な単語を分かりやすい表現に変換するための辞書であり、前記単語併記手段は前記文章から抽出された難解な単語を分かりやすい表現に変換して、前記文章の単語に変換後の単語を併記し、
    前記単語併記手段は、前記環境情報取得手段が取得した環境情報に紐づけられている前記辞書において、前記文章から抽出された単語に対応づけられている辞書登録単語を読み出し、前記文章から抽出された単語に前記辞書登録単語を併記することを特徴とするプログラム。
JP2013172530A 2013-08-22 2013-08-22 文章処理装置、文章表示システム、プログラム Expired - Fee Related JP6417649B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013172530A JP6417649B2 (ja) 2013-08-22 2013-08-22 文章処理装置、文章表示システム、プログラム
US14/456,005 US9519637B2 (en) 2013-08-22 2014-08-11 Text processing apparatus and text display system
CN201410419596.9A CN104424166B (zh) 2013-08-22 2014-08-22 文本处理装置和文本显示系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013172530A JP6417649B2 (ja) 2013-08-22 2013-08-22 文章処理装置、文章表示システム、プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018192395A Division JP6729656B2 (ja) 2018-10-11 2018-10-11 文章処理装置、文章表示システム、情報処理装置、プログラム

Publications (2)

Publication Number Publication Date
JP2015041284A JP2015041284A (ja) 2015-03-02
JP6417649B2 true JP6417649B2 (ja) 2018-11-07

Family

ID=52481149

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013172530A Expired - Fee Related JP6417649B2 (ja) 2013-08-22 2013-08-22 文章処理装置、文章表示システム、プログラム

Country Status (3)

Country Link
US (1) US9519637B2 (ja)
JP (1) JP6417649B2 (ja)
CN (1) CN104424166B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2639684C2 (ru) * 2014-08-29 2017-12-21 Общество С Ограниченной Ответственностью "Яндекс" Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты)
JP6502279B2 (ja) * 2016-02-26 2019-04-17 日本電信電話株式会社 外れ値箇所抽出装置、方法及びプログラム
JP2019128374A (ja) * 2018-01-22 2019-08-01 トヨタ自動車株式会社 情報処理装置、及び情報処理方法
US11657454B2 (en) * 2018-05-23 2023-05-23 Panagora Asset Management, Inc System and method for constructing optimized ESG investment portfolios
WO2020054244A1 (ja) * 2018-09-13 2020-03-19 株式会社Nttドコモ 対話情報生成装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2836159B2 (ja) * 1990-01-30 1998-12-14 株式会社日立製作所 同時通訳向き音声認識システムおよびその音声認識方法
JPH0635954A (ja) * 1992-07-17 1994-02-10 Matsushita Electric Ind Co Ltd 機械翻訳機
JPH06119379A (ja) * 1992-10-07 1994-04-28 Matsushita Electric Ind Co Ltd ふりがな機能つき機械翻訳装置および方法
JPH1139298A (ja) * 1997-07-18 1999-02-12 Nippon Telegr & Teleph Corp <Ntt> ふりがな制御装置
JP2000010975A (ja) * 1998-06-16 2000-01-14 Toshiba Corp 機械翻訳システム及び電子メール作成支援システム並びに機械翻訳方法及び電子メール作成支援方法
JP2002140252A (ja) * 2000-11-02 2002-05-17 Nec Custommax Ltd 閲覧サービス方法、データ処理方法および装置、ユーザ端末装置、情報記憶媒体
US20020087302A1 (en) * 2000-11-10 2002-07-04 Miyuki Tomaru Processing system, processing method and recording medium
JP3969628B2 (ja) * 2001-03-19 2007-09-05 富士通株式会社 翻訳支援装置、方法及び翻訳支援プログラム
WO2002086737A1 (en) * 2001-04-20 2002-10-31 Wordsniffer, Inc. Method and apparatus for integrated, user-directed web site text translation
WO2003065245A1 (fr) * 2002-01-29 2003-08-07 International Business Machines Corporation Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
EP1703419A1 (en) * 2003-12-15 2006-09-20 Laboratory for Language Technology Translation judgment device, method, and program
JP4506215B2 (ja) * 2004-03-15 2010-07-21 沖電気工業株式会社 情報システム,スケジュール生成装置,およびスケジュール生成方法
JP2005129086A (ja) * 2005-02-10 2005-05-19 Fujitsu Fip Corp 文書編集装置並びに文書編集処理プログラムを記録した記録媒体
JP2008191976A (ja) * 2007-02-06 2008-08-21 Tsukuba Univ Of Technology リアルタイム字幕提示装置、及び、方法
JP2009104231A (ja) 2007-10-19 2009-05-14 Ricoh Co Ltd 情報処理装置、音出力装置、記号表示装置、画像形成装置、ユーザ属性判定方法、プログラム
JP2009122937A (ja) * 2007-11-14 2009-06-04 Nippon Telegr & Teleph Corp <Ntt> 自動翻訳装置、その方法、そのプログラム
JP5340584B2 (ja) * 2007-11-28 2013-11-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 電子メッセージの読解を支援する装置及び方法
JP2011192163A (ja) * 2010-03-16 2011-09-29 Nec Corp テキスト表示装置、テキスト表示方法、テキスト変換プログラム、及びテキスト変換装置
JP2011227849A (ja) 2010-04-23 2011-11-10 Jvc Kenwood Corp 文章変換装置、文章変換方法、プログラムおよびデータ構造
JP5525921B2 (ja) 2010-06-07 2014-06-18 株式会社リコー 携帯端末、電子文書送信システム、サーバ、機器、文字符号化方法、プログラム
JP2012018633A (ja) * 2010-07-09 2012-01-26 Toshiba Tec Corp 語句解説装置、語句解説方法、翻訳制御装置および翻訳制御方法
JP5529092B2 (ja) * 2011-09-14 2014-06-25 株式会社ゼンリンデータコム 注記データ翻訳装置、注記データ翻訳方法および注記データ翻訳プログラム

Also Published As

Publication number Publication date
CN104424166B (zh) 2017-05-24
JP2015041284A (ja) 2015-03-02
US9519637B2 (en) 2016-12-13
CN104424166A (zh) 2015-03-18
US20150057996A1 (en) 2015-02-26

Similar Documents

Publication Publication Date Title
JP6417649B2 (ja) 文章処理装置、文章表示システム、プログラム
CN105390049A (zh) 电子装置和发音学习支援方法
KR20180036074A (ko) 텍스트 필터링 장치 및 방법
CN105683891A (zh) 通过手势来输入声调和音符符号
JP6729656B2 (ja) 文章処理装置、文章表示システム、情報処理装置、プログラム
JP7102710B2 (ja) 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法
US11709872B2 (en) Computer-readable recording medium storing response processing program, response processing method, and information processing apparatus
JP6933395B2 (ja) 自動翻訳装置及び自動翻訳プログラム
KR20130122437A (ko) 영어의 한글 표기 방법 및 시스템
JP6523345B2 (ja) プレーンasciiデータストリームの符号化
KR20180007183A (ko) 대표문자와 공백 입력을 통한 둘 이상의 단어로 구성된 문장입력방법 및 장치
JP5849690B2 (ja) 文字入力用のプログラムおよび情報処理装置
CN113268981A (zh) 一种信息处理方法、装置及电子设备
JP2002207728A (ja) 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
JP5428622B2 (ja) 電子機器及びプログラム
JP6203083B2 (ja) 未知語抽出装置及び未知語抽出方法
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
JP3803253B2 (ja) 漢字入力のための方法および装置
JP4035111B2 (ja) 対訳語抽出装置、及び対訳語抽出プログラム
JP2008217770A (ja) 言語データ表示システム、言語データ表示方法、及び言語データ表示プログラム
JP2018180808A (ja) 解析プログラム、解析方法および解析装置
JP2021184295A (ja) 自動翻訳装置及び自動翻訳プログラム
JPH1166061A (ja) 情報処理装置および情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体
EP4109435A1 (en) Braille editting method using error output function, recording medium storing program for executing same, and computer program stored in recording medium for executing same
KR20130125912A (ko) 사전 검색 마크업 언어 생성 시스템 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160722

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180924

R151 Written notification of patent or utility model registration

Ref document number: 6417649

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees