JP6729656B2 - 文章処理装置、文章表示システム、情報処理装置、プログラム - Google Patents
文章処理装置、文章表示システム、情報処理装置、プログラム Download PDFInfo
- Publication number
- JP6729656B2 JP6729656B2 JP2018192395A JP2018192395A JP6729656B2 JP 6729656 B2 JP6729656 B2 JP 6729656B2 JP 2018192395 A JP2018192395 A JP 2018192395A JP 2018192395 A JP2018192395 A JP 2018192395A JP 6729656 B2 JP6729656 B2 JP 6729656B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- word
- environmental information
- text
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Description
1.難しい漢字を平仮名/カタカナで表示
2.難しい表現を簡単な表現で表示
3.重要な単語を外国語で表示
上記1.2の変換により各単語の意味を例えば低年齢層が理解可能な単語に変換できる。また、3の変換により各単語の意味を外国人が理解可能な単語に変換できる。
「コリー社(しゃ)は、お客様(おきゃくさま)の仕事の内容・新しい技術(しごとのないよう・あたらしいぎじゅつ)を作る(つくる)お仕事(しごと)をご提供(ていきょう)いたします。」
また、表示装置が表示する原文を米国人が読む可能性がある場合、文章処理装置は次のように変換する。
「コリー社(cory)は、お客様(customer)のワークスタイル・イノベーション(workstyle・innovation)を実現する(make)ITソリューション(solution)をご提供(give)いたします。」
すなわち、文章処理装置は、文章を読むことが想定される読者に応じて、原文の単語を別の単語に変換し、元の単語と変換後の単語を併記する。併記することで、日本人の成人だけではなく、想定されるターゲット(読者のことであり、例えば外国人/子供などである)も同時に文章を理解できる。
図3は、文章処理装置又は文章表示システムの構成例を示す図である。図3(a)では、スタンドアローンのPC(Personal Computer)が文章処理装置100の主要な構成要素である。文章処理装置100は、ユーザが入力した環境情報又は外部から取得した環境情報に応じて単語を別の単語に変換し、原文の単語に変換後の単語を併記することで変換文章を作成する。文章処理装置100は変換文章を内蔵する表示装置に表示する。
図5は、本実施形態の文章処理装置100による文章変換の概略を説明する図の一例である。文章処理装置100は、表示S/W(スイッチ)の押下を契機に主に以下の2つの処理を行う。
(i) 環境情報の入力/取得
(ii) 単語/表現の変換
環境情報の入力/取得では、環境情報が入力されるか又は外部から送信される。環境情報と共に、又は、前後して原文である文章も入力又は取得される。
文節辞書 :原文を形態素解析するための辞書である。
単語辞書 :同じく形態素解析に使用され一般的な単語が登録されている。
ひらがな辞書:漢字をひらがなに変換するための辞書である。
外国語辞書 :日本語を外国語に変換するための辞書である。
表現辞書 :難解な単語や漢字を分かりやすい表現に変換するための辞書である。日本語には日本語の分かりやすい表現があり、英語には(米国人用には)英語の分かりやすい表現がある。
図6は、文章処理装置の機能ブロック図の一例である。文章処理装置100は、環境設定部11、形態素解析部12、文章最適化部13、及び、画像変換部14を有する。これらの各機能は、CPU101がHDD108に記憶されたプログラムを実行し、各種のハードウェアと協働することで実現されている。
想定ターゲットそのものの環境情報:小学生、中学生、中国人、米国人など
場所により間接的に想定ターゲットを指定する環境情報:小学校、病院など
環境設定部11は、予め登録されている想定ターゲット又は場所を表示して、ユーザが入力装置107を操作して選択した想定ターゲット又は場所を受け付ける。または、選択を受け付けるのではなく、想定ターゲット又は場所の入力を直接受け付けてもよい。いずれの場合も、環境設定部11はファイルとして受信した環境情報を受け付けることができる。
図7は、形態素解析部12による形態素解析の一例を説明する図である。形態素解析とは文章を意味のある単語に区切り、辞書を利用して品詞を判別することである。ただし、本実施形態では品詞の判別まで行わなくてもよく、形態素解析部12を抽出すればよく、単語レベルに分解できればよい。
1.「コリー社,は,お客様,の,ワークスタイル,・,イノベーション,を,実現,する,IT,ソリューション,を,ご提供,いたします」
2.「コリー社△は、△お客様△の△ワークスタイル△・△イノベーション△を△実現△する△IT△ソリューション△を△ご提供△いたします」
なお、このような方法の他、汎用的な形態素解析エンジンで形態素解析してもよい。また、形態素解析を文章処理装置100が行うのではなく、外部のサービスを利用してもよい。この場合、文章処理装置100は、例えばクラウドサービスや、ネットワーク上のサーバに原文を送信することで、形態素に分解された原文を取得することができる。
図8は、環境辞書31、ひらがな辞書26、表現辞書24、カタカナ辞書27を模式的に説明する図の一例である。環境辞書31には、様々な環境情報が収録されている。上記のように、環境情報は、例えば想定ターゲット又は表示装置であるディスプレイ200の場所である。これらの辞書に登録されている単語が特許請求の範囲の辞書登録単語の一例である。
図11は、文章処理装置100の動作手順を示すフローチャート図の一例である。
S100:まず、環境設定部11は環境情報の入力を受け付ける。なお、想定ターゲットが固定的である場合、環境情報は予め設定されていてもよい。
「幼児:コリー社はお客様の・・・・・・・」
また、以下のように環境情報の識別情報にて設定してもよい。
「02:コリー社はお客様の・・・・・・・」
この「02」が環境情報の識別情報である。
文章最適化部13は、単語順を1つ大きくする(S1101)。原文は形態素に分解されているので、原文の先頭から各形態素に連番が付されている。なお、単語順は図13の処理開始前に初期化されている。
「お客」の文字コード(UTF-16)は「304a, 5ba2」である。これがひらがなに変換された場合、「きゃく」の文字コードは「304d, 3083, 304f」となる。したがって、「お客」の後に「きゃく」を併記した場合、文字コードは以下のように表すことができる。実際には、「()」も文字コードで表されるが、ここでは「()」のままとした。
お客(きゃく)=304a, 5ba2,(304d, 3083, 304f)
図14は、教育漢字変換の処理手順を説明するフローチャート図の一例である。教育漢字とは日本の小学校6年間に教育される漢字である。よって、想定ターゲット(環境情報)が中学生の場合、教育漢字は変換する必要がない。
「微」という単語は教育漢字でないので、ひらがなに変換される。「微」の文字コードは「5fae」である。「微」がひらがなに変換された場合、「び」の文字コードは「3073」となる。したがって、「微」の後に「び」を併記した場合、文字コードは以下のように表すことができる。実際には、「()」も文字コードで表されるが、ここでは「()」のままとした。
微(び)=5fae(3073)
図15は、英語変換の処理手順を説明するフローチャート図の一例である。すなわち、環境情報が重要単語辞書32に紐づけられているとする。
お客(customer)=304a, 5ba2(ff54, ff4f, ff4d,ff45, ff52)
図16は、中国語変換の処理手順を説明するフローチャート図の一例である。すなわち、環境情報が重要単語辞書32に紐づけられているとする。
に変換される。
も文字コードで表されるが、ここでは「()」のままとした。
イノベーション(新しいぎじゅつ)=30a4,30ce,30d9,2015,30b7,30e7,30f3(65b0,3057, 3044,304e,3058,3085,3064)
図18は、表現変換とひらがな変換を連続して行う処理手順を説明するフローチャート図の一例である。すなわち、環境情報に、表現辞書24とひらがな辞書26が紐づけられているとする。
英語:ITソリューションをご提供します(give solution)いたします。
中国語:ITソリューションをご提供(提供 解決方案)いたします。
12 形態素解析部
13 文章最適化部
14 画像変換部
100 文章処理装置
200 ディスプレイ
700 文章表示システム
Claims (7)
- 文章を処理する文章処理装置であって、
文章を取得する文章取得手段と、
文章を読む想定ターゲットを指定するための環境情報であって、前記文章取得手段が取得した文章が表示され、前記文章の読者として想定されるターゲットが存在する施設を指定する情報である環境情報を1つ以上取得する環境情報取得手段と、
前記文章から1つ以上の単語を抽出する単語抽出手段と、を有し、
前記文章から抽出された単語を、前記環境情報取得手段が取得した環境情報に応じて前記施設に特有の別の単語に変換して、前記文章を残したまま前記文章の単語に併記することを特徴とする文章処理装置。 - 前記単語が想定ターゲットに対して難しい漢字であると判断された場合に、前記単語を平仮名またはカタカナに変換し前記単語に併記することを特徴とする請求項1に記載の文章処理装置。
- 前記単語が想定ターゲットに対して難しい表現であると判断された場合に、前記単語を簡単な表現に変換して前記単語に併記することを特徴とする請求項1に記載の文章処理装置。
- 前記単語が想定ターゲットに対する重要単語であると判断された場合に、前記単語を環境情報に基づいて決定された想定ターゲットに対応する外国語辞書に基づき変換して、前記単語に併記することを特徴とする請求項1に記載の文章処理装置。
- 文章を表示する文章表示システムであって、
文章を取得する文章取得手段と、
文章を読む想定ターゲットを指定するための環境情報であって、前記文章取得手段が取得した文章が表示され、前記文章の読者として想定されるターゲットが存在する施設を指定する情報である環境情報を1つ以上取得する環境情報取得手段と、
前記文章から1つ以上の単語を抽出する単語抽出手段と、を有し
前記文章から抽出された単語を、前記環境情報取得手段が取得した環境情報に応じて前記施設に特有の別の単語に変換して、前記文章を残したまま前記文章の単語に併記することを特徴とする文章表示システム。 - 文章を処理する情報処理装置であって、
文章を取得する文章取得手段と、
文章を読む想定ターゲットを指定するための環境情報であって、前記文章取得手段が取得した文章が表示され、前記文章の読者として想定されるターゲットが存在する施設を指定する情報である環境情報を1つ以上取得する環境情報取得手段と、
前記文章から1つ以上の単語を抽出する単語抽出手段と、を有し、
前記文章から抽出された単語を、前記環境情報取得手段が取得した環境情報に応じて前記施設に特有の別の単語に変換して、前記文章を残したまま前記文章の単語に併記し、端末に提供することを特徴とする情報処理装置。 - 文章を処理する文章処理装置を、
文章を取得する文章取得手段と、
文章を読む想定ターゲットを指定するための環境情報であって、前記文章取得手段が取得した文章が表示され、前記文章の読者として想定されるターゲットが存在する施設を指定する情報である環境情報を1つ以上取得する環境情報取得手段と、
前記文章から1つ以上の単語を抽出する単語抽出手段、として機能させ、
前記文章から抽出された単語を、前記環境情報取得手段が取得した環境情報に応じて前記施設に特有の別の単語に変換して、前記文章を残したまま前記文章の単語に併記することを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018192395A JP6729656B2 (ja) | 2018-10-11 | 2018-10-11 | 文章処理装置、文章表示システム、情報処理装置、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018192395A JP6729656B2 (ja) | 2018-10-11 | 2018-10-11 | 文章処理装置、文章表示システム、情報処理装置、プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013172530A Division JP6417649B2 (ja) | 2013-08-22 | 2013-08-22 | 文章処理装置、文章表示システム、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019036333A JP2019036333A (ja) | 2019-03-07 |
JP6729656B2 true JP6729656B2 (ja) | 2020-07-22 |
Family
ID=65637829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018192395A Active JP6729656B2 (ja) | 2018-10-11 | 2018-10-11 | 文章処理装置、文章表示システム、情報処理装置、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6729656B2 (ja) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0635954A (ja) * | 1992-07-17 | 1994-02-10 | Matsushita Electric Ind Co Ltd | 機械翻訳機 |
JPH06119379A (ja) * | 1992-10-07 | 1994-04-28 | Matsushita Electric Ind Co Ltd | ふりがな機能つき機械翻訳装置および方法 |
JP3161942B2 (ja) * | 1995-06-14 | 2001-04-25 | シャープ株式会社 | 訳振り機械翻訳装置 |
JP2000010975A (ja) * | 1998-06-16 | 2000-01-14 | Toshiba Corp | 機械翻訳システム及び電子メール作成支援システム並びに機械翻訳方法及び電子メール作成支援方法 |
JP2002140252A (ja) * | 2000-11-02 | 2002-05-17 | Nec Custommax Ltd | 閲覧サービス方法、データ処理方法および装置、ユーザ端末装置、情報記憶媒体 |
JP2005010830A (ja) * | 2003-06-16 | 2005-01-13 | Fuji Xerox Co Ltd | 電子データ配信システムおよび配信管理サーバ |
JP4506215B2 (ja) * | 2004-03-15 | 2010-07-21 | 沖電気工業株式会社 | 情報システム,スケジュール生成装置,およびスケジュール生成方法 |
JP2012018633A (ja) * | 2010-07-09 | 2012-01-26 | Toshiba Tec Corp | 語句解説装置、語句解説方法、翻訳制御装置および翻訳制御方法 |
JP5971685B2 (ja) * | 2012-02-20 | 2016-08-17 | 株式会社東芝 | 電力変換装置 |
-
2018
- 2018-10-11 JP JP2018192395A patent/JP6729656B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019036333A (ja) | 2019-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6417649B2 (ja) | 文章処理装置、文章表示システム、プログラム | |
US20190303437A1 (en) | Status reporting with natural language processing risk assessment | |
JP6729656B2 (ja) | 文章処理装置、文章表示システム、情報処理装置、プログラム | |
CN105683891A (zh) | 通过手势来输入声调和音符符号 | |
JP6933395B2 (ja) | 自動翻訳装置及び自動翻訳プログラム | |
KR20130122437A (ko) | 영어의 한글 표기 방법 및 시스템 | |
KR20160140527A (ko) | 다국어 전자책 시스템 및 방법 | |
JP2002207728A (ja) | 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体 | |
JP5428622B2 (ja) | 電子機器及びプログラム | |
JP3803253B2 (ja) | 漢字入力のための方法および装置 | |
JP2007257188A (ja) | 辞書検索装置およびその制御プログラム | |
JP4035111B2 (ja) | 対訳語抽出装置、及び対訳語抽出プログラム | |
JP6203083B2 (ja) | 未知語抽出装置及び未知語抽出方法 | |
US11947580B2 (en) | Book search apparatus, book search database generation apparatus, book search method, book search database generation method, and program | |
JP7223450B2 (ja) | 自動翻訳装置及び自動翻訳プログラム | |
JP2008217770A (ja) | 言語データ表示システム、言語データ表示方法、及び言語データ表示プログラム | |
EP1221082B1 (en) | Use of english phonetics to write non-roman characters | |
JPH1166061A (ja) | 情報処理装置および情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP6551066B2 (ja) | 電子辞書 | |
JP2024017326A (ja) | 検索装置、検索方法およびプログラム | |
JP3194529B2 (ja) | 機械翻訳装置 | |
KR20130125912A (ko) | 사전 검색 마크업 언어 생성 시스템 및 방법 | |
JP5767784B2 (ja) | 情報処置装置、文字列候補確定方法及びプログラム | |
JPH08272780A (ja) | 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法 | |
JP2009271593A (ja) | 情報検索装置、情報検索方法、及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181105 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200204 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200327 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200615 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6729656 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |