JP6897168B2 - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP6897168B2 JP6897168B2 JP2017041259A JP2017041259A JP6897168B2 JP 6897168 B2 JP6897168 B2 JP 6897168B2 JP 2017041259 A JP2017041259 A JP 2017041259A JP 2017041259 A JP2017041259 A JP 2017041259A JP 6897168 B2 JP6897168 B2 JP 6897168B2
- Authority
- JP
- Japan
- Prior art keywords
- noun
- user
- proper
- proper noun
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/274—Syntactic or semantic context, e.g. balancing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は、文中の固有名詞を変換しない場合に比べて、固有名詞が使われている文が利用者にとって理解しやすくなる情報処理装置及び情報処理装プログラムを提供することを目的としている。
請求項1の発明は、少なくとも固有名詞を含む文を受け付ける受付手段と、本情報処理装置によって処理された文を利用する利用者に関する情報を取得する取得手段と、前記固有名詞と名詞と前記利用者に関する情報とを対応させて記憶している記憶手段を用いて、前記固有名詞と前記固有名詞に近接する数量表現の組み合わせを別の名詞と前記名詞と数量表現の組み合わせに置換する置換手段を有する情報処理装置である。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。また、「A、B、C」等のように事物を列挙した場合は、断りがない限り例示列挙であり、その1つのみを選んでいる場合(例えば、Aのみ)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
固有名詞抽出モジュール110は、原文受付モジュール105、固有名詞記憶モジュール115、置換モジュール135と接続されている。固有名詞抽出モジュール110は、固有名詞記憶モジュール115内の情報を用いて、原文受付モジュール105が受け付けた原文103から固有名詞を抽出する。例えば、形態素解析等の技術を用いればよい。
利用者プロファイル抽出モジュール125は、利用者情報受付モジュール120、プロファイル記憶モジュール130、置換モジュール135と接続されている。利用者プロファイル抽出モジュール125は、情報処理装置100によって処理された文(置換結果142)を利用する利用者に関する情報を、プロファイル記憶モジュール130から取得する。ここで「文を利用する利用者」には、その文の一部を置換した文(本実施の形態による処理済みの文)を直接的又は間接的に利用する者である。直接的に利用する者とは、置換した文の読者であり、間接的に利用する者とは、置換した文に対してさらに処理(翻訳等)を加えた文の読者である。
また、置換モジュール135は、置換する別の名詞を、利用者の使用言語にしたがって選択するようにしてもよい。そして、この選択を行った場合、固有名詞抽出モジュール110によって抽出された固有名詞を、この選択した「別の名詞」に置換する。
また、置換モジュール135は、固有名詞に類似する名詞に関する情報と、利用者に関する情報を比較することによって、固有名詞を別の名詞に置換するようにしてもよい。例えば、前述のカテゴリーツリーを用いるようにしてもよい。これによって、利用者のプロファイルに応じた置換が可能になる。
情報処理装置100は、特に、利用者に応じた数量的表現の言い換えを行うものである。特許文献1に記載の技術では、固有名詞に補足説明(補足情報)をつけることで、固有名詞の理解を助けてはいるが、固有名詞の補足説明だけでは数値による絶対的な大小が分かるだけである。
利用者に馴染みがないモノは、補足説明だけではどのようなものか想像ができないため、馴染みがあるものに置き換えるべきである。特に、「固有名詞と数量的表現との組み合わせ」は作者の知識や経験を基にした相対的又は感情的(その作者が経験してきたことから来る経験的)な数量を伝える表現である。例えば、固有名詞である「大江戸ドーム」は「野球場」であるとの補足説明を付加したとしても、野球が盛んな国であるアメリカ人と野球の人気が低い国であるイギリス人では、読み手が想像する野球場の規模が異なる。また、「北海道と同じ広さ」など特定の地域にしかないモノを基準にした場合、補足説明の「38万平方km」だけでは驚きが伝わらない。
プロファイルとして、前述したように、例えば、「名前、年齢、性別、生年月日、年齢、出身国(国籍)、出身地、使用言語、現住所、職業、業種、趣味等」がある。
扱う数量単位には、例えば、「面積、高さ、深さ、速度、重量、照度、時代、金銭価値、倍率等」がある。
固有名詞を置き換える際、同じ数量単位で表せるのであれば、利用者が分かりやすい異なる分野の固有名詞を使ってもよい。例えば、「大江戸ドームの3倍」の大江戸ドームを言い換える際、サッカーが趣味である利用者であれば野球場ではなく同規模のサッカー場を使う。
情報処理装置100、ユーザー端末210A、ユーザー端末210B、データ記憶サーバー220、情報処理サーバー230は、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、情報処理装置100、データ記憶サーバー220、情報処理サーバー230による機能は、クラウドサービスとして実現してもよい。
例えば、ユーザー端末210Aから、情報処理装置100は、原文103を受け取り、置換結果142を返すようにしてもよい。
また、情報処理装置100の代わりに第2の実施の形態である翻訳装置1200を用いた場合、ユーザー端末210Aから原文103を受け取り、翻訳結果1252をユーザー端末210Bに渡すようにしてもよい。
また、情報処理装置100の機能をデータ記憶サーバー220と情報処理サーバー230に分けてもよい。データ記憶サーバー220は、固有名詞記憶モジュール115、プロファイル記憶モジュール130、置換用データ記憶モジュール140を有している。データ記憶サーバー220は、固有名詞記憶モジュール115、プロファイル記憶モジュール130、置換用データ記憶モジュール140を管理して、最新の情報に保つようにしてもよい。また、情報処理サーバー230は、原文受付モジュール105、固有名詞抽出モジュール110、利用者情報受付モジュール120、利用者プロファイル抽出モジュール125、置換モジュール135を有している。情報処理サーバー230は、データ記憶サーバー220内の固有名詞記憶モジュール115、プロファイル記憶モジュール130、置換用データ記憶モジュール140を用いて、原文103内の固有名詞を置換して置換結果142を生成するようにしてもよい。
ステップS302では、原文受付モジュール105は、原文103を受け付ける。
ステップS304では、固有名詞抽出モジュール110は、固有名詞記憶モジュール115を用いて原文103から固有名詞を探索する。
ステップS306では、置換モジュール135は、固有名詞があるか否かを判断し、ある場合はステップS308へ進み、それ以外の場合は処理を終了する(ステップS399)。
ステップS310では、利用者プロファイル抽出モジュール125は、プロファイル記憶モジュール130からユーザープロファイルを取得する。
ステップS312では、置換モジュール135は、固有名詞の置換語を決定する。
ステップS314では、置換モジュール135は、固有名詞を置換する。
また、固有名詞記憶モジュール115が、固有名詞対テーブル400を記憶していてもよい。つまり、原文103からの固有名詞の抽出に、固有名詞対テーブル400(日本固有名詞欄405、米国固有名詞欄410のいずれか一方又は両方)を用いてもよい。
そして、置換モジュール135は、そのプロファイルに応じた固有名詞対テーブル400を選択して、置換処理を行う。
原文103として「ネズミーランドは大江戸ドーム10個分の広さです。」を受け付け、利用者がスティングさん610である場合の処理について説明する。なお、原文103は、日本語であることが判明しているとする。例えば、日本語の原文103を受け付けることが既知であっても(予め定められていても)よいし、原文103で用いられている文字コードから、日本語であると判断してもよい。
なお、置換元の属性(例えば、面積)と類似しているものを置換先の名詞として選択するようにしてもよい。ここで類似とは、両者の差(ここでは面積の差)が予め定められた値以内である場合をいい、完全一致している場合を含む。ここでは、「大江戸ドーム」と「イリニドーム」の面積は、類似している範疇である。また、類似していない場合は、数量表現を変更してもよい。つまり、置換先の属性(例えば、面積)と数量表現Bの積が、置換元の属性(例えば、面積)と数量表現Aの積と、類似するように(「等しくなるように」を含む)数量表現Bを定めればよい。例えば、「大江戸ドーム」の半分の面積である建物等を置換先の名詞とする場合は、数量表現「10個分」を「20個分」と変換する。
図7は、属性付固有名詞対テーブル700のデータ構造例を示す説明図である。属性付固有名詞対テーブル700は、固有名詞と名詞と利用者に関する情報とを対応させて記憶しており、日本固有名詞欄705、米国固有名詞欄710、属性欄715を有している。日本固有名詞欄705は、日本固有名詞を記憶している。米国固有名詞欄710は、米国固有名詞を記憶している。属性欄715は、属性を記憶している。つまり、固有名詞対テーブル400に属性欄715を付加したものである。例えば、「大江戸ドーム」を置換するのに、利用者のプロファイル(ここでは性別)が一致する属性である置換先の名詞を選択してもよい。図6の例では、スティングさん610は男性であるので、属性付固有名詞対テーブル700の1行目の「イリニドーム」を置換先として選択する。なお、1つの置換元に対応する置換先が複数ある場合に、属性欄715を用いるようにしてもよい。
図8は、カテゴリーツリーのデータ構造例を示す説明図である。ノード(建物)802の下にノード(競技場)804、ノード(イベント会場)806があり、ノード(競技場)804の下にノード(エディンスタースタジアム)808、ノード(Aスタジアム)810、ノード(大江戸ドーム)812があり、ノード(イベント会場)806の下にノード(大江戸ドーム)812、ノード(天領ビッグサイト)814があり、ノード(エディンスタースタジアム)808の下にノード(属性)816があり、ノード(Aスタジアム)810の下にノード(属性)818があり、ノード(大江戸ドーム)812の下にノード(属性)820があり、ノード(天領ビッグサイト)814の下にノード(属性)822がある。
なお、2階層目までのノードであるノード(建物)802、ノード(競技場)804、ノード(イベント会場)806は、カテゴリーを示しており、3階層目のノードであるノード(エディンスタースタジアム)808、ノード(Aスタジアム)810、ノード(大江戸ドーム)812、ノード(天領ビッグサイト)814は、固有名詞を示しており、4階層目のノードであるノード(属性)816、ノード(属性)818、ノード(属性)820、ノード(属性)822は、その固有名詞の関連プロファイル(属性)を示している。
図9は、固有名詞プロファイルテーブル900のデータ構造例を示す説明図である。固有名詞プロファイルテーブル900は、固有名詞欄905、国欄910、用途欄915、大きさ欄920を有している。固有名詞欄905は、固有名詞を記憶している。国欄910は、その固有名詞が示すモノがある国を記憶している。用途欄915は、その固有名詞が示すモノの用途を記憶している。大きさ欄920は、その固有名詞が示すモノの大きさを記憶している。その他の属性(例えば、性別(具体的には、男性が使うことが多い等))を含めてもよい。
(1)置換元の固有名詞「大江戸ドーム」のノードをカテゴリーツリーから探索する。そのノードに対応する属性を抽出する。具体的には、そのノードに接続している4階層目のノードを抽出すればよい。そして、そのノードが含まれるカテゴリーを抽出する。具体的には、そのノードに接続している上位のノードを抽出すればよい。
例えば、図10(a)に示す利用者プロファイルテーブル1000の1行目と、ノード(属性)820をマージして、図10(b)に示す検索用プロファイルテーブル1050を生成する。なお、利用者プロファイルテーブル1000のデータ構造は、図5の例に示すプロファイルテーブル500と同等である。検索用プロファイルテーブル1050は、検索プロファイルID欄1055、国欄1060、趣味欄1065、大きさ欄1070を有している。検索プロファイルID欄1055は、本実施の形態において、検索プロファイルを一意に識別するための情報(検索プロファイルID)を記憶している。国欄1060は、国を記憶している。趣味欄1065は、趣味を記憶している。大きさ欄1070は、大きさを記憶している。この例は、国欄1060として、利用者プロファイルテーブル1000の国籍欄1025を採用し、趣味欄1065として、利用者プロファイルテーブル1000の趣味欄1035と固有名詞プロファイルテーブル900の用途欄915の両方を採用し、大きさ欄1070として、固有名詞プロファイルテーブル900の大きさ欄920を採用している。
具体的には、図11の例に示すカテゴリーツリー内の太矢印線のように、ノード(大江戸ドーム)812の1つ上位にあるノード(競技場)804に戻り、その下位にあるノード(ノード(エディンスタースタジアム)808、ノード(Aスタジアム)810)を対象として、その属性(ノード(属性)816、ノード(属性)818)と検索用プロファイル(検索用プロファイルテーブル1050)とを比較する。なお、ここで、ノード(エディンスタースタジアム)808、ノード(Aスタジアム)810内の名詞が、ノード(競技場)804に類似する名詞となる。同じ上位ノードであるノード(競技場)804を有しているからである。比較した結果である一致度が予め定められた閾値以上である名詞(3階層目のノード)を、置換先の名詞とする。例えば、ノード(属性)816と検索用プロファイルテーブル1050との一致度が予め定められた閾値以上となり、ノード(エディンスタースタジアム)808の「エディンスタースタジアム」が置換先の名詞として選択される。
ここでの一致度は、属性(ノード(属性)816、ノード(属性)818)と検索用プロファイル(検索用プロファイルテーブル1050)内の一致した項目数の全項目数に対する割合としてもよい。ここで「一致した項目数」とは、具体的には、検索用プロファイルテーブル1050内の一致した欄数を示しており、「全項目数」とは、具体的には、検索用プロファイルテーブル1050内の全欄数を示している。
一致度が予め定められた閾値以上である名詞がない場合は、さらに、上位のノードに戻って、その下位にあるノードを検索対象とする。図11に示す例では、ノード(競技場)804の上位であるノード(建物)802に戻り、その下位にあるノード(イベント会場)806の下位にあるノードも検索対象とする。
そして、カテゴリーツリーのルートに戻っても、一致度が予め定められた閾値以上である名詞がない場合は、置換を行わない。
図12は、第2の実施の形態の構成例についての概念的なモジュール構成図を示している。第2の実施の形態では、第1の実施の形態による処理結果(置換結果142)を対象とした翻訳を行うものである。固有名詞が翻訳先の言語で用いられている名詞に変更されているので、一般的な翻訳処理を行うことによって、翻訳先の言語に適した名詞を用いることができるようになる。つまり、翻訳が難しい固有名詞であっても、事前に翻訳先にある名詞に変更しているため翻訳が可能になる。
なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。また、図2に示すシステム構成例にあっては、情報処理装置100を翻訳装置1200に置きかえてもよいし、翻訳装置1200を通信回線290に通信可能に追加してもよい。
情報処理装置100は、翻訳モジュール1250と接続されており、原文103、利用者情報118を受け付け、翻訳モジュール1250に置換結果142を渡す。
情報処理装置100内の原文受付モジュール105は、第1の言語(翻訳元の言語)で記載された文を受け付けるようにしてもよい。
翻訳モジュール1250は、情報処理装置100と接続されており、情報処理装置100より置換結果142を受け取り、翻訳結果1252を出力する。翻訳モジュール1250は、情報処理装置100(置換モジュール135)によって固有名詞が置換された文(置換結果142)を、第1の言語とは異なっており、かつ、利用者が用いる第2の言語(翻訳先の言語)に翻訳する。なお、翻訳処理は、既に知られた翻訳処理を用いればよい。
翻訳装置1200によって「固有名詞」又は「固有名詞と数量表現の組み合わせ」を置換して翻訳した場合、翻訳結果1252の利用者に合わせた名詞に変換でき、読者である利用者の知識や経験を基にした相対的、感情的な数量を伝える表現が可能になる。
なお、図14に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図14に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図14に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
103…原文
105…原文受付モジュール
110…固有名詞抽出モジュール
115…固有名詞記憶モジュール
118…利用者情報
120…利用者情報受付モジュール
125…利用者プロファイル抽出モジュール
130…プロファイル記憶モジュール
135…置換モジュール
140…置換用データ記憶モジュール
142…置換結果
210…ユーザー端末
220…データ記憶サーバー
230…情報処理サーバー
290…通信回線
1200…翻訳装置
1250…翻訳モジュール
1252…翻訳結果
Claims (5)
- 少なくとも固有名詞を含む文を受け付ける受付手段と、
本情報処理装置によって処理された文を利用する利用者に関する情報を取得する取得手段と、
前記固有名詞と名詞と前記利用者に関する情報とを対応させて記憶している記憶手段を用いて、前記固有名詞と前記固有名詞に近接する数量表現の組み合わせを別の名詞と前記名詞と数量表現の組み合わせに置換する置換手段
を有する情報処理装置。 - 前記置換手段は、置換する前記別の名詞を、前記利用者の使用言語にしたがって置換する、
請求項1に記載の情報処理装置。 - 前記受付手段が受付けた文は第1の言語で記載されており、
固有名詞が置換された文を、前記第1の言語とは異なっており、かつ前記利用者が用いる言語である第2の言語に翻訳する翻訳手段
をさらに有する請求項2に記載の情報処理装置。 - 前記置換手段は、前記名詞を、現在使われている名詞に変更し、
前記現在使われている名詞として、インターネットを検索して最新の用語集を用いること、又は、電子辞書が改訂された場合に、該改訂後の電子辞書を用いることとする、
請求項1に記載の情報処理装置。 - 情報処理装置であるコンピュータを、
少なくとも固有名詞を含む文を受け付ける受付手段と、
前記情報処理装置によって処理された文を利用する利用者に関する情報を取得する取得手段と、
前記固有名詞と名詞と前記利用者に関する情報とを対応させて記憶している記憶手段を用いて、前記固有名詞と前記固有名詞に近接する数量表現の組み合わせを別の名詞と前記名詞と数量表現の組み合わせに置換する置換手段
として機能させるための情報処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017041259A JP6897168B2 (ja) | 2017-03-06 | 2017-03-06 | 情報処理装置及び情報処理プログラム |
US15/701,788 US20180253417A1 (en) | 2017-03-06 | 2017-09-12 | Information processing device and non-transitory computer readable medium |
CN201710903912.3A CN108536685B (zh) | 2017-03-06 | 2017-09-29 | 信息处理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017041259A JP6897168B2 (ja) | 2017-03-06 | 2017-03-06 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018147205A JP2018147205A (ja) | 2018-09-20 |
JP6897168B2 true JP6897168B2 (ja) | 2021-06-30 |
Family
ID=63355698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017041259A Active JP6897168B2 (ja) | 2017-03-06 | 2017-03-06 | 情報処理装置及び情報処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20180253417A1 (ja) |
JP (1) | JP6897168B2 (ja) |
CN (1) | CN108536685B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7334434B2 (ja) * | 2019-03-19 | 2023-08-29 | 富士フイルムビジネスイノベーション株式会社 | 文書検索結果提示装置及びプログラム並びに文書検索結果提示システム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956668A (en) * | 1997-07-18 | 1999-09-21 | At&T Corp. | Method and apparatus for speech translation with unrecognized segments |
JP4356745B2 (ja) * | 2004-03-18 | 2009-11-04 | 日本電気株式会社 | 機械翻訳システム、機械翻訳方法及びプログラム |
JPWO2006051966A1 (ja) * | 2004-11-12 | 2008-05-29 | 株式会社ジャストシステム | 文書管理装置及び文書管理方法 |
JP4622514B2 (ja) * | 2004-12-28 | 2011-02-02 | 日本電気株式会社 | 文書匿名化装置、文書管理装置、文書匿名化方法及び文書匿名化プログラム |
JP4645242B2 (ja) * | 2005-03-14 | 2011-03-09 | 富士ゼロックス株式会社 | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
US7555475B2 (en) * | 2005-03-31 | 2009-06-30 | Jiles, Inc. | Natural language based search engine for handling pronouns and methods of use therefor |
JP2007207127A (ja) * | 2006-02-04 | 2007-08-16 | Fuji Xerox Co Ltd | 質問応答システム、質問応答処理方法及び質問応答プログラム |
WO2007108788A2 (en) * | 2006-03-13 | 2007-09-27 | Answers Corporation | Method and system for answer extraction |
JP5154132B2 (ja) * | 2007-04-16 | 2013-02-27 | ヤフー株式会社 | 名称変換認知装置、方法 |
KR20100029221A (ko) * | 2007-06-01 | 2010-03-16 | 구글 인코포레이티드 | 명칭 엔터티와 신규 단어를 검출하는 것 |
US8516380B2 (en) * | 2007-12-28 | 2013-08-20 | International Business Machines Corporation | Conversation abstractions based on trust levels in a virtual world |
JP5812534B2 (ja) * | 2012-06-04 | 2015-11-17 | 日本電信電話株式会社 | 質問応答装置、方法、及びプログラム |
JP2014206916A (ja) * | 2013-04-15 | 2014-10-30 | 株式会社日立製作所 | 作業履歴分析装置及び作業履歴分析システム並びに作業履歴分析方法 |
JP2016031733A (ja) * | 2014-07-30 | 2016-03-07 | 富士通株式会社 | 推論容易性算出プログラム、装置、及び方法 |
US10127212B1 (en) * | 2015-10-14 | 2018-11-13 | Google Llc | Correcting errors in copied text |
EP3369002A4 (en) * | 2015-10-26 | 2019-06-12 | 24/7 Customer, Inc. | METHOD AND DEVICE FOR FACILITATING THE PREDICTION OF CUSTOMER VISIONS |
KR102565275B1 (ko) * | 2016-08-10 | 2023-08-09 | 삼성전자주식회사 | 병렬 처리에 기초한 번역 방법 및 장치 |
KR102329127B1 (ko) * | 2017-04-11 | 2021-11-22 | 삼성전자주식회사 | 방언을 표준어로 변환하는 방법 및 장치 |
-
2017
- 2017-03-06 JP JP2017041259A patent/JP6897168B2/ja active Active
- 2017-09-12 US US15/701,788 patent/US20180253417A1/en not_active Abandoned
- 2017-09-29 CN CN201710903912.3A patent/CN108536685B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108536685A (zh) | 2018-09-14 |
JP2018147205A (ja) | 2018-09-20 |
US20180253417A1 (en) | 2018-09-06 |
CN108536685B (zh) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7289047B2 (ja) | ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム | |
JP6333745B2 (ja) | 翻訳結果提供方法、翻訳結果提供システム、プログラムおよびファイル配布システム | |
US9262403B2 (en) | Dynamic generation of auto-suggest dictionary for natural language translation | |
KR101326354B1 (ko) | 문자 변환 처리 장치, 기록 매체 및 방법 | |
CN102426607B (zh) | 可扩展搜索项建议引擎 | |
JP2007257644A (ja) | 訳語候補文字列予測に基づく訳語取得のためのプログラム、方法および装置 | |
JP4502615B2 (ja) | 類似文検索装置、類似文検索方法、およびプログラム | |
US20160188569A1 (en) | Generating a Table of Contents for Unformatted Text | |
TWI588668B (zh) | Foreign language production support facilities and methods | |
US10650195B2 (en) | Translated-clause generating method, translated-clause generating apparatus, and recording medium | |
JP6602243B2 (ja) | 学習装置、方法、及びプログラム | |
JP6897168B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6705352B2 (ja) | 言語処理装置、言語処理方法、及び言語処理プログラム | |
KR20190090636A (ko) | 문서 자동 편집 방법 | |
CN111581344A (zh) | 一种接口信息审核方法、装置、计算机设备及存储介质 | |
JP5279129B2 (ja) | 言語横断型情報検索システムおよび言語横断型情報検索方法 | |
JP6626029B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN114118078A (zh) | 制作辅助装置、制作辅助方法及记录介质 | |
WO2019225560A1 (ja) | 検索ワードサジェスト装置、固有表現情報の作成方法、および、固有表現情報の作成プログラム | |
WO2021084807A1 (ja) | 情報提供システム | |
JP2010266969A (ja) | 文字検索装置、文字検索システム、文字検索方法、入力端末装置、検索サーバおよびプログラム | |
JP2009230705A (ja) | テンプレート作成装置、文書データ作成装置、その作成方法及びプログラム | |
JP2023028783A (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
CN116992831A (zh) | 语句处理方法及装置 | |
JP2023174053A (ja) | 登録プログラム、登録方法、及び、情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6897168 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |