JP2019003387A - Program, device and method creating scatter diagram with scattered word group - Google Patents

Program, device and method creating scatter diagram with scattered word group Download PDF

Info

Publication number
JP2019003387A
JP2019003387A JP2017117314A JP2017117314A JP2019003387A JP 2019003387 A JP2019003387 A JP 2019003387A JP 2017117314 A JP2017117314 A JP 2017117314A JP 2017117314 A JP2017117314 A JP 2017117314A JP 2019003387 A JP2019003387 A JP 2019003387A
Authority
JP
Japan
Prior art keywords
word
occurrence
language
scatter diagram
scatter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017117314A
Other languages
Japanese (ja)
Other versions
JP6745761B2 (en
Inventor
鈴木 雅実
Masami Suzuki
雅実 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2017117314A priority Critical patent/JP6745761B2/en
Publication of JP2019003387A publication Critical patent/JP2019003387A/en
Application granted granted Critical
Publication of JP6745761B2 publication Critical patent/JP6745761B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide a program or the like creating a scatter diagram capable of causing a user to recognize words of a known language with which meaning may be close to sensory expression words of an unknown language.SOLUTION: A scatter diagram in which a plurality of words based on a first language are scattered on a plurality of evaluation axes is displayed on a display. According to the present invention, for the scatter diagram, a first co-occurrence word with high co-occurrence degree in both a first word and a second word is derived between the first word and the second word based on the first language, and a second co-occurrence word based on a second language to be a paginal translation of a first co-occurrence word is displayed. The first word and the second word based on the first language are, for example, onomatopoeia (onomatopoeic). The evaluation axes of the scatter diagram may be based on a correspondence analysis or any feature vector. Also, the evaluation axes of the scatter diagram represents the strength of the characteristic based on human sense.SELECTED DRAWING: Figure 2

Description

本発明は、言語に基づく単語の意味合いをユーザが理解しやすいようにするために、単語群が散布された散布図を作成する技術に関する。   The present invention relates to a technique for creating a scatter diagram in which a group of words is scattered so that a user can easily understand the meaning of words based on a language.

母国語以外の言語を理解する上で、単語の使用場面やニュアンスを、辞書の記述のみで理解することは極めて難しい。例えば、外国人が、日本語の中で理解が難しい表現として「オノマトペ(onomatopee)」(擬声語)がある。「オノマトペ」とは、擬音語や擬態語に基づくものであり、日本人の日常会話の中では特に好んで用いられる。オノマトペは、人の感覚に基づく心的状態(気分や態度)や、対象物の様態などを伝える際に、的確かつ簡易に表現することができる。   In understanding languages other than the native language, it is extremely difficult to understand the usage scenes and nuances of words using only a dictionary description. For example, “onomatopee” (onomatopee) is an expression that is difficult for foreigners to understand in Japanese. "Onomatopoeia" is based on onomatopoeia and mimetic words, and is especially preferred in Japanese daily conversation. Onomatopoeia can be expressed accurately and simply when it conveys the mental state (feelings and attitudes) based on human senses and the state of the object.

外国人にとっては、オノマトペを理解しようとする場合、一般的な対訳辞書には記載されていない場合が多く、用例で学ぶ機会は相当に限定されている。一方で、オノマトペを対訳辞書に記述することは、必ずしも実用的ではない。オノマトペは、分類整理することはある程度可能であるが、使用場面やニュアンスまで記述することが難しい。
一方で、観光目的で日本を訪問した外国人にとっても、日本語のオノマトペを正しく理解することができれば、単なる言語的意味を越えたコミュニケーションの理解にも役立つ。
For foreigners, when they try to understand onomatopoeia, they are often not listed in general bilingual dictionaries, and the opportunities to learn with examples are considerably limited. On the other hand, it is not always practical to describe onomatopoeia in a bilingual dictionary. Onomatopoeia can be classified and arranged to some extent, but it is difficult to describe the usage scene and nuances.
On the other hand, foreigners who visit Japan for sightseeing purposes can also help understand communication beyond linguistic meaning if they can correctly understand Japanese onomatopoeia.

従来、オノマトペが修飾する動詞や名詞などの用例を、Webサイトから収集し、その出現頻度から感性評価指標の評価値を算出する技術がある(例えば非特許文献1参照)。この技術によれば、オノマトペの持つ音韻的な語感に着目したものである。そのために、出現文脈やニュアンスまでも理解できるようにしたものではない。   Conventionally, there is a technique for collecting usage examples such as verbs and nouns modified by onomatopoeia from a website and calculating an evaluation value of a sensitivity evaluation index from the appearance frequency (see, for example, Non-Patent Document 1). This technique focuses on the phonetic sense of onomatopoeia. Therefore, it is not designed to understand even the appearance context and nuances.

また、レビュー文章から、オノマトペを含む評価語の関連ネットワークを構築し、利用分野間の意味的な相違を分析する技術もある(例え非特許文献2参照)。オノマトペは特に、利用分野や文脈によって意味が大きく異なるためである。   There is also a technique for constructing a related network of evaluation words including onomatopoeia from review texts and analyzing semantic differences between fields of use (see Non-Patent Document 2, for example). This is because onomatopoeia has a particularly different meaning depending on the field of use and context.

更に、被験者による実験的数値によって、オノマトペ毎の微細な印象を推定する技術もある(例えば非特許文献3参照)。
その他、留学生を対象として、オノマトペの学習を支援するための電子絵本システムの技術もある(例えば非特許文献4参照)。この技術によれば、対話型のユーザ・インタフェースによって、比較的意味の近いオノマトペの利用状況の違いを視覚的に表すことができる。
Furthermore, there is also a technique for estimating a fine impression for each onomatopoeia based on experimental numerical values by a subject (see, for example, Non-Patent Document 3).
In addition, there is an electronic picture book system technology for supporting onomatopoeia learning for international students (see Non-Patent Document 4, for example). According to this technology, it is possible to visually represent a difference in usage status of onomatopoeia having relatively close meaning through an interactive user interface.

他の研究論文として、複数のオノマトペを、「コレスポンディング分析」の散布図として表示する技術もある(例えば非特許文献5参照)。この技術は、各オノマトペを体系的に分析したものであるが、オノマトペ自体を理解させるものではない。   As another research paper, there is also a technique for displaying a plurality of onomatopoeia as a scatter diagram of “corresponding analysis” (see, for example, Non-Patent Document 5). This technique is a systematic analysis of each onomatopoeia, but it does not make onomatopoeia itself understandable.

図1は、コレスポンディング分析の散布図である。   FIG. 1 is a scatter diagram of correspondent analysis.

「コレスポンディング分析の散布図」とは、クロス集計表を視覚的に表すものであって、相関関係が高い要素ほど近くにプロットされる。
図1の散布図によれば、適用分野「食感」に基づく複数のオノマトペが、評価軸上の相対的位置にプロットされている。
第1の評価軸:力学的特性 (破砕のし易さ<->破砕のしづらさ)
第2の評価軸:幾何学的特性(空気的な軽さ<->空気的な重さ)
即ち、ユーザは、第1のオノマトペと第2のオノマトペとが座標的に近いほど、食感的にも近いことを、一見して理解するこができる。
“Corresponding analysis scatter diagram” is a visual representation of a cross tabulation table, and elements with higher correlations are plotted closer to each other.
According to the scatter diagram of FIG. 1, a plurality of onomatopoeia based on the application field “texture” is plotted at relative positions on the evaluation axis.
First evaluation axis: Mechanical properties (Ease of crushing <-> Difficulty of crushing)
Second evaluation axis: Geometric characteristics (aerial lightness <-> aerial weight)
In other words, the user can understand at a glance that the closer the first onomatopoeia and the second onomatopoeia are, the closer the texture is.

特開2013−033351号公報JP2013-033351A 特開2010−256957号公報JP 2010-256957 A 特開平11−203278号公報Japanese Patent Laid-Open No. 11-203278 特開2012−123639号公報JP 2012-123039 A

中部文子、浅賀千里、渡辺知恵美、「感性情報を利用したオノマトペ学習システムの開発」、第1回データ工学と情報マネジメントに関するフォーラム(DEIM2009)、E5-1、2009.Fumiko Chubu, Chisato Asaga, Chiemi Watanabe, “Development of onomatopoeia learning system using Kansei information”, 1st Forum on Data Engineering and Information Management (DEIM2009), E5-1, 2009. 千本達也、竹内和広、「分野データにより訓練した評価語関連ネットワークに対するオノマトペ表現の割り当て」、信学技報、TL2014-44,2014.Tatsuya Senmoto, Kazuhiro Takeuchi, “Assignment of onomatopoeia expressions to evaluation word-related networks trained by field data”, IEICE Technical Report, TL2014-44, 2014. 清水祐一郎、土斐崎龍一、坂本真樹、「オノマトペごとの微細な印象を推定するシステム」、人工知能学会論文誌、Vol.29 No.1、pp.41-52,2014.Yuichiro Shimizu, Ryuichi Dobasaki, Maki Sakamoto, “System for Estimating Fine Impressions by Onomatopoeia”, Journal of the Japanese Society for Artificial Intelligence, Vol.29 No.1, pp.41-52, 2014. 前田安里紗、上間大生、松下光範、「留学生を対象としたオノマトペの学習を支援するための電子絵本システムの評価」、情報処理学会第76回全国大会、2ZF-8,2014.Maeda Yuri, Kamima University, Matsushita Mitsunori, “Evaluation of Electronic Picture Book System to Support Onomatopoeia Learning for International Students”, IPSJ 76th National Convention, 2ZF-8, 2014. 早川文代、「日本語テクスチャー用語の体系化と官能評価への利用」、日本食品科学工学会誌、Vol.60、No.7、pp.311-322、2013.Fumiyo Hayakawa, “Systematization of Japanese Texture Terms and Use for Sensory Evaluation”, Journal of Japan Society for Food Science and Technology, Vol.60, No.7, pp.311-322, 2013.

前述した従来技術によれば、日本語のオノマトペを、外国人に理解させることは難しい。特に、オノマトペは、一般的な対訳辞書にも記述されておらず、使用場面やニュアンスを理解させることは極めて難しい。   According to the aforementioned prior art, it is difficult for foreigners to understand Japanese onomatopoeia. In particular, onomatopoeia is not described in general bilingual dictionaries, and it is very difficult to understand usage scenes and nuances.

これに対し、本願の発明者らは、異なる言語間では必ず、対訳辞書に記述することが難しい、人の感覚表現的な単語(例えばオノマトペ)があると認識している。即ち、外国人には、未知の言語(第1の言語、例えば旅行先の国の言語)における感覚表現的な単語に対して意味が近いであろう、既知の言語(第2の言語、例えば母国語)の単語を明示することができれば、理解できるのではないか、と考えた。   On the other hand, the inventors of the present application recognize that there is a human sensory expression word (for example, onomatopoeia) that is difficult to describe in a bilingual dictionary between different languages. That is, the foreigner has a known language (second language, eg, mother language) that will be close in meaning to sensory expressions in an unknown language (first language, eg, the language of the destination country). I thought that I could understand it if I could clearly show the word in Japanese.

そこで、本願発明は、未知の言語の感覚表現的な単語に対して意味が近いであろう、既知の言語の単語を、ユーザに認識させることができる散布図を作成するプログラム、装置及び方法を提供することを目的とする。   Therefore, the present invention provides a program, an apparatus, and a method for creating a scatter diagram that allows a user to recognize a word in a known language that has a meaning close to that of a sensory expression word in an unknown language. The purpose is to do.

本発明によれば、第1の言語に基づく複数の単語が複数の評価軸上に散布された散布図を、ディスプレイに表示するようにコンピュータを機能させるプログラムであって、
散布図について、第1の言語に基づく第1の単語と第2の単語との間に、第1の単語及び第2の単語の両方で共起度が高い第1の共起単語を導出し、その対訳となる第2の言語に基づく第2の共起単語を表示する
ようにコンピュータを機能させることを特徴とする。
According to the present invention, there is provided a program for causing a computer to function such that a scatter diagram in which a plurality of words based on a first language are scattered on a plurality of evaluation axes is displayed on a display,
For the scatter diagram, a first co-occurrence word having a high degree of co-occurrence in both the first word and the second word is derived between the first word and the second word based on the first language. The computer is caused to function so as to display the second co-occurrence word based on the second language as the translation.

本発明のプログラムにおける他の実施形態によれば、
第1の言語に基づく第1の単語及び第2の単語は、オノマトペ(擬声語)である
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
It is also preferable to cause the computer to function so that the first word and the second word based on the first language are onomatopoeia.

本発明のプログラムにおける他の実施形態によれば、
散布図の評価軸は、コレスポンデンス分析に基づくもの、又は、任意の特徴ベクトルに基づくものである
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
It is also preferable to make the computer function so that the evaluation axis of the scatter diagram is based on correspondence analysis or based on an arbitrary feature vector.

本発明のプログラムにおける他の実施形態によれば、
散布図の評価軸は、人の感覚に基づく特性の強弱を表すものである
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
It is also preferable to make the computer function so that the evaluation axis of the scatter diagram represents the strength of characteristics based on human senses.

本発明のプログラムにおける他の実施形態によれば、
散布図に表示される第2の共起単語は、テキストに代えて、サムネイル画像として表示される
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
It is also preferable to cause the computer to function so that the second co-occurrence word displayed in the scatter diagram is displayed as a thumbnail image instead of the text.

本発明のプログラムにおける他の実施形態によれば、
第1の言語に基づくコーパスを用いて、第1の言語に基づく第1の単語及び第2の単語の両方で共起度が高い、第1の言語に基づく第1の共起単語を抽出する第1の共起単語抽出手段と、
対訳辞書を用いて、第1の言語に基づく第1の共起単語を、第2の言語に基づく第2の共起単語に対訳する第2の共起単語抽出手段と、
第1の言語に基づく第1の単語と第2の単語との間に、第2の言語に基づく第2の共起単語を表示する散布図を作成する散布図作成手段と
してコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
Using a corpus based on the first language, a first co-occurrence word based on the first language that has a high degree of co-occurrence on both the first word and the second word based on the first language is extracted. First co-occurrence word extraction means;
A second co-occurrence word extracting means for translating a first co-occurrence word based on the first language into a second co-occurrence word based on the second language, using a bilingual dictionary;
Causing a computer to function as a scatter diagram creating means for creating a scatter diagram for displaying a second co-occurrence word based on a second language between a first word based on a first language and a second word Is also preferable.

本発明のプログラムにおける他の実施形態によれば、
第1の共起単語抽出手段は、第1の単語及び第1の共起単語の間の共起度と、第2の単語及び第1の共起単語の間の共起度との比率を算出し、
散布図表示手段は、第1の単語と第2の単語との間で比率に応じた位置に、第2の共起単語を表示する
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
The first co-occurrence word extracting means calculates a ratio between the co-occurrence degree between the first word and the first co-occurrence word and the co-occurrence degree between the second word and the first co-occurrence word. Calculate
The scatter diagram display means preferably causes the computer to display the second co-occurrence word at a position corresponding to the ratio between the first word and the second word.

本発明のプログラムにおける他の実施形態によれば、
適用分野毎に、散布図を記憶した散布図記憶手段を更に有し、
ユーザ所望の適用分野に基づく散布図に対して、第2の共起単語を表示する
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
Each application field further has a scatter diagram storage means for storing a scatter diagram,
It is also preferred to have the computer function to display the second co-occurrence word for a scatter plot based on the user desired field of application.

本発明のプログラムにおける他の実施形態によれば、
ユーザに、第1の言語に基づく第1の単語を検索キーとして入力させる検索キー入力手段と、
散布図記憶手段から、検索キーを含む散布図を検索する散布図検索手段と、
検索した散布図を、ユーザに明示する散布図表示手段と
してコンピュータを更に機能させることも好ましい。
According to another embodiment of the program of the present invention,
Search key input means for allowing a user to input a first word based on a first language as a search key;
Scatter chart search means for searching a scatter chart including a search key from the scatter chart storage means;
It is also preferable to further cause the computer to function as a scatter diagram display means for clearly displaying the retrieved scatter diagram to the user.

本発明のプログラムにおける他の実施形態によれば、
散布図毎に、適用分野に基づく1つ以上の適用態様語が更に対応付けられており、
検索キー入力手段は、第1の単語に対する適用態様語を更に入力し、
散布図検索手段は、検索キー入力手段に入力された適用態様語に対応付けられた1つ以上の散布図の中から、検索キーを含む散布図を検索する
ようにコンピュータを機能させることも好ましい。
According to another embodiment of the program of the present invention,
Each scatter diagram is further associated with one or more application terms based on the field of application,
The search key input means further inputs an application mode word for the first word,
The scatter diagram search means preferably causes the computer to search for a scatter diagram including the search key from one or more scatter diagrams associated with the application mode words input to the search key input means. .

本発明によれば、第1の言語に基づく複数の単語が複数の評価軸上に散布された散布図を、ディスプレイに表示する装置であって、
散布図について、第1の言語に基づく第1の単語と第2の単語との間に、第1の単語及び第2の単語の両方で共起度が高い第1の共起単語を導出し、その対訳となる第2の言語に基づく第2の共起単語を表示する
ことを特徴とする。
According to the present invention, a device for displaying a scatter diagram in which a plurality of words based on a first language are scattered on a plurality of evaluation axes on a display,
For the scatter diagram, a first co-occurrence word having a high degree of co-occurrence in both the first word and the second word is derived between the first word and the second word based on the first language. The second co-occurrence word based on the second language serving as the parallel translation is displayed.

本発明によれば、第1の言語に基づく複数の単語が複数の評価軸上に散布された散布図を、ディスプレイに表示する装置の表示方法であって、
散布図について、第1の言語に基づく第1の単語と第2の単語との間に、第1の単語及び第2の単語の両方で共起度が高い第1の共起単語を導出し、その対訳となる第2の言語に基づく第2の共起単語を表示する
ことを特徴とする。
According to the present invention, there is provided a display method for an apparatus for displaying on a display a scatter diagram in which a plurality of words based on a first language are scattered on a plurality of evaluation axes.
For the scatter diagram, a first co-occurrence word having a high degree of co-occurrence in both the first word and the second word is derived between the first word and the second word based on the first language. The second co-occurrence word based on the second language serving as the parallel translation is displayed.

本願発明のプログラム、装置及び方法によれば、未知の言語の感覚表現的な単語に対して意味が近いであろう、既知の言語の単語を、ユーザに認識させることができる散布図を作成する。   According to the program, apparatus, and method of the present invention, a scatter diagram is created that allows a user to recognize a word in a known language that would have a similar meaning to a sensory expression word in an unknown language.

コレスポンディング分析の散布図である。It is a scatter diagram of correspondent analysis. 本発明におけるコレスポンディング分析の散布図である。It is a scatter diagram of correspondent analysis in the present invention. サムネイル画像が表示された散布図である。It is a scatter diagram in which thumbnail images are displayed. 本発明におけるサーバの機能構成図である。It is a functional block diagram of the server in this invention.

以下、本発明の実施の形態について、図面を用いて詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図2は、本発明におけるコレスポンディング分析の散布図である。   FIG. 2 is a scatter diagram of correspondent analysis in the present invention.

図2によれば、図1と同様に、複数のオノマトペ(擬声語)がプロットされた、コレスポンディング分析の散布図が表されている。散布図の評価軸は、適用分野「食感」の力学的特性及び幾何学的特性に基づくものであって、「人の感覚に基づく特性の強弱」を表すものである。オノマトペは、日本人にとっては日常会話の中で頻繁に用いるものであるが、人の感覚に基づくものである。そのために、オノマトペは、対訳辞書にも記述されていないか、又は、記述されていても伝えづらいものである。   According to FIG. 2, as in FIG. 1, a scatter diagram of correspondent analysis in which a plurality of onomatopoeia (onomatopoeia) is plotted is shown. The evaluation axis of the scatter diagram is based on the mechanical characteristics and geometric characteristics of the application field “texture” and represents “strength of characteristics based on human senses”. Onomatopoeia is frequently used in daily conversation for Japanese people, but is based on human senses. Therefore, onomatopoeia is not described in the bilingual dictionary or is difficult to convey even if it is described.

英語(第2の言語)圏の外国人にとって、例えば、日本語(第1の言語)のmochimochiの意味合いが理解できないとする。
このとき、図2によれば、適用分野「食感」について、日本語(第1の言語)のオノマトペ(擬声語)として、「もちもち(mochimochi)」「つるつる(tsurutsuru)」が表されている。そして、日本語に基づくmochimochi(第1の単語)とtsurutsuru(第2の単語)との間に、mochimochi及びtsurutsuruの両方で共起度が高い「麺(第1の共起単語)」が導出され、その対訳となる英語(第2の言語)に基づく「noodle(第2の共起単語)」が表示されている。
その外国人は、図2の散布図を一見しただけで、日本語のmochimochiは、日本語のtsurutsuruと食感として近く、且つ、「noodle」の食感をイメージすることができる。
For example, a foreigner in English (second language) cannot understand the meaning of mochimochi in Japanese (first language).
At this time, according to FIG. 2, “mochimochi” and “tsurutsuru” are represented as onomatopoeia (onomatopoeia) of Japanese (first language) for the application field “texture”. And, “noodle (first co-occurrence word)” with high co-occurrence in both mochimochi and tsurutsuru is derived between mochimochi (first word) and tsurutsuru (second word) based on Japanese. In addition, “noodle (second co-occurrence word)” based on English (second language) as a parallel translation is displayed.
The foreigner just looks at the scatter diagram in Fig. 2 and the Japanese mochimochi is close to the Japanese tsurutsuru and has the image of "noodle".

また、図2によれば、日本語に基づくtorotoro(第1の単語)とfuwafuwa(第2の単語)との間に、torotoro及びfuwafuwaの両方で共起度が高い「プリン(第1の共起単語)」が導出され、その対訳となる英語(第2の言語)に基づく「pudding(第2の共起単語)」が表示されている。
更に、図2によれば、日本語に基づくsakusaku(第1の単語)とboroboro(第2の単語)との間に、sakusaku及びboroboroの両方で共起度が高い「クッキー(第1の共起単語)」が導出され、その対訳となる英語(第2の言語)に基づく「cookie(第2の共起単語)」が表示されている。
In addition, according to FIG. 2, between the tootoro (first word) and fuwafuwa (second word) based on Japanese, both the torotoro and fuwafuwa have a high co-occurrence degree “pudding (first common "Word") is derived, and "pudding (second co-occurrence word)" based on English (second language) as the translation is displayed.
Furthermore, according to FIG. 2, between the sakusaku (first word) and boroboro (second word) based on Japanese, “cookie (first "Word") is derived, and "cookie (second co-occurrence word)" based on English (second language) as a translation is displayed.

尚、図2によれば、散布図は、2つの評価軸で2次元上に単語が散布されているが、3つ以上の評価軸でn次元上に単語が散布されたものであってもよい。   Note that, according to FIG. 2, the scatter diagram is such that words are scattered two-dimensionally with two evaluation axes, but even if words are scattered n-dimensionally with three or more evaluation axes. Good.

図3は、サムネイル画像が表示された散布図である。   FIG. 3 is a scatter diagram in which thumbnail images are displayed.

図2によれば、日本語に基づくmochimochiとtsurutsuruとの間に、テキストとしての「noodle」が表示されている。これに対し、図3によれば、他の実施形態として、「麺」のサムネイル画像が表示されている。この場合、外国人としては、「noodle」を理解できない非英語圏の外国人であっても、mochimochiの食感をイメージすることができる。   According to FIG. 2, “noodle” as text is displayed between mochimochi and tsurutsuru based on Japanese. On the other hand, according to FIG. 3, a thumbnail image of “noodle” is displayed as another embodiment. In this case, as a foreigner, even a non-English speaking foreigner who cannot understand “noodle” can imagine the texture of mochimochi.

図4は、本発明におけるサーバの機能構成図である。   FIG. 4 is a functional configuration diagram of the server in the present invention.

図4によれば、サーバ1と、ユーザの所持する端末2とが、ネットワークを介して接続されている。
サーバ1は、散布図記憶部100と、コーパス101と、対訳辞書102と、第1の共起単語抽出部11と、第2の共起単語抽出部12と、散布図作成部13と、検索キー入力部14と、散布図検索部15と、散布図表示部16とを有する。これら機能構成部は、サーバに搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、散布図作成方法としても理解できる。
According to FIG. 4, the server 1 and the terminal 2 possessed by the user are connected via a network.
The server 1 includes a scatter diagram storage unit 100, a corpus 101, a bilingual dictionary 102, a first co-occurrence word extraction unit 11, a second co-occurrence word extraction unit 12, a scatter diagram creation unit 13, and a search A key input unit 14, a scatter diagram search unit 15, and a scatter diagram display unit 16 are provided. These functional components are realized by executing a program that causes a computer mounted on the server to function. The processing flow of these functional components can also be understood as a scatter diagram creation method.

コーパス(corpus)101は、自然言語の文章を構造化し大規模に集積したデータベースである。
また、対訳辞書102は、例えば日本語(第1の言語)の単語の対訳となる、英語(第2の言語)の単語が記述された辞書である。
A corpus 101 is a database in which natural language sentences are structured and accumulated on a large scale.
The bilingual dictionary 102 is a dictionary in which English (second language) words are described as bilingual translations of Japanese (first language) words, for example.

[散布図記憶部100]
散布図記憶部100は、適用分野毎に、散布図を記憶したものである。即ち、散布図は、適用分野「食感」「触感」「態度」「感情」「健康」「医療」「スポーツ」のように、それぞれ異なる評価軸で作成されたものである。このような人の感覚に基づく単語の中で、日本人には理解しやすくても、外国人には理解しにくいものとして、例えばオノマトペがある。
[Scatter diagram storage unit 100]
The scatter diagram storage unit 100 stores scatter diagrams for each application field. In other words, the scatter diagrams are created with different evaluation axes, such as application fields “texture”, “tactile sensation”, “attitude”, “emotion”, “health”, “medicine”, and “sports”. Among such words based on human senses, there is Onomatopoeia, for example, which is easy for Japanese to understand but difficult for foreigners to understand.

散布図の評価軸は、例えば以下のような分析に基づくものである。
(1)コレスポンディング分析
相関関係が高い要素ほど、近くにプロットされる。
(2)任意の特徴ベクトル
例えばword2vec(登録商標)であり、単語の意味や文法を捉えるために単語をベクトル表現化して次元を圧縮したものである。これは、2層からなるニューラルネットワークであって、入力されたテキストから、単語の特徴ベクトル(feature vector)を出力することができる。
The evaluation axis of the scatter diagram is based on the following analysis, for example.
(1) Corresponding analysis Elements with higher correlation are plotted closer.
(2) Arbitrary feature vector For example, word2vec (registered trademark), which is a vector that expresses a word and compresses the dimension in order to capture the meaning and grammar of the word. This is a two-layer neural network that can output a feature vector of a word from input text.

例えばオノマトペは、適用分野によっては全く別の意味合いを持つ場合がある。例えば、「しこしこ」の場合、以下のような意味合いを持つ。
適用分野「食感」:「この麺は”しこしこ”している」
「”しこしこ”した歯ごたえ」
適用分野「態度」:「”しこしこ”と勉強する」
For example, onomatopoeia may have completely different meanings depending on the field of application. For example, in the case of “strain”, it has the following meaning.
Field of application: “Food texture”: “This noodle is“ shikoshi ””
“Cheap”
Field of application “Attitude”: “Study with“ Shiko ””

他の実施形態として、散布図毎に、適用分野に基づく1つ以上の「適用態様語」が更に対応付けられていることも好ましい。「適用態様語」とは、オノマトペの適用分野を表わすキーワードのことである。
例えば適用分野「食感」の散布図については、適用態様語として「食事」「料理」「食べ物」のようなキーワードを付与しておく。このようなキーワードは、後述する散布図検索部15によって用いられる。
As another embodiment, it is also preferable that one or more “application mode words” based on the application field are further associated with each scatter diagram. The “application mode word” is a keyword representing an application field of onomatopoeia.
For example, for the scatter diagram of the application field “texture”, keywords such as “meal”, “cooking”, and “food” are assigned as application mode words. Such keywords are used by the scatter diagram search unit 15 described later.

図4によれば、散布図記憶部100は、前述した図1のような既存の散布図を、第1の共起単語抽出部11へ出力し、散布図作成部13から本発明の散布図を入力して蓄積する。即ち、既存の散布図が、第1の共起単語抽出部11と、第2の共起単語抽出部12と、散布図作成部13とによって、本発明の散布図に更新される。   According to FIG. 4, the scatter diagram storage unit 100 outputs the existing scatter diagram as shown in FIG. 1 to the first co-occurrence word extraction unit 11 from the scatter diagram creation unit 13 according to the present invention. Enter and accumulate. In other words, the existing scatter diagram is updated to the scatter diagram of the present invention by the first co-occurrence word extraction unit 11, the second co-occurrence word extraction unit 12, and the scatter diagram creation unit 13.

[第1の共起単語抽出部11]
第1の共起単語抽出部11は、散布図記憶部100から散布図を入力する。そして、第1の共起単語抽出部11は、第1の言語に基づくコーパスを用いて、第1の言語に基づく第1の単語及び第2の単語の両方で共起度が高い、第1の言語に基づく第1の共起単語を抽出する。
具体的には、前述した図2によれば、日本語(第1の言語)のコーパス101を用いて、オノマトペ(擬声語)「もちもち(mochimochi)」「つるつる(tsurutsuru)」の両方で共起度が高い「麺(第1の共起単語)」を抽出する。
[First Co-occurrence Word Extraction Unit 11]
The first co-occurrence word extraction unit 11 inputs a scatter diagram from the scatter diagram storage unit 100. The first co-occurrence word extraction unit 11 uses the corpus based on the first language, and the first co-occurrence degree is high in both the first word and the second word based on the first language. A first co-occurrence word based on the language is extracted.
Specifically, according to FIG. 2 described above, the degree of co-occurrence in both the onomatopoeia (onomatopoeia) “mochimochi” and “tsurutsuru” using the Japanese (first language) corpus 101. “Noodle (first co-occurrence word)” having a high is extracted.

共起度は、キーとなる「もちもち」と、他の単語(例えば「麺」「餅」「うどん」「ご飯」等)それぞれとの間における、例えば相互情報量基準によって算出する。例えば、コーパスの中から、「もちもち」と共起する単語毎に、計数された出現頻度を「共起度」とする。例えば、コーパスに以下のような文章があるとする。
「"もちもち"した麺」
「麺が"もちもち"している」
「"もちもち"した餅」
「"もちもち"したうどん」
「"もちもち"したご飯」
・・・・・
The degree of co-occurrence is calculated based on, for example, a mutual information amount standard between “mochimochi” as a key and each of other words (for example, “noodle”, “salmon”, “udon”, “rice”, etc.). For example, for each word that co-occurs with “mochi mochi” from the corpus, the counted appearance frequency is set as “co-occurrence degree”. For example, assume that the corpus has the following text:
"Noodles with" mochimochi ""
"The noodles are mochimochi"
"The rice cake that was mochimochi"
"Udon made"
"Rice with rice cake"
...

ここで、共起度は、相互情報量(Mutual Information)として算出される。相互情報量とは、2つの確率変数要素xi,yjにおける相互依存の尺度を表す確率的方法であって、以下のように算出したものである。
I(xi,yj)=log{p(xi,yj)/p(xi)p(yj)}
p():出現回数
例えば10000語句の中で、以下のような出現回数があったとする。
”もちもち”及び”麺”の組み合わせの出現回数p=20回
”もちもち”の出現回数p=24回
”麺”の出現回数p=120回
この場合、”もちもち”と”麺”との相互情報量は、以下のように表される。
I(もちもち,麺)=log{p(もちもち,麺)/p(もちもち)p(麺)}
=log2{(20/10000)/((120/10000)・(24/10000))}
≒6.118
Here, the co-occurrence degree is calculated as mutual information. The mutual information amount is a probabilistic method that represents a measure of mutual dependence in two random variable elements xi and yj, and is calculated as follows.
I (xi, yj) = log {p (xi, yj) / p (xi) p (yj)}
p (): Number of appearances For example, suppose that there are the following number of appearances in 10,000 words.
Number of occurrences of “mochimochi” and “noodle” p = 20 times Number of occurrences of “mochimochi” p = 24 times Number of occurrences of “noodle” p = 120 times In this case, mutual information between “mochimochi” and “noodles” The quantity is expressed as follows:
I (mochimochi, noodle) = log {p (mochimochi, noodle) / p (mochimochi) p (noodle)}
= Log 2 {(20/10000) / ((120/10000) ・ (24/10000))}
≒ 6.118

このように、全ての係り受け語に対する相互情報量を算出する。
I(もちもち,麺)
I(もちもち,餅)
I(もちもち,うどん)
I(もちもち,ご飯)
・・・・・
この中で、相互情報量が大きいほど、相対的に多く組み合わされて使用されていることを意味する。尚、適切な相互情報量を算出するために、コーパス101を用いて、一定以上の絶対出現頻度が観測されることが前提となる。一方で、それを満たさない少数事例は、対象外とすることによって、信頼性を確保する。
In this way, the mutual information amount for all the dependency words is calculated.
I (mochimochi, noodles)
I (mochi, mochi)
I (mochimochi, udon)
I (mochimochi, rice)
...
In this, it means that it is used combining relatively many, so that mutual information amount is large. In order to calculate an appropriate mutual information amount, it is assumed that an absolute appearance frequency of a certain level or more is observed using the corpus 101. On the other hand, reliability is ensured by excluding minority cases that do not meet this requirement.

次に、散布図の中で、キーとなる「もちもち」の近くに配置される「つるつる」についても、前述と同様に、他の単語それぞれとの間における、例えば相互情報量基準によって算出する。例えば、コーパスに以下のような文章があるとする。
「"つるつる"した麺」
「"つるつる"したうどん」
「"つるつる"したラーメン」
「"つるつる"したそうめん」
・・・・・
この場合、全ての係り受け語に対する相互情報量は、以下のように算出される。
I(つるつる,麺)
I(つるつる,うどん)
I(つるつる,ラーメン)
I(つるつる,そうめん)
・・・・・
Next, in the scatter diagram, “smooth vine” arranged near the key “mochi mochi” is also calculated, for example, based on the mutual information criterion between each of the other words as described above. For example, assume that the corpus has the following text:
"Smooth noodles"
"Sudden udon"
"Ramen that is smooth"
“Some noodles that were“ smooth ””
...
In this case, the mutual information amount for all the dependency words is calculated as follows.
I (smooth, noodles)
I (Smooth, Udon)
I (Smooth, Ramen)
I (Smooth, Somen)
...

ここで、「もちもち」と「つるつる」との両方について、共起度が高い単語が「麺」であったとする。このとき、「麺」が、第1の共起単語として抽出される。「麺」(第1の共起単語)は、日本語(第1の言語)に基づく「もちもち」(第1の単語)及び「つるつる」(第2の単語)に対して、重要な連想概念の単語となる。   Here, it is assumed that a word having a high co-occurrence degree for both “mochimochi” and “smooth vine” is “noodle”. At this time, “noodle” is extracted as the first co-occurrence word. “Noodle” (first co-occurrence word) is an important associative concept for “mochimochi” (first word) and “surutsuru” (second word) based on Japanese (first language). It becomes the word.

また、他の実施形態として、第1の共起単語抽出部11は、第1の単語及び第1の共起単語の間の共起度と、第2の単語及び第1の共起単語の間の共起度との比率を算出することも好ましい。
具体的には、第1の共起単語(例えば「麺」)について、第1の単語(例えば「もちもち」)との間の共起度と、第2の単語(例えば「つるつる」)との間の共起度との比率を算出する。例えば以下のようになるとする。
「もちもち」0.3:0.7「つるつる」
勿論、第1の単語(例えば「もちもち」)との間の共起度と、第2の単語(例えば「つるつる」)との間の共起度とが全く同じである場合、以下のようになる。
「もちもち」0.5:「つるつる」0.5
Further, as another embodiment, the first co-occurrence word extraction unit 11 calculates the degree of co-occurrence between the first word and the first co-occurrence word, and the second word and the first co-occurrence word. It is also preferable to calculate a ratio with the co-occurrence degree.
Specifically, for the first co-occurrence word (eg, “noodle”), the co-occurrence degree between the first word (eg, “mochimochi”) and the second word (eg, “smooth”) The ratio with the co-occurrence degree is calculated. For example, assume the following.
“Mochimochi” 0.3: 0.7 “Smooth”
Of course, when the co-occurrence degree between the first word (for example, “mochimochi”) and the co-occurrence degree between the second word (for example, “smooth”) are exactly the same, as follows: Become.
“Mochimochi” 0.5: “Smooth” 0.5

[第2の共起単語抽出部12]
第2の共起単語抽出部12は、対訳辞書102を用いて、第1の言語に基づく第1の共起単語を、第2の言語に基づく第2の共起単語に対訳する。
具体的には、日本語(第1の言語)に基づく「麺」(第1の共起単語)を、英語(第2の言語)に基づく「noodle」(第2の共起単語)に対訳する。これによって、英語圏の外国人は、適用分野「食感」における「もちもち」とは、「noodle」と近い食感であると理解することができる。
[Second Co-occurrence Word Extraction Unit 12]
The second co-occurrence word extraction unit 12 translates the first co-occurrence word based on the first language into the second co-occurrence word based on the second language, using the bilingual dictionary 102.
Specifically, “noodle” (first co-occurrence word) based on Japanese (first language) is translated into “noodle” (second co-occurrence word) based on English (second language). To do. This allows foreigners in English-speaking countries to understand that “mochimochi” in the application field “texture” is close to “noodle”.

[散布図作成部13]
散布図作成部13は、第1の言語に基づく第1の単語と第2の単語との間に、第2の言語に基づく第2の共起単語を表示する散布図を作成する。
具体的には、日本語の「もちもち」(第1の単語)と「つるつる」(第2の単語)との間に、英語の「noodle」(第2の共起単語)が表示されるように、散布図を更新する。これによって、ユーザに対して、例えばオノマトペに対して出現頻度の多い単語(名詞や動詞)を表示することによって、母国語によらないユニバーサルなインタフェースを提供することができる。
また、第1の共起単語抽出部11によって複数の第1の共起単語を抽出し、第2の共起単語抽出部12によって対訳された複数の第2の共起単語を、第1の単語と第2の単語との間に表示してもよい。
このように更新された散布図は、散布図記憶部100へ出力される。
[Scatter plot creation unit 13]
The scatter diagram creation unit 13 creates a scatter diagram for displaying the second co-occurrence word based on the second language between the first word based on the first language and the second word.
Specifically, the English “noodle” (second co-occurrence word) is displayed between the Japanese “mochimochi” (first word) and “smooth” (second word). Update the scatter plot. Accordingly, a universal interface that does not depend on the native language can be provided to the user by displaying words (nouns and verbs) that frequently appear, for example, for onomatopoeia.
The first co-occurrence word extraction unit 11 extracts a plurality of first co-occurrence words, and the second co-occurrence word extraction unit 12 translates the plurality of second co-occurrence words into the first You may display between a word and a 2nd word.
The scatter diagram updated in this way is output to the scatter diagram storage unit 100.

他の実施形態として、散布図作成部13は、第1の単語と第2の単語との間で共起度の比率に応じた位置に、第2の共起単語を表示することも好ましい。
図2によれば、例えば「麺」に対する「もちもち」と「つるつる」との共起度の比率が、0.3:0.7である場合、「つるつる」のプロット位置から、「もちもち」のプロット位置との間で、0.3:0.7の位置に、「麺」をプロットする。これは、「麺」は、「もちもち」よりも「つるつる」との共起度が高いことを、ユーザは一見して認識することができる。
As another embodiment, it is also preferable that the scatter diagram creating unit 13 displays the second co-occurrence word at a position corresponding to the ratio of the co-occurrence degree between the first word and the second word.
According to FIG. 2, for example, when the ratio of co-occurrence between “mochimochi” and “smooth vine” with respect to “noodle” is 0.3: 0.7, from the plot position of “smooth vine”, “mochimochi” “Noodles” are plotted at a position of 0.3: 0.7 between the plot positions. This means that the user can recognize at a glance that “noodle” has a higher degree of co-occurrence with “smooth” than “mochimochi”.

尚、他の実施形態として、散布図にプロットされるオノマトペについて、音韻的な類似性のあるオノマトペを更にプロットすることもできる。日本語に基づくオノマトペは、造語傾向が強いために、新規の造語表現が生み出されてから定着(辞書等の知識源に反映)するまで、経過期間が存在する。そのような場合は、対応する訳語が見当たらないことも想定される。例えば、ふわふわ/とろとろ(オノマトペ)に対して、「ふわとろ」のような造語が流行する場合もある。その場合、出現文脈としては、「ふわふわ」「とろとろ」の両者に近いものと予想される。そこで、コーパス中の共起語の類似性から、散布図では、「ふわふわ」「とろとろ」の近傍に、「ふわとろ」がプロットされる。この場合、ユーザは、直接の訳語が表示されなくとも、近い関係にある語群の訳語を理解することができる。   As another embodiment, onomatopoeia having phonological similarity can be further plotted on the onomatopoeia plotted in the scatter diagram. Since onomatopoeia based on Japanese has a strong tendency to make words, there is an elapsed period from the creation of a new coined expression to its establishment (reflected in a knowledge source such as a dictionary). In such a case, it is assumed that no corresponding translation is found. For example, there is a case where a coined word such as “Fuwatoro” is prevalent for onomatopoeia. In that case, the appearance context is expected to be close to both “fluffy” and “torotoro”. Therefore, from the similarity of co-occurrence words in the corpus, “Fuwatoro” is plotted in the vicinity of “Fuwafuwa” and “Torotoro” in the scatter diagram. In this case, the user can understand the translations of the closely related word group even if the direct translation is not displayed.

[検索キー入力部14]
検索キー入力部14は、ユーザ所持の端末2から、第1の言語に基づく第1の単語を、「検索キー」として入力する。前述によれば、例えば外国人が日本語(第1の言語)の「もちもち」(第1の単語)の意味合いを知りたい場合に、検索キーとして「もちもち」が入力される。
入力された検索キーは、散布図検索部15へ出力される。
[Search key input unit 14]
The search key input unit 14 inputs a first word based on the first language as a “search key” from the terminal 2 possessed by the user. According to the above, for example, when a foreigner wants to know the meaning of “mochimochi” (first word) in Japanese (first language), “mochimochi” is input as a search key.
The input search key is output to the scatter diagram search unit 15.

また、他の実施形態として、検索キー入力部14は、ユーザに、第1の単語に対する「適用態様語」を更に入力させることも好ましい。例えば「もちもち」に対する「食事」(適用態様語)のようなものである。適用態様語は、散布図検索部15が、適用分野に基づく散布図を検索するために用いられる。   As another embodiment, it is also preferable that the search key input unit 14 further causes the user to input an “application mode word” for the first word. For example, it is like “meal” (application mode word) for “mochimochi”. The application mode word is used by the scatter diagram search unit 15 to search for a scatter diagram based on the application field.

更に、他の実施形態として、検索キー入力部14は、例えば検索用文章を入力し、その検索用文章の中から、オノマトペを検索キーとし、文脈として現れる単語を適用態様語として抽出するものであってもよい。   Further, as another embodiment, the search key input unit 14 inputs, for example, a search sentence, and extracts a word appearing as a context as an application mode word from the search sentence using onomatopoeia as a search key. There may be.

[散布図検索部15]
散布図検索部15は、散布図記憶部100を用いて、検索キーを含む散布図を検索する。具体的には、検索キー入力部14によって入力された「もちもち」(検索キー)を含む散布図を検索する。
[Scatter diagram search unit 15]
The scatter diagram search unit 15 uses the scatter diagram storage unit 100 to search for a scatter diagram including a search key. Specifically, a scatter diagram including “mochimochi” (search key) input by the search key input unit 14 is searched.

このとき、異なる適用分野に基づく複数の散布図が検索される場合もある。そのために、散布図検索部15は、検索キー入力部14に入力された「適用態様語」に対応付けられた1つ以上の散布図の中から、検索キーを含む散布図を検索することも好ましい。
適用分野「食感」の散布図には、適用態様語として「食事」「料理」「食べ物」のようなキーワードが付与されている(前述した散布図記憶部100参照)。ユーザから、検索キー「もちもち」及び適用態様語「食事」が入力された場合、適用態様語「食事」が付与された1つ以上の散布図の中から、「もちもち」を含む散布図が検索される。
At this time, a plurality of scatter diagrams based on different application fields may be searched. For this purpose, the scatter diagram search unit 15 may also search for a scatter diagram including the search key from one or more scatter diagrams associated with the “application mode word” input to the search key input unit 14. preferable.
In the scatter diagram of the application field “texture”, keywords such as “meal”, “cooking”, and “food” are given as application mode words (see the scatter diagram storage unit 100 described above). When the search key “mochimochi” and the application mode word “meal” are input from the user, a scatter diagram including “mochimochi” is searched from one or more scatter diagrams to which the application mode word “meal” is assigned. Is done.

[散布図表示部16]
散布図表示部16は、散布図検索部15によって検索された散布図を、端末2へ返信する。
[Scatter diagram display section 16]
The scatter diagram display unit 16 returns the scatter diagram retrieved by the scatter diagram search unit 15 to the terminal 2.

以上、詳細に説明したように、本発明のプログラム、装置及び方法によれば、未知の言語の感覚表現的な単語に対して意味が近いであろう、既知の言語の単語を、ユーザに認識させることができる散布図を作成する。
具体的には、未知の言語(第1の言語、例えば旅行先の国の言語)における感覚表現的な単語に対して意味が近いであろう、既知の言語(第2の言語、例えば母国語)の単語を明示することによって、外国人にも、その単語の使用場面及びニュアンスを理解させることができる。
As described above in detail, according to the program, apparatus, and method of the present invention, a user recognizes a word in a known language that has a meaning close to that of a sensory expression word in an unknown language. Create a scatter plot that you can.
Specifically, a known language (second language, eg, native language) that will be close in meaning to a sensory expression word in an unknown language (first language, eg, the language of the destination country) By clearly indicating the word, it is possible for foreigners to understand the usage situation and nuance of the word.

前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。   Various changes, modifications, and omissions of the above-described various embodiments of the present invention can be easily made by those skilled in the art. The above description is merely an example, and is not intended to be restrictive. The invention is limited only as defined in the following claims and the equivalents thereto.

1 サーバ
100 散布図記憶部
101 コーパス部
102 対訳辞書部
11 第1の共起単語抽出部
12 第2の共起単語抽出部
13 散布図作成部
14 検索キー入力部
15 散布図検索部
16 散布図表示部

DESCRIPTION OF SYMBOLS 1 Server 100 Scatter chart storage part 101 Corpus part 102 Bilingual dictionary part 11 1st co-occurrence word extraction part 12 2nd co-occurrence word extraction part 13 Scatter figure creation part 14 Search key input part 15 Scatter figure search part 16 Scatter figure Display section

Claims (12)

第1の言語に基づく複数の単語が複数の評価軸上に散布された散布図を、ディスプレイに表示するようにコンピュータを機能させるプログラムであって、
前記散布図について、第1の言語に基づく第1の単語と第2の単語との間に、第1の単語及び第2の単語の両方で共起度が高い第1の共起単語を導出し、その対訳となる第2の言語に基づく第2の共起単語を表示する
ようにコンピュータを機能させることを特徴とするプログラム。
A program for causing a computer to function on a display to display a scatter diagram in which a plurality of words based on a first language are scattered on a plurality of evaluation axes.
For the scatter diagram, a first co-occurrence word having a high degree of co-occurrence is derived between the first word and the second word based on the first language in both the first word and the second word. And a program for causing the computer to function to display a second co-occurrence word based on the second language to be translated.
第1の言語に基づく第1の単語及び第2の単語は、オノマトペ(擬声語)である
ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。
The program according to claim 1, wherein the computer functions so that the first word and the second word based on the first language are onomatopoeia.
前記散布図の評価軸は、コレスポンデンス分析に基づくもの、又は、任意の特徴ベクトルに基づくものである
ようにコンピュータを機能させることを特徴とする請求項1又は2に記載のプログラム。
The program according to claim 1 or 2, wherein the computer is caused to function so that the evaluation axis of the scatter diagram is based on correspondence analysis or based on an arbitrary feature vector.
前記散布図の評価軸は、人の感覚に基づく特性の強弱を表すものである
ようにコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載のプログラム。
The program according to any one of claims 1 to 3, wherein the computer is caused to function so that the evaluation axis of the scatter diagram represents the strength of characteristics based on a human sense.
前記散布図に表示される第2の共起単語は、テキストに代えて、サムネイル画像として表示される
ようにコンピュータを機能させることを特徴とする請求項1から4のいずれか1項に記載のプログラム。
5. The computer according to claim 1, wherein the computer functions so that the second co-occurrence word displayed in the scatter diagram is displayed as a thumbnail image instead of the text. 6. program.
第1の言語に基づくコーパスを用いて、第1の言語に基づく第1の単語及び第2の単語の両方で共起度が高い、第1の言語に基づく第1の共起単語を抽出する第1の共起単語抽出手段と、
対訳辞書を用いて、第1の言語に基づく第1の共起単語を、第2の言語に基づく第2の共起単語に対訳する第2の共起単語抽出手段と、
第1の言語に基づく第1の単語と第2の単語との間に、第2の言語に基づく第2の共起単語を表示する散布図を作成する散布図作成手段と
してコンピュータを機能させることを特徴とする請求項1から5のいずれか1項に記載のプログラム。
Using a corpus based on the first language, a first co-occurrence word based on the first language that has a high degree of co-occurrence on both the first word and the second word based on the first language is extracted. First co-occurrence word extraction means;
A second co-occurrence word extracting means for translating a first co-occurrence word based on the first language into a second co-occurrence word based on the second language, using a bilingual dictionary;
Causing a computer to function as a scatter diagram creating means for creating a scatter diagram for displaying a second co-occurrence word based on a second language between a first word based on a first language and a second word The program according to any one of claims 1 to 5.
第1の共起単語抽出手段は、第1の単語及び第1の共起単語の間の共起度と、第2の単語及び第1の共起単語の間の共起度との比率を算出し、
前記散布図作成手段は、第1の単語と第2の単語との間で前記比率に応じた位置に、第2の共起単語を表示する
ようにコンピュータを機能させることを特徴とする請求項6に記載のプログラム。
The first co-occurrence word extracting means calculates a ratio between the co-occurrence degree between the first word and the first co-occurrence word and the co-occurrence degree between the second word and the first co-occurrence word. Calculate
The scatter diagram creating means causes the computer to function to display a second co-occurrence word at a position corresponding to the ratio between the first word and the second word. 6. The program according to 6.
適用分野毎に、散布図を記憶した散布図記憶手段を更に有し、
ユーザ所望の適用分野に基づく散布図に対して、第2の共起単語を表示する
ようにコンピュータを機能させることを特徴とする請求項1から7のいずれか1項に記載のプログラム。
Each application field further has a scatter diagram storage means for storing a scatter diagram,
The program according to any one of claims 1 to 7, wherein the computer is caused to function to display a second co-occurrence word with respect to a scatter diagram based on an application field desired by a user.
ユーザに、第1の言語に基づく第1の単語を検索キーとして入力させる検索キー入力手段と、
前記散布図記憶手段から、前記検索キーを含む散布図を検索する散布図検索手段と、
検索した散布図を、ユーザに明示する散布図表示手段と
してコンピュータを更に機能させることを特徴とする請求項8に記載のプログラム。
Search key input means for allowing a user to input a first word based on a first language as a search key;
Scatter chart search means for searching a scatter chart including the search key from the scatter chart storage means;
9. The program according to claim 8, further causing the computer to function as a scatter diagram display means for clearly displaying the retrieved scatter diagram to the user.
前記散布図毎に、前記適用分野に基づく1つ以上の適用態様語が更に対応付けられており、
前記検索キー入力手段は、第1の単語に対する適用態様語を更に入力し、
前記散布図検索手段は、前記検索キー入力手段に入力された前記適用態様語に対応付けられた1つ以上の散布図の中から、前記検索キーを含む散布図を検索する
ようにコンピュータを機能させることを特徴とする請求項9に記載のプログラム。
Each scatter diagram is further associated with one or more application mode words based on the application field,
The search key input means further inputs an application mode word for the first word,
The scatter diagram search means functions a computer to search for a scatter diagram including the search key from one or more scatter diagrams associated with the application mode word input to the search key input means. The program according to claim 9, wherein:
第1の言語に基づく複数の単語が複数の評価軸上に散布された散布図を、ディスプレイに表示する装置であって、
前記散布図について、第1の言語に基づく第1の単語と第2の単語との間に、第1の単語及び第2の単語の両方で共起度が高い第1の共起単語を導出し、その対訳となる第2の言語に基づく第2の共起単語を表示する
ことを特徴とする装置。
A device that displays on a display a scatter diagram in which a plurality of words based on a first language are scattered on a plurality of evaluation axes,
For the scatter diagram, a first co-occurrence word having a high degree of co-occurrence is derived between the first word and the second word based on the first language in both the first word and the second word. And displaying a second co-occurrence word based on the second language to be translated.
第1の言語に基づく複数の単語が複数の評価軸上に散布された散布図を、ディスプレイに表示する装置の表示方法であって、
前記散布図について、第1の言語に基づく第1の単語と第2の単語との間に、第1の単語及び第2の単語の両方で共起度が高い第1の共起単語を導出し、その対訳となる第2の言語に基づく第2の共起単語を表示する
ことを特徴とする装置の表示方法。

A display method of an apparatus for displaying on a display a scatter diagram in which a plurality of words based on a first language are scattered on a plurality of evaluation axes,
For the scatter diagram, a first co-occurrence word having a high degree of co-occurrence is derived between the first word and the second word based on the first language in both the first word and the second word. And displaying a second co-occurrence word based on the second language to be translated.

JP2017117314A 2017-06-15 2017-06-15 Program, device and method for creating scatter plot in which word groups are scattered Active JP6745761B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017117314A JP6745761B2 (en) 2017-06-15 2017-06-15 Program, device and method for creating scatter plot in which word groups are scattered

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017117314A JP6745761B2 (en) 2017-06-15 2017-06-15 Program, device and method for creating scatter plot in which word groups are scattered

Publications (2)

Publication Number Publication Date
JP2019003387A true JP2019003387A (en) 2019-01-10
JP6745761B2 JP6745761B2 (en) 2020-08-26

Family

ID=65006096

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017117314A Active JP6745761B2 (en) 2017-06-15 2017-06-15 Program, device and method for creating scatter plot in which word groups are scattered

Country Status (1)

Country Link
JP (1) JP6745761B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020213158A1 (en) * 2019-04-19 2020-10-22 富士通株式会社 Identification method, generation method, dimensionality reduction method, display method, and information processing device
JP2021099865A (en) * 2021-03-10 2021-07-01 小林 哲 Information processing system, semantic content interpretation method for japanese and program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020213158A1 (en) * 2019-04-19 2020-10-22 富士通株式会社 Identification method, generation method, dimensionality reduction method, display method, and information processing device
JPWO2020213158A1 (en) * 2019-04-19 2021-12-09 富士通株式会社 Specific method, generation method, dimensional compression method, display method and information processing device
JP7367754B2 (en) 2019-04-19 2023-10-24 富士通株式会社 Identification method and information processing device
JP2021099865A (en) * 2021-03-10 2021-07-01 小林 哲 Information processing system, semantic content interpretation method for japanese and program
JP7125794B2 (en) 2021-03-10 2022-08-25 哲 小林 Information processing system, Japanese semantic content interpretation method and program

Also Published As

Publication number Publication date
JP6745761B2 (en) 2020-08-26

Similar Documents

Publication Publication Date Title
Schroeder et al. childLex: A lexical database of German read by children
US20070174040A1 (en) Word alignment apparatus, example sentence bilingual dictionary, word alignment method, and program product for word alignment
US20110246496A1 (en) Information search method and information provision method based on user&#39;s intention
AlOtaibi et al. Sentiment analysis challenges of informal Arabic language
US11397740B2 (en) Method and apparatus for providing information by using degree of association between reserved word and attribute language
Bentz Adaptive languages: An information-theoretic account of linguistic diversity
Goyal et al. Development of Indian sign language dictionary using synthetic animations
Goyal et al. Automatic translation of English text to Indian sign language synthetic animations
JP6626917B2 (en) Readability evaluation method and system based on English syllable calculation method
dos Santos et al. A lightweight regression method to infer psycholinguistic properties for Brazilian Portuguese
Qudar et al. A survey on language models
Georgiev et al. Methodology for creating new scenes through the use of thematic relations for innovative designs
JP6745761B2 (en) Program, device and method for creating scatter plot in which word groups are scattered
Kato et al. Extraction of onomatopoeia used for foods from food reviews and its application to restaurant search
Shivahare et al. Survey Paper: Study of Natural Language Processing and its Recent Applications
CN114722174A (en) Word extraction method and device, electronic equipment and storage medium
Gobin-Rahimbux et al. KreolStem: A hybrid language-dependent stemmer for Kreol Morisien
Singh et al. Natural language processing, understanding, and generation
Li et al. Twitter sentiment analysis of the 2016 US Presidential Election using an emoji training heuristic
Ali et al. Word embedding based new corpus for low-resourced language: Sindhi
JP5697164B2 (en) Tagging program, apparatus, method, and server for providing a category tag that cannot be directly derived from the target sentence
Aditya et al. ENGLISH TEXT TO INDIAN SIGN LANGUAGE TRANSLATION SYSTEM
Huang Measuring Similarity Between Texts in Python
Franco et al. A Recall Analysis of Core Word Lists over Children's Utterances for Augmentative and Alternative Communication
Ebeling Exploring cross-linguistic congruence: The case of two stance frames in English and Norwegian

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190701

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200727

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200804

R150 Certificate of patent or registration of utility model

Ref document number: 6745761

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150