JP2005250916A - 電子文書の話題単語関連図作成方法 - Google Patents

電子文書の話題単語関連図作成方法 Download PDF

Info

Publication number
JP2005250916A
JP2005250916A JP2004061512A JP2004061512A JP2005250916A JP 2005250916 A JP2005250916 A JP 2005250916A JP 2004061512 A JP2004061512 A JP 2004061512A JP 2004061512 A JP2004061512 A JP 2004061512A JP 2005250916 A JP2005250916 A JP 2005250916A
Authority
JP
Japan
Prior art keywords
topic
topic word
electronic document
words
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004061512A
Other languages
English (en)
Inventor
Kojiro Kobayashi
孝次郎 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SENKU KK
Original Assignee
SENKU KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SENKU KK filed Critical SENKU KK
Priority to JP2004061512A priority Critical patent/JP2005250916A/ja
Publication of JP2005250916A publication Critical patent/JP2005250916A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】電子文書中の話題単語を抽出し、これらの関連性を図式化して電子文書の内容が視覚的に把握することを課題とする。
【解決手段】電子文書中の話題単語を抽出し、各話題単語の出現回数を計測し、一方各話題単語の全組数と該全組数における各話題単語間の距離が関連限界距離以下となる各話題単語の関連組数を計測し、計測された話題単語の全組数と関連組数を基に各話題単語間の関連率を計測し、上記各話題単語の出現回数と各話題単語間の関連率を基にして電子文書の中の話題単語間の関連を図示する電子文書の話題単語関連図作成方法。
【選択図】 図8

Description

この発明は、短時間に視覚的に電子文書の概要や話題を把握できるようにした電子文書の話題単語関連図作成方法に関するものである。
テキスト文書の概要や話題を把握するには、一般に目次によって見易さを向上させる方法が採用されているが、目次による方法は、全くテキスト文書の内容を確認せずに、どんなことが書かれているのかを極簡単に把握することができるが、その反面もっとも重要な主題しか分からず、他にどのような文章が記載されているかは把握できないという欠点がある。
一方、文中の重要箇所抽出、不要箇所削除による要約手法により概要や話題など電子文書の特徴を抽出することも行われている。
更に、文単位の抽出では、重要でないとして捨てられる情報の単位が文単位であることから、要約を作成する際に情報が大きく欠落する可能性があり、そのため一文ごとに重要な箇所を抽出し、或いは削り、情報をなるべく減らさずに、テキストを短く表現しなおす要約手法もある。
現在、日本語を対象とする要約装置でも、JUMAN、茶セン等の形態素解析ツール、KNPなどの構文解析ツールの普及により重要文抽出のみでなく、構文解析結果を積極的に利用した文内要約も行われるようになっている。
また、計算機の処理速度と記憶容量の増大及び大量の機械可読テキストが利用拡大に伴い、統計的手法によって概要や要約文の抽出精度の改善も図られている。
特開 2001-5821,特開 2002-288190,特開平 10-63658 号,特開平 10-69482号 自然言語処理Vol.6 No.6 July 1999発行「テキスト自動要約に関する研究動向」、情報処理43巻12号2002年12月発行「テキスト自動要約における新たな展開と展望」
しかし、人間がテキスト文の要約に際してはまず内容を理解し、理解した内容に基づいて要約文を作成するが、現在の計算機によるテキスト自動要約装置では内容理解の技術が十分なほど発達しておらず、したがってこれらの要約装置によって抽出された要約文は文書全体を把握するのにあまり適していないものが多い。
そこで、この発明は、複雑な言語処理を行うことにより人間が行う要約に近い文章を作成することではなく、これとは全く別のアプローチ方法、即ち電子文書の概要や話題の関連を視覚的に表現することにより、短時間で電子文書の概要や話題を把握することを目的とするものである。
これらの目的のために、電子文書中の話題単語を抽出し、これらの話題単語の関連性を調べて得られた数値より話題単語関連図を作成して表示する方法について鋭意研究の結果、以下のような発明を完成するに至ったものである。
この発明は、電子文書中の話題単語を抽出し、各話題単語の出現回数を計測し、一方各話題単語の全組数と該全組数における各話題単語間の距離が関連限界距離以下となる各話題単語の関連組数を計測し、計測された話題単語の全組数と関連組数を基に各話題単語間の関連率を計測し、上記各話題単語の出現回数と各話題単語間の関連率を基にして電子文書中の話題単語間の関連を図示する電子文書の話題単語関連図作成方法を提案するものである。
上記各話題単語の出現回数と各話題単語間の関連率を基にして電子文書中の話題単語間の関連図を作成する方法としては、例えば出現回数の多い順に話題単語を上位に表示して囲繞し、且つ該囲繞図形を関連率に応じた太さの線分で結合した方法を挙げることができる。
ここで、話題単語は関連率に応じた径の楕円図形で囲む方法、この出現回数に応じた径の長方形図形で囲む方法、或いは話題単語の出現回数に応じた濃淡の色彩で塗りつぶす方法を採用することができる。
この発明によれば電子文書中の話題単語を抽出し、これらの話題単語の関連性を調べて得られた数値により話題単語関連図を作成して表示することにより、電子文書の内容が視覚的に把握することが出来る。
電子文書中の話題単語を抽出し、各話題単語の出現回数を計測し、一方各話題単語の全組数と該全組数における各話題単語間の距離が関連限界距離以下となる各話題単語の関連組数を計測し、計測された話題単語の全組数と関連組数を基に各話題単語間の関連率を計測し、上記のように計測した出現回数の多い順に話題単語を上位に表示し、これらの話題単語を上記のように計測した関連率に応じた径の楕円形で囲繞し、且つこれらの楕円形を関連率に応じた太さの線分で結合した方法。
この発明を図示の実施例に基づいて詳細に説明すると、はじめに対象となる電子文書のテキストに対して形態素解析を行い、代名詞を除く名刺に特化した単語抽出を行う(図1参照)。
上記により全話題単語に関して出現回数をカウントする(図2参照)。
あらかじめユーザーが定義した任意の順位以内に属する単語(以下、これを対象語と呼ぶ)に注目し、それらの単語の関連性を以下の手順を用いて解析する(図3参照)。
話題単語間に含まれる、名詞、代名詞、動詞、形容詞、形容動詞、副詞の個数を単語間の距離と呼び、各対象語の全ての組み合わせにおける距離を計測する(図4参照)。
あらかじめユーザーが定義することができる、ある2つの単語A、Bがお互いに関連性があるか否かを判別する距離の基準値を関連限界距離と呼ぶ(図5参照)。
電子文書に含まれる全ての単語A、Bの組み合わせの数を単語A、Bの全組数と呼び、距離が関連限界距離以下となる組み合わせの数を単語A、Bの関連組数と呼ぶ(図6参照)。
単語A、Bの関連組数を単語A、Bの全組数で割った値を単語A、Bの関連率と呼ぶ。
以上によって説明した方法をもとに得られる出現回数、関連率をもとにして電子文書中の話題単語間の関連を図示する(図7参照)。
図8は、以上で示される方法のフローチャートの一例を示すものであり、また図9は関連率の算出のフローチャートの一例を示すものである。
各話題単語の出現回数と各話題単語間の関連率を基にして電子文書中の話題単語間の関連図は、具体的に出現回数の多い順に話題単語を上位に表示して囲繞し、且つ該囲繞図形を関連率に応じた太さの線分で結合した方法等で図示される。
ここで、話題単語は、この関連率に応じた径の楕円図形等の図形で囲繞する方法等を採用して図式化することができるが、この方法を定式化すると、話題単語関連図作成の対象となるソース全体 を形態素解析し、代名詞を除く名詞に特化し抽出した単語の集合をDとし、抽出された単語をW1,W2,・・・,Wi,・・・Wn-1,Wnとすると、Dは下式で表される。



={W1,W2,・・・,Wi,・・・Wn-1,Wn}


テキストSにおける集合D中の各話題単語の出現回数をAS,Wiとし、出現回数上位m番目までの単語を選出したものを、集合NS,mとすると、NS,mは下式で表される。


S,m={W1',W2',・・・,Wj',・・・Wm-1',Wm'}

但し、
S,W1'≧AS,W2'≧・・・≧AS,Wj'≧・・・≧AS,Wm-1'≧AS,Wm'


話題単語関連図生成の対象となるソース全体Sより、NS,mの各単語Wa',Wb'全ての組み合わせの数 C(NS,m,Wa',Wb')を計測する。そして、NS,mの各単語それぞれの単語間の距離L(S,Wa',Wb')を計測し、あらかじめ設定された任意の正の整数である関連限界距離boundを超えないすなわち、bound≧L(S,Wa',Wb')となる組み合わせの数 C'(NS,m,Wa',Wb',bound)を計測する。そしてテキストSにおける、Wa',Wb'の関連率R(S,Wa',Wb')は下式として算出できる。


R(S,Wa',Wb')=C'(NS,m,Wa',Wb',bound)/C(NS,m,Wa',Wb')

ここで、C'(NS,m,Wa',Wb')は、AS,Wa'×AS,Wb'として計算することができる。すなわちテキストSにおけるWa',Wb'の関連率は下式として算出できる。


R(S,Wa',Wb')=C'(NS,m,Wa',Wb',bound)/(AS,Wa'×AS,Wb') (0 ≦R(S,Wa',Wb')≦ 1)

テキストSにおいて最も多く出現するの名詞の出現回数、すなわちAS,W1'で、NS,mにおける他の全ての出現回数を割ったものをテキストSにおけるWj'の出現率とし、KS,Wj'とすると、KS,Wj'は下式で表すことができる。


S,Wj=AS,Wj'/AS,W1' (0 ≦KS,Wj'≦ 1)

楕円の最大長径をα(話題単語関連図描画領域の横幅の3分の1)とし、関連を示す線分の太さをβ (ユーザーが任意に設定)とし、集合NS,mの単語Wj'を長径α×KS,Wj'、短径α×KS,Wj'/4の楕円で表現し、中心地に単語のスペルを記載し、単語 Wj'とWj+1'との関係を線分の太さをβ×R(S,Wa',Wb')で描画することで話題単語関連図を生成することができる(図10参照)。
この他の話題単語関連図作成方法としては、例えば出現回数の多い順に0から1に正規化し、数値に応じた濃淡で楕円を描き、各楕円間を関連率に応じた太さの線分で結ぶ方法(図11参照)。
出現回数の多い話題単語を上位に表示し、各単語の出現回数を最も出現回数の多い単語の数で割り0から1に出現回数を正規化し、その数値に応じた横幅を持つ長方形で各単語を囲み、各長方形を関連率に応じた太さの線で結ぶ方法(図12参照)等を挙げることができ、この場合単語を長方形で囲む方法は楕円形で囲む方法に比べると各単語の出現回数の比率を視覚的に捉えやすい等の利点がある。
次に、この発明に係る方法により作成された話題単語関連図の好ましい実施形態について詳しく説明する。
実施態様1
メッセンジャーサービスとは、インターネットを利用して遠隔地にいる2人のユーザーが1対1の会話をテキストを基本として行うことが出来るサービスであるが、やりとりする会話の一覧性においては効率が悪く、メッセンジャーサービス利用ユーザーは、話題や話の方向性をしばしば勘違いしてしまうことがあり、ゆえに無駄な会話を重ねてしまうことや相手に誤解を与えてしまうことがある。
そこで、インターネットにおけるメッセンジャーサービスにおいて使用される話題単語関連図の実施形態は、従来のメッセンジャーサービスで提供されているサービスに加え、話題単語関連図が右横に配置される仕組みとなっている(図13参照)。
メッセンジャーサービスにおいては、ユーザーがある時点までに行った全会話分のテキストを話題単語関連図生成のためのソースとせず、敢えて近時間で行われた会話のみを対象とすることで、より近時間の会話の話題を理解するという目的に適した、話題単語関連図を生成することができる。
一方、メッセンジャーサービスは、発言単位でデータを管理する。したがって、a番目の発言をVaと表記し、最新の発言をVrとするならば、過去30件の発言すなわち Vr-29からVrまでのテキストデータを話題単語関連図生成のためのソースとすることで、最新の話題を表現することができる。
上記例であげた30件の発言の量を一般的に示せば、過去q件の発言とは、Vr-q+1からVrと示すことができる。
時間軸調整ツマミをスライドすることで、過去に遡った話題単語関連図を閲覧する機能を提供することもできる。具体的に言えば、スライドの目盛を1ずらすことで、発言を1件分過去にずらしたテキストを話題単語関連図生成のためのソースとすることができ、時間軸調整ツマミの目盛移動距離を dとするならば、話題単語関連図生成のためのソースとなる30件分の発言は、 Vr-29-dから、Vr-dとなる。(図14参照)。
以上を纏めると、発言全件数r、スライド移動距離d、対象とする発言件数q、となる発言のテキストS'r,d,qは、下式で表すことができる。


S'r,d,q={Vr-q+1-d,Vr-q+1-d+1,・・・,Vr-d-1,Vr-d}


ここで、メッセンジャーサービスにおいて、時間軸調整ツマミの目盛移動距離d、過去q件の発言という条件下での、よく出現するキーワードの上位 mとそのキーワードの関連性は下式で表現でき、したがってNS,m とR(S,Wa',Wb')を利用することでメッセンジャーサービスにおける話題単語関連図の関連性を示す線分を描画することができる。


S=S'r,d,q
={W1,W2,・・・,Wi,・・・Wn-1,Wn}
S,m={W1',W2',・・・,Wi',・・・Wm-1',Wm'}
R(S,Wa',Wb')=C'(NS,m,Wa',Wb',bound)/(AS,Wa'×AS,Wb') (0 ≦R(S,Wa',Wb')≦ 1)
但し、
S,W1'≧AS,W2'≧・・・≧AS,Wj'≧・・・≧AS,Wm-1'≧AS,Wm'

実施態様2
チャットサービスとメッセンジャーサービスは多くの共通点を持つサービスであるが、サービスの利用形態がメッセンジャーサービスでは1ユーザー対1ユーザーであるのに対してチャットサービスは多ユーザー対多ユーザーであることに大きな違いである。すなわち、メッセンジャーサービスに比べて、チャットサービスは誰がどんな考えを持っている(発言を行った)のかを把握することがしばしば困難である。
そこで、インターネットにおけるチャットサービスをメッセンジャーと同様な形式でユーザー毎の話題単語関連図を作成するものである(図15参照)。
実施態様3
既存の掲示板サービスは、掲示板全体を把握するためにはタイトルの一覧を解読しなければならず、膨大な文字列を理解しなくてはならない。また、適切なタイトルが入力されるとは限らず、閲覧者が期待する投稿文があるかないかを判断するのは困難で、しばしば既に存在する話題があるのにも拘わらず同じ内容で投稿してしまうユーザーが多くトラブルの原因になっている。
そこで、インターネットにおける掲示板サービスにおいて投稿記事のスレッドを上記同様な形式で話題単語関連図にした実施態様を示す(図16参照)。即ち、掲示板サービスは、投稿者によって構築されていくスレッドと呼ばれる話題のかたまりがあり、このスレッドはシステムによって投稿文が管理されている。したがって、この実施態様のようにスレッドに属する全ての投稿文を話題単語関連図生成のためのソースとすることでスレッドの話題の概要を表現することができる。
実施態様4
メールサービスは爆発的に普及されているが、その閲覧する機能は従来と変わらず、現状ではメーリングリストやメールマガジンなど配信する側の機能は拡張され、個々のユーザーに届くメールの数は近年増大しつつある。また、メールサービスの普及に伴い、メールサービスは宣伝業者の友好なツールとして活用され、閲覧者にとっては迷惑なメールが来ることも多々ある。そして以上のことは、閲覧者が全てのメールを把握することを困難にする状況を生じ、閲覧者が自分宛に届いたメールを短時間で把握し取捨選択できる機能の必要性が高まっている。
そこで、インターネットにおけるメールサービスにおいてメールの内容を上記同様な形式で話題単語関連図にした実施態様を示す(図17参照)。この実施態様のようにメール1通1通に対しての話題単語関連図の作成が有効である。与えられた、閲覧者が把握しようとしているメールを与え、そのメールに含まれているテキストデータを話題単語関連図作成のためのソースとすることで、メールの概要を把握することができる。
論文や書籍など電子文書の概要を把握する際には、複数の電子文書を統合した図面を参照する機会も多い。例えば、フォルダやコーディングされたファイル名などによってファイリングされている電子文書群において、分類されていることは認知できるが、具体的な内容がわからない場合がある。
図18は、話題単語関連図のテキストデータにおいて使用されている話題単語関連図の実施態様を示すもので、ブラウズソフトの機能として働き、ユーザーは文書ファイルを開く前に、話題単語関連図を参照できるようにしてあり、これによれば複数の電子文書の統合したテキストデータを話題単語関連図作成のためのソースとすることで、複数の電子文書の概要を把握するための話題単語関連図の作成ができる。
この発明では電子文書の内容が視覚的に把握することができるため、インターネットにおけるメッセンジャーサービス、チャットサービス、掲示板サービス、メールサービス、論文や書籍の紹介サービス等に使用することが可能である。
電子文書のテキストデータに対して形態素解析を行い、代名詞を除く名詞に特化した話題単語抽出を行う様子を示す図 図1の例をもとに、代名詞を除く名詞に特化して抽出されたの話題単語の出現回数をカウントした様子を示す図 話題単語の出現回数の大きい順に整列された、代名詞を除く名詞に特化して抽出されたの話題単語の例で、且つ対象語の例を示した図 話題単語間の距離の例を示す図 話題単語A、Bに関連性があるかないかを判別する例を示す図 話題単語A、Bの全ての組み合わせから、距離が関連限界距離以下となる組み合わせの数を計測する様子を示す図 話題単語関連図の一例を示す図 この発明の一実施例を示すフローチャート図 この発明において関連率の算出のフローチャートの一例を示す図 必要な計算式を含んだ話題単語関連図の一例を示す図 話題単語関連図の他の一例を示す図 話題単語関連図の更に他の一例を示す図 この発明の一実施態様である話題単語関連図表示機能を搭載したメッセンジャーサービスの操作画面の一例を示す図 同上のメッセンジャーサービスにおいて時系列的な話題の流れを把握するために時間軸調節ツマミを付加した図 この発明の他の実施態様である話題単語関連図表示機能を搭載したチャットサービスの操作画面の一例を示す図 この発明の更に他の実施態様である話題単語関連図表示機能を搭載した掲示板サービスの操作画面の一例を示す図 この発明の更に他の実施態様である話題単語関連図表示機能を搭載したメールサービスの操作画面の一例を示す図 この発明の更に他の実施態様である話題単語関連図表示機能を搭載したブラウズソフトの操作画面の一例を示す図
符号の説明
1 代名詞を除く名詞のみに抽出された単語のうち最も出現回数の多い単語
2 出現回数
3 対象語
4 対象条件順位

Claims (5)

  1. 電子文書中の話題単語を抽出し、各話題単語の出現回数を計測し、一方各話題単語の全組数と該全組数における各話題単語間の距離が関連限界距離以下となる各話題単語の関連組数を計測し、計測された話題単語の全組数と関連組数を基に各話題単語間の関連率を計測し、上記各話題単語の出現回数と各話題単語間の関連率を基にして電子文書中の話題単語間の関連を図示することを特徴とする電子文書の話題単語関連図作成方法。
  2. 上記各話題単語の出現回数と各話題単語間の関連率を基にして電子文書中の話題単語間の関連率が出現回数の多い順に話題単語を上位に表示して囲繞し、且つ該囲繞図形を関連率に応じた太さの線分で結合した方法で図示される請求項1記載の電子文書の話題単語関連図作成方法。
  3. 囲繞図形がこれに囲まれる話題単語の関連率に応じた径の楕円図形である請求項2記載の電子文書の話題単語関連図作成方法。
  4. 囲繞形状がこれに囲まれる話題単語の出現回数に応じた径の長方形図形である請求項2記載の電子文書の話題単語関連図作成方法。
  5. 囲繞図形内をこれに囲まれる話題単語の出現回数に応じた濃淡の色彩で塗りつぶすようにした請求項2記載の電子文書の話題単語関連図作成方法。
JP2004061512A 2004-03-05 2004-03-05 電子文書の話題単語関連図作成方法 Pending JP2005250916A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004061512A JP2005250916A (ja) 2004-03-05 2004-03-05 電子文書の話題単語関連図作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004061512A JP2005250916A (ja) 2004-03-05 2004-03-05 電子文書の話題単語関連図作成方法

Publications (1)

Publication Number Publication Date
JP2005250916A true JP2005250916A (ja) 2005-09-15

Family

ID=35031332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004061512A Pending JP2005250916A (ja) 2004-03-05 2004-03-05 電子文書の話題単語関連図作成方法

Country Status (1)

Country Link
JP (1) JP2005250916A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007140862A (ja) * 2005-11-17 2007-06-07 Konica Minolta Medical & Graphic Inc 情報処理システム、プログラム、及び情報処理方法
JP2009163617A (ja) * 2008-01-09 2009-07-23 Fujitsu Ltd 表示装置、表示方法、及び、表示プログラム
JP2010113412A (ja) * 2008-11-04 2010-05-20 Omron Corp 文書情報加工方法、文書情報加工装置、文書情報加工プログラムおよび記録媒体
JP2019046017A (ja) * 2017-08-31 2019-03-22 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2020160514A (ja) * 2019-03-25 2020-10-01 カシオ計算機株式会社 検索装置、辞書作成プログラム、辞書データ作成方法
JP2021071744A (ja) * 2019-10-29 2021-05-06 株式会社東芝 情報処理装置、情報処理方法、および情報処理システム
JP2021082328A (ja) * 2021-02-15 2021-05-27 株式会社 ミックウェア コンテンツ制御装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007140862A (ja) * 2005-11-17 2007-06-07 Konica Minolta Medical & Graphic Inc 情報処理システム、プログラム、及び情報処理方法
JP2009163617A (ja) * 2008-01-09 2009-07-23 Fujitsu Ltd 表示装置、表示方法、及び、表示プログラム
JP2010113412A (ja) * 2008-11-04 2010-05-20 Omron Corp 文書情報加工方法、文書情報加工装置、文書情報加工プログラムおよび記録媒体
JP2019046017A (ja) * 2017-08-31 2019-03-22 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2020160514A (ja) * 2019-03-25 2020-10-01 カシオ計算機株式会社 検索装置、辞書作成プログラム、辞書データ作成方法
JP7443667B2 (ja) 2019-03-25 2024-03-06 カシオ計算機株式会社 検索装置、辞書検索プログラム、辞書検索方法
JP2021071744A (ja) * 2019-10-29 2021-05-06 株式会社東芝 情報処理装置、情報処理方法、および情報処理システム
JP7362424B2 (ja) 2019-10-29 2023-10-17 株式会社東芝 情報処理装置、情報処理方法、および情報処理システム
US11811985B2 (en) 2019-10-29 2023-11-07 Kabushiki Kaisha Toshiba Information processing apparatus, information processing method, and information processing system
JP2021082328A (ja) * 2021-02-15 2021-05-27 株式会社 ミックウェア コンテンツ制御装置
JP7160971B2 (ja) 2021-02-15 2022-10-25 株式会社 ミックウェア コンテンツ制御装置

Similar Documents

Publication Publication Date Title
CA2499440C (en) Method and apparatus for summarizing one or more text messages using indicative summaries
Bali et al. “i am borrowing ya mixing?" an analysis of english-hindi code mixing in facebook
Zajic et al. Single-document and multi-document summarization techniques for email threads using sentence compression
CN105426360B (zh) 一种关键词抽取方法及装置
Helt A multi-dimensional comparison of British and American spoken English
Sardinha 25 years later
Ahmed et al. Why read if you can skim: towards enabling faster screen reading
Gupta et al. Text summarization of Hindi documents using rule based approach
Goldstein et al. Using speech acts to categorize email and identify email genres
Baker Corpus Linguistics inSociolinguistics
Rühlemann et al. Windows on the mind: Pauses in conversational narrative
Gries Corpora and legal interpretation: Corpus approaches to ordinary meaning in legal interpretation
JP2014219872A (ja) 発話選択装置、方法、及びプログラム、対話装置及び方法
Jaafar Book review of Ringrow and Pihlaja’s contemporary media stylistics
JP2005250916A (ja) 電子文書の話題単語関連図作成方法
Cheng Corpus analyses of professional discourse
JP2017097488A (ja) 情報処理装置、情報処理方法および情報処理プログラム
Miura et al. WSL: sentence similarity using semantic distance between words
Sampietro The Use of the'Face with Tears of Joy'Emoji on WhatsApp: A Conversation-Analytical Approach
Van Enschot et al. Taming our wild data: On intercoder reliability in discourse research
JP2007140639A (ja) データ表示装置、データ表示方法およびデータ表示プログラム
JP5362651B2 (ja) 重要語句抽出装置及び方法及びプログラム
JP2006318509A (ja) 解データ編集処理装置および処理方法
JP2023034235A (ja) テキスト要約方法、テキスト要約システム
Lin et al. The secret to popular Chinese web novels: A corpus-driven study