JP5202524B2 - 多段アプローチを使用した事実の抽出の最適化 - Google Patents
多段アプローチを使用した事実の抽出の最適化 Download PDFInfo
- Publication number
- JP5202524B2 JP5202524B2 JP2009522777A JP2009522777A JP5202524B2 JP 5202524 B2 JP5202524 B2 JP 5202524B2 JP 2009522777 A JP2009522777 A JP 2009522777A JP 2009522777 A JP2009522777 A JP 2009522777A JP 5202524 B2 JP5202524 B2 JP 5202524B2
- Authority
- JP
- Japan
- Prior art keywords
- fact
- description
- factual
- search term
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims description 40
- 238000013459 approach Methods 0.000 title description 6
- 238000003860 storage Methods 0.000 claims description 23
- 230000007717 exclusion Effects 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 14
- 239000012634 fragment Substances 0.000 claims description 4
- 239000003607 modifier Substances 0.000 claims 1
- 238000004458 analytical method Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- LQIAZOCLNBBZQK-UHFFFAOYSA-N 1-(1,2-Diphosphanylethyl)pyrrolidin-2-one Chemical compound PCC(P)N1CCCC1=O LQIAZOCLNBBZQK-UHFFFAOYSA-N 0.000 description 1
- 240000000254 Agrostemma githago Species 0.000 description 1
- 235000009899 Agrostemma githago Nutrition 0.000 description 1
- 241000842962 Apoda limacodes Species 0.000 description 1
- 208000034656 Contusions Diseases 0.000 description 1
- 240000004244 Cucurbita moschata Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009852 Cucurbita pepo Nutrition 0.000 description 1
- 101100117236 Drosophila melanogaster speck gene Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 206010024453 Ligament sprain Diseases 0.000 description 1
- 206010041662 Splinter Diseases 0.000 description 1
- 208000010040 Sprains and Strains Diseases 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 206010053615 Thermal burn Diseases 0.000 description 1
- 239000007844 bleaching agent Substances 0.000 description 1
- 208000034526 bruise Diseases 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- JLQUFIHWVLZVTJ-UHFFFAOYSA-N carbosulfan Chemical compound CCCCN(CCCC)SN(C)C(=O)OC1=CC=CC2=C1OC(C)(C)C2 JLQUFIHWVLZVTJ-UHFFFAOYSA-N 0.000 description 1
- 208000018747 cerebellar ataxia with neuropathy and bilateral vestibular areflexia syndrome Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- ZINJLDJMHCUBIP-UHFFFAOYSA-N ethametsulfuron-methyl Chemical compound CCOC1=NC(NC)=NC(NC(=O)NS(=O)(=O)C=2C(=CC=CC=2)C(=O)OC)=N1 ZINJLDJMHCUBIP-UHFFFAOYSA-N 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000003595 mist Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 239000002574 poison Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 235000020354 squash Nutrition 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
abase advance appear avoid
abate advertise appease awake
abort aerate apply award
abrade afford argue back
abridge aggravate arouse bail
absorb agree arrange bank
abstract aid arrest bar
accelerate aim arrive barbarize
accent air ask bare
accept allay assemble base
accredit alleviate assert batter
achieve alter asseverate beach
act amend assign beam
add amplify assuage bear
address amuse assure become
adduce animate attach befog
adjust announce attack befuddle
administer answer attenuate beget
admit antedate avert begin
belch bypass conceal damp
belie canvass concede dance
bend cap conceive dangle
benumb capitalize conciliate darken
bequeath carry conclude darn
bestow cast conduct dash
betray castigate confess deaden
better castrate confide deal
bind catch confirm debase
blackleg chafe confound debauch
blanket change confuse debunk
bleach channel congeal decay
blemish chafe connect decide
blend check conserve declare
blight chill consolidate deepen
blister chime constitute deface
block chip constrain defeat
blockade chock constrict defend
blow choke continue deflate
blunder choose contort deflect
blunt churn contact deform
blur cipher control defrost
blurt circulate convert delay
bob circumvent convey delegate
bog claim cook deliver
boil clash cool demise
bolster clean cordon demonstrate
boost cleanse correct dent
bowdlerize clear corrode deny
bowl climb corrupt deplete
brace clinch counter depreciate
brand clip countersink depress
brave clog cover deprive
break close crack depute
brief clot crank derange
brighten cloud cash describe
bring cockle craze desecrate
broadcast coin create design
bruise collapse cripple designate
buckle collect crop desolate
build colour cross despoil
bull comfort crumble destroy
bunch commission crush detail
bundle commit cry detect
bung communicate curb deteriorate
burlesque compare curdle determine
burn complete curtail develop
burst compound cushion die
bury compress cut differentiate
dilute ease exhibit fold
dim eat exist follow
diminish educate expand force
direct effect expedite forge
dirty elevate explain forgive
disable elicit expose form
disappear elude expound foster
discharge emancipate express foul
discipline embellish extend found
disclose embitter extinguish frame
discolor embody extort fray
disconnect emit extract free
discontinue emphasize fabricate freeze
discover enable face frustrate
discuss encourage fade furl
disfigure end fail furnish
disguise endorse fake furrow
dislocate endow fall fuse
dislodge enforce falsify gain
dismantle engage familiarize gallop
dismount enhance fasten garble
disorder enjoin father gash
dispatch enlarge fatten generate
dispense enliven feature gerrymander
disperse ennoble feed get
display enrich ferry give
dispute enroll fertilize gladden
disrupt enshrine festoon glorify
distil entail fiddle gloss
distinguish entangle fight glut
distort enthrone fill go
disturb entrust filter govern
divert enunciate finalize grade
divide epitomize find graduate
dock equalize finish grant
doctor erect fire grate
dodge escalate fit graze
double establish fix ground
douse evade flag group
draft evaporate flash grow
dramatize evince flaunt guide
draw evoke flay halt
dredge exacerbate float halve
dress exact flood hamper
drive exaggerate floodlight handle
drop examine flourish happen
drown exasperate flush harass
duff exceed fly harbour
dull excite fog harden
harmonize instill listen neaten
harry institute litter nick
hasten integrate live nip
hatch intend liven notch
head intensify load notice
heal interpolate lock nourish
hear interrupt loose nurse
heat intimate loosen obfuscate
heighten introduce lose obscure
help invert lower obstruct
hide invigorate lump obtain
hit invite magnify occupy
hoard invoke maintain occur
hoist involve make offend
hold issue manage offer
hope jab mangle open
hound jam manipulate operate
hurt jettison manufacture oppose
identify jingle mark order
illuminate join marshal originate
imagine jumble mask outline
impair jump match overcharge
impart justify matter overdo
impeach keep maul overflow
impede kick measure overturn
imperil kill meet overwork
implant kindle mellow pacify
improve knock melt pack
inaugurate lacerate mend pad
increase ladder mention panic
indent lance mildew paralyze
indenture land mind pare
indicate laugh misrepresent parley
induce launch miss parole
induct lay mist parry
infect layer mitigate part
infiltrate lead modify partition
infix leave mollify pass
inflame lend moot patch
inflate lengthen mould pay
inflict lessen move peal
influence let muddle peddle
inform level muddy peg
infuse liberate muffle penalize
initial lie muss perform
initiate light muster perish
injure lighten mute persecute
insert limit mutilate pervert
inspire line narrow phrase
pillow provide regard roll
pique provoke register rotate
pit prune regulate rouse
placard publicize rehabilitate row
place publish rehearse ruffle
plan pull reinforce ruin
plant pulp reissue rumple
play punch reject run
pluck puncture rekindle rush
plug punish relate rustle
plunge punt relax sail
point purge release salvage
poison push relieve sap
pole put reline save
polish qualify remould scald
poll quarter remove scold
pool quench rend score
pop question renew scotch
pose quicken renovate scratch
position quieten reopen scream
post quilt repair scuff
pound race replace scupper
preach raise report scuttle
precipitate ransack republish seal
predate rap require sear
prefer rationalize rerun seat
prejudice rattle reseat secure
preoccupy re-engage resist see
prepare re-establish rest sell
present re-form restart send
preserve read restore serve
prettify rear restrain set
prevent reawaken result settle
prick recall resurrect server
prime receive retail shake
proclaim reclaim retain shame
procure recline retire sharpen
produce recognize retract shatter
profess recommend retrench sheathe
programme reconcile retrieve shed
promote reconsider return shelter
promulgate record reveal shield
prop recruit reverse shift
propagandize reduce revive shine
propel refer rewind shingle
profound refine right shirk
prosecute reflect ring shoot
protect refloat rise shorten
protest reform roast shout
shrink sponsor succeed transfer
shut sport suffer transplant
sift spot suggest trap
sign spout suit travel
signal sprain summarize treat
signalize spray supplement trigger
signify spread supply trim
simmer spring support truss
sing square suppose try
singe squash suppress tumble
sink squeeze surface turn
sit stack surrender twang
site staff survive twiddle
situate stain suspend twirl
skirt stalemate sustain twist
slacken stall sweep unblock
slake stamp sweeten unburden
slash stand swell unclog
sleep star swing undo
slice starch swish unfasten
slip start taint unfix
slow staunch tarnish unfold
smear stay task unhinge
smile steady teach unhitch
smudge steer tear unite
snag stem telephone unloose
snap step temper unravel
snarl stick tend unsaddle
snuff stiffen thank unseat
sober still thaw unsex
soften stir thin unstop
soil stoke thrill untangle
solace stop throw untwist
solidify store thrust uphold
soothe straighten thump upset
sort strain thwart urge
sound strand tidy use
sour strengthen tighten validate
sow stress toll vandalize
spare stretch tootle veer
spark strike topple veil
speak strip torment ventilate
speck strum torture vocalize
speed study total voice
spill stuff touch vote
spin stultify toughen vulgarize
splinter stunt tousle waft
spilt subdue tow waggle
splodge subscribe train wake
wangle weave win worry
warm weep wind wreak
warn weld wing wreck
warp whet wipe wrest
warrant whirl wire wring
wash whitewash wish wrinkle
watch widen withdraw write
weaken wield wither yield
wean wiggle withhold
Claims (20)
- 電子リソース内で意見と事実との区別をプロセッサにより実施するコンピュータ実装方法であって、
検索用語を受け取ること、
前記検索用語に一致する関連する電子リソースを発見すること、
前記検索用語に一致する単語を含む前記関連する電子リソースのリスト及び前記リスト内の前記電子リソースの断片を表示すること、
前記検索用語と、事実の表現を示唆するように判定された動詞のリストを含むように構成された事実−単語表に一致する1以上の動詞とからなる文書の事実の記述を発見するために、関連する電子リソースをスキャンすること、
前記関連する電子リソースの部分であって、前記検索用語と前記事実−単語表の単語と一致しない単語を含む部分を事実の抽出処理から、削除すること、
前記関連する電子リソースの部分を削除することの後に、前記事実の記述の言語成分を識別するために、前記発見した事実の記述を調査すること、
前記識別した言語成分に基づいた事実として事実の記述を提示するか否かを決定すること、
前記検索用語と、前記検索用語に関連する事実であると判定された事実の記述とを含む文書の少なくとも一部を表現すること
から成ることを特徴とする方法。 - 前記識別した言語成分に基づいた事実として事実の記述を提示するか否かを決定することは、
ある事実の記述を考慮からはずすために、前記事実の記述の前記言語成分に関する除外規則を適用すること、
前記事実の記述にスコアをつけること、
考慮するために残っている事実の記述の各々の前記スコアを閾値と比較すること、
前記閾値を超えるスコアを有する事実の記述の各々に対して、事実として前記事実の記述を含む文章の少なくとも一部を提示すること
から成ることを特徴とする請求項1に記載の方法。 - 更に会話の部分と共に前記事実の記載の単語にタグを付けることから成ることを特徴とする請求項2に記載の方法。
- 会話の部分と共に前記事実の記載の単語にタグを付けることは、単語が動詞か名詞のいずれかであるとき、名詞タグを適用することから成ることを特徴とする請求項3に記載の方法。
- 前記除外規則を適用することは、主語の役目を有する統語上の句のための規則の第1のセットを適用することと、目的語の役目を有する統語上の句のための規則の第2のセットを適用することから成ることを特徴とする請求項4に記載の方法。
- 規則の前記第1のセットを適用することは、主語又は目的語の意見又は偏った修飾語句を有する名詞句を除外することから成ることを特徴とする請求項5に記載の方法。
- 規則の前記第2のセットを適用することは、
固有名詞でない限定記述を含む主語名詞句を除外すること、
代名詞を含む名詞句を除外すること、文書の冒頭に現れない主語名詞句を除外することから成ることを特徴とする請求項5に記載の方法。 - 前記名詞句の役目に関係なく、更に規則の第3のセットを適用することから成ることを特徴とする請求項5に記載の方法。
- 規則の前記第3のセットを適用することは、前記文章の句読点が疑問符である事実の記述を除外することと、ストップワードを含む句を有する文章を除外することから成ることを特徴とする請求項8に記載の方法。
- 前記事実の記述にスコアを付けることは、前記除外規則の適用後、又は適用中のどちらかに考慮するために残っているこれらの事実の記述だけにスコアを付けることから成ることを特徴とする請求項2に記載の方法。
- コンピュータストレージ媒体であって、
検索用語を受け取ること、
前記検索用語に一致する関連する電子リソースを発見すること、
前記検索用語に一致する単語を含む前記関連する電子リソースのリスト及び前記リスト内の前記電子リソースの断片を表示すること、
前記検索用語と、事実の表現を示唆するように判定された動詞のリストを含むように構成された事実−単語表の単語に一致する1以上の動詞とからなる文書の事実の記述を発見するために、複数の関連する電子文書を構文解析すること、
前記関連する電子リソースの部分であって、前記検索用語と前記事実−単語表の単語と一致しない単語を含む部分を事実の抽出処理から、削除すること、
前記関連する電子文書の部分を削除することの後に、前記事実の記述の言語成分を識別するために、前記発見した事実の記述を調査すること、
前記言語成分に関する候補となる事実の記述に除外規則を適用することにより、前記識別した言語成分に基づいた前記検索用語に関連する事実として事実の記述を提示するか否かを決定すること、
一致する事実−単語表に基づき、かつ、主語と目的語の個々の重みに基づき、候補となる事実の記述をスコアリングすること、
前記除外規則および事実の記述のスコアリングに従って、前記候補となる事実の記述を考慮からはずすこと、
前記検索用語と、前記検索用語に関連する事実であると判定された事実の記述とを含む文書の少なくとも一部を表現すること
から成ることを特徴とする行為を、プロセッサに実行させる実行可能プログラム命令を含むコンピュータストレージ媒体。 - 前記行為は、さらに電子文書の集合を検索して、前記検索用語を含むこれらの文書を発見することにより前記複数の文書を得ることから成り、
前記集合は、前記複数の電子文書を解析する前に前記検索用語を含むこれらの文書を発見するために検索されること
を特徴とする請求項11に記載のコンピュータストレージ媒体。 - 前記行為は、さらに前記電子文書を入手して前記検索用語を受け取る前に事実の記述を提示すること、又前記電子文書と事実の記述を検索して、これらの電子文書と前記検索用語に関連する対応する事実の記述を見つけることから成ることを特徴とする請求項11に記載のコンピュータストレージ媒体。
- 前記行為は、さらに考慮するために残っている事実の記述の各々の前記スコアを閾値に対して比較すること、
前記検索用語を含み、前記閾値を超えるスコアを有する電子文書から取られた事実の記述の各々に対して、前記検索用語に関連する事実として前記事実の記述を含む前記文章の少なくとも一部を提示することから成ることを特徴とする請求項11に記載のコンピュータストレージ媒体。 - 前記事実の記述にスコアを付けることは、前記除外規則を適用した後に考慮するために残っているこれらの事実の記述にだけスコアをつけること
から成ることを特徴とする請求項14に記載のコンピュータストレージ媒体。 - 本文情報から成る複数の電子リソースを含むストレージと、
プロセッサとから成るコンピュータシステムであって、
前記プロセッサは、検索用語を受け取り、前記検索用語と一致する関連する電子リソースを発見し、前記検索用語に一致する単語を含む前記関連する電子リソースのリスト及び前記リスト内の前記電子リソースの断片を表示し、電子文書のセットから前記検索用語に関する事実を提示するための要求を受け取り、前記検索用語と、事実の表現を示唆するように判定された動詞のリストを含むように構成された事実−単語表の単語に一致する1以上の動詞とからなる文書の事実の記述を発見するために、前記関連する電子文書を構文解析し、前記関連する電子リソースの部分であって、前記検索用語と前記事実−単語表の単語と一致しない単語を含む部分を事実の抽出処理から、削除すること、前記関連する電子文書の部分を削除した後に、前記事実の記述の言語成分を識別するために、前記発見した事実の記述を調査し、前記識別した言語成分に基づいた事実として事実の記述を提示するか否かを決定し、前記事実として提示されると判定された事実の記述と、前記検索用語に関連する事実の記述とを含む文書の少なくとも一部を表現する
ことを特徴とするコンピュータシステム。 - 表示装置を更に備え、前記表示装置上に前記文章の少なくとも前記部分を表示することにより、前記プロセッサが前記文章の少なくとも前記部分を提示することを特徴とする請求項16に記載のコンピュータシステム。
- ネットワークインタフェースを更に備え、前記ネットワークインタフェースを介してこれらの部分を他のコンピュータに出力することにより、前記プロセッサが前記文章の少なくとも前記部分を提示することを特徴とする請求項16に記載のコンピュータシステム。
- ネットワークインタフェースを更に備え、前記ストレージは前記ネットワークインタフェースを介して前記プロセッサによりアクセス可能なことを特徴とする請求項16に記載のコンピュータシステム。
- 前記事実の記述の前記言語成分に関連して除外規則を適用して前記事実の記述の一部を考慮から外すこと、
前記事実の記述にスコアを付けること、
閾値に対して考慮するために残存する事実の記述の各々のスコアを比較すること、
前記検索用語を含み、前記閾値を超えるスコアを有する事実の記述の各々に対して、前記検索用語に関連する事実として前記事実の記述を含む前記文章の少なくとも前記部分を提示すること、
により、事実として事実の記述を提示するか否かを前記プロセッサが決定することを特徴とする請求項16に記載のコンピュータシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/496,650 US7668791B2 (en) | 2006-07-31 | 2006-07-31 | Distinguishing facts from opinions using a multi-stage approach |
US11/496,650 | 2006-07-31 | ||
PCT/US2007/016435 WO2008016491A1 (en) | 2006-07-31 | 2007-07-20 | Optimization of fact extraction using a multi-stage approach |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2009545808A JP2009545808A (ja) | 2009-12-24 |
JP2009545808A5 JP2009545808A5 (ja) | 2010-09-09 |
JP5202524B2 true JP5202524B2 (ja) | 2013-06-05 |
Family
ID=38987573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009522777A Active JP5202524B2 (ja) | 2006-07-31 | 2007-07-20 | 多段アプローチを使用した事実の抽出の最適化 |
Country Status (10)
Country | Link |
---|---|
US (1) | US7668791B2 (ja) |
EP (1) | EP2050019A4 (ja) |
JP (1) | JP5202524B2 (ja) |
AU (1) | AU2007281638B2 (ja) |
BR (1) | BRPI0714311A2 (ja) |
MX (1) | MX2009000588A (ja) |
NO (1) | NO20085387L (ja) |
RU (1) | RU2451999C2 (ja) |
TW (1) | TWI431493B (ja) |
WO (1) | WO2008016491A1 (ja) |
Families Citing this family (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7269875B1 (en) * | 2003-11-19 | 2007-09-18 | David Brian Grimes | Cleaning apparatus |
US9495358B2 (en) | 2006-10-10 | 2016-11-15 | Abbyy Infopoisk Llc | Cross-language text clustering |
US8671341B1 (en) * | 2007-01-05 | 2014-03-11 | Linguastat, Inc. | Systems and methods for identifying claims associated with electronic text |
US8190628B1 (en) * | 2007-11-30 | 2012-05-29 | Google Inc. | Phrase generation |
TWI544349B (zh) | 2008-06-13 | 2016-08-01 | 尼爾 揚 | 可分類與可更新之編譯及封存平台以及其使用 |
US20110231387A1 (en) * | 2010-03-22 | 2011-09-22 | Yahoo! Inc. | Engaging content provision |
US8719692B2 (en) * | 2011-03-11 | 2014-05-06 | Microsoft Corporation | Validation, rejection, and modification of automatically generated document annotations |
US8812301B2 (en) * | 2011-09-26 | 2014-08-19 | Xerox Corporation | Linguistically-adapted structural query annotation |
CN102929934A (zh) * | 2012-09-25 | 2013-02-13 | 东莞宇龙通信科技有限公司 | 照片信息显示的方法及移动终端 |
US10922326B2 (en) * | 2012-11-27 | 2021-02-16 | Google Llc | Triggering knowledge panels |
US10289653B2 (en) | 2013-03-15 | 2019-05-14 | International Business Machines Corporation | Adapting tabular data for narration |
USD805535S1 (en) | 2013-06-04 | 2017-12-19 | Abbyy Production Llc | Display screen or portion thereof with a transitional graphical user interface |
USD802609S1 (en) | 2013-06-04 | 2017-11-14 | Abbyy Production Llc | Display screen with graphical user interface |
US9164977B2 (en) | 2013-06-24 | 2015-10-20 | International Business Machines Corporation | Error correction in tables using discovered functional dependencies |
US9600461B2 (en) | 2013-07-01 | 2017-03-21 | International Business Machines Corporation | Discovering relationships in tabular data |
US9830314B2 (en) | 2013-11-18 | 2017-11-28 | International Business Machines Corporation | Error correction in tables using a question and answer system |
RU2586577C2 (ru) | 2014-01-15 | 2016-06-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Фильтрация дуг в синтаксическом графе |
RU2665239C2 (ru) | 2014-01-15 | 2018-08-28 | Общество с ограниченной ответственностью "Аби Продакшн" | Автоматическое извлечение именованных сущностей из текста |
US10331782B2 (en) | 2014-11-19 | 2019-06-25 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems and methods for automatic identification of potential material facts in documents |
US9626358B2 (en) | 2014-11-26 | 2017-04-18 | Abbyy Infopoisk Llc | Creating ontologies by analyzing natural language texts |
RU2592396C1 (ru) | 2015-02-03 | 2016-07-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Способ и система для машинного извлечения и интерпретации текстовой информации |
RU2610241C2 (ru) | 2015-03-19 | 2017-02-08 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Способ и система синтеза текста на основе извлеченной информации в виде rdf-графа с использованием шаблонов |
US10095740B2 (en) * | 2015-08-25 | 2018-10-09 | International Business Machines Corporation | Selective fact generation from table data in a cognitive system |
CN105260091B (zh) * | 2015-09-07 | 2019-06-21 | 努比亚技术有限公司 | 照片处理方法及装置 |
US10776587B2 (en) * | 2016-07-11 | 2020-09-15 | International Business Machines Corporation | Claim generation |
RU2637992C1 (ru) * | 2016-08-25 | 2017-12-08 | Общество с ограниченной ответственностью "Аби Продакшн" | Способ извлечения фактов из текстов на естественном языке |
CN106648390B (zh) * | 2016-12-05 | 2018-12-21 | 网易(杭州)网络有限公司 | 一种控制指令生成方法、装置及移动终端 |
CN106649786B (zh) * | 2016-12-28 | 2020-04-07 | 北京百度网讯科技有限公司 | 基于深度问答的答案检索方法及装置 |
CN106924963B (zh) * | 2017-04-26 | 2023-06-27 | 温州大学 | 一种视力听力康复训练娱乐打靶机 |
CN108038263A (zh) * | 2017-11-15 | 2018-05-15 | 南京邮电大学 | 考虑性能相关结构不确定的芯片多元参数成品率预测方法 |
CN108257380B (zh) * | 2017-12-05 | 2020-11-10 | 北京掌行通信息技术有限公司 | 一种基于路况信息检测拥堵事件的方法及系统 |
US10303771B1 (en) * | 2018-02-14 | 2019-05-28 | Capital One Services, Llc | Utilizing machine learning models to identify insights in a document |
CN109344993B (zh) * | 2018-08-23 | 2021-08-24 | 江西省水利科学研究院 | 一种基于条件概率分布的河道洪峰水位预报方法 |
CN111026597B (zh) * | 2019-01-31 | 2023-12-26 | 安天科技集团股份有限公司 | 一种芯片隐藏存储空间的检测方法、装置及存储介质 |
CN110007589B (zh) * | 2019-02-26 | 2021-05-18 | 湖南盛世威得科技有限公司 | 一种具有火灾自动求救功能的智能手表 |
CN110057634B (zh) * | 2019-04-11 | 2021-09-07 | 东北石油大学 | 一种制造岩心裂缝的装置及方法 |
CN111858225A (zh) * | 2019-04-28 | 2020-10-30 | 中国移动通信集团上海有限公司 | 延时预测方法、装置、设备及计算机存储介质 |
CN111090785A (zh) * | 2019-06-10 | 2020-05-01 | 工盒(嘉兴)网络技术有限公司 | 一种紧固云系统 |
CN110597108B (zh) * | 2019-08-23 | 2021-12-21 | 广州电力设计院有限公司 | 电缆隧道区域控制系统、控制方法、装置及计算机设备 |
CN110737010B (zh) * | 2019-09-19 | 2021-11-16 | 西安空间无线电技术研究所 | 一种基于低轨通信卫星的安全定位授时信号生成系统 |
CN111078849B (zh) * | 2019-12-02 | 2023-07-25 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
CN111126057B (zh) * | 2019-12-09 | 2023-08-01 | 航天科工网络信息发展有限公司 | 一种分级神经网络的案件情节精准量刑系统 |
DE102020103941A1 (de) * | 2020-02-14 | 2021-08-19 | Grimme Landmaschinenfabrik Gmbh & Co. Kg | Verfahren zum Betrieb einer Maschine zum Ernten und/oder Trennen von Hackfrüchten, zugehörige Maschine und zugehöriges Computerprogrammprodukt |
CN111526397A (zh) * | 2020-03-30 | 2020-08-11 | 深圳市懿美莱科技有限公司 | 一种智能家庭网络播放器 |
JP2021164005A (ja) * | 2020-03-30 | 2021-10-11 | Kddi株式会社 | 画像復号装置、画像復号方法及びプログラム |
CN111836065B (zh) * | 2020-07-14 | 2022-04-29 | 北京场景互娱传媒科技有限公司 | 一种直播商标自动隐藏的智能方法 |
CN111882828B (zh) * | 2020-07-22 | 2021-08-20 | 淮北智淮科技有限公司 | 一种防滑坡预警装置及其使用方法 |
CN112182895B (zh) * | 2020-10-10 | 2022-08-23 | 中际联合(天津)科技有限公司 | 一种风机塔筒爬梯及防坠落布置方案图的自动分析方法 |
CN112890771B (zh) * | 2021-01-14 | 2022-08-26 | 四川写正智能科技有限公司 | 一种基于毫米波雷达传感器监测睡眠状态的儿童手表 |
US11687539B2 (en) | 2021-03-17 | 2023-06-27 | International Business Machines Corporation | Automatic neutral point of view content generation |
US11972210B2 (en) * | 2021-05-13 | 2024-04-30 | Motorola Solutions, Inc. | System and method for predicting a penal code and modifying an annotation based on the prediction |
CN115191786B (zh) * | 2022-08-04 | 2023-12-19 | 慕思健康睡眠股份有限公司 | 一种控制方法、装置、设备和存储介质 |
CN115432851B (zh) * | 2022-08-23 | 2023-06-23 | 长兴瑷晟环保装备有限公司 | 一种高效混凝水力空化一体机 |
CN118278385B (zh) * | 2024-05-29 | 2024-09-17 | 暗物智能科技(广州)有限公司 | 一种基于篇章卷面分析的测试方法、装置及可读存储介质 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5519608A (en) | 1993-06-24 | 1996-05-21 | Xerox Corporation | Method for extracting from a text corpus answers to questions stated in natural language by using linguistic analysis and hypothesis generation |
JPH0756933A (ja) | 1993-06-24 | 1995-03-03 | Xerox Corp | 文書検索方法 |
US5331556A (en) | 1993-06-28 | 1994-07-19 | General Electric Company | Method for natural language data processing using morphological and part-of-speech information |
US5715468A (en) | 1994-09-30 | 1998-02-03 | Budzinski; Robert Lucius | Memory system for storing and retrieving experience and knowledge with natural language |
JP2000029902A (ja) * | 1998-07-15 | 2000-01-28 | Nec Corp | 構造化文書分類装置およびこの構造化文書分類装置をコンピュータで実現するプログラムを記録した記録媒体、並びに、構造化文書検索システムおよびこの構造化文書検索システムをコンピュータで実現するプログラムを記録した記録媒体 |
US6167370A (en) | 1998-09-09 | 2000-12-26 | Invention Machine Corporation | Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures |
US6741986B2 (en) | 2000-12-08 | 2004-05-25 | Ingenuity Systems, Inc. | Method and system for performing information extraction and quality control for a knowledgebase |
US6665661B1 (en) | 2000-09-29 | 2003-12-16 | Battelle Memorial Institute | System and method for use in text analysis of documents and records |
JP4630480B2 (ja) * | 2001-03-19 | 2011-02-09 | 株式会社東芝 | 要約抽出プログラム、文書分析支援プログラム、要約抽出方法、文書分析支援方法、文書分析支援システム |
JP2001357064A (ja) * | 2001-04-09 | 2001-12-26 | Toshiba Corp | 情報共有支援システム |
US9009590B2 (en) | 2001-07-31 | 2015-04-14 | Invention Machines Corporation | Semantic processor for recognition of cause-effect relations in natural language documents |
US7526425B2 (en) | 2001-08-14 | 2009-04-28 | Evri Inc. | Method and system for extending keyword searching to syntactically and semantically annotated data |
WO2003027894A1 (en) | 2001-09-26 | 2003-04-03 | The Trustees Of Columbia University In The City Of New York | System and method of generating dictionary entries |
US7426509B2 (en) * | 2002-11-15 | 2008-09-16 | Justsystems Evans Research, Inc. | Method and apparatus for document filtering using ensemble filters |
WO2004072780A2 (en) | 2003-02-05 | 2004-08-26 | Verint Systems, Inc. | Method for automatic and semi-automatic classification and clustering of non-deterministic texts |
RU2236699C1 (ru) * | 2003-02-25 | 2004-09-20 | Открытое акционерное общество "Телепортал. Ру" | Способ поиска и выборки информации с повышенной релевантностью |
KR100515641B1 (ko) * | 2003-04-24 | 2005-09-22 | 우순조 | 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법 |
US20050108630A1 (en) * | 2003-11-19 | 2005-05-19 | Wasson Mark D. | Extraction of facts from text |
US7496500B2 (en) | 2004-03-01 | 2009-02-24 | Microsoft Corporation | Systems and methods that determine intent of data and respond to the data based on the intent |
US7970600B2 (en) * | 2004-11-03 | 2011-06-28 | Microsoft Corporation | Using a first natural language parser to train a second parser |
US20070027860A1 (en) * | 2005-07-28 | 2007-02-01 | International Business Machines Corporation | Method and apparatus for eliminating partitions of a database table from a join query using implicit limitations on a partition key value |
US7376551B2 (en) | 2005-08-01 | 2008-05-20 | Microsoft Corporation | Definition extraction |
-
2006
- 2006-07-31 US US11/496,650 patent/US7668791B2/en active Active
-
2007
- 2007-07-18 TW TW096126248A patent/TWI431493B/zh not_active IP Right Cessation
- 2007-07-20 WO PCT/US2007/016435 patent/WO2008016491A1/en active Application Filing
- 2007-07-20 MX MX2009000588A patent/MX2009000588A/es unknown
- 2007-07-20 RU RU2009103145/08A patent/RU2451999C2/ru active
- 2007-07-20 JP JP2009522777A patent/JP5202524B2/ja active Active
- 2007-07-20 AU AU2007281638A patent/AU2007281638B2/en active Active
- 2007-07-20 EP EP07796948A patent/EP2050019A4/en not_active Ceased
- 2007-07-20 BR BRPI0714311-7A patent/BRPI0714311A2/pt not_active IP Right Cessation
-
2008
- 2008-12-29 NO NO20085387A patent/NO20085387L/no not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
US7668791B2 (en) | 2010-02-23 |
EP2050019A1 (en) | 2009-04-22 |
AU2007281638A1 (en) | 2008-02-07 |
MX2009000588A (es) | 2009-01-27 |
BRPI0714311A2 (pt) | 2013-04-24 |
TWI431493B (zh) | 2014-03-21 |
TW200817947A (en) | 2008-04-16 |
NO20085387L (no) | 2009-01-19 |
US20080027888A1 (en) | 2008-01-31 |
EP2050019A4 (en) | 2012-03-21 |
AU2007281638B2 (en) | 2011-10-06 |
WO2008016491A1 (en) | 2008-02-07 |
RU2451999C2 (ru) | 2012-05-27 |
RU2009103145A (ru) | 2010-08-10 |
JP2009545808A (ja) | 2009-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5202524B2 (ja) | 多段アプローチを使用した事実の抽出の最適化 | |
Foraker et al. | The role of prominence in pronoun resolution: Active versus passive representations | |
Newman et al. | Refining targeted syntactic evaluation of language models | |
JP2009545808A5 (ja) | ||
Poesio et al. | Identifying concept attributes using a classifier | |
Oostdijk et al. | N-gram-based recognition of threatening tweets | |
Frisson et al. | Phonological and orthographic overlap effects in fast and masked priming | |
Kockelman | The anthropology of intensity: Language, culture, and environment | |
Joanis | Automatic verb classification using a general feature space | |
Sotudeh et al. | Comparing discrimination powers of text and citation-based context types | |
Hudson | The Empire in the epitome: Florus and the conquest of historiography | |
Considine | Current projects in historical lexicography | |
Sundström | How not to write a thesis or dissertation: a guide to success through failure | |
Forgács | Grammaticalisation and preverbs | |
Smith et al. | The semantics of winning and losing1 | |
Hu et al. | Inflation Metaphor in Contemporary American English. | |
Mapunda | “Simba yagongwa”: metaphors in soccer reporting headlines in Tanzania’s Uhuru Swahili daily | |
Shao et al. | The blurring of the boundaries: changes in verb/noun heterosemy in Recent English | |
Klein | Corpus Development Methodologies in Service of a Microtheory of Metaphor | |
Kostusiak et al. | Media Language of Modern Football: Dynamic and Communicative-Intentional Dimensions | |
Kamp | Statistical modeling at the syntax-semantics interface: exploiting automatically induced lexical classes evaluated through variational Bayesian inference | |
Schafroth | Verb Formation by Means of Suffixes in the Romance Languages | |
Cha et al. | SentenceLDA: Discriminative and Robust Document Representation with Sentence Level Topic Model | |
Wehrle | Frenzy: Babe Ruth's Much Ballyhooed Premier Season with the New York Yankees | |
Nadler-Akirav | The Literary-Historical Approach of Yefet Ben ‘Eli the Karaite in His Commentary of the Book of Amos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100720 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120608 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120921 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5202524 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160222 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |