DE102012218966A1 - Verfahren und System zum Kennzeichnen von durch Dinge im Internet der Dinge erzeugten Originaldaten - Google Patents

Verfahren und System zum Kennzeichnen von durch Dinge im Internet der Dinge erzeugten Originaldaten Download PDF

Info

Publication number
DE102012218966A1
DE102012218966A1 DE102012218966A DE102012218966A DE102012218966A1 DE 102012218966 A1 DE102012218966 A1 DE 102012218966A1 DE 102012218966 A DE102012218966 A DE 102012218966A DE 102012218966 A DE102012218966 A DE 102012218966A DE 102012218966 A1 DE102012218966 A1 DE 102012218966A1
Authority
DE
Germany
Prior art keywords
things
web messages
web
address information
messages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102012218966A
Other languages
English (en)
Other versions
DE102012218966B4 (de
Inventor
Xian Wu
Keke Cai
Li Zhang
Li Jun Xia
Jian Yao
Shuo Zhang
Zhong Su
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN201110347155.9A external-priority patent/CN103092880B/zh
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE102012218966A1 publication Critical patent/DE102012218966A1/de
Application granted granted Critical
Publication of DE102012218966B4 publication Critical patent/DE102012218966B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

Diese Offenbarung betrifft ein Verfahren und ein System zum Kennzeichen von durch Dinge im Internet der Dinge (IoT) erzeugten Originaldaten, wobei das Verfahren aufweist: Durchführen einer Relativitätserkennung an erworbenen Web-Nachrichten, um Web-Nachrichten zu erhalten, die einen Bezug zu verschiedenen Ereignissen aufweisen; Erwerben von in den zugehörigen Web-Nachrichten enthaltenen Adressinformationen; Ermitteln benachbarter Dinge für verschiedene Ereignisse auf der Grundlage der erworbenen Adressinformationen; und Kennzeichnen von durch die ermittelten benachbarten Dinge erzeugten Originaldaten mithilfe zumindest eines Teils des Inhalts der zugehörigen Web-Nachrichten als Metadaten. Mit dieser Erfindung können durch verschiedene Dinge erzeugten Originaldaten, die für Menschen unverständlich sind, Metadaten in natürlicher Sprache hinzugefügt werden, so dass es möglich ist, Abrufen und Data-Mining in natürlicher Sprache zu erreichen.

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung betrifft Datenverarbeitungstechniken und insbesondere ein Verfahren und ein System zum Kennzeichnen (tagging) von durch Dinge im Internet der Dinge (Internet of Things IoT) erzeugten Originaldaten.
  • BESCHREIBUNG DES STANDES DER TECHNIK
  • Das Internet der Dinge (d. h. IoT) wird als die nächste wichtige Revolution des Internet angesehen. Beim so genannten IoT geht es darum, verschiedene Dinge der realen Welt, wie beispielsweise Straßen, Gebäude, Wasserversorgungssysteme und Haushaltsgeräte mit etwas wie Erfassungseinheiten bereitzustellen, sie durch das Internet zu verbinden und dabei spezifische Programme auszuführen, um eine Fernbedienung oder direkte Kommunikation zwischen diesen Dingen der realen Welt zu erreichen. Das IoT hat den Umfang verbundener Objekte von Elektronik auf alle Arten von Dingen der realen Welt erweitert, das bedeutet ein Archivieren der Mensch-Maschine-Kommunikation und -Interaktion sowie der Kommunikation und Interaktion zwischen Objekten mittels Funkfrequenzerkennung (radio frequency identifications RFID), Sensoren, Binärcodes und Ähnlichem, die für verschiedene Arten von Dingen durch Anschließen an kabellose Netzwerke über Schnittstellen bereitgestellt werden. In naher Zukunft können zum Beispiel Haushaltsgeräte, Krankenhausgeräte und sogar ein T-Shirt verbunden werden und in Netzwerken genau wie Webseiten oder entfernt angeordnete Server besucht werden. Als Folge können all die Dinge der realen Welt über Netzwerke überwacht und betrieben werden, und ihr Verhalten kann für Annehmlichkeiten der Menschen programmiert werden.
  • Bei einem gegebenen bestimmten Ereignis stellt im IoT das Auffinden von Sensoren, die Informationen bezüglich des Ereignisses aufgezeichnet haben, ein Problem dar.
  • Zum Beispiel bei der gegebenen Abfrage „
    Figure 00020001
    (Heckkollision)” das Auffinden von Kameras, die solche Ereignisse aufgezeichnet haben. Eine solche IoT-Suche stellt eine sehr wichtige Anwendung für das IoT dar. Im Unterschied zum Netzwerk des World Wide Web steht der Aufbau von IoT-Suchmaschinen vor den folgenden Herausforderungen:
    Zum Ersten beläuft sich die Anzahl von Dingen in der realen Welt auf exponentielle Größenordnungen. Objekte im Internet codieren 50 bis 100 Billionen Objekte. Jeder Mensch ist von 1000 bis 5000 Objekten umgeben. Der große Datenumfang ist für derzeitige Suchmaschinen zu aufwändig. Laut Statistiken indexiert allein die Suchmaschine Google im Jahr 2008 1 Billion Webseiten.
  • Zum Zweiten können von verschiedenen Dingen im IoT erworbene Originaldaten in Form von Bildern, Video, Audio, numerischen Datensequenzen, Nutzsignalen (wavelets) oder Ähnlichem vorliegen. Im Wesentlichen sind keine Metadaten zum Beschreiben der Semantik dieser Originaldaten verfügbar, und Computer sind per se nicht in der Lage, die Inhalte dieser Datendateien zu verstehen. In anderen Worten, es ist schwierig, menschliche Ansichten und Gefühle durch erworbene Originaldaten zu übermitteln, und es ist für Menschen ebenso schwierig, diese Originaldaten zu verstehen. Obwohl viele Originaldaten zur Verfügung stehen, hat der Mensch erfahren, dass das Suchen zugehöriger Informationen in der natürlichen Sprache oder das Data-Mining nach Zuordnungen von Originaldaten usw. schwierig sind.
  • Heute gibt es Techniken zum tiefgreifenden Verarbeiten von Originaldaten. Aufgrund des großen Umfangs von Dingen im IoT, wie beispielsweise Sensoren und Ähnlichem ist das Entnehmen semantischer Anmerkungen über tiefgreifende Verarbeitung wie beispielsweise Rechnersichttechnologien rechentechnisch zu aufwändig. Des Weiteren müssen auch bei tiefgreifender Verarbeitung aufgrund der Flexibilität von Anwendungen wie beispielsweise Abfragen eine Fülle von Modellen aufgebaut werden, um mit den verschiedenen Anwendungen umzugehen, was ebenfalls unpraktisch ist.
  • 1 zeigt eine schematische Abbildung, welche die Probleme zwischen tatsächlichen Anwendungen nach dem Stand der Technik und durch Dinge erzeugten Originaldaten darstellt. Wie in 1 gezeigt, fragen Benutzer in menschlicher Sprache über ein Netzwerk Sensordaten ab. Obwohl jedoch eine große Menge von Originaldatendateien verfügbar ist, ist es aufgrund der großen Lücke zwischen den Abfragen durch die Benutzer in natürlicher Sprache und den Originaldatendateien von den Sensoren und weil es nahezu keine verfügbaren Metadaten für eine semantische Beschreibung der Originaldatendateien gibt nicht überraschend, dass Benutzer nicht erwerben können, was sie erwartet haben. Somit besteht ein technisches Problem nach dem Stand der Technik darin, wie Abfragen in natürlicher Sprache Originaldaten zugeordnet werden können, um die Datensuche und das Data-Mining sowie das Zuordnungs-Data-Mining und Ähnliches zu erleichtern.
  • Daher besteht nach dem Stand der Technik ein Bedarf, eine Technik zum Kennzeichen von durch Dinge im IoT erzeugten Originaldaten für die weitere Datenverarbeitung bereitzustellen.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung wird vorgelegt, um mindestens eines der vorgenannten nach dem Stand der Technik erkannten Probleme zu lösen. Gemäß einem Aspekt einer Ausführungsform der vorliegenden Erfindung wird ein technisches Schema zum Kennzeichnen von Originaldaten durch die Verwendung von Web-Nachrichten bereitgestellt, um Originaldaten mit Metadaten für deren semantische Beschreibungen zu versehen, um das Verständnis von Inhalten der Originaldaten zu erleichtern.
  • Es wurde von den Erfindern festgestellt, dass Web-Nachrichten wie beispielsweise Blogs und Microblogs in der Praxis vorherrschend verwendet wurden. Der hierin verwendete Begriff „Web-Nachrichten” bezieht sich auf diejenigen Inhalte, welche Universalität und Relativität aufweisen und über Netzwerke geliefert werden. Die so genannte „Universalität” bedeutet, dass diese Web-Nachrichten eine große Vielfalt von Inhalten aufweisen, was verschiedene Ereignisse, menschlichen Geist usw. mit einbezieht, die in der realen Welt aufgetreten sind und durch Benutzer über das Internet jederzeit mittels verschiedener Einheiten wie beispielsweise Mobilendgeräte oder feste Endgeräte eingestellt (posted) werden. Web-Nachrichten beinhalten Texte, Dokumente, Symbole, Fotos, Audios, Videos usw. Die so genannte „Relativität” bedeutet, dass die Inhalte von Web-Nachrichten einen Bezug zu Ereignissen aufweisen können, die interessant sind. Zum Beispiel können Web-Nachrichten mit derartigen Einstellzeiten, dass die Differenzen zwischen ihnen und dem Zeitpunkt des Auftretens eines betreffenden Ereignisses innerhalb eines zuvor festgelegten Zeitbereichs liegt, sowie alles über ähnliche Ereignisse als eine Relativität zu dem betreffenden Ereignis aufweisend angesehen werden. Des Weiteren handelt es sich im Hinblick auf die vorliegende Erfindung bei Web-Nachrichten um diejenigen Web-Nachrichten, die bereitgestellte Adressinformationen aufweisen, wenn sie durch Benutzer geliefert werden.
  • Das Microblog stellt ein typisches Beispiel für Web-Nachrichten dar. Microblogs sind kurz gefasste Texte (üblicherweise weniger als 140 Wörter), die Benutzern ein zeitnahes Aktualisieren und öffentliches Verbreiten in Form eines Blogs ermöglichen. Zu verbreiteten Microblog-Diensten zählen zum Beispiel Twitter, Yahoo, Sina, Sohu, 163 usw.
  • Microblog-Dienste florieren in jüngster Zeit und haben enorme Benutzerzahlen angezogen. Laut Statistiken besitzt Twitter als eine stellvertretende Microblog-Seite im April 2010 nun mehr als eine Million registrierter Benutzer, und es gibt nach wie vor 300.000 neue Benutzer pro Tag. Im Durchschnitt werden jeden Tag 55 Millionen Tweets mit fast allumfassendem Inhalt eingestellt. Unter all den Tweets werden mehr als 37 Prozent über Mobileinheiten eingestellt. Daher können für diese Tweets die Standorte, an denen sie tatsächlich eingestellt werden, festgestellt werden.
  • Aufgrund der vorherrschenden Verwendung (in anderen Worten mit Relativität und Universalität) und den Standorte berücksichtigenden Eigenschaften von Web-Nachrichten sind die Erfinder der Möglichkeit nachgegangen, die Semantik von Sensordaten bei Web-Nachrichten anzureichern. Genauer löst die vorliegende Erfindung die Probleme nach dem Stand der Technik durch ein Erkennen der Beziehung zwischen Web-Nachrichten und Sensoren und ein anschließendes Zuweisen mindestens eines Teils der Inhalte zugehöriger Web-Nachrichten als Kennzeichen, um die Semantik von Sensordaten zum Überbrücken der großen Lücke zwischen dem Verständnis des Menschen und von den Dingen erworbenen Originaldaten hinzuzufügen. Des Weiteren können diese Semantikkennzeichen verwendet werden, um Funktionen der Sensordatensuche und des Sensor-Data-Mining sowie andere Anwendungen von Originaldaten zu unterstützen.
  • Ausführungsformen der vorliegenden Erfindung können auf viele Arten einschließlich eines Verfahrens und eines Systems ausgebildet werden. Verschiedene Ausführungsformen der vorliegenden Erfindung werden nachstehend erläutert.
  • Als ein Verfahren zum Kennzeichnen von durch Dinge im Internet der Dinge (IoT) erzeugten Originaldaten weist eine Ausführungsform der vorliegenden Erfindung mindestens auf: Durchführen einer Relativitätserkennung an erworbenen Web-Nachrichten, um Web-Nachrichten zu erhalten, die einen Bezug zu verschiedenen Ereignissen aufweisen; Erwerben von in den zugehörigen Web-Nachrichten enthaltenen Adressinformationen; Ermitteln benachbarter Dinge für verschiedene Ereignisse auf der Grundlage der erworbenen Adressinformationen; und Kennzeichnen von durch die ermittelten benachbarten Dinge erzeugten Originaldaten mithilfe zumindest eines Teils des Inhalts der zugehörigen Web-Nachrichten als Metadaten.
  • Als ein System zum Kennzeichnen von durch Dinge im Internet der Dinge (IoT) erzeugten Originaldaten weist eine Ausführungsform der vorliegenden Erfindung mindestens auf: ein Mittel zum Durchführen einer Relativitätserkennung an erworbenen Web-Nachrichten, um Web-Nachrichten zu erhalten, die einen Bezug zu verschiedenen Ereignissen aufweisen; ein Mittel zum Erwerben von in den zugehörigen Web-Nachrichten enthaltenen Adressinformationen; ein Mittel zum Ermitteln benachbarter Dinge für verschiedene Ereignisse auf der Grundlage der erworbenen Adressinformationen; und ein Mittel zum Kennzeichnen von durch die ermittelten benachbarten Dinge erzeugten Originaldaten mithilfe zumindest eines Teils des Inhalts der zugehörigen Web-Nachrichten als Metadaten.
  • Als ein Verfahren zum Suchen von Dingen im Internet der Dinge weist eine Ausführungsform der vorliegenden Erfindung mindestens auf: Eingeben von Abfrageelementen in natürlicher Sprache; und Erzeugen von Suchergebnissen auf der Grundlage der Metadaten von Dingen im Internet der Dinge mithilfe der Abfrageelemente; wobei die Metadaten mit dem vorstehend beschriebenen Verfahren erzeugt werden.
  • Als eine Einheit zum Suchen von Dingen im Internet der Dinge weist eine Ausführungsform der vorliegenden Erfindung mindestens auf: ein Mittel zum Eingeben von Abfrageelementen in natürlicher Sprache; und ein Mittel zum Erzeugen von Suchergebnissen auf der Grundlage der Metadaten von Dingen im Internet der Dinge mithilfe der Abfrageelemente; wobei die Metadaten mit dem vorstehend beschriebenen Verfahren erzeugt werden.
  • Als eine Suchmaschine in einem Netzwerk weist eine Ausführungsform der vorliegenden Erfindung mindestens auf: ein Modul zum Empfangen einer Benutzereingabe; das vorgenannte System; und ein Modul zum Abrufen auf der Grundlage der Benutzereingabe und der durch die Einheit erzeugten Informationen.
  • In einem weiteren Aspekt betrifft die Erfindung ein System zum Kennzeichnen von durch Dinge im Internet der Dinge (IoT) erzeugten Originaldaten, aufweisend:
    ein Mittel zum Durchführen einer Relativitätserkennung an erworbenen Web-Nachrichten, um Web-Nachrichten zu erhalten, die einen Bezug zu verschiedenen Ereignissen aufweisen;
    ein Mittel zum Erwerben von in den zugehörigen Web-Nachrichten enthaltenen Adressinformationen;
    ein Mittel zum Ermitteln benachbarter Dinge für die verschiedenen Ereignisse auf der Grundlage der erworbenen Adressinformationen; und
    ein Mittel zum Kennzeichnen der durch die ermittelten benachbarten Dinge erzeugten Originaldaten mithilfe zumindest eines Teils des Inhalts der zugehörigen Web-Nachrichten als Metadaten.
  • Gemäß einer Ausführungsform der Erfindung weist das Mittel zum Ermitteln benachbarter Dinge für die verschiedenen Ereignisse auf der Grundlage der erworbenen Adressinformationen auf:
    ein Mittel zum Erwerben von einem Benutzer zugeordneten Adressinformationen von den zugehörigen Web-Nachrichten;
    ein Mittel zum Erzeugen angepasster Kurven auf der Grundlage der erworbenen Adressinformationen durch Kurvenanpassung; und
    ein Mittel zum Ermitteln von Nachbarschaften für die Dinge auf der Grundlage der Ortsinformationen der Dinge im IoT und der angepassten Kurven.
  • Gemäß einem weiteren Aspekt der Erfindung werden die Nachbarschaften zu den interessierenden Ereignissen für die betreffenden Dinge gemäß dem Mindestwert der Distanzen zwischen den Ortsinformationen der betreffenden Dinge und den angepassten Kurven oder dem Mindestwert der maximalen Distanzen zwischen den Ortsinformationen der betreffenden Dinge und den angepassten Kurven oder dem Mindestwert der durchschnittlichen Distanzen zwischen den Ortsinformationen der betreffenden Dinge und den angepassten Kurven oder dem Mindestwert der quadrierten maximalen Distanzen zwischen den Ortsinformationen der betreffenden Dinge und den angepassten Kurven ermittelt.
  • Gemäß einer weiteren Ausführungsform der Erfindung weist das System weiterhin auf:
    ein Mittel zum Indexieren von im Netzwerk eingestellten Web-Nachrichten in Echtzeit; und
    ein Mittel zum Abrufen aller Web-Nachrichten, die einen Bezug zu interessierenden Ereignissen der verschiedenen Ereignisse aufweisen, von den indexierten Web-Nachrichten.
  • Gemäß einer weiteren Ausführungsform der Erfindung werden die Metadaten zum Kennzeichnen von durch die benachbarten Dinge erzeugten Originaldaten mithilfe der Einstellzeiten der zugehörigen Web-Nachrichten und von den interessierenden Ereignissen zugeordneten Wörtern erzeugt.
  • Gemäß einer weiteren Ausführungsform der Erfindung wird auf Abfragen in natürlicher Sprache auf der Grundlage von Metadaten reagiert.
  • Gemäß einer weiteren Ausführungsform der Erfindung weist das System weiterhin auf:
    ein Mittel zum Sortieren der betreffenden Dinge gemäß ihren Nachbarschaften.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die Zeichnungen, auf die in der vorliegenden Anmeldung Bezug genommen wird, werden nur verwendet, um typische Ausführungsformen der vorliegenden Erfindung beispielhaft zu verdeutlichen, und sind nicht als den Umfang der vorliegenden Erdfindung einschränkend anzusehen.
  • 1 zeigt eine schematische Abbildung, welche die Probleme zwischen praktischen Anwendungen nach dem Stand der Technik und von Dingen erworbenen Originaldaten darstellt;
  • 2 zeigt einen Ablaufplan, der ein Verfahren des Kennzeichnens von durch Dinge im IoT erzeugten Originaldaten gemäß einer Ausführungsform der vorliegenden Erfindung darstellt;
  • 3 zeigt eine Abbildung, die durch Kurvenanpassung auf der Grundlage der Adressinformationen von durch jeden Benutzer eingestellten Web-Nachrichten erzeugte Kurven gemäß einer Ausführungsform der vorliegenden Erfindung darstellt;
  • 4 zeigt eine Blockansicht, die ein System zum Kennzeichnen von durch Dinge im IoT erzeugten Originaldaten gemäß einer Ausführungsform der vorliegenden Erfindung darstellt;
  • 5 zeigt einen Ablaufplan, der ein Suchverarbeitungsbeispiel gemäß einer Ausführungsform der vorliegenden Erfindung darstellt;
  • 6 zeigt eine Blockansicht, die eine Suchmaschine gemäß einer Ausführungsform der vorliegenden Erfindung darstellt.
  • DETAILLIERTE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORM
  • In der folgenden Erläuterung wird eine große Menge konkreter Details bereitgestellt, um zum gründlichen Verstehen der vorliegenden Erfindung beizutragen. Für den Fachmann ist jedoch ersichtlich, dass das Verständnis der vorliegenden Erfindung auch im Falle, dass keine solchen konkreten Details vorhanden sind, nicht beeinflusst wird. Darüber hinaus ist weiterhin zu beachten, dass alle nachstehend verwendeten spezifischen Ausdrücke nur der Verständlichkeit der Beschreibung dienen und die vorliegenden Erfindung nicht darauf beschränkt sein soll, in irgendwelchen spezifischen Anwendungen verwendet zu werden, für die solche Ausdrücke stehen, oder die durch diese impliziert werden.
  • Gemäß einer Ausführungsform der vorliegenden Erfindung kann mindestens ein Problem nach dem Stand der Technik durch das Erkennen der Beziehung zwischen Web-Nachrichten und Dingen im IoT und, um die Semantik von durch die betreffenden Dinge erzeugten Originaldaten hinzuzufügen, anschließendes Zuweisen mindestens eines Teils der Inhalte zugehöriger Web-Nachrichten als Kennzeichen gelöst werden. Des Weiteren können diese Semantikkennzeichen verwendet werden, um Funktionen der Sensordatensuche und des Sensor-Data-Mining sowie andere Anwendungen von Originaldaten zu unterstützen, zum Beispiel Abfragen von Originaldaten unter Verwendung von natürlicher Sprache.
  • Es ist zu beachten, dass der hierin verwendete Begriff „Dinge” jedes beliebige von Geräten, Vorrichtungen, Einheiten oder Systemen bedeutet, die in der Lage sind, Daten zu erzeugen und diese erzeugten Daten anderen Dingen zu übermitteln. Zum Beispiel kann es sich bei den Dingen um Erfassungseinheiten wie beispielsweise Funkerkennungen (RFIDs), Leseeinheiten, Binärcodes, Kameras usw. oder um eigenständige mit RFIDs, Leseeinheiten, Binärcodes, Kameras usw. bereitgestellte Einheiten wie beispielsweise Notebook-Computer mit RFIDs, Kühlschränke mit Temperatursensoren und T-Shirts mit Binärcodes handeln.
  • 2 zeigt einen Prozess 200 des Kennzeichnens von durch Dinge im IoT erzeugten Originaldaten gemäß einer Ausführungsform der vorliegenden Erfindung.
  • Der Prozess 200 beginnt mit Schritt 202.
  • In Schritt 204 wird eine Relativitätserkennung an empfangenen Web-Nachrichten durchgeführt, um diejenigen Web-Nachrichten zu erwerben, die einen Bezug zu Ereignissen aufweisen, die interessant sind. Schritt 204 kann durch mehr als einen Filterschritt verwirklicht werden. Gemäß einer Ausführungsform der vorliegenden Erfindung kann er zwei Filterschritte aufweisen:
  • (1) inhaltsbasiertes Filtern:
  • Schritt 204 kann einen Inhaltsfilterschritt zum Filtern aller Web-Nachrichten, die zugehörige Inhalte besitzen, und zum Verwerfen anderer Nachrichten aufweisen. Da die Dinge mit Informationen zu kennzeichnen sind, die Ereignissen zugeordnet sind, die durch diese Dinge aufgezeichnet werden, kann das inhaltsbasierte Filtern darin bestehen, Elemente mit passenden Inhalten aus einer Vielzahl von Web-Nachrichten gemäß Standardoptionen (wie beispielsweise Listen häufigster Benutzerabfrageelemente, Schwerpunktereignisse, Verkehrsunfälle oder am häufigsten verwendete Schlüsselwörter usw.) herauszusuchen. Dies kann durch Techniken umgekehrter Listen auf der Grundlage eines Schlüsselwortvergleichs realisiert werden.
  • (2) zeitbasiertes Filtern:
  • Schritt 204 kann einen Zeitfilterschritt zum Filtern aller zeitrelevanten Web-Nachrichten und Verwerten anderer Nachrichten aufweisen, der zwei Schritte wie folgend aufweisen kann:
    • 2.1 einstellzeitbasiertes Filtern: das heißt, nur Web-Nachrichten mit Einstellzeiten mit einem Bezug zu den Zeitpunkten des Auftretens von Ereignissen, die interessant sind, werden beibehalten. Der Zeitfilterschritt besteht darin, aus den empfangenen Web-Nachrichten diejenigen Web-Nachrichten herauszufiltern, die Einstellzeiten innerhalb eines zuvor festgelegten Zeitbereichs ab den Zeitpunkten des Auftretens der Ereignisse besitzen, und andere Web-Nachrichten innerhalb entsprechender Zeiten zu verwerten. Wenn zum Beispiel ein interessantes Ereignis ungefähr um 8:00 Uhr morgens an einem Tag aufgetreten ist, kann der Zeitfilterschritt nur diejenigen Web-Nachrichten beibehalten, die innerhalb einer Zeitperiode von 7:30 bis 8:30 morgens an diesem Tag eingestellt wurden.
  • Ein Zeitbereich ist aufgrund der möglichen Bewegung von Benutzern vorhanden, welche die Web-Nachrichten eingestellt haben, d. h. Differenzen zwischen den Zeiten, zu denen sie das Ereignis beobachtet haben und den Zeiten, zu denen sie die Web-Nachrichten eingestellt haben; oder aus einem Grund, dass die Benutzer die Web-Nachrichten nach Ablauf einer Zeitdauer seit dem Beobachten des Ereignisses eingestellt haben; oder wegen Zeitdifferenzen aufgrund von Netzwerkstaus, instabilen Signalen von kabellosen Netzwerken usw. Der Zeitbereich kann zuvor festgelegt oder durch Benutzer/das System festgelegt werden
    • 2.2 Kürzlichkeitsfiltern: auf der Grundlage von Einstellzeitfiltern wird weiterhin Kürzlichkeitsfiltern angewandt, so dass nur diejenigen Web-Nachrichten beibehalten werden, die gegenwärtige Situationen beschreiben und innerhalb eines festgelegten Zeitintervalls eingestellt werden. Zum Beispiel kann eine nach 8:00 Uhr morgens an diesem Tag eingestellte Web-Nachricht einen Inhalt wie „XX gestern geschehen” aufweisen, wobei es sich offensichtlich nicht um eine unmittelbar eingestellte Nachricht handelt und die als Informationen außerhalb des Zeitbereichs herausgefiltert werden sollte. Andererseits sollten Nachrichten wie beispielsweise „XX gerade geschehen” als unmittelbare Informationen beibehalten werden. Der Schritt des Kürzlichkeitsfilterns kann in Verbindung mit vorhandenen Techniken zur Wortsegmentierung und -klassifizierung realisiert werden. Gemäß einem Aspekt der vorliegenden Erfindung wird eine Inhaltsfilterfunktionseinheit bereitgestellt, in der sowohl vorhandene Techniken zur Wortsegmentierung als auch -klassifizierung ausgebildet sein können. Zum Beispiel werden zuerst 2000 einzelne Web-Nachrichten ausgewählt, die künstlich in Gegenwart, Vergangenheit, Zukunft und weitere eingestuft werden können. Zuerst wird jeder Satz in jeder Web-Nachricht segmentiert. Zum, Beispiel wird eine Web-Nachricht, die nur einen einzigen Satz „
      Figure 00120001
      (Ich sehe gerade einen Film an.)” enthält, zu „
      Figure 00120002
      (Ich/sehe/gerade/einen/Film/an.)”.
  • Wird jedes segmentierte Wort als Merkmal genommen, so wird ein Klassifizierer auf der Grundlage von Algorithmen für maschinelles Lernen, zum Beispiel der Algorithmus SVM (support vector machine), der ME-Algorithmus (maximum entropy) usw., erstellt. Da diese Web-Nachrichten somit nicht der künstlichen Kennzeichnung unterliegen, können sie mittels einer durch den Klassifizierer realisierten automatischen Identifizierung als eine der Kategorien der Gegenwart, der Vergangenheit, der Zukunft oder anderen Kategorien gekennzeichnet werden. Nur Web-Nachrichten, die als die Gegenwart gekennzeichnet sind, werden beibehalten und andere Nachrichten entfernt. Es ist zu beachten, dass die vorliegende Erfindung nicht auf den vorstehend beschriebenen Prozess beschränkt ist und durch den Fachmann andere Techniken zur Segmentierung und Klassifizierung abhängig von deren tatsächlichen Anforderungen verwendet werden können.
  • Obwohl jeder Filterschritt vorstehend in einer bestimmten Reihenfolge veranschaulicht und beschrieben ist, sollte für den Fachmann ersichtlich sein, dass die vorliegende Erfindung nicht auf diese bestimmte Reihenfolge beschränkt ist und das inhaltsbasierte und das zeitbasierte Filtern nach Bedarf in jeder beliebigen Abfolge realisiert werden können.
  • In Schritt 206 wird eine Adressinformationserkennung durchgeführt, um Adressinformationen von denjenigen Web-Nachrichten zu erwerben, die solche Adressinformationen beinhalten, und andere Web-Nachrichten zu verwerfen, die keine enthaltenen Adressinformationen aufweisen.
  • Es ist zu beachten, dass nicht alle Web-Nachrichten Adressinformationen enthalten müssen und es eine Option für Web-Nachrichten einstellende Benutzer darstellt, ob ihre aktuellen Adressinformationen enthalten sein sollen. Wenn durch einen Benutzer das Offenlegen seiner/ihrer Adressinformationen ausgewählt ist, weisen die eingestellten Web-Nachrichten Adressinformationen auf, andernfalls sind keine Adressinformationen enthalten.
  • Adressinformationen liegen allgemein in der Form von GPS-Adressdaten vor, jedoch können Adressinformationen innerhalb von Web-Nachrichten bei Diensten Dritter in der Form von wörtlicher Beschreibung, wie beispielsweise „
    Figure 00130001
    (Kreuzung zwischen XX-Straße und YY-Straße)”, vorliegen. Adressinformationen innerhalb von durch Benutzer eingestellten Nachrichten können mittels durch Web-Browser bereitgestellten APIs erworben werden. Im Falle von wörtlich beschriebenen Adressinformationen, die erworben wurden, ist es gemäß einer Ausführungsform der vorliegenden Erdfindung notwendig, die wörtliche Beschreibung in GPS-Adressdaten umzuwandeln, was mittels Umwandlungswerkzeugen nach dem Stand der Technik realisiert werden kann und hierin nicht im Detail beschrieben wird.
  • Gemäß einer anderen Ausführungsform der vorliegenden Erfindung können Adressinformationen von den Inhalten aus Web-Nachrichten entnommen und dann in GPS-Adressdaten umgewandelt werden. Zum Beispiel kann bei einer gegebenen Web-Nachricht „
    Figure 00130002
    (es herrscht ein Verkehrsstau an der Kreuzung der Chongwenmen-Straße und der Changan-Straße. Die Fahrzeuge bewegen sich langsam.)” die Adressinformation „
    Figure 00140001
    (Kreuzung der Chongwenmen-Straße und der Changan-Straße)” aus der Nachricht entnommen werden. Die Adressinformationen können in Verbindung mit verfügbaren Karteninformationen in GPS-Adressdaten umgewandelt werden.
  • In Schritt 208 werden auf der Grundlage der erworbenen Adressinformationen von den Web-Nachrichten Dinge im IoT erkannt, die den interessierenden Ereignissen benachbart sind.
  • Für den Fachmann ist der Besitz jedes Dings im IoT (wie beispielsweise GPS-Adressdaten) bekannt, und diejenigen Dinge, die einen Bezug zu den interessierenden Ereignissen aufweisen, können aus den Adressinformationen der Web-Nachrichten und den bekannten Positionsinformationen von Dingen ermittelt werden. Zum Beispiel kann ein Ding mit einer linearen Mindestdistanz zu einem interessierenden Ereignis als ein benachbartes Ding ermittelt werden.
  • Wie vorstehend beschrieben, ist es jedoch aufgrund der Mobilität der Benutzer möglich, dass ein Benutzer eine Web-Nachricht nach Ablauf einer Zeitdauer seit Beobachten eines Ereignisses einstellt, wenn sich seine Position verändert hat. Somit kann eine Abweichung zwischen dem Ort, an dem ein Benutzer eine Web-Nachricht eingestellt hat, und dem Ort, an dem das interessierende Ereignis auftrat, vorhanden sein. Als Folge kann es schwierig sein, nur anhand der Adressinformationen einer oder weniger Web-Nachrichten und den Ortsinformationen bereits bekannter Dinge diejenigen Dinge zu ermitteln, die relativ höhere Nachbarschaften zu den interessierenden Ereignissen aufweisen.
  • Gemäß einer Ausführungsform der vorliegenden Erfindung wird vorgeschlagen, die vorhandene Kurvenanpasstechnik zu verwenden, um aus einer großen Anzahl von Dingen im IoT diejenigen Dinge zu ermitteln, die relativ höhere Nachbarschaften zu den interessierenden Ereignissen aufweisen.
  • Gemäß einer Ausführungsform der vorliegenden Erfindung kann der Schritt der Nachbarschaftserkennung die folgenden Operationen aufweisen:
    in einem ersten Schritt: aus den erworbenen Web-Nachrichten Entnehmen von Adressinformationen, die in denjenigen Web-Nachrichten enthalten sind, die durch denselben Benutzer eingestellt wurden. Unter der Annahme, dass zum Beispiel insgesamt 100 Benutzer die zugehörigen Nachrichten eingestellt haben, werden Adressinformationen aus denjenigen Web-Nachrichten entnommen, die in den letzten 6 Stunden durch ein und denselben Benutzer eingestellt wurden.
    in einem zweiten Schritt: Durchführen einer Kurvenanpassung mit den Adressinformationen, die in den durch den Benutzer eingestellten Web-Nachrichten enthalten sind, um seine Positionskurve zu erwerben.
  • 3 zeigt gemäß einer Ausführungsform der vorliegenden Erfindung eine Abbildung, welche die Kurven darstellt, die unter Verwendung einer Kurvenanpassung mit den in durch jeden Benutzer eingestellten Web-Nachrichten enthaltenen Adressinformationen erhalten wurden. Wie in 3 gezeigt, geben leere Kreise die Adressinformationen jeder einzelnen Web-Nachricht an, und jede Kurve wird auf der Grundlage der Adressinformationen der durch denselben Benutzer eingestellten Web-Nachrichten angepasst. In 3 sind Dinge im IoT durch ausgefüllte Kreise dargestellt. Obwohl in 3 nur ein Ding gezeigt wird, ist die vorliegende Erfindung nicht darauf beschränkt, und wie zuvor erwähnt kann die Anzahl von Dingen viel größer als die gezeigte sein und durch den Fachmann nach Bedarf festgelegt werden.
    in einem dritten Schritt: auf der Grundlage der Distanzbeziehung zwischen den Positionsdaten von Dingen und jeder Kurve Ermitteln eines benachbarten Dings.
  • Die folgende Formel kann verwendet werden, um die Distanzbeziehung zwischen den Positionsdaten von Dingen und entsprechenden Kurven zu ermitteln:
    gegeben sei jedes mit x1, x2, ... xm bezeichnete Ding und jede mit D1, D2, ... DN bezeichnete Kurve, arg mini(maxj(dis tan ce(xi, Dj))) wobei die distance(xi, Dj) die kürzeste Distanz vom i-ten Ding zur j-ten angepassten Kurve angibt, wobei i das i-te Ding bezeichnet und eine ganze Zahl zwischen 1 und M ist, es sich bei M um die Gesamtanzahl benachbarter Dinge handelt, die auf der Grundlage von Benutzeranforderungen ausgewählt wurden; j die j-te angepasste Kurve bezeichnet und eine ganze Zahl zwischen 1 und N ist, es sich bei N um die Gesamtanzahl von durch Kurvenanpassung erhaltenen Kurven handelt; Max eine Funktion bezeichnet, die einen Maximalwert ausgibt, Min eine Funktion bezeichnet, die einen Minimalwert ausgibt.
  • Mit der vorstehenden Formel wird die größte der Distanzen zwischen einem Ding und jeder Kurve als eine charakteristische Distanz für dieses Ding ausgewählt, und dann wird ein Ding mit der minimalen charakteristischen Distanz von all den Dingen als das am nächsten liegende Ding für das interessierende Ereignis ausgewählt. Des Weiteren können entsprechende Dinge in einer aufsteigenden Reihenfolge der charakteristischen Distanzen sortiert werden, um die Nachbarschaften zum interessierenden Ereignis für jedes Ding anzugeben.
  • Wird zum Beispiel 3 erneut als Beispiel genommen, sind als Ergebnis der Kurvenanpassung zwei Kurven 1 und 2 auf der Grundlage der Adressinformationen von Benutzer A und eine Kurve 3 auf der Grundlage der Adressinformationen von Benutzer B angepasst. Es wird angenommen, dass mehr als ein Ding vorhanden ist und die größte der Distanzen zwischen jedem Ding und den drei Kurven jeweils 5, 3, 5, 6, 9, 8, ... beträgt. Dann wird wie in 3 gezeigt ein Ding mit einem Minimum von 3 dieser größten Distanzen als das am nächsten liegende Ding ausgewählt.
  • Der vorteilhafteste Aspekt eines derartigen Verfahrens liegt darin, dass arg mini(maxj(dis tan ce(xi, Dj))) einfach ist und nach dem Stand der Technik bei vielen Realisierungen standardisiert wurde, die leicht verfügbar sind.
  • Es ist unnötig zu sagen, dass die vorliegende Erfindung nicht darauf beschränkt ist und durch den Fachmann bei Bedarf andere Distanzformeln verwendet werden können. Zum Beispiel kann eine kleinste durchschnittliche Distanz verwendet werden, wobei der Durchschnittswert der Distanzen zwischen einem Ding und entsprechenden Kurven als die charakteristische Distanz angesehen wird und ein Ding mit der kürzesten charakteristischen Distanz als das am nächsten liegende Ding ausgewählt wird. Der kleinste quadratische Wert maximaler Distanzen kann ebenfalls verwendet werden, wobei das Quadrat einer maximalen Distanz unter den Distanzen zu entsprechenden Kurven als eine charakteristische Distanz für jedes Ding ausgewählt wird und ein Ding mit der minimalen charakteristischen Distanz als das am nächsten liegende Ding angesehen wird.
  • In Schritt 210 werden Daten der ermittelten benachbarten Dinge mit zumindest einem Teil der Web-Nachrichten gekennzeichnet.
  • Zum Beispiel können unter der Voraussetzung, dass ein Benutzer am 23. September 2011 um 7:56 Uhr eine Web-Nachricht „
    Figure 00170001
    !(eine Heckkollision mit vier Autos, so schlimm!)” einstellt und eine am westlichen Ende der Xinjiekou-Straße montierte Kamera die am nächsten liegende Kamera ist, das Wort „
    Figure 00170002
    (Heckkollision)” und die Zeit „23.9.2011” in der Web-Nachricht als Metadaten verwendet werden, um eine von der am westlichen Ende der Xinjiekou-Straße montierten Kamera erhaltene Originaldatendatei „vsd.vso” zu kennzeichnen.
  • Des Weiteren kann zum Beispiel jede benachbarte Kamera sortiert werden, um eine Webseite zu erzeugen, die den folgenden Inhalt enthält: Heckkollision
    23.9.2011 7:56 westliches Ende der Xinjiekou-Straße vsd.vso
    östliches Ende der Xinjiekouxijie-Straße vsf.vso
    westliches Ende der Xinjiekouxijie-Straße vsf.vso
  • Benutzer können auf entsprechende Videodateien klicken, um sie anzusehen. Zudem können Daten durch eine Abfrage in natürlicher Sprache wie „Heckkollision” oder „23.9.2011” usw. abgerufen werden.
  • In Schritt 212 endet der Prozess 200.
  • Wie vorstehend beschrieben, wachsen Web-Nachrichten-Daten in exponentieller Größenordnung. Für jede Realisierung des Prozesses 200 wird Zeit benötigt, und es fallen relativ hohe Datenverarbeitungskosten an, wenn von Schritt 204 alle Web-Nachrichten im Netzwerk verarbeitet werden.
  • Gemäß einer Ausführungsform der vorliegenden Erfindung kann ein Vorbehandlungsschritt zwischen Schritt 202 und Schritt 204 eingefügt werden, in dem alle im Netzwerk eingestellte Web-Nachrichten in Echtzeit mit vorhandenen Indexier-Techniken indexiert werden können, und dann in Schritt 204 auf der Grundlage des Indexes diejenigen Web-Nachrichten entnommen werden, die Inhalte mit Bezug zum interessierenden Ereignis aufweisen.
  • Zum Beispiel kann jede Web-Nachricht einer Echtzeit-Wortsegmentierung mit Wortsegmentierungstechniken unterzogen werden, und es wird ermittelt, ob gemäß einer zuvor eingerichteten Schlüsselwort-Datenbank mindestens ein Schlüsselwort in der Web-Nachricht vorhanden ist, und dann wird durch Verknüpfen der Web-Nachricht, in der ein bestimmtes Schlüsselwort vorhanden ist, mit dem Schlüsselwort in der Schlüsselwortdatenbank ein Index erstellt.
  • Unter erneuter Verwendung der Web-Nachricht „Heckkollision von Autos” als ein Beispiel wird die Nachricht in „Heckkollision/von/Autos” wortsegmentiert. Unter Verwendung von „Auto” und „Heckkollision” als Indexwörter wird eine umgekehrte Liste erstellt, durch welche die Web-Nachricht durch Suchen von „Auto” oder „Heckkollision” abgerufen werden kann.
  • Dann werden in Schritt 204 rasch Web-Nachrichten mit Bezug zu den Schlüsselwörtern für einen weiteren Prozess mithilfe der Verknüpfungen entnommen.
  • Obwohl des Weiteren in 2 jeder Schritt mit einer Pfeillinie gekennzeichnet ist, ist die vorliegende Erfindung nicht darauf beschränkt, und jeder Schritt in 2 kann in anderen Abfolgen ausgeführt werden. Zum Beispiel können die Schritte 204 und 206 in einer umgekehrten Abfolge ausgeführt werden.
  • 4 zeigt ein Blockschaubild, das ein System 400 zum Kennzeichnen von durch Dinge im IoT erzeugten Originaldaten gemäß einer Ausführungsform der vorliegenden Erfindung darstellt.
  • Gemäß einer Ausführungsform der vorliegenden Erfindung weist das System 400 eine Web-Nachrichten-Suchmaschine 401, einen Relativitätserkenner 407, einen Adressinformationserkenner 409, einen Nachbarschaftserkenner 409 und einen Kennzeichner 413 auf. Der Relativitätserkenner 407 weist einen Inhaltsfilter 403 und einen Zeitfilter 405 auf.
  • Die Web-Nachrichten-Suchmaschine 401 ist optional und in der Realisierung der vorliegenden Erfindung nicht unbedingt erforderlich. Die Web-Nachrichten-Suchmaschine 401 wird dazu verwendet, sämtliche der im Netzwerk eingestellten Web-Nachrichten in Echtzeit zu indexieren.
  • Der Relativitätserkenner 407 wird dazu verwendet, diejenigen Web-Nachrichten zu erkennen, die einen Bezug zu verschiedenen Ereignissen aufweisen. Der Inhaltsfilter 403 wird dazu verwendet, diejenigen Web-Nachrichten zu filtern, die Inhalte mit einem Bezug zu verschiedenen Ereignissen aufweisen. Der Zeitfilter 405 wird dazu verwendet, diejenigen Web-Nachrichten zu filtern, die zu einer Zeit innerhalb eines festgelegten Zeitbereichs ab den Zeitpunkten des Auftretens der verschiedenen Ereignisse eingestellt wurden, und führt das Kürzlichkeitsfiltern durch, um diejenigen Web-Nachrichten zu erwerben, die vor kurzem stattgefundene Situationen beschreiben und innerhalb des festgelegten Zeitbereichs eingestellt wurden. Andere Nachrichten werden verworfen.
  • Der Adressinformationserkenner 409 empfängt die zugehörigen Web-Nachrichten vom Relativitätserkenner 407 und entnimmt dann in diesen Web-Nachrichten enthaltene Adressinformationen. Die Adressinformationen können aus diesen Web-Nachrichten durch APIs entnommen oder aus den Inhalten der Web-Nachrichten gefiltert werden. Die Adressinformationen können das Format von GPS-Daten oder Textdaten besitzen. Der Adressinformationserkenner 409 kann einen Umwandler (nicht gezeigt) zum Umwandeln der Adressinformationen von zum Beispiel Text- in GPS-Daten aufweisen.
  • Der Nachbarschaftserkenner 411 wird dazu verwendet, auf der Grundlage der Adressinformationen vom Adressinformationserkenner 409 diejenigen Dinge zu ermitteln, die den aufgetretenen Ereignissen am nächsten liegen. Eine spezifische Realisierung wurde vorstehend beschrieben und wird hierin nicht wiederholt.
  • Der Kennzeichner 413 wird dazu verwendet, die auf der Grundlage der entsprechenden Web-Nachrichten ermittelten Originaldaten zu kennzeichnen.
  • Gemäß einer Ausführungsform der vorliegenden Erfindung können gekennzeichnete Ergebnisse in der Form von Webseiten, Dokumenten, Text usw. für einen weiteren Prozess eingestellt werden. Zum Beispiel können die gekennzeichneten Ergebnisse durch eine Suchmaschine für ihre Suche verwendet werden, um Benutzern, die in natürlicher Sprache abfragen, rasch zugeordnete Abfrageergebnisse bereitzustellen.
  • 5 zeigt einen Ablaufplan, der einen beispielhaften Suchprozess gemäß einer Ausführungsform der vorliegenden Erfindung darstellt. 5 zeigt eine Abfrageanwendung der vorliegenden Erfindung.
  • Wie in 5 gezeigt, kann ein Benutzer mit „
    Figure 00200001
    (Heckkollision)” eine Abfrage nach aufgetretenen Heckkollisionsunfällen durchführen. Der Inhaltsfilter 403 findet mit dem Schlüsselwort „
    Figure 00200002
    (Heckkollision)” verknüpfte Webseiten heraus und stellt Webseiten bereit, die Inhalte mit einem Bezug zu den Abfragebedingungen des Benutzers aufweisen. Der Zeitfilter 405 filtert alle Web-Nachrichten außerhalb des festgelegten Zeitbereichs heraus und verarbeitet die verbleibenden Web-Nachrichten. Der Zeitfilter 405 führt weiterhin ein Kürzlichkeitsfiltern auf der Grundlage der Inhalte der Web-Nachrichten durch, um diejenigen Web-Nachrichten herauszufiltern, die keinen Bezug zu aktuellen Ereignissen aufweisen. Benötigt zum Beispiel ein Benutzer Inhalte bezüglich denjenigen Heckkollisionen, die heute aufgetreten sind, sind folglich Web-Nachrichten, die „Heckkollision ... gestern” oder „Heckkollision ... vor langer Zeit” enthalten, nicht betroffen und werden entfernt.
  • Der Adressinformationserkenner 409 erwirbt aus den verbleibenden Web-Nachrichten die darin enthaltenen Adressinformationen. Wie vorstehend beschrieben, sind die Positionsinformationen von Dingen im IoT bekannt und im Voraus in einer Datenbank gespeichert. Der Nachbarschaftserkenner 411 erkennt diejenigen Dinge, die einen Bezug zu den interessierenden Ereignissen aufweisen. Der Kennzeichner 413 kennzeichnet jedes Ding mit mindestens einem Teil der Web-Nachrichten, um die Semantik von durch betreffende Dinge erhaltenen Originaldaten anzugeben. Mit den vorstehend beschriebenen Kennzeichnungen können Abfragen in natürlicher Sprache Originaldaten zugeordnet werden, um Benutzern etwas in der Art von „ausgegebene Abfrageergebnisse: Kameras, die eine „Heckkollision” beobachten oder beobachtet haben, Benutzer können eine Verbindung mit diesen Kameras herstellen und deren Daten durchsuchen” bereitzustellen.
  • Es ist unnötig zu sagen, dass Benutzer auf der Grundlage dieser Kennzeichnungen Data-Mining nach Zuordnungen von Originaldaten durchführen können. Zum Beispiel ist es möglich, alle Kameras herauszufinden, die einen Bezug zu einer Heckkollision aufweisen, um Daten in Verbindung mit dem Prozess des Auftretens des Heckkollisionsunfalls zu erwerben.
  • 6 zeigt ein Blockschaubild einer Suchmaschine gemäß einer Ausführungsform der vorliegenden Erfindung. 6 zeigt ein spezifisches Beispiel einer Realisierung der vorliegenden Erfindung.
  • Wie in 6 gezeigt, weist die Suchmaschine das in 4 veranschaulichte System 400 auf. Des Weiteren weist die Suchmaschine ein Modul 601 zum Empfangen einer Benutzereingabe und ein Modul 602 zum Abrufen auf der Grundlage der Benutzereingabe und den durch das System 400 erzeugten Informationen auf. Dann werden den abfragenden Benutzern abgerufene Ergebnisse ausgegeben.
  • Das grundlegende Konzept der vorliegenden Erfindung wurde vorstehend beschrieben, für den Fachmann kann ersichtlich sein, dass die vorliegende Erfindung einen oder mehrere der folgenden Vorteile bietet:
    um ein verständliches IoT mit der Verbindung von Web-Nachrichten und dem IoT bereitzustellen
    • – Zuweisen von Web-Nachrichten zu zugehörigen „Dingen”;
    • – Anreichern der Beobachtung von Dingen mit Metadaten;
    • – Verwenden natürlicher Sprache, im Gegensatz zu quantitativen Daten, Bildern, Videos usw.;
    • – Übermitteln gefühlsmäßiger Ansichten im Gegensatz zu Daten; und
    • – Widerspiegeln unterschiedlicher Gesichtspunkte unterschiedlicher Personen.
  • Um „Dinge” mit Web-Nachrichten anzureichern
    • – Erkennen von Beziehungen zwischen unmittelbaren Microblog-Einstellungen und „Dingen”;
    • – Zuweisen von Einstellungen zu „Dingen” als Kennzeichnungen;
    • – Unterstützen von Such- und Mining-Funktionen an Dingen;
    • – Benutzer, die in der Lage sind, in natürlicher Sprache zu suchen; und
    • – Abrufen zugehöriger Microblog-Einstellungen, die einen Bezug aufweisen.
  • Wie für den Fachmann ersichtlich ist, können Aspekte der vorliegenden Erfindung als System, Verfahren, oder Computerprogrammprodukt ausgebildet werden. Dementsprechend können Aspekte der vorliegenden Erfindung in Form einer vollständigen Hardware-Ausführungsform, einer vollständigen Software-Ausführungsform (darunter Firmware, residente Software, Mikrocode usw.) oder in einer Ausführungsform ausgebildet werden, die Software- und Hardware-Aspekte kombiniert, was hierin sämtlich allgemein als „Schaltung”, „Modul” oder „System” bezeichnet sein kann. Weiterhin können Aspekte der vorliegenden Erfindung in Form eines Computerprogrammprodukts ausgebildet werden, das in einem oder mehreren computerlesbaren Medien mit darauf befindlichem computerlesbarem Programmcode enthalten sein kann.
  • Jede beliebige Kombination aus einem oder mehreren von Computern verwendbaren oder computerlesbaren Medien kann verwendet werden. Bei dem durch Computer verwendbaren oder computerlesbaren Medium kann es sich um ein computerlesbares Signalmedium oder ein computerlesbares Speichermedium handeln. Bei einem computerlesbaren Speichermedium kann es sich zum Beispiel, ohne darauf beschränkt zu sein, um ein System, eine Vorrichtung oder eine Einheit oder ein Transportmedium elektronischer, magnetischer, optischer, elektromagnetischer, Infrarot oder Halbleiter verwendender Art handeln.
  • Aspekte der vorliegenden Erfindung werden nachfolgend unter Bezugnahme auf Abbildungen von Ablaufplänen und/oder Blockschaubildern von Verfahren, Vorrichtungen (Systemen) und Computerprogrammprodukten gemäß Ausführungsformen der Erfindung beschrieben. Es versteht sich, dass jeder Block der Abbildungen von Ablaufplänen und/oder der Blockschaubilder sowie Kombinationen von Blöcken in den Abbildungen von Ablaufplänen und/oder den Blockschaubildern durch Computerprogrammanweisungen realisiert werden kann. Diese Computerprogrammanweisungen können einem Prozessor eines universellen Computers, eines zweckbestimmten Computers oder einer anderen programmierbaren Datenverarbeitungsvorrichtung bereitgestellt werden, um eine Maschine so zu erzeugen, dass die Anweisungen, die über den Prozessor des Computers oder der anderen programmierbaren Datenverarbeitungsvorrichtung ausgeführt werden, ein Mittel zum Realisieren der im Block oder in den Blöcken des Ablaufplans und/oder Blockschaubildes angegebenen Funktionen/Handlungen erzeugen.
  • Der Ablaufplan und die Blockschaubilder in den Figuren veranschaulichen die Architektur, Funktionalität und die Arbeitsweise möglicher Realisierungen von Systemen, Verfahren und Computerprogrammprodukten gemäß vielfältigen Ausführungsformen der vorliegenden Erfindung. Auf diese Weise kann jeder Block im Ablaufplan oder den Blockschaubildern für ein Modul, ein Segment oder einen Codeabschnitt stehen, der eine oder mehrere ausführbare Anweisungen zum Realisieren der angegebenen logischen Funktion oder Funktionen aufweist. Es soll zudem angemerkt werden, dass bei einigen alternativen Realisierungen die im Block angegebenen Funktionen in anderer Reihenfolge als der in den Figuren angegebenen auftreten können. Zum Beispiel können zwei aufeinander folgend abgebildete Blöcke tatsächlich im Wesentlichen gleichzeitig ausgeführt werden, oder die Blöcke können manchmal abhängig von der betreffenden Funktionalität in umgekehrter Reihenfolge ausgeführt werden.
  • Die entsprechenden Strukturen, Materialien, Handlungen und Entsprechungen aller Mittel oder Schritte sowie Funktionselemente in den Ansprüchen sollen alle Strukturen, Materialien oder Handlungen zum Durchführen der Funktion in Kombination mit anderen beanspruchten Elementen, wie sie im Einzelnen beansprucht sind, einschließen. Die Beschreibung der vorliegenden Erfindung wurde zum Zwecke der Veranschaulichung und Beschreibung vorgelegt, ist jedoch nicht als erschöpfend oder auf die Erfindung in der offenbarten Form beschränkt aufzufassen. Viele Änderungen und Variationen sind für den Fachmann naheliegend, ohne vom Umfang und Geist der Erfindung abzuweichen. Die Ausführungsform wurde gewählt, um die Grundgedanken der Erfindung und die praktische Anwendung am besten zu beschreiben und den Fachleuten das Verständnis der Erfindung für vielfältige Ausführungsformen mit vielfältigen Änderungen wie sie für den speziellen besonderen Gebrauch geeignet sind zu ermöglichen.

Claims (15)

  1. Verfahren zum Kennzeichen von durch Dinge im Internet der Dinge (IoT) erzeugten Originaldaten, aufweisend: Durchführen einer Relativitätserkennung an erworbenen Web-Nachrichten, um Web-Nachrichten zu erhalten, die einen Bezug zu verschiedenen Ereignissen aufweisen; Erwerben von in den zugehörigen Web-Nachrichten enthaltenen Adressinformationen; Ermitteln benachbarter Dinge für die verschiedenen Ereignisse auf der Grundlage der erworbenen Adressinformationen; und Kennzeichnen der durch die ermittelten benachbarten Dinge erzeugten Originaldaten mithilfe zumindest eines Teils des Inhalts der zugehörigen Web-Nachrichten als Metadaten.
  2. Verfahren nach Anspruch 1, wobei der Schritt des Ermittelns benachbarter Dinge für die verschiedenen Ereignisse auf der Grundlage der erworbenen Adressinformationen aufweist: Erwerben von einem Benutzer zugeordneten Adressinformationen von den zugehörigen Web-Nachrichten; Erzeugen angepasster Kurven auf der Grundlage der erworbenen Adressinformationen durch Kurvenanpassung; und Ermitteln von Nachbarschaften für die Dinge auf der Grundlage der Ortsinformationen der Dinge im IoT und der angepassten Kurven.
  3. Verfahren nach Anspruch 2, wobei die Nachbarschaften zu den interessierenden Ereignissen für die betreffenden Dinge gemäß dem Mindestwert der Distanzen zwischen den Ortsinformationen der betreffenden Dinge und den angepassten Kurven oder dem Mindestwert der maximalen Distanzen zwischen den Ortsinformationen der betreffenden Dinge und den angepassten Kurven oder dem Mindestwert der durchschnittlichen Distanzen zwischen den Ortsinformationen der betreffenden Dinge und den angepassten Kurven oder dem Mindestwert der quadrierten maximalen Distanzen zwischen den Ortsinformationen der betreffenden Dinge und den angepassten Kurven ermittelt werden.
  4. Verfahren nach einem der Ansprüche 1 bis 3, weiterhin aufweisend: Indexieren von im Netzwerk eingestellten Web-Nachrichten in Echtzeit; und Abrufen aller Web-Nachrichten, die einen Bezug zu interessierenden Ereignissen der verschiedenen Ereignisse aufweisen, von den indexierten Web-Nachrichten.
  5. Verfahren nach einem der Ansprüche 1 bis 4, wobei die Metadaten zum Kennzeichnen von durch die benachbarten Dinge erzeugten Originaldaten mithilfe der Einstellzeiten der zugehörigen Web-Nachrichten und von den interessierenden Ereignissen zugeordneten Wörtern erzeugt werden.
  6. Verfahren nach Anspruch 5, wobei auf Abfragen in natürlicher Sprache eine Reaktion auf der Grundlage der Metadaten erfolgt.
  7. Verfahren nach einem der Ansprüche 2 bis 6, weiterhin aufweisend: Sortieren der betreffenden Dinge gemäß ihren Nachbarschaften.
  8. System zum Kennzeichen von durch Dinge im Internet der Dinge (IoT) erzeugten Originaldaten, aufweisend: ein Mittel zum Durchführen einer Relativitätserkennung an erworbenen Web-Nachrichten, um Web-Nachrichten zu erhalten, die einen Bezug zu verschiedenen Ereignissen aufweisen; ein Mittel zum Erwerben von in den zugehörigen Web-Nachrichten enthaltenen Adressinformationen; ein Mittel zum Ermitteln benachbarter Dinge für die verschiedenen Ereignisse auf der Grundlage der erworbenen Adressinformationen; und ein Mittel zum Kennzeichnen der durch die ermittelten benachbarten Dinge erzeugten Originaldaten mithilfe zumindest eines Teils des Inhalts der zugehörigen Web-Nachrichten als Metadaten.
  9. System nach Anspruch 8, wobei das Mittel zum Ermitteln benachbarter Dinge für die verschiedenen Ereignisse auf der Grundlage der erworbenen Adressinformationen aufweist: ein Mittel zum Erwerben von einem Benutzer zugeordneten Adressinformationen von den zugehörigen Web-Nachrichten; ein Mittel zum Erzeugen angepasster Kurven auf der Grundlage der erworbenen Adressinformationen durch Kurvenanpassung; und ein Mittel zum Ermitteln von Nachbarschaften für die Dinge auf der Grundlage der Ortsinformationen der Dinge im IoT und der angepassten Kurven.
  10. System nach Anspruch 9, wobei die Nachbarschaften zu den interessierenden Ereignissen für die betreffenden Dinge gemäß dem Mindestwert der Distanzen zwischen den Ortsinformationen der betreffenden Dinge und den angepassten Kurven oder dem Mindestwert der maximalen Distanzen zwischen den Ortsinformationen der betreffenden Dinge und den angepassten Kurven oder dem Mindestwert der durchschnittlichen Distanzen zwischen den Ortsinformationen der betreffenden Dinge und den angepassten Kurven, oder dem Mindestwert der quadrierten maximalen Distanzen zwischen den Ortsinformationen der betreffenden Dinge und den angepassten Kurven ermittelt werden.
  11. System nach einem der Ansprüche 8 bis 10, weiterhin aufweisend: ein Mittel zum Indexieren von im Netzwerk eingestellten Web-Nachrichten in Echtzeit; und ein Mittel zum Abrufen aller Web-Nachrichten, die einen Bezug zu interessierenden Ereignissen der verschiedenen Ereignisse aufweisen, von den indexierten Web-Nachrichten.
  12. System nach einem der Ansprüche 8 bis 11, wobei die Metadaten zum Kennzeichnen von durch die benachbarten Dinge erzeugten Originaldaten mithilfe der Einstellzeiten der zugehörigen Web-Nachrichten und von den interessierenden Ereignissen zugeordneten Wörtern erzeugt werden.
  13. Verfahren zum Suchen nach Dingen im Internet der Dinge, aufweisend: Eingeben von Abfrageelementen in natürlicher Sprache; und Erzeugen von Suchergebnissen auf der Grundlage der Metadaten von Dingen im Internet der Dinge mittels der Abfrageelemente; wobei die Metadaten mit dem Verfahren nach einem der Ansprüche 1 bis 7 erzeugt werden.
  14. Einheit zum Suchen von Dingen im Internet der Dinge, aufweisend: ein Mittel zum Eingeben von Abfrageelementen in natürlicher Sprache; und ein Mittel zum Erzeugen von Suchergebnissen auf der Grundlage der Metadaten von Dingen im Internet der Dinge mittels der Abfrageelemente; wobei die Metadaten mit dem Verfahren nach einem der Ansprüche 8 bis 12 erzeugt werden.
  15. Suchmaschine in einem Netzwerk, aufweisend: ein Modul zum Empfangen einer Benutzereingabe; die Einheit nach einem der Ansprüche 8 bis 12; und ein Modul zum Abrufen auf der Grundlage der Benutzereingabe und durch die Einheit erzeugten Informationen.
DE102012218966.1A 2011-10-31 2012-10-18 Verfahren und System zum Kennzeichnen von durch Dinge im Internet der Dinge erzeugten Originaldaten Active DE102012218966B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2011103471559 2011-10-31
CN201110347155.9A CN103092880B (zh) 2011-10-31 标记由物联网中的物体产生的原始数据的方法及系统

Publications (2)

Publication Number Publication Date
DE102012218966A1 true DE102012218966A1 (de) 2013-05-02
DE102012218966B4 DE102012218966B4 (de) 2018-07-12

Family

ID=47359131

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102012218966.1A Active DE102012218966B4 (de) 2011-10-31 2012-10-18 Verfahren und System zum Kennzeichnen von durch Dinge im Internet der Dinge erzeugten Originaldaten

Country Status (3)

Country Link
US (1) US8983926B2 (de)
DE (1) DE102012218966B4 (de)
GB (1) GB2496268A (de)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101504182B1 (ko) * 2013-02-26 2015-03-24 주식회사 케이티 소셜 미디어 연동을 기반으로 m2m 디바이스를 제어하는 방법 및 시스템
KR101812398B1 (ko) * 2013-05-16 2017-12-26 콘비다 와이어리스, 엘엘씨 Iot 시스템들에 대한 서비스로서의 데이터 주석화
US9400943B2 (en) 2013-08-02 2016-07-26 Qualcomm Incorporated Identifying IoT devices/objects/people using out-of-band signaling/metadata in conjunction with optical images
CN103957260B (zh) * 2014-05-05 2017-12-08 哈尔滨工业大学深圳研究生院 一种基于物联网的装配式混凝土全程监控系统
US9860681B2 (en) 2015-01-06 2018-01-02 Afero, Inc. System and method for selecting a cell carrier to connect an IOT hub
US10816944B2 (en) 2015-01-06 2020-10-27 Afero, Inc. System and method for using data collected from internet-of-things (IoT) sensors to disable IoT-enabled home devices
US9933768B2 (en) 2015-01-06 2018-04-03 Afero, Inc. System and method for implementing internet of things (IOT) remote control applications
US9774497B2 (en) * 2015-01-06 2017-09-26 Afero, Inc. System and method for implementing internet of things (IOT) remote control applications
US9774507B2 (en) 2015-01-06 2017-09-26 Afero, Inc. System and method for collecting and utilizing user behavior data within an IoT system
US9729340B2 (en) 2015-01-06 2017-08-08 Afero, Inc. System and method for notifying a user of conditions associated with an internet-of-things (IoT) hub
KR101584176B1 (ko) 2015-01-22 2016-01-13 연세대학교 산학협력단 시멘틱 주소를 이용한 객체 식별 장치 및 그 방법
CN104735128A (zh) * 2015-02-02 2015-06-24 中国水利水电科学研究院 一种基于物联网的水库动库容实时监测系统
US10339135B2 (en) * 2015-11-06 2019-07-02 International Business Machines Corporation Query handling in search systems
RU2654167C2 (ru) * 2015-11-10 2018-05-16 федеральное государственное автономное образовательное учреждение высшего образования "Санкт-Петербургский политехнический университет Петра Великого" (ФГАОУ ВО "СПбПУ") Способ обнаружения скрытых взаимосвязей в Интернете Вещей
US20170154111A1 (en) * 2015-11-30 2017-06-01 International Business Machines Corporation Managing item life-cycle at home with internet of things
US20170329831A1 (en) * 2016-05-11 2017-11-16 Aclipsa Mobile Video Solutions, Llc System and method for analyzing content usage events
US10275519B2 (en) 2016-08-22 2019-04-30 International Business Machines Corporation Sensor based context augmentation of search queries
US10372767B2 (en) 2016-08-22 2019-08-06 International Business Machines Corporation Sensor based context augmentation of search queries
KR102384518B1 (ko) * 2017-08-28 2022-04-08 삼성전자 주식회사 메시지 처리 방법 및 이를 지원하는 전자 장치
KR102306542B1 (ko) * 2018-06-05 2021-09-29 삼성전자주식회사 정보 처리 방법 및 디바이스
US11379487B2 (en) 2018-08-27 2022-07-05 International Business Machines Corporation Intelligent and interactive knowledge system
KR102124355B1 (ko) * 2019-01-31 2020-06-23 (주)엘렉스정보통신 사물 인터넷 데이터 인덱싱 시스템

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6601026B2 (en) 1999-09-17 2003-07-29 Discern Communications, Inc. Information retrieval by natural language querying
JP4829290B2 (ja) 2005-03-25 2011-12-07 センサーマティック・エレクトロニクス・エルエルシー インテリジェントなカメラ選択および対象追跡
US20080153509A1 (en) * 2006-12-21 2008-06-26 Christopher Piekarski Method for locating a mobile communication device
EP2131292A1 (de) 2008-06-06 2009-12-09 NTT DoCoMo, Inc. Verfahren und Vorrichtung zum Suchen mehrerer Echtzeit-Sensoren
WO2010011747A1 (en) 2008-07-22 2010-01-28 New Jersey Institute Of Technology System and method for protecting user privacy using social inference protection techniques
US8090695B2 (en) 2008-12-05 2012-01-03 Microsoft Corporation Dynamic restoration of message object search indexes
US9443226B2 (en) 2009-01-12 2016-09-13 Sri International Electronic assistant for making predictions based on user messages
WO2011001291A2 (en) 2009-06-30 2011-01-06 France Telecom Method and apparatus for managing interpersonal communications
US20110087559A1 (en) 2009-10-09 2011-04-14 Gil Paul Compliance Assurance System
EP2520070B1 (de) 2009-12-28 2019-01-09 Telefonaktiebolaget LM Ericsson (publ) Ein sozialnetz der gegenstände
CN101833710B (zh) 2010-05-07 2012-04-25 中国科学院自动化研究所 一种基于语义的物联网物品信息跟踪和追溯方法

Also Published As

Publication number Publication date
GB2496268A (en) 2013-05-08
CN103092880A (zh) 2013-05-08
DE102012218966B4 (de) 2018-07-12
GB201218783D0 (en) 2012-12-05
US20130110806A1 (en) 2013-05-02
US8983926B2 (en) 2015-03-17

Similar Documents

Publication Publication Date Title
DE102012218966B4 (de) Verfahren und System zum Kennzeichnen von durch Dinge im Internet der Dinge erzeugten Originaldaten
EP3363005B1 (de) Verfahren zur ermittlung und bereitstellung einer auf eine vorbestimmte umgebung bezogenen, umfelddaten enthaltenden datenbank
DE102019005423A1 (de) Raum-Zeit-Speicher- bzw. Ablagenetzwerk zum Lokalisieren eines Zielobjektes in Videocontent
DE102019000675A1 (de) Nutzen eines modells auf der basis eines tiefen neuronalen netzwerks zum identifizieren von visuell ähnlichen digitalen bildern auf der basis von nutzer-ausgewählten visuellen eigenschaften
DE102017005963A1 (de) Bereitstellen von relevanten Videoszenen in Reaktion auf eine Videosuchabfrage
DE112017002821T5 (de) Verfahren, System und Computerprogrammprodukt zur interaktiven Identifizierung von gleichen Personen oder Objekten in Videoaufnahmen
DE102013205737A1 (de) System und Verfahren zum automatischen Erkennen und interaktiven Anzeigen von Informationen über Entitäten, Aktivitäten und Ereignisse aus multimodalen natürlichen Sprachquellen
DE112018005087T5 (de) Verbesserung von suchabfragen durch kontextanalyse
DE202015009255U1 (de) Automatische Bildorganisation
DE112007000053T5 (de) System und Verfahren zur intelligenten Informationsgewinnung und -verarbeitung
DE202020005789U1 (de) Ereignisdetektierung in Echtzeit auf sozialen Datenströmen
DE112013005981T5 (de) Systeme und Verfahren zur rechnergestützten Einsatzleitung, zur Videosuche und zum Tagging auf der Grundlage von Ereignisberichten
DE102018219984B3 (de) Verfahren und System zum Unterstützen eines automatisiert fahrenden Fahrzeugs
DE102010049891A1 (de) Ersatz von maschinell vorgegebenen Stichworten von Webseiten durch manuelle Eingaben
DE102007037646B4 (de) Computerspeichersystem und Verfahren zum Indizieren, Durchsuchen und zur Datenwiedergewinnung von Datenbanken
DE112017006106T5 (de) Erzeugen von, Zugreifen auf und Anzeigen von Abstammungsmetadaten
DE202017107393U1 (de) Vorhersagen eines Suchmaschinen-Einordnungssignalwerts
DE212011100098U1 (de) Präsentieren von Suchergebnissen für Galerie-Webseiten
DE112015005186T5 (de) Strukturierte Entitätsinformationsseite
CN102214227B (zh) 基于互联网层次结构存储的自动舆情监控方法
DE102021004561A1 (de) Text verfeinerndes Netzwerk
DE102014113817A1 (de) Vorrichtung und Verfahren zur Erkennung eines Objekts in Einem Bild
DE102020120953A1 (de) Digitalzwilling-überwachungssysteme und -verfahren
DE202017105891U1 (de) Knoten in einem gerichteten azyklischen Graphen
DE102019123005A1 (de) System und verfahren zur anzeige des objektbewegungsschemas

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R084 Declaration of willingness to licence
R020 Patent grant now final
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0017300000

Ipc: G06F0016000000