aksw.org Research Group dataset

http://aksw.org/Talk/BiOnText

Business Intelligence auf Text - Smart Information Management erschließt Big Data

Vortrag

23. September 2013—

Ein Treiber hinter Big Data sind Informationen im WWW, sei es im öffentlichen Internet oder in Intranets. Jedoch liegen diese natürlichsprachig vor und müssen daher für eine effiziente Weiterverarbeitung zunächst strukturiert werden, um gewissermaßen „BI auf Text“ machen und somit verwertbare Informationen ableiten zu können (siehe auch Keynote). Dies umfasst gleichermaßen klassische Web-Inhalte – wie Web-Seiten, Blogs und Foren – aber ebenso Geschäftsdokumente, Patentanmeldungen, White Papers etc. insofern sie über das Internet zugreifbar sind. Im Vortrag zeigen wir anhand der Empolis Competitive Lösung, wie in einem mehrstufigen Prozess, unter Nutzung von Semantik und Linguistik, Quellen aus dem WWW und dem Intranet einbezogen, stufenweise analysiert und aggregiert werden, um daraus konkrete Erkenntnisse abzuleiten, wie sie typisch sind für die Bereiche Wettbewerbs- und Marktbeobachtung sowie Innovationsforschung. Wir erläutern das Zusammenspiel von Ontologien, welche die fachliche Anwendung beschreiben, mit NLP-Techniken wie Entitäten-Traktion und Konzept-Erkennung sowie statistischen Methoden, um schwache Signale zu erfassen und somit Hinweise zu relevanten Trends im betrachteten Bereich zu geben.