Big Data – Tag Zwei der Projektwoche

Gestern Abend wurde Runde zwei der KI-Projektwoche eingeläutet.
Wohingegen das Thema am Montag etwas allumfassender angegangen wurde, so sollte es nun schon konkreter werden. Das Thema lautete Big Data.
Nach einer kurzen Einführung begann der Abend auch schon direkt mit dem ersten Vortrag.

Professor Dr. Klawonn, Leiter am Helmholtz-Institut für Bioinformatik und Statistik, führte zunächst einmal anschaulich aus, was Big Data genau ist/sind. Dafür erläuterte er zunächst andere Formen der Datenverarbeitung (Entscheidungsbäume und »random forests«) und zeigte so die Unterschiede auf. Nachdem Big Data durch die vier großen V’s (Volume, Variety, Velocity und Veracity) genauer definiert wurde, formte sich langsam eine Idee zu dem Begriff.

Weiter ging es anschließend mit einem Aspekt, der heutzutage wahrscheinlich mit »Daten« noch im selben Atemzug fällt: und zwar der Schutz derselben. Professorin Dr. Schiering informierte uns als IT-Sicherheitsexpertin über den verantwortlichen Umgang mit aus Big Data entstehenden Innovationen. Durch verschiedene, aktuelle Beispiele machte sie darauf aufmerksam, dass es nur eine Frage des Blickwinkels sei, für wen bestimmte Daten relevant wären und für wen nicht. Auch erörterte sie die gesetzliche Grundlage in der EU Charta und bat einen Ausblick auf möglichweise kommende problematische Datenschutzkonflikte.

Nach einer Pause, in der es neben leckerem Nudelsalat auch noch die Chance gab, die Vernissage zu bewundern oder am Computer das quickdraw-Programm mit seinen Zeichnung und Assoziationen zu füttern, ging es weiter mit dem Beitrag von Frau Dr. Gerbel, der Leiterin der Abteilung Systeme für Forschung und Lehre des ZIMt’s der MHH. Sie erklärte genauer, was es mit einem »Data Warehouse« auf sich hat und wie dieses in Kombination mit »machine learning« dafür eingesetzt werden kann, eine Menge von Daten erfolgreich zu nutzen und zu interpretieren, auch wenn es genau genommen nicht im Stil von Big Data geschehe. Sie nannte uns auch zwei aktuelle Beispiele an der MHH, wovon eins zu meiner Überraschung sogar meine eigenen Daten betraf: Ein noch laufendes Projekt, in welchem Daten aller aktuell Studierenden genutzt würden, welches probiert, potentielle Studienabbrecher zu detektieren, um ihnen dann gezielt Beratungsangebote zukommen zu lassen.

Doch Zeit, lange perplex zu sein, hatte ich nicht, denn es ging direkt weiter mit dem nächsten und letzten Redner: M.Sc. Canali, Doktorand an der LUH widmete sich der Rolle, welche Big Data in der Wissenschaft künftig einnehmen könnte. Hierfür illustrierte er geschickt, allein anhand von Buchtiteln über selbiges Thema, den Trend, der sich abzeichnen zu scheint und erläuterte uns die verschiedenen Sichtweisen diesbezüglich. Die Frage war, ob Big Data an sich eine neue Revolution ist, ob es sozusagen zum vierten Paradigma der Wissenschaft wird.

Am Ende der Veranstaltung brummt mein Kopf zwar etwas nach all dem interessanten und neuen Input, dennoch gehe ich mit dem Gefühl nach Hause, sehr viel gelernt zu haben und auch noch einige Fragen zu haben, die vielleicht in kommenden Veranstaltungen beantwortet werden können. Denn je mehr man sich mit KI befasst, desto mehr wird einem bewusst, dass es nicht nur Zukunftsgerede ist, sondern, dass es bereits in der Gegenwart hochaktuell ist.

/as