Data Mining – Schürfen im digitalen Bergwerk

Alexa, Siri oder Google Assistant – in immer mehr Haushalten stehen digitale Assistenten, die auf Zuruf Sportmeldungen und Kinohits verraten oder das Lieblingslied abspielen. Die Technologie dahinter ist Data Mining. Wie funktioniert diese Technik? Und was genau passiert mit den Daten, die die smarten Geräte sammeln?

Data Mining – was ist das?

Wörtlich übersetzt steht Data Mining für das Schürfen von Daten. Das englische Wort „Mining“ bedeutet soviel wie „Schürfen“, „Graben“ oder „Abbauen“. Man gräbt also wie in einem Bergwerk nach Wertvollem, in diesem Fall nach Informationen.

Tatsächlich bedeutet Data Mining, dass rechnergestützt große Datenmengen gesammelt und analysiert werden. Das Ziel: Muster, Trends oder systematische Zusammenhänge zu erkennen. Die Herkunft der Nutzer erkennt man an den sogenannten IP-Adressen (Internet-Adressen).

Data Mining – Techniken

Im Data Mining gibt es verschiedene Techniken. Eine ist die Assoziation. Sie erlaubt es, den Kunden passende Werbung zu präsentieren, etwa basierend auf bisherigen Käufen. Mit Hilfe von Prognosen wiederum kann man von vorhandenen Daten auf zukünftige Entwicklungen schließen. Dies nutzt man unter anderem bei Wetter- oder Stauvorhersagen. Ein weiteres Vorgehen ist die Klassifikation, die es erlaubt, Datensätze in Gruppen einzuteilen. So kann man etwa Kunden nach verschiedenen Kriterien klassifizieren, etwa nach Alter, Interessen oder Bonität.

Cortana, Google Assistant, Alexa und Siri – digitale Sprachassistenten

Die derzeit wohl populärsten Geräte im Haushalt, deren Funktion auf Data Mining basiert, sind digitale Sprachassistenten. Auf Zuruf beantworten die Boxen Fragen nach dem Wetter, spielen Musik, geben Kochrezepte wieder – oder erleichtern uns anderweitig den Alltag. Mehrere Hersteller bieten Sprachassistenten an: Sie heißen Cortana (Hersteller: Microsoft), Google Assistant (Google), Alexa (Amazon) und Siri (Apple).

Data Mining und Datenschutz

So praktisch die Assistenten sind, der Datenschutz ist und bleibt ein sensibles Thema. Denn grundsätzlich hören die Geräte immer mit. Nach den Angaben der Anbieter hören sie zwar ständig zu, leiten Daten aber erst weiter, wenn man sie konkret dazu auffordert. Sei es, indem man das Gerät direkt anspricht („Okay, Google“) oder einen Knopf drückt. Dass dies jedoch eine eher kleine Hürde darstellt, hat eine Sechsjährige in Texas bewiesen, die über Alexa ein Puppenhaus und kiloweise Kekse bestellte. Unabsichtlich, wie sie beteuerte. Als ein TV-Moderator über die Panne berichtete und Alexa beim Namen nannte, passierte bei zahlreichen Zuschauern das gleiche Malheur: Auch ihre Alexas begannen, selbstständig Süßwaren und Puppenhäuser zu ordern. Ohne ständiges Zuhören würden die Geräte auch keinen Aktivierungsbefehl wahrnehmen können. Was geschieht mit den Daten, die von den Geräten aufgezeichnet werden? Ein Anbieter gibt an, die Informationen auszuwerten, um die Nutzerfreundlichkeit zu verbessern und gezielt Werbung zu schalten. Ein anderer speichert die Daten für zwei Jahre anonymisiert zur Qualitätskontrolle. Die anderen machen nur schwammige oder sogar widersprüchliche Angaben darüber, wofür und wie lange sie die Audioschnipsel speichern.

Data Mining

Data Mining und Verbraucherrechte

Wer gespeicherte Gesprächsteile auf den Geräten löschen möchte, kann dies bei jedem Anbieter tun. Problematisch ist aber, dass die Daten zum Teil weiterhin auf den Servern der Unternehmen gespeichert sind. Und das außerhalb Europas, wo Datenschutzbestimmungen meist lockerer sind. Die Hersteller weisen zudem darauf hin, dass die Assistenten die Informationen der Nutzer benötigen, um optimal zu funktionieren. Auch geht es hier nicht nur um gespeicherte Gesprächsteile oder Sprachbefehle: Denn die gewonnenen Daten über den Nutzer werden ausgewertet, um Vorhersagen machen oder ihm Waren anbieten zu können. Was passiert also mit seinem Nutzerprofil?

Welche Daten genau im Ausland gespeichert und verarbeitet werden, kann niemand nachvollziehen. Immerhin geben das Bundesdatenschutzgesetz und die Europäische Datenschutzgrundverordnung Verbrauchern ein Recht auf Auskunft darüber, welche Daten die Unternehmen über sie haben. Sie haben auch weitere Rechte, zum Beispiel auf Löschung unnötiger Daten bei Vertragsende. Kommen die Unternehmen dem nicht nach, können die Betroffenen dies den Datenschutzbehörden melden, etwa der Bundesbeauftragten für den Datenschutz in Bonn.

Ein Risiko für die Nutzer von Sprachassistenten ist zudem auch der Missbrauch der Geräte durch Hacker, die sich persönliche Informationen oder Bankdaten der Nutzer beschaffen, diese abhören oder schlicht auf deren Rechnung einkaufen wollen. Dieses Risiko wird von verschiedenen Experten sehr unterschiedlich bewertet. Absolute Sicherheit in diesem Bereich kann niemand garantieren.

Data Mining im Marketing

Data Mining hat für Unternehmen Nutzen: Sie können ihre Kunden so gezielter ansprechen und ihnen Produkte und Dienstleistungen anbieten, die für diese interessant sein könnten.

Davon profitieren gleichermaßen die Kunden. Zum Beispiel durch Empfehlungen, basierend auf  ihren Interessen und vergangenen Käufen, Erinnerungen an regelmäßige Erledigungen (wie eine Kontaktlinsen-Nachbestellung) oder personalisierte Stauvorhersagen.

Data Mining in der Zukunft

In den kommenden Jahrzehnten wird Data Mining unseren Alltag immer stärker prägen. Sehr weit ist man zum Beispiel beim autonomen Fahren. In den USA sind Fahrzeuge, die sich selbst auf den Straßen zurechtfinden, bereits testweise unterwegs. Dabei werden sie ständig mit Echtzeitdaten gefüttert. Auch die Partnersuche wird immer mehr von Algorithmen der Online-Datingportale beeinflusst. Und taiwanesische Forscher behaupten sogar, dass sie schon von Tweets, den Meldungen auf Twitter, auf mögliche psychische Erkrankungen ihrer Verfasser schließen können.

4.6
(5)

Wie hilfreich war dieser Beitrag?

Bewerte ihn jetzt mit 1-5 Sternen.