3.2 Daten, Daten, Daten und warum sie so wichtig sind!
Daten sind im Grund nur Zuordnungen von Zahlen zu Objekten oder Ereignissen. Sie werden durch das Beobachten, Messen oder über statistische Erhebungen gesammelt. Ein klassisches Beispiel, um das zu verdeutlichen, ist die Temperatur. Wir wollen z.B. wissen, wie warm es draußen ist. Um das herauszufinden nutzen wir ein Thermometer (Messinstrument), welches uns eine Temperaturangabe anzeigt. So haben wir einem Ereignis/Zustand eine konkrete Zahl zugeschrieben z.B. 23°C.
Im Interview mit Aniek de Haan sprechen wir darüber, warum Daten im KI-Kontext so wichtig sind. Aniek de Haan ist eine der ersten Absolventinnen, des erst vor ein paar Jahren an der Universität Mannheim eingeführten Masters “Data Science”. Derzeit arbeitet sie in einer Linguistischen Unternehmensberatung in der sie Chatbots entwickelt. Ihre Arbeitsschwerpunkte umfassen Data Analytics und Natural Language Processing (NLP).
Reflexion
Daten bilden die Grundlage aller KI-Systeme. Sind diese Daten allerdings verzerrt (Stichwort Data Bias), kann das Individuen oder ganze Gruppen diskriminieren. Um mögliche Verzerrungen in den Daten zu identifizieren, braucht es immer Personen, die diese inhaltlich verstehen. Bei der Entwicklung von KI-Anwendungen ist also immer auch domänenspezifisches Wissen gefragt. Im Bildungskontext könnte das von Pädagog*innen geliefert werden.
Aktivität
Unmengen von Daten werden jeden Tag produziert. Häufig wird sogar vom “Öl des 21. Jahrhunderts” gesprochen. Warum Daten so wichtig sind, weißt Du nun. Es lassen sich aber ganz verschiedene Datenarten unterscheiden.
Informiere Dich darüber, was unstrukturierte Daten und was strukturierte Daten sind.
Vertiefung
In diesem Video erzählt Aniek de Haan, was man eigentlich als Data Scientist macht und was Data Science ist 👉 Zum Video
Buchtipp! 📓📚💡 Unsichtbare Frauen: Wie eine von Daten beherrschte Welt die Hälfte der Bevölkerung ignoriert von Caroline Criado-Perez. Das Buch ist auf Deutsch und Englisch erhältlich. In dem Buch wird sehr eindrücklich aufgezeigt, welche geschlechterbezogenen Ungleichheiten es in der Gesellschaft gibt und wie sich das in Daten manifestiert.