Viele unterschiedliche Branchen nutzen die Vorzüge von Data Science und die Möglichkeit, künstliche Intelligenz einzusetzen. Das bekannteste Beispiel sind dabei vermutlich die Produktempfehlungen auf den Plattformen von Online-Versandhändlern. Dort wird künstliche Intelligenz auch zur Bilderkennung bei Retouren, für Größenempfehlungen oder für die Logistikzentren eingesetzt. Weiterhin kann künstliche Intelligenz in Versicherungen zur Risikoermittlung, zur proaktiven Kontaktaufnahme mit den Kunden oder zur Ermittlung von Reparaturkosten unterstützend wirken.
ML in der Finanzbranche: Betrugsfälle erkennen
Besonders sicherheitskritisch ist der Einsatz zur Betrugsfallerkennung in der Finanzbranche. Bisher eingesetzte Expertensysteme, die beispielsweise einfache Betrugsmuster im Zahlungsverkehr mit Kreditkarten erkennen, reichen nicht mehr aus, um auch komplexere Betrugsfälle zu erkennen. In diesem Umfeld wird mittlerweile verstärkt künstliche Intelligenz eingesetzt.
Daten für die Betrugsfallerkennung werden durch die Finanzinstitute meist selbst erhoben. In anderen Projekten können auch Daten aus externen Quellen verarbeitet werden. Dazu werden beispielsweise öffentlich zugängliche APIs genutzt, Webseiten gecrawlt oder anderweitig automatisiert verarbeitet. Viele Regierungen, Behörden und Unternehmen stellen mittlerweile auch OpenData-Plattformen bereit, die beispielsweise den Zugang zu Straßenverkehrsdaten ermöglichen. Möglich ist außerdem der Erwerb von Daten, wie beispielsweise Nutzerdaten.
Werden die o.g. Daten analysiert oder zum Trainieren eines Machine-Learning-Modells verwendet, ist nicht nur auf die Einhaltung von Persönlichkeitsrechten zu achten. Besonders Gesundheitsdaten fallen unter strenge Regeln! Auch Urheberrechtsverletzungen können auftreten, wenn beispielsweise eine Webseite unrechtmäßig gecrawlt wird oder Daten von einer API genutzt werden, die diesen Verwendungszweck nicht erlaubt. Besonders bei der kommerziellen Verwendung solcher Daten kann dies zu erheblichen Problemen führen.
Illegal, legal, egal: Quellen müssen vertrauenswürdig sein
Bei der Verwendung von Daten – völlig unabhängig davon, woher sie stammen – ist darauf zu achten, dass der Ursprung der Daten vertrauenswürdig ist. Manipulierte Daten können dazu verwendet werden, ein Machine-Learning-Modell zu kompromittieren, das mit diesen Daten trainiert wird.
Vor der Datenanalyse und dem Trainieren eines Machine-Learning-Modells sollte daher immer auf die rechtmäßige Verwendung der Daten, korrekte Lizenzierung und auf einen vertrauenswürdigen Ursprung der Daten geachtet werden.