Machine Learning…aber sicher!?

titelbild-machine-leaarning-trust

Viele unterschiedliche Branchen nutzen die Vorzüge von Data Science und die Möglichkeit, künstliche Intelligenz einzusetzen. Das bekannteste Beispiel sind dabei vermutlich die Produktempfehlungen auf den Plattformen von Online-Versandhändlern. Dort wird künstliche Intelligenz auch zur Bilderkennung bei Retouren, für Größenempfehlungen oder für die Logistikzentren eingesetzt. Weiterhin kann künstliche Intelligenz in Versicherungen zur Risikoermittlung, zur proaktiven Kontaktaufnahme mit den Kunden oder zur Ermittlung von Reparaturkosten unterstützend wirken.

ML in der Finanzbranche: Betrugsfälle erkennen 

Besonders sicherheitskritisch ist der Einsatz zur Betrugsfallerkennung in der Finanzbranche. Bisher eingesetzte Expertensysteme, die beispielsweise einfache Betrugsmuster im Zahlungsverkehr mit Kreditkarten erkennen, reichen nicht mehr aus, um auch komplexere Betrugsfälle zu erkennen. In diesem Umfeld wird mittlerweile verstärkt künstliche Intelligenz eingesetzt.

Daten für die Betrugsfallerkennung werden durch die Finanzinstitute meist selbst erhoben. In anderen Projekten können auch Daten aus externen Quellen verarbeitet werden. Dazu werden beispielsweise öffentlich zugängliche APIs genutzt, Webseiten gecrawlt oder anderweitig automatisiert verarbeitet. Viele Regierungen, Behörden und Unternehmen stellen mittlerweile auch OpenData-Plattformen bereit, die beispielsweise den Zugang zu Straßenverkehrsdaten ermöglichen. Möglich ist außerdem der Erwerb von Daten, wie beispielsweise Nutzerdaten.

Werden die o.g. Daten analysiert oder zum Trainieren eines Machine-Learning-Modells verwendet, ist nicht nur auf die Einhaltung von Persönlichkeitsrechten zu achten. Besonders Gesundheitsdaten fallen unter strenge Regeln! Auch Urheberrechtsverletzungen können auftreten, wenn beispielsweise eine Webseite unrechtmäßig gecrawlt wird oder Daten von einer API genutzt werden, die diesen Verwendungszweck nicht erlaubt. Besonders bei der kommerziellen Verwendung solcher Daten kann dies zu erheblichen Problemen führen.

Illegal, legal, egal: Quellen müssen vertrauenswürdig sein 


Bei der Verwendung von Daten  völlig unabhängig davon, woher sie stammen – ist darauf zu achten, dass der Ursprung der Daten vertrauenswürdig ist. Manipulierte Daten können dazu verwendet werden, ein Machine-Learning-Modell zu kompromittieren, das mit diesen Daten trainiert wird.

Vor der Datenanalyse und dem Trainieren eines Machine-Learning-Modells sollte daher immer auf die rechtmäßige Verwendung der Daten, korrekte Lizenzierung und auf einen vertrauenswürdigen Ursprung der Daten geachtet werden.

Dass die Arbeit mit sensiblen Daten in einer Data Science Pipeline unter den regulatorischen und sicherheitstechnischen Anforderungen möglich ist, wurde auf den IT-Tagen 2020 gezeigt, indem eine sichere Data Science Pipeline vorgestellt wurde. Mit einer besonderen Sandbox-Architektur wird darauf geachtet, dass sich Flexibilität und Sicherheit in der Data Science vereinen lassen. Einen Artikel dazu von unserem Kollegen Olaf Hein lesen Sie auch hier: https://www.informatik-aktuell.de/betrieb/kuenstliche-intelligenz/aufbau-einer-data-science-pipeline.html

By accepting you will be accessing a service provided by a third-party external to https://blog.ordix.de/