2 Minuten Lesezeit (374 Worte)

Machine Learning…aber sicher!?

Freitag, 21. Mai 2021

Viele unterschiedliche Branchen nutzen die Vorzüge von Data Science und die Möglichkeit, künstliche Intelligenz einzusetzen. Das bekannteste Beispiel sind dabei vermutlich die Produktempfehlungen auf den Plattformen von Online-Versandhändlern. Dort wird künstliche Intelligenz auch zur Bilderkennung bei Retouren, für Größenempfehlungen oder für die Logistikzentren eingesetzt. Weiterhin kann künstliche Intelligenz in Versicherungen zur Risikoermittlung, zur proaktiven Kontaktaufnahme mit den Kunden oder zur Ermittlung von Reparaturkosten unterstützend wirken.

ML in der Finanzbranche: Betrugsfälle erkennen

Besonders sicherheitskritisch ist der Einsatz zur Betrugsfallerkennung in der Finanzbranche. Bisher eingesetzte Expertensysteme, die beispielsweise einfache Betrugsmuster im Zahlungsverkehr mit Kreditkarten erkennen, reichen nicht mehr aus, um auch komplexere Betrugsfälle zu erkennen. In diesem Umfeld wird mittlerweile verstärkt künstliche Intelligenz eingesetzt.

Daten für die Betrugsfallerkennung werden durch die Finanzinstitute meist selbst erhoben. In anderen Projekten können auch Daten aus externen Quellen verarbeitet werden. Dazu werden beispielsweise öffentlich zugängliche APIs genutzt, Webseiten gecrawlt oder anderweitig automatisiert verarbeitet. Viele Regierungen, Behörden und Unternehmen stellen mittlerweile auch OpenData-Plattformen bereit, die beispielsweise den Zugang zu Straßenverkehrsdaten ermöglichen. Möglich ist außerdem der Erwerb von Daten, wie beispielsweise Nutzerdaten.

Werden die o.g. Daten analysiert oder zum Trainieren eines Machine-Learning-Modells verwendet, ist nicht nur auf die Einhaltung von Persönlichkeitsrechten zu achten. Besonders Gesundheitsdaten fallen unter strenge Regeln! Auch Urheberrechtsverletzungen können auftreten, wenn beispielsweise eine Webseite unrechtmäßig gecrawlt wird oder Daten von einer API genutzt werden, die diesen Verwendungszweck nicht erlaubt. Besonders bei der kommerziellen Verwendung solcher Daten kann dies zu erheblichen Problemen führen.

Illegal, legal, egal: Quellen müssen vertrauenswürdig sein

Bei der Verwendung von Daten – völlig unabhängig davon, woher sie stammen – ist darauf zu achten, dass der Ursprung der Daten vertrauenswürdig ist. Manipulierte Daten können dazu verwendet werden, ein Machine-Learning-Modell zu kompromittieren, das mit diesen Daten trainiert wird.

Vor der Datenanalyse und dem Trainieren eines Machine-Learning-Modells sollte daher immer auf die rechtmäßige Verwendung der Daten, korrekte Lizenzierung und auf einen vertrauenswürdigen Ursprung der Daten geachtet werden.

Dass die Arbeit mit sensiblen Daten in einer Data Science Pipeline unter den regulatorischen und sicherheitstechnischen Anforderungen möglich ist, wurde auf den IT-Tagen 2020 gezeigt, indem eine sichere Data Science Pipeline vorgestellt wurde. Mit einer besonderen Sandbox-Architektur wird darauf geachtet, dass sich Flexibilität und Sicherheit in der Data Science vereinen lassen. Einen Artikel dazu von unserem Kollegen Olaf Hein lesen Sie auch hier: https://www.informatik-aktuell.de/betrieb/kuenstliche-intelligenz/aufbau-einer-data-science-pipeline.html

{loadmoduleid 179}

Alle Beiträge anzeigen

hat noch keine Informationen über sich angegeben

Markiert in:

Machine Learning

Kommentare

Derzeit gibt es keine Kommentare. Schreibe den ersten Kommentar!

BLEIBEN SIE INFORMIERT

BLEIBEN SIE INFORMIERT

Machine Learning…aber sicher!?

ML in der Finanzbranche: Betrugsfälle erkennen

Illegal, legal, egal: Quellen müssen vertrauenswürdig sein

Kommentare

BLEIBEN SIE INFORMIERT

BLEIBEN SIE INFORMIERT

Machine Learning…aber sicher!?

ML in der Finanzbranche: Betrugsfälle erkennen

Illegal, legal, egal: Quellen müssen vertrauenswürdig sein

Ähnliche Beiträge

Oracle trifft OpenAI: SELECT AI als Brücke zwischen Sprache und SQL

NiFi trifft MCP – wenn der KI-Agent den Flow übernimmt

PostgreSQL als KI-Enabler: Teil 2 – Semantische Suche und RAG in der Praxis

PostgreSQL als KI-Enabler: Teil 1 – Wie pgvector aus einer relationalen Datenbank einen KI-fähigen Datenspeicher macht

MCP – wenn KI-Modelle aufhören zu fragen und anfangen zu handeln

Automatische Dokumentation: Wie KI die zwingende Notwendigkeit des eigenen Dokumentierens ablöst

Kommentare