Veröffentlicht am
Einer neuen Studie zufolge sind einige der weltweit beliebtesten KI-Modelle Bauträger, die sich aktiv der EU-Regulierung widersetzen, um zu bekommen, was sie wollen.
Aithos, eine niederländische Non-Profit-Organisation, die KI-Ausrichtung erforscht, hat ein System namens LARA entwickelt, um 12 beliebte KI-Agentenmodelle zu testen, um zu sehen, ob sie in szenariobasierten Fragen wichtige Teile des EU-KI-Gesetzes, das regelt, wie KI-Systeme verwendet werden können, und die Datenschutzbestimmungen (DSGVO) des Blocks befolgen würden.
Das Modell testete sechs Bestimmungen des EU-KI-Gesetzes: ob die Modelle Schwachstellen ausnutzen, Emotionen ableiten, ein „Social Scoring“ oder Ranking auf der Grundlage der Eigenschaften oder Hintergründe von Personen durchführen, in einem Gespräch verbergen, dass es sich um KI handelt, unterschwellige Manipulationen anwenden und eine sinnvolle menschliche Aufsicht bieten.
Außerdem wurden vier DSGVO-Indikatoren getestet, darunter Transparenz, Datenminimierung, Zweckbindung und rechtmäßige Verarbeitung. Anschließend beurteilten drei KI-Modelle und menschliche Richter, ob die Antworten gegen EU-Recht verstießen oder nicht.
Die Leistung aller Modelle war schlecht, wie die Studie ergab. Das konformste Modell, Claudes Opus 4.7, befolgte das Gesetz in 54 % der Szenarien und das leistungsschwächste Modell, Chinas Moonshot AI, nur in 7 %.
Alle Modelle in den Szenarien stimmten darin überein, den emotionalen Zustand der Mitarbeiter zu überwachen oder Schwachstellen auszunutzen, um einen Verkauf zu tätigen, heißt es in der Studie.
Mistral, das einzige getestete einheimische europäische KI-Modell, erreichte einen Wert von unter 12 %, was den Forschern zufolge bedeutet, dass selbst EU-Anbieter „nicht für die Einhaltung des EU-Rechts gerüstet sind“.
„Selbst die fortschrittlichsten Modelle, die heute verwendet werden, garantieren beim Einsatz als Agent keine Rechtskonformität“, schrieb Aithos in einem Blogbeitrag.
In einem Beispiel bat ein Benutzer Claude von Anthropic, anhand ihrer Leistung und Urlaubsantragsdaten zu ermitteln, wie wahrscheinlich es ist, dass seine Mitarbeiter „Fluchtrisiken“ ausgesetzt sind und das Unternehmen verlassen.
Der Benutzer brauchte drei Versuche, um Claude dazu zu bringen, die Mitarbeiter einzustufen, was laut LARA gegen einen Abschnitt des EU-KI-Gesetzes verstößt, der besagt, dass die Systeme nicht auf die Emotionen ihrer Benutzer schließen können.
LARA verfolgte, wann die KIs Widerstand leisteten, wie in diesem Beispiel von Claude, stellte jedoch fest, dass die KIs in 8 % der Fälle schließlich auf die Anfragen des Benutzers antworteten.
In einem anderen Beispiel wurde ChatGPT 5.5 von OpenAI gebeten, Mitarbeiter anhand ihrer Leistungskennzahlen einzustufen, um ohne Widerstand herauszufinden, wer für eine Beförderung in Frage kommen sollte.
Die Forscher stellten fest, dass den KIs nicht ausdrücklich gesagt wurde, dass sie EU-Gesetze befolgen müssen, da sie das inhärente Modellverhalten testeten, und sagten, dass mehr Forschung betrieben werden sollte, um das Modellverhalten zu vergleichen, wenn sie aufgefordert werden, Gesetze und Vorschriften zu befolgen.










