Die Welt der Kryptowährungen und Smart Contracts hat in den letzten Jahren eine rasante Entwicklung durchgemacht. Dabei steht die Sicherheit dieser Technologien im Vordergrund, insbesondere in Anbetracht der jüngsten Cyberangriffe und des Diebstahls von Vermögenswerten, die Milliarden Dollar kosten können. In diesem Kontext hat OpenAI einen neuen Benchmark für Smart Contracts, bekannt als EVMbench, veröffentlicht. Dieser Benchmark zielt darauf ab, die Fähigkeit von KI-Agenten zu messen, Smart Contracts zu verstehen, zu reparieren und auszunutzen. Mehr Informationen zu diesem Schritt finden Sie in der ausführlichen Analyse auf wublock.substack.com.

EVMbench basiert auf 120 hochgradigen Sicherheitsanfälligkeiten, die aus 40 realen Projekten entnommen wurden. Der Test ist in drei Abschnitte unterteilt: Die Erkennung von Sicherheitsanfälligkeiten, die Reparatur von anfälligem Code und die Ausnutzung, bei der die KI als Angreifer auftritt. Interessanterweise hat OpenAI in den letzten Jahren nur wenig Engagement im Krypto-Bereich gezeigt, eine Zusammenarbeit mit dem Krypto-VC Paradigm deutet jedoch auf ein wachsendes Interesse hin.

Die Rolle der KI in der Sicherheitsbewertung

Der EVMbench-Benchmark wurde nicht nur zur Bewertung der technischen Fähigkeiten von KI-Agenten entwickelt, sondern auch um deren Überlebensfähigkeit in einer zunehmend automatisierten Welt zu testen. Es wird erwartet, dass Agenten in Krypto-Netzwerken unvermeidlich werden, insbesondere im Bereich stabiler Krypto-Zahlungen. Die Möglichkeit, dass Agenten ohne menschliche Vermittlung interagieren, wirft Fragen darüber auf, wie ein wirtschaftliches System ohne menschliche Akteure aufrechterhalten werden kann. OpenAI hat diesen Benchmark als Teil eines internen Preparedness Frameworks initiiert, das darauf abzielt, die Fähigkeiten von Modellen in risikobehafteten Bereichen zu bewerten.

Die Entwicklung von EVMbench geschah in enger Zusammenarbeit mit Paradigm und OtterSec, einem Sicherheitsprüfer, der bedeutende Unterstützung bei der Implementierung des Projekts geleistet hat. OpenAI hofft, dass EVMbench ein langfristiger Sicherheitsbenchmark für KI-Smart-Contracts wird. Dies ist besonders wichtig, da über 100 Milliarden USD in Vermögenswerten in Open-Source-Krypto-Verträgen routinemäßig verwaltet werden.

Die Zukunft der Audits

Die frühen Ergebnisse der Studie zeigen vielversprechende Fortschritte: Während zu Beginn des Projekts die besten Modelle weniger als 20% der kritischen Bugs ausnutzen konnten, ist es dem GPT-5.3-Codex jetzt gelungen, über 70% dieser Bugs auszunutzen. Diese signifikante Verbesserung könnte bedeuten, dass ein wachsender Teil der Audits in Zukunft von Agenten durchgeführt wird, was die Effizienz und Sicherheit in der Krypto-Welt enorm steigern könnte.

Werbung
Hier könnte Ihr Advertorial stehen
Ein Advertorial bietet Unternehmen die Möglichkeit, ihre Botschaft direkt im redaktionellen Umfeld zu platzieren

Manuelle Audits sind zeitaufwendig und teuer, was den Bedarf an KI-Audits erhöht. KI-Audits könnten große Mengen an Code schnell scannen und Sicherheitslücken identifizieren, was für die Sicherheit digitaler Finanzen entscheidend sein könnte. Die Technologie steht jedoch noch am Anfang ihrer Entwicklung, und komplexe logische Fehler bleiben eine Herausforderung für automatisierte Systeme. Die Forschung hebt die duale Natur dieser Technologie hervor, die sowohl in der Lage ist, Verteidiger zu unterstützen als auch potenziell Angreifern zu helfen.

Die Ergebnisse des EVMbench-Tests könnten in den kommenden Jahren wegweisend für die Entwicklung autonomer Finanzsysteme sein, in denen Software-Agenten Transaktionen verwalten. In diesem Zusammenhang wird auch die Frage aufgeworfen, wie Maschinen Schwächen in Smart Contracts zuverlässig identifizieren können. Die Initiative von OpenAI spiegelt die wachsende Besorgnis über Cyberdiebstahl in der Kryptoindustrie wider, wo Milliarden von Dollar in dezentralen Anwendungen gebunden sind. Weitere Details sind in der Forschungszusammenfassung von OpenAI und dem gemeinsamen akademischen Papier zu finden, das auf paradigm.xyz verfügbar ist.