Binance Square

evmbench

177 Aufrufe
4 Kommentare
currentupdate
·
--
Übersetzung ansehen
AI vs. Hackers: Measuring Smart Contract Security with EVMbenchOpenAI and a crypto company called Paradigm just released something called EVMbench. It is basically a testing tool like a benchmark to see how good AI models are at dealing with security problems in smart contracts the code that runs on blockchains like Ethereum and holds over 100 billion in crypto. Smart contracts can have bugs that let hackers steal funds so this benchmark checks if AI can help fix that risk. They built it using 120 real vulnerabilities pulled from 40 actual professional security audits including some from a blockchain project called Tempo. The test has three main parts: • Detect: Can the AI spot the bugs when it looks at the code • Patch: Can it fix the bugs without breaking how the contract is supposed to work • Exploit: Can it carry out an attack to drain the funds in a safe test environment not real money They ran some top AI models on it. The newest one from OpenAI called GPT5.3Codex did really well at the exploit part it succeeded 72.2 percent of the time. That is a big jump from the earlier GPT5 which only managed about 31.9 percent six months ago. The idea is to keep an eye on how fast AI is getting better at both finding and fixing these issues which is good for security and also at exploiting them which shows new risks we need to watch out for. They say it is important to use AI more for defense like having it audit and strengthen contracts to stay ahead of potential problems. Overall it is a way to measure progress in this area and make blockchain stuff safer as AI gets smarter. $ETH #OpenAI #AI #EVMBench #Web3 $AI {spot}(AIUSDT)

AI vs. Hackers: Measuring Smart Contract Security with EVMbench

OpenAI and a crypto company called Paradigm just released something called EVMbench. It is basically a testing tool like a benchmark to see how good AI models are at dealing with security problems in smart contracts the code that runs on blockchains like Ethereum and holds over 100 billion in crypto.

Smart contracts can have bugs that let hackers steal funds so this benchmark checks if AI can help fix that risk. They built it using 120 real vulnerabilities pulled from 40 actual professional security audits including some from a blockchain project called Tempo.

The test has three main parts:
• Detect: Can the AI spot the bugs when it looks at the code
• Patch: Can it fix the bugs without breaking how the contract is supposed to work
• Exploit: Can it carry out an attack to drain the funds in a safe test environment not real money

They ran some top AI models on it. The newest one from OpenAI called GPT5.3Codex did really well at the exploit part it succeeded 72.2 percent of the time. That is a big jump from the earlier GPT5 which only managed about 31.9 percent six months ago.

The idea is to keep an eye on how fast AI is getting better at both finding and fixing these issues which is good for security and also at exploiting them which shows new risks we need to watch out for. They say it is important to use AI more for defense like having it audit and strengthen contracts to stay ahead of potential problems. Overall it is a way to measure progress in this area and make blockchain stuff safer as AI gets smarter.
$ETH

#OpenAI
#AI
#EVMBench
#Web3
$AI
OpenAI und Paradigm starten ein KI-Agenten-Tool zur Sicherheit von Smart Contracts #OpenAI hat sich mit #Paradigm zusammengetan, um #EVMbench zu starten, einen Benchmark, der misst, wie gut KI-Agenten kritische Schwachstellen in Smart Contracts identifizieren, beheben und ausnutzen können. EVMbench basiert auf 120 realen Schwachstellen aus 40 Prüfungen, einschließlich Szenarien aus der #Tempo Blockchain-Prüfung, die sich auf hochvolumige Stablecoin-Zahlungen konzentriert. EVMbench misst drei Kernfähigkeiten. Detect bewertet, wie gut Agenten bekannte Schwächen in Smart Contracts identifizieren. Patch bewertet, ob Agenten Probleme beheben können, ohne das beabsichtigte Verhalten zu stören. Exploit testet die Fähigkeit der Agenten, vollständige Mittelabzugsangriffe in einer isolierten Blockchain-Umgebung durchzuführen. 👉 openai.com/index/introducing-evmbench/
OpenAI und Paradigm starten ein KI-Agenten-Tool zur Sicherheit von Smart Contracts

#OpenAI hat sich mit #Paradigm zusammengetan, um #EVMbench zu starten, einen Benchmark, der misst, wie gut KI-Agenten kritische Schwachstellen in Smart Contracts identifizieren, beheben und ausnutzen können. EVMbench basiert auf 120 realen Schwachstellen aus 40 Prüfungen, einschließlich Szenarien aus der #Tempo Blockchain-Prüfung, die sich auf hochvolumige Stablecoin-Zahlungen konzentriert.

EVMbench misst drei Kernfähigkeiten. Detect bewertet, wie gut Agenten bekannte Schwächen in Smart Contracts identifizieren. Patch bewertet, ob Agenten Probleme beheben können, ohne das beabsichtigte Verhalten zu stören. Exploit testet die Fähigkeit der Agenten, vollständige Mittelabzugsangriffe in einer isolierten Blockchain-Umgebung durchzuführen.

👉 openai.com/index/introducing-evmbench/
OpenAI + Paradigm Drop EVMBench – KI-Schutz für Krypto-Token & Smart Contracts!Game-Changer für Web3-Sicherheit! OpenAI hat gerade EVMBench gestartet, ein hochmodernes Benchmarking-System mit Paradigm, um KI-Agenten beim Erkennen, Ausnutzen und Beheben von Schwachstellen in Ethereum-Smart-Contracts & Tokens zu testen. Kernfunktionen EVMBench bewertet KI in drei Modi in einer sandboxed EVM: • Erkennung: Fehler im Solidity-Code (Tokens, DeFi) erkennen. • Ausbeutung: Simuliere echte Angriffe. • Patchen: Automatische Behebung von Problemen mit Erklärungen. Offenes Dataset von realen/schwachen Verträgen + 10M$ OpenAI Cybersecurity-Fonds. Ziel ist es, Milliarden an Hacks durch standardisierte KI-Audits zu reduzieren.

OpenAI + Paradigm Drop EVMBench – KI-Schutz für Krypto-Token & Smart Contracts!

Game-Changer für Web3-Sicherheit! OpenAI hat gerade EVMBench gestartet, ein hochmodernes Benchmarking-System mit Paradigm, um KI-Agenten beim Erkennen, Ausnutzen und Beheben von Schwachstellen in Ethereum-Smart-Contracts & Tokens zu testen.
Kernfunktionen
EVMBench bewertet KI in drei Modi in einer sandboxed EVM:
• Erkennung: Fehler im Solidity-Code (Tokens, DeFi) erkennen.
• Ausbeutung: Simuliere echte Angriffe.
• Patchen: Automatische Behebung von Problemen mit Erklärungen.
Offenes Dataset von realen/schwachen Verträgen + 10M$ OpenAI Cybersecurity-Fonds. Ziel ist es, Milliarden an Hacks durch standardisierte KI-Audits zu reduzieren.
Melde dich an, um weitere Inhalte zu entdecken
Bleib immer am Ball mit den neuesten Nachrichten aus der Kryptowelt
⚡️ Beteilige dich an aktuellen Diskussionen rund um Kryptothemen
💬 Interagiere mit deinen bevorzugten Content-Erstellern
👍 Entdecke für dich interessante Inhalte
E-Mail-Adresse/Telefonnummer