AlphaProof od DeepMind: AI zdobyła srebrny medal na Olimpiadzie Matematycznej. Ma to swoją cenę

4 miesięcy temu

Komputery są świetne w liczeniu, ale słabe w rozumowaniu. Teraz zespół Google DeepMind ogłosił przełom: AlphaProof, nowy system AI, dorównał srebrnym medalistom Międzynarodowej Olimpiady Matematycznej (IMO) 2024.

Twór DeepMind osiągnął wynik 28 punktów, stając się siódmym podmiotem (obok sześciu ludzi), który rozwiązał najtrudniejsze zadanie.

Jak zauważa ArsTechnica, to ogromny sukces. Do tej pory modele AI nie radziły sobie z dowodami matematycznymi, ponieważ polegały na statystycznym przewidywaniu, co „brzmi” poprawnie, a nie na zrozumieniu struktury matematyki.

TTRL: uczenie się jak człowiek

DeepMind wykorzystało architekturę znaną z AlphaZero (tej od gier: go, szachy), ale dodało trzeci, unikalny element: Test-Time Reinforcement Learning (TTRL). Ten komponent naśladuje podejście człowieka do trudnych problemów.

Kiedy AlphaProof nie potrafi rozwiązać zadania, tworzy setki jego wariacji – uproszczonych, uogólnionych lub luźno powiązanych. Następnie uczy się, próbując rozwiązać te łatwiejsze wersje, aby zdobyć praktykę i nabyć „praktyczne doświadczenie” w trakcie trwania zadania.

Cena srebrnego medalu: dni i setki TPU

Ten sukces ma jednak gigantyczną cenę, co jest kluczowym elementem krytycznej oceny. Po pierwsze, czas. Ludzie uczestniczący w Międzynarodowej Olimpiadzie Matematycznej mieli na rozwiązanie sześciu problemów dwie sesje po cztery i pół godziny. AlphaProof zmagał się z problemami przez… kilka dni, zużywając jednocześnie wiele jednostek TPU (Tensor Processing Unit).

W efekcie cały system potrzebował setek TPU-dni na problem. Jak przyznaje DeepMind, wymagania obliczeniowe są „najprawdopodobniej zbyt kosztowne dla większości grup badawczych”.

Jakby tego było mało AlphaProof nie działał całkowicie autonomicznie. Potrzebował ludzi do przetłumaczenia problemów na formalny język Lean oraz musiał wywołać drugą, wyspecjalizowaną AI (AlphaGeometry 2) do rozwiązania problemu z geometrią.

Podsumowując, AlphaProof to dowód na to, iż AI osiągnęło poziom rozumienia logiki, ale do zastąpienia ludzkiego matematyka brakuje mu jeszcze… szybkości, elegancji i pieniędzy. Zatem, gdy ktoś powie, iż AI jest dużo szybsza od człowieka, to niniejszy przypadek jest dowodem, iż wciąż mamy przewagę.

AWS rzuca wyzwanie Copilotowi. Kiro już dostępne, a startupy dostaną je za darmo

Jeśli artykuł AlphaProof od DeepMind: AI zdobyła srebrny medal na Olimpiadzie Matematycznej. Ma to swoją cenę nie wygląda prawidłowo w Twoim czytniku RSS, to zobacz go na iMagazine.

Idź do oryginalnego materiału