Uczeń i zbudowany z kart pomocnik AI wspólnie oglądają geometryczną zagadkę

35 minut · zero magii · prawdziwa matematyka

Czy AI zastąpi
naszą głowę?

Jak używać AI w zadaniach wymagających myślenia, nie oddając mu kontroli nad rozumowaniem.

Bartosz Naskręcki UAM/CCAI Warszawa, 8.06.2026

Anonimowa sonda

Do czego najczęściej używasz AI?

?

Wyjaśnij

Pomóż mi zrozumieć temat, który nadal jest niejasny.

{ }

Wykonaj

Napisz kod, tekst, prezentację albo rozwiąż zadanie.

✓

Sprawdź

Znajdź pierwszy błąd, przetestuj przypadek, zadaj pytanie.

Większość z nas bywa w każdej z tych sytuacji. Nie chodzi o poczucie winy, tylko o kontrolę.

Teza na dziś

AI może wykonać za nas część czynności
i dostarczyć gotowy wynik.

Nie przejmuje jednak twojej odpowiedzialności za rozumienie, sprawdzanie i wybór.

Najważniejsze pytanie nie brzmi: „czy AI myśli?”, tylko: „czy po jej użyciu ja rozumiem więcej?”.

Podstawowy mechanizm GPT

Jaki token najlepiej pasuje jako następny?

235 711?

13 72% 12 16% 17 8% kot 4%

Model przewiduje token na podstawie struktur poznanych podczas treningu. To nie jest losowe zgadywanie, ale też nie gwarancja rozumienia.

Procenty są ilustracyjne. Model może próbkować odpowiedź, zamiast zawsze wybierać najczęstszy token.

Jak tekst trafia do modelu?

Najpierw tokenizer dzieli tekst na tokeny

Token może być słowem, częścią słowa, symbolem albo fragmentem kodu.

matematyka!

Podział zależy od tokenizera. Token nie jest „pojęciem” w ludzkim sensie.

Rząd geometrycznych figur połączonych łukami o różnej grubości

Mechanizm uwagi · attention

Model przypisuje wagi
fragmentom kontekstu

Ola powiedziała Mai, że ona wygrała.

Dla każdej pozycji model oblicza, jak silnie połączyć ją z poszczególnymi wcześniejszymi pozycjami.

To operacja algebraiczna, nie świadoma uwaga. Same wagi nie są pełnym wyjaśnieniem odpowiedzi.

Jedna głowa uwagi w GPT

Wagi określają wkład wcześniejszych pozycji

A(Q,K,V) = softmax((QK^T + M) / √d_k)V

Qzapytania: czego szuka pozycja?

Kklucze: do czego można ją porównać?

Vwartości: jaka informacja zostanie połączona?

Q = XW_QK = XW_KV = XW_V

`M` jest maską przyczynową: pozycja nie może korzystać z przyszłych tokenów.

Dlaczego GPT nie podgląda przyszłości?

Maska przyczynowa nadaje przyszłym pozycjom wagę zero

235?

21.0×××

3.3.7××

5.2.3.5×

?.1.2.3.4

Wiersz opisuje jedną ważoną kombinację wcześniejszych wartości.

Wiele głów może równolegle wychwytywać inne zależności.

Wiele warstw

Jedna operacja uwagi to dopiero początek

Każda warstwa łączy informacje z kontekstu i przekształca wektory reprezentujące tokeny.

Nie ma jednej szuflady „twierdzenie Pitagorasa”. Wiedza i procedury są rozproszone w wielu parametrach i aktywacjach.

rozkład następnego tokenu

uwaga + sieć feed-forward

⋮

uwaga + sieć feed-forward

tokeny + pozycje

Cztery różne rzeczy

Co zmienia model, a co tylko sposób jego użycia?

1

Trening wstępny

Uczenie przewidywania tokenów zmienia parametry modelu.

Pretrening: L(θ) = −Σ log p_θ(x_t|x<t)

2

Dostrajanie po treningu

Dalsze uczenie na instrukcjach, ocenach, preferencjach i sygnałach weryfikowalnych.

Posttrening nadal zmienia parametry.

3

Generowanie

Model może wykonać więcej kroków, prób i sprawdzeń wyniku podczas odpowiedzi.

Rozmowa zwykle nie doucza modelu na żywo.

4

Agent

System pozwala modelowi czytać pliki, uruchamiać kod i analizować wyniki narzędzi.

To pętla działania wokół gotowego modelu.

Dlaczego nowsze modele są mocne w matematyce?

Matematyka daje strukturę i informację zwrotną

①

Struktura zapisu

Definicje, dowody i kod zawierają powtarzalne reguły.

②

Ocena wyniku

Rachunek, test lub weryfikator często daje jednoznaczny sygnał.

③

Wiele prób

Więcej czasu obliczeń pozwala sprawdzić kilka sposobów rozwiązania i poprawić błędy.

④

Narzędzia

Python, CAS, testy i programy sprawdzające dowody tworzą zewnętrzny brudnopis.

Matematyka jest dobrym poligonem do sprawdzania AI. Nie oznacza to, że AI jest w niej zawsze wiarygodna.

Codex jako przykład agenta

Nie tylko odpowiada. Może działać i sprawdzać.

1Czytajzadanie, pliki, ograniczenia

→

2Planujhipoteza i małe testy

→

3Działajedytuj, licz, uruchamiaj

→

4Sprawdzajczytaj wynik i poprawiaj

Codex jest przykładem. Ta sama metoda może działać w innych agentach AI.

Co z ideami?

AI może proponować hipotezy i rozwiązania. Trudniej jej ocenić ich wartość.

Mocna strona

Łączenie

Składa znane techniki i analogie w nowe propozycje.

Mocna strona

Przeszukiwanie

Szybko bada wiele wariantów, przykładów i kontrprzykładów.

Brak gwarancji

Nowość i głębia

Nie potrafi niezawodnie ocenić, czy propozycja jest naprawdę nowa, ważna i poprawna.

Brak gwarancji

Intuicja i sens

Nie ma ludzkiego doświadczenia problemu ani odpowiedzialności za kierunek badań.

Zmiana reprezentacji

1 + 2 + 3 + … + 100 = ?

Najpierw sprawdź 1+…+10.

1 + 100 = 101

2 + 99 = 101

3 + 98 = 101

…

50 + 51 = 101

50 × 101 = 5050

Intuicja często polega na takim zapisaniu problemu, aby jego struktura stała się widoczna.

Co znaczy nieskończony zapis?

W liczbach rzeczywistych: 0,999… = 1

0,999… := lim_n→∞(1 − 10⁻ⁿ) = 1

Skrót algebraiczny po zdefiniowaniu granicy

x = 0,999…

10x = 9,999…

9x = 9

x = 1

Droga przez granicę

Skończone przybliżenia to 1 − 10⁻ⁿ.

Gdy n rośnie, 10⁻ⁿ → 0.

Granica wynosi 1.

Zagadka · nie pokazuj alarmu

„Dowód”, że 1 = 2. Wskaż pierwszy niedozwolony krok.

Załóżmy: a = b ≠ 0

a² = ab

a² − b² = ab − b²

(a − b)(a + b) = b(a − b)

a + b = b

2b = b, więc 2 = 1

Najpierw decyzja

Które przejście jest pierwszym błędem?

Nie oceniaj tylko absurdalnego wyniku.

Pierwszy błąd, nie tylko zły wynik

Warunek ukryty w zwykłym „skracaniu”

(a − b)(a + b) = b(a − b)

a + b = b dzielimy przez a − b

ALARMa − b = 0

Dzielenie przez zero nie jest dozwolone.

POLECENIE DLA AGENTA„Sprawdź każdy krok. Wskaż pierwszy błąd i nazwij złamany warunek.”

1Czyta:
a=b

→

2Wylicza:
a−b=0

→

3Odrzuca:
dzielenie przez 0

Dobry audyt sprawdza każdy krok osobno i warunki jego wykonania, a nie tylko końcowe zdanie.

Najważniejszy bezpiecznik

Brzmi pewnie ≠ jest prawdziwe

MATEMATYKA

Elegancko zapisany błąd

Każda linia wygląda znajomo, ale jeden warunek niszczy cały dowód.

FAKTY

„Przekonujący cytat”

Model może wymyślić źródło, datę lub cytat, który brzmi idealnie i nie istnieje.

brzmi pewnie

bardzo

zostało sprawdzone

?

Konkretny problem

Ile prostokątów ma plansza m×k pól?

Definicja problemu

Plansza ma m wierszy i k kolumn. Liczymy prostokąty o bokach na liniach siatki; kwadraty też się liczą.

k+1 linii pionowychm+1 linii poziomych

Pierwszy strzałm·k?

To liczba pól, nie wszystkich prostokątów.

Wybierz graniceC(m+1,2)

Dwie linie poziome wyznaczają górny i dolny bok.

Drugi kierunekC(k+1,2)

Dwie linie pionowe wyznaczają lewy i prawy bok.

Wzór ogólnyR(m,k)

C(m+1,2)·C(k+1,2)

Agent tworzy program, który można sprawdzić

Program znajduje błąd „o jeden”. Matematyka wyjaśnia wzór.

POLECENIE„Napisz program dla m×k. Najpierw przetestuj 1×1, 1×2 i 2×3.”

Plan

Wybór dwóch z m+1 linii poziomych i dwóch z k+1 linii pionowych.

C(m+1,2) · C(k+1,2)

- range(width)+ range(width + 1)

codex · rectangle_demo.py

$ gotowy do uruchomienia testów

Komputer sprawdził: konkretne przypadki.Matematyka wyjaśniła: każdy prostokąt odpowiada wyborowi czterech linii.

Wiele sukcesów nie daje dowodu

Dla jakiego pierwszego n wartość n²+n+41 nie jest pierwsza?

n²+n+41

Dla n=0,1,…,39 otrzymujemy liczby pierwsze.

for (let n = 0; ; n++) {
  const value = n*n + n + 41;
  if (classify(value) !== "prime") {
    console.log({n, value});
    break;
  }
}

$ szukam pierwszej porażki…czekam

Komputer znalazł: pierwszy kontrprzykład w badanej kolejności.Matematyka nadal potrzebuje: powodu, dlaczego pojawia się właśnie tam.

Kontrprzykład nie jest przypadkiem

Podstaw n = c−1

f_c(n) = n²+n+c

f_c(c−1) = (c−1)²+(c−1)+c

= c²

c=41n=40

f₄₁(40)=41²=1681

Przypadek brzegowyc=1, n=0

Wynik 1 nie jest ani pierwszy, ani złożony.

Ten sam problem · inna rola AI

Jedno pytanie diagnostyczne. Jedna wskazówka. Stop.

UczeńMyślę, że dla 8×8 odpowiedź to 64. Oto moja próba.

AIIle pionowych linii ogranicza osiem kolumn pól?

UczeńDziewięć. Wybieram lewą i prawą granicę.

AIIle nieuporządkowanych par można wybrać z dziewięciu linii?

UczeńC(9,2)=36. W obu kierunkach: 36·36=1296.

AITeraz samodzielnie przenieś metodę na planszę 2×3.

WARUNEK SUKCESUUczeń rozwiązuje nowy wariant i wyjaśnia metodę bez transkryptu AI.

Własna próba: ujawnia rzeczywisty punkt startu.
Diagnoza: jedno pytanie znajduje lukę.
Wskazówka: nie zastępuje kolejnego kroku ucznia.
Sprawdzenie: mały przypadek testuje metodę.
Transfer: nowy problem potwierdza naukę.

Prompt, który wspiera naukę

Polecenie, które wyręcza, kontra polecenie, które pomaga się uczyć

SŁABO

„Rozwiąż to.”

Nie określa celu, roli ani momentu zatrzymania.

LEPIEJ

„Uczę się tego tematu. Nie rozwiązuj całego zadania. Najpierw zadaj jedno pytanie diagnostyczne. Potem daj jedną wskazówkę i poczekaj. Na końcu poproś mnie o wyjaśnienie własnymi słowami. Oto moja próba: …”

Pięć pytań kontrolnych

Zanim zaufasz odpowiedzi

1Jakie założenie jest tu użyte?
2Jaki jest najprostszy mały przykład, na którym mogę to sprawdzić?
3Jaki jest przypadek brzegowy?
4Czy mogę sprawdzić to inną metodą, narzędziem lub źródłem?
5Czy umiem wyjaśnić wynik bez rozmowy z AI?

Nie tylko Codex

Te same nawyki pomagają przy różnych narzędziach AI

Proś o pytania, nie tylko odpowiedzi. Proś o jawne założenia. Proś o przypadki brzegowe. Oddziel rachunek od dowodu. Zapytaj: co zmieniłoby tę odpowiedź? Sprawdź samodzielnie, z nauczycielem, podręcznikiem albo kodem.

„Najpierw spróbuj” w praktyce

Daj sobie 3–5 minut przed otwarciem AI

03:00

Co wiem?Definicje, dane, podobne zadania.
Czego próbuję?Rysunek, hipoteza, rachunek, mały przykład.
Na którym dokładnie kroku utknąłem?Pokaż AI własną próbę i wskaż konkretny punkt, w którym potrzebujesz pomocy.

Używaj tak, żeby nie stracić nauki

AI w szkole: sześć zasad

Stosuj zasady zadania.Jeśli nauczyciel mówi „bez AI”, nie używaj AI.
Zacznij od własnej próby.Zachowaj szkic, pytania i miejsce utknięcia.
Proś najpierw o pytanie lub wskazówkę.Nie pozwól, aby narzędzie wykonało za ciebie właśnie tę część, której masz się nauczyć.
Chroń dane i cudze materiały.Nie wpisuj nazwisk, ocen, informacji o zdrowiu, haseł ani prywatnych rozmów. Nie przesyłaj materiałów, których nie wolno ci udostępniać.
Ujawnij pomoc, gdy trzeba.Napisz, czy AI pomogło w pomyśle, kodzie, stylu lub sprawdzeniu.
Odpowiedzialność zostaje u ciebie.Na egzaminie, konkursie i w pracy ocenianej obowiązują osobne reguły.

Warunki są częścią twierdzenia

Małe twierdzenie Fermata i test pierwszości

TWIERDZENIEp pierwsza ⇒ a^p ≡ a (mod p)

Dla każdego całkowitego a.

WERSJA DLA NWD=1p pierwsza i NWD(a,p)=1 ⇒ a^p−1 ≡ 1 (mod p)

Ta postać prowadzi do testu Fermata.

PSEUDOPIERWSZAn złożona, NWD(a,n)=1

Jeśli mimo to aⁿ⁻¹ ≡ 1 (mod n), liczba n jest pseudopierwsza przy podstawie a.

Sprawdzanie nie jest dowodem

341 przechodzi test Fermata dla podstawy 2

agent · fermat_test.pyNWD(2,n)=1

UczeńNie potwierdzaj hipotezy. Szukaj złożonego n, które przejdzie test.

AgentSprawdzę NWD(2,n)=1 i warunek 2ⁿ⁻¹≡1 (mod n).

JavaScript · modular exponentiation

$ czekam na test

FAKTORYZACJA341 = 11 · 31Liczba jest złożona.

TEST2³⁴⁰ ≡ 1 (mod 341)Przejście testu nie dowodzi pierwszości.

WYJAŚNIENIE

10 | 340 i 2¹⁰≡1 (mod 11); 5 | 340 i 2⁵≡1 (mod 31). Ponieważ NWD(11,31)=1, otrzymujemy 2³⁴⁰≡1 (mod 341).

Sprawdź po wykładzie

Slajdy, źródła i laboratoria

Kod QR prowadzący do publicznej strony prezentacji

nasqret.github.io/czy-ai-zastapi-nasza-glowe

Stabilna zasada: weryfikuj twierdzenia i warunki.Zmienna część: funkcje produktów, modele i benchmarki szybko się starzeją.

Uczniowie z pomocnikiem AI badają nasiona pomysłów, z których wyrasta geometryczne drzewo

Odpowiedź po 35 minutach

Nie oddawaj
odpowiedzialności.

Zlecaj obliczenia, szkice i testy. Zachowaj rozumienie, kontrolę i wybór kierunku.

Po użyciu AI: czy rozumiem więcej i umiem to wyjaśnić?

Dodatek · bibliografia

Na czym opiera się ten wykład?

Vaswani i in. (2017)Transformer i mechanizm uwagi Ouyang i in. (2022)Uczenie wykonywania instrukcji Lightman i in. (2023)Weryfikacja krok po kroku OpenAI (2024)Rozumowanie i uczenie ze wzmocnieniem OpenAI CodexDokumentacja i dobre praktyki Źródła projektuPełna bibliografia, zastrzeżenia i data sprawdzenia

Dodatek · pytania z sali

Trzy rozróżnienia, których warto pilnować

Wynik a rozumienie

Poprawna odpowiedź nie rozstrzyga, czy model ma ludzką intuicję lub doświadczenie świata.

Kandydat a idea naukowa

Nowa kombinacja może być użyteczna, ale nowość, znaczenie i autorstwo wymagają niezależnej oceny.

Sprawdzenie a zaufanie

Ufamy w granicach, w których znamy metodę kontroli i akceptujemy koszt błędu.