Jak używać AI w zadaniach wymagających myślenia, nie oddając mu kontroli nad rozumowaniem.
Bartosz NaskręckiUAM/CCAIWarszawa, 8.06.2026
Anonimowa sonda
Do czego najczęściej używasz AI?
?
Wyjaśnij
Pomóż mi zrozumieć temat, który nadal jest niejasny.
{ }
Wykonaj
Napisz kod, tekst, prezentację albo rozwiąż zadanie.
✓
Sprawdź
Znajdź pierwszy błąd, przetestuj przypadek, zadaj pytanie.
Większość z nas bywa w każdej z tych sytuacji. Nie chodzi o poczucie winy, tylko o kontrolę.
Teza na dziś
AI może wykonać za nas część czynności i dostarczyć gotowy wynik.
Nie przejmuje jednak twojej odpowiedzialności za rozumienie, sprawdzanie i wybór.
Najważniejsze pytanie nie brzmi: „czy AI myśli?”, tylko: „czy po jej użyciu ja rozumiem więcej?”.
Podstawowy mechanizm GPT
Jaki token najlepiej pasuje jako następny?
235711?
13 72%12 16%17 8%kot 4%
Model przewiduje token na podstawie struktur poznanych podczas treningu. To nie jest losowe zgadywanie, ale też nie gwarancja rozumienia.
Procenty są ilustracyjne. Model może próbkować odpowiedź, zamiast zawsze wybierać najczęstszy token.
Jak tekst trafia do modelu?
Najpierw tokenizer dzieli tekst na tokeny
Token może być słowem, częścią słowa, symbolem albo fragmentem kodu.
matematyka!
Podział zależy od tokenizera. Token nie jest „pojęciem” w ludzkim sensie.
Abstrakcja jest super!
✦ ✦ ✦
Abstrakcjajestsuper!
Mechanizm uwagi · attention
Model przypisuje wagi fragmentom kontekstu
Ola powiedziała Mai, że ona wygrała.
Dla każdej pozycji model oblicza, jak silnie połączyć ją z poszczególnymi wcześniejszymi pozycjami.
To operacja algebraiczna, nie świadoma uwaga. Same wagi nie są pełnym wyjaśnieniem odpowiedzi.
Jedna głowa uwagi w GPT
Wagi określają wkład wcześniejszych pozycji
A(Q,K,V) = softmax((QKT + M) / √dk)V
Qzapytania: czego szuka pozycja?
Kklucze: do czego można ją porównać?
Vwartości: jaka informacja zostanie połączona?
Q = XWQK = XWKV = XWV
`M` jest maską przyczynową: pozycja nie może korzystać z przyszłych tokenów.
Dlaczego GPT nie podgląda przyszłości?
Maska przyczynowa nadaje przyszłym pozycjom wagę zero
235?
21.0×××
3.3.7××
5.2.3.5×
?.1.2.3.4
Wiersz opisuje jedną ważoną kombinację wcześniejszych wartości.
Wiele głów może równolegle wychwytywać inne zależności.
Wiele warstw
Jedna operacja uwagi to dopiero początek
Każda warstwa łączy informacje z kontekstu i przekształca wektory reprezentujące tokeny.
Nie ma jednej szuflady „twierdzenie Pitagorasa”. Wiedza i procedury są rozproszone w wielu parametrach i aktywacjach.
rozkład następnego tokenu
uwaga + sieć feed-forward
uwaga + sieć feed-forward
⋮
uwaga + sieć feed-forward
tokeny + pozycje
Cztery różne rzeczy
Co zmienia model, a co tylko sposób jego użycia?
1
Trening wstępny
Uczenie przewidywania tokenów zmienia parametry modelu.
Pretrening: L(θ) = −Σ log pθ(xt|x<t)2
Dostrajanie po treningu
Dalsze uczenie na instrukcjach, ocenach, preferencjach i sygnałach weryfikowalnych.
Posttrening nadal zmienia parametry.3
Generowanie
Model może wykonać więcej kroków, prób i sprawdzeń wyniku podczas odpowiedzi.
Rozmowa zwykle nie doucza modelu na żywo.4
Agent
System pozwala modelowi czytać pliki, uruchamiać kod i analizować wyniki narzędzi.
To pętla działania wokół gotowego modelu.
Dlaczego nowsze modele są mocne w matematyce?
Matematyka daje strukturę i informację zwrotną
①
Struktura zapisu
Definicje, dowody i kod zawierają powtarzalne reguły.
②
Ocena wyniku
Rachunek, test lub weryfikator często daje jednoznaczny sygnał.
③
Wiele prób
Więcej czasu obliczeń pozwala sprawdzić kilka sposobów rozwiązania i poprawić błędy.
④
Narzędzia
Python, CAS, testy i programy sprawdzające dowody tworzą zewnętrzny brudnopis.
Matematyka jest dobrym poligonem do sprawdzania AI. Nie oznacza to, że AI jest w niej zawsze wiarygodna.
Codex jako przykład agenta
Nie tylko odpowiada. Może działać i sprawdzać.
1Czytajzadanie, pliki, ograniczenia
→
2Planujhipoteza i małe testy
→
3Działajedytuj, licz, uruchamiaj
→
4Sprawdzajczytaj wynik i poprawiaj
Codex jest przykładem. Ta sama metoda może działać w innych agentach AI.
Co z ideami?
AI może proponować hipotezy i rozwiązania. Trudniej jej ocenić ich wartość.
Mocna strona
Łączenie
Składa znane techniki i analogie w nowe propozycje.
Mocna strona
Przeszukiwanie
Szybko bada wiele wariantów, przykładów i kontrprzykładów.
Brak gwarancji
Nowość i głębia
Nie potrafi niezawodnie ocenić, czy propozycja jest naprawdę nowa, ważna i poprawna.
Brak gwarancji
Intuicja i sens
Nie ma ludzkiego doświadczenia problemu ani odpowiedzialności za kierunek badań.
Zmiana reprezentacji
1 + 2 + 3 + … + 100 = ?
Najpierw sprawdź 1+…+10.
1 + 100 = 101
2 + 99 = 101
3 + 98 = 101
…
50 + 51 = 101
50 × 101 = 5050
Intuicja często polega na takim zapisaniu problemu, aby jego struktura stała się widoczna.
Co znaczy nieskończony zapis?
W liczbach rzeczywistych: 0,999… = 1
0,999… := limn→∞(1 − 10−n) = 1
Skrót algebraiczny po zdefiniowaniu granicy
x = 0,999…
10x = 9,999…
9x = 9
x = 1
Droga przez granicę
Skończone przybliżenia to 1 − 10−n.
Gdy n rośnie, 10−n → 0.
Granica wynosi 1.
Zagadka · nie pokazuj alarmu
„Dowód”, że 1 = 2. Wskaż pierwszy niedozwolony krok.
Załóżmy: a = b ≠ 0
a² = ab
a² − b² = ab − b²
(a − b)(a + b) = b(a − b)
a + b = b
2b = b, więc 2 = 1
Najpierw decyzja
Które przejście jest pierwszym błędem?
Nie oceniaj tylko absurdalnego wyniku.
Pierwszy błąd, nie tylko zły wynik
Warunek ukryty w zwykłym „skracaniu”
(a − b)(a + b) = b(a − b)
a + b = b dzielimy przez a − b
ALARMa − b = 0
Dzielenie przez zero nie jest dozwolone.
POLECENIE DLA AGENTA„Sprawdź każdy krok. Wskaż pierwszy błąd i nazwij złamany warunek.”
1Czyta: a=b
→
2Wylicza: a−b=0
→
3Odrzuca: dzielenie przez 0
Dobry audyt sprawdza każdy krok osobno i warunki jego wykonania, a nie tylko końcowe zdanie.
Najważniejszy bezpiecznik
Brzmi pewnie ≠ jest prawdziwe
MATEMATYKA
Elegancko zapisany błąd
Każda linia wygląda znajomo, ale jeden warunek niszczy cały dowód.
FAKTY
„Przekonujący cytat”
Model może wymyślić źródło, datę lub cytat, który brzmi idealnie i nie istnieje.
brzmi pewnie
bardzo
zostało sprawdzone
?
Konkretny problem
Ile prostokątów ma plansza m×k pól?
Definicja problemu
Plansza ma m wierszy i k kolumn. Liczymy prostokąty o bokach na liniach siatki; kwadraty też się liczą.
k+1 linii pionowychm+1 linii poziomych
Pierwszy strzałm·k?
To liczba pól, nie wszystkich prostokątów.
Wybierz graniceC(m+1,2)
Dwie linie poziome wyznaczają górny i dolny bok.
Drugi kierunekC(k+1,2)
Dwie linie pionowe wyznaczają lewy i prawy bok.
Wzór ogólnyR(m,k)
C(m+1,2)·C(k+1,2)
Agent tworzy program, który można sprawdzić
Program znajduje błąd „o jeden”. Matematyka wyjaśnia wzór.
POLECENIE„Napisz program dla m×k. Najpierw przetestuj 1×1, 1×2 i 2×3.”
Plan
Wybór dwóch z m+1 linii poziomych i dwóch z k+1 linii pionowych.
C(m+1,2) · C(k+1,2)
- range(width)+ range(width + 1)
codex · rectangle_demo.py
$ gotowy do uruchomienia testów
Komputer sprawdził: konkretne przypadki.Matematyka wyjaśniła: każdy prostokąt odpowiada wyborowi czterech linii.
Wiele sukcesów nie daje dowodu
Dla jakiego pierwszego n wartość n²+n+41 nie jest pierwsza?
n²+n+41
Dla n=0,1,…,39 otrzymujemy liczby pierwsze.
for (let n = 0; ; n++) {
const value = n*n + n + 41;
if (classify(value) !== "prime") {
console.log({n, value});
break;
}
}
$ szukam pierwszej porażki…czekam
Komputer znalazł: pierwszy kontrprzykład w badanej kolejności.Matematyka nadal potrzebuje: powodu, dlaczego pojawia się właśnie tam.
Kontrprzykład nie jest przypadkiem
Podstaw n = c−1
fc(n) = n²+n+c
fc(c−1) = (c−1)²+(c−1)+c
= c²
c=41n=40
f41(40)=41²=1681
Przypadek brzegowyc=1, n=0
Wynik 1 nie jest ani pierwszy, ani złożony.
Ten sam problem · inna rola AI
Jedno pytanie diagnostyczne. Jedna wskazówka. Stop.
UczeńMyślę, że dla 8×8 odpowiedź to 64. Oto moja próba.
AIIle pionowych linii ogranicza osiem kolumn pól?
UczeńDziewięć. Wybieram lewą i prawą granicę.
AIIle nieuporządkowanych par można wybrać z dziewięciu linii?
UczeńC(9,2)=36. W obu kierunkach: 36·36=1296.
AITeraz samodzielnie przenieś metodę na planszę 2×3.
WARUNEK SUKCESUUczeń rozwiązuje nowy wariant i wyjaśnia metodę bez transkryptu AI.
Własna próba: ujawnia rzeczywisty punkt startu.
Diagnoza: jedno pytanie znajduje lukę.
Wskazówka: nie zastępuje kolejnego kroku ucznia.
Sprawdzenie: mały przypadek testuje metodę.
Transfer: nowy problem potwierdza naukę.
Prompt, który wspiera naukę
Polecenie, które wyręcza, kontra polecenie, które pomaga się uczyć
SŁABO
„Rozwiąż to.”
Nie określa celu, roli ani momentu zatrzymania.LEPIEJ
„Uczę się tego tematu. Nie rozwiązuj całego zadania. Najpierw zadaj jedno pytanie diagnostyczne. Potem daj jedną wskazówkę i poczekaj. Na końcu poproś mnie o wyjaśnienie własnymi słowami. Oto moja próba: …”
Pięć pytań kontrolnych
Zanim zaufasz odpowiedzi
1Jakie założenie jest tu użyte?
2Jaki jest najprostszy mały przykład, na którym mogę to sprawdzić?
3Jaki jest przypadek brzegowy?
4Czy mogę sprawdzić to inną metodą, narzędziem lub źródłem?
5Czy umiem wyjaśnić wynik bez rozmowy z AI?
Nie tylko Codex
Te same nawyki pomagają przy różnych narzędziach AI
Proś o pytania, nie tylko odpowiedzi.Proś o jawne założenia.Proś o przypadki brzegowe.Oddziel rachunek od dowodu.Zapytaj: co zmieniłoby tę odpowiedź?Sprawdź samodzielnie, z nauczycielem, podręcznikiem albo kodem.
„Najpierw spróbuj” w praktyce
Daj sobie 3–5 minut przed otwarciem AI
03:00
Co wiem?Definicje, dane, podobne zadania.
Czego próbuję?Rysunek, hipoteza, rachunek, mały przykład.
Na którym dokładnie kroku utknąłem?Pokaż AI własną próbę i wskaż konkretny punkt, w którym potrzebujesz pomocy.
Używaj tak, żeby nie stracić nauki
AI w szkole: sześć zasad
Stosuj zasady zadania.Jeśli nauczyciel mówi „bez AI”, nie używaj AI.
Zacznij od własnej próby.Zachowaj szkic, pytania i miejsce utknięcia.
Proś najpierw o pytanie lub wskazówkę.Nie pozwól, aby narzędzie wykonało za ciebie właśnie tę część, której masz się nauczyć.
Chroń dane i cudze materiały.Nie wpisuj nazwisk, ocen, informacji o zdrowiu, haseł ani prywatnych rozmów. Nie przesyłaj materiałów, których nie wolno ci udostępniać.
Ujawnij pomoc, gdy trzeba.Napisz, czy AI pomogło w pomyśle, kodzie, stylu lub sprawdzeniu.
Odpowiedzialność zostaje u ciebie.Na egzaminie, konkursie i w pracy ocenianej obowiązują osobne reguły.
Warunki są częścią twierdzenia
Małe twierdzenie Fermata i test pierwszości
TWIERDZENIEp pierwsza ⇒ ap ≡ a (mod p)
Dla każdego całkowitego a.
WERSJA DLA NWD=1p pierwsza i NWD(a,p)=1 ⇒ ap−1 ≡ 1 (mod p)
Ta postać prowadzi do testu Fermata.
PSEUDOPIERWSZAn złożona, NWD(a,n)=1
Jeśli mimo to an−1 ≡ 1 (mod n), liczba n jest pseudopierwsza przy podstawie a.
Sprawdzanie nie jest dowodem
341 przechodzi test Fermata dla podstawy 2
agent · fermat_test.pyNWD(2,n)=1
UczeńNie potwierdzaj hipotezy. Szukaj złożonego n, które przejdzie test.
AgentSprawdzę NWD(2,n)=1 i warunek 2n−1≡1 (mod n).
JavaScript · modular exponentiation
$ czekam na test
FAKTORYZACJA341 = 11 · 31Liczba jest złożona.
TEST2340 ≡ 1 (mod 341)Przejście testu nie dowodzi pierwszości.
WYJAŚNIENIE
10 | 340 i 210≡1 (mod 11); 5 | 340 i 25≡1 (mod 31). Ponieważ NWD(11,31)=1, otrzymujemy 2340≡1 (mod 341).
Sprawdź po wykładzie
Slajdy, źródła i laboratoria
nasqret.github.io/czy-ai-zastapi-nasza-glowe
Stabilna zasada: weryfikuj twierdzenia i warunki.Zmienna część: funkcje produktów, modele i benchmarki szybko się starzeją.
Odpowiedź po 35 minutach
Nie oddawaj odpowiedzialności.
Zlecaj obliczenia, szkice i testy. Zachowaj rozumienie, kontrolę i wybór kierunku.
Po użyciu AI: czy rozumiem więcej i umiem to wyjaśnić?