{<Z Kordian Zadrożny

AI, Strony WWW, Programowanie, Bazy danych

Halucynacje AI bez tajemnic: Dlaczego ChatGPT zmyśla i jak możemy to naprawić?

Halucynacje AI bez tajemnic: Dlaczego ChatGPT zmyśla i jak możemy to naprawić?

Przeczytałem bardzo ciekawy artykuł (https://arxiv.org/pdf/2509.04664) "Why Language Models Hallucinate" ("Dlaczego modele językowe halucynują") autorstwa Adama Taumana Kalai, Ofira Nachuma, Santosha S. Vempali i Edwina Zhanga. Panowie analizują przyczyny powstawania tak zwanych "Halucynacji", czyli sytuacji, gdzie model językowy (LLM czyli popularnie AI) mówi coś absolutnie wiarygodnie brzmiącego, ale zupełnie nieprawdziwego. Czy zdarzyło Ci się kiedyś zapytać o coś chatbota AI i dostać w odpowiedzi pięknie sformułowaną, pewną siebie… nieprawdę? Może to być zmyślony tytuł książki, nieistniejący fakt historyczny albo, jak w przykładzie z pewnego badania, trzy różne, nieprawidłowe daty urodzin tej samej osoby. To zjawisko, nazywane w branży "halucynacjami", jest jedną z największych barier na drodze do pełnego zaufania sztucznej inteligencji. Nowy artykuł naukowy rzuca światło na ten problem, argumentując, że halucynacje nie są tajemniczą usterką, ale logiczną konsekwencją tego, jak trenujemy i oceniamy modele językowe. Krótko mówiąc: sami nauczyliśmy AI, że zgadywanie się opłaca. Grzech pierworodny AI: Błędy z etapu treningu Wszystko zaczyna się na etapie "pretrainingu", kiedy model przetrawia gigantyczne ilości tekstu z internetu, by nauczyć się wzorców językowych. Autorzy badania pokazują, że nawet przy idealnie czystych danych treningowych, statystyka jest nieubłagana. Wyjaśniają to przez sprytne porównanie do problemu klasyfikacji binarnej. Wyobraźmy sobie, że zadaniem AI nie jest generowanie tekstu, ale odpowiadanie "prawda" lub "fałsz" na stwierdzenia. Okazuje się, że generowanie poprawnych zdań jest znacznie trudniejsze niż sama ocena ich poprawności. Co więcej, badacze ustalili matematyczną zależność: wskaźnik błędów generowanych przez model jest co najmniej dwukrotnie wyższy niż jego wskaźnik błędów w ocenie, co jest prawdą, a co fałszem. Szczególnie dobrze widać to na przykładzie faktów, które w danych treningowych pojawiają się bardzo rzadko. Jeśli...

czytaj dalej
Co ma wspólnego IT/AI, karate i pisanie science fiction? Witajcie na moim blogu.

Co ma wspólnego IT/AI, karate i pisanie science fiction? Witajcie na moim blogu.

Cześć, jestem Kordian. Od ponad dwudziestu lat świat IT stanowi moje naturalne środowisko. Na co dzień prowadzę zespół IT, projektuję i tworzę systemy informatyczne. Ale kiedy kończy się dzień pracy, moja pasja do technologii wcale się nie kończy. Od zawsze fascynowało mnie łączenie pozornie odległych elementów. Co łączy dyscyplinę, której nauczyłem się na macie karate, z projektowaniem systemów IT? Jak myślenie o statkach kosmicznych może przyczynić się do tworzenia lepszych aplikacji biznesowych? I w jaki sposób sztuczna inteligencja zmienia zasady gry nie tylko w naszej pracy zawodowej, ale w całym naszym życiu? Ten blog to przestrzeń, w której chcę właśnie o tym rozmawiać. Bez korporacyjnego żargonu – jestem człowiekiem starej daty, z czasów sprzed wielkiej korporatyzacji i mimo pracy w takich organizacjach, niektóre standardy nadal są mi obce. Chcę się tu dzielić trzema obszarami, które mnie szczególnie interesują: Technologia, która ma rzeczywisty sens: Praktyczne spojrzenie na AI, systemy ERP i szerzej – systemy IT wspierające biznes. Będziemy analizować, jak technologia może realnie pomagać firmom, a nie tylko efektownie prezentować się w slajdach. Chcę pokazać prawdziwe zastosowania AI – nie marketingowe obietnice kończące się prototypami i niczym więcej (poza znacznymi stratami), ale zrozumienie mechanizmów działania dużych modeli językowych i obszarów, gdzie faktycznie warto je dziś wykorzystać. Wielkie pytania: Nauka, kosmos i wszystko, co każe nam patrzeć w gwiazdy z pytaniem "co dalej?". To moja nieustająca fascynacja od momentu, gdy nauczyłem się czytać. Nauka i science fiction – po prostu to kocham. Kreatywność w działaniu: Czasem piszę opowiadania science fiction. Do tej pory trafiały do szuflady, ale pomyślałem, że czas z nią skończyć i postanowiłem dzielić się tu od czasu do czasu owocami tej twórczej radości. Krótko mówiąc, będzie to blog o technologii z ludzką twarzą. Żeby dać przedsmak tego, o czym będziemy rozmawiać, oto kilka newsów, które...

czytaj dalej