Jesli grales w *Zork* za dawnych czasow (albo odkryles go pozniej, jak wiekszosc ludzi), to wiesz jak to wygladalo: "Stoisz na otwartym polu na zachod od bialego domu." Zadnego obrazka. Zadnej sciezki dzwiekowej. Tylko slowa i twoja wyobraznia robiaca cala robote.

Przez prawie 50 lat to byl standard fikcji interaktywnej. Historie stawaly sie coraz lepsze, zwlaszcza gdy generatory tekstu oparte na AI, takie jak AI Dungeon, pojawily sie w 2019 roku, ale wizualnie nic sie nie zmienilo: tekst na ekranie i, jesli miales szczescie, kilka statycznych obrazkow, gdy tworca mial budzet na grafike.

To sie teraz szybko zmienia. Generowanie obrazow przez AI jest juz wystarczajaco dobre i szybkie, by ilustrowac kazda scene w locie. Nie generyczny stock art, ale ilustracje odzwierciedlajace to, co dzieje sie w twojej historii, z twoim bohaterem, w stylu artystycznym pasujacym do danej chwili. I to przeksztalca fikcje interaktywna w cos, co wydaje sie zupelnie inne od wszystkiego, co bylo wczesniej.

Jak do tego doszlismy

Porownanie klasycznej przygody tekstowej na zielonym terminalu z bogato ilustrowana przez AI scena jaskini

Krotka lekcja historii. Infocom stworzyl *Zork* i *Planetfall* pod koniec lat 70. i w latach 80., i to byl czysty tekst. Lata 90. przyniosly przygodowki typu "wskazz i kliknij" (pomysl o *Monkey Island*), lata 2000 daly nam visual novel, a w 2019 AI Dungeon pokazal, ze model jezykowy moze generowac nieskonczone sciezki fabularne w czasie rzeczywistym.

Ale nawet AI Dungeon pozostal czysto tekstowy. AI moglo napisac o smoku atakujacym zamek, ale trzeba bylo sobie to wyobrazic. Nie bylo warstwy wizualnej.

Wtedy modele generowania obrazow, takie jak DALL-E, Midjourney, Stable Diffusion i FLUX, nadrobily zaleglosci. Nagle mozna bylo zamienic opis tekstowy w szczegolowa ilustracje w kilka sekund. Pytanie przestalo brzmiec "czy potrafimy tworzyc obrazy z tekstu?" i zamienilo sie w "czy mozemy to zintegrowac z silnikiem gry na tyle dobrze, by grafika wydawala sie czescia historii?"

Okazuje sie, ze tak. A wyniki sa naprawde imponujace.

Dlaczego to wieksze niz sie wydaje

Wstawianie obrazkow do historii to nic nowego. Ksiazki typu "wybierz swoja przygode" mialy ilustracje juz dziesieciolecia temu. Roznica polega na tym, ze sztuka AI jest proceduralna: powstaje od nowa dla kazdej sceny, kazdej rozgrywki, kazdej decyzji. Oto co naprawde zmienia sie w praktyce:

Zadna rozgrywka nie wyglada tak samo

W tradycyjnej grze artysta rysuje okreslona liczbe scen, ktore sa ponownie uzywane. Przy generowaniu przez AI, jesli wybierasz jaskinie zamiast mostu, nie dostajesz generycznego "jaskinia.jpg" wyciagnietego z folderu. Dostajesz te jaskinie, w tym momencie historii, z twoim bohaterem u wejscia trzymajacym to, co zebral trzy sceny wczesniej. Zagraj ponownie, podejmij inne decyzje, a kazda ilustracja bedzie inna.

Grafika reaguje na twoje wybory

Kiedy decydujesz sie negocjowac z bandytami zamiast walczyc, wygenerowana scena nie przeskakuje po prostu do szablonu "rozmowy". Widac napiecie w mowie ciala, opuszczona bron, ognisko miedzy dwiema grupami. Grafika wzmacnia emocjonalny ciezar twojej decyzji. Konsekwencje staja sie widoczne, a nie tylko opisane.

Nie potrzebujesz juz budzetu na grafike

To ma wieksze znaczenie, niz ludzie sadza. Przed sztuka AI stworzenie wizualnie bogatej interaktywnej historii oznaczalo zatrudnianie artystow i zamawianie setek ilustracji. Tylko dobrze finansowane studia mogly sobie na to pozwolic. Teraz samodzielny tworca moze zbudowac epicka fantazje, kryminalna historie noir albo przygode dla dzieci, a kazda scena bedzie miala wlasna unikalna ilustracje. Pole gry zostalo wyrownane z dnia na dzien.

Widzenie dziala inaczej niz czytanie

Jest powod, dla ktorego filmy oddzialuja silniej niz ksiazki na wiekszosc ludzi (przepraszam, miloscicy ksiazek). Obrazy tworza natychmiastowy wplyw emocjonalny. Kiedy widzisz plonace miasto, bo podjales zla decyzje, lub wschod slonca nad krolestwem, ktore wlasnie uratowales, to uderza inaczej niz akapit to opisujacy. Sztuka AI zamyka przepasc miedzy "interaktywna ksiazka" a "grywalnym filmem."

Najtrudniejsza czesc: spojnosc postaci

Ta sama postac wojownika renderowana spojnie w czterech stylach: anime, akwarela, filmowy i pixel art

Kazdy, kto bawal sie Midjourney albo DALL-E, zna glowny problem: popros AI o narysowanie tej samej postaci dwa razy, a dostaniesz dwie zupelnie rozne osoby. Inna twarz, inne wlosy, inna budowa ciala. Przy pojedynczym obrazku to nie przeszkadza, ale w grze narracyjnej, gdzie masz byc bohaterem przez dziesiatki scen, to rujnuje wszystko.

Rozwiazanie tego problemu nie polega na pisaniu lepszych promptow. Wymaga calego potoku przetwarzania: obrazow referencyjnych postaci, osadzania stylu, sterowania pozami, logiki kompozycji. Tego rodzaju prace jest naprawde trudno zestawic samodzielnie.

Tutaj platformy zaprojektowane specjalnie do tego celu odrozniaja sie od podejscia "uzyj ChatGPT". W aiga_ mozesz na przyklad wgrac swoje zdjecie, a AI renderuje cie jako glownego bohatera w kazdej scenie. Twoja twarz, twoje ubranie, twoje proporcje pozostaja spojne niezaleznie od tego, czy historia jest w stylu anime, akwareli, realizmu filmowego czy jakimkolwiek innym. Scena pierwsza i scena pieczdziesiata wyglada jak ta sama osoba. Moze to brzmi jak szczegol, ale to roznica miedzy sztuczka a czyms, co naprawde wciaga.

Styl artystyczny jako narzedzie narracyjne

W tradycyjnych grach styl wizualny jest ustalany na etapie tworzenia. Gra jest albo w pixel arcie, albo fotorealistyczna. Wybierasz jeden i koniec. Przy generowaniu AI styl moze zmieniac sie w zaleznosci od tego, co dzieje sie w historii.

Wyobraz sobie historie horroru, ktora zaczyna sie cieplymi, przyjemnymi akwarelami i stopniowo przechodzi w ciemny, szorstki wegiel w miare narastania napiec. Albo przygode z podroza w czasie, gdzie sekcje sredniowieczne wygladaja jak gobeliny, sceny z lat 20. sa w stylu Art Deco, a przyszlosc to neonowy cyberpunk. Sam styl artystyczny staje sie czescia narracji. Czujesz zmiane nastroju, zanim jeszcze przeczytasz tekst.

aiga_ juz teraz pozwala tworcom wybierac z biblioteki stylow artystycznych dla swoich swiatow. Historia dla dzieci moze uzywac jasnych, animowanych ilustracji. Dark fantasy stosuje filmowe oswietlenie. Komedia opiera sie na przesadzonych karykaturach. Teraz to wybor tworcey, nie ograniczenie produkcyjne.

Tryb wieloosobowy czyni to jeszcze lepszym

Kilku graczy zebranych wokol stolu ze swiecaca mapa fantasy, glosujacych nad decyzjami fabularnymi w wieloosobowej grze AI

Granie w pojedynke jest swietne, ale magia naprawde dziala w grupie. Grupa ludzi glosuje nad decyzja w historii, AI przetwarza zwycieska opcje, i wszyscy widza zupelnie nowa ilustracje tego, co wlasnie sie stalo. Nikt wczesniej nie widzial tego obrazu. Zostal stworzony na podstawie zbiorowej decyzji grupy. Jest w tym cos naprawde ekscytujacego.

Dzieki polaczeniom aiga_ z Discordem, Telegramem i X wszystko odbywa sie bezposrednio na platformach, z ktorych ludzie juz korzystaja. Spolecznosc na Discordzie glosuje, czy szturmowac zamek, czy wkrasc sie przez kanaly, a wynik pojawia sie jako ilustrowana scena opublikowana prosto na kanale. To zamienia serwer czatowy w cos o wiele ciekawszego.

Dla tworcow tresci i marek jest tu ciekawy efekt uboczny: kazda sesja generuje strumien unikalnych tresci wizualnych. Kazdy obraz nadaje sie do udostepnienia, kazdy powstal z zaangazowania publicznosci. To organiczna tresc, ktora tworzy sie sama.

Co to otwiera dla roznych grup ludzi

Ciekawa rzecza w fikcji interaktywnej ilustrowanej przez AI jest liczba zastosowan, ktore odblokowuje. Nie tylko dla "graczy", ale dla ludzi, ktorych normalnie nie kojarzylbys z przygodami tekstowymi:

  • Tworca swiatow i projektanci gier moga prototypowac wizualnie bogate swiaty w godziny zamiast miesiecy. Skup sie na historii i logice rozgalezien, pozwol AI zajac sie grafika, a potem udostepnij swoj swiat spolecznosci, by inni mogli w nim grac.
  • Mistrzowie gier fabularnych moga prowadzic kampanie, w ktorych kazde spotkanie ma wlasna ilustracje. Twoi gracze widza smoka, NPC-a, loch. Koniec z "ok, wyobrazcie sobie duza sale z kolumnami."
  • Nauczyciele moga tworzyc interaktywne lekcje, w ktorych historia i nauka zyskuja wizualny wymiar. Uczniowie nie tylko czytaja o starozytnym Rzymie. Widza go, oddanego w sztuce inspirowanej epoka, a ich decyzje wplywaja na to, co stanie sie dalej.
  • Marki i zespoly marketingowe moga tworzyc interaktywne kampanie, w ktorych publicznosc glosuje nad fabuala. Kazda scena generuje tresc wizualna stworzona do udostepniania.
  • Pisarze moga widziec swoje historie ilustrowane w trakcie ich tworzenia. To jak miec concept artiste dostepnego 24 godziny na dobe.

Jak to dziala od srodka

Stworzenie dobrego obrazu z promptu jest latwe. Stworzenie setek spojnych obrazow wzdluz rozgalezionej historii, ktore wygladaja jakby nalezaly do tego samego zestawu, to prawdziwe wyzwanie inzynieryjne. Oto uproszczona wersja tego procesu:

  1. AI czyta wydarzenie fabularne i wyodrebnia kluczowe elementy wizualne: gdzie sie to rozgrywa, kto jest w scenie, nastroj, pora dnia i wszelkie wazne przedmioty lub akcje.
  2. Te elementy sa laczone z ustawieniami stylu artystycznego swiata i danymi referencyjnymi postaci, by zbudowac szczegolowy prompt dla obrazu.
  3. Jesli gracz ma spersonalizowanego bohatera (np. wgrane zdjecie), system wstrzykuje osadzenia referencyjne, aby postac pojawiala sie spojnie.
  4. Prompt trafia do modelu obrazow (FLUX, DALL-E, Stable Diffusion itp.), ktory renderuje scene. Niektore potoki wykonuja wiele przejsc w celu udoskonalenia.
  5. Wygenerowany obraz jest sprawdzany pod katem jakosci, bezpieczenstwa i spojnosci z poprzednimi scenami.
  6. Gotowa ilustracja jest parowana z tekstem narracyjnym i dostarczana graczowi, czy to na stronie, w osadzeniu Discord, wiadomosci Telegram, czy poscie na X.

Dokad to zmierza

Wciaz jestesmy na bardzo wczesnym etapie. Oto co nadchodzi:

  • Animowane sceny zamiast statycznych obrazow. Pomysl o krotkich klipach filmowych generowanych w czasie rzeczywistym z kontekstu historii. Bitwa rozgrywa sie jako 5-sekundowa animacja zamiast nieruchomego obrazka.
  • Aktorstwo glosowe AI nakladane na sceny wizualne. Kazda gra narracyjna staje sie spersonalizowanym serialem animowanym, w ktorym ty jestes glownym bohaterem.
  • Trwale stany swiata. Jesli spaliles wioske w rozdziale drugim, kazda scena rozgrywajaca sie w tym miejscu przez reszte gry pokazuje ruiny. Swiat pamrieta, co zrobiles, wizualnie.
  • Spersonalizowane style artystyczne, w ktorych wgrywasz grafike referencyjna i cala gra dopasowuje sie do twojej estetyki. Ta sama historia, zupelnie inny wyglad dla kazdego gracza.
  • Eksport do innych formatow. Wyobraz sobie, ze konczysz gre i eksportujesz wszystko jako album ilustrowany, komiks lub krotki film animowany. Twoja rozgrywka staje sie publikowalnym dzielem sztuki.

Wieksze niz gry

To, co najbardziej ekscytuje, to nie aspekt gier. To fakt, ze fikcja interaktywna ilustrowana przez AI staje sie naprawde nowym medium tworcym. Znajduje sie gdzies na przecieciu gier, literatury, sztuki wizualnej i zaangazowania spolecznosci. I jest dostepna praktycznie dla kazdego.

Nauczyciel moze stworzyc ilustrowana przygode historyczna dla swojej klasy, nie umiejac rysowac ani programowac. Grupa przyjaciol moze zagrac w spersonalizowany RPG i zabrac ze soba galerie unikalnych ilustracji ze swojej sesji. Marka moze uruchomic interaktywna kampanie wizualna bez zatrudniania studia animacji.

To jest prawdziwa zmiana. Historie, ktorych nie tylko czytasz albo w ktore grasz, ale ktore widzisz, ksztaltowane przez twoje decyzje i renderowane na nowo za kazdym razem.

Wyprobuj to sam

Kazda scena jest ilustrowana, twoja postac pozostaje spojna przez cala rozgrywke, a mozesz grac sam, z przyjaciolmi lub z calymi spolecznosciami na stronie, Discordzie, Telegramie i X.

Przegladaj wspolne swiaty