إذا لعبت *Zork* في وقتها (أو اكتشفتها لاحقًا كمعظمنا)، فأنت تعرف الموضوع: "أنت واقف في حقل مفتوح غرب منزل أبيض." لا صورة. لا موسيقى. مجرد كلمات وخيالك يقوم بكل العمل.
لما يقارب 50 عامًا، كانت هذه هي القاعدة في القصص التفاعلية. القصص أصبحت أذكى، خصوصًا بعد ظهور مولّدات النصوص بالذكاء الاصطناعي مثل AI Dungeon في 2019، لكنها ظلّت تبدو نفسها بصريًا: نص على الشاشة، وربما صورة ثابتة أو اثنتين إن كان لدى المطوّر ميزانية فنية.
هذا يتغيّر بسرعة. توليد الصور بالذكاء الاصطناعي أصبح جيدًا وسريعًا بما يكفي لتصوير كل مشهد فوريًا. ليس فنًا جاهزًا عامًا، بل رسومًا تعكس ما يحدث في قصتك، بـشخصيتك فيها، وبأي أسلوب فني يناسب اللحظة. وهو يحوّل القصص التفاعلية إلى شيء يشعر بأنه مختلف تمامًا عمّا سبق.
كيف وصلنا إلى هنا

درس تاريخي سريع. أنشأت Infocom لعبتي *Zork* و*Planetfall* في أواخر السبعينيات والثمانينيات، وكانتا نصًا بحتًا. التسعينيات جلبت مغامرات الأشر والنقر (فكّر في *Monkey Island*)، والألفية الثالثة أعطتنا الروايات المرئية، وفي 2019 أثبت AI Dungeon أن نموذج لغوي يمكنه توليد مسارات قصصية لا نهائية في الوقت الحقيقي.
لكن حتى AI Dungeon ظلّ نصًا فقط. كان بإمكان الذكاء الاصطناعي أن يكتب عن تنين يهاجم قلعة، لكن كان عليك أن تتخيل ذلك بنفسك. لم يكن هناك طبقة بصرية.
ثم لحقت نماذج توليد الصور مثل DALL-E وMidjourney وStable Diffusion وFLUX بالركب. فجأة أصبح بإمكانك تحويل وصف نصي إلى رسم توضيحي مفصّل في ثوانٍ. السؤال لم يعد "هل يمكننا صنع صور من النص؟" بل أصبح "هل يمكننا دمج هذا في محرك لعبة بإحكام كافٍ ليشعر الفن بأنه جزء من القصة؟"
اتضح أن نعم. والنتائج مذهلة حقًا.
لماذا هذا أكبر مما يبدو
وضع صور في قصة ليس جديدًا. كتب "اختر مغامرتك" كانت تحتوي رسومًا منذ عقود. الفرق أن فن الذكاء الاصطناعي إجرائي: يُولّد من جديد لكل مشهد، وكل جولة لعب، وكل قرار. إليك ما يتغيّر فعليًا في التطبيق:
لا توجد جولتان تبدوان متماثلتين
في لعبة تقليدية، يرسم فنان عددًا محدودًا من المشاهد ويُعاد استخدامها. مع التوليد بالذكاء الاصطناعي، إذا اخترت الكهف بدلًا من الجسر، لن تحصل على "cave.jpg" عام من مجلد. ستحصل على هذا الكهف، في هذه اللحظة من القصة، بشخصيتك واقفة عند المدخل حاملة ما التقطته قبل ثلاثة مشاهد. العب مرة أخرى، اتّخذ قرارات مختلفة، وكل رسم سيكون مختلفًا.
الفن يستجيب لقراراتك
عندما تختار التفاوض مع قطّاع الطرق بدلًا من قتالهم، المشهد المولّد لا يتحول ببساطة إلى قالب "محادثة". سترى توترًا في لغة الجسد، وأسلحة منخفضة، ونار مخيّم بين المجموعتين. الفن يعزّز الثقل العاطفي لقرارك. العواقب تصبح مرئية، وليست مجرد وصف.
لم تعد بحاجة لميزانية فنية
هذا يهم أكثر مما يدرك الناس. قبل فن الذكاء الاصطناعي، صنع قصة تفاعلية غنية بصريًا كان يعني توظيف فنانين وطلب مئات الرسوم. فقط الاستوديوهات الممولة جيدًا كانت تستطيع فعل ذلك. الآن يمكن لمبدع واحد أن يبني ملحمة خيالية أو قصة بوليسية نوار أو مغامرة أطفال، وكل مشهد يحصل على رسمه الفريد. ساحة اللعب تسوّت بين ليلة وضحاها.
المشاهدة تؤثر بشكل مختلف عن القراءة
هناك سبب يجعل الأفلام تؤثر أكثر من الكتب بالنسبة لمعظم الناس (عذرًا، عشاق القراءة). الصور تصنع تأثيرًا عاطفيًا فوريًا. عندما ترى المدينة تحترق لأنك اتخذت القرار الخاطئ، أو شروق الشمس فوق مملكة أنقذتها للتو، ذلك يصل بشكل مختلف عن فقرة تصفه. فن الذكاء الاصطناعي يسد الفجوة بين "كتاب تفاعلي" و"فيلم قابل للعب."
الجزء الصعب: جعل الشخصيات تبدو متسقة

أي شخص جرّب Midjourney أو DALL-E يعرف المشكلة الأكبر: اطلب من الذكاء الاصطناعي رسم نفس الشخصية مرتين وستحصل على شخصين مختلفين تمامًا. وجه مختلف، شعر مختلف، بنية مختلفة. لصورة واحدة هذا مقبول، لكن للعبة قصصية من المفترض أن تكون فيها البطل عبر عشرات المشاهد، هذا يكسر كل شيء.
إصلاح هذا ليس مجرد كتابة طلبات أفضل. يتطلب خط معالجة كامل: صور مرجعية للشخصية، تضمينات أسلوب، توجيه وضعيات، منطق تكوين. النوع من العمل الذي يصعب جدًا تجميعه بنفسك.
هنا تفرق المنصات المصممة خصيصًا نفسها عن نهج "استخدم ChatGPT فقط". في aiga_، على سبيل المثال، يمكنك رفع صورتك والذكاء الاصطناعي يرسمك كالشخصية الرئيسية في كل مشهد. وجهك، ملابسك، نسبك تبقى متسقة سواء كانت القصة بأسلوب أنمي أو ألوان مائية أو واقعية سينمائية أو أي شيء آخر. المشهد الأول والمشهد الخمسون يبدوان نفس الشخص. قد يبدو هذا صغيرًا، لكنه الفرق بين خدعة وشيء يشعر فعلًا بالانغماس.
استخدام الأسلوب الفني كأداة سرد
في الألعاب التقليدية، يُثبّت الأسلوب البصري وقت التطوير. اللعبة إما بكسل آرت أو واقعية. تختار واحدًا وهذا كل شيء. مع التوليد بالذكاء الاصطناعي، يمكن للأسلوب أن يتغيّر ليتناسب مع ما يحدث في القصة.
تخيّل قصة رعب تبدأ بألوان مائية دافئة وودية وتتحول تدريجيًا إلى فحم داكن خشن مع ازدياد التوتر. أو مغامرة سفر عبر الزمن حيث الأقسام القروسطية تبدو كنسيج معلّق، ومشاهد العشرينيات بأسلوب آرت ديكو، والمستقبل نيون سايبربانك. الأسلوب الفني نفسه يصبح جزءًا من السرد. تشعر بتغيّر الأجواء قبل أن تقرأ النص.
aiga_ يتيح بالفعل للمبدعين الاختيار من مكتبة أساليب فنية لعوالمهم. قصة أطفال يمكن أن تستخدم رسومًا متحركة زاهية. خيال مظلم يستخدم إضاءة سينمائية. كوميديا تعتمد على كاريكاتير مبالغ فيه. أصبح اختيارًا إبداعيًا الآن، وليس قيدًا إنتاجيًا.
اللعب الجماعي يجعله أفضل

اللعب الفردي رائع، لكن السحر يتجلّى حقًا مع مجموعة. مجموعة أشخاص يصوّتون على قرار في القصة، الذكاء الاصطناعي يعالج الخيار الفائز، ثم الجميع يرى رسمًا جديدًا تمامًا لما حدث للتو. لم يرَ أحد هذه الصورة من قبل. أُنشئت من القرار الجماعي للمجموعة. هناك شيء مثير حقًا في ذلك.
مع اتصالات aiga_ لـ Discord وTelegram وX، يحدث هذا مباشرة داخل المنصات التي يستخدمها الناس بالفعل. مجتمع Discord يصوّت هل يقتحمون القلعة أم يتسللون عبر المجاري، والنتيجة تظهر كمشهد مرسوم يُنشر مباشرة في القناة. يحوّل خادم محادثة إلى شيء أكثر إثارة بكثير.
لصنّاع المحتوى والعلامات التجارية، هناك تأثير جانبي ممتع: كل جلسة تولّد تدفقًا من المحتوى المرئي الفريد. كل صورة قابلة للمشاركة، وكل واحدة كانت مدفوعة بمشاركة الجمهور. إنه محتوى عضوي يصنع نفسه.
ما الذي يفتحه هذا لأشخاص مختلفين
الشيء المثير في القصص التفاعلية المرسومة بالذكاء الاصطناعي هو كم حالات الاستخدام التي تفتحها. ليس فقط لـ"اللاعبين"، بل لأشخاص لا تربطهم عادة بمغامرات النص:
- بناة العوالم ومصممو الألعاب يمكنهم إنشاء نماذج أولية لعوالم غنية بصريًا في ساعات بدلًا من أشهر. ركّز على القصة ومنطق التفرع، دع الذكاء الاصطناعي يتولى الفن، ثم شارك عالمك مع المجتمع ليلعبه الآخرون.
- مديرو حملات ألعاب الطاولة يمكنهم إدارة حملات حيث كل مواجهة لها رسمها الخاص. لاعبوك يرون التنين والشخصية غير القابلة للعب والزنزانة فعلًا. لا مزيد من "حسنًا، تخيّل غرفة كبيرة بأعمدة."
- المعلمون يمكنهم بناء دروس تفاعلية حيث التاريخ والعلوم ينبضان بالحياة بصريًا. الطلاب لا يقرأون فقط عن روما القديمة. يرونها، مرسومة بفن مستوحى من التاريخ، وقراراتهم تشكّل ما يحدث بعد ذلك.
- العلامات التجارية وفرق التسويق يمكنهم إنشاء حملات تفاعلية حيث يصوّت الجمهور على الحبكة. كل مشهد يولّد محتوى بصريًا مُصممًا للمشاركة.
- الكتّاب يمكنهم رؤية قصصهم مرسومة أثناء بنائها. إنه مثل وجود فنان مفاهيم متاح على مدار الساعة.
كيف يعمل الأمر من الداخل
صنع صورة جيدة من طلب واحد أمر سهل. صنع مئات الصور المتسقة عبر قصة متفرعة بحيث تبدو جميعها من نفس المجموعة هو التحدي الهندسي الحقيقي. إليك نسخة مبسطة من كيفية عمله:
- الذكاء الاصطناعي يقرأ حدث القصة ويستخرج العناصر البصرية الرئيسية: أين يحدث المشهد، من في المشهد، المزاج، وقت اليوم، وأي أشياء أو أفعال مهمة.
- تُدمج هذه العناصر مع إعدادات الأسلوب الفني للعالم وأي بيانات مرجعية للشخصية لبناء طلب صورة مفصّل.
- إذا كان لدى اللاعب بطل مخصص (مثل صورة مرفوعة)، يضخ النظام تضمينات مرجعية لتظهر الشخصية باتساق.
- يُرسل الطلب إلى نموذج صور (FLUX أو DALL-E أو Stable Diffusion وغيرها) الذي يرسم المشهد. بعض خطوط المعالجة تمر بعدة جولات للتحسين.
- الصورة المولّدة تُفحص من حيث الجودة والسلامة والاتساق مع المشاهد السابقة.
- الرسم النهائي يُقرن بنصه القصصي ويُسلّم للاعب، سواء على الويب، أو في رسالة Discord، أو رسالة Telegram، أو منشور على X.
إلى أين يتجه هذا
نحن لا نزال في البداية. مبكرين جدًا. إليك ما هو قادم:
- مشاهد متحركة بدلًا من صور ثابتة. فكّر بمقاطع سينمائية قصيرة تُولّد في الوقت الحقيقي من سياق القصة. معركة تتكشف كرسوم متحركة من 5 ثوانٍ بدلًا من إطار ثابت.
- أداء صوتي بالذكاء الاصطناعي يُضاف فوق المشاهد البصرية. كل لعبة قصصية تصبح مسلسلًا متحركًا مخصصًا حيث أنت الشخصية الرئيسية.
- حالات عالم مستمرة. إذا أحرقت القرية في الفصل الثاني، كل مشهد يدور في ذلك الموقع لبقية اللعبة يُظهر الأطلال. العالم يتذكر ما فعلته، بصريًا.
- أساليب فنية مخصصة حيث ترفع فنًا مرجعيًا واللعبة بأكملها تتكيّف مع ذوقك. نفس القصة، مظهر مختلف تمامًا لكل لاعب.
- تصدير إلى صيغ أخرى. تخيّل أنك تنهي لعبة وتصدّر كل شيء ككتاب إلكتروني مصوّر أو شريط قصص مصورة أو فيلم قصير متحرك. جولتك تصبح عملًا فنيًا قابلًا للنشر.
أكبر من مجرد ألعاب فيديو
أكثر ما يثير الحماس في هذا ليس زاوية الألعاب. إنه أن القصص التفاعلية المرسومة بالذكاء الاصطناعي أصبحت وسيطًا إبداعيًا جديدًا حقًا. تقع في مكان ما بين الألعاب والأدب والفن البصري والمشاركة المجتمعية. وهي متاحة لأي شخص تقريبًا.
معلم يمكنه بناء مغامرة تاريخية مصوّرة لفصله من دون أن يعرف الرسم أو البرمجة. مجموعة أصدقاء يمكنهم لعب لعبة أدوار مخصصة والخروج بمعرض من الأعمال الفنية الفريدة من جلستهم. علامة تجارية يمكنها إطلاق حملة بصرية تفاعلية من دون توظيف استوديو رسوم متحركة.
هذا هو التحول الحقيقي. قصص لا تقرأها أو تلعبها فقط، بل قصص تراها، مشكّلة بقراراتك ومرسومة بشكل فريد في كل مرة.
جرّبه بنفسك
كل مشهد يُرسم، شخصيتك تبقى متسقة طوال الجولة، ويمكنك اللعب بمفردك أو مع أصدقاء أو مع مجتمعات كاملة على الويب وDiscord وTelegram وX.
استكشاف العوالم المشتركة