مدوّنة FARBA
كيف يعمل توليد الصور بالذكاء الاصطناعي فعلاً (شرح مبسط)
ترفع صورة سيلفي، تضغط على نمط، وبعد 30 ثانية تحصل على بورتريه يبدو وكأنه التُقط في استوديو احترافي. لكن ماذا يحدث فعلاً في تلك الثلاثين ثانية؟ كيف يحوّل الذكاء الاصطناعي صورة هاتف عادية إلى بورتريه تحريري، أو شخصية Pixar، أو بطل أنمي — مع الحفاظ على شبهك؟
إليك شرحاً بلغة بسيطة لكيف يعمل الذكاء الاصطناعي للصور وراء توليد الصور بالذكاء الاصطناعي، دون مصطلحات معقدة.
الأساس: نماذج الانتشار (Diffusion Models)
تستخدم مولدات الصور الحديثة بالذكاء الاصطناعي تقنية تُسمى نماذج الانتشار. أبسط طريقة لفهم الانتشار هي: تعلّم الذكاء الاصطناعي إنشاء الصور من خلال دراسة ملايين الصور والأعمال الفنية. تعلّم الأنماط — كيف يسقط الضوء على الوجه، كيف ينسدل القماش، كيف تستخدم الأنماط الفنية المختلفة الألوان والخطوط.
عندما تعطيه صورة ونمطاً، فإنه لا يقصّ ويلصق العناصر معاً. بدلاً من ذلك، يولّد صورة جديدة من الصفر، موجّهاً بصورتك (للحفاظ على الشبه) ومعاملات النمط (لتحديد الجمالية). فكّر فيه أقل كفلتر وأكثر كفنان رقمي يرسم بورتريهاً جديداً لك بنمط محدد.
كيف يعمل الحفاظ على الشبه
هذا هو التحدي التقني الأصعب في توليد الصور بالذكاء الاصطناعي، وهو المكان الذي تفشل فيه معظم التطبيقات. الحفاظ على الشبه يعني أن الصورة المولّدة يجب أن تبدو مثلك — هيكلك الوجهي المحدد، وشكل عينيك، وأنفك، وخط فكك — لا مجرد شخص جذاب بشكل عام.
يستخدم FARBA تقنية تضمين الوجه التي تنشئ تمثيلاً رياضياً لملامحك الوجهية الفريدة. يعمل هذا التضمين كمرساة خلال عملية التوليد. يستطيع الذكاء الاصطناعي تغيير الإضاءة والستايل والتفسير الفني، لكنه مقيّد بالحفاظ على هندستك الوجهية المحددة. لهذا ينتج مولّد البورتريه بالذكاء الاصطناعي نتائج تكون فيها واضحاً وقابلاً للتعرف عليه حتى في أنماط مختلفة دراماتيكياً.
نقل النمط: كيف تُطبَّق الأنماط
عندما تختار نمطاً مثل "الساعة الذهبية" أو "الكروم"، يطبّق الذكاء الاصطناعي مجموعة من المعاملات الجمالية المتعلَّمة — لوحة الألوان، اتجاه الإضاءة، منحنيات التباين، تكوين الخلفية، والتأثيرات الجوية. كل نمط هو في الجوهر قالب جمالي مدرَّب يتبعه الذكاء الاصطناعي أثناء توليد بورتريهك.
الجزء المثير هو أن هذه الأنماط ليست فلاتر ألوان بسيطة. بورتريه "الساعة الذهبية" لا يضيف فقط نغمات دافئة إلى صورتك. يعيد الذكاء الاصطناعي خلق فيزياء إضاءة الساعة الذهبية — ضوء اتجاهي دافئ من زاوية منخفضة، ظلال ناعمة، وميض العدسة، وضبابية الخلفية. يولّد صورة جديدة قد تبدو طبيعية في ظل ظروف الإضاءة تلك.
من الصورة إلى الكرتون: التوليد عبر النطاقات
تشغّل التقنية نفسها توليد الكرتون والأنمي، لكن مع التواء. عندما يحوّل مولّد الكرتون بالذكاء الاصطناعي صورتك إلى شخصية بنمط Pixar، فإنه يحتاج إلى ترجمة الملامح الوجهية الواقعية إلى نطاق بصري مختلف تماماً — عيون أكبر، بشرة أنعم، نسب مبالغ فيها — مع الحفاظ على جوهر ما يجعل وجهك وجهك.
هذا التوليد عبر النطاقات مدرَّب على أمثلة مزدوجة من الوجوه الحقيقية ومكافئاتها الكرتونية. يتعلم الذكاء الاصطناعي قواعد التحويل: كيف يُترجَم شكل أنف حقيقي إلى أنف كرتوني، كيف ينتقل لون عينيك وشكلهما عبر التنميط، كيف تتكيف درجة لون البشرة مع لوحات الألوان المتحركة. يستخدم مولّد الأنمي بالذكاء الاصطناعي مبادئ مماثلة لكنه يتبع قواعد الرسوم اليابانية للنسبة وعمل الخطوط.
الجودة والدقة
أنتجت مولدات الصور المبكرة بالذكاء الاصطناعي نتائج ضبابية ومنخفضة الدقة. تستخدم الأنظمة الحديثة التوليد التدريجي — تبدأ بتكوين تقريبي وتصقله من خلال مرات متعددة، تضيف التفاصيل، تحدّد الملامح، وتصحّح التشوهات في كل خطوة. المخرج النهائي بدقة عالية كافية للطباعة، لا لمجرد وسائل التواصل.
ما لا يستطيع توليد الصور بالذكاء الاصطناعي فعله (بعد)
- اليدان والأصابع المثالية — لا يزال الذكاء الاصطناعي يكافح مع وضعيات اليد المعقدة. تتجنب معظم أنماط البورتريه ذلك بالقص عند الأكتاف أو استخدام وضعيات لا تكون فيها اليدان بارزتين.
- سلسلة صور متعددة متسقة — يبقى توليد صور متعددة لنفس الشخص بملابس متطابقة لكن وضعيات مختلفة تحدياً. كل توليد مستقل.
- النص في الصور — إذا تضمن النمط عناصر نصية مثل أغلفة المجلات، فقد تكون الكتابة مشوّهة. هذا قيد معروف لنماذج الانتشار.
- الجانبية المثالية — يعمل الحفاظ على الشبه بأفضل شكل مع الصور الأمامية. الزوايا الحادة تقلل الدقة.
الخصوصية وصورك
قلق شائع: ماذا يحدث لصورك بعد التوليد؟ تطبيقات الصور بالذكاء الاصطناعي المسؤولة تعالج صورتك على خوادم آمنة، تولّد النتيجة، ولا تحتفظ بصورتك الأصلية للتدريب أو لأغراض أخرى. تحقق دائماً من سياسة خصوصية التطبيق قبل رفع صور شخصية.