انشاء صور بالذكاء الاصطناعي دليل شامل وكامل

أفضل 7 مولدات صور الذكاء الاصطناعي في عام 2024

سـعد الفــلاح يناير 19, 2025

1 546 18 دقائق

جدول المحتويات

لقد كانت برامج إنشاء الصور التي تعمل بالذكاء الاصطناعي تكتسب شعبية كبيرة خلال العامين الماضيين. إذا كنت تستخدم وسائل التواصل الاجتماعي أو تشاهد برامج الأخبار في وقت الذروة أو تقرأ مجلة، فمن المستحيل أن تفوتك الصور التي تم إنشاؤها بالذكاء الاصطناعي. إنها موجودة في كل مكان، ومن السهل معرفة السبب: الأدوات اللازمة لإنشاء هذه الصور أصبحت الآن جيدة ومتاحة للجمهور. إذا كنت ترغب في الانضمام إلى المرح أو إضافة بعض الميزات التي تعمل بالذكاء الاصطناعي إلى سير العمل في عملك ، فستوفر لك التطبيقات الموجودة في هذه القائمة ما تبحث عنه.

لقد كنت أكتب عن مولدات الصور بالذكاء الاصطناعي منذ Google Deep Dream في عام 2015. وهذا هو نفس الوقت تقريبًا الذي فكر فيه أي شخص خارج مختبر علوم الكمبيوتر بشكل واقعي في هذه الأدوات، وأنا متحمس حقًا للمدى الذي وصلت إليه.

سأحاول تجنب المناقشات الشائكة حول الجدارة الفنية، وما إذا كانت هذه الأدوات تحل محل الفنانين أو تعززهم، وانتهاك حقوق الطبع والنشر في بيانات التدريب، على الأقل حيثما أمكنني ذلك. وبدلاً من ذلك، سأركز على حقيقة مفادها أن مولدات الصور التي تعمل بالذكاء الاصطناعي يمكنها الآن إنتاج نتائج رائعة من مجموعة واسعة من المطالبات النصية.

من الجدير أن تأخذ بضع ساعات للعب بأحد تطبيقات الذكاء الاصطناعي لتحويل النص إلى صورة، حتى لو كان ذلك فقط حتى تتمكن من تقديرها من منظور فني. وسواء أعجبك ذلك أم لا، فإننا جميعًا نرى الكثير من إنتاجهم في الوقت الحالي. ولن يكون هناك سوى المزيد في المستقبل.

أفضل مولدات الصور بالذكاء الاصطناعي

DALL·E 3 لمولد صور AI سهل الاستخدام
رحلة منتصف الطريق للحصول على أفضل نتائج صور الذكاء الاصطناعي
إيديوجرام للحصول على نص دقيق
انتشار مستقر لتخصيص صور الذكاء الاصطناعي والتحكم فيها
FLUX.1 بديل للانتشار المستقر
Adobe Firefly لدمج الصور المولدة بالذكاء الاصطناعي في الصور
الذكاء الاصطناعي التوليدي من Getty للحصول على صور قابلة للاستخدام وآمنة تجاريًا

كيف تعمل مولدات الصور بالذكاء الاصطناعي؟

إن كل هذه المولدات للصور التي تعمل بالذكاء الاصطناعي تأخذ نصًا ثم تحوله -بأفضل ما يمكنها- إلى صورة مطابقة. وهذا يفتح بعض الاحتمالات الجامحة، حيث يمكن أن يكون النص الذي تطلبه أي شيء من “لوحة زيتية انطباعية لرجل كندي يمتطي موسًا عبر غابة من أشجار القيقب” إلى “لوحة على طراز فيرمير لكلب أيرلندي كبير رقيق يستمتع بكوب من البيرة في حانة تقليدية” أو “صورة لحمار على القمر”.

لى محمل الجد، الحدود الحقيقية الوحيدة هي خيالك، وقدرة مولد الصور بالذكاء الاصطناعي على فهم مطالبتك ، وأي مرشحات محتوى يتم وضعها لمنع الانتحال، وانتهاك حقوق النشر، والجهات الفاعلة السيئة التي تغمر الإنترنت بالعنف الناتج عن الذكاء الاصطناعي أو غيره من المحتوى غير المناسب للعمل. (كان موجه فيرمير يعمل بشكل موثوق، لكن بعض مولدات الصور تحظره الآن لأنه يستخدم فنانًا معروفًا.)

تعمل معظم مولدات الصور بالذكاء الاصطناعي بطريقة متشابهة إلى حد كبير. تُستخدم ملايين أو مليارات أزواج الصور والنصوص لتدريب شبكة عصبية (في الأساس، خوارزمية كمبيوترية متطورة للغاية تم تصميمها بشكل فضفاض على أساس الدماغ البشري ) على ماهية الأشياء . من خلال السماح لها بمعالجة عدد لا يحصى من الصور تقريبًا، فإنها تتعلم ماهية الكلاب واللون الأحمر وفيرمير وكل شيء آخر. بمجرد القيام بذلك، يكون لديك ذكاء اصطناعي يمكنه تفسير أي مطالبة تقريبًا – على الرغم من وجود مهارة في إعداد الأشياء حتى تتمكن من القيام بذلك بدقة.

الخطوة التالية هي تقديم الصورة المولدة بواسطة الذكاء الاصطناعي. يقوم أحدث جيل من مولدات الصور بالذكاء الاصطناعي بذلك باستخدام عملية تسمى الانتشار . في الأساس، يبدأون بحقل عشوائي من الضوضاء ثم يقومون بتحريره في سلسلة من الخطوات لتتناسب مع تفسيرهم للمطالبة. إنه يشبه إلى حد ما النظر إلى سماء غائمة، والعثور على سحابة تبدو نوعًا ما مثل الكلب، ثم القدرة على النقر بأصابعك للاستمرار في جعلها أكثر فأكثر تشبه الكلب.

قبل أن نتعمق في الموضوع: لا أريد أن أبالغ في بيع الأشياء. إن ما تستطيع هذه المولدات تحويل النص إلى صورة القيام به مثير للإعجاب للغاية، ولكن من غير المرجح أن تنقذك من الاضطرار إلى إجراء جلسة تصوير للمنتج مرة أخرى. إذا كنت بحاجة فقط إلى بعض الصور الغريبة أو الفريدة، فيمكنها أن تساعدك حقًا. ولكن إذا كنت تبحث عن شيء محدد للغاية، فمن الأفضل أن تستأجر مصورًا أو ترخص الصورة الدقيقة التي تريدها. وبالمثل، فإن محاولة استخدام أحدها لإنشاء صورة رأسية لمنشور مدونة قد تستغرق وقتًا أطول بكثير من مجرد العثور على صورة رأسية لمدونتك من خلال موقع صور فوتوغرافية. بالتأكيد، لن تكون مخصصة، ولكن من المرجح أن يكون للعارضة عشرة أصابع.

ما الذي يجعل منشئ الصور بالذكاء الاصطناعي هو الأفضل؟

كيف نقوم بتقييم التطبيقات واختبارها

إن أفضل تطبيقاتنا مكتوبة من قبل بشر قضوا جزءًا كبيرًا من حياتهم المهنية في استخدام واختبار والكتابة عن البرامج. ما لم يُذكَر صراحةً، فإننا نقضي عشرات الساعات في البحث عن التطبيقات واختبارها، واستخدام كل تطبيق كما هو مقصود للاستخدام وتقييمه وفقًا للمعايير التي حددناها للفئة. لا نتقاضى أي أجر مقابل وضع أي تطبيق في مقالاتنا أو مقابل روابط إلى أي موقع – فنحن نقدر الثقة التي يضعها القراء فينا لتقديم تقييمات حقيقية للفئات والتطبيقات التي نراجعها. لمزيد من التفاصيل حول عمليتنا، اقرأ الملخص الكامل لكيفية اختيارنا للتطبيقات التي سيتم عرضها على مدونة Zapier .

هناك سبب وراء انتشار مولدات الصور بالذكاء الاصطناعي بشكل لا يصدق على مدار العامين الماضيين: قبل ذلك، كانت سيئة للغاية. كانت التكنولوجيا التي تقوم عليها رائعة للغاية ومثيرة للإعجاب، على الأقل بالنسبة لعلماء الأبحاث، لكن الصور التي يمكن أن تنتجها كانت مخيبة للآمال. حتى DALL·E الأصلي كان أكثر من مجرد ابتكار ممتع من كونه اكتشافًا يهز العالم عندما تم إطلاقه في عام 2021 .

الآن بعد أن أصبحت مولدات النصوص إلى الصور متاحة منذ فترة، بدأنا نرى بعض المنافسة الحقيقية بين النماذج المختلفة. كما أن النتائج التي تنتجها أكثر واقعية. لذا، للعثور على أفضل مولدات الفن بالذكاء الاصطناعي، حددت بعض المعايير الصارمة:

كنت أبحث عن تطبيقات تسمح لك بإنشاء صور الذكاء الاصطناعي من خلال مطالبة نصية. الأدوات التي تتيح لك تحميل عشرات الصور ثم إخراج صور شخصية تم إنشاؤها بواسطة الذكاء الاصطناعي هي أدوات ممتعة (وعادة ما يتم إنشاؤها باستخدام Stable Diffusion)، لكنها ليست من النوع العام من مولدات الصور التي كنت أفكر فيها.
كنت أنظر إلى مولدات الصور بالذكاء الاصطناعي نفسها، وليس الأدوات المبنية عليها . على سبيل المثال، يعد NightCafe مولد صور بالذكاء الاصطناعي يتمتع بمجتمع وتطبيق رائعين، ولكنه يتيح لك فقط استخدام نماذج مفتوحة المصدر مثل FLUX وStable Diffusion، ونماذج دقيقة بناءً على إصدارات مختلفة منها، وواجهة برمجة تطبيقات DALL·E 3، بالإضافة إلى عدد قليل من النماذج التوليدية القديمة. إنه يستحق التحقق منه، لكنه لا يلبي معاييري لإدخاله الخاص في هذه القائمة.

وبعيدًا عن كل ذلك، فكرت أيضًا في مدى سهولة استخدام كل منشئ صور الذكاء الاصطناعي، وأنواع عناصر التحكم وخيارات التخصيص التي يوفرها (لأشياء مثل تحسين جودة الصور بالذكاء الاصطناعي)، ونموذج التسعير الذي يتبناه، والأهم من كل ذلك: مدى جودة النتائج؟ أصبحت أفضل منشئي الصور بالذكاء الاصطناعي الآن أقل احتمالية لإنشاء أشياء غريبة أو مستحيلة المظهر.

لقد كنت أستخدم وأكتب عن مولدات النص إلى الصور منذ إطلاق DALL·E الأصلي، وعن التصوير الفوتوغرافي والفن لأكثر من عقد من الزمان، لذا فأنا على دراية تامة بكيفية عمل كل هذه الأدوات – ومميزاتها وعيوبها وسلوكياتها المجنونة. لكن كتابة هذا المقال كانت في الواقع المرة الأولى التي أضع فيها العديد من مولدات الصور بالذكاء الاصطناعي وجهاً لوجه بنفس المطالبات . كانت النتائج رائعة، ويسعدني أن أقول إن جميع التطبيقات الموجودة في القائمة تقدم أسبابًا حقيقية لاستخدامها.

قبل أن نتعمق في الأمر، هناك أمر آخر يجب ملاحظته: العديد من هذه الأدوات لا تزال في مرحلة تجريبية من الناحية الفنية، وأظن أنها ستظل كذلك لفترة من الوقت. ورغم أنها أصبحت أكثر إثارة للإعجاب كل يوم، إلا أن مولدات الصور التي تعمل بالذكاء الاصطناعي لا تزال أمامها طريق طويل قبل أن تتمكن من إنتاج نتائج رائعة باستمرار والتكيف بشكل موثوق مع سير العمل التجاري.

لسوء الحظ، لا يعني كون هذه الأدوات في مرحلة الإصدار التجريبي أنها مجانية. وهذا أمر مفهوم، نظرًا للحمل الحاسوبي الثقيل الذي ينطوي عليه إنشاء صور الذكاء الاصطناعي، ولكن هذا لا يزال يعني أنه من الصعب اللعب بها.

كيفية استخدام توليد الصور بالذكاء الاصطناعي في العمل

هل أنت مهتم بالذكاء الاصطناعي، ولكنك لست متأكدًا تمامًا من كيفية استخدامه في العمل؟ إليك بعض الطرق التي يلجأ بها الأشخاص إلى إنشاء صور الذكاء الاصطناعي في أدوارهم:

إنشاء صور البطل لمشاركات المدونة
إنشاء منشورات على وسائل التواصل الاجتماعي
إنشاء شرائح عرض وقصص مصورة
إنشاء صور مخصصة للعملاء

أفضل مولدات الصور بالذكاء الاصطناعي في لمحة

	الأفضل لـ	خيارات الوصول	سعر	الشركة الأم
من ·3	سهولة الاستخدام	ChatGPT Plus أو Enterprise؛ Bing’s AI Copilot؛ API	صورتان مجانيتان/اليوم مع خطة ChatGPT المجانية؛ متضمنة مع ChatGPT Plus مقابل 20 دولارًا/الشهر	OpenAI
منتصف الرحلة	نتائج عالية الجودة	ديسكورد، تطبيق ويب	من 10 دولارات أمريكية شهريًا مقابل حوالي 200 صورة شهريًا وحقوق الاستخدام التجاري	منتصف الرحلة
الصور الرمزية	نص دقيق	تطبيق الويب	خطة مجانية محدودة؛ من 8 دولارات أمريكية/شهريًا للتنزيل بدقة كاملة و400 رصيد أولوية شهريًا	رسم بياني للذكاء الاصطناعي
انتشار مستقر	التخصيص والتحكم	NightCafe وTensor.Art وCivitai والعديد من التطبيقات الأخرى؛ واجهة برمجة التطبيقات؛ تنزيلها على خادم محلي	يعتمد على المنصة	استقرار الذكاء الاصطناعي
فلوكس.1	بديل الانتشار المستقر	NightCafe وTensor.Art وCivitai والعديد من التطبيقات الأخرى؛ واجهة برمجة التطبيقات؛ تنزيلها على خادم محلي	يعتمد على المنصة	مختبرات الغابة السوداء
أدوبي فايرفلاي	دمج الصور المولدة بواسطة الذكاء الاصطناعي في الصور	firefly.adobe.com، Photoshop، Express، وأدوات Adobe الأخرى	مجانًا مقابل 25 رصيدًا/شهرًا؛ من 4.99 دولارًا مقابل 100 رصيد/شهرًا	أدوبي
الذكاء الاصطناعي التوليدي بواسطة جيتي	صور آمنة تجاريا	iStock	من 14.99 دولارًا لـ 100 جيل من الذكاء الاصطناعي	جيتي (يستخدم NVIDIA Pica

أفضل مولد صور بالذكاء الاصطناعي لسهولة الاستخدام

من و 3

من E 3 تابع:

سهل الاستخدام بشكل لا يصدق
مضمن مع ChatGPT Plus، حتى تحصل على قدر كبير من الذكاء الاصطناعي مقابل أموالك

من و 3 سلبيات:

يمكن أن تكون عناصر التحكم في ChatGPT ناجحة أو غير ناجحة
20 دولارًا شهريًا هو سعر باهظ إذا كنت لا تريد GPT معه

يمكن القول إن DALL·E 3 هو الاسم الأكبر في مجال مولدات الصور بالذكاء الاصطناعي – ولسبب وجيه. كان سلفه، DALL·E 2 ، أول مولد صور يعمل بالذكاء الاصطناعي وكان جيدًا بما يكفي لإنشاء صور مثيرة للاهتمام بشكل كبير وكان متاحًا على نطاق واسع لعدد كافٍ من الأشخاص ليصبح فيروسيًا.

يُعد DALL·E 3 تحسنًا كبيرًا مقارنة بـ DALL·E 2. ففي أي موجه معين، يُنتج نتائج أكثر إثارة للاهتمام وأكثر واقعية وأكثر اتساقًا. في السابق، كان يبدو أن OpenAI تتخلف عن منافسيها باستخدام مولدات الصور بالذكاء الاصطناعي، لكن DALL·E 3 أعادها إلى السباق. يمكنك الوصول إليها من خلال ChatGPT و AI Copilot من Microsoft Bing ، بالإضافة إلى بعض الخدمات الأخرى التي تستخدم واجهة برمجة التطبيقات الخاصة بها.

أهم ما يميز DALL·E 3 هو سهولة استخدامه بشكل مثير للسخرية. أخبر ChatGPT أو Bing بما تريد رؤيته، وفي غضون لحظات قليلة، سيكون لديك خياران أو أربعة خيارات تم إنشاؤها بواسطة الذكاء الاصطناعي للاختيار من بينها. يستخدم فهم GPT-4o للغة لتوسيع نطاق مطالباتك، بحيث تكون كل نتيجة مميزة، ويمكنك دائمًا طلب المزيد.

يتيح OpenAI لمستخدمي ChatGPT المجانيين إنشاء صورتين يوميًا باستخدام DALL·E 3، بينما تمنحك Microsoft قدرًا أكبر من المرونة دون دفع أي أموال. وجدت أن Copilot أكثر صعوبة في الاستخدام، لكن من الصعب الجدال بشأن سعره. لكن أفضل طريقة لاستخدام DALL·E 3 هي من خلال ChatGPT Plus ، حيث يمكنك استخدامه بقدر ما تريد، مع مراعاة حدود المراسلة الأخرى.

يحتوي DALL·E 3 على طريقتين لتحرير الصور: يمكنك أن تطلب من ChatGPT إجراء تغييرات، وسيعيد تشغيل المطالبات بالإضافات التي أدخلتها؛ أو يمكنك استخدام أداة تحديد لتحديد التحديثات على أجزاء معينة من الصورة. (لا يمكنك توسيع صورة تم إنشاؤها بواسطة DALL·E حتى الآن، على الأقل ليس دون نقل الأشياء إلى تطبيق آخر.) في بعض الأحيان يبدو هذا الأمر وكأنه سحر، حيث سيقوم ChatGPT بالضبط بما تطلبه. وفي أحيان أخرى، يبدو الأمر وكأنك تعمل مع متدرب متحمس للغاية لا يرغب في القيام بأمره بنفسه. إذا كنت تريد المزيد من التحكم، فيمكنك تجربة أحد التطبيقات الأخرى في هذه القائمة.

بالإضافة إلى DALL·E 3 من خلال ChatGPT، تقدم OpenAI واجهة برمجة تطبيقات ، والتي تسمح للمطورين ببناء تطبيقات تتكامل مع نموذجي DALL·E. وبسبب ذلك، يمكنك ربط DALL·E بـ Zapier للقيام بأشياء مثل إنشاء صور تلقائيًا من نماذج Google أو استجابات HubSpot أو أي تطبيقات أخرى تستخدمها. تعرف على كيفية إنشاء شعارات تلقائيًا أو إنشاء صور للمدونات باستخدام DALL·E وZapier، أو ابدأ في استخدام تدفقات العمل المعدة مسبقًا هذه.

مولد الصور بالذكاء الاصطناعي مع أفضل النتائج

منتصف الرحلة

إيجابيات منتصف الرحلة:

ينتج باستمرار أفضل الصور المولدة بواسطة الذكاء الاصطناعي
المجتمع هو وسيلة رائعة للحصول على الإلهام

سلبيات منتصف الرحلة:

الصور التي تقوم بإنشائها تكون عامة بشكل افتراضي
تم تعليق التجارب المجانية حاليًا

يُنتج Midjourney باستمرار نتائجي المفضلة من بين جميع مولدات الصور في هذه القائمة. تبدو الصور التي ينشئها أكثر تماسكًا، مع نسيج وألوان أفضل – وبشكل عام، تكون النتائج أكثر إثارة للاهتمام وجاذبية بصريًا. على وجه الخصوص، تبدو الأشخاص والأشياء في العالم الحقيقي أكثر واقعية وطبيعية مما تبدو عليه مع مولدات الصور الأخرى التي تعمل بالذكاء الاصطناعي، على الأقل بدون الكثير من المطالبات، ويمكن لأحدث الإصدارات حتى أن تتقن نوعًا ما . إنه لأمر مثير للإعجاب أنه كان أول مولد صور بالذكاء الاصطناعي يفوز بمسابقة فنية .

أفضل ما في الأمر هو أن Midjourney لديه الآن تطبيق ويب فعلي. لم يعد عليك الوصول إليه عبر Discord، رغم أنه يمكنك ذلك إذا أردت. بعض ميزاته الأكثر تقدمًا، مثل مزج صور متعددة، والحفاظ على التفاصيل عبر أجيال مختلفة، ومطابقة الأنماط، لم تنتقل إلى تطبيق الويب بعد، ولكن لا يزال بإمكانك استخدام محرره الرائع والحصول على قدر كبير من التحكم في مظهر الأشياء.

ومع ذلك، وكما يمكنك أن تتخيل على الأرجح، فإن موقع Midjourney ليس خاليًا تمامًا من العيوب: فبشكل افتراضي، يتم نشر كل صورة تنشئها علنًا على صفحة “استكشاف” في موقع Midjourney ويمكن مشاهدتها على ملفك الشخصي. وهذا يمنح كل شيء جانبًا مجتمعيًا رائعًا، ولكنه يعني أن أي شخص يهتم بالبحث يمكنه رؤية ما تنشئه. ورغم أن هذا لا يمثل مشكلة بالضرورة بالنسبة للفنانين، فقد يكون عائقًا كبيرًا إذا كنت تتطلع إلى استخدام موقع Midjourney لأغراض تجارية.

إذا كانت الأمور لا تزال تبدو مربكة بعض الشيء، فلا تقلق. إن وثائق المساعدة الخاصة بـ Midjourney جيدة حقًا وترشدك خلال البدء في استخدام كل من تطبيق الويب وDiscord، وتوضح لك كيفية التحكم في جميع ميزاته المختلفة، من تحديد إصدارات النموذج والترقية إلى استخدام مراجع الأحرف وأدوات التخصيص. بمجرد فهم الخيارات المختلفة، ستكون النتائج التي يمكنك الحصول عليها مذهلة حقًا.

تم تعليق التجارب المجانية لبرنامج Midjourney حاليًا بسبب العدد الهائل من الأشخاص الذين يحاولون استخدامه ، ولكن يتم إعادة تفعيلها أحيانًا لبضعة أيام. إذا فاتتك فترة تجريبية مجانية، تبدأ الخطة الأساسية من 10 دولارات أمريكية/شهر وتأتي مع 3.3 ساعة من وقت وحدة معالجة الرسومات شهريًا، أو حوالي 200 صورة. يمكنك أيضًا الحصول على خيار شراء وقت وحدة معالجة الرسومات الإضافي، ويمكنك استخدام صورك تجاريًا.

أسعار Midjourney: من 10 دولارات أمريكية شهريًا للخطة الأساسية التي تتيح لك إنشاء حوالي 200 صورة شهريًا وتوفر حقوق الاستخدام التجاري.

أفضل مولد صور الذكاء الاصطناعي للنص الدقيق

الصور الرمزية

إيجابيات الرسم البياني:

صور رائعة تم إنشاؤها بواسطة الذكاء الاصطناعي – والنص الأكثر دقة من أي تطبيق
هناك خطة مجانية

سلبيات الرسم البياني:

الصور التي تقوم بإنشائها تكون عامة بشكل افتراضي

تواجه أغلب برامج توليد الصور بالذكاء الاصطناعي صعوبة في إنشاء نص بشكل صحيح، إذ لا تصلح عملية الانتشار لمعالجة الحروف. ولكن برنامج Ideogram نجح في اجتياز هذه العملية بسهولة. حيث أصبحت خوارزميته الأحدث 2.0 قادرة على تضمين نص بدقة مع أي صورة تم إنشاؤها.

ما يجعل هذا أكثر إثارة للإعجاب هو أن Ideogram هو أيضًا أحد أفضل مولدات الصور بشكل عام. فهو يحتوي على تطبيق ويب بديهي وبعض الميزات الرائعة مثل محرر الصور والقدرة على استخدام أي صورة كأساس لصورة جديدة . في اختباري، كان التطبيق الوحيد الذي أعجبني باستمرار هو Midjourney – ولا يزال مقيدًا بعض الشيء بسبب اعتماده السابق على Discord.

حتى أن Ideogram لديه خطة مجانية. فباستخدامها، تقتصر على 10 نقاط ائتمان يوميًا، وعليك الانتظار لبضع دقائق حتى يبدأ الجيل، ولا تحصل إلا على الميزات الأساسية لـ Ideogram، ولكنها لا تزال طريقة رائعة للتعرف على أحد أفضل مولدات الصور بالذكاء الاصطناعي المتاحة.

أسعار الصور الرمزية: خطة مجانية محدودة؛ من 8 دولارات أمريكية شهريًا للتنزيل بالدقة الكاملة و400 رصيد أولوية شهريًا.

أفضل مولد صور الذكاء الاصطناعي للتخصيص والتحكم

انتشار مستقر

إيجابيات الانتشار المستقر:

متوفر على نطاق واسع عبر منصات إنشاء الفن بالذكاء الاصطناعي
بأسعار معقولة وقابلة للتخصيص وقوية للغاية مع نتائج رائعة بشكل عام

سلبيات الانتشار المستقر:

الشركة التي تقف وراءها تنهار
لا يوجد خيار واحد سهل لاستخدامه

على عكس DALL·E وMidjourney، فإن Stable Diffusion مفتوح المصدر. وهذا يعني أن أي شخص لديه المهارات الفنية المطلوبة يمكنه تنزيله وتشغيله محليًا على جهاز الكمبيوتر الخاص به. وهذا يعني أيضًا أنه يمكنك تدريب النموذج وضبطه لأغراض محددة. على مدار العامين الماضيين، استخدمت جميع الخدمات تقريبًا التي تستخدم الذكاء الاصطناعي لإنشاء صور فنية وصور تاريخية ورسومات معمارية وكل شيء آخر Stable Diffusion بهذه الطريقة.

ولكن قد يعني المصدر المفتوح أيضًا الفوضى. وهذا بالضبط ما حدث مع Stability.ai، الشركة التي أسسها بعض الباحثين الذين طوروا Stable Diffusion. فهي الآن على وشك الانهيار ، وقد تعرضت أحدث نماذجها وشروط الترخيص الخاصة بها لانتقادات شديدة ، وغادر معظم فريق البحث الشركة لتشكيل شركة جديدة (سأتحدث عنها لاحقًا).

كل هذا يضع Stable Diffusion في مكان غريب. لا تزال الإصدارات الحالية من أفضل النماذج المتاحة، وهناك عدد لا يحصى من الإصدارات الدقيقة التي تجعلها أفضل لاستخدامات محددة، وهي تحظى بشعبية كبيرة – لكنني لست متأكدًا إلى متى ستظل أي من هذه الأشياء صحيحة.

أفضل طريقة (أو على الأقل الأكثر استقرارًا) لاستخدام Stable Diffusion هي من خلال أداة إنشاء صور مثل NightCafe أو Tensor.Art أو Civitai — على الرغم من أنه يمكنك العثور على الكثير من التطبيقات الأخرى التي ستتيح لك الوصول إليها. حتى أن العديد من هذه المنصات تمنحك بعض الاعتمادات المجانية حتى تتمكن من تجربتها قبل الدفع. ومع ذلك، هناك كلمة تحذير واحدة: بعض هذه المنصات لا تتمتع بنوع إدارة المحتوى المعتاد على مواقع التواصل الاجتماعي الأكبر حجمًا. قد ترى بعض الأشياء الغريبة وغير المناسبة للعمل.

إذا كنت تريد تجنب كل ذلك أو الحصول على التحكم الكامل، فيمكنك دائمًا تنزيل Stable Diffusion وتشغيله محليًا.

تسعير الانتشار المستقر: يعتمد على المنصة، ولكن العديد منها تقدم رصيدًا مجانيًا حتى تتمكن من تجربتها.

أفضل بديل للانتشار المستقر

فلوكس.1

مميزات FLUX.1:

من الفريق الذي يقف وراء Stable Diffusion—ولكن بدون الدراما
قوية ومفتوحة

سلبيات FLUX.1:

جديد وغير متوفر على نطاق واسع مثل Stable Diffusion

مع بدء انهيار Stability.ai، ترك جزء كبير من الفريق الشركة لتأسيس Black Forest Labs . والآن، أصدروا أول سلسلة من نماذج تحويل النص إلى صورة: FLUX.1 .

في اختباراتي، كان FLUX.1 جيدًا على الأقل مثل Stable Diffusion. ورغم أنه لا يحظى بدعم واسع النطاق حتى الآن، إلا أنني أتوقع أنه سيتولى زمام المبادرة تدريجيًا مع قيام المزيد من فناني الذكاء الاصطناعي بضبطه بدقة لإنشاء نماذج متخصصة.

في الوقت الحالي، إذا كنت تتطلع إلى الدخول في مجال توليد الصور بالذكاء الاصطناعي المفتوح بدلاً من مجرد استخدام إحدى أدوات تحويل النص إلى صورة الأبسط، فإنني أقترح عليك تجربة FLUX.1 عبر Stable Diffusion. تم إصدار FLUX.1 Schnell بموجب ترخيص Apache 2.0 المفتوح، بينما FLUX.1 الأكبر مفتوح للاستخدام غير التجاري.

مثل Stable Diffusion، فإن أبسط طريقة لاستخدام FLUX.1 هي من خلال مولدات الفن عبر الإنترنت التي تعمل بالذكاء الاصطناعي مثل NightCafe وTensor.Art وCivitai. قم بالتسجيل للحصول على حساب مجاني، وجربه، وقارنه جنبًا إلى جنب مع بعض النماذج الأخرى. ولكن مرة أخرى، كن حذرًا من أن المحتوى الموجود على هذه المواقع قد لا يكون مناسبًا تمامًا للعمل.

تسعير FLUX.1: يعتمد على المنصة، ولكن العديد منها تقدم رصيدًا مجانيًا حتى تتمكن من تجربتها.

أفضل مولد صور بالذكاء الاصطناعي لدمج الصور المولدة بالذكاء الاصطناعي في الصور

أدوبي فايرفلاي

إيجابيات Adobe Firefly:

يتكامل بشكل جيد مع تطبيقات Adobe، وخاصة Photoshop
قوية عندما تتطابق مع صورة

سلبيات Adobe Firefly:

ليس الأفضل كنموذج نص إلى صورة نقية

لقد قامت Adobe ببناء أدوات الذكاء الاصطناعي في تطبيقاتها لأكثر من 15 عامًا، لذا فلا ينبغي أن يكون مفاجئًا أن لديها أحد أقوى مولدات النص إلى الصورة – على الأقل من حيث كيفية تكاملها مع الأدوات الأخرى. يمكنك تجربة نموذج الذكاء الاصطناعي الخاص بها، Firefly ، على الويب مجانًا أو من خلال Adobe Express ، ولكنه في أفضل حالاته في أحدث إصدار من Photoshop.

يحتوي تطبيق Firefly على بعض الحيل. فبالإضافة إلى قدرته على إنشاء صور جديدة من وصف نصي مفصل، فإنه يستطيع إنشاء تأثيرات نصية من خلال موجه مكتوب (مثل كلمة “TOAST” المكتوبة بأحرف تبدو وكأنها مصنوعة من الخبز المحمص)، أو إعادة تلوين الأعمال الفنية المتجهة، أو إضافة عناصر تم إنشاؤها بواسطة الذكاء الاصطناعي إلى صورك. يمكنك اختبار كل هذه الميزات من خلال تطبيق الويب، ولكن الميزة الأخيرة هي التي تميز تطبيق Firefly.

إذا نظرنا إلى Firefly باعتباره أداة لتحويل النصوص إلى صور، فقد تكون نتائجه غير مرضية. فقد يتفوق على DALL·E أو Midjourney في بعض المهام، ولكن بالنسبة لمهام أخرى، فإنني أشك في الهدف الذي كان يهدف إلى تحقيقه. ومن ناحية أخرى، فإن تكامله مع Photoshop، محرر الصور القياسي في الصناعة، يمثل مستوى جديدًا.

الميزة الأفضل في Photoshop هي Generative Fill و Generative Expand. باستخدام Generative Fill، يمكنك استخدام أدوات Photoshop العادية لتحديد منطقة من صورتك، ثم بمجرد النقر فوق زر وكتابة موجه، يمكنك استبدالها بشيء آخر. باستخدام Generative Expand، يمكنك الإضافة إلى خارج صورتك. والأمر الحاسم هو أن كلتا الأداتين تفهمان سياق صورتك. في لقطة الشاشة أعلاه، يمكنك أن ترى أن Photoshop قام بمطابقة ضبابية عمق المجال للغابة التي أضفتها باستخدام Generative Fill. تبدو متماسكة.

بقدر ما بدأ DALL·E وStable Diffusion الحديث عن الذكاء الاصطناعي لتوليد الصور، فإن برنامج Firefly من Adobe هو أول تطبيق لمولد صور بالذكاء الاصطناعي يلمح حقًا إلى ما سيأتي. إنه ليس خدعة للحفلات، بل أداة متاحة لملايين المحترفين الذين يستخدمون تطبيقات Adobe كل يوم.

أسعار Firefly: مجاني مقابل 25 رصيدًا/الشهر؛ من 4.99 دولارًا مقابل 100 رصيد/الشهر؛ يتوفر Photoshop مقابل 19.99 دولارًا/الشهر كجزء من خطة Creative Cloud Photography، التي تأتي مع 500 رصيد توليدي.

أفضل مولد صور بالذكاء الاصطناعي للحصول على صور صالحة للاستخدام وآمنة تجاريًا

الذكاء الاصطناعي التوليدي بواسطة Getty Images

إيجابيات جيتي:

فعالة بشكل مدهش في توليد صور تشبه الصور المخزنة
تتعهد Getty بتعويضك عن أي مطالبات قانونية ناجمة عن استخدامك للصور التي تولدها

سلبيات جيتي:

أقل إبداعًا ومتعة في الاستخدام
لا يمكن المنافسة مع Midjourney أو DALL·E 3 أو Stable Diffusion من حيث الجودة الشاملة

كما ناقشنا، فإن مولدات الصور التي تعمل بالذكاء الاصطناعي مثيرة للجدل. وحتى بعيدًا عن أخلاقيات استخدامها، فإن الوضع القانوني غامض للغاية. فقد حكم مكتب حقوق الطبع والنشر الأمريكي بشكل عام بأن صور الذكاء الاصطناعي لا يمكن حمايتها بحقوق الطبع والنشر ، وبالتالي يمكن لمنافسيك أخذ صورك واستخدامها دون عواقب. بصراحة، إذا كنت تدير عملًا تجاريًا، فإن تجنب الذكاء الاصطناعي التوليدي هو استراتيجية مفهومة. ولكن إذا كنت تريد حقًا استخدامها، فإن منصة مثل Getty Images التي تعد بأن مولد صور الذكاء الاصطناعي التوليدي الخاص بها خالٍ من هذه الأنواع من الصداع هي الخيار الأفضل.

يُعد Generative AI من Getty Images ، والذي يمكنك الوصول إليه بسهولة عبر iStock ، جيدًا بشكل مدهش – خاصة في إنشاء صور تشبه الصور المخزنة. لقد اختبرته باستخدام صور كلاسيكية مثل “ امرأة تضحك وحدها مع سلطة “، وكانت النتائج قوية جدًا. للوهلة الأولى، كانت الخيارات الأفضل غير قابلة للتمييز عن الصور المخزنة الحقيقية.

بالنسبة للمطالبات الأكثر إبداعًا، مثل “رجل كندي يركب موسًا عبر غابة القيقب”، وأي شيء يتضمن أنماطًا فنية محددة ، كان الأمر أكثر صعوبة بعض الشيء ، للتعبير عن الأمر بشكل خفيف. أظن أن هذا يرجع إلى بيانات التدريب. بدلاً من مجموعة من بضعة مليارات من الصور ذات مصادر مشكوك فيها، يستخدم الذكاء الاصطناعي التوليدي NVIDIA Picasso وتم تدريبه إلى حد كبير على كتالوج صور Getty. وفقًا لـ Getty، تم كل هذا بشكل صريح، ولديه برنامج قائم لتعويض الفنانين الذين تم استخدام أعمالهم لتدريب النموذج.

ورغم أن هذا أمر جدير بالثناء، فإنه يؤثر على نوع الأشياء التي يمكنك توليدها. فالذكاء الاصطناعي التوليدي لن ينشئ أي شيء يضم شخصًا حقيقيًا أو علامة تجارية أو أي شيء آخر قد ينتهك قوانين الملكية الفكرية. ولم أتمكن حتى من جعله ينتج لوحة على طراز فيرمير، على الرغم من حقيقة أنه توفي في عام 1675. وبشكل عام، فإن هذا يجعل أداة جيتي أقل متعة ومرونة في الاستخدام – ولكنها أكثر عملية للشركات التي لديها قسم قانوني.

تسعير Generative AI من Getty : متوفر كـ Generative AI من iStock مقابل 14.99 دولارًا أمريكيًا لـ 100 جيل من الذكاء الاصطناعي

يحتوي موقع Shutterstock للصور أيضًا على مولد صور AI تم إنشاؤه باستخدام OpenAI. لقد اختبرته ولم يعجبني كثيرًا، لكن الأمر يستحق التحقق منه إذا كنت بحاجة إلى صور آمنة تجاريًا.

كيفية استخدام مولد الصور بالذكاء الاصطناعي

حسنًا، أنت تعرف الآن ما هي أفضل الخيارات، ولكن… ماذا بعد؟ لقد جمع فريق

بالإضافة إلى ذلك، يوجد دليل حول كيفية كتابة مطالبات فنية فعالة للذكاء الاصطناعي ، حتى تتمكن من الحصول على ما تبحث عنه بشكل أسرع (وأفضل) عند إنشاء الصور.

بمجرد إتقان الأساسيات، حان الوقت لاستخدام هذه الأدوات لأكثر من مجرد إنشاء صور غريبة.

ماذا عن Google Gemini و Imagen؟

إن أبرز ما غاب عن هذه القائمة هو برنامج Imagen لتحويل النصوص إلى صور من Google. فقد ظهر Imagen 3 للتو، ويمكنك الآن استخدامه من خلال برنامج الدردشة الآلي Google Gemini مجانًا. إنه تحسن كبير مقارنة بـ Imagen 2، لكنه لا يزال بعيدًا كل البعد عن جودة DALL·E 3 في اختباراتي. ومع استمرار تحسنه، لن أتفاجأ إذا نجح في الوصول إلى القائمة – وإذا كان لا يزال مجانيًا، فقد يتفوق على بعض الخيارات الأخرى – ولكن حتى ذلك الحين، فإن نتائجه ليست على قدم المساواة مع التطبيقات الأخرى هنا.

إذا كنت تريد قائمة غسيل لكل مولد صور الذكاء الاصطناعي الموجود هناك، بما في ذلك تلك المبنية على هذه النماذج الثلاثة، فقد قمت بذلك أيضًا. تتضمن أكثر من عشرين مولدًا للصور: بعضها مدمج في أدوات أخرى، مثل تطبيقات الكتابة بالذكاء الاصطناعي ، أو تطبيقات تحرير الصور ، أو مواقع الصور الفوتوغرافية ؛ بعضها يتيح لك الاختيار من بين نماذج متعددة ؛ ويختلف كل منها في كيفية تعامله مع إنشاء صور الذكاء الاصطناعي. لذا، إذا لم يكن أي من التطبيقات الموجودة في هذه القائمة يبدو طبيعيًا بالنسبة لك، فراجع قائمتي لأفضل مولدات الفن بالذكاء الاصطناعي ، وانظر ما إذا كان هناك أي شيء مميز.

التأثيرات القانونية والأخلاقية للصور المولدة بواسطة الذكاء الاصطناعي

أصبحت الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي موجودة في كل مكان الآن، ولكن هذا لا يعني أنه لا ينبغي لنا أن نطرح أسئلة حول كيفية استخدامها (أو عدم استخدامها) .

لا توجد قوانين واضحة تتعلق بالصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي. وينطبق هذا على جانبي العملة: يقترح مكتب حقوق الطبع والنشر الأمريكي أن المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي ليس محميًا بحقوق الطبع والنشر، ولا توجد قواعد لحماية الفنانين الذين تم جمع أعمالهم للتدريب على الذكاء الاصطناعي. (لهذا السبب تم تدريب Firefly على الصور المرخصة والمحتوى العام فقط).

لقد أدى هذا بالفعل إلى رفع دعاوى قضائية. على سبيل المثال، تواجه شركة Stability AI دعاوى قضائية من Getty Images والفنانين أنفسهم لاستخدام صورهم دون إذن، وهناك دعوى قضائية جماعية ضد عدد من مولدات الصور التي تعمل بالذكاء الاصطناعي.

من غير المحتمل أن تتعرض للمشاكل بسبب استخدام الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي في بعض منشورات وسائل التواصل الاجتماعي أو صور بطل المدونة، ولكن نظرًا لعدم وجود خط مرسوم في الرمال حتى الآن، فقد يكون من الخطر تطوير استراتيجية كاملة حول الفن الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.

ثم هناك مسألة التحيز . فحتى الآن، يتسم الذكاء الاصطناعي بنفس التحيزات التي يتسم بها البشر، وقد يؤدي ذلك إلى كل شيء بدءًا من تصوير الصور النمطية وحتى المحتوى الضار. لقد واجهت هذا بنفسي مع النتائج التي حصلت عليها من بعض التطبيقات أثناء اختبارها، على الرغم من أن أدوات أخرى تتخذ خطوات متعمدة لإضافة التنوع إلى الصور التي تولدها. والأمر متروك لنا كبشر لتجنب ذلك من خلال مراجعة المحتوى الذي يولد بواسطة الذكاء الاصطناعي بحثًا عن التحيز وتحسين مطالباتنا للقضاء على هذا التحيز قدر الإمكان.

ما هو التالي بالنسبة لمولدات الصور بالذكاء الاصطناعي؟

إن توليد الصور باستخدام الذكاء الاصطناعي هو مجال يتطور بسرعة، وتتوفر نماذج أكثر قوة في كل مرة أقوم فيها بتحديث هذه المقالة. ومن المذهل مدى جودة نماذج تحويل النص إلى صورة مثل Midjourney وIdeogram وFLUX.1 في عرض المفاهيم الصعبة بشكل متكرر. ورغم أنها لا تزال أداة متخصصة إلى حد ما الآن، إلا أنه إذا استمرت في التحسن بهذه الوتيرة، فقد تغير الأمور حقًا.

الوسوم