api dall-e 2 Enterprise Generative AI Media & Entertainment OpenAI Robotics & AI أخبار تقنية تقنية تكنولوجيا شروحات مراجعات تقنية مقالات معلوماتية

الآن يمكن لأي شخص إنشاء تطبيقات تستخدم DALL-E 2 لإنشاء الصور

alwaliنوفمبر 3, 2022آخر تحديث: نوفمبر 3, 2022

الآن يمكن لأي شخص إنشاء تطبيقات تستخدم DALL-E 2 لإنشاء الصور

أخيرًا ، يتوفر DALL-E 2 ، وهو نظام AI لتوليد الصور من OpenAI ، كواجهة برمجة تطبيقات ، مما يعني أنه يمكن للمطورين بناء النظام في تطبيقاتهم ومواقعهم الإلكترونية وخدماتهم. في منشور مدونة اليوم ، أعلنت شركة OpenAI أن أي مطور يمكنه البدء في الاستفادة من قوة DALL-E 2 – التي يستخدمها الآن أكثر من ثلاثة ملايين شخص لإنتاج أكثر من أربعة ملايين صورة يوميًا – بمجرد إنشاء حساب OpenAI API كجزء من الإصدار التجريبي العام.

يختلف تسعير DALL-E 2 API حسب الدقة. بالنسبة إلى الصور التي تبلغ 1024 × 1024 ، تبلغ التكلفة 0.02 دولارًا لكل صورة ؛ 512 × 512 صورة – 0.018 دولار لكل صورة ؛ و 256 × 256 صورة هي 0.016 دولار لكل صورة. خصومات الحجم متاحة للشركات التي تعمل مع فريق مؤسسة OpenAI.

كما هو الحال مع الإصدار التجريبي DALL-E 2 ، ستسمح واجهة برمجة التطبيقات للمستخدمين بإنشاء صور جديدة من المطالبات النصية (على سبيل المثال ، “أرنب رقيق يقفز عبر حقل من الزهور”) أو تحرير الصور الموجودة. تقوم Microsoft ، الشريك المقرب لـ OpenAI ، بالاستفادة منها في Bing و Microsoft Edge باستخدام أداة Image Creator الخاصة بها ، والتي تتيح للمستخدمين إنشاء الصور إذا لم تُرجع نتائج الويب ما يبحثون عنه. يستخدم تطبيق تصميم الأزياء CALA واجهة برمجة تطبيقات DALL-E 2 لأداة تسمح للعملاء بتحسين أفكار التصميم من أوصاف النص أو الصور ، بينما يقوم بدء تشغيل الصور Mixtiles بإحضاره إلى تدفق إنشاء الأعمال الفنية لمستخدميه.

لا يتغير الكثير من حيث السياسة مع إطلاق API ، والذي من المرجح أن يخيب آمال أولئك الذين يخشون أن يتم إطلاق أنظمة الذكاء الاصطناعي التوليدية مثل DALL-E 2 دون مراعاة كافية للمسائل الأخلاقية والقانونية التي يطرحونها. كما كان من قبل ، يلتزم المستخدمون بشروط خدمة OpenAI ، والتي تحظر استخدام DALL-E 2 لإنشاء محتوى عنيف أو جنسي أو يحض على الكراهية. تواصل OpenAI أيضًا منع المستخدمين من تحميل صور الأشخاص دون موافقتهم أو الصور التي ليس لديهم حقوقها ، وذلك باستخدام مزيج من أنظمة المراقبة الآلية والبشرية لفرض ذلك.

أحد التعديلات الطفيفة هو أن الصور التي تم إنشاؤها باستخدام واجهة برمجة التطبيقات لن تكون مطلوبة لاحتواء علامة مائية. قدمت شركة OpenAI وضع العلامات المائية أثناء الإصدار التجريبي من DALL-E 2 كطريقة للإشارة إلى الصور التي نشأت من النظام ، ولكنها قررت جعلها اختيارية مع إطلاق واجهة برمجة التطبيقات.

قال Luke Miller ، مدير المنتج في OpenAI الذي يشرف على تطوير DALL-E 2 ، لموقع TechCrunch عبر البريد الإلكتروني: “نشجع المطورين على الكشف عن أن الصور تم إنشاؤها بواسطة الذكاء الاصطناعي ، ولكن لا تتطلب تضمين توقيع DALL-E 2”.

أداة Microsoft Designer ، مدعومة بواجهة برمجة تطبيقات DALL-E 2.

توظف أوبن إيه آي أيضًا مرشحات على مستوى سريع وصورة مع DALL-E 2 ، وإن كانت المرشحات التي اشتكى بعض العملاء منها مفرط الحماس و غير دقيق. وقد ركزت الشركة جزءًا من جهودها البحثية على تنويع أنواع الصور التي ينتجها DALL-E 2 ، بهدف مكافحة التحيزات التي من المعروف أن أنظمة الذكاء الاصطناعي لتحويل النص إلى صورة تقع ضحية لها (على سبيل المثال ، إنشاء صور باللون الأبيض في الغالب. الرجال عند مطالبتهم بنص مثل “أمثلة على المديرين التنفيذيين”).

لكن هذه الخطوات لم تضع كل النقاد. في أغسطس ، صور غيتي محظور تحميل وبيع الرسوم التوضيحية التي تم إنشاؤها باستخدام DALL-E 2 وغيرها من الأدوات المماثلة ، باتباع قرارات مماثلة من قبل المواقع بما في ذلك Newgrounds و PurplePort و FurAffinity. قال الرئيس التنفيذي لشركة Getty Images ، كريج بيترز ، لموقع The Verge إن الحظر جاء بسبب مخاوف بشأن “المشكلات الصحيحة التي لم تتم معالجتها” ، حيث تحتوي مجموعات بيانات التدريب لأنظمة مثل DALL-E 2 على صور محمية بحقوق الطبع والنشر مأخوذة من الويب.

يقول العديد من النقاد إنه ليس مجرد انتهاك لـ عمل مسجّل كعلامة تجارية 2. يهدد النظام اهتمامات الفنانين الذين يمكن الآن تكرار أنماطهم ببضع سلاسل من النص ، كما يقولون ، بما في ذلك الفنانين الذين لم يوافقوا على استخدام عملهم في تدريب DALL-E 2. (لكي نكون منصفين لشركة OpenAI ، الشركة لديها رخصت جزءًا من الصور في مجموعة بيانات التدريب الخاصة بـ DALL-E 2 ، وهو أكثر مما يمكن قوله عن بعض منافسيها.)

في محاولة لإيجاد حل وسط ، أعلنت شركة Shutterstock منافسة Getty Images مؤخرًا أنها ستبدأ في استخدام DALL-E 2 لإنشاء محتوى ولكن في نفس الوقت ستطلق “صندوق مساهم” لتعويض المبدعين عندما تبيع الشركة العمل لتدريب أنظمة الذكاء الاصطناعي على تحويل النص إلى صورة . كما أنه يحظر فن الذكاء الاصطناعي الذي تم تحميله من قبل أطراف ثالثة لتقليل احتمالية أن يشق العمل المحمي بحقوق الطبع والنشر طريقه إلى النظام الأساسي.

يقود التقنيون مات دريهيرست وهولي هيرندون جهدًا يسمى المصدر + للسماح للأشخاص بعدم السماح باستخدام عملهم أو ما شابه لأغراض التدريب على الذكاء الاصطناعي. لكنها طوعية. لم تذكر OpenAI ما إذا كانت ستشارك – أو في الواقع ، ما إذا كانت ستقدم أداة الخدمة الذاتية للسماح لأصحاب الحقوق باستبعاد عملهم من التدريب أو إنشاء المحتوى.

تعد Mixtiles من بين أوائل الذين تبنوا DALL-E 2 API.

في مقابلة ، كشف ميلر القليل فيما يتعلق بالتفاصيل المتعلقة بالتدابير التخفيفية الجديدة ، باستثناء أن OpenAI كانت تعمل على تحسين تقنياتها لمنع النظام من إنشاء محتوى متحيز وسام ومهين بطريقة أخرى قد يجده العملاء مرفوضًا. وقد وصف الإصدار التجريبي المفتوح من واجهة برمجة التطبيقات بأنه عملية “تكرارية” ، عملية ستتضمن العمل مع “المستخدمين والفنانين” خلال الأشهر القليلة القادمة حيث تقوم OpenAI بتوسيع البنية التحتية لتشغيل DALL-E 2.

بالتأكيد ، إذا كان الإصدار التجريبي DALL-E 2 يمثل أي مؤشر ، فسوف يتطور برنامج API مع مرور الوقت. في وقت مبكر ، قامت OpenAI بتعطيل القدرة على تحرير وجوه الأشخاص باستخدام DALL-E 2 ، لكنها مكنت لاحقًا القدرة بعد إجراء تحسينات على نظام الأمان الخاص بها.

“لقد قمنا بالكثير من العمل في هذا الجانب من الأشياء – من خلال الصور التي تحملها والمطالبات التي ترسلها بقدر ما تتوافق مع سياسة المحتوى الخاصة بنا والخبز في إجراءات التخفيف المختلفة للتصفية على المستوى الفوري وعلى مستوى الصورة للتأكد من توافقها مع سياسة المحتوى الخاصة بنا. لذلك ، على سبيل المثال ، إذا قام شخص ما بتحميل صورة تحتوي على رموز كراهية أو دموية – مثل محتوى شديد العنف للغاية – فسيتم رفض ذلك ، “قال ميلر. “نفكر دائمًا في كيفية تحسين النظام.”

ولكن بينما يبدو أن OpenAI حريص على تجنب الجدل الذي يحيط بـ Stable Diffusion ، وهو المكافئ المفتوح المصدر لـ DALL-E 2 الذي تم استخدامه لإنشاء التزييف العميق للأفلام الإباحية والمشاهير ، فإنه يترك الأمر لمستخدمي واجهة برمجة التطبيقات لاختيار كيف وأين يتم النشر بالضبط تقنيتها. سيتبع البعض ، مثل Microsoft ، بلا شك نهجًا محسوبًا ، حيث يطرحون المنتجات التي تعمل بالطاقة DALL-E 2 ببطء لجمع التعليقات. سوف يغوص الآخرون رأسًا على عقب ، حيث يستفيدون من كل من التكنولوجيا و معضلات النتيجة التي تأتي معها.

إذا كان هناك شيء واحد مؤكد ، فهو أن هناك طلبًا مكبوتًا على الذكاء الاصطناعي التوليدي – ستكون العواقب ملعونًا. حتى قبل أن تصبح واجهة برمجة التطبيقات متاحة رسميًا ، كان المطورون ينشرون الحلول لدمج DALL-E 2 في التطبيقات والخدمات والمواقع الإلكترونية وحتى ألعاب الفيديو. مع إطلاق الإصدار التجريبي العام ، الذي تغذيه القوة التسويقية الهائلة لـ OpenAI ، تستعد الصور الاصطناعية لدخول الاتجاه السائد حقًا.