القائمة الرئيسية

الصفحات

الذكاء الاصطناعي يجعل الصور أكثر وضوحا 60 مرة

الذكاء الاصطناعي يجعل الصور أكثر وضوحا 60 مرة

طور باحثون في جامعة ديوك أداة الذكاء الاصطناعي التي يمكنها تحويل صور ضبابية وغير معروفة لوجوه الأشخاص إلى صور شريرة مقنعة تم إنشاؤها بواسطة الكمبيوتر ، بمزيد من التفصيل أكثر من أي وقت مضى.

تتيح لك الطرق السابقة تغيير حجم صورة الوجه بما يصل إلى ثمانية أضعاف دقتها الأصلية. لكن فريق Duke وجد طريقة لالتقاط عدد قليل من وحدات البكسل وإنشاء وجوه واقعية بدقة تصل إلى 64 مرة ، "تخيل" ميزات مثل الخطوط الدقيقة والرموش واللحية التي لم تكن موجودة في البداية.

قالت سينثيا رودين ، عالمة الكمبيوتر في شركة Duke ، التي قادت الفريق: "لم نقم أبدًا بإنشاء صور بهذا القرار بهذه التفاصيل".

لا يمكن استخدام النظام لتحديد هوية الأشخاص ، كما يقول الباحثون: لن يحول صورة ضبابية ولا يمكن التعرف عليها من كاميرا أمنية إلى صورة واضحة ونقية لشخص حقيقي. بل إنها قادرة على توليد وجوه جديدة غير موجودة ، ولكن يبدو أنها حقيقية.

بينما ركز الباحثون على الوجوه كدليل على المفهوم ، يمكن لنفس التقنية نظريًا التقاط صور منخفضة الدقة لكل شيء تقريبًا وإنشاء صور واضحة وواقعية ، مع تطبيقات تتراوح من الطب والمجهري إلى قال المؤلف المشارك ساتكيت مينون '20 ، علم الفلك وصور الأقمار الصناعية ، الذي تخرج للتو من جامعة ديوك مع تخصص مزدوج في الرياضيات وعلوم الكمبيوتر.

سيقدم الباحثون طريقتهم ، المسماة PULSE ، في مؤتمر 2020 حول رؤية الكمبيوتر والتعرف على الأنماط (CVPR) ، والذي سيعقد فعليًا من 14 إلى 19 يونيو.

تأخذ الأساليب التقليدية صورة منخفضة الدقة و "تخمين" ما هي البكسلات الإضافية المطلوبة بمحاولة مطابقتها ، في المتوسط ​​، مع وحدات البكسل المقابلة في الصور عالية الدقة التي شاهدها الكمبيوتر بالفعل. ونتيجة لذلك ، فإن المناطق المنسوجة من الشعر والجلد التي لا تتماشى بشكل مثالي من البكسل إلى البكسل ينتهي بها الأمر إلى أن تبدو باهتة وغير واضحة.

اقترح فريق دوق نهجا مختلفا. بدلاً من التقاط صورة منخفضة الدقة وإضافة تفاصيل جديدة ببطء ، يقوم النظام بتحليل أمثلة الوجوه عالية الدقة الناتجة عن الذكاء الاصطناعي ، بحثًا عن تلك التي تشبه إلى حد كبير الصورة المدخلة عندما يتم تقليلها إلى نفس الحجم.

استخدم الفريق أداة تعلُم الآلة تسمى "شبكة معارضة مولدة" أو GAN ، وهما شبكتان عصبيتان تشكلت على نفس مجموعة بيانات الصور. تقوم إحدى الشبكات بإنشاء وجوه بشرية باستخدام الذكاء الاصطناعي الذي يحاكي تلك التي تم تدريبها عليها ، بينما تأخذ الأخرى هذا الإنتاج وتقرر ما إذا كانت مقنعة بما فيه الكفاية ليتم أخذها على أرض الواقع. تصبح الشبكة الأولى أفضل وأفضل مع الخبرة ، حتى لا تتمكن الشبكة الثانية من معرفة الفرق.

وقال رودين إن PULSE يمكن أن تنشئ صورًا واقعية المظهر من إشارة ضجيج رديئة الجودة ، والتي لا يمكن للطرق الأخرى القيام بها. من صورة ضبابية واحدة لوجه ، يمكنه أن يبصق عددًا لا نهائيًا من الاحتمالات الواقعية بشكل لا يصدق ، كل منها يشبه بمهارة شخصًا مختلفًا.

قال أليكس داميان ، مؤلف مشارك ، 20 ، طالب مشارك ، حتى مع الصور المنقطة حيث لا يمكن التعرف على العينين والفم ، "لا تزال الخوارزمية لدينا قادرة على القيام بشيء معها ، وهو ما لا يمكن للطرق التقليدية القيام به". في الرياضيات في دوق.

يمكن للنظام تحويل صورة 16 × 16 بكسل لوجه إلى 1024 × 1024 بكسل في ثوانٍ ، مع إضافة أكثر من مليون بكسل ، وهو ما يتوافق مع دقة HD. تصبح التفاصيل مثل المسام والتجاعيد وشعيرات الشعر التي لا يمكن ملاحظتها في الصور منخفضة الدقة واضحة ونقية في الإصدارات التي يتم إنشاؤها بواسطة الكمبيوتر.

طلب الباحثون من 40 شخصًا تقييم 1440 صورة تم إنشاؤها بواسطة PULSE وخمس طرق أخرى للتحجيم على مقياس من واحد إلى خمسة. حققت PULSE أفضل النتائج ، حيث سجلت درجات عالية تقريبًا مثل تلك الصور عالية الجودة لأشخاص حقيقيين.

أمتلة عن مشروع PULSE

أمتلة عن مشروع PULSE

أمتلة عن مشروع PULSE

أمتلة عن مشروع PULSE


رابط المشروع على  github للمطورين.
محتوى الموضوع