تشخیص دیپ فیک در تصویر با استفاده از مدل ترکیبی مبتنی بر شبکه عصبی کانولوشنی عمیق
مدل سازی در مهندسی - Modeling in Engineering
1402/2023
چکیده
دیپ فیک به دسته ای از داده های جعلی و مصنوعی اطلاق می گردد که در آن محتوای جعلی بر اساس محتوای موجود تولید می گردد. این محتوا می تواند شامل تصویر، ویدیو و سیگنال های صوتی باشد. تولید دیپ فیک مبتنی بر شبکه-های زایشی عمیق می باشد که موجب دستکاری داده ها یا تولید تصاویر و ویدیوهای ساختگی استفاده می شود. در سال های اخیر، مطالعات زیادی برای درک نحوه عملکرد دیپ فیک ها انجام شده است و روش های بسیاری مبتنی بر یادگیری عمیق برای شناسایی ویدیوها یا تصاویر تولید شده توسط دیپ فیک و نیز تمایز آنها از تصاویر واقعی معرفی شده است. به منظور بهبود دقت تشخیص دیپ فیک و نیز استفاده همزمان از قابلیت های انواع مختلف شبکه های عصبی کانولوشنی، در این مقاله، یک مدل ترکیبی با استفاده از چهار شبکه عصبی کانولوشنی ِDenseNet201، EfficientNetB2، Inception-ResNet-V2 و ResNet152 ارائه می گردد. با تکیه بر قابلیت های بالای این شبکه ها در استخراج ویژگی های موثر از تصویر ورودی، مدل پیشنهادی قادر به تشخیص همزمان دیپ فیک بودن یا نبودن تصویر ورودی توسط این چهار مدل می باشد. نتایج ارائه شده بر روی سه پایگاه داده 140k real and fake faces، DFDC faces و Deepfake and real images حاکی از بهبود نتایج نسبت به مدل های موجود می باشد.

