به قول قدیمیها، چشمها دریچهای به روح هستند – اما وقتی صحبت از تصاویر عمیق جعلی به میان میآید، ممکن است پنجرهای به سمت غیرواقعی بودن باشند.
این بر اساس تحقیقات جدیدی است که در دانشگاه هال در بریتانیا انجام شده است، که از تکنیکهایی استفاده میکند که معمولاً در رصد کهکشانهای دور برای تعیین واقعی بودن یا نبودن تصاویر صورت انسان استفاده میشود. این ایده زمانی مطرح شد که کوین پیمبلت، استاد اخترفیزیک در دانشگاه، در حال مطالعه تصاویر صورت ایجاد شده توسط مولدهای هنری هوش مصنوعی (AI) Midjourney و Stable Diffusion بود. او فکر می کرد که آیا می تواند از فیزیک برای تعیین اینکه کدام تصاویر جعلی و کدام واقعی هستند استفاده کند. او به Space.com گفت: ‘من متوجه شدم که انعکاس در چشم ها چیزی است که باید به آن نگاه کرد.’
دیپفیکها یا تصاویر جعلی یا ویدیوهایی از افراد هستند که با آموزش هوش مصنوعی روی کوههای داده ایجاد شدهاند. هنگام تولید تصاویری از صورت انسان، هوش مصنوعی از دانش گسترده خود برای ساختن یک چهره غیر واقعی، پیکسل به پیکسل استفاده می کند. این چهره ها را می توان از ابتدا یا بر اساس افراد واقعی ساخت. در مورد دومی، آنها اغلب به دلایل مخرب استفاده می شوند. با این وجود، با توجه به اینکه عکسهای واقعی حاوی انعکاس هستند، هوش مصنوعی این موارد را اضافه میکند –– اما اغلب تفاوتهای ظریفی در هر دو چشم وجود دارد.
پیمبلت با تمایل به پیروی از غریزه خود، Adejumoke Owolabi، دانشجوی کارشناسی ارشد دانشگاه را برای کمک به توسعه نرمافزاری که میتواند به سرعت چشمهای سوژهها را در تصاویر مختلف اسکن کند، استخدام کرد تا ببیند آیا این بازتابها بررسی میشوند یا خیر. این زوج برنامه ای برای ارزیابی تفاوت بین کره چشم چپ و راست در عکس های افراد، واقعی و غیر واقعی ساختند. چهره های واقعی از مجموعه داده های متنوعی از ۷۰۰۰۰ چهره در فلیکر به دست آمد، در حالی که دیپ فیک ها توسط هوش مصنوعی زیربنای وب سایت This Person Does Not Exist، وب سایتی که تصاویر واقعی از افرادی تولید می کند که فکر می کنید وجود دارند، اما وجود ندارند.
وقتی متوجه شدید که وجود دارد، واضح است: من این شخص وجود ندارد پنج بار رفرش کردم و انعکاسهای چشمها را مطالعه کردم. چهره ها تاثیرگذار بود. در یک نگاه، هیچ چیزی وجود ندارد که نشان دهد آنها جعلی هستند.
بازرسی دقیقتر تفاوتهای تقریباً نامحسوسی را در نور هر دو کره چشم نشان داد. به نظر نمی رسید دقیقاً مطابقت داشته باشند. در یک مورد، هوش مصنوعی مردی را ایجاد کرد که عینک داشت – انعکاس در لنز او نیز کمی دور به نظر می رسید.
با این حال، چیزی که چشم من نمی توانست کمیت کند، این بود که بازتاب ها چقدر متفاوت بودند. برای انجام چنین ارزیابی، به ابزاری نیاز دارید که بتواند نقض قوانین دقیق اپتیک را شناسایی کند. اینجاست که نرم افزار Pimbblet و Owolabi وارد می شود. آنها از دو تکنیک از کتاب راهنما نجوم استفاده کردند، ‘پارامترهای CAS’ و ‘شاخص جینی’.
در نجوم، پارامترهای CAS می توانند ساختار یک کهکشان را با بررسی غلظت، عدم تقارن و صافی (یا ‘کلوگی’) یک نیمرخ نوری تعیین کنند. به عنوان مثال، یک کهکشان بیضوی دارای مقدار C بالا و مقادیر A و S پایین خواهد بود – نور آن در مرکز آن متمرکز است، اما پوسته پراکنده تری دارد که آن را هموارتر و متقارن تر می کند. با این حال، جفت دریافتند که CAS برای شناسایی دیپفیکها مفید نیست. تمرکز با یک نقطه نور بهتر عمل می کند، اما بازتاب ها اغلب به صورت تکه های نور پراکنده در کره چشم ظاهر می شوند. عدم تقارن از مشکل مشابهی رنج میبرد – این تکهها انعکاس را نامتقارن میکنند و پیمبلت میگوید دریافت «درست» این معیار دشوار است.
استفاده از ضریب جینی بسیار بهتر عمل کرد. این روشی برای اندازه گیری نابرابری در طیفی از مقادیر است. می توان از آن برای محاسبه طیف وسیعی از نتایج مربوط به نابرابری، مانند توزیع ثروت، امید به زندگی یا، شاید رایج ترین، استفاده کرد. در این مورد، جینی برای نابرابری پیکسل اعمال شد.
پیمبلت میگوید: «جینی کل توزیع پیکسل را میگیرد، میتواند ببیند آیا مقادیر پیکسلها به طور مشابه بین چپ و راست توزیع شدهاند یا خیر، و یک رویکرد ناپارامتریک قوی برای استفاده در اینجا است».
این کار در نشست انجمن سلطنتی نجوم در دانشگاه هال در ۲۵ تیر ارائه شد، اما هنوز مورد بررسی و انتشار قرار نگرفته است. این زوج در تلاشند تا مطالعه را به یک نشریه تبدیل کنند.
Pimbblet میگوید که این نرمافزار صرفاً یک اثبات مفهوم در این مرحله است. این نرم افزار همچنان موارد مثبت کاذب و منفی کاذب را با نرخ خطا در حدود سه در ۱۰ علامت گذاری می کند. همچنین تاکنون تنها بر روی یک مدل هوش مصنوعی آزمایش شده است. پیمبلت میگوید: «ما روی مدلهای دیگر آزمایش نکردهایم، اما این یک گام بعدی واضح است.
دن میلر، روانشناس در دانشگاه جیمز کوک در استرالیا، گفت که یافته های این مطالعه اطلاعات مفیدی را ارائه می دهد، اما هشدار داد که ممکن است به خصوص برای بهبود تشخیص انسان از دیپ فیک مرتبط نباشد – حداقل هنوز، زیرا این روش نیاز به مدل سازی ریاضی پیچیده ای از نور دارد. با این حال، او خاطرنشان کرد: «یافتهها میتوانند از توسعه نرمافزار تشخیص عمیق دروغین خبر دهند».
و نرم افزار به نظر می رسد که ضروری است، با توجه به پیچیده شدن تقلبی ها. در مطالعهای در سال ۲۰۲۳، میلر ارزیابی کرد که شرکتکنندگان تا چه حد میتوانند یک ویدیوی دیپفیک را تشخیص دهند، و به یک گروه فهرستی از مصنوعات بصری – مانند سایهها یا نورها – را که باید به دنبال آن باشند ارائه میدهد. اما این تحقیق نشان داد که مداخله به هیچ وجه مؤثر نبود. آزمودنیها فقط میتوانستند تقلبیها و همچنین گروه کنترلی را که راهنماییهای لازم را دریافت نکرده بودند، تشخیص دهند (این نوع نشان میدهد که آزمایش کوچک شخصی من در بالا میتواند یک امر پرت باشد).
کل حوزه هوش مصنوعی از زمانی که ChatGPT در اواخر سال ۲۰۲۲ حذف شد، احساس میکند با سرعت نور در حال حرکت است. Pimbblet پیشنهاد میکند که رویکرد این جفت با دیگر تولیدکنندگان تصویر هوش مصنوعی کار میکند، اما خاطرنشان میکند که احتمالاً مدلهای جدیدتر نیز میتوانند مشکل نور فیزیک را حل کنند.
این تحقیق همچنین یک سوال جالب را مطرح میکند: اگر هوش مصنوعی بتواند بازتابهایی ایجاد کند که بتوان با روشهای مبتنی بر نجوم ارزیابی کرد… آیا میتوان از هوش مصنوعی برای تولید کل کهکشانها نیز استفاده کرد؟
پیمبلت میگوید هجومهایی به این حوزه صورت گرفته است. او به مطالعهای در سال ۲۰۱۷ اشاره میکند که ارزیابی میکرد «شبکههای متخاصم مولد» یا GAN (فناوری زیربنای مولدهای هوش مصنوعی مانند Midjourney یا ChatGPT) چقدر میتوانند کهکشانها را از دادههای تخریبشده جمعبندی کنند. رصد تلسکوپها روی زمین و فضا میتواند توسط نویز و پسزمینه محدود شود و باعث تاری و کاهش کیفیت شود (حتی تصاویر خیرهکننده تلسکوپ فضایی جیمز وب نیاز به تمیز کردن دارند).
در مطالعه سال ۲۰۱۷، محققان یک مدل بزرگ هوش مصنوعی را بر روی تصاویر کهکشان ها آموزش دادند، سپس از این مدل برای تلاش برای بازیابی تصاویر تخریب شده استفاده کردند. همیشه کامل نبود – اما مطمئناً میتوان ویژگیهای کهکشانها را از تصاویر با کیفیت پایین بازیابی کرد.
یک مطالعه پیش از چاپ، در سال ۲۰۱۹، به طور مشابه از GAN ها برای شبیه سازی کل کهکشان ها استفاده کرد.
محققان پیشنهاد میکنند که این کار میتواند مفید باشد زیرا حجم عظیمی از دادهها از مأموریتهای رصد کیهان سرازیر میشوند. هیچ راهی برای بررسی همه آن وجود ندارد، بنابراین ممکن است لازم باشد به هوش مصنوعی روی بیاوریم. تولید این کهکشان ها با هوش مصنوعی می تواند به نوبه خود هوش مصنوعی را برای شکار انواع خاصی از کهکشان های واقعی در مجموعه داده های عظیم آموزش دهد. همه اینها کمی دیستوپیک به نظر می رسد، اما باز هم تشخیص چهره های غیر واقعی با تغییرات ظریف در انعکاس در کره چشم آنها نیز صدق می کند.