انسان شکل میبند، هوش مصنوعی بافت
وقتی که شما به عکس یک گربه نگاه میکنید، به احتمال زیاد به راحتی میتواند گربه را تشخیص بدهید. حتی اگر گربه راه راه باشد، رنگ عجیبی داشته باشد، تصویر قدیمی باشد و یا گربه در حال حرکت باشد و تصویر تار گرفته شده باشد؛ انسان ها به طور غریزی یاد می گیرند که همه این تصاویر متعلق به گربه است. ماشین هایی که از یادگیری عمیق استفاده میکنند نیز می توانند گربه را تشخیس دهند و گاهی از انسان ها نیز سریع تر عمل میکنند ولی اگر این تصویر حتی کمی تار شوند و یا اختلال کوچکی در آن به وجود آید ماشین دیگر نمی تواند به درستی گربه را تشخیص دهد.
روش کار ماشین هایی که از سیستم یاد گیری عمیق استفاده میکنند، به این شکل است که ابتدا تعدادی عکس به ماشین داده میشود، و سپس با استفاده از برچسب هایی به ماشین گفته می شود که آیا تصویر دارای گربه است یا نه. سپس ماشین شروع به برسی داده های خود میکند و الگو هایی را برای خود از درون تصاویر استخراج می کند و با استفاده از این الگو ها تصمیم می گیرد که آیا تصویری که تا حالا ندیده است دارای گربه است یا نه. محققین در حال تلاش اند تا بفهمند که چه چیزهایی باعث موفقیت و بهبود کارایی سیستم می شود و چه چیزهای باعث شکست این سیستم ها می شود.
برای این کار برخی از محققین تصمیم گرفتند تا عمدا اختلالی در تصویر به وجود بیاورند. و متوجه شدند که تعقیرات کوچکی باعث تشخیص اشتباه ماشین می شود. اگر اختلالات زیادی در تصویر به وجود آورند ماشین توانایی تشخیص را کاملا از دست میدهد. برخی های دیگر هم تصمیم به تجزیه و تحلیل جواب شبکه “عصبی” ماشین به عکس های مختلف گرفتند تا با این کار یک تصویر بزرگ از یادگرفته های سیستم بسازند.
یادگیری ماشین با عکس ها
به تازگی گروهی از محقیقن در دانشگاه تیپینگن (Tübingen ) آلمان کار جدیدی انجام داده اند، آن ها شروع به تعلیم یک ماشین با عکس هایی که نوع خاصی از اختلال را داشتند کردند. پس از مدتی قابلیت تشخیص ماشین در این نوع خاص از اختلال از انسان نیز بهتر شد. ولی اگر اختلال ایجاد شده حتی کمی از اختلال ایجاد شده قبلی متفاوت باشد، ماشین کاملا گول خواهدخورد و به شتباه می افتد.
برای جواب سوال این که چرا این اتفاق رخ می دهد، محققین حدس زدن که ماشین بیشتر به بافت تصویر توجه میکند و نه شکل آن. بر اساس گفته های رابرت گیرهوس Robert Geirhos رئیس پروژه:
“وقتی که اختلالی در یک تصویر به وجود می آید شکل کلی تصویر به ندرت تغییر می کند اما بافت جسم با کوچک ترین اختلالی دچار تغییرمی شود”
برای نشان دادن این مسله گیرهوس و همکارانش آزمایشی جدید انجام دادن. آن ها عکس هایی را درست کردند که در آن ها شکل کلی از یک شیئ آمده بود، و بافت از شیئ دیگر به طور مثل گربه ای که پوستش همانند پوست فیل است، خرسی که از قوطی های آلمینیومی درست شده یا هواپیمایی که با ساعت پوشیده شده است. در تقریبا تمامی دفعات انسان بر اساس شکل کلی تصویر راتشخیص داد گربه،خرس،هواپیما ولی ماشین با بافت تصویر را شناسایی کرد فیل، قوطی، ساعت.
در نگاه اول این انتخواب- ترجیح دادن بافت بر ساختار- عجیب به نظر می آید. ولی اگر عمیق تر نگاه کنیم میبینیم که میتوان به بافت به عنوان شکل در مقیاس ریز نگاه کرد. تمرکز بر یک مقیاس ریزتر راحت تر است چون تعداد پیکزل هایی که در درون یک شکل وجود دارد بسیار بیشتر است از تعداد پیکزل های در مرز یک شکل با محیط اطرافش وجود دارد.
یادگیری عمیق
نیکلاس کریگسکورت Nikolaus Kriegeskorte یک محقق عصب شناسی که عضو تیم نبود گفت:
” الگوریتم های آموزش عمیق امروزی این اجازه رابه ماشین می دهند که با ادغام کردن ساختارهای شکل های مختلف مثل بافت آن یک الگوی کلی از شکل جسم برای خود تعریف بکند. ولی چیزی که باعث تعجب می شود ین است که با وجود این که ساختار این اجازه را به ماشین میدهد ماشین به خودی خود این کار را انجام نمیدهد.”
گیرهوس و همکارانش تلاش کردند تا سیستم را وادار کنند تا بیشتر مانند انسان به اشکال نگاه کند. برای این کار آن ها عکس های آموزشی یک ماشین را ” رنگامیزی کردند” و با این کار جلوی تمرکز ماشین بر بافت شکل ها را گرفتند. بعد از تعلیم دوباره ماشین، ماشین شروع کرد به توجه به شکل به جای بافت درست مثل انسان، از آن به بعد عملکرد ماشین در تشخیص تصاویری که اخلالاتی در آن ها بود بهتر شد.
چون که ما در یک دنیای 3 بعدی زندگی میکنیم و علاوه بر دیدن می توانیم از حواص دیگر برای تشخیص اشیاء استفاده بکنیم؛ انسان ها به طور ذاتی تصمیم گیری بر اساس شکل را بر تصمیم گیری بر اساس بافت ترجیح می دهند. این به ما کمک میکند تا در شرایتی که اختلالی در تصویر وجود دارد، تصویر واضح نیست و یا در زمان مواجه با تصویری جدیدی که در گزشته مشابه آن را ندیده بودیم، ما بتوانیم اشیاء داخل تصویر را تشخیص بدهیم.( در واقع این مسئله باعث به وجود آمدن یک جور تعصب و پیشقدری در انسان در رابطه با تشخیص اشیاء درون یک تصویر می شود. )
مدل گیرهوس
به هر حال حتی مدل گیرهوس هم که بیشتر بر شکل تمر کز میکند، در زمانی که میزان اختلال زیاد شود و یا با تغیر چند پیکزل خاص در تصویر دچار مشکل می شود، که نشان دهنده سطح تفاوت بزرگ میان ماشین و انسان است.( در موردی مشابه روزنفیلد Rosenfeld تسوتوس Tsotsos و مارکوس سلباخ Markus D. Solbach در طی تحقیقی نشان دادند که الگریتم های یاد گیری ماشین نمی توانند مانند انسان شباهت های میان دو شکل تشخیص دهند. )
سانجا فیدلر Sanja Fidler محقق کامپیوتر همراه با همکارانش در دانشگاه تورنتو در حال تحقیق بر سر چگونگی بالا بردن کارایی با دادن یکسری وظایف ثانویه به شبکه های عصبی است. با الحام گرفتن از کارهای گیرهوس به یک الگوریتم طبقه بندی داده یاد دادند تا نه تنها شکل را تشخیص دهد بلکه تشخیص دهد که کدام پیکسل جزوی از بخش داخلی و کدام پیکسل حاوی مرز میان شکل و فضای اطرافش است. این کار باعث بهبود عملکرد ماشین شد. فیدلر گفت:
“داشتن یک وظیفه باعث به وجود آمد نقات کور در سیستم می شود. چون فرد یا ماشین به یک سری مسائل خاص توجه می کند. ولی دادن چند وظیفه به سیستم باعث گسترش افق دید سیستم میشود و توانایی های آن سیستم را در تشخیص و طبقه بندی افزایش می دهد.”
تمامی این تحقیقات به عمق درک ما از پروسه یادگیری عمیق می افزاید. و به فهم چگونگی عمل کردن مغز انسان کمک میکند.
اگه این محققین بتونن ویژ گی های ثانویه عصبی انسان رو در روبات ها یا ماشین ها شبیه سازی کنن میتونه علاوه بر این تصاویر بسیاری از ویژگی های عاطفی انسانگونه ای هم در هوش مصنوعی این ربات ها فعال شه یه چبزایی مثل بخش عاطفی مغز ما انسان ها.
البته ایلان ماسک در باره ی ایجاد قسمت عاطفی در هوش مصنوعی ربات ها هشدار داده که این کار در دهه های بعداین نظریه رو ممکن میکنه که ما انسان ها توسط این ربات ها به بند کشیده شیم و در خدمت این ربات ها به مانند بردگان به حیات خود ادامه بدیم یعنی پس از انقلاب روباتیک که ماروز به روز به اون نزدیک تر میشیم.