چہرے پہچاننے والے الگورتھم دو طریقے سے کام کرتے ہیں۔ ایک طریقے میں یہ چہرے کا 3D ماڈل بناتے ہیں۔ یہ کئی کیمروں سے آنے والی 2D تصاویر کو ملا کر بنانے کا طریقہ ہو سکتا ہے یا پھر چہرے کو انفراریڈ کیمرے کی مدد سے سکین کرنے کا ہو سکتا ہے۔
آئی فون میں ایپل ایسا ہی طریقے استعمال کرتا ہے۔ چہرے کے مختلف تاثرات اور عمر کے فرق کے مسائل کو حل کرنے کے لئے چہرے کے ان فیچرز پر توجہ دی جاتی ہے جو کہ تبدیل نہ ہوتے ہوں جیسا کہ ہڈی، آنکھ کی ساکٹ کی ساخت یا ناک کی شکل۔
ایپل کا دعوٰی ہے کہ ان کی فیس آئی ڈی میں اس بات کا امکان دس لاکھ میں سے ایک ہے کہ آپ کے چہرے کی آئی ڈی کی مدد سے لاک کئے جانے والے فون کو کوئی اور کھول لے۔ لیکن یہ الگورتھم غلطی کرتا ہے۔ جڑواں، ہم شکل بھائی بہن یا والدین کے فون پر بچوں سے دھوکہ کھا سکتا ہے۔ (فیس آئی ڈی کے لانچ کے کچھ ہی بعد ایک ویڈیو آئی جس میں ایک لڑکا اپنی والدہ کا فون اپنے چہرے سے کھول لیتا تھا)۔ خاص پرنٹ کئے گئے تھری ڈی ماسک سے بھی اسے دھوکا دیا جا سکتا ہے۔ اپنے مقصد، یعنی فون کو ان لاک کرنے کے لئے، یہ الگورتھم بہت اچھا ہے لیکن آپ اسے اپنے بینک اکاؤنٹ تک رسائی دینے کے لئے استعمال نہیں کریں گے۔
۔۔۔۔۔۔۔۔۔
تھری ڈی الگورتھم کو پاسپورٹ کی تصویر یا CCTV سے چہرے پہچاننے کے لئے استعمال نہیں کیا جا سکتا۔ اس کے لئے ایک اور طرح کا الگورتھم درکار ہے جو کہ 2D تصویر پر شماریاتی اپروچ طریقہ کرتا ہے۔ یہ چہرے پر بننے والی روشنی کے پیٹرنز کا شماریاتی تجزیہ کرتے ہیں۔ اور عام طور پر یہ کام نیورل نیٹورک سے کیا جاتا ہے۔ یہ اچھا کام کرتے ہیں لیکن اس کی قیمت ان کی غیرشفافیت کی صورت میں چکانا پڑتی ہے کہ ہمیں ٹھیک معلوم نہیں ہو پاتا کہ اس نے فیصلہ کس بنیاد پر لیا ہے۔
اور اس کا مطلب یہ ہے کہ غیرمانوس تصاویر پر انہیں دھوکہ دینا آسان ہے۔ مثلاً، ایسی عینک پہن لیں جس پر عجیب ڈیزائن بنا ہو۔
چہرے پہچاننے کے کام میں گوگل کے فیس نیٹ کا مقابلہ انسانوں سے کروایا گیا۔ مشہور شخصیات کی پانچ ہزار تصاویر میں سے لوگ پہچاننے کے کام میں انسانوں نے اچھی کارکردگی دکھائی جو کہ 97.5 فیصد درست تھی۔ فیس نیٹ نے اس سے بھی بہت بہتر۔ یہ 99.6 فیصد درست تھی۔
بظاہر ایسا لگتا ہے کہ یہ اتنا زبردست ہے کہ اس سے بآسانی مجرم پہچاننے کا کام لیا جا سکتا ہے لیکن ایک مسئلہ یہ ہے کہ پانچ ہزار چہرے کم ڈیٹا ہے۔
برطانیہ کے پولیس ریکارڈ میں دو کروڑ چہرے ہیں جبکہ چین کی شناختی کارڈ کی ڈیٹابیس میں ایک ارب سے زیادہ۔
چین میں چہرے پہچاننے والی ٹیکنالوجی میں بھاری سرمایہ کاری کی جا رہی ہے۔ سڑکوں، سب وے، ائرپورٹ پر کیمروں کی تنصیب جاری ہے تاکہ مطلوب لوگوں یا ٹریفک قوانین توڑنے والون کو شناخت کیا جا سکے۔ ایک تجویز یہ بھی ہے کہ معمولی حرکات جیسا کہ لفافہ سڑک پر پھینک دینے جیسے کاموں کو بھی لوگوں کے ریکارڈ کا حصہ بنایا جائے۔
اور یہاں پر مسئلہ ہے۔ ڈھیر میں چہرے جتنے زیادہ ہو جائیں، غلط شناخت کا امکان اتنا ہی بڑھ جاتا ہے۔ جب گوگل کے فیس نیٹ کو میگافیس چیلنج کے مقابلے میں دس لاکھ چہرے دئے گئے تو اس کی ایکوریسی 75 فیصد تک گر گئی۔ (زیادہ تر الگورتھمز کے نتائج اس سے خراب تھے)۔ بہترین چین کے الگورتھم ٹین سینٹ یوٹو لیب کے تھے جو کہ 83.29 فیصد تھے۔
اصل دنیا کے ڈیٹا کے ساتھ روشنی، پوز، کوالٹی وغیرہ جیسے اصل مسائل ہیں، جو اس مسئلے کو زیادہ مشکل کر دیتے ہیں۔ اس شعبے میں ترقی تیز ہے اور ایکوریسی بہتر ہو رہی ہے۔ آئندہ ماہ و سال میں یہ بہتر ہو گی، جو چہرے پہچاننے کی ٹیکنالوجی کے عملی استعمال اور اس بارے میں نئے سوالات لے کر آئے گی۔
(جاری ہے)
Post Top Ad
Your Ad Spot
اتوار، 20 اگست، 2023
ذہانت (48) ۔ لاکھوں میں ایک
Tags
Computer Science#
Share This
About Wahara Umbakar
Computer Science
لیبلز:
Computer Science
سبسکرائب کریں در:
تبصرے شائع کریں (Atom)
تقویت یافتہ بذریعہ Blogger.
رابطہ فارم
Post Top Ad
Your Ad Spot
میرے بارے میں
علم کی تحریریں۔ مجھے امید ہے کہ میری یہ کاوش آپ سب کو پسند آئے گی اگر آپ نے میری اس کاوش سے کچھ سیکھا ہو یا آپ کے لئے یہ معلومات نئی ہوں تو اپنی رائے کا اظہار ضرور کیجیئے گا۔ شکریہ
۔
وہارا امباکر
کوئی تبصرے نہیں:
ایک تبصرہ شائع کریں