كشف تحقيق أجرته شبكة "NBC" أن العديد من أنظمة التعرف على الوجه تستخدم ملايين الصور التي تم تحميلها من قبل الأشخاص العاديين على ​الإنترنت​، وفي أكثر الأحيان يتم الحصول الصور دون موافقة المستخدمين.

وفي إحدى الحالات المقلقة، جمعت "IBM" حوالي مليون صورة من مستخدمي "Flickr" لإنشاء قاعدة بيانات التعرف على الوجه، ولا تثير هذه الممارسات مخاوف تتعلق بالخصوصية فحسب، بل تثير أيضًا مخاوف من إمكانية استخدام الأنظمة ذات يوم لاستهداف الأقليات بشكل غير متناسب.

وتم إصدار قاعدة بيانات "IBM"، والتي تسمى "التنوع في الوجوه" (Diversity in Faces)، في كانون الثاني كجزء من جهود الشركة الرامية إلى تطوير النزاهة والدقة في تقنية التعرف على الوجه.

وتستند مجموعة البيانات "Diversity in Faces" إلى 100 مليون صورة تم نشرها باستخدام تراخيص، ما يتيح لأي شخص إعادة استخدام الصور دون دفع رسوم ترخيص. ومع ذلك، لا يمكن إلا للمجموعات البحثية الأكاديمية أو الشركات طلب الوصول إلى قاعدة بيانات التنوع في الوجوه، وفقًا لـ"NBC News".