كشف تحقيق العديد من أنظمة التعرف على الوجه تستخدم ملايين ​الصور​ التي تم تحميلها من قبل الأشخاص العاديين على ​الإنترنت​، وفي أكثر الأحيان يتم الحصول الصور دون موافقة المستخدمين.

فى إحدى الحالات المقلقة، جمعت "IBM" ما يقرب من مليون صورة من مستخدمي "Flickr" لإنشاء قاعدة بيانات التعرف على الوجه، ولا تثير هذه الممارسات مخاوف تتعلق بالخصوصية فحسب، بل تثير أيضًا مخاوف من إمكانية استخدام الأنظمة ذات يوم لاستهداف الأقليات بشكل غير متناسب.

تم إصدار قاعدة بيانات "IBM"، والتي تسمى "التنوع في الوجوه"، في كانون الثاني كجزء من جهود الشركة الرامية إلى تطوير النزاهة والدقة في تقنية التعرف على الوجه".

وتستند مجموعة البيانات، " التنوع في الجوه" إلى 100 مليون صورة تم نشرها باستخدام تراخيص، مما يتيح لأي شخص إعادة استخدام الصور دون دفع رسوم ترخيص.