تُعرّف وزارة الأمن الداخلي الأمريكية المعلومات الشخصية القابلة للتحديد (PII) بأنها المعلومات التي تُتيح تحديد هوية فردٍ ما بشكلٍ فريد، مثل موظف أو مريض أو عميل أو متبرع. إضافةً إلى المعلومات الشخصية القابلة للتحديد، تُعرّف "المعلومات الشخصية الحساسة" بأنها البيانات التي قد يُؤدي اختراقها إلى زيادة المخاطر على الفرد، وقد تشمل هذه البيانات رقمًا حكوميًا مُحددًا (مثل رقم الضمان الاجتماعي الأمريكي)، ومعلومات مالية، وجنس، وميول جنسية، وما إلى ذلك.
توجد الآن مئات القوانين واللوائح التي تُغطي جمع واستخدام ومشاركة وحذف وضوابط أمن المعلومات الشخصية الحساسة، ويتم سنّ قوانين جديدة شهريًا (على سبيل المثال، دخلت قوانين المملكة العربية السعودية الجديدة حيز التنفيذ في مارس 2022). أصبح المستهلكون أكثر وعيًا من أي وقت مضى بقيمة بياناتهم، والمخاطر المترتبة على إساءة استخدامها أو فقدانها، كما تُجري الجهات التنظيمية تحقيقات مع الشركات التي بنت أعمالها على جمع البيانات، لذا يتعين على المؤسسات التأكد من استخدامها للبيانات بشكل قانوني ضمن هذه اللوائح المعقدة.
سواءً كان ذلك لحماية البيانات، أو الحوكمة، أو الامتثال التنظيمي، فإن كل شيء يبدأ بمعرفة نوع البيانات المصنفة كبيانات حساسة، ومكان وجودها، ومستوى أمانها، والقوانين القضائية التي تنطبق عليها. وهنا تبرز الحاجة إلى أداة فعّالة لاكتشاف بيانات التعريف الشخصية الحساسة.
أهمية اكتشاف بيانات التعريف الشخصية في بيئة ديناميكية
تشير بيانات Arm Treasure إلى أن 47% من المسوقين يقرّون بأن البيانات مُجزأة، وبالتالي يصعب الوصول إليها. على سبيل المثال، في حملة تسويقية، يستخدم فريق المبيعات بيانات العملاء المحتملين لتحويلهم إلى عملاء فعليين، بينما يستخدم الفريق المالي البيانات نفسها لمعالجة المدفوعات، سواءً كانت لمرة واحدة أو دورية. بعد ذلك، يستخدم فريق تسويق المنتج البيانات نفسها لإرسال رسائل بريد إلكتروني لتذكير العملاء بأهمية الاحتفاظ بهم.
في المثال السابق، تعالج كل إدارة البيانات بطريقة مختلفة، مما قد يتطلب الوصول إلى معلومات شخصية حساسة مختلفة. يحتاج فريق المالية إلى بيانات بطاقات الائتمان لمعالجة المدفوعات، بينما يستخدم فريق التسويق عبر البريد الإلكتروني أسماء العملاء وعناوين بريدهم الإلكتروني لإرسال الرسائل إليهم. بالإضافة إلى بلد العميل (لتحديد السعر المناسب) ولغته لضمان قراءة الرسائل، يحتاج فريق المبيعات إلى معرفة عنوان العميل بالكامل، ويحتاج فريق خدمة العملاء إلى تفاصيل كاملة عن إصدار المنتج. مع ذلك، لا يحتاج أي من هذه الفرق إلى معرفة كل شيء. لهذا السبب (ولأسباب أخرى)، قد تتكرر البيانات نفسها في جميع أنحاء المؤسسة في قواعد بيانات معزولة مختلفة، مما يجعل التحكم والتحديثات، وبالتالي دقة البيانات، مهمة بالغة الصعوبة.
وبغض النظر عن صوامع البيانات، فإن ظهور بيئات الحوسبة السحابية فائقة التوسع مثل Snowflake أدى ذلك إلى تعاون سلس في بيئة الحوسبة السحابية. يتمتع معظم موظفي المؤسسات بحرية الوصول إلى السحابة، وإجراء استعلامات ضخمة بحجم بيتابايت من مواقع مختلفة، وبالتالي إنتاج كميات هائلة من البيانات. ولتوضيح ذلك، تشير التوقعات إلى أن بيئة الحوسبة السحابية ستحتوي على أكثر من 100 زيتابايت من البيانات بحلول عام 2025.
ثم تتوزع هذه البيانات السحابية عبر العديد من بحيرات البيانات وقواعد البيانات والتطبيقات، وحتى أجهزة الكمبيوتر الشخصية. ويؤدي هذا إلى نقص في الشفافية بشأن الوضع الأمني للبيانات أو مدى امتثالها للمعايير، مما يعرضها لخطر جسيم يتمثل في الاختراقات الأمنية أو عدم الامتثال.
تتطلب إدارة البيانات وأمنها والامتثال لها رؤية شاملة ودقيقة للمعلومات الشخصية الحساسة. توفر أداة اكتشاف البيانات الحساسة ذلك تمامًا، مما يساعد مسؤولي أمن المعلومات ومسؤولي حماية البيانات على الحصول على رؤية كاملة للبيانات، وحالة أمنها وامتثالها.
أفضل الممارسات لاكتشاف بيانات المعلومات الشخصية الحساسة
ينبغي أن تأخذ عملية اكتشاف البيانات في المؤسسة بعين الاعتبار أفضل الممارسات التالية لاكتشاف البيانات لتحديد وتصنيف وتحليل المعلومات الشخصية الحساسة.
- اكتشاف الأصول الخفية والأصول الأصلية : يبدأ اكتشاف البيانات بتحديد مكان وجودها. قد توجد البيانات في الأصول الخفية أو الأصول الأصلية. تشمل الأصول الأصلية مستودعات البيانات، وبحيرات البيانات، وقواعد البيانات في بيئات محلية أو متعددة السحابات. أما الأصول الخفية، فهي أنظمة غير مسجلة أُضيفت إلى السحابة ولكن لم تُوثّق في قاعدة بيانات إدارة التكوين (CMDB).
- بيانات تعريف أصول فهرس البيانات : تتمثل الخطوة التالية في اكتشاف بيانات التعريف وفهرستها عبر الأصول الظلية والأصلية. ويمكن تصنيف بيانات التعريف إلى بيانات تعريف تجارية وتقنية وأمنية، مثل معلومات المورد، ومعلومات المنفذ، والإصدار، وحالة التشفير ، وما إلى ذلك.
- تصنيف البيانات غير المهيكلة والبيانات المهيكلة : الكشف عن البيانات الحساسة غير المهيكلة والبيانات المهيكلة الموجودة في أنواع مستندات متفرقة وعبر جداول وصفوف مختلفة في مخزن البيانات، على التوالي. يتيح التصنيف المناسب لاحقًا للفرق ربط البيانات بمالكيها بشكل فعال وتقييم وضعها الأمني والخصوصي.
- استخدام التصنيف القائم على السياسات : يصنف التصنيف القائم على السياسات البيانات إلى فئات أو أغراض أو ملفات تعريف محتوى مختلفة، مثل الأعمال التجارية والمالية والأكاديمية وما إلى ذلك.
- تعريف التصنيف القائم على الأمان : في التصنيف القائم على الأمان، يتم تطبيق تصنيف الحساسية على البيانات، مثل رسائل البريد الإلكتروني والمستندات وما إلى ذلك. ثم تتم حماية البيانات وفقًا لمستوى حساسية البيانات المصنفة إلى سرية، وعامة، وعامة، وسرية للغاية.
- تطبيق التصنيف القائم على الخصوصية : في هذا النوع من التصنيف، تُصنّف البيانات بناءً على مخاطر الخصوصية التي تنطوي عليها. تُتيح هذه البيانات فهمًا أعمق لمخاوف الخصوصية المتعلقة بأي بيانات، مثل ما إذا كانت تتطلب الامتثال للمادة 30 من اللائحة العامة لحماية البيانات (GDPR ). هل هي ضرورية لتلبية أي طلب من أصحاب البيانات؟
سمات حل فعال لاكتشاف بيانات التعريف الشخصية
في بيئة بحجم بيتابايت، يستحيل على البشر البحث في ملايين البايتات من البيانات المتباينة، وتصنيفها، وتحليلها. لذا، ثمة حاجة ماسة إلى أداة ذكية لاكتشاف البيانات قادرة على استيعاب بيتابايتات من البيانات الخام، وتصنيفها، وتحسينها، ومساعدة فرق الأمن والخصوصية على ضمان أمن وحوكمة وامتثال أفضل.
ينبغي أن تتمتع أداة اكتشاف بيانات التعريف الشخصية الفعالة بالخصائص المهمة التالية التي يمكن أن تساعد المؤسسات على اكتساب رؤية وتحكم أفضل.
- ينبغي أن يكون مدعوماً بالذكاء الاصطناعي لتحقيق سرعة وكفاءة أفضل.
- ينبغي أن يحتوي على موصلات أصلية لتحقيق التكامل السلس مع مختلف أصول البيانات.
- ينبغي أن يتضمن أيضًا تكاملًا أصليًا مع قاعدة بيانات إدارة التكوين (CMDB) وقدرة على المسح الضوئي المنتظم لمساعدة مسؤولي النظام في الحفاظ على كتالوج محدث لأصول البيانات.
- ينبغي أن يحتوي على محرك كشف شامل، يتضمن عناصر بيانات مدمجة ومخصصة لاكتشاف البيانات بشكل فعال.
- ينبغي أن تستخدم الذكاء الاصطناعي والتعلم الآلي واللغة الطبيعية للتحليل السياقي لاكتشاف البيانات في الأنظمة المهيكلة وغير المهيكلة بدقة.
- ينبغي أن يسمح ذلك بمسح البيانات المتعددة لاكتشاف البيانات بشكل أسرع.
- ينبغي أن يدعم البرنامج العديد من التنسيقات لاكتشاف كل بايت من البيانات ووضع علامات عليها بشكل فعال.
- ينبغي أن تستخدم قوالب محددة مسبقاً لتصنيف البيانات، تستند إلى السياسات والأمان والخصوصية.
كيف Securiti أداة اكتشاف البيانات الحساسة الروبوتية المدعومة بالذكاء الاصطناعي من شركة [اسم الشركة] يمكن أن تساعد
مع وجود مؤسسات تعتمد على البيانات وتعمل في بيئات فائقة التوسع، يمكن أن يمنحها حل اكتشاف البيانات الحساسة العميقة المدعوم بالذكاء الاصطناعي ميزة تنافسية. Securiti يقدم حلاً لاكتشاف البيانات الحساسة مدعومًا بالذكاء الاصطناعي، والذي يمكن أن يساعد المؤسسات على أتمتة اكتشاف وتصنيف أصول البيانات والمعلومات الحساسة عبر الشبكات المحلية والأصلية وغير الأصلية والسحابية المتعددة.
ألقِ نظرة على أبرز ميزات أداة اكتشاف البيانات الحساسة لدينا:
- أكثر من 200 موصل أصلي يتكامل بسلاسة مع العديد من أصول البيانات.
- عناصر بيانات مدمجة ومخصصة لاكتشاف البيانات الحساسة بعمق.
- تقنيات الذكاء الاصطناعي/التعلم الآلي التي يمكنها اكتشاف البيانات الحساسة بشكل فعال في الجداول أو الأعمدة أو فئات المستندات.
- يدعم تنسيقات البيانات الضخمة، مثل AVRO.
- يدعم عمليات مسح متعددة لاكتشاف البيانات من أجل مسح أسرع على مستوى دقيق.
- قوالب مُعدة مسبقاً لوضع العلامات بناءً على السياسات.
- تكامل مدمج مع برنامج Microsoft Information Protection (MIP) لاكتشاف وتصنيف العلامات الأمنية.
شاهد عرضًا توضيحيًا لتتعلم كيف Securiti يمكن لأداة اكتشاف البيانات الخاصة بـ 's مساعدتك في اكتشاف البيانات المتباينة واستخلاص رؤى ذات مغزى.