ما هي بحيرة البيانات

ما هي بحيرة البيانات تم تقديم مصطلح “بحيرة البيانات” بواسطة جيمس ديكسون، رئيس قسم التكنولوجيا في Pentaho Business Intelligence Software. إن وصف هذا النوع من المستودعات على أنه بحيرة أمر منطقي لأنه يخزن مجموعة من البيانات في حالتها الطبيعية، على سبيل المثال. ب- مسطح مائي لم يتم تصفيته أو تجديده. تتدفق المعلومات من مصادر متعددة إلى البحيرة ويتم تخزينها بتنسيقها الأصلي.

ما هي بحيرة البيانات

ما هي بحيرة البيانات
ما هي بحيرة البيانات

بحيرة البيانات هي نوع من مستودعات البيانات التي تخزن مجموعات كبيرة ومتنوعة من البيانات الأولية بتنسيقها الأصلي. كما أنه يتيح الحفاظ على عرض غير متكرر للبيانات. في الواقع، أصبحت استراتيجية إدارة البيانات شائعة بشكل متزايد لدى الشركات التي تريد مستودعًا كبيرًا وشاملًا لبياناتها

  • بينما البيانات الأولية هي تلك التي لم تتم معالجتها بعد لأي غرض محدد. لا يتم تعريف أولئك الموجودين في بحيرة البيانات حتى يتم الاستعلام عنها.
  • يمكن للعلماء أيضًا الوصول إلى البيانات الأولية عند الحاجة باستخدام أدوات تحليل أكثر تقدمًا أو نمذجة تنبؤية.
  • أثناء استخدام بحيرة البيانات، يتم الاحتفاظ بجميع البيانات ؛ لا يتم إزالة أي من هذا أو تصفيته قبل التخزين. يمكن استخدامها للتحليل قريبًا أو في المستقبل أو على الإطلاق.
  • يمكن أيضًا استخدام البيانات عدة مرات لأغراض مختلفة، بدلاً من تها لغرض معين. هذا يجعل من الصعب إعادة استخدام البيانات بأي شرح طريقة أخرى.
  • يتم تحويل البيانات الموجودة في البحيرة فقط عند الحاجة إليها للتحليل، ثم يتم تطبيق المخطط بحيث يمكن إجراء التحليل. يُعرف هذا باسم “المخطط عند القراءة” لأنه يتم الاحتفاظ بالبيانات الأولية حتى تصبح جاهزة للاستخدام.
  • تتيح Graphic Lakes أيضًا للمستخدمين الوصول إليها واستكشافها بطريقتهم الخاصة دون الحاجة إلى نقلهم إلى نظام آخر.
  • عادةً ما يتم إجراء الرؤى والتقارير من بحيرة البيانات على أساس مخصص بدلاً من سحب تقرير تحليلي بانتظام من نظام أساسي آخر أو نوع من مستودع البيانات. ومع ذلك، يمكن للمستخدمين تطبيق المخطط والأتمتة للسماح بتكرار التقارير حسب الحاجة.
  • في المقابل، لا بد من الحوكمة والصيانة المستمرة لجعل البيانات قابلة للاستخدام ويمكن الوصول إليها.
  • بدون هذه الصيانة، فإنك تخاطر بجعل بياناتك غير مهمة، ولا يمكن الوصول إليها، وغير عملية، ومكلفة، وغير مجدية.
  • تُعرف البحيرات التي يتعذر على مستخدميها الوصول إليها باسم “مستنقعات البيانات”.

اقرأ أيضًا تسجيل حساب على منصة مسار الإلكترونية وتحديث البيانات على المنصة

بحيرة البيانات مقابل مستودع البيانات

بحيرة البيانات مقابل مستودع البيانات
بحيرة البيانات مقابل مستودع البيانات

على الرغم من الخلط بين بحيرة البيانات ومخزن البيانات، إلا أنهما ليسا متشابهين ويخدمان أغراضًا مختلفة. في الواقع، تعد البحيرة ومخزن البيانات مستودعات لتخزين البيانات الضخمة، ولكن هنا تنتهي أوجه التشابه. فيما يلي نقدم بعض الاختلافات بينهما على النحو التالي

  • تستخدم العديد من الشركات بحيرة بيانات ومستودعًا لتلبية احتياجاتهم وأهدافهم المحددة.
  • يقدم مستودع البيانات نموذجًا منظمًا ومصممًا لإعداد التقارير. هذا هو الفرق الرئيسي بين Lake و Data Warehouse.
  • تخزن البحيرات البيانات الخام وغير المهيكلة دون أي غرض. قبل أن يتم وضع البيانات في مستودع بيانات، يجب معالجتها.
  • يتم اتخاذ القرارات بشأن البيانات التي يجب تضمينها أو عدم تضمينها في المستودع، والمعروف باسم “المخطط عند الكتابة”.
  • قد يستغرق حذف البيانات قبل تخزينها في المستودع وقتًا طويلاً وصعبًا. قد يستغرق الأمر أحيانًا شهورًا أو حتى سنوات، مما يمنعك أيضًا من جمع البيانات على الفور.
  • باستخدام هذا، يمكنك البدء في جمع البيانات على الفور ومعرفة ما يجب فعله بها في المستقبل.
  • بسبب هيكلها، غالبًا ما يتم استخدام مستودعات البيانات من قبل محللي الأعمال ومستخدمي الأعمال الآخرين الذين يعرفون بالفعل البيانات التي يحتاجونها لإعداد التقارير المنتظمة.
  • غالبًا ما يستخدمها علماء ومحللو البيانات لأنهم يبحثون باستخدام البيانات. تحتاج البيانات إلى عوامل تصفية وتحليلات متقدمة قبل أن تكون مفيدة.
  • عادةً ما تستخدم بحيرات البيانات ومخازن البيانات أجهزة مختلفة للتخزين.
  • يمكن أن تكون مستودعات البيانات باهظة الثمن أيضًا، بينما يمكن أن تظل بحيرة البيانات غير مكلفة على الرغم من حجمها ؛ لأنهم غالبًا ما يستخدمون أجهزة جاهزة.

تقنية بحيرة الجرافيك

تقنية بحيرة الجرافيك
تقنية بحيرة الجرافيك

تحتوي بحيرة البيانات على هيكل مسطح لأنه يمكن أن يكون غير منظم أو شبه منظم أو منظم. يتم جمعها من مصادر مختلفة عبر المؤسسة مقارنة بالمستودعات التي تخزن البيانات في ملفات أو مجلدات. نظرًا لهيكلها، فهي توفر قابلية توسعة واسعة تصل إلى مقياس x-byte. هذا مهم لأنه عند إنشائه، لا تعرف مسبقًا مقدار البيانات المراد تخزينها. لا يمكن لأنظمة تخزين البيانات التقليدية التوسع بهذه الشرح طريقة. كما أنه يفيد العلماء القادرين على استخراج البيانات واستكشافها من جميع أنحاء المؤسسة ومشاركتها وال التبادلية، بما في ذلك غير المتجانسة من مختلف المجالات، لطرح الأسئلة واكتشاف رؤى جديدة. يمكنك أيضًا استخدام تحليلات البيانات الضخمة والتعلم الآلي للتحليل. على الرغم من أن البيانات لا تحتوي على مخطط ثابت قبل تخزينها، إلا أن إدارة البيانات لا تزال مهمة لتجنب تعكير البيانات. يجب أن تكون البيانات وصفية عند وضعها في البحيرة حتى تتمكن من الوصول إليها لاحقًا.

اقرأ أيضًا ما هي خطة التعافي من الكوارث

أخيرًا، نقدم تعريفًا لبحيرات البيانات التي تمكن العلماء من استخدام بحيرة البيانات للوصول إلى البيانات ومعالجتها وتحليلها بشكل أسرع وأكثر دقة. بالإضافة إلى ذلك، فإنه يوفر لمحترفي التحليلات كمية هائلة من البيانات، والتي تتوفر بتنسيقات مختلفة غير تقليدية. سيوفر ذلك القدرة على الوصول إليه من مجموعة متنوعة من حالات الاستخدام مثل تحليل المشاعر أو اكتشاف الاحتيال.

  1. ^ redhat.com، ما هي بحيرة البيانات، 8 يوليو 2024
Scroll to Top