التنقيب في البيانات الضخمة

التنقيب في البيانات الضخمة من الأمور الهامة , فعندما نتحدث عن البيانات الضخمة ، فإننا نتحدث عن كميات لا يمكن تصورها من البيانات تأتي من عدة أنواع ومصادر بمئات تيرابايت أو حتى بيتابايت (البيتابايت هو رقم واحد متبوعًا بـ 15 صفرًا). وتتحدث آي بي إم عن 2.5 كوينتيليون بايت من البيانات كل يوم (كوينتيليون هو رقم واحد يليه 18 صفراً). معلومات في كل مكان وفي مواضيع مختلفة. هنا ، يتساءل المرء عن مدى أهمية هذه البيانات بالنظر إلى أن المعلومات المنظمة من هذه البيانات لا تشكل سوى جزء صغير يصل إلى 10 ٪ مقارنة بالمعلومات غير المنظمة ، والتي تشكل الباقي. وقد أدى ذلك إلى زيادة الحاجة إلى تطوير أدوات قوية لتحليل البيانات واستخراج المعلومات والمعرفة منها. لا يمكن للطرق التقليدية والإحصائية التعامل مع هذا الكم الهائل ، لذلك يتم استخدام الأدوات الذكية لمعالجة هذه البيانات.

ماذا تعني البيانات الضخمة

انتشر مصطلح “البيانات الضخمة” في السنوات الأخيرة وقبل أن نصل إلى تعريف البيانات الضخمة ، نحتاج أولاً إلى معرفة ماهية البيانات وكيف تختلف عن المعلومات. المعلومات هي نتيجة أي عملية معالجة بيانات خام.

  • في عام 2011 ، عرّف معهد ماكينزي العالمي البيانات الضخمة على أنها أي مجموعة من البيانات أكبر من قدرة أدوات قواعد البيانات التقليدية على التقاط تلك البيانات وتخزينها وإدارتها وتحليلها. في الآونة الأخيرة ، أثرت البيانات الضخمة أو البيانات الضخمة على جميع المجالات.
  • تعد البيانات الضخمة جزءًا حيويًا من أي عملية تنقيب عن البيانات.
  • تُستخدم هذه المعلومات على نطاق واسع في الأعمال والاقتصاد ، ولفهم العمليات التجارية ، على سبيل المثال ، يتم استخدامها لمعرفة سلوك الأسهم في سوق الأوراق المالية ومحاولة العثور على الأسهم الرابحة من خلال تحليل كمية كبيرة من البيانات. على سلوك هذه الأسهم في الماضي والحاضر.

ما هي أنواع البيانات الضخمة؟

تنقسم إلى ثلاثة أنواع:

  1. البيانات الخام أو البيانات دون أي تحليل
  2. للمعلومات أو المعلومات ، أي البيانات التي تم تحليلها للحصول معلومات ىبسيطة
  3. معرفة، أي البيانات التي تم تحليلها بطريقة أكثر تعقيدًا .

Wal-Martاستخدام شركة الشهيرة في استكشاف وول مارت في الولايات المتحدة ، تزيد واردات المتاجر الكبرى من مبيعاتها في السوق دون أي تكلفة إضافية. اقترح أحد موظفي الشركة محاولة فهم سلوك العملاء ومحاولة ربط المنتجات التي تم تتبعها مع بعضها البعض.

في الواقع ، من خلال مراقبة سلوك ملايين العملاء ، تمكنوا من ربط المنتجات ببعضها البعض من خلال مراقبة سلوك المشترين وزيادة أرباحهم بشكل كبير بفضل العروض على هذه المنتجات معًا. تسمى هذه الطريقة الآن تحليل سلة السوق.

استخدامات البيانات الضخمة

فيما يلي الاستخدامات الأكثر شيوعًا للبيانات الضخمة:

1. فهم العملاء وجذبهم

، وهو أحد أهم استخدامات البيانات الضخمة اليوم. أصبح المثال الآن قادرًا على التنبؤ بالمنتجات التي تريدها ، وحتى الحكومات قادرة على التنبؤ بنتائج الانتخابات باستخدام البيانات الضخمة

2. فهم العملية التجارية

يتم استخدام البيانات الضخمة بشكل كبير من أجل  تحسين العمليات التجارية. تستطيع متاجر البيع بالتجزئة توقع احتياجات العملاء بناءً على المعلومات من مواقع التواصل الاجتماعي والأشياء المطلوبة. محركات البحث وكذلك الطقس المتوقع ومثال على ذلك وول مارت الذي سبق ذكره

استخدام آخر للبيانات الضخمة في شركات النقل لتحسين عملية المرور باستخدام بيانات حركة المرور الحية

3. في الاستخدامات الشخصية

لا تقتصر فوائد البيانات الضخمة على الشركات والحكومات ولكن يمكن استخدامها أيضًا بشكل شخصي ، على سبيل المثال الساعات الذكية التي تجمع المعلومات في جميع أنحاء اليوم على السعرات الحرارية وأنماط الحركة والنوم

إن تحليل كل هذه الكمية من البيانات سيجعل من الممكن بالطبع التفكير في الاستخدامات الفردية

4. تحسين الأداء الرياضي

معظم النخب الرياضية اليوم تستفيد من البيانات الضخمة بطريقة أو بأخرى ، IBM SlamTracker لبطولات التنس ، كما نستخدم تحليلات الفيديو للاعبي كرة القدم لمراقبة أدائهم. تتبع بعض الفرق الرياضية الكبيرة اللاعبين خارج النادي لمعرفة عاداتهم في النوم والأكل.

 

 

Scroll to Top