يكثر الحديث عن «البيانات الضخمة» (أو ما يعرف بالإنجليزية Big Data) وتأثيرها على العالم، وأصبحت محاولات الاستفادة من تحليلات البيانات الضخمة عاملاً مشتركاً بين الشركات الكبيرة والناشئة وحتى الجامعات والمراكز البحثية. كما فتحت فرصاً عديدة أمام روَّاد الأعمال لإنشاء مشروعات تساعد الحكومات والمؤسسات التي تختزن محتويات رقمية هائلة في تنظيم بياناتها وتحليلها.
لا يوجد تعريف واحد متفق عليه لمصطلح «البيانات الضخمة»، ولكن من أبسط تعريفاتها أنها بيانات تولدت من خلال استخدامنا المضطرد للأجهزة الرقمية، والحاسبات، وكل ما هو متصل بشبكة الإنترنت. ففي أي لحظة معيَّنة، هناك عشرات الملايين من الأفراد في أنحاء العالم يستخدمون الهواتف المحمولة – التي يقدَّر عددها بأكثر من ثمانية مليارات هاتف – لإجراء مكالمات، أو لإرسال رسائل نصية أو بريد إلكتروني، أو مشاهدة محتوى رقمي على الشبكة. ويمكن أن تستحدث البيانات أيضاً عند إجراء عمليات اعتيادية في ظاهرها، ولكنها تستخدم التقنية لتسهيل سيرها، كعمليات تحويل الأموال، أو شراء قطعة ملابس، أو عند استخدام اللاقط لمشاهدة القنوات الفضائية، أو عبور جسر ما، أو حتى عند زيارة أحد المطاعم وطلب نوع معيَّن من الأطباق. كل هذه النشاطات تترك أثراً رقمياً، ومن ثم تشكِّل هذه المعلومات في مجموعها ما يُعرف بـ «البيانات الضخمة».
وبسبب تلك النشاطات وغيرها الكثير، ينتج العالم من حولنا حالياً أكثر من 1.7 ترليون بايت من البيانات في الدقيقة الواحدة، منها ما تقوم بعض مراكز البيانات بتخزينه وتحليله، ومنها ما يتم مسحه لعدم أهميته. وبحسب شركة «إنتل»، فإن حجم البيانات التي أنتجها العالم منذ بداية عصر الإنترنت وحتى عام 2003م يقدر بأكثر من 5 إكسابايت (الإكسابايت تعادل البليون جيجابايت)، وتضاعف هذا الرقم أكثر من 500 مرة خلال عام 2012م، ليصل إلى 2.7 زيتابايت (الزيتابايت يعادل الألف بليون جيجابايت)، ويتوقع أن يتضاعف هذا الرقم ثلاث مرات بنهاية عام 2015م.
وبسبب هذا الحجم الهائل من البيانات المستحدثة، بدأ مصطلح «البيانات الضخمة» بالانتشار، وزاد حجمها بحيث إنه من الصعب معالجتها الآن باستخدام برنامج واحد أو جهاز مستقل، أو باستخدام تطبيقات معالجة البيانات التقليدية. وهنا بدأت شركات التقنية بتطوير برامج مساعدة وعتاد جديد يمكن من خلاله المساعدة في تحليل تلك البيانات الضخمة.
تقوم شركة أمازون Amazon.com بتحليل ومعالجة ملايين العمليات يومياً لتلبية رغبات زبائنها، بالإضافة إلى الرد على استفسارات أكثر من نصف مليون بائع يومياً
وإن كنت تتساءل عمَّن يمتلك تلك المعلومات ويهتم بتحليلها، فإليك هذه الأمثلة: تقوم شركة «أمازون» بتحليل ومعالجة ملايين العمليات يومياً لتلبية رغبات زبائنها، بالإضافة إلى الرد على استفسارات أكثر من نصف مليون بائع يومياً، ولذلك تمتلك أمازون أكبر 3 قواعد بيانات في العالم. ومن ناحية أخرى، يعمل متجر «وول مارت» على معالجة أكثر من مليون عملية تجارية في الساعة، التي يتم تخزينها في قواعد بيانات تحتوي على أكثر من 2.5 بيتابايت (2500 تيرابايت) من البيانات – وهو ما يعادل 167 ضعف محتوى الكتب الموجودة في مكتبة الكونغرس في الولايات المتحدة. أما موقع «فايسبوك» فيعالج 50 مليار صورة مرفوعة من قبل مستخدميه. كما أن لدى برنامج المحادثات الفورية «واتس آب» أكثر من 450 مليون مستخدم، يتداولون أكثر من 10 مليارات رسالة و400 مليون صورة يومياً، وفي 31 ديسمبر 2013م، وصل عدد الرسائل عبر الواتس آب إلى 18 مليار رسالة في يوم واحد.
ووفقاً لأحدث الإحصاءات، فإن حجم البيانات التجارية في جميع أنحاء العالم، عبر جميع الشركات، يتضاعف كل 1.2 سنة.
خصائص البيانات الضخمة
بالإضافة إلى الحجم الهائل من البيانات التي يتم إنتاجها وتخزينها وإتاحتها تحت مظلة «البيانات الضخمة»، تتسم طرق معالجه تلك البيانات بخصائص أخرى تختلف عن البيانات التقليدية، أو التي تخزن مرتبة ومنسقة، كقواعد البيانات مثلاً. ويرى الخبراء أن من أهم خصائص تلك البيانات:
الحجم: يقدر الخبراء أنه بحلول العام 2020م ستحتوي الإنترنت على ما يقرب من 40,000 زيتابايت من البيانات الجاهزة للتحليل واستخلاص المعلومات.
السرعة: لمعالجة مجموعة صغيرة من البيانات المخزنة فى قواعد البيانات، أو ملف «أكسل»، كانت الشركات تقوم بتحليل كل مجموعة بيانات على حدة وبشكل متسلسل إلى أن يتم الانتهاء منها جميعاً. ولكن مع تضخم حجم البيانات، أصبحت الحاجة مُلِحَّة إلى إيجاد نظم خاصة تضمن سرعة تحليل البيانات الضخمة وقت وصولها «Real Time»، وأدت تلك الحاجة إلى ابتكار تقنيات خاصة لمعالجة تلك البيانات مثل برامج «Apache Hadoop».
تنوع الملفات: مع ازدياد أعداد مستخدمي الإنترنت والهواتف النقالة وشبكات التواصل الاجتماعي المختلفة، تغيرت طريقة تخزين البيانات من وجودها في قواعد بيانات تقليدية إلى بيانات مخزنة عشوائياً وبامتدادات متنوعة (مثل الصور ومقاطع الصوت والفيديو والرسائل القصيرة).
كيف استفاد العالَم من البيانات الضخمة؟
تقدِّم البيانات الضخمة ميزة تنافسية للشركات إذا تم تحليلها والاستفادة منها لفهم عملائها وطرق تفكيرهم ورغباتهم، ومن ثم اتخاذ القرارات بصورة أكثر فعالية.
واستوعبت الشركات العالمية والدول المتقدمة أهمية الاستفادة من تلك البيانات، حيث قامت بوضع خطط مستقبلية وبناء مراكز بيانات متخصصة (Data Centers) للاستفادة من تلك البيانات، مثل مشروع وكالة الأمن القومي (NSA) لتطوير قاعدة بيانات وطنية أطلق عليه مشروع (Utah Data Center)، وهو يهدف إلى تحليل بيانات مستخدمي شبكات الإنترنت والاتصالات في العالم لفهم سلوكياتهم ونشاطاتهم. ولكن بسبب زيادة حجم تلك البيانات في كل عام وبشكل مضطرد، يظل البحث عن أفضل السبل لتحليلها واستثمارها قيد الدراسة والبحث.
ولا يقتصر تأثير البيانات الضخمة على الشركات الضخمة أو الشركات التقنية، بل هناك عديد من القطاعات التقليدية والحكومات، وشركات خدمة المستهلكين وشركات التوريد والتصنيع التي تستفيد من مخرجات تحليل هذه البيانات. ومن ذلك:
يرى فريق من المختصين أن التطور التقني المبني على هذا المفهوم قد يشكِّل خطراً يهدِّد كثيراً من الوظائف مستقبلاً، وخاصة التي تعتمد على أذواق العاملين أو نظرتهم الفنية
تطوير الخدمات الحكومية: أصبح بإمكان المختصين بتطوير الخدمات الحكومية رصد مدى رضا المواطنين عن الخدمات الحكومية المقدَّمة لهم، وعلى ضوء النتائج المحللة يمكن استنتاج ما يلزم عمله للتطوير والتحسين، حيث بات مسح آراء الجمهور عن طريق الاستبيانات التقليدية مكلفاً وغير مجدٍ في كثير من الأحيان، وذلك نظراً لتنوع البيانات الديموغرافية وثقافات المتعاملين، وحتى المساحات الشاسعة المراد مسحها واستقصاؤها. ومن أكبر المصادر لتلك البيانات الضخمة هي البيانات المسجلة من خلال عمليات التعداد السكاني والتسجيل في قواعد البيانات الحكومية، حيث يمكن أن تستنتج الحكومات معلومات ثمينة جداً من خلال تحليل تلك البيانات المخزنة.
زيادة أرباح الشركات وتقديم خدمات أفضل للزبائن: أتاحت البيانات الضخمة لمؤسسات الأعمال زيادة أرباحها بشكل كبير وتعزيز وضعها التنافسي. فمعرفة رغبات الزبائن وميولهم ونفسياتهم يتيح للشركات الربحية توفير منتجات وخدمات بناءً على تلك الرغبات والميول، وبذلك، تضمن تلك الشركات رضا عملائها مما يؤدي إلى زيادة مبيعاتها من دون أن تخمن تلك الشركات وتجازف بما يرغب زبائنها من منتجات وخدمات.
ومن أبرز الأدلة على استخدام شركات التجزئة والخدمات لتلك البيانات الضخمة لزيادة أرباحها، هو توجيه الإعلانات الترويجية التي تلاحق متصفحي الإنترنت والمواقع الإلكترونية. فهناك تطبيقات ومواقع متخصصة بتحليل تلك البيانات، مثل خدمة قوقل «AdSense»، التي تحلل رغبات المستخدم من خلال المدخلات التي يقوم بإدخالها سابقاً في محركات البحث، فتقوم تلك المواقع برصد الكلمات وتخزينها في قواعد بيانات خاصة، ليتم تحليلها وتوجيه الدعايات التي تتناسب مع هذه الاهتمامات والرغبات، بصرف النظر عن الموقع الذي تتم زيارته.
ومن الأمثلة أيضاً استغلال شركات البيع بالتجزئة لتلك المعلومات بحيث إنها أصبحت قادرة على اكتشاف الأيام التي يتوافد المستهلكون فيها بغزارة إلى المحلات التجارية، وتحليل كيفية إنفاق الناس على البضائع، وذلك بهدف زيادة الربحية واتباع الطرق الأمثل للتسويق المستهدف (Targeted Marketing).
تطوير الطب والمجالات الصحية: تساعد البيانات الضخمة قطاع الصحة عبر تحليل البيانات المتعلقة بالوجهات المفضلة للسفر وسلوكيات الشراء والتسوق والنشاطات الرياضية، لتكون أحد المصادر المهمة التي تمكِّن الأطباء من معرفة أسباب وسلوكيات كثير من الأمراض التي تكون قد انتشرت بسبب زيارة المصابين لتلك البلدان، أو بسبب القيام بنشاطات رياضية معيَّنة. فمع وجود تلك البيانات الضخمة، أصبحت عملية تحليل معلومات المراكز الطبية وربط نتائجها بما هو حاصل بالواقع أسهل نظراً لمقدرة الأطباء معرفة البيانات الأولية للمريض، حتى وإن لم يقم المريض بزيارة المركز الصحي من قبل.
وفي الآونة الأخيرة، ظهر مصدر آخر من مصادر البيانات الصحية، وهو ما توفره أجهزة الارتداء كالساعات والأساور الذكية المرتبطة بشبكة الإنترنت، والتي يتم من خلالها رفع ومشاركة النشاطات البدنية والتمارين الرياضية على الشبكة العنكبوتية.
التنبؤ بالكوارث الطبيعية: بات بإمكان مراكز وحدات الاستجابة للكوارث من استخدام البيانات المتعلِّقة بالجيولوجيا الطبيعية والبيانات الجغرافية للتنبؤء بالكوارث المحتملة، من خلال تحليل البيانات السابقة ومن ثم مقارنة تلك البيانات بما هو حاصل حالياً. وبذلك، تعزز هذه النتائج من تنبؤات تلك المراكز ومن ثم اتخاذ إجراءات احترازية قبل حدوث الكوارث والأزمات الطبيعية، ووضع استراتيجيات الإغاثة والإخلاء قبل فوات الأوان.
شركات التقنية: تقوم شبكة «لينكد إن» (LinkedIn) الاجتماعية المتخصصة فى العمل والوظائف باستخدام نتائج البيانات الضخمة لتوليد مليار اقتراح كل شهر لزوار موقعها. أما شركة «سيسكو» لمعدات الشبكات فترى أن البيانات الضخمة هي بمنزلة «النفط الجديد» في الاقتصاد العالمي، لما لها من قدرة على تحويل الاقتصاديات، وجعل الشركات أكثر كفاءة، وتحسين الحياة اليومية للمستهلكين.
أثرها في الوظائف التقنية؟
على الرغم من كل إيجابيات البيانات الضخمة، والفوائد المحتملة التي قد تنتج عن تحليل مزيد من تلك البيانات، يرى فريق من المختصين أن التطور التقني المبني على هذا المفهوم قد يشكِّل خطراً يهدِّد كثيراً من الوظائف مستقبلاً، وخاصة التي تعتمد على أذواق العاملين أو نظرتهم الفنية. فأصبح الحاسب بتحليله للبيانات أدق في التعرف على أذواق ورغبات الجمهور. وبذلك، لا حاجة لمن يحاور الجمهور عن قرب، أو يحلل رغباته بالطرق التقليدية. ويزيد المتشائمون على تلك الرؤية، فيرون أنه لن تكون هناك حاجة للابتكار أو إيجاد نظريات أو مفاهيم جديدة تُعنى بسلوكيات الناس وتحليل نفسياتهم مستقبلاً، لأنه، وببساطة، هذا ما سيعمله الحاسب من خلال تحليل تلك البيانات وفي أجزاء من الثانية. والناتج هو الاستغناء عن مزيد من العاملين.
ولذلك، ينادي مديرو الأعمال بتوجيه الموظفين الراغبين بالتمسك بأعمالهم وحرفهم أن يجيدوا الابتكار والإبداع، لأنه الفارق الوحيد بين الآلات والبشر. ولتوضيح مدى قلق المختصين من انتشار البطالة وخصوصاً بين العاملين في المجالات الفنية، تبيِّن دراسة أجريت مؤخراً أن أكثر من ثلث البريطانيين يتخوفون من أن يكون الرجل الآلي «الروبوت» هو البديل المستقبلي ليحل مكانهم في الوظائف، مشيرين إلى أن التطور التقني وسهولة إيجاد الأجوبة بواسطة تحليل البيانات ومن ثم تمريرها للإنسان الآلي بات يشكِّل خطراً فعلياً. وتوقع أكثر من ربع الذين خضعوا للاستطلاع في بريطانيا أن يصبح الرجل الآلي قادراً في المستقبل على قراءة أفكار البشر والتفاعل معها، وستصبح لدى الأجهزة القدرة على التعامل مع الناس من خلال تغذيتها بالمعلومات ومن ثم تحليلها تلقائياً لترد على استفسارات البشر، بما في ذلك خدمات الزبائن ومتابعة شؤون العملاء، وغير ذلك من الوظائف التي تتضمن بُعداً إنسانياً أو فنياً بشكل أو بآخر.
هناك من يرى أن التقنية وسهولة الحصول على الأجوبة من الآلات لن يغني عن أصحاب الخبرة، أو المتفانين في أعمالهم، أو مَنْ لديهم روح المبادرة أو التطوير
وفي المقابل، هناك مَنْ يرى أن التقنية وسهولة الحصول على الأجوبة من الآلات لن يغني عن أصحاب الخبرة، أو المتفانين في أعمالهم، أو مَنْ لديهم روح المبادرة أو التطوير. يقول الخبير الإداري المتخصص في مجالات التنمية البشرية «عدنان حميدان»: «إن الآلة يصعب أن تحل مكان الموظف العادي في كثير من الأحيان، لكن شريطة أن يكون الموظف نفسه مؤهلاً بأن يحافظ على عمله، وأن يظهر تميزه عن الكمبيوتر والآلة والروبوت». ويضيف: «أن هناك عدداً من العوامل قد تجعل الشركة أو صاحب العمل غير قادر على التخلي عن الموظف لصالح كمبيوتر أو روبوت، كأن يكون لدى الموظف القدرة على العمل بدماغه وليس فقط بجسمه، حيث إن الآلة يمكن أن تعوِّض الجسم، لكنها لا يمكن أن تعمل بدلاً من الدماغ». ومن ثم يتابع ليؤكد أن على الموظف أيضاً أن يمتلك روح الإبداع في عمله ويسعى إلى تطويره، لأنه هو من صنع الآلة وهو من سيطورها، وهو أمر لا يمكن للتقنية عمله لأنها وببساطة ليس لديها القدرة على التفكير في كيفية التطوير، فالمستقبل لن يسع إلَّا للمبدعين.
ولدعم تلك الرؤية، لا توجد أدلة موثقة حتى الآن تفيد بأن ثورة المعلومات والصناعة التقنية قد أسهمت في ارتفاع نسب البطالة بين الحرفيين أو التقنيين، بل هناك ما قد يشير إلى أنه لثورة المعلومات الفضل في استحداث وظائف جديدة لم تكن موجودة في السابق، وتسببت بتطوير أعمال ملايين الشركات بمختلف أحجامها حول العالم، ومن تلك الأدلة هبوط نسبة البطالة في الولايات المتحدة الأمريكية إلى أدنى مستوياتها قبل الهزة الاقتصادية في سنة 2008م، على الرغم من التطور التقني المدعوم من شركات التقنية الأمريكية الكبرى.
ومهما كانت نظرتنا إلى تلك البيانات الضخمة وأثرها على الوظائف، يجب أن نعي أن توفر هذا الكم الضخم من البيانات لا يعني تحولها تلقائياً إلى «معرفة صحيحة»، بل قد تؤدي تلك البيانات إلى استنتاجات خاطئة واكتشافات مغلوطة، أو ما يسميه الخبراء «موجبات كاذبة»، وهو ما أشار إليه الكاتب نيت سيلفر في كتابه «الإشارة والضجيج»، ليوضح من خلال عرضه أمثلة واقعية كيف يمكن لعلم الإحصاء والاحتمالات ومعالجة الكم الهائل من البيانات أن تقودنا إلى استنتاجات وأحكام خاطئة. ولهذا يجب التأكيد أن تحليل البيانات يتطلب فهماً دقيقاً ومتطوراً، حتى لا نقع في فخ الاستنتاجات المغلوطة.
وما يتفق عليه المتشائمون والمتفائلون على حد سواء، هو أن ثورة المعلومات المتسارعة هذه تتطلب إيجاد وظائف جديدة مبتكرة، كخبراء في تحليل البيانات، ومبرمجين متخصصين في علوم البيانات الضخمة والمعالجة الموزعة distributed computing. وكذلك مناهج جديدة ومحدثة لتوائم هذه الثورة. وهذا ما أشار إليه الاقتصادي «مارك لوتمان» في قوله «إن ثمانين بالمئة من وظائف المستقبل ليست موجودة بعد، ويجب علينا إعداد طلابنا لوظائف وأشكال حياة الغد لا اليوم».