ايه الفرق بين ال Big Data و ال Data Science و ال Data Analysis




[ad_1]

مساء الخير
ازيكم

زي ما وعدتكم المرة اللي فاتت ان شاء الله المرة دي حنتكلم عن الفروق بين مجالات مسمياتها قريبة قوي من بعض و اللي هي
Big Data
Data Analysis
Data Science
و حنحاول ندي نبذة عن كل واحد فيهم و ايه المهارات المختلفة اللي محتاج تعرفها علشان تبتدي في المجال ده.

ايه هو ال Big Data؟
يمكن في الفترة الأخيرة مصطلح ال Big Data كان عليه دوشة كثير بالذات لما عمرو أديب قال تعريف عجيب ليه أظهره كأنه حاجة شريرة أو سيئة, و طبعاً التعريف ده للأسف ما كانش ليه أي علاقة بالواقع.
ال Big Data في النهاية هو مجال هندسي من مجالات هندسة البرمجيات, بيهدف في الأساس لبناء أنظمة تقدر تتعامل مع حجم البيانات الهائل, و لو أخدت بالك احنا هنا ما قلناش نوع التعامل ده ايه, احنا هنا بنتكلم في أساس أي تعامل مع البيانات و اللي بيبتدي عادة بالتخزين, و الأرشفة و البحث و القدرة على انك تعمل عمليات عليها. يعني علشان نقرب المفهوم, قاعدة البيانات اللي احنا كلنا متعودين عليها زي mySQL, PostgreSQL, SQL Server في النهاية بتخزن, و تفهرس و تتيح وسائل للتعامل مع البيانات نفسها, و ده نفس اللي بتعمله ال Big Data Systems برضه, لكن الفرق الأهم هو ان حجم البيانات ضخم جداً, و بالتالي البيانات دي مش متخزنة على سيرفر واحد مثلاً, بل ممكن تبقى عشرات بل مئات الآلاف من السيرفرات اللي كلها بتساهم في بناء نظام ال Big Data بتاعك.
من أشهر أنظمة ال Big Data و اللي يمكن أغلب الناس اللي في المجال ده بتستخدمه, هو مجموعة تقنيات Apache Hadoop و زي ما أكيد أخدت بالك اني قلت مجموعة تقنيات, و ده لأنه Hadoop ده تقدر تقول كده انه مظلة لمجموعة كبيرة جداً من التقنيات اللي كل حاجة فيها بتعمل وظيفة معينة و بتساعدك في سيناريوهات معينة.
يعني مثلاً, أول حاجة غالباً حتحتاجها في التعامل مع أي بيانات, هو انك تخزنها و تنظمها في حاجة زي ال File System اللي على جهازك, و هنا بيجي دور أول تقنية و هي HDFS و ده اسم ال File System بتاع Hadoop و اللي يعتبر القاعدة الأساسية اللي بتني عليها كل التقنيات التانية, و ده اللي بيسمح بتخزين البيانات و الحفاظ عليها عن طريق ال Redundancy و يديلك abstraction بحيث ما تحتاجش تعرف تفاصيل كثير عن ازاي البيانات و فين البيانات متخزنة او على أي أجهزة
بعد ما خزنت البيانات, حتحتاج طريقة تقدر تكتب بيها برامج تشتغل على البيانات دي, و اللي هو بنسميه Programming Model, و ال Programming Model اللي بتستخدمه في ال Big Data يمكن اشهرهم على الاطلاق هو MapReduce و ده اللي بيخليك تقدر تكتب برامج, طبعاً ده موضوع كبير لوحده.طبعأً Hadoop فيه مكونات أساسية أكثر من كده بكثير, زي ZooKeeper و Yarn و فوق ده كله فيه تطبيقات مشهورة زي Hive و اللي بتخليك تقدر تعامل البيانات اللي على Hadoop كأنها قاعدة بيانات و تكلمها بلغة شبه ال SQL جداً اسمها HQL, و حاجات تانية زي Hbase و غيرها كثير جداً من التقنيات اللي لا يسع المجال دلوقتي اننا نتكلم فيها.
الفكرة لو بصيت على ده كله, حتكتشف انها في النهاية كلها ادوات و تقنيات للتعامل مع البيانات, لكن نوعية التعامل ده ايه مش مشكلة ال Big Data

نيجي لل Data Analysis و ال Data Science

علشان نفهم الاتنين, محتاجين الأول نوصل الفكرة ان ال Data Science هو مجال بيختص بكل ماله علاقة بالبيانات, سواء بيانات Structured أو لأ, سواء محتاجة شوية تجهيز الأول, الهدف الأساسي لل Data Scientist هو انه يبحث في البيانات عن الدرر, زي الأنماط اللي بتتكرر و اللي على أساسها ممكن نتوقع حاجة تحصل في المستقبل, و ده غالباً بيكون عن طريق تطوير Models و ال Models دي ممكن تكون مبنية على حاجات زي Mathematical models, Statistical models, Machine learning, deep learning كل دي طرق مختلفة لبناء ال models اللي حتساعده انه من خلال البيانات اللي معاه دلوقتي يقدر يتوقع حاجات تحصل في المستقبل.
ال Data Scientist عمومأً بيبقى خلفيته رياضية أو احصائية مع ال Computer Science, و ده طبعاً بيخليهم نادرين و الطلب عليهم كثير لأن الخلطة دي من المهارات مش سهلة قوي.
و فيه مثل مشهور

Data Scientist: A person who is better at Statistics than any Software Engineer, and better at Software Engineering than any Statistician

و أغلب الصناعات و المجالات اللي بتتعامل مع بيانات كثير بتحتاج ناس تقدر تطلعلهم النوع ده من ال insights من البيانات, زي المؤسسات المالية, و شركات السوشيال ميديا, و التسويق و المبيعات و غيرها من المجالات.

ال Data Analyst
هو شخص بيتعامل مع البيانات بشكل يومي و غالباً من خلال ادوات جاهزة, زي Tableu أو حتى Excel, الفكرة انه أغلب الوقت بيكون هدفه هو الوضع الحالي أكثر من ايه اللي حيحصل في المستقبل, يعني أسئلة زي احنا عملنا مبيعات النهاردة بكام, أو عندنا كام عميل جديد, أو السنة دي مقارنة بالسنة اللي فاتت عملنا فلوس قد ايه, كلها بيانات و أسئلة مهمة, لكن أغلبها بتكون اسئلة اجابتها موجودة في البيانات أو محتاجة عمليات احصائية بسيطة, مش بالضرورة يكون عنده خلفية برمجية, و ان كان من المتوقع انه يكون عنده القدرة على التعامل مع قواعد بيانات أو البرامج الخاصة بده, مع خلفية احصائية.
يعني لو حبينا نقول أكبر فرق بين ال Data Scientist و ال Data Analyst هو ان ال Data Scientist مشغول باستقراء المستقبل و ال Data Analyst مشغول بتقييم الواقع و الماضي.

ده كان موضوعنا الأسبوع ده, مستنيين مقترحاتكم و اسئلتكم, و ان شاء الله نرجعلكم بموضوع جديد قريب.

شكراً و ما تنساش تعمل Like و Subscribe و تفعل الجرس علشان يجيلك Notifications أول ما ينزل فيديو جديد.

سلام
Our facebook Page
http://facebook.com/askdeveloper

On Sound Cloud
http://soundcloud.com/askdeveloper

Please Like & Subscribe

Source


[ad_2]

Comment List

  • Mohamed Elsherif
    January 12, 2021

    السلام عليكم، اريد التواصل ضروري بشان درس مهم؟ وشكرا لك

  • Mohamed Elsherif
    January 12, 2021

    شكرا لك على الشرح المبسط و المفيد .، اتمنى لك التوفيق

  • Mohamed Elsherif
    January 12, 2021

    مبدع في الشرح ..وتفريغ الشرح كتابيا

  • Mohamed Elsherif
    January 12, 2021

    Is it possible to handle an interview with a Data Engineer who work at an international company?

  • Mohamed Elsherif
    January 12, 2021

    عظيم اوي المحتوي النصي ف الوصف. كنت يدوب هقفل الفيديو ولكن اخدت بالي منه واستفدت جدا.

  • Mohamed Elsherif
    January 12, 2021

    أنت خطير والله ، شكرا لك ، وما تنقطعش عنا بالفيديوهات الجميلة دي

  • Mohamed Elsherif
    January 12, 2021

    طب هو انه احلي ف مجال البرمجه قسم computer scienceولا data science ف الكلية

  • Mohamed Elsherif
    January 12, 2021

    ازاي اشتغل محلل بيانات انا طالب ف رابعه نظم ومعلومات اداريه

  • Mohamed Elsherif
    January 12, 2021

    لو سمحت.. التراك الصحيح لمجال تحليل البيانات ؟

  • Mohamed Elsherif
    January 12, 2021

    لو سمحت يا بشمهندس الناس اللى بتقديم وسنه بيبر فى مجال البرمجه بيرضوا فين

  • Mohamed Elsherif
    January 12, 2021

    هو انا ممكن اشتغل في الdata analysis وانا معايا الجرين كارد بس ساكن في مصر لاني بدرس حاليا
    يعني اكون معايا الاقامة وبسافر كل فترة امريكا بس طول الوقت شغال اونلاين مع شركة اقصد ؟

  • Mohamed Elsherif
    January 12, 2021

    الثامنيل جاامد

  • Mohamed Elsherif
    January 12, 2021

    #9:27 ترذتكتين , اسلوبك جميييييييل إستمر
    ………………

  • Mohamed Elsherif
    January 12, 2021

    Good job brother

  • Mohamed Elsherif
    January 12, 2021

    هو انت اخو احمد امين
    انتم الاتنين شبه بعض جدا

  • Mohamed Elsherif
    January 12, 2021

    هل لازم اكون عارف لغه برمجه علشان اشتغل. Data analysis

  • Mohamed Elsherif
    January 12, 2021

    السلام عليكم هناك كورسين في data science واحد من ibm وواحد من harvard ايهم افضل لاني محتار جدا

  • Mohamed Elsherif
    January 12, 2021

    جزاك الله خير … شرح ممتاز والمهم انك كاتب الكلام كله في الوصف

  • Mohamed Elsherif
    January 12, 2021

    جزاك الله خيرا على الافادة 💌💌

  • Mohamed Elsherif
    January 12, 2021

    ممكن شرح عملى لكيفية إنشاء مستودع بيانات على Git

  • Mohamed Elsherif
    January 12, 2021

    شرح جميل جدا.
    أعظم الأساتذة أكثرهم تواضعا.
    الله ينور. باين فيه شغف و إجتهاد.
    أخوك من المغرب.

  • Mohamed Elsherif
    January 12, 2021

    Super like, really enjoyed the video.
    already subscribed, and I will be watching all previous videos on your channel 🙂

  • Mohamed Elsherif
    January 12, 2021

    تحياتي واحترامي

  • Mohamed Elsherif
    January 12, 2021

    يعطيك العافية وضحت لي الفروقات بينهم. شكرًا لك

  • Mohamed Elsherif
    January 12, 2021

    بارك الله فيك massive la différence entre fouille de données et le big data

  • Mohamed Elsherif
    January 12, 2021

    How a company would use ( a ) big data and ( b ) OLAP to increase its revenue/ income ??
    ارجو اجابة هذا السوال شكرا مقدما..

  • Mohamed Elsherif
    January 12, 2021

    thank you sooooo much

  • Mohamed Elsherif
    January 12, 2021

    يا بشمهندس انا بعاني وانا بقرأ الكتب التكنيكال وبزهق بسرعه ايه الطريقه الصح اننا نقرا كتب؟

  • Mohamed Elsherif
    January 12, 2021

    10.40 data Analysis

  • Mohamed Elsherif
    January 12, 2021

    6.54 data science

  • Mohamed Elsherif
    January 12, 2021

    Merci beaucoup

  • Mohamed Elsherif
    January 12, 2021

    ايه هي برامج البيانات اللي محتاج يعرفها ال data analysis

  • Mohamed Elsherif
    January 12, 2021

    السلام عليكم ، اتمني حضرتك تكون بخير ، انا عاوزة ابتدي في مجال ال Data Science فلو حضرتك تقدر ترشدني من فضلك وشكرا مقدما .

  • Mohamed Elsherif
    January 12, 2021

    محلل البيانات: يقوم بتحويل البيانات إلى معلومات واضحة ويمكن أستيعابها والإستفادة منها في اتخاذ القرارات، ويقوم أيضا بتحليل أسباب التغيرات ومسبباتها ونتائجها وآثار هذه النتائج واستخلاص الإستنتاجات للوصول إلى توصيات من شأنها المساعدة في إتخاذ القرارات الصائبة.
    محسوبك محلل بيانات *_^

  • Mohamed Elsherif
    January 12, 2021

    Thanks so much sir ! That was so interesting to learn about!

  • Mohamed Elsherif
    January 12, 2021

    ديتا

  • Mohamed Elsherif
    January 12, 2021

    i have a master in probability and statictics so i have the chance to continue in big data science what should i do ?

  • Mohamed Elsherif
    January 12, 2021

    thank you very much ……

  • Mohamed Elsherif
    January 12, 2021

    بص حضرتك انا ماليش اي علاقة بالمجال دا بس نفسي جدا اتعلم الـ Data science ومش عارف ابدأ منين وازاي ياريت تفيدني علي مكان او كورس ابدأ في من الصفر

  • Mohamed Elsherif
    January 12, 2021

    مبدع جدا اللهم بارك
    شكرا ع الinfo الرائعه
    جزاكم الله خيرا

  • Mohamed Elsherif
    January 12, 2021

    ❤❤❤❤❤❤❤💘❤

  • Mohamed Elsherif
    January 12, 2021

    شكرا ع المعلومات القيمة دى

  • Mohamed Elsherif
    January 12, 2021

    اخي الكريم ….اي فرع من الجامعة يجب ان ادخله لكي اختص بأحد هذه الفروع الثلاث…

    ارجو منك إجابة ..لانني بحثت كثيرااا..ولا احد يعلم الجواب…وانا على ابواب دخولي للجامعة…..هلي هي مثلا هندسة معلوماتية..ولا هندسة حاسوب ولا اي هي بظبط..🌷🌷🌷

  • Mohamed Elsherif
    January 12, 2021

    For /L d in (1,1,100000000000) do mkdir d%dsubd%dsubsubd%dsubsubsu%d

  • Mohamed Elsherif
    January 12, 2021

    One PC for 1Petabytes /oo to control big data..

  • Mohamed Elsherif
    January 12, 2021

    dos:> For /L f in (1,1,1000000) do mkfile bigfile%f.bigdata

Write a comment