نرحب بك في موقع كورس سيت ... إن الموقع في الفترة التجريبية

28

أغسطس'18

Apache Hadoop

أباتشي هادوب (بالإنجليزية: Apache Hadoop) هو برنامج أو منصة برمجية مفتوحة المصدر مكتوبة بلغة الجافا لتخزين ومعالجة البيانات الضخمة بشكل موزع مثل تخزين بيانات ضخمة على عدة أجهزة ومن ثم توزيع عملية المعالجة على هذه الاجهزة لتسريع نتيجة المعالجة. إن نظام ملفات Hadoop الموزّع Hadoop Distributed File System (DHFS) هو نظامُ تخزينٍ لعنقود Hadoop، فعندما تأتي بياناتٌ جديدةٌ للعنقود، يقوم نظام الملفات بتجزيئِها ويوزّع هذه الأجزاء على الخوادم المختلفة المُشارِكَة في العنقود. يُخزِّنُ كلُّ خادمٍ جزءاً صغيراً من مجموعة البيانات الكُلِّيَّة، وينسَخُ كلَّ جزءٍ من البيانات على أكثرِ من خادمٍ واحد. وبما أن نظام الملفات هذا يُخزِّن البيانات الكُلّيّة بشكلِ أجزاءٍ صغيرة على مجموعةٍ من الخوادم، فإنَّ مهام التحليل تُوزَّع تفرُّعياً على كلِّ الخوادم التي تحتوي جزءاً من البيانات الكُلِّيَّة. انضم لهذه الدورة المجانية و تعرف على هذا المجال الحديث و اكتسب أفضل فرص عمل في هذا المجال

اقرأ المزيد