2008/01/19

Top 10 Largest Databases in the World

الكثير من المبرمجين هنا يتفاخرون بمقدار البيانات المخزنة في قواعد البيانات التي يقومون بإنشائها ويربطونها ببرامجهم، طبعاً أتحدث عن كمبية البيانات وليس حجم قاعدة البيانات، فقاعدة البيانات الضخمة ليس من علامات ضخامتها قوتها والبيانات المخزنة بها، فالعديد من قواعج البيانات يكون تضخمها ناتج عن خطأ في التصميم وعلامة على ضعف إمكانيات المبرمج وعدم متابعته لقاعدة بياناته للقيام بالصيانة والتخلص من البيانات الزائدة وتعديل هيكلية البنية التحتية لتتناسب مع البيانات المتغيرة بإستمرار.

فمثلاً من الأخطاء الشائعة عند المبرمجين تخصيص نوع (Integer) لأى حقل مخصص للبيانات الرقمية، بينما الأجدى أن يتم معرفة أكبر رقم يراد تخزينه في هذا الحقل تم إختيار النوع المناسب (Long,Integer,SmallInt,TinyInt,Byte) طبعاً هذه الأنواع تم اعتمادها في قواعد البيانات (SQL Server 2005)، وكذلك عدم تطبيق أشهر قاعدتين في تصميم قواعد البيانات وهما:

  • منع التكرار منعاً باتاً، فإذا أمكنني الحصول على معلومة واحدة بطريقتين مختلفتين من قاعدة البيانات فهذا دليل على أن هنالك خطأ كبير في التصميم، مثلا من الخطأ تخزين سنة ميلاد الموظف في جدولين مختلفين.
  • عدم تخزين بيانات يمكننا الحصول عليها بطريقة أخرى غير تخزينها، فمثلاً من الخطأ تخزين سنة ميلاد موظف في جدول وعمره الحالي في جدول أخر.

ولكن هل تعتقد أن قاعدة بياناتك الضخمة هي الأكبر؟ حسناً فلنرى معاً أكبر 10 قواعد بيانات موجودة في العالم:

10 - قاعدة بيانات مكتبة الكونجرس: وهي تحوي أكثر من 130 مليون عنوان (كتب، صور، خرائط،...)، وحجمها حوالي 20 تيرابايت من النصوص ويتم إضافة حوالي 10000 عنوان يومياً، بالإضافة الى 29 مليون كتاب، و 5 ملايين وثيقة رقمية، وأغلبية الموجودات غير رقمية لكن يتم تحويلها الى الأرشيف الإلكتروني يومياً.

09 - قاعدة بيانات وكالة المخابرات المركزية الأمريكية (CIA): وهي تحوي أرشيفاً كبيرا من العديد من الموضوعات التي تتفاوت مابين الوئائق الخاصة بالمشروع النووي الباكستاني حتى الوثائق الخاصة بالحرب الكورية، بالإضافة إلى معلومات كثيرة عن حوالي 250 دولة حول العالم، ويتم إضافة حوالي 100 موضوع جديد شهرياً.

08 - قاعدة بيانات السوق الإلكتروني Amazon: وهي من أكبر قواعد البيانات على الإنترنت فهي تحوي بيانات حوالي 59 مليون متسوق نشط، بالإضافة الى 250000 كتاب مخزن بالكامل، وحجمها أكثر من 42 تيرابايت.

07 - قاعدة بيانات موقع YouTube: بعد حوالي سنتين من خروج هذا الموقع للنور أستطاع أن يحتل له مكاناً مرموقاً في أكبر قواعد البيانات حول العالم، ففي اليوم الواحد يقوم الزوار بمشاهدة حوالي 100 مليون فيلم قصير، بنسبة اكبر من 60% من كل الأفلان التي يتم مشاهدتها مباشرة على النت، كما يتم إضافة أكثر من 65000 فيلم يومياً، وبالتالي فقاعدة البيانات تتضاعف كل خمسة أشهر تقريباً، وحسب أخر تقدير فإن حجم قاعدة البيانات يبلغ حوالي 45 تيرابايت.

06 - قاعدة بيانات موقع ChoicePoint: وهي قاعدة بيانات متخصصة بتخزين كافة البيانات الخاصة بسكان الولايات المتحدة الأمريكية (عناوين السكن، أرقام الهواتف، رخص القيادة، بيانات الجرائم، ...) كما يضم بينات خاصة بالحكومة الإتحادية الأمريكية، كما يضم بيانات الحمض النووي DNA لمرتكبي الجرائم وأصحاب السوابق، وقد تم الإستفادة من هذا البيانات في التعرف على هوية الجثث في الهجوم على مركز التجارية العالمي في نيويورك سنة 2001، وحجمها حوالي 250 تيرابايت من البيانات الكاملة التي تخص حوالي 250 مليون شخص.

05 - قاعدة بيانات شركة Sprint: وهي من أكبر الشركات الخاصة بالهاتف النقال (مايسمى بالموبايل)، فهي تضم أكثر من 53 مليون مشترك حول العالم، وكعادة كل شركات الهاتف النقال فإن Sprint تحتفظ بكل المعلومات المتعلقة بمواقع زبائنها، بالإضافة إلى أن قواعد بياناتها تخزن وتعالج حوالي 365 مليون مكالمة بكامل تفاصيلها يومياً، كما تحوي حوالي 2.85 مليار سطر من البيانات.

04 - قاعدة بيانات موقع Google: تقوم شركة Google بإخفاء بياناتها الداخلية ائماً وعدم نشرها، بالإضافة إلى ذلك فإن الشركة تتعامل بأكثر من نوع من قواعد البيانات المتخصصة، فمن ناحية البحث على الإنترنت وحدها فإن الموقع يستقبل يومياً حوالي 91 مليون طلب بحث وهي تعتبر حوالي نصف عمليات البحث على الإنترنت، حيث يقوم الموقع بتخزين كافة البيانات الخاصة عن كل عملية بحث، ولحد اليوم فإن الشركة أستقبلت أكثر من 33 مليار عملية إدخال لقاعدة البيانات، ويقدر الخبراء أن قاعدة بيانات Google مئات التيرابايتات من البيانات، وبإضافة قواعد البيانات الأخرى المتفرعة من Google مثل (Google Video, Google YouTube, Google Ads, GMail) بالإضافة الى باقي بيانات Google الأخرى.

03 - قاعدة بيانات شركة AT&T: وهي شركة الإتصالات الأكبر في أمريكا وعلى مستوى العالم، حيث قامت الشركة بدمج كل قواعد بياناتها المتفرقة في قاعدة بيانات واحدة ضخمة يبلغ حجمها 312 تيرابايت.

02 - قاعدة بيانات المركز الأمريكي الوطني لأبحاث الطاقة National Energy Research Scientific Computing Center: حيث تعتبر ثاني أضخم قاعدة بيانات على مستوى العالم، ويقع هذا المركز في مدينة اوكلاند بكاليفورنيا، وتحتوي قاعدة البيانات على كل الأبحاث والمشاريع في مجال الطاقة النووية ومشاريع الفيزياء المتطورة وبإستخدام أجهزة السوبر كمبيوتر يتم تشبيه التجارب النووية وكل مايتعلق بها من تجارب وأبحاث وبيانات، ويبلغ حجم قاعدة البيانات حوالي 2.8 بيتابايت (Petabytes) بصراحة أول مرة أسمع بهذا النوع من وحدات القياس، كما أنها متاحة للجامعات ومراكز الأبحاث الأخرى، ولحوالي 2000 عالم، كما أنها ترتبط بقواعد بيانات أخرى تحوي كل التراث الإنساني وكل الكتابة والكلام المسجل منذ بدأ التأريخ مما يرفع حجمها الى حوالي (5 اكسابايت Exabytes).

01 - قاعدة بيانات المركز العالمي للطقس World Data Centre for Climate: بإستخدام مجموعة كبيرة من أجهزة الكمبيوتر فائقة السرعة ومركز ماكس بلانك للأبحاث و المركز الألماني لأبحاث الطقس بالإضافة الى أجهزة كمبيوتر في مختلف دول العالم، تم تكوين أضخم قاعدة بيانات في العالم بحجم أكبر من 220 تيرابايت من البيانات مرتبطة بشبكة الإنترنت، بالإضافة إلى حوالي 110 تيرابايت من البيانات الخاصة بمشبهات الطقس، وبجمعها مع 6 بيتابايت من البيانات المخزنة على أقراص مغناطيسية نتحصل على أكبر قاعدة بيانات في العالم.

هذه القائمة تم نشرها في موقع Business Intelligence Lowdown بتاريخ 15-2-2007، اي منذ سنة تقريباً، وبتوقع مقدار الزيادة تستطيع تخمين حجمها اليوم، للأسف لم أستطع معرفة نوعية برامج إدارة قواعد البيانات Database Management System، ولكنني أعتقد أنها لن تخرج عن (MySQL أو Oracle أو MSSQL).

كم يبلغ حجم أضخم قاعدة بيانات كونتها أو ساهمت في تكوينها؟

No comments: