روزانه حجم عظیمی از داده‌ها توسط «سیستم‌های اطلاعاتی مدرن، فناوری‌های دیجیتال مانند اینترنت اشیا رایانش ابری و دیگر موارد تولید می‌شود. تحلیل این داده‌های انبوه که به آن‌ها داده های بزرگ گفته می‌شود نیازمند تلاش‌های زیاد در سطوح گوناگون، جهت استخراج دانش به منظور کمک به تصمیم‌سازی بهتر است. بنابراین، تحلیل کلان داده یک حوزه علمی و صنعتی روز محسوب می‌شود که پژوهش‌های زیادی پیرامون آن در جریان است و همچنان نیازمند تحقیقات بیشتر نیز هست. ترکیب داده های بزرگ خود یک کار تخصصی و پیشرفته است که نیازمند دانش و تجربه در حیطه های مختلف منجمله آمار پیشرفته، اقتصاد سنجی و آگاهی از نحوه کار و اتصال نرم افزارهای دیتابیس با نرم افزارهای آماری پیشرفته است. اغلب رویکردهای ارائه شده در «داده‌کاوی» قادر به مدیریت موفق مجموعه داده‌های بزرگ نیستند. مساله کلیدی در تحلیل کلان‌داده فقدان هماهنگی بین سیستم‌های پایگاه داده و ابزارهای تحلیل مانند داده‌کاوی و «تحلیل‌های آماری » است. ادامه…..