روزانه حجم عظیمی از دادهها توسط «سیستمهای اطلاعاتی مدرن، فناوریهای دیجیتال مانند اینترنت اشیا رایانش ابری و دیگر موارد تولید میشود. تحلیل این دادههای انبوه که به آنها داده های بزرگ گفته میشود نیازمند تلاشهای زیاد در سطوح گوناگون، جهت استخراج دانش به منظور کمک به تصمیمسازی بهتر است. بنابراین، تحلیل کلان داده یک حوزه علمی و صنعتی روز محسوب میشود که پژوهشهای زیادی پیرامون آن در جریان است و همچنان نیازمند تحقیقات بیشتر نیز هست. ترکیب داده های بزرگ خود یک کار تخصصی و پیشرفته است که نیازمند دانش و تجربه در حیطه های مختلف منجمله آمار پیشرفته، اقتصاد سنجی و آگاهی از نحوه کار و اتصال نرم افزارهای دیتابیس با نرم افزارهای آماری پیشرفته است. اغلب رویکردهای ارائه شده در «دادهکاوی» قادر به مدیریت موفق مجموعه دادههای بزرگ نیستند. مساله کلیدی در تحلیل کلانداده فقدان هماهنگی بین سیستمهای پایگاه داده و ابزارهای تحلیل مانند دادهکاوی و «تحلیلهای آماری » است. ادامه…..