شناسایی نوع توزیع داده ها و وزن هر یک از بلوکها و نمونه ها:

آنالیز داده های بزرگ به طور کل با دادههای آماری تحقیقاتی متفاوت است. در این نوع از داده ها ابتدا به بررسی نوع توزیع داده ها، نوع چولگی و…. پرداخته خواهد شد. بر اساس sampling weight یا location weight یا population weight یا frequency weight و یا بر اساس ایده شخصی خود دریافت کننده خدمت به داده ها در بلوکها و نمونه های مختلف وزن داده خواهد شد. در کنار اینها نحوه robustness تخمینها نیز مورد بررسی قرار خواهد گرفت. مرحله بعد شناسایی روش تخمین مناسب برای هر یک از متغیرها است. بطوریکه مدل بر اساس متغیرهای مرحله قبل بر اساس تخمین زننده های مختلف رگرسیونی داده های بزرگ تخمین زده خواهند شد. ، شاخص های پساتخمین مرتبط تعیین خواهند شد و گزارش داده خواهند شد. در صورت اشکال در شاخص های پسا تخمین، تخمین های مجدد به منظور رفع این اشکال با مدلهای رگرسیونی دیگر انجام خواهد شد تا از تورش تخمین جلوگیری شود. در مرحله بعد با استفاده از روش تجزیه و تحلیل حساسیت، کیفیت و نحوه حرکت خروجیها مورد بررسی مجدد قرار خواهند گرفت

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *