یکپارچه سازی و کلینینگ داده های دیتا بیس ها

یکی از مسائل اساسی در سازمانها، عدم توانایی دقیق یکپارچه سازی داده های بانکهای اطلاعاتی مختلف است. در صورت وجود آی دی های یکسان در بانکهای اطلاعاتی مختلف ( برای مثال کد ملی) می توان با استفاده از تکنیک merge و Lookup در نرم افزارهای دیتا بیس، آن دسته از متغیرهای Individual که در بانکهای اطلاعاتی مختلف مشترک هستند مرتب سازی و ترکیب نمود. اما با توجه به اینکه احتمال دسترسی به یک فیلد مشترک در بانکهای اطلاعاتی مختلف داده ها تقریبا پایین است، در صورت نبود چنین متغیرهایی، داده ها بر اساس روش های propensity score به چندین گروه با ویژگیهای مشابه طبقه بندی شده و با هم ترکیب می شوند. در صورت عدم امکان این روش نیز، داده ها به سطح کلان macro تغییر شکل داده خواهند شد و تجزیه تحلیل می شوند. شرکت داده کاوان سلامت مفتخر است، بعنوان تنها شرکت در داخل کشور، این فرآیند را در دیتابیسهای آماری بوم سازی نموده است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *