پارامترهای کیفیت داده های مکانی

آشنایی با پارامترهای کیفیت داده های مکانی

آشنایی با پارامترهای کیفیت داده های مکانی

درستی و دقت داده های مکانی

   داده ها قسمت اصلی یک سیستم مکانی را تشکیل میدهند. درستی و دقت نتیجه ارائه شده توسط سیستم، وابسته به درستی و دقت هر یک از اجزای سیستم، خصوصاً داده می باشد.
به بیانی دیگر هرگونه خطا در داده ها و کیفیت داده های مکانی، مستقیماً روی نتایج خروجی سیستم تاثیر گذارده و آنها را نامطمئن می سازد. از این رو پیش از به کارگیری داده ها، باید به نحو مناسب کیفیت داده های مکانی را مورد ارزیابی قرار داد.

ارزیابی کیفیت،باید از جنبه های مختلف صورت گیرد که برخی از مهمترین مولفه های آن ذیلاً ذکر گردیده است.

تعریف درستی و دقت

 – درستی (Accuracy)  عبارت است از میزان نزدیکی نتایج، محاسبات و یا پیش بینی ها به مقدار واقعی کمیت مورد نظر، یا میزان توافق بین نتیجه یک آزمون و مقدار مرجع مورد قبول.
– دقت (Precision)  عبارت است از میزان نزدیکی کمیت های مورد اندازه گیری نسبت به میانگین کمیت مورد نظر.

باید در نظر داشت که لزوماً دقت بالا به مفهوم درستی بالا نمیباشد.

تقابل بین دقت و درستی داده ها
تقابل بین دقت و درستی داده ها

مولفه های تعیین کیفیت داده های مکانی

1-  درستی موقعیت(Positional Accuracy)
2- درستی داده های توصیفی(Attribute Accuracy)
3- سازگاری منطقی(Logical Consistency)
4- کامل بودن(Completeness)
5- پیشینه(Lineage)
6- قدرت تفکیک(Resolution)

پارامترهای کیفیت داده های مکانی
پارامترهای کیفیت داده های مکانی

1- درستی موقعیت

   عبارت است از میزان نزدیکی اطلاعات موقعیتی به موقعیت واقعی. مثلاً اگر درستی نقشه 1:10000 در حد 0.5 میلیمتر در مقیاس نقشه باشد، خطای روی زمین برابر 5 متر خواهد بود.

 روشهای مختلف ارزیابی درستی موقعیت

 – مقایسه نتایج اندازه گیری با نتایج حاصل از یک منبع اطلاعاتی با دقت بالاتر. مثلاً یک نقشه با مقیاس بزرگتر از داده مورد نظر و یا نتایج حاصل از بکار بردن روش های دقیق تر نقشه برداری مانند GPS.
– محاسبه میانگین تعدادی از ایرادات از قبیل از هم رد شدگی ها، بهم نرسیدگی ها و یا Gap در سطح داده.
– محاسبه دقت از روی خطاهای ایجاد شده در مراحل مختلف.

2- درستی داده های توصیفی

   عبارت است از نزدیکی (میزان مطابقت) اطلاعات توصیفی یا مقادیر واقعی شان.

اطلاعات توصیفی دو نوع می باشند:

– پیوسته (Continuous) مانند طول خیابان، درجه حرارت.
– گسسته (Categorical) مانند نام خیابان یا کد کلاس کاربری.

برای ارزیابی درستی داده های توصیفی از نوع پیوسته از روش ذکر شده برای ارزیابی درستی موقعیت استفاده میشود. ولی برای ارزیابی درستی داده ای توصیفی از نوع گسسته، از ماتریس طبقه بندی و یا همان Cross-Tabulation استفاده میشود.

3- سازگاری منطقی

عبارت است از وجود ارتباط منطقی بین عوارض.

انواع سازگاری منطقی

1- سازگاری مکانی یا توپولوژی که عبارتست از میزان متابعت از قوانین توپولوژی. مانند عدم وجود چند سنتروئید در یک پلیگون، یا عدم تقاطع جاده یا بلوک ساختمانی، بسته بودن پلیگون ها، وجود گره (Node) در محل تقاطع عوارض خطی.

2- سازگاری موضوعی(Thematic) که عبارت است از عدم تناقض در داده های توصیفی. مثلاً اطلاعات توصیفی مساحت، جمعیت و چگالی جمعیت برای تمام  المان ها باید سازگاری داشته باشد و یا جمعیت یک شهرستان نباید بیشتر از جمعیت استان مربوطه اش باشد.

روشهای ارزیابی سازگاری منطقی

1- استفاده از اطلاعات توصیفی افزونه(Redundant). مثلاً در صورت وجود اطلاعات مربوط به مساحت و جمعیت، می توان سازگاری اطلاعات توصیفی چگالی جمعیت را ارزیابی کرد.
2- تعریف قواعد توپولوژیک(Topologic Rules) و اجرای آنها جهت یافتن موارد ناسازگاری

نکته: میبایست توجه داشت که یافتن یک ناسازگاری لزوما امکان تصحیح آن را فراهم نمی آورد و عدم وجود ناسازگاری ضرورتاً به معنی درستی داده نمی باشد.

4- کامل بودن

   عبارت است از وجود یا عدم وجود عوارض، اطلاعات توصیفی و یا ارتباطات آنها که در دو بخش کامل بودن مدل و کامل بودن داده مطرح میشود.

 برای ارزیابی کامل بودن، باید مشخصات فنی پایگاه داده(DB) مورد ارزیابی قرار گیرد تا وجود یا عدم وجود کلاسها و همین طور میزان جنرالیزه و خلاصه سازی در آن تعریف شده باشد.

5- پیشینه داده ها

   عبارتست از سابقه مربوط به منابع اطلاعاتی و عملیات انجام شده روی آنها برای تولید مجموعه داده مورد نظر. ایجاد فراداده مناسب میتواند پیشینه داده های ما را به خوبی ذخیره سازی نماید.
اجزای اصلی پیشینه داده ها عبارتند از:

1- اطلاعات منبع، که باید منشاء مجموعه داده را تشریح نماید.
2- اطلاعات مربوط به مراحل پردازش، که باید سرگذشت و تبدیلات انجام شده بر روی مجموعه داده را توصیف کند، و باید شامل نوع و زمان پردازش هایی باشد که به صورت دوره ای یا پیوسته برای نگهداری و ابقای مجموعه داده انجام شده است.

6- قدرت تفکیک

   عبارتست از میزان جزئیات قابل تشخیص در مجموعه داده، و در شاخه های مختلف زیر تعریف میگردد:

1- قدرت تفکیک مکانی(Spatial):  کوچکترین واحد قابل تشخیص در مجموعه داده که بر حسب ابعاد پیکسل در داده های رستری و یا کوچکترین المان ارائه شده در داده های برداری ذکر می شود.
2- قدرت تفکیک زمانی(Temporal):  عبارتست از بازه زمانی انجام عملیات نمونه برداری. اگر عمر یک عارضه کمتر از قدرت تفکیک زمانی باشد، عارضه ممکن است در مجموعه داده وجود نداشته باشد.
3- قدرت تفکیک موضوعی(Thematic):  عبارت است از میزان تفکیک بین طبقات مختلف در طبقه بندی

این مطالب را نیز مطالعه کنید :
محصولات ویژه فروشگاه :
اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
فهرست