آشنایی با خطای RMSE در GIS

 RMSE که از آن به عنوان خطای RMSE نیز یاد میکنند، مخفف کلمه Root Mean Square Error و به معنی میانگین مربع خطاها میباشد. این واژه یکی از پرکاربردترین پارامترهای آماری در GIS است و میتواند بعنوان یکی از پارامترهای تاثیرگذار در کاربردهای زمین آمار استفاده گردد.

RMSE میزان خطای بین دو مجموعه داده را اندازه گیری میکند. این پارامتر معمولاً مقادیر پیش بینی شده و مقادیر اندازه گیری شده را با یکدیگر مقایسه میکند. برای مثال ارتفاع نقاط به دست آمده از LiDAR را با ارتفاعی که از نقشه برداری زمینی به دست آمده، مقایسه میکند.

برای به دست آوردن RMSE، ابتدا اختلاف بین هرکدام از مقادیر LiDAR و ارتفاع متناظر به دست آمده از نقشه برداری زمینی را محاسبه میکنیم. در اینحالت میتوانیم دو طرف این تفاضل را جابجا کنیم، چون در مرحله بعد، این تفاضل به توان 2 خواهد رسید. پس از به توان 2 رساندن تمامی تفاضل ها، آنها را با یکدیگر جمع کرده و بر تعدادشان تقسیم میکنیم. اگر از عدد حاصل جذر بگیریم نتیجه نهایی به دست می آید.

فرمول زیر گویای همین مطالب است :

فرمول محاسبه خطای RMSE

فرمول محاسبه خطای RMSE

 

نحوه محاسبه خطای RMSE با استفاده از نرم افزار Excel :

 فرض میکنیم شما دو سری داده دارید که با روشهای مختلفی اندازه گیری شده اند و میخواهید میزان RMSE را برای این دو دسته داده محاسبه نمایید. داده های هر دسته را در ستونهای A و B به فرمی قرار میدهیم که هرکدام از مقادیر روبروی مقدار متناظر با خود قرار گیرد. مثلاً اگر تعداد 10 داده در هر دسته وجود داشته باشد، داده های دسته اول در سلولهای A1 تا A10 و داده های دسته دوم در ستونهای B1 تا B10 قرار میگیرند.

مقدار سلول C1 را برابر A1-B1 قرار داده و این کار را برای سلولهای C2 تا C10 نیز تعمیم میدهیم.

سپس در سلول D1 فرمول زیر را وارد کرده و کلید Enter را میزنیم. مقدار محاسبه شده در سلول D1 همان RMSE خواهد بود.

SQRT(SUMSQ(C1:C10)/COUNTA(C1:C10))

کاربرد پارامتر RMSE در ارزیابی دقت تولید مدل رقومی ارتفاع (DEM)

 عدد RMSE بیانگر میانگینی از خطاهای موجود است و هنگامی که هدف ما ارزیابی دقت کل داده ها باشد، میتوان از این عدد بعنوان یک شاخص مهم استفاده نمود.
برای مثال هنگامی که با استفاده از روشهای مختلف اقدام به تولید DEM مینمائیم، برای کنترل دقت تولید DEM ابتدا تعداد مشخصی از نقاط کنترل را انتخاب کرده و با استفاده از روشهای میدانی ( مانند قرائت مختصات توسط GPS ) ارتفاع زمین و مختصات آن نقاط را به دست می آوریم. سپس ارتفاع نقاط برداشت شده و ارتفاع DEM در همان مختصات ها را وارد فرمول محاسبه خطای RMSE میکنیم.

پس از به دست آوردن عدد خطای RMSE نوبت به تحلیل دقت داده ها میرسد. معمولاً کنترلهای زیر درخصوص بررسی دقت DEM به ترتیب به کار گرفته میشوند:

1- عدد RMSE میبایست از یک سوم فاصله بین منحنی میزانهای مورد انتظار ما کمتر باشد. برای مثال در یک نقشه با مقیاس 1:2000 فاصله بین منحنی میزانها یک متر درنظر گرفته میشود. پس یک سوم این فاصله حدوداً 33 سانتیمتر خواهد بود. اگر عدد RMSE داده های ما بیش از این مقدار باشد به این معنا است که تولید DEM با دقت مناسبی صورت نپذیرفته است.

پیشنهاد بعدی   تعیین موقعیت آنی (RTK)، روشی مطلوب جهت تعیین موقعیت نسبی

2- میزان خطای 68 درصد از نقاط کنترل، نباید از عدد RMSE بیشتر باشد. این خطا برای هرنقطه برابر است با اختلاف ارتفاع اندازه گیری شده و ارتفاع DEM در آن نقطه. برای مثال اگر تعداد 100 نقطه را بعنوان نقطه کنترل در نظر گرفته باشیم و مقیاس ما همان 1:2000 باشد، خطای ارتفاع 68 عدد از این نقاط نباید از 33 سانتیمتر بیشتر باشد.

3- میزان خطای 98 درصد از نقاط کنترل، نباید از دو برابر عدد RMSE بیشتر باشد. برای مثال اگر تعداد 100 نقطه را بعنوان نقطه کنترل در نظر گرفته باشیم و مقیاس ما همان 1:2000 باشد، خطای ارتفاع 98 عدد از این نقاط نباید از 66 سانتیمتر بیشتر باشد.

4- میزان خطای 99 درصد از نقاط کنترل، نباید از سه برابر عدد RMSE بیشتر باشد. برای مثال اگر تعداد 100 نقطه را بعنوان نقطه کنترل در نظر گرفته باشیم و مقیاس ما همان 1:2000 باشد، خطای ارتفاع 99 عدد از این نقاط نباید از 99 سانتیمتر بیشتر باشد.

اگر داده های ما در هر مرحله از مراحل فوق نتوانند حدنصاب لازم را کسب نمایند، ازلحاظ دقت مورد تائید قرار نمیگیرند. در پایان از خانم مهندس راد تشکر میکنیم که در همین رابطه اطلاعات مفیدی را در اختیار ما قرار دادند.