آشنایی با خطای RMSE در GIS

نویسنده : |۱۳۹۵-۱۲-۱۱ ۱۶:۱۲:۳۱ +۰۰:۰۰ ۱۲م آبان, ۱۳۹۴|جی.آی.اس (GIS), مقالات آموزشی, نقشه برداری|۱۹ دیدگاه

آشنایی با خطای RMSE در GIS

   RMSE که از آن به عنوان خطای RMSE نیز یاد میکنند، مخفف کلمه Root Mean Square Error و به معنی میانگین مربع خطاها میباشد. این واژه یکی از پرکاربردترین پارامترهای آماری در GIS است و میتواند بعنوان یکی از پارامترهای تاثیرگذار در کاربردهای زمین آمار استفاده گردد.

RMSE میزان خطای بین دو مجموعه داده را اندازه گیری میکند. این پارامتر معمولاً مقادیر پیش بینی شده و مقادیر اندازه گیری شده را با یکدیگر مقایسه میکند. برای مثال ارتفاع نقاط به دست آمده از LiDAR را با ارتفاعی که از نقشه برداری زمینی به دست آمده، مقایسه میکند.

برای به دست آوردن RMSE، ابتدا اختلاف بین هرکدام از مقادیر LiDAR و ارتفاع متناظر به دست آمده از نقشه برداری زمینی را محاسبه میکنیم. در اینحالت میتوانیم دو طرف این تفاضل را جابجا کنیم، چون در مرحله بعد، این تفاضل به توان 2 خواهد رسید. پس از به توان 2 رساندن تمامی تفاضل ها، آنها را با یکدیگر جمع کرده و بر تعدادشان تقسیم میکنیم. اگر از عدد حاصل جذر بگیریم نتیجه نهایی به دست می آید.

فرمول زیر گویای همین مطالب است :

فرمول محاسبه خطای RMSE

فرمول محاسبه خطای RMSE

 

نحوه محاسبه خطای RMSE با استفاده از نرم افزار Excel :

   فرض میکنیم شما دو سری داده دارید که با روشهای مختلفی اندازه گیری شده اند و میخواهید میزان RMSE را برای این دو دسته داده محاسبه نمایید. داده های هر دسته را در ستونهای A و B به فرمی قرار میدهیم که هرکدام از مقادیر روبروی مقدار متناظر با خود قرار گیرد. مثلاً اگر تعداد 10 داده در هر دسته وجود داشته باشد، داده های دسته اول در سلولهای A1 تا A10 و داده های دسته دوم در ستونهای B1 تا B10 قرار میگیرند.

مقدار سلول C1 را برابر A1-B1 قرار داده و این کار را برای سلولهای C2 تا C10 نیز تعمیم میدهیم.

سپس در سلول D1 فرمول زیر را وارد کرده و کلید Enter را میزنیم. مقدار محاسبه شده در سلول D1 همان RMSE خواهد بود.

SQRT(SUMSQ(C1:C10)/COUNTA(C1:C10))

کاربرد پارامتر RMSE در ارزیابی دقت تولید مدل رقومی ارتفاع (DEM)

   عدد RMSE بیانگر میانگینی از خطاهای موجود است و هنگامی که هدف ما ارزیابی دقت کل داده ها باشد، میتوان از این عدد بعنوان یک شاخص مهم استفاده نمود.
برای مثال هنگامی که با استفاده از روشهای مختلف اقدام به تولید DEM مینمائیم، برای کنترل دقت تولید DEM ابتدا تعداد مشخصی از نقاط کنترل را انتخاب کرده و با استفاده از روشهای میدانی ( مانند قرائت مختصات توسط GPS ) ارتفاع زمین و مختصات آن نقاط را به دست می آوریم. سپس ارتفاع نقاط برداشت شده و ارتفاع DEM در همان مختصات ها را وارد فرمول محاسبه خطای RMSE میکنیم.

پس از به دست آوردن عدد خطای RMSE نوبت به تحلیل دقت داده ها میرسد. معمولاً کنترلهای زیر درخصوص بررسی دقت DEM به ترتیب به کار گرفته میشوند:

1- عدد RMSE میبایست از یک سوم فاصله بین منحنی میزانهای مورد انتظار ما کمتر باشد. برای مثال در یک نقشه با مقیاس 1:2000 فاصله بین منحنی میزانها یک متر درنظر گرفته میشود. پس یک سوم این فاصله حدوداً 33 سانتیمتر خواهد بود. اگر عدد RMSE داده های ما بیش از این مقدار باشد به این معنا است که تولید DEM با دقت مناسبی صورت نپذیرفته است.

پیشنهاد بعدی   گوگل ارث (Google Earth) ؛ دریچه ای کوچک به سمت کشف زیبایی‌های دنیا

2- میزان خطای 68 درصد از نقاط کنترل، نباید از عدد RMSE بیشتر باشد. این خطا برای هرنقطه برابر است با اختلاف ارتفاع اندازه گیری شده و ارتفاع DEM در آن نقطه. برای مثال اگر تعداد 100 نقطه را بعنوان نقطه کنترل در نظر گرفته باشیم و مقیاس ما همان 1:2000 باشد، خطای ارتفاع 68 عدد از این نقاط نباید از 33 سانتیمتر بیشتر باشد.

3- میزان خطای 98 درصد از نقاط کنترل، نباید از دو برابر عدد RMSE بیشتر باشد. برای مثال اگر تعداد 100 نقطه را بعنوان نقطه کنترل در نظر گرفته باشیم و مقیاس ما همان 1:2000 باشد، خطای ارتفاع 98 عدد از این نقاط نباید از 66 سانتیمتر بیشتر باشد.

4- میزان خطای 99 درصد از نقاط کنترل، نباید از سه برابر عدد RMSE بیشتر باشد. برای مثال اگر تعداد 100 نقطه را بعنوان نقطه کنترل در نظر گرفته باشیم و مقیاس ما همان 1:2000 باشد، خطای ارتفاع 99 عدد از این نقاط نباید از 99 سانتیمتر بیشتر باشد.

اگر داده های ما در هر مرحله از مراحل فوق نتوانند حدنصاب لازم را کسب نمایند، ازلحاظ دقت مورد تائید قرار نمیگیرند. در پایان از خانم مهندس راد تشکر میکنیم که در همین رابطه اطلاعات مفیدی را در اختیار ما قرار دادند.

درباره نویسنده :

کارشناس نقشه برداری و کارشناس ارشد سنجش از دور و سیستمهای اطلاعات مکانی. آشنا به زبانهای برنامه نویسی VB و VB.Net در نرم افزارهای مرتبط با GIS. مدرس دوره های مختلف مقدماتی و پیشرفته ArcGIS.

۱۹ Comments

  1. مرتضی ۱۳۹۷/۰۸/۱۳ در ۸:۱۴ ب.ظ - پاسخ دادن

    سلام آقای مهندس
    ببخشید می خواستم بدونم موارد بالا قسمتی که گفتید ( میزان خطای 68 درصد از نقاط کنترل، نباید از عدد RMSE بیشتر باشد.) را از چه منبعی گرفتید اگه مقاله یا کتابی هست که این مسائل به صورت کامل در آن توضیح داده شده را بهم معرفی کنید نیاز داشتم
    با تشکر

    • حسن واعظی ۱۳۹۷/۰۹/۰۵ در ۵:۳۱ ب.ظ - پاسخ دادن

      سلام
      درخصوص تستهایی که برای صحت DEM انجام میشود، سه مورد آخر که میزان خطاهای 68 و 98 و 99 درصد را تست میکنند، به دنبال کنترل نرمال بودن خطاها هستند.
      اگر منحنی نرمال را درنظر داشته باشید، سطح زیر منحنی نرمال در فاصله یک واریانس برابر 68 درصد کل فراوانی ها است. اگر دو برابر واریانس را در نظر بگیریم سطح زیر منحنی به 98 درصد میرسد. درخصوص سه برابر واریانس هم این موضوع به 99 درصد میرسد. RMSE هم فرمولی دقیقاً مشابه واریانس دارد و میتوان همین موضوع را به آن نسبت داد.
      پس داده ای که دارای رفتار نرمال باشد، در این سه مقطع میبایست رفتاری مشابه تابع نرمال داشته باشد. منابع علم آمار هم این موضوع را تائید میکنند .

  2. مازیار فرزین به ۱۳۹۷/۰۸/۱۱ در ۱۲:۴۹ ب.ظ - پاسخ دادن

    صمیمانه از لطف شما سپاسگزارم

  3. انوشه ۱۳۹۷/۰۳/۰۸ در ۱۰:۱۸ ق.ظ - پاسخ دادن

    ممنون آقای مهندس
    عذر می خوام. کسی با کاربردهای GIS دربیگ دیتا آشنایی داره؟

  4. حامد محمدی ۱۳۹۶/۱۰/۱۳ در ۴:۳۲ ب.ظ - پاسخ دادن

    عرض سلام و تشکر بخاطر مطالب مفیدتون.
    فاکتورهایی که برای کنترل دقت DEM ذکر کردین، تو کدوم مقاله ی منتشر شده بیان شده؟
    ممنون میشم

    • حسن واعظی ۱۳۹۶/۱۰/۱۶ در ۶:۳۶ ب.ظ - پاسخ دادن

      سلام
      این روش براساس دستورالعملها و روال موجود در سازمان نقشه برداری کشور تنظیم شده است.

      • نان ۱۳۹۶/۱۰/۲۲ در ۱۰:۳۰ ب.ظ

        با سلام
        ممنون از راهنمایی مفیدتون.
        لطف کنید اینم بگید که فرمول ME رو چطور مینویسن؟ مثل RMSE هست ولی نه توان دو داره و نه رادیکال

      • حسن واعظی ۱۳۹۶/۱۰/۲۲ در ۱۱:۴۹ ب.ظ

        سلام
        ممنون از توجهتون. پرسش شما باعث شد جستجو کنم و خودم هم یاد بگیرم.
        احتمالاً منظور شما MAE یا همان Mean Absolute Error است. مقادیر RMSE و MAE تشابه و تفاوتهایی دارند.
        هردو میتوانند میزان خطاها را برآورد کنند. هر دو عددی مثبت هستند و علامت مثبت یا منفی خطاها در آنها تاثیری نمی گذارد.
        اما RMSE به خطاهای بزرگتر حساس است و اگر شما خطاهایی داشته باشید که از مقدار برآورد شده شما فاصله زیادی داشته باشند، چون اختلاف این اعداد به توان 2 میرسد، میزان RMSE را بسیار تغییر میدهد. این در حالی است که در موارد مشابه، به دلیل اینکه MAE از توان اول اختلافات استفاده میکند، زیاد تغییر نمیکند.

  5. امین بهرامی ۱۳۹۵/۱۲/۱۱ در ۵:۱۱ ب.ظ - پاسخ دادن

    با سلام و خسته نباشید،
    و تشکر ویژه از جنابعالی و خانم راد بزرگوار به خاطر تلاشتون در راستای ارتقاء دانش علاقه مندان به علوم مکانی

  6. سعید ۱۳۹۵/۱۲/۱۱ در ۱۰:۲۹ ق.ظ - پاسخ دادن

    با سلام و خسته نباشید

    رنج نمره دهی این خطا در چه محدوده ای می باشد.
    یعنی بین چند تا چند میشه خوب یا متوسط یا بد؟؟؟؟
    متشکر

    • حسن واعظی ۱۳۹۵/۱۲/۱۱ در ۴:۱۴ ب.ظ - پاسخ دادن

      سلام
      برای پاسخ به پرسش جنابعالی، نمونه ای از کاربرد خطای RMSE را در ادامه مطلب قرار دادیم.
      امیدوارم پاسخگوی پرسش شما بوده باشد.
      موفق باشید

  7. شايسته دانش كاظمي ۱۳۹۵/۱۲/۰۶ در ۱۱:۲۱ ق.ظ - پاسخ دادن

    اگر بخواهيم rmse تعريف كنيم و بگيم خطاي بدست امده حاصل اختلاف ارتفاع پيكسل معادل با نقطه برداشت است. به جاي نقطه برداشت چه واژه ديگه ايي ميتونيم بزاريم؟

    • حسن واعظی ۱۳۹۵/۱۲/۰۶ در ۱۱:۵۶ ب.ظ - پاسخ دادن

      دلیل اهمیت جایگزینی این واژه را متوجه نمیشوم، اما میتوان بجای نقطه برداشت، نقطه معلوم ویا نقطه با مقدار مشخص را استفاده کنیم.

  8. fatemeh ۱۳۹۵/۰۸/۲۱ در ۱۰:۰۶ ب.ظ - پاسخ دادن

    سلام
    خطای RMSE بدست آمده همیشه به صورت عدد صحیح است؟!

    • حسن واعظی ۱۳۹۵/۰۸/۲۲ در ۸:۲۵ ق.ظ - پاسخ دادن

      سلام
      الزامی به عدد صحیح بودن خطای RMSE نیست و در اکثر موارد عدد اعشاری به دست می آید.

  9. سارا ۱۳۹۵/۰۶/۳۱ در ۹:۰۹ ب.ظ - پاسخ دادن

    با سلام و احترام
    معیار RMSE در نمودار چیست؟
    به عنوان مثال برای زمان ثانیه (S) است. برای RMSE چیست؟

    • حسن واعظی ۱۳۹۵/۰۷/۰۱ در ۶:۳۳ ق.ظ - پاسخ دادن

      سلام
      اگر منظورتون واحد RMSE باشد که مشخص است. واحد RMSE همان واحد پارامتر X میشود.
      مثلاً اگر شما مطابق نمونه ای که ذکر شد، مقادیر ارتفاع نقاط را در RMSE قرار دهید و واحد ارتفاع شما نیز متر باشد، واحد RMSE متر خواهد شد.

  10. hamid ۱۳۹۵/۰۲/۲۰ در ۱۰:۳۸ ق.ظ - پاسخ دادن

    با سلام. اینجا n تعداد خطاهاست یا تعداد کل داده ها؟

    • حسن واعظی ۱۳۹۵/۰۲/۲۱ در ۱۲:۵۲ ق.ظ - پاسخ دادن

      باسلام خدمت شما
      گفتیم که “RMSE میزان خطای بین دو مجموعه داده را اندازه گیری میکند”. پس مثلاً برای 10 نقطه مقادیر ارتفاع را از DEM و از LiDAR داریم. تعداد n همان تعداد نقاط یا تعداد اعضای آن دو مجموعه بوده و در مثال ما عدد 10 است.

دیدگاه خود را اینجا ثبت کنید