استفاده از رگرسیون دمینگ برای صحه گذاری روش های آزمون
۱- مقدمه
رگرسیون دمینگ یک مدل بررسی خطا در متغیرها است که سعی میکند خطی با بهترین تناسب را برای یک مجموعه داده دو بعدی پیدا کند. تفاوت آن با رگرسیون خطی ساده از این جهت است که خطای مشاهدات در هر دو محور x و y را در نظر میگیرد. این یک روش خاص از رگرسیون حداقل مربعات است که این امکان را فراهم میکند که هر تعداد پیشبینی کننده و ساختار خطاهای پیچیدهتری را تحلیل نمود. این مدل از رگرسیون در اصل توسط ادکاک (Adcock) در سال ۱۸۷۸ معرفی و در سال ۱۸۷۹ توسط کوممل (Kummell) کامل گردید. با این حال ایدههای آنها بیش از ۵۰ سال مورد توجه قرار نگرفت، تا اینکه توسط کوپمنز (Koopmans) در سال ۱۹۳۷ احیا و بعد از آن توسط دمینگ (W. Edwards Deming) در کتاب تنظیم آماری دادهها در سال ۱۹۴۳ ترویج گردید. امروزه در بسیاری از کتابها و مقالات در رشتههای شیمی، شیمی بالینی و سایر رشتهها، این نوع از رگرسیون به نام رگرسیون دمینگ شناخته میشود. رگرسیون دمینگ در مقایسه با رگرسیون خطی ساده کمی پیچیدهتر است و در اکثر بستههای نرم افزاری آماری مانند نرمافزار Minitab و Xlstat رگرسیون دمینگ ارائه شده است. در ادامه این پست در نظر داریم کاربرد این نوع از رگرسیون را برای صحه گذاری روشهای آزمون و نحوه رسم آن را همراه با یک مثال عددی با نرم افزار Xlstat تشریح نماییم.
۲- رگرسیون دمینگ
ادوارد دمینگ در سال ۱۹۴۳ یک روش رگرسیون را ایجاد کرد، که امکان مقایسه دو روش اندازهگیری (به عنوان مثال، دو تکنیک برای اندازهگیری غلظت آنالیت) را فراهم میکند، در این نوع از رگرسیون فرض بر این است که خطای اندازهگیری هم در محور X و هم در محور Y وجود دارد. این نوع از رگرسیون بر مفروضات رگرسیون خطی کلاسیک (رگرسیون حداقل مربعات معمولی (OLS)) که برای این کاربرد نامناسب هستند، غلبه میکند. برخی از این فرضیات عبارتند از:
– متغیر مستقل (X) در مدل y(i)= a + bx(i) + ε(i)i قطعی و بدون خطای اندازهگیری است.
– متغیر وابسته (y) دارای توزیع نرمال میباشد.
– واریانس خطای اندازهگیری ثابت است.
علاوه بر این، مقادیر افراطی (دادههای پرت) میتوانند به شدت بر روی ترسیم رگرسیون کلاسیک تأثیر بگذارند.
دمینگ نوع خاصی از رگرسیون را پیشنهاد نمود که بر این مفروضات غلبه میکند: در روش دمینگ فرض بر این است که این دو متغیر دارای یک قسمت تصادفی هستند (نشان دهنده اندازهگیری). توزیع نتایج باید نرمال باشد. سپس تعریف میشود:
y(i)= y(i)* + ε(i)
x(i)= x(i)* + η(i)
فرض کنید دادههای موجود ((y(i), x(i) مشاهدات بد اندازهگیری شده از مقادیر “واقعی” (*(y(i)*, x(i) هستند که در آنها خطاهای ε و η مستقل میباشند. فرض بر این است که نسبت واریانس آنها شناخته شده است:
δ = σ۲(η)/ σ۲(ε)
نرم افزار XLSTAT این امکان را فراهم میکند که واریانس اندازهگیری خطا روی X و Y تعیین گردد. این نرمافزار به تعیین بهترین تناسب *y*= a + bx کمک مینماید، به گونهای که مجموع وزنی باقیماندههای مربعات مدل به حداقل برسد. جایی که ε و η از توزیع نرمال پیروی میکنند.
روش دمینگ امکان محاسبه ضرایب a و b و همچنین فاصله اطمینان در اطراف این مقادیر را فراهم میکند. مطالعه این مقادیر به مقایسه روشها (به منظور صحهگذاری یک روش غیر استاندارد با مقایسه نتایج آن با یک روش استاندارد) کمک مینماید. اگر نتایج روش غیر استاندارد به نتایج روش استاندارد بسیار نزدیک باشند، مقدار متغیر b نزدیک به ۱ و مقدار متغیر a نزدیک ۰ خواهد شد.
رگرسیون دمینگ به دو شکل است:
- رگرسیون دمینگ ساده: خطاها در کل گستره اندازهگیری ثابت هستند و تخمین ضرایب معادله خط در آن با استفاده از فرمول مستقیم بسیار ساده است (دمینگ، ۱۹۴۳)؛
- رگرسیون دمینگ وزنی: در این نوع از رگرسیون فرض میشود که خطاها در کل گستره اندازهگیری ثابت نیستند، بلکه متناسب با مقدار اندازهگیری شده تغییر میکنند. در این حالت، از یک روش تکراری برای بدست آوردن ضرایب معادله خط استفاده میشود (Linnet 1990)، در این حالت تعیین فاصله اطمینان برای ضرایب عرض از مبداء و شیب خط پیچیده است. در نرمافزار XLSTAT برای محاسبه فواصل اطمینان از رویکرد جک نایف (jackknife) استفاده میشود.
۳- مقایسه روش با رگرسیون دمینگ
هنگام توسعه یک روش جدید برای اندازهگیری غلظت یا مقدار یک عنصر (مثلاً مولکول یا میکرو ارگانیسم و …)، ممکن است نیاز به بررسی این موضوع که آیا نتیجهی روش جدید معادل با یک روش مرجع (استاندارد) است یا نه، وجود داشته باشد. دمینگ یک نوع از رگرسیون را ایجاد کرد، که امکان مقایسه دو روش اندازهگیری (به عنوان مثال، دو تکنیک برای اندازهگیری غلظت آنالیت) را فراهم میکند. این نوع از رگرسیون فرض میکند خطای اندازهگیری در هر دو سری اندازهگیری یعنی اندازهگیری با روش مرجع (X) و اندازهگیری به روش توسعه یافته جدید (Y) وجود دارد. رگرسیون کلاسیک (به روش حداقل مربعات معمولی) برای انجام این مقایسه بین دو روش نامناسب است زیرا خطاها را فقط در راستای یک محور (محور Y) در نظر میگیرد. نرم افزار XLSTAT ابزار آماری لازم برای استفاده از رگرسیون دمینگ را برای ارزیابی عملکرد یک روش جدید در مقایسه با روش مرجع یا استاندارد فراهم میکند. این نرمافزار شامل رگرسیون دمینگ ساده و وزنی است. رگرسیون دمینگ وزنی فرض میکند که خطاها متناسب با مقدار اندازهگیری بوده (به عنوان مثال با افزایش مقدار اندازهگیری شده مقدار خطا آن نیز افزایش مییابد) و رگرسیون دمینگ ساده فرض میکند که خطاها ثابت هستند و مقدار آنها با تغییر مقدار اندازهگیری شده تغییری نمیکند.
۴- ارائه یک مثال عددی
دادههای مربوط به آزمون بر روی ۱۶ نمونه با یک روش جدید و یک روش مرجع مطابق با جدول زیر است. هزینه انجام آزمون به روش جدید بسیار کمتر از روش مرجع استاندارد میباشد. هدف آن است که بررسی شود آیا امکان استفاده از روش جدید به جای روش مرجع استاندارد وجود دارد. (دانلود فایل مثال)
۵- رسم رگرسیون دمینگ با نرم افزار XLSTAT
به منظور رسم رگرسیون دمینگ در نرمافزار XLSTAT مطابق با گامهای زیر عمل میشود:
گام ۱: نرم افزار XLSTAT را دانلود و نصب نمایید. (دانلود نرم افزار)
گام ۲: فایل مثال ارائه شده را دانلود و در نرم افزار اکسل آن را باز کنید. (دانلود فایل مثال)
گام ۳: در نرم افزار اکسل به منوی XLSTAT رفته و مسیر زیر را انتخاب کنید:
گام ۴: بر روی Advanced Features –> Method validation –> Deming regressionَ کلیک نمایید، تا پنجره زیر باز شود، در کادر y دادههای مربوط به نتایج آزمون حاصل از روش جدید مورد صحه گذاری (ستون C1:C17) و در کادر X دادههای مربوط به نتایج آزمون حاصل از روش مرجع (ستون B1:B17) را وارد نمایید.
در نهایت با کلیک بر روی OK محاسبات انجام و نتایج نمایش داده میشوند.
۶- تفسیر نتایج بدست آمده:
به منظور تحلیل نتایج بدست آمده از روش رگرسیون دمینگ، اگر هر یک از شرایط زیر برقرار باشد، تحلیل نتایج شواهدی مبنی بر معادل نبودن دو روش جدید و مرجع را ارائه میدهد:
– در سطح اطمینان ۹۵% فاصله اطمینان برای شیب خط منحنی رگرسیون دمینگ شامل ۱ نباشد.
– در سطح اطمینان ۹۵% فاصله اطمینان برای عرض از مبداء خط منحنی رگرسیون دمینگ شامل ۰ نباشد.
در خروجی نرم افزار XLSTAT موارد زیر نمایش داده میشود:
جدول اول آمار توصیفی برای دو روش را نشان میدهد. روش جدید دارای میانگین بیشتر و واریانس بزرگتری (دقت کمتری) میباشد.
سپس، ضرایب مدل نمایش داده میشود.
جدول فوق برای نتایج رگرسیون دمینگ نشان میدهد:
– ضریب مقدار عرض از مبداء ۱.۹۰۹- با فاصله اطمینان (۵.۵۹۶- تا ۱.۷۷۸) است که این بازه شامل عدد ۰ میباشد. بنابراین میتوان گفت که تفاوت معنادار سیستماتیک از مقدار صفر بین دو وجود ندارد.
– ضریب شیب خط برابر با ۱.۲۰۸ با فاصله اطمینان (۰.۹۳۹ تا ۱.۴۷۷) است که این بازه شامل عدد ۱ است. این بدان معنی است که اختلاف متناسب معناداری بین دو روش وجود ندارد. اگر مقدار ۱ در این فاصله اطمینان قرار بگیرد، فرضیه این که شیب خط مخالف ۱ است، رد میشود.
– فواصل اطمینان با استفاده از روش jackknife بدست میآید. بر اساس نتایج بدست آمده میتوان گفت هیچ تفاوتی سیستماتیک و متناسبی بین این دو روش وجود ندارد. لذا میتوان عنوان کرد که هر دو روش معادل هستند و از روش جدید ارزانتر برای جایگزینی روش مرجع میتوان استفاده کرد.
۶- مراجع
Deming, W. E. (1943). Statistical adjustment of data. Wiley, NY (Dover Publications edition, 1985).
Linnet K. (1990). Estimation of the Linear Relationship between the Measurements of Two Methods with Proportional Errors. Statistics in Medicine, Vol. 9, 1463-1473.
Linnet K. (1993). Evaluation of Regression Procedures for Method Comparison Studies. Clin.Chem. Vol. ۳۹(۳), ۴۲۴-۴۳۲.