چگونگی بررسی تفاوت معنادار آماری در دو معادله رگرسیون خطی

scatter constant dift

1- مقدمه

اگر آنالیز رگرسیون خطی را انجام دهید، ممکن است به مقایسه عرض از مبداء و شیب خطوط رگرسیون های متفاوت نیاز داشته باشید. تصور کنید یک رابطه بین X و Y وجود دارد. حال فرض کنید که می‌خواهید تعیین کنید آیا این تفاوت معنادار آماری در دو معادله رگرسیون تحت شرایط متفاوت وجود دارد یا نه؟ این شرایط متفاوت می‌تواند دو محیط متفاوت، دو روش آزمون متفاوت، دو فرایند تولیدی متفاوت، دو اپراتور متفاوت یا متغیرهای کیفی مشابه دیگر باشند که می‌خواهید تعیین کنید که رابطه بین X و Y تحت تاثیر این متغیرهای کیفی متفاوت قرار گرفته است یا خیر.

به عنوان مثال شما ممکن است بخواهید ارزیابی کنید که آیا رابطه قد و وزن بازیکنان فوتبال با رابطه قد و وزن افراد عادی در جامعه از نظر آماری تفاوت معناداری دارد یا خیر؟

شما می توانید به صورت چشمی عرض از مبداء و شیب خطوط رگرسیون را با هم مقایسه کنید. با این حال، باز هم نیاز به انجام آزمون‌های آماری جهت بررسی وجود تفاوت معنادار است. آزمون‌های فرض آماری کمک خواهند کرد که تفاوت‌های واقعی را از تفاوت‌های ناشی از خطای نمونه برداری در یک سطح اطمینان مشخص، تعیین کنید.

در این پست، نشان داده خواهد شد که چگونه می‌توان رابطه‌های بین مدلهای مختلف رگرسیون را با هم مقایسه کرد و وجود یا عدم وجود تفاوت معنادار آماری را تعیین نمود. خوشبختانه این آزمون‌ها به راحتی با نرم افزار آماری Minitab قابل انجام است.

برای انجام این کار در این پست از یک مثال استفاده شده است (دانلود فایل مثال) که در آن دو متغیر ورودی و خروجی در یک فرایند فرضی وجود دارند. قرار است رابطه بین این دو متغیر را در دو شرایط متفاوت (به عنوان مثال دو روش آزمون متفاوت) با هم مقایسه شوند.

2- مقایسه عرض از مبدا دو خط در آنالیز رگرسیون ها

هنگامی که عرض از مبداء در دو معادله رگرسیون مختلف متفاوت است، نشان دهنده آن است که دو خط رگرسیون در جهت محور Y به سمت بالا یا پایین جابه‌جایی دارند. در نمودار زیر، می‌توان مشاهده نمود که متغیر خروجی تحت شرایط B (روش آزمون B) بالاتر از شرایط A (روش آزمون A) برای هر یک از مقادیر ورودی داده شده است. هدف تعیین آن است که آیا این تغییر مکان عمودی از نظر آماری معنادار است؟

scatter_constant_dift

جهت آزمون تفاوت بین ضرایب عرض از مبداء، فقط نیاز به یک متغیر جهت طبقه‌بندی شرایط مختلف وجود دارد که این متغیر بایستی از نوع وصفی باشد. برای مثال‌های استفاده شده در این پست یک متغیر وصفی برای تعیین شرایط (A or B) در هر یک از مشاهدات بکار گرفته شده است.

برازش مدل رگرسیونی در نرم افزار MINITAB از مسیر زیر برای مثال ارائه شده قابل انجام است:

 Stat > Regression > Regression > Fit Regression Model

 response variable: Output

continuous predicotr: Input

categorical predictor: Condition

در خروجی آنالیز رگرسیون ابتدا جدول ضرایب بررسی می‌شود:

coeff_constant_dift

این جدول نشان می دهد که رابطه بین دو متغیر ورودی (Input) و خروجی (Output) با توجه به آنکه مقدار P-Value برابر با ۰٫۰۰۰ شده است، از نظر آماری معنی دار می باشد.

ضریب عرض از مبداء برای متغیر وصفی شرایط مختلف برابر ۱۰ و مقدار P-Value آن (۰٫۰۰۰) می‌باشد که نشان می‌دهد عرض از مبداء در دو معادله رگرسیونی بدست آمده تفاوت معناداری دارند و فرضیه صفر که برابری عرض از مبداء‌ها در دو معادله رگرسیونی است، رد می شود. همچنین می توان تفاوت بین دو ضریب عرض از مبداء را در جدول معادله رگرسیون زیر نیز مشاهده نمود.

equ_constant_dift

3- بررسی تفاوت معنادار آماری در دو معادله رگرسیون

نمودار زیر را در نظر بگیرید، یک مقدار واحد برای متغیر ورودی در دو معادله پاسخ های متفاوتی را ارائه می دهند. به نظر می رسد افزایش یک واحد در متغیر ورودی در وضعیت B افزایش بیشتری را نسبت به وضعیت A دارد. این شرایط در نمودار به صورت بصری مشخص است، بررسی وجود تفاوت آماری معنادار در شیب دو معادله خط مدنظر است.

scatter_slope_dift

انجام آزمون آماری تفاوت بین ضرایب شیب خط به نظر مشکل است؛ اما در واقع این امر بسیار ساده و مشابه با مثال قبل قابل انجام می‌باشد و تنها بایستی تعیین کرد که آیا ضرایب شیب خط وابسته به متغیر وضعیت است. در علم آمار، زمانی می گویند که تاثیر یک متغیر وابسته به متغیر دیگر است، که اثر متقابل (interaction) وجود داشته باشد. لذا آنچه که باید انجام دهیم آن است که تعیین کنیم که آیا اثر متقابل بین دو متغیر Input*Condition وجود دارد یا خیر.

در MINITAB می‌توان وجود اثر متقابل را در پنجره تجزیه و تحلیل داده ها رگرسیون بررسی کرد. بعد از آنکه مدل رگرسیون برازش گردید وجود یا عدم وجود اثر متقابل (interaction) به راحتی قابل کنترل است.  برای مثال به جدول زیر توجه نمایید.

coeff_slope_dift

جدول فوق نشان می دهد اثر متقابل بین دو متغیر (Input*Condition) از نظر آماری معنادار است؛ زیرا مقدار p = 0.000 می‌باشد. در نتیجه، فرض صفر رد و نتیجه گیری می‌شود که تفاوت بین ضرایب شیب خط (۱٫۵۳۵۹ و ۲٫۰۰۵۰) در دو معادله رگرسیونی برابر با صفر نمی‌باشد. همچنین مشاهده می‌شود تفاوت بین عرض از مبدا دو خط برای این مثال با توجه به آنکه (P = 0.093)است، از نظر آماری معنادار نمی‌باشد و تنها تفاوت معنادار موجود، تفاوت بین شیب دو خط است.

equ_coeff_dift

4- سخن پایانی

روش شرح داده شده در این پست برای مقایسه دو معادله روگرسیونی با نام روش حداقل مربعات معمولی شناخته می‌شود. در این روش فرض بر این است که خطای مشاهدات عمدتاً در محور y است و خطا مشاهدات در محور x ناچیز و قابل صرف نظر کردن است. اگر این فرض برقرار نباشد، بایستی از روش رگرسیون دمینگ استفاده نمود. تفاوت رگرسیون دمینگ با رگرسیون خطی ساده از این جهت است که خطای مشاهدات در هر دو محور x و y را در نظر می‌گیرد. این یک روش در مقایسه با رگرسیون خطی ساده کمی پیچیده‌تر است. در یک پست آموزشی دیگر به عنوان استفاده از رگرسیون دمینگ برای صحه گذاری روش های آزمونپرداخته شده است. در صورت وجود هر گونه پرسشی در خصوص رسم رگرسیون در آزمایشگاه می‌تواند سوالات خودتان در قسمت کامنت های این پست قراردهید. سعی خواهد شد تا جای ممکن به سئوالات مطرح شده پاسخ مناسب داده شوند. همچنین در صورت نیاز به برگزاری دوره تصدیق و صحه گذاری روش آزمون با نرم‌افزار Minitab برای کارکنان آزمایشگاه یا برای دریافت خدمات مشاوره استاندارد ایزو 17025 و مشاوره استاندارد ایزو 15189 می‌توانید با ما تماس بگیرید.

دیدگاهتان را بنویسید