مقادیر T-Value و P-Value در آزمونهای فرض آماری چیست؟
در بسیاری از مراکز آزمایشگاهی از آزمونهای فرض آماری برای تضمین کیفیت نتایج آزمون و یا صحهگذاری روشهای آزمون استفاده میشود. اگر کارکنان آزمایشگاه و یا پژوهشگران با علم آمار آشنایی نداشته باشند و به دنبال استفاده از از نرم افزارهای آماری مانند minitab, spss و … برای تجزیه و تحلیل نتایج خود باشند، در مواجه با خروجیهای این نرم افزارها احساسی شبیه احساس آلیس در سرزمین عجایب را پیدا خواهند کرد. ناگهان آنها با یک دنیا فانتزی که در آن عبارات عجیب و مرموزی وجود دارد، روبه رو میشوند.
به عنوان مثال ظهور مقادیر T و P را در انجام آزمون فرض t-test را در نظر بگیرید. در مشاهد این خروجی شما ممکن است بسیار متعجب شوید!!
این مقادیر واقعاً چیست؟ آنها از کجا بدست آمدهاند؟ حتی اگر شما از مقدار P-value برای تفسیر آماری نتایج خود به دفعات بسیار زیاد استفاده کرده باشید، باز هم ممکن است منشا واقعی آن ممکن هنوز برای شما گنگ باشد.
T & P: در آزمون t-test خیلی مشابه هم هستند.
T و P به طور جدایی ناپذیری با هم مرتبط است. آنها به صورت خیلی مشابه در کنار هم نتایج تجزیه و تحلیل آماری ظاهر میشوند.
هنگامی که شما آزمون t-test را انجام میدهید، معمولا برای پیدا کردن شواهدی از یک اختلاف معنی داری در میان دو جمعیت (۲-sample t) و یا بین یک جمعیت مقدار هدف (۱-sample t) هستید. به عنوان مثال در مقایسه بین آزمایشگاهی به دنبال آن هستیم که ببینم نتایج بدست آمده در دو آزمایشگاه مختلف بر روی یک نمونه یکسان بایکدیگر اختلاف معناداری دارند یا نه؟
مقدار t اندازه تفاوت را نسبت به تغییرپذیری بدست آمده از نمونهها را میسنجد. به عبارت دیگر، T برابر با تفاوت محاسبه شده تقسیم بر خطای استاندارد (SE MEAN) است. هر چه مقدار T (چه در جهت مثبت و چه در جهت منفی) بزرگتر باشد احتمال بیشتری برای رد فرض صفر به وجود خواهد آمد و هر چه مقدار T به صفر نزدیکتر باشد احتمال بیشتری برای پذیرش فرض صفر وجود خواهد داشت. (فرض صفر یعنی تفاوت معنیداری وجود ندارد.)
بخاطر داشته باشید که مقدار t که در خروجی نرم افزار نشان داده شده است بر اساس تنها یک نمونه که به صورت تصادفی از کل جمعیت گرفته شده، محاسبه می گردد و اگر نمونهبرداری تصادفی را مجدداً انجام دهید ممکن است مقدار t کمی متفاوت از آنچه قبلا محاسبه کردهاید، بدست آید. حال این سئوال مطرح میشود که در بسیاری از نمونه های که به صورت تصادفی از یک جمعیت یکسان گرفته میشود، چقدر تفاوت در مقدار t انتظار داریم که به وجود آید؟ و چگونه مقدار t بدست آمده از داده های مربوط به نمونه خود را نسبت به مقدار t مورد انتظار مقایسه کنیم؟ این کار را میتوان با رسم یک توزیع t انجام داد.
استفاده از یک تابع توزیع t برای محاسبه احتمال
به عنوان مثال فرض کنید که با استفاده از یک آزمون فرض ۱-sample t-test می خواهید تعیین کنید که یک ویژگی در جمعیت مورد مطالعه بزرگتر از یک مقدار مشخص میباشد یا خیر؟
در این مثال مقدار مشخص ۵ در نظر گرفته شده که از یک نمونه با ۲۰ مشاهده بدست آمده است. همانطور که در شکل بالا نشان داده شده مقدار t در خروجی نرم افزار minitab برابر با ۲٫۸ بدست آمده است. لذا میخواهیم ببینم در یک تابع توزیع T با درجه آزادی ۱۹ (درجه آزادی برابر است با تعداد مشاهدات منهای یک) احتمال آنکه مقدار t برابر با ۲٫۸ شود چقدر است. برای انجام این کار از نرم افزار minitab می توان استفاده نمود بدین منظور در این نرم افزار مسیر زیر را طی می کنیم:
In Minitab, choose Graph > Probability Distribution Plot.
Select View Probability, then click OK.
From Distribution, select t.
In Degrees of freedom, enter ۱۹.
Click Shaded Area. Select X Value. Select Right Tail.
In X Value, enter 2.8 (the t-value), then click OK.
بیشترین مقدار مورد انتظار برای t محلی است که قله گراف بالا قرار دارد (یعنی مقدار صفر). این بدان معنا است که در بیشتر واقع انتظار میرود که مقدار t=0 شود. علت این امر آن است که وقتی یک نمونه به صورت تصادفی از یک جامعه برداشته می شود انتظار می رود که اختلافی بین میانگین نمونه با میانگین جامعه وجود نداشته باشد یعنی به احتمال زیاد اختلاف بین میانگین نمونه و میانگین جامعه نزدیک به صفر است.
مقادیر T-Value و P-Value
احتمال اینکه مقدار T-value (چه در جهت مثبت و چه در جهت منفی) مقدار بزرگی شود خیلی کم است. یعنی آنکه هر چه از مقدار صفر در هر دو جهت دور می شویم احتمال رخداد چنین وضعیتی به صورت طبیعی کاهش می یابد. به عنوان مثال ناحیه قرمز مشخص شده در منحی فوق احتمال اینکه مقدار T-Value برابر با ۲٫۸ و بیشتر از آن باشد را نشان میدهد. احتمال این امر ۰٫۰۰۵۷۱۲ محاسبه شده است که اگر آن را گرد کنیم برابر با ۰٫۰۰۶ می شود که به این مقدار P-Value گفته می شود.
به عبارت دیگر، احتمال به دست آوردن T-Value برابر با ۲٫۸ و یا بالاتر، زمانی که نمونه برداری از جمعیت یکسان (در مثال، یک جمعیت با میانگین ۵ در نظر گرفته شده)، حدود ۰٫۰۰۶ است.
چقدر احتمال این رخ داد وجود دارد؟ این رخداد مثل آن است که در برداشت تصادفی از ۵۲ برگ در بازی پوکر ۲ برگ تک پشت سر هم به دست شما برسد. شناس چنین رخدادی بسیار کم است!!
این امر که این نمونه از جامعهی با میانگین بیشتری از مقدار مشخص شده (در این مثال ۵) باشند، محتمل تر است. بعبارت دیگر: از آنجا که مقدار P-value بسیار کوچک تر از (< alpha level) است، شما فرض صفر رد و نتیجه گیری است که تفاوت معنی داری وجود دارد.
مقادیر T و P به طور جدایی ناپذیری مرتبط هستند و به سادگی میتوانید از آنها برای تصمیم در خصوص درست یا نادرست بودن یک فرض استفاده کنید. مقدار یکی از آنها بدون تغییر در دیگری، تغییر نخواهد کرد. مقادیر بزرگتر قدرمطلق T-Value منجر به مقادیر کوچکتر P-value میشود که امر سبب کاهش احتمال پذیرش فرض صفر میشود. به طور معمول مطالعات آماری در سطح اطمینان ۹۵% (یعنی آلفای برابر با ۰٫۰۵) انچام میشود
در سطح اطمینان ۹۵% اگر P-value کوچکتر از ۰٫۰۵ باشد فرض صفر را رد میکنند و در غیر این صورت فرض صفر را میپذیرند.
در پایان این نکته قابل ذکر است که در برخی از نرم افزارها مانند spss مقدار p-value در جدول های خروجی نرم افزار تحت عنوان Significant Level ذکر میشود.
هماهنگی برای برگزاری دوره آموزشی تجزیه و تحلیلهای آماری
جهت هماهنگی برای برگزاری دوره ” تجزیه و تحلیلهای آماری” میتوانید با ما تماسبگیرید.
عالی بود ممنونم کلی سوال بی جواب داشتم که شما کمک کردید
یعنی اینهمه آمار به خوردمون دادن یه طرف این توضیح یه طرف
ممنونم از توضیحات خوب شما
خیلی خوب بود توضیحاتتونن , من واسه کنکور ارشد دانشگاه علامه مصاحبه دعوت شدم این مطالب برام خیلی مفید بود.
ببخشید توspss از کجا باید p-valueرو وارد کنیم ؟
واقعا ممنون…. قبل ار توضیح زیبای شما دقیقا من همون احساس الیس در سرزمین عجایب رو داشتم
خارج از کشور واحد امار دارم . خیلی از مطالب به زبان انگلیسی نامانوس اند . پدرم درامده .یه منبع فارسی که همه مطالب اماری باشه معرفی کنید لطفا . نرم افزار آماری مون R cmander
ممنون از تفهیم p value
سلام.خسته نباشید ببخشید یه سوال داشتم .مقادیر T که در جدول رگرسیون چند متغیری به روش همزمان وجود داره رو باید با چی مقایسه کرد که متوجه رد فرض صفر یا قبول اون بشیم. البته ستون کنارش P هست ولی من میخوام از طریق T متوجه بشم نتیجه چی میشه وو اینکه یه سال دیگه اینکه قاعدتا این T با آزمون T student که برای مقایسه میانگینها هست فرق داره؟ یه سوال دیگه اینکه مقدار F در جدول تحلیل واریانس جهت ازمون معناداری مدل ارائه شده چجوری تحلیل میشه؟ با چی مقایسه میشه؟ وو چی ازش متوجه می شیم ممنون
ممنون. بعد از مدتها این قضیه به صورت اصولی در ذهن من جا افتاد
با تشکر از اطلاعات خوبتون .ممنون میشم بفرمایید اندازه عددP – VALUE در نمودار SPC چقدر باید باشد
زیر ۰٫۰۵ یا بالای ۰٫۰۵ اوکی میباشد.
با سلام و احترام
سئوال شما شفاف نیست.