مقادیر T-Value و P-Value در آزمون‌های فرض آماری چیست؟

اشتراک گذاری

tweedle_tweedledumدر بسیاری از مراکز آزمایشگاهی از آزمون‌های فرض آماری برای تضمین کیفیت نتایج آزمون و یا صحه‌گذاری روش‌های آزمون استفاده می‌شود. اگر کارکنان آزمایشگاه و یا پژوهشگران با علم آمار آشنایی نداشته باشند و به دنبال استفاده از از نرم افزارهای آماری مانند minitab, spss و … برای تجزیه و تحلیل نتایج خود باشند، در مواجه با خروجی‌های این نرم افزارها احساسی شبیه احساس آلیس در سرزمین عجایب را پیدا خواهند کرد. ناگهان آنها با یک دنیا فانتزی که در آن عبارات عجیب و مرموزی وجود دارد، روبه رو می‌شوند.

به عنوان مثال ظهور مقادیر T و P را در انجام آزمون فرض t-test را در نظر بگیرید. در مشاهد این خروجی شما ممکن است بسیار متعجب شوید!!

t_test_results_one_sided

این مقادیر واقعاً چیست؟ آنها از کجا بدست آمده‌اند؟ حتی اگر شما از مقدار P-value برای تفسیر آماری نتایج خود به دفعات بسیار زیاد استفاده کرده باشید، باز هم ممکن است منشا واقعی آن ممکن هنوز برای شما گنگ باشد.

T & P: در آزمون t-test خیلی مشابه هم هستند.

T و P به طور جدایی ناپذیری با هم مرتبط است. آنها به صورت خیلی مشابه در کنار هم نتایج تجزیه و تحلیل آماری ظاهر می‌شوند.

هنگامی که شما آزمون t-test را انجام می‌دهید، معمولا برای پیدا کردن شواهدی از یک اختلاف معنی داری در میان دو جمعیت (۲-sample t) و یا بین یک جمعیت مقدار هدف (۱-sample t) هستید. به عنوان مثال در مقایسه بین آزمایشگاهی به دنبال آن هستیم که ببینم نتایج بدست آمده در دو آزمایشگاه مختلف بر روی یک نمونه یکسان بایکدیگر اختلاف معناداری دارند یا نه؟

مقدار t اندازه تفاوت را نسبت به تغییرپذیری بدست آمده از نمونه‌ها را می‌سنجد. به عبارت دیگر، T برابر با تفاوت محاسبه شده تقسیم بر خطای استاندارد (SE MEAN) است. هر چه مقدار T (چه در جهت مثبت و چه در جهت منفی) بزرگتر باشد احتمال بیشتری برای رد فرض صفر به وجود خواهد آمد  و هر چه مقدار T به صفر نزدیکتر باشد احتمال بیشتری برای پذیرش فرض صفر وجود خواهد داشت. (فرض صفر یعنی تفاوت معنی‌داری وجود ندارد.)

بخاطر داشته باشید که مقدار t که در خروجی نرم افزار نشان داده شده است بر اساس تنها یک نمونه که به صورت تصادفی از کل جمعیت گرفته شده، محاسبه می گردد و اگر نمونه‌برداری تصادفی را مجدداً انجام دهید ممکن است مقدار  t کمی متفاوت از آنچه قبلا محاسبه کرده‌اید، بدست آید. حال این سئوال مطرح می‌شود که در بسیاری از نمونه های که به صورت تصادفی از یک جمعیت یکسان گرفته می‌شود، چقدر تفاوت در مقدار t انتظار داریم که به وجود آید؟ و چگونه مقدار t بدست آمده از داده های مربوط به نمونه خود را نسبت به مقدار t مورد انتظار مقایسه کنیم؟ این کار را می‌توان با رسم یک توزیع t انجام داد.

استفاده از یک تابع توزیع t برای محاسبه احتمال

به عنوان مثال فرض کنید که با استفاده از یک آزمون فرض ۱-sample t-test  می خواهید تعیین کنید که یک ویژگی در جمعیت مورد مطالعه بزرگتر از یک مقدار مشخص می‌باشد یا خیر؟

در این مثال مقدار مشخص ۵ در نظر گرفته شده که از یک نمونه با ۲۰ مشاهده بدست آمده است. همانطور که در شکل بالا نشان داده شده مقدار t‌ در خروجی نرم افزار minitab برابر با ۲٫۸ بدست آمده است. لذا می‌خواهیم ببینم در یک تابع توزیع T با درجه آزادی ۱۹ (درجه آزادی برابر است با تعداد مشاهدات منهای یک) احتمال آنکه مقدار t‌ برابر با ۲٫۸ شود چقدر است. برای انجام این کار از نرم افزار minitab ‌می توان استفاده نمود بدین منظور در این نرم افزار  مسیر زیر را طی می کنیم:

In Minitab, choose Graph > Probability Distribution Plot.

Select View Probability, then click OK.

From Distribution, select t.

In Degrees of freedom, enter ۱۹.

Click Shaded Area. Select X Value. Select Right Tail.

 In X Value, enter 2.8 (the t-value), then click OK.

distribution_plot_t

بیشترین مقدار مورد انتظار برای t محلی است که قله گراف بالا قرار دارد (یعنی مقدار صفر).  این بدان معنا است که در بیشتر واقع انتظار می‌رود که مقدار t=0 شود. علت این امر آن است که وقتی یک نمونه به صورت تصادفی از یک جامعه برداشته می شود انتظار می رود که اختلافی بین میانگین نمونه با میانگین جامعه وجود نداشته باشد یعنی به احتمال زیاد اختلاف بین میانگین نمونه و میانگین جامعه نزدیک به صفر است.

مقادیر T-Value و P-Value

احتمال اینکه مقدار T-value (چه در جهت مثبت و چه در جهت منفی) مقدار بزرگی شود خیلی کم است. یعنی آنکه هر چه از مقدار صفر در هر دو جهت دور می شویم احتمال رخداد چنین وضعیتی به صورت طبیعی کاهش می یابد. به عنوان مثال ناحیه قرمز مشخص شده در منحی فوق احتمال اینکه مقدار T-Value برابر با ۲٫۸  و بیشتر از آن باشد را نشان می‌دهد. احتمال این امر  ۰٫۰۰۵۷۱۲ محاسبه شده است که اگر آن را گرد کنیم برابر با ۰٫۰۰۶ می شود که به این مقدار P-Value گفته می شود.

به عبارت دیگر، احتمال به دست آوردن T-Value برابر با ۲٫۸ و یا بالاتر، زمانی که نمونه برداری از جمعیت یکسان (در مثال، یک جمعیت با میانگین ۵ در نظر گرفته شده)، حدود ۰٫۰۰۶ است.

چقدر احتمال این رخ داد وجود دارد؟ این رخداد مثل آن است که در برداشت تصادفی از ۵۲ برگ در بازی پوکر ۲ برگ تک پشت سر هم به دست شما برسد. شناس چنین رخدادی بسیار کم است!!

poker_picture

این امر که این نمونه‌ از جامعه‌ی با میانگین بیشتری از مقدار مشخص شده (در این مثال ۵) باشند، محتمل تر است.  بعبارت دیگر: از آنجا که مقدار P-value بسیار کوچک تر از (< alpha level)  است، شما فرض صفر رد و نتیجه گیری است که تفاوت معنی داری وجود دارد.

مقادیر T و P به طور جدایی ناپذیری مرتبط هستند و به سادگی می‌توانید از آنها برای تصمیم در خصوص درست یا نادرست بودن یک فرض استفاده کنید. مقدار یکی از آنها بدون تغییر در دیگری، تغییر نخواهد کرد. مقادیر بزرگتر قدرمطلق T-Value منجر به مقادیر کوچکتر P-value می‌شود که امر سبب کاهش احتمال پذیرش فرض صفر می‌شود. به طور  معمول مطالعات آماری در سطح اطمینان ۹۵% (یعنی آلفای برابر با ۰٫۰۵) انچام می‌شود

در سطح اطمینان ۹۵% اگر P-value  کوچکتر از ۰٫۰۵ باشد فرض صفر را رد می‌کنند و در غیر این صورت فرض صفر را می‌پذیرند. 

در پایان این نکته قابل ذکر است که در برخی از نرم افزارها مانند spss مقدار p-value در جدول های خروجی نرم افزار تحت عنوان Significant Level ذکر می‌شود.

 

هماهنگی برای برگزاری دوره‌ آموزشی تجزیه و تحلیل‌های آماری
جهت هماهنگی برای برگزاری دوره‌ ” تجزیه و تحلیل‌های آماری” می‌توانید با ما تماسبگیرید.

dastmardi

اين سایت با هدف اشاعه مفاهیم مدیریت كیفیت در زمینه ارائه خدمات آزمايشگاهی و ترويج استانداردهای رایج در اين خصوص نظیر ISO/IEC 17025, ISO 15189 ایجاد شده است. خوانندگان عزيز، سعي می شود در این سایت اطلاعات تخصصی و بروز در زمینه‌های سيستم‌های مدیریت كیفیت در مراكز آزمايشگاهی، استانداردهای بین‌المللی ارائه خدمات آزمايشگاهی، ارزيابی و محاسبه عدم قطعیت اندازه گیری، نمونه‌برداری پذيرشی، كالیبراسیون تجهیزات اندازه‌گیری، طراحی آزمایش‌ها، اعتباربخشی روش‌های آزمون و تضمین كیفیت نتایج آزمون ارائه شود. اميدوارم با همكاري شما عزيزان و علاقه‌مندان، يك پايگاه اطلاعاتي مفيد و معتبر براي علاقمندان بحت مديريت كيفيت در مراكز آزمايشگاهي در ايران ايجاد شود. لذا از ارسال نظرات ، پيشنهادات و مطالب علمي و فني خود دريغ نكرده و به غني‌تر كردن اين سایت براي استفاده كارشناسان و علاقمندان كمك نماييد. بديهي است مطالب و نظرات به اسم ارسال كننده درج خواهد شد.

۱۲ دیدگاه‌

  1. فاطمه گفت:

    عالی بود ممنونم کلی سوال بی جواب داشتم که شما کمک کردید

  2. فرهاد گفت:

    یعنی اینهمه آمار به خوردمون دادن یه طرف این توضیح یه طرف
    ممنونم از توضیحات خوب شما

  3. میترا گفت:

    خیلی خوب بود توضیحاتتونن , من واسه کنکور ارشد دانشگاه علامه مصاحبه دعوت شدم این مطالب برام خیلی مفید بود.

  4. Solmaz گفت:

    ببخشید توspss از کجا باید p-valueرو وارد کنیم ؟

  5. sasan گفت:

    واقعا ممنون…. قبل ار توضیح زیبای شما دقیقا من همون احساس الیس در سرزمین عجایب رو داشتم

  6. Aysu گفت:

    خارج از کشور واحد امار دارم . خیلی از مطالب به زبان انگلیسی نامانوس اند . پدرم درامده .یه منبع فارسی که همه مطالب اماری باشه معرفی کنید لطفا . نرم افزار آماری مون R cmander

    ممنون از تفهیم p value

  7. المیرا علوی گفت:

    سلام.خسته نباشید ببخشید یه سوال داشتم .مقادیر T که در جدول رگرسیون چند متغیری به روش همزمان وجود داره رو باید با چی مقایسه کرد که متوجه رد فرض صفر یا قبول اون بشیم. البته ستون کنارش P هست ولی من میخوام از طریق T متوجه بشم نتیجه چی میشه وو اینکه یه سال دیگه اینکه قاعدتا این T با آزمون T student که برای مقایسه میانگینها هست فرق داره؟ یه سوال دیگه اینکه مقدار F در جدول تحلیل واریانس جهت ازمون معناداری مدل ارائه شده چجوری تحلیل میشه؟ با چی مقایسه میشه؟ وو چی ازش متوجه می شیم ممنون

  8. سعید گفت:

    ممنون. بعد از مدتها این قضیه به صورت اصولی در ذهن من جا افتاد

  9. محمد خوش شعار گفت:

    با تشکر از اطلاعات خوبتون .ممنون میشم بفرمایید اندازه عددP – VALUE در نمودار SPC چقدر باید باشد
    زیر ۰٫۰۵ یا بالای ۰٫۰۵ اوکی میباشد.

  10. ارجمندي گفت:

    اگر در تحلیل تی تک نمونه ای ضرائب تی منفی شود چگونه باید انرا تفسیر کرد?
    اگر در تی تک نمونه ای نتایج تی معنی دار شود ، اما میانگین ها کمتر از سه باشد، این تناقض را چگونه می توان توجیه وَیَا برطرف کرد

    • dastmardi گفت:

      با سلام و احترام

      منفی شدن مقدار آمار تی مشکل ایجاد نمی کند اگر مقدار میانگین جامعه اول کوچکتر از جامعه دوم باشد مقدار آماره تی منفی می شود.
      قسمت دوم سئوال شما شفاف نیست.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *