مديریت كیفیت در مراكز آزمایشگاهی

آشنایی با آنالیز واریانس (ANOVA) و F-test برای انجام مقایسات بین آزمایشگاهی

اشتراک گذاری
  • ۳
    Shares

در تجزیه و تحلیل مقایسات بین آزمایشگاهی و مطالعات درون آزمایشگاهی هنگامی‌ که می‌خواهیم نتایج بیش از سه گروه مختلف (سه آزمایشگاه متفاوت و یا سه تکنسین متفاوت در یک آزمایشگاه) را به یکدیگر مقایسه کنیم، از روش آنالیز واریانس (ANOVA) استفاده می‌شود. روش ANOVA از F-test برای آزمون آماری برابری میانگین‌ها استفاده می‌کند. در این پست، با استفاده از یک مثال برای آنالیز واریانس یک طرفه نشان داده خواهد شد که چگونه ANOVA و F-test را می‌توان برای انجام مقایسات مورد استفاده قرارداد.

اما یک دقیقه صبر کنید … آیا تا کنون توجه کرده‌اید که چرا می‌خواهید از یک آنالیز واریانس برای تعیین اینکه آیا میانگین‌ها متفاوت هستند، استفاده کنید؟

در این پست همچنین نشان داده خواهد شد که چگونه واریانس اطلاعاتی را در مورد میانگین‌ها فراهم می‌کند. همانطور که در پست آشنایی با  t-tests  بجای معادله‌ها بر روی مفهوم و نمودارها تمرکز شد  در این پست نیز بر روی مفهوم آنالیز واریانس تمرکز می‌شود.

آماره F و آزمون F‌ چیست؟

F-tests و آماره آزمون آن، “F-statistic”، به افتخار رونالد فیشر نامگذاری شد. آماره F نسبت دو واریانس است. واریانس یک شاخص برای اندازه‌گیری میزان پراکندگی است، که نشان می‌دهد تا چه اندازه داده‌ها از میانگین پراکنده شده است. مقادیر بزرگتر واریانس نشان دهنده پراکندگی بیشتر است.

واریانس مربع انحراف استاندارد است. در بسیاری از علوم، استفاده از انحراف استاندارد بجایی واریانس  رایج‌تر است، چرا که انحراف استاندارد هم واحد با داده‌های اندازه‌گیری شده است ولی واریانس پرداکندگی را برحسب مربع واحد داده‌های اندازه گیری شده، نشان می‌دهد. با این حال در بسیار از تجزیه و تحلیل‌های واقعی از واریانس برای انجام محاسبات استفاده می‌کنند.

 آماره F بر اساس به نسبت میانگین مربعات است. اصطلاح “میانگین مربعات” ممکن است گیج کننده باشد اما “میانگین مربعات”به سادگی برآورد واریانس جمعیت است که در آن درجات آزادی (DF) برای محاسبه و برآورد مورد استفاده قرار گرفته است. با این حال، با تغییر واریانس که شامل نسبت است، آزمون F یک آزمون بسیار انعطاف پذیر می‌شود.

با وجود یک نسبت واریانس، می‌توان آزمون F را در طیف گسترده ای از موقعیت‌ها استفاده نمود. جای تعجب نیست که آزمون F می‌تواند برابری واریانس را ارزیابی کند. به عنوان مثال می‌توان از آماره F و  F-tests برای آزمون وجود تفاوت معنادار در مدل های رگرسیونی (مقایسه برازش‌ها در مدل‌های مختلف)، تعیین ضرایب در معادلات رگرسیونی مختلف، و یا برابری میانگین‌ها استفاده کرد.
 

استفاده از آزمون F در آنالیز واریانس یک طرفه

برای استفاده از آزمون F برای تعیین اینکه آیا میانگین‌ها گروه‌ها مختلف با هم برابر هستند، در آنالیز واریانس یک طرفه، از آماره F به صورت زیر استفاده می‌شود: 

F = تغییر پذیری بین میانگین نمونه‌ها تقسیم بر تغییر پذیری درون نمونه‌ها
F = variation between sample means / variation within the samples
 

بهترین راه برای درک نسبت فوق در آزمون واریانس یک طرفه استفاده از یک مثال برای تشریح آن است.

مثال: استحکام کششی یک نمونه پلاستیکی توسط چهار آزمایشگاه مختلف مورد آزمون قرار گرفته است. داده‌های مربوط به این مثال از لینک (دانلود مثال استحکام کششی) قابل دانلود است. برای مشاهده و تجزیه و تحلیل داده های مربوط به این مثال لازم است نرم افزار MINItab 17.3.1 را بر روی سیستم خود نصب کنید.

نرم افزار MINITAB 17.3.1 ‌از لینک زیر قابل دانلود است.

دانلود نرم افزار Minitab 18.1 

پسورد فایل فشرده : dastmardi.ir

برای توضیح مفاهیم مربوط به آنالیز واریانس ما از خروجی این نرم افزار استفاده می‌کنیم. پس از نصب نرم افزار و دانلود مثال، برای تجزیه و تحلیل نتایج در نرم افزار MINITAB‌ مسیر زیر را دنبال کنید:

Stat > ANOVA > One-Way ANOVA… 

In the dialog box, choose “Strength” as the response, and “Sample” as the factor

Press Ok

 

نرم افزار MINITAB‌ در پنجره Session خروجی زیر را نشان می‌دهد:

۱way_swo

صورت کسر: تغیرپذیری بین میانگین آزمایشگاه‌ها

آنالیز واریانس یک طرفه میانگین نتایج آزمون هر یک از چهار آزمایشگاه را به صورت مجزا محاسبه می‌شود. در مثال ارائه شده میاگین نتایج هر کدام از آزمایشگاه‌ها به ترتیب عبارتند از:  ۱۱٫۲۰۳, ۸٫۹۳۸, ۱۰٫۶۸۳ و  ۸٫۸۳۸٫

این میانگین‌های آزمایشگاه‌ها در اطراف میانگین کل برای همه ۴۰ مشاهدات که برابر با ۹٫۹۱۵ می‌باشد، توزیع شده است. اگر میانگین‌های نتایج آزمایشگاه‌ها  نزدیک به میانگین کل باشند، واریانس آنها کم است و اگر میانگین‌ها آزمایشگاه‌ها فاصله بیشتری از میانگین کل داشته باشد، واریانس آنها بیشتر است.

واضح است که اگر قرار است که نشان داده شود که میانگین‌ها آزمایشگاه‌ها یکسان هستند، در صورتی که میانگین‌ها به یکدیگر نزدیکتر باشند، به این امر کمک خواهند کرد. در این شرایط تغیرپذیری کمتر بین میانگین‌ها نتایج آزمایشگاه ها مطلوب خواهد بود.

تصور کنید که دو آنالیز واریانس یک طرفه مختلف که در آن هر آنالیز چهار گروه دارد، انجام شده است. نمودار زیر پراکندگی میانگین‌ها را نشان می دهد. هر نقطه نشان‌دهنده میانگین نتایج یک گروه است. پراکندگی بیشتر در میانگین نتایج هر گروه، سبب پراکندگی بیشتر در صورت کسر آماره F می‌شود.

group_means_dot_plot

چه مقدار برای اندازه گیری واریانس بین آزمایشگاه‌ها برای مثال استحکام کششی یک نمونه پلاستیکی بدست می‌آید؟

در خروجی آنالیز واریانس یک طرفه، (ADJ MS) برای Factor که مقدار آن برابر با ۱۴٫۵۴۰ برای اندازه گیری واریانس بین آزمایشگاه‌ها استفاده می‌شود. هیچ گاه سعی نشود برای این مقدار تفسیری را بیان گردد، این عدد (۱۴٫۵۴۰) مجموع مجذور انحرافات تقسیم بر درجه آزادی فاکتورها می‌باشد. فقط در نظر داشته باشید که هر چه میانگین نتایج آزمایشگاه ها بیشتر از هم دوره باشند، این مقدار بزرگتر است.

مخرج کسر: تغییرپذیری درون آزمایشگاهی

پس تخمین صورت کسر آماره F، نیاز به یک تخمین از تغییرپذیری در هر آزمایشگاه برای تعیین مخرج آماره F‌ وجود دارد. برای محاسبه این تخمین (واریانس)، نیاز به محاسبه اینکه هر مشاهد از میانگین نتایج آزمایشگاه خود چقدر فاصله دارد برای کل ۴۰ مشاهده وجود دارذ. به طور فنی، مقدار آن برابر با مجموع مجذور انحراف از هر مشاهده از میانگین نتایج آن آزمایشگاه تقسیم بر خطا درجه آزادی (DF) است.

اگر مشاهدات هر یک از آزمایشگاه نزدیک به میانگین نتایج آزمایشگاه خود هستند، واریانس درون آزمایشگاهی کم است. با این حال، اگر مشاهدات برای هر آزمایشگاه از مقدار میانگین برای آن آزمایشگاه فاصله زیادی داشته باشد، واریانس درون آزمایشگاهی مقدار بزرگی خواهد شد.

within_group_dplot

در نمودار فوق گراف سمت چپ تغییرپذیری کم درون آزمایشگاهی را نشان می‌دهد و گراف سمت راست تغییرپذیری زیاد درون آزمایشگاهی را نشان می‌دهد تغییرپذیری زیاد درون آزمایشگاهی سبب بزرگ شدن مخرج کسر در آماره F می‌شود. اگر علاقه مند به نشان دادن یکسان بودن میانگین‌های بدست آمده در آزمایشگاه‌های مختلف باشیم، زمانی که واریانس درون آزمایشگاهی زیاد است، برای ما مطلوب خواهد بود.

 برای این مثال آنالیز واریانس یک طرفه، تغییرپذیری درون آزمایشگاهی Adj MS برای Error خواهد بود که مقدار عددی آن برابر با ۴٫۴۰۲ است.  آن در نظر گرفته شده به عنوان “Error” چون این تغییرپذیری ناشی از فاکتورها (آزمایشگاه‌ها) نیست.

آماره F : تغییرپذیری بین آزمایشگاهی تقسیم بر تغییرپذیری درون آزمایشگاهی

از آماره F به عنوان آماره آزمون برای F-tests است. به طور کلی، آماره F نسبت دو مقدار تشریح شده در صورت و مخرج کسر است. در ادامه برای انجام تجزیه و تحلیل می‌توان آزمون‌های فرض زیر را تعریف کرد:

فرض ۰: میانگین نتایج آزمایشگاه‌ها تفاوت معنادار آماری با یکدیگر ندارد.

فرض ۱: میانگین نتایج آزمایشگاه‌ها تفاوت معنادار آماری با یکدیگر دارد.

که در آزمون فوق برای فرض صفر انتظار می‌رود این مقدار برای نسبت تغییرپذیری بین آزمایشگاهی تقسیم بر تغییرپذیری درون آزمایشگاهی برابر “۱” باشد و برای فرض یک انتظار می‌رود این مقدار نسبت مخالف “۱” باشد.

 آماره F ترکیبی از نسبت تغییرپذیری بین آزمایشگاهی و درون آزمایشگاهی است. باید بررسی شود که تغییرپذیری بین آزمایشگاهی و درون آزمایشگاهی چگونه بر روی مقدار آماره F‌ تاثیر می‌گذارد. به نمودار زیر نگاه کنید و پهنای پراکندگی میانگین آزمایشگاه‌ها را با پهنای پراکندگی نتایج درون هر آزمایشگاه مقایسه کنید.

high_f_dplot low_f_dplot

در نمودار سمت چپ که در آن برای آماره F مقدار پایین بدست آمده است، میانگین نتایج آزمایشگاه‌ها نزدیک به هم هستند یعنی آنکه تغییرپذیری بین آزمایشگاهی نسبت به تغییر پذیری درون آزمایشگاهی عدد کوچکی می‌شود.

در نمودار سمت راست که در آن برای آماره F مقدار بزرگی بدست آمده است، میانگین نتایج آزمایشگاه‌ها با هم فاصله زیادی دارند یعنی آنکه تغییرپذیری بین آزمایشگاهی نسبت به تغییر پذیری درون آزمایشگاهی عدد بزرگی شده است. برای پذیرش یا عدم پذیرش فرض صفر (یکسان بودن میانگین نتایج آزمایشگاه‌ها)‌ نیاز به مقدار بحرانی برای آماره F‌ وجود دارد.

در این مثال برای تجزیه و تحلیل نتایج مقایسات بین آزمایشگاهی تغییر پذیری بین آزمایشگاهی (Factor Adj MS) برای صورت کسر برابر با ۱۴٫۵۴۰ و تغییر پذیری درون آزمایشگاهی  (Error Adj MS) برای مخرج کسر برابر با ۴٫۴۰۲ شده است، که مقدار F برابر با ۳٫۳۰ را می دهد.

اینک سئوالی که پیش می‌آید آن است که “آیا مقدار F ما به اندازه بزرگ است که نتیجه گیری شود نتایج آزمایشگاه‌های مختلف، تفاوت معنادار آماری دارند؟” برای پاسخگویی به این پرسش می‌توان از جداول آماری یا از محاسبه احتمالات توزیع F می‌توان استفاده نمود.

توزیع F و آزمون فرض آماری

برای آنالیز واریانس یک طرفه، نسبت تغییرپذیری بین آزمایشگاهی و تغییرپذیری درون آزمایشگاهی همگامی فرض صفر درست است از تابع توزیع F‌ پیروی می کند.

هنگامی که انجام آنالیز واریانس یک طرفه برای مطالعه، یک مقدار F به دست می‌آید. با این حال، اگر ما چندین نمونه های تصادفی با سایز یکسان از جمعیت یکسان برداشته شود آنالیز واریانس یک طرفه ANOVA انجام شود، مقادیر متفاوتی از F‌ بدست می‌آید و می‌توان توزیع همه آنها را رسم نمود. این نوع از توزیع به عنوان یک توزیع نمونه شناخته شده است.

از آنجا که در توزیع F فرض می شود که فرضیه صفر درست است، می‌توان احتمال درست بودن فرض صفر را از تابع توزیع F محاسبه نمود. اگر احتمال درست بودن فرض صفر کم باشد، می توان نتیجه گیری نمود که شواهدی کافی برای رد فرض صفر وجود دارد. احتمال درستی فرض صفر را بنام p-value می‌شناسند.

f_distribution_probability

اگر فرضیه صفر درست باشد و ما مطالعه خودمان را چندین بار تکرار کنیم نمودار فوق برای توزیع مقادیر F بدست خواهد آمد. ناحیه قرمز رنگ احتمال مشاهده یک مقدار برای F‌ که  بزرگتر از F‌ بدست آمده برای مثال (۳٫۳) را نشان می‌دهد. مقدار احتمال بدست آمده برای F‌ در ناحیه قرمز رنگ ۳٫۱% است. این مقدار به اندازه کافی کوچک است که بتوان فرض صفر را در سطح معناداری ۰٫۰۵ (سطح اطمینان ۹۵%) رد کرد. لذا می‌توان نتیجه گرفت که میانگین نتایج آزمایشگاه‌های مختلف با هم یکسان نیست و از نظر آماری تفاوت معناداری دارند.

بررسی میانگین‌ها به وسیله آنالیز تغییرپذیری

 آنالیز واریانس ANOVA از آزمون F برای تعیین اینکه آیا تغییرپذیری بین آزمایشگاهی بزرگتر از تغییرپذیری درون آزمایشگاهی است، استفاده می‌کند. در صورتی که این نسبت به اندازه کافی بزرگ باشد،  می‌توان نتیجه گیری کرد که میانگین نتایج همه آزمایشگاه‌ها با هم یکسان نیستند.

هماهنگی برای برگزاری دوره آموزشی تجزیه و تحلیل نتایج مقایسات بین آزمایشگاهی
جهت هماهنگی برای برگزاری دوره‌ ” آشنایی با روشهای آماری در مقایسات بین آزمایشگاهی” می‌توانید با ما تماس بگیرید.

یک دیدگاه در نوشته‌ی “آشنایی با آنالیز واریانس (ANOVA) و F-test برای انجام مقایسات بین آزمایشگاهی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *