تفاوت بین فواصل اطمینان، پیشبینی و رواداری چیست؟

Tolerance Intervals 3

۱- مقدمه بر فواصل اطمینان، پیشبینی و رواداری

همانطور که در زندگی، یقین مطلق به ندرت اتفاق می‌افتد، در آمار نیز نمی‌توان نتایج خاصی را با یقین کامل بیان نمود. در عوض نتایج تجزیه و تحلیل‌های آماری در یک بازه ارائه می‌شوند که مقدار واقعی پارامترهای مورد بررسی با یک احتمال مشخص (معمولاً ۹۵%) در آن بازه قرار دارد.

بسیاری از افراد با “فواصل اطمینان (confidence intervals)” آشنا می‌باشند، اما این فاصله فقط  یکی از چندین نوع فواصلی است که می‌توان برای توصیف نتایج یک تجزیه و تحلیل آماری از آن استفاده نمود. گاهی اوقات برای بیان نتایج تجزیه و تحلیل‌های آماری استفاده از فاصله اطمینان بهترین گزینه نمی‌باشد. بر این اساس در این پست به بررسی ویژگی‌های برخی از فواصل دیگر نظیر “فواصل پیش‌بینی (Prediction Intervals)” و “فواصل رواداری (Tolerance Intervals)”  پرداخته می‌شود. مشخص می‌شود که برای انجام چه کارهای باید از هر یک از این فواصل استفاده نمود.

۲- مرور اجمالی بر فواصل اطمینان (confidence intervals)

فاصله اطمینان به گستره‌ای از مقادیر که شامل مقدار یک پارامتر (مانند میانگین) از یک جامعه ناشناخته، بر اساس داده‌های نمونه‌گیری شده از آن جمعیت است، اطلاق می‌شود. دو نمونه از یک جامعه که به صورت تصادفی برداشته شده‌اند، بعید است فواصل اطمینان یکسان داشته‌ باشند. اگر از یک جامعه چندین بار نمونه‌برداری شود، درصد معینی از این فواصل اطمینان شامل پارامتر مورد بررسی برای جامعه ناشناخته خواهد بود. به درصد این فواصل اطمینان که شامل پارامتر مورد نظر است، “سطح اطمینان (confidence level)” آن فاصله گفته می‌شود.

ci 1

فواصل اطمینان معمولاً برای بیان پارامترهای مانند میانگین، میانه یا انحراف استاندارد جمعیت استفاده می‌شود اما محدود به این پارامترها نمی‌شود و می‌توان از آن برای نسبت‌ها، ضرایب رگرسیون، نرخ وقوع (پواسون) و برای تفاوت بین جامعه‌های مختلف در آزمون‌های فرض آماری نیز استفاده نمود.

ارائه یک مثال:

برای ارزیابی اینکه میانگین عمر لامپ تولید شده توسط یک شرکت چقدر است، شرکت تولید کننده از بین محصولات تولید شده خود ۱۰۰ نمونه را به صورت تصادفی انتخاب، مدت زمان عمر هر یک از این نمونه‌ها را مطابق با جدول زیر تعیین نموده است. (دانلود فایل مثال)

جدول شماره ۱: طول عمر ۱۰۰ نمونه لامپ که به صورت تصادفی انتخاب شده‌اند.

۱۲۱۶۱۱۳۱۱۱۶۱۱۱۸۷۱۲۱۰
۱۰۷۲۱۳۳۶۱۰۹۳۱۳۴۲۱۲۶۲
۱۲۳۱۱۱۶۰۱۱۳۵۱۳۴۷۱۲۳۹
۱۲۲۴۱۲۵۷۱۳۵۹۱۴۲۲۱۲۴۰
۱۱۴۵۱۳۳۰۱۱۸۴۱۱۶۶۱۳۵۹
۱۲۳۷۱۲۸۷۱۱۲۳۱۳۵۷۱۲۰۱
۱۱۴۲۱۱۵۶۱۳۱۹۱۲۳۶۱۳۲۰
۱۳۵۳۱۰۷۱۱۲۰۹۱۴۱۴۱۳۳۰
۱۰۴۴۱۲۷۱۱۱۵۰۱۲۴۴۱۲۰۰
۱۲۳۵۱۱۵۵۱۳۵۵۱۲۸۷۱۲۷۴
۱۱۱۵۱۲۷۴۱۲۴۰۱۱۳۰۱۲۵۶
۱۳۵۶۱۳۱۷۱۲۸۳۱۲۸۱۱۲۴۳
۱۲۵۶۱۱۵۰۱۲۲۴۱۲۴۸۱۲۶۸
۱۲۹۵۱۲۰۹۱۲۴۹۱۲۹۲۱۱۵۲
۱۲۴۴۱۳۱۵۱۲۶۷۱۲۲۵۱۲۰۴
۱۲۵۶۱۲۸۲۱۲۵۶۱۲۱۴۱۲۳۹
۱۲۶۴۱۲۷۷۱۳۴۱۱۲۲۸۱۲۶۴
۱۳۲۷۱۲۳۰۱۵۱۰۱۲۹۶۱۴۶۰
۱۳۷۱۱۳۰۰۱۲۵۷۱۲۹۶۱۱۰۸
۱۱۷۸۱۱۷۷۱۲۶۲۱۲۸۷۱۲۵۱

برای تعیین این میانگین طول عمر لامپ‌های تولید شده توسط این شرکت در سطح اطمینان ۹۵% چقدر است، می‌توان از نرم افزار Minitab استفاده نمود. (آخرین ویرایش نرم افزار Minitab ‌از لینک دانلود نرم افزار Minitab قابل دانلود کردن است)

برای انجام این کار در نرم افزار minitab مسیر زیر را طی خواهیم کرد.

Stat > Basic Statistics > Graphical Summary

در کادر محاوره‌ای باز شده مطابق شکل زیر ستونی را که در آن داده‌های مربوط به طول عمر هر یک از لامپ‌ها قرار دارد را وارد نموده و سپس دکمه ok‌ را انتخاب نمایید.تعیین فاصله اطمینان در نرم افزار minitab

پس از ok‌ کردن نرم افزار minitab‌ گرافی مشابه با گراف زیر ارائه خواهد داد. همانطور که در گراف نیز مشخص است، در سطح اطمینان ۹۵% با فاصله اطمینان برای میانگین عمر لامپ‌ها در بازه ۱۲۳۱ تا ۱۲۶۵ ساعت را بدست می‌آید، یعنی می‌توان با ۹۵٪ اطمینان گفت که میانگین جمعیت لامپ ها بین ۱۲۳۱و ۱۲۶۵ ساعت است.

Tolerance Intervals 3

در رابطه با پارامتر مورد بررسی، فواصل اطمینان تنها خطای نمونه‌گیری (خطای ذاتی در برآورد یک مشخصه از یک جامعه با استفاده از یک نمونه) را ارزیابی می‌کند و با افزایش تعداد نمونه‌ها خطای ناشی از نمونه‌گیری کاهش می‌یابد این امر منجر به فواصل اطمینان کوچکتر (با پنهای کمتر) می‌شود. اگر بتوان تمام جامعه را مورد آزمون قرار داد، فاصله اطمینان دارای پهنای صفر می‌شود: یعنی آنکه هیچگونه خطای ناشی از نمونه‌گیری وجود نخواهد داشت، زیرا برآورد پارامتر بر اساس کل جامعه به دست آمده است.

علاوه بر این، فواصل اطمینان تنها اطلاعاتی در مورد میانگین، انحراف استاندارد یا پارامتری دیگری که مورد بررسی قرار می‌گیرند، را ارائه می‌دهند. در مورد چگونگی توزیع مقادیر منفرد (تک تک مشاهدات) هیچ چیزی را ارائه نمی‌دهند. این بدان معنی است که فاصله اطمینان دارای محدودیت‌های مهمی است در این مثال، می‌توان ۹۵٪ اطمینان داشت که میانگین عمر لامپ‌های بین ۱۲۳۱ تا ۱۲۶۵ ساعت خواهد بود. اما فاصله اطمینان ۹۵٪ نشان نمی‌دهد که ۹۵٪ لامپ‌ها در بازه بین ۱۲۳۱ تا ۱۲۶۵ ساعت عمر خواهند کرد. برای رسیدن به نتیجه اینکه در چه بازه‌ای ۹۵% لامپ‌ها عمر خواهند کرد به یک بازه متفاوت از فاصله اطمینان نیاز است.

۳- مرور اجمالی بر فواصل پیش‌بینی (Prediction Intervals)

فاصله پیش‌بینی برای پیش‌بینی‌های حاصل از مدل‌های رگرسیون خطی و غیر خطی است. دو نوع فواصل پیش بینی وجود دارد.

۳-۱- فاصله اطمینان پیش‌بینی (confidence interval of the prediction)

با توجه به تنظیمات یا مقادیر مشخص شده برای پیش‌بینی کننده (متغیرهای مستقل) در یک مدل رگرسیونی، فاصله اطمینان پیش‌بینی یک گستره است که با احتمال مشخص شامل میانگین متغیر پاسخ می‌شود. مانند فواصل اطمینان، فاصله اطمینان پیش‌بینی نشان دهنده یک بازه برای میانگین است، نه توزیع نقاط داده‌های منفرد.

به عنوان نمونه برای مثال ارائه شده بالا (عمر لامپ) می‌توان بررسی کرد که چگونه تغییر دو متغیر مستقل “روش‌های مختلف تولید (آهسته یا سریع)” و یا “فیبرهای مورد استفاده در تولید لامپ  (A یا B) ” بر روی عمر لامپ‌ها تاثیرگذار است. پس از برازش یک مدل می‌توان از نرم افزار برای پیش‌بینی میانگین عمر لامپ تولید شده با استفاده از فیبر A و تحت روش تولید سریع استفاده نمود.

اگر فاصله اطمینان پیش‌بینی ۱۴۰۰ تا ۱۴۵۰ ساعت بدست آید، می‌توان ۹۵٪ اطمینان داشت که میانگین عمر لامپ‌های تولید شده در این شرایط در بازه ۱۴۰۰-۱۴۵۰ قرار می‌گیرد. با این حال، این بازه هیچ چیز در مورد چگونگی توزیع عمر لامپ‌ها به صورت منفرد ارائه نمی‌دهد.

۳-۲- فاصله پیش بینی (prediction interval)

فاصله پیش بینی یک گستره است که احتمالاً شامل مقدار پاسخ برای  یک مشاهد منفرد با توجه به تنظیمات مشخص شده (مثلاً تولید سریع با استفاده از فیبر A) برای پیش‌بینی کننده (متغیر مستقل) است. اگر به عنوان مثال نرم افزار Minitab  یک فاصله پیش‌بینی از ۱۳۵۰-۱۵۰۰ ساعت برای یک لامپ تولید شده در شرایط فوق را محاسبه نماید، می‌توان ۹۵٪ اطمینان داشت که طول عمر یک لامپ جدید تولید شده با آن تنظیمات مشخص شده در بازه ۱۳۵۰ تا ۱۵۰۰ ساعت خواهد بود.

همیشه “فاصله پیش‌بینی” برزگتر از “فاصله اطمینان پیش‌بینی” است زیرا عدم‌قطعیت بیشتر زمانی اتفاق می‌افتد که یک پاسخ واحد قرار است پیش‌بینی شود، نه یک میانگین  پاسخ‌ها.

۴- مرور اجمالی بر فواصل رواداری (tolerance intervals)

فواصل رواداری یک گستره است که با احتمال مشخصی شامل یک نسبت تعریف شده از یک جامعه می‌باشد. برای محاسبه فواصل رواداری باید نسبت جامعه و سطح اطمینان مورد نظر را تعیین نمود. برای درک بهتر این امر به مثال زیر را ملاحظه نمایید.

۴-۱- مثال برای فاصله رواداری

برای ارزیابی اینکه یک لامپ تولید شده توسط یک شرکت چقدر عمر می‌کند، شرکت تولید کننده از بین محصولات تولید شده خود ۱۰۰ نمونه را به صورت تصادفی انتخاب، مدت زمان عمر هر یک از این نمونه‌ها بدست آورده است نتایج مطابق با جدول شماره ۱ است. (دانلود فایل مثال)

برای محاسبه فواصل رواداری با استفاده از نرم افزار Minitab‌ از مسیر زیر استفاده می‌شود: 

Stat> Quality Tools> Tolerance IntervalsTolerance Intervals

پس از رفتن مسیر فوق داده‌ها مطابق با شکل زیر برای ستونی که داده‌های مربوط به طول عمر لامپ را در آن وارد شده، به نرم افزار معرفی می‌شود.

Tolerance Intervals 1

در نهایت دکمه ok‌ زده می‌شود. نرم افزار داده‌های وارد شده را تجزیه و تحلیل نموده و نتایج زیر را ارائه می‌دهد.

Tolerance Intervals 2 1

آزمون بررسی نرمال بودن داده‌ها (normality test) نشان می‌دهد که این داده‌ها از توزیع نرمال پیروی می‌کنند، بنابراین می‌توان از فاصله نرمال (۱۰۶۰تا ۱۴۳۵) استفاده کرد و نتیجه‌گیری نمود که ۹۵% از لامپ‌های تولید شده توسط این شرکت طول عمری بین ۱۰۶۰ تا ۱۴۳۵ ساعت دارند.

۵- چگونگی فاصله رواداری با فاصله اطمینان مقایسه می‌شود

همان طور که قبلاً ذکر شد، پهنای فاصله اطمینان به طور کامل به خطای نمونه‌گیری بستگی دارد. وقتی تعداد نمونه‌ها به کل جامعه نزدیکتر می‌شود، پهنای فاصله اطمینان کوچکتر می‌شود، تا زمانی تعداد نمونه با جامعه برابر شود پهنای این فاصله نزدیک به صفر می‌شود.

اما پهنای فاصله رواداری نه تنها به خطای نمونه‌گیری، بلکه به واریانس جامعه نیز بستگی است و وقتی تعداد نمونه‌ها به کل جامعه نزدیکتر می‌شود، خطای نمونه‌گیری کاهش می‌یابد و پرداکندگی بدست آمده، پراکندگی واقعی جامعه مورد مطالعه خواهد بود.

Minitab از مقادیر داده‌های برآورد شده را برای صدک‌های ۲٫۵ و ۹۷٫۵ (۹۵=۲٫۵-۹۷٫۵) برای تعیین فاصله ۹۵% استفاده می‌کند. البته، برای مثال فوق چون از یک نمونه استفاده شده است، بخشی از برآورد بدست آمده ناشی از خطای نمونه‌گیری خواهد بود. معمولاً فاصله رواداری را در سطح اطمینان مشخص (مثلاً ۹۵%) تعیین می‌کنند.

۶- چگونه از فواصل رواداری استفاده می‌شود

فواصل رواداری زمانی بسیار مفید هستند که قرار است پیش‌بینی طیف وسیعی از نتایج ممکن بر اساس داده‌های نمونه‌گیری انجام شود. در بهبود کیفیت، کارشناسان نیاز دارند بدانند خروجی فرآیند (مانند عمر یک لامپ) در چه محدوده‌ای قرار می‌گیرد. همچنین فاصله رواداری می‌تواند تغییری‌پذیری فرایند را تعیین نماید. یک فاصله رواداری بزرگ‌تر از الزامات مشتریان ممکن است نشان دهد که تغییرپذیری محصولات تولید شده، بیش از اندازه زیاد است و باید کیفیت محصولات تولید شده را برای کاهش ضایعات بهبود داد. با استفاده از نرم افزار Minitab‌ بازه رواداری را می‌توان به سادگی آنچه که تشریح شد، بدست آورد.

برگزاری دوره آموزشی تجزیه و تحلیل آماری نتایج:

برای برگزاری دوره آموزشی تجزیه و تحلیل آماری نتایج با استفاده از نرم افزار Minitab می‌توانید با ما تماس بگیرید.

2 دیدگاه

به گفتگوی ما بپیوندید و دیدگاه خود را با ما در میان بگذارید.

دیدگاهتان را بنویسید