تفاوت بین فواصل اطمینان، پیشبینی و رواداری چیست؟
۱- مقدمه بر فواصل اطمینان، پیشبینی و رواداری
همانطور که در زندگی، یقین مطلق به ندرت اتفاق میافتد، در آمار نیز نمیتوان نتایج خاصی را با یقین کامل بیان نمود. در عوض نتایج تجزیه و تحلیلهای آماری در یک بازه ارائه میشوند که مقدار واقعی پارامترهای مورد بررسی با یک احتمال مشخص (معمولاً ۹۵%) در آن بازه قرار دارد.
بسیاری از افراد با “فواصل اطمینان (confidence intervals)” آشنا میباشند، اما این فاصله فقط یکی از چندین نوع فواصلی است که میتوان برای توصیف نتایج یک تجزیه و تحلیل آماری از آن استفاده نمود. گاهی اوقات برای بیان نتایج تجزیه و تحلیلهای آماری استفاده از فاصله اطمینان بهترین گزینه نمیباشد. بر این اساس در این پست به بررسی ویژگیهای برخی از فواصل دیگر نظیر “فواصل پیشبینی (Prediction Intervals)” و “فواصل رواداری (Tolerance Intervals)” پرداخته میشود. مشخص میشود که برای انجام چه کارهای باید از هر یک از این فواصل استفاده نمود.
۲- مرور اجمالی بر فواصل اطمینان (confidence intervals)
فاصله اطمینان به گسترهای از مقادیر که شامل مقدار یک پارامتر (مانند میانگین) از یک جامعه ناشناخته، بر اساس دادههای نمونهگیری شده از آن جمعیت است، اطلاق میشود. دو نمونه از یک جامعه که به صورت تصادفی برداشته شدهاند، بعید است فواصل اطمینان یکسان داشته باشند. اگر از یک جامعه چندین بار نمونهبرداری شود، درصد معینی از این فواصل اطمینان شامل پارامتر مورد بررسی برای جامعه ناشناخته خواهد بود. به درصد این فواصل اطمینان که شامل پارامتر مورد نظر است، “سطح اطمینان (confidence level)” آن فاصله گفته میشود.
فواصل اطمینان معمولاً برای بیان پارامترهای مانند میانگین، میانه یا انحراف استاندارد جمعیت استفاده میشود اما محدود به این پارامترها نمیشود و میتوان از آن برای نسبتها، ضرایب رگرسیون، نرخ وقوع (پواسون) و برای تفاوت بین جامعههای مختلف در آزمونهای فرض آماری نیز استفاده نمود.
ارائه یک مثال:
برای ارزیابی اینکه میانگین عمر لامپ تولید شده توسط یک شرکت چقدر است، شرکت تولید کننده از بین محصولات تولید شده خود ۱۰۰ نمونه را به صورت تصادفی انتخاب، مدت زمان عمر هر یک از این نمونهها را مطابق با جدول زیر تعیین نموده است. (دانلود فایل مثال)
جدول شماره ۱: طول عمر ۱۰۰ نمونه لامپ که به صورت تصادفی انتخاب شدهاند.
۱۲۱۶ | ۱۱۳۱ | ۱۱۶۱ | ۱۱۸۷ | ۱۲۱۰ |
۱۰۷۲ | ۱۳۳۶ | ۱۰۹۳ | ۱۳۴۲ | ۱۲۶۲ |
۱۲۳۱ | ۱۱۶۰ | ۱۱۳۵ | ۱۳۴۷ | ۱۲۳۹ |
۱۲۲۴ | ۱۲۵۷ | ۱۳۵۹ | ۱۴۲۲ | ۱۲۴۰ |
۱۱۴۵ | ۱۳۳۰ | ۱۱۸۴ | ۱۱۶۶ | ۱۳۵۹ |
۱۲۳۷ | ۱۲۸۷ | ۱۱۲۳ | ۱۳۵۷ | ۱۲۰۱ |
۱۱۴۲ | ۱۱۵۶ | ۱۳۱۹ | ۱۲۳۶ | ۱۳۲۰ |
۱۳۵۳ | ۱۰۷۱ | ۱۲۰۹ | ۱۴۱۴ | ۱۳۳۰ |
۱۰۴۴ | ۱۲۷۱ | ۱۱۵۰ | ۱۲۴۴ | ۱۲۰۰ |
۱۲۳۵ | ۱۱۵۵ | ۱۳۵۵ | ۱۲۸۷ | ۱۲۷۴ |
۱۱۱۵ | ۱۲۷۴ | ۱۲۴۰ | ۱۱۳۰ | ۱۲۵۶ |
۱۳۵۶ | ۱۳۱۷ | ۱۲۸۳ | ۱۲۸۱ | ۱۲۴۳ |
۱۲۵۶ | ۱۱۵۰ | ۱۲۲۴ | ۱۲۴۸ | ۱۲۶۸ |
۱۲۹۵ | ۱۲۰۹ | ۱۲۴۹ | ۱۲۹۲ | ۱۱۵۲ |
۱۲۴۴ | ۱۳۱۵ | ۱۲۶۷ | ۱۲۲۵ | ۱۲۰۴ |
۱۲۵۶ | ۱۲۸۲ | ۱۲۵۶ | ۱۲۱۴ | ۱۲۳۹ |
۱۲۶۴ | ۱۲۷۷ | ۱۳۴۱ | ۱۲۲۸ | ۱۲۶۴ |
۱۳۲۷ | ۱۲۳۰ | ۱۵۱۰ | ۱۲۹۶ | ۱۴۶۰ |
۱۳۷۱ | ۱۳۰۰ | ۱۲۵۷ | ۱۲۹۶ | ۱۱۰۸ |
۱۱۷۸ | ۱۱۷۷ | ۱۲۶۲ | ۱۲۸۷ | ۱۲۵۱ |
برای تعیین این میانگین طول عمر لامپهای تولید شده توسط این شرکت در سطح اطمینان ۹۵% چقدر است، میتوان از نرم افزار Minitab استفاده نمود. (آخرین ویرایش نرم افزار Minitab از لینک دانلود نرم افزار Minitab قابل دانلود کردن است)
برای انجام این کار در نرم افزار minitab مسیر زیر را طی خواهیم کرد.
در کادر محاورهای باز شده مطابق شکل زیر ستونی را که در آن دادههای مربوط به طول عمر هر یک از لامپها قرار دارد را وارد نموده و سپس دکمه ok را انتخاب نمایید.
پس از ok کردن نرم افزار minitab گرافی مشابه با گراف زیر ارائه خواهد داد. همانطور که در گراف نیز مشخص است، در سطح اطمینان ۹۵% با فاصله اطمینان برای میانگین عمر لامپها در بازه ۱۲۳۱ تا ۱۲۶۵ ساعت را بدست میآید، یعنی میتوان با ۹۵٪ اطمینان گفت که میانگین جمعیت لامپ ها بین ۱۲۳۱و ۱۲۶۵ ساعت است.
در رابطه با پارامتر مورد بررسی، فواصل اطمینان تنها خطای نمونهگیری (خطای ذاتی در برآورد یک مشخصه از یک جامعه با استفاده از یک نمونه) را ارزیابی میکند و با افزایش تعداد نمونهها خطای ناشی از نمونهگیری کاهش مییابد این امر منجر به فواصل اطمینان کوچکتر (با پنهای کمتر) میشود. اگر بتوان تمام جامعه را مورد آزمون قرار داد، فاصله اطمینان دارای پهنای صفر میشود: یعنی آنکه هیچگونه خطای ناشی از نمونهگیری وجود نخواهد داشت، زیرا برآورد پارامتر بر اساس کل جامعه به دست آمده است.
علاوه بر این، فواصل اطمینان تنها اطلاعاتی در مورد میانگین، انحراف استاندارد یا پارامتری دیگری که مورد بررسی قرار میگیرند، را ارائه میدهند. در مورد چگونگی توزیع مقادیر منفرد (تک تک مشاهدات) هیچ چیزی را ارائه نمیدهند. این بدان معنی است که فاصله اطمینان دارای محدودیتهای مهمی است در این مثال، میتوان ۹۵٪ اطمینان داشت که میانگین عمر لامپهای بین ۱۲۳۱ تا ۱۲۶۵ ساعت خواهد بود. اما فاصله اطمینان ۹۵٪ نشان نمیدهد که ۹۵٪ لامپها در بازه بین ۱۲۳۱ تا ۱۲۶۵ ساعت عمر خواهند کرد. برای رسیدن به نتیجه اینکه در چه بازهای ۹۵% لامپها عمر خواهند کرد به یک بازه متفاوت از فاصله اطمینان نیاز است.
۳- مرور اجمالی بر فواصل پیشبینی (Prediction Intervals)
فاصله پیشبینی برای پیشبینیهای حاصل از مدلهای رگرسیون خطی و غیر خطی است. دو نوع فواصل پیش بینی وجود دارد.
۳-۱- فاصله اطمینان پیشبینی (confidence interval of the prediction)
با توجه به تنظیمات یا مقادیر مشخص شده برای پیشبینی کننده (متغیرهای مستقل) در یک مدل رگرسیونی، فاصله اطمینان پیشبینی یک گستره است که با احتمال مشخص شامل میانگین متغیر پاسخ میشود. مانند فواصل اطمینان، فاصله اطمینان پیشبینی نشان دهنده یک بازه برای میانگین است، نه توزیع نقاط دادههای منفرد.
به عنوان نمونه برای مثال ارائه شده بالا (عمر لامپ) میتوان بررسی کرد که چگونه تغییر دو متغیر مستقل “روشهای مختلف تولید (آهسته یا سریع)” و یا “فیبرهای مورد استفاده در تولید لامپ (A یا B) ” بر روی عمر لامپها تاثیرگذار است. پس از برازش یک مدل میتوان از نرم افزار برای پیشبینی میانگین عمر لامپ تولید شده با استفاده از فیبر A و تحت روش تولید سریع استفاده نمود.
اگر فاصله اطمینان پیشبینی ۱۴۰۰ تا ۱۴۵۰ ساعت بدست آید، میتوان ۹۵٪ اطمینان داشت که میانگین عمر لامپهای تولید شده در این شرایط در بازه ۱۴۰۰-۱۴۵۰ قرار میگیرد. با این حال، این بازه هیچ چیز در مورد چگونگی توزیع عمر لامپها به صورت منفرد ارائه نمیدهد.
۳-۲- فاصله پیش بینی (prediction interval)
فاصله پیش بینی یک گستره است که احتمالاً شامل مقدار پاسخ برای یک مشاهد منفرد با توجه به تنظیمات مشخص شده (مثلاً تولید سریع با استفاده از فیبر A) برای پیشبینی کننده (متغیر مستقل) است. اگر به عنوان مثال نرم افزار Minitab یک فاصله پیشبینی از ۱۳۵۰-۱۵۰۰ ساعت برای یک لامپ تولید شده در شرایط فوق را محاسبه نماید، میتوان ۹۵٪ اطمینان داشت که طول عمر یک لامپ جدید تولید شده با آن تنظیمات مشخص شده در بازه ۱۳۵۰ تا ۱۵۰۰ ساعت خواهد بود.
همیشه “فاصله پیشبینی” برزگتر از “فاصله اطمینان پیشبینی” است زیرا عدمقطعیت بیشتر زمانی اتفاق میافتد که یک پاسخ واحد قرار است پیشبینی شود، نه یک میانگین پاسخها.
۴- مرور اجمالی بر فواصل رواداری (tolerance intervals)
فواصل رواداری یک گستره است که با احتمال مشخصی شامل یک نسبت تعریف شده از یک جامعه میباشد. برای محاسبه فواصل رواداری باید نسبت جامعه و سطح اطمینان مورد نظر را تعیین نمود. برای درک بهتر این امر به مثال زیر را ملاحظه نمایید.
۴-۱- مثال برای فاصله رواداری
برای ارزیابی اینکه یک لامپ تولید شده توسط یک شرکت چقدر عمر میکند، شرکت تولید کننده از بین محصولات تولید شده خود ۱۰۰ نمونه را به صورت تصادفی انتخاب، مدت زمان عمر هر یک از این نمونهها بدست آورده است نتایج مطابق با جدول شماره ۱ است. (دانلود فایل مثال)
برای محاسبه فواصل رواداری با استفاده از نرم افزار Minitab از مسیر زیر استفاده میشود:
Stat> Quality Tools> Tolerance Intervals
پس از رفتن مسیر فوق دادهها مطابق با شکل زیر برای ستونی که دادههای مربوط به طول عمر لامپ را در آن وارد شده، به نرم افزار معرفی میشود.
در نهایت دکمه ok زده میشود. نرم افزار دادههای وارد شده را تجزیه و تحلیل نموده و نتایج زیر را ارائه میدهد.
آزمون بررسی نرمال بودن دادهها (normality test) نشان میدهد که این دادهها از توزیع نرمال پیروی میکنند، بنابراین میتوان از فاصله نرمال (۱۰۶۰تا ۱۴۳۵) استفاده کرد و نتیجهگیری نمود که ۹۵% از لامپهای تولید شده توسط این شرکت طول عمری بین ۱۰۶۰ تا ۱۴۳۵ ساعت دارند.
۵- چگونگی فاصله رواداری با فاصله اطمینان مقایسه میشود
همان طور که قبلاً ذکر شد، پهنای فاصله اطمینان به طور کامل به خطای نمونهگیری بستگی دارد. وقتی تعداد نمونهها به کل جامعه نزدیکتر میشود، پهنای فاصله اطمینان کوچکتر میشود، تا زمانی تعداد نمونه با جامعه برابر شود پهنای این فاصله نزدیک به صفر میشود.
اما پهنای فاصله رواداری نه تنها به خطای نمونهگیری، بلکه به واریانس جامعه نیز بستگی است و وقتی تعداد نمونهها به کل جامعه نزدیکتر میشود، خطای نمونهگیری کاهش مییابد و پرداکندگی بدست آمده، پراکندگی واقعی جامعه مورد مطالعه خواهد بود.
Minitab از مقادیر دادههای برآورد شده را برای صدکهای ۲٫۵ و ۹۷٫۵ (۹۵=۲٫۵-۹۷٫۵) برای تعیین فاصله ۹۵% استفاده میکند. البته، برای مثال فوق چون از یک نمونه استفاده شده است، بخشی از برآورد بدست آمده ناشی از خطای نمونهگیری خواهد بود. معمولاً فاصله رواداری را در سطح اطمینان مشخص (مثلاً ۹۵%) تعیین میکنند.
۶- چگونه از فواصل رواداری استفاده میشود
فواصل رواداری زمانی بسیار مفید هستند که قرار است پیشبینی طیف وسیعی از نتایج ممکن بر اساس دادههای نمونهگیری انجام شود. در بهبود کیفیت، کارشناسان نیاز دارند بدانند خروجی فرآیند (مانند عمر یک لامپ) در چه محدودهای قرار میگیرد. همچنین فاصله رواداری میتواند تغییریپذیری فرایند را تعیین نماید. یک فاصله رواداری بزرگتر از الزامات مشتریان ممکن است نشان دهد که تغییرپذیری محصولات تولید شده، بیش از اندازه زیاد است و باید کیفیت محصولات تولید شده را برای کاهش ضایعات بهبود داد. با استفاده از نرم افزار Minitab بازه رواداری را میتوان به سادگی آنچه که تشریح شد، بدست آورد.
برگزاری دوره آموزشی تجزیه و تحلیل آماری نتایج:
برای برگزاری دوره آموزشی تجزیه و تحلیل آماری نتایج با استفاده از نرم افزار Minitab میتوانید با ما تماس بگیرید.
2 دیدگاه
به گفتگوی ما بپیوندید و دیدگاه خود را با ما در میان بگذارید.
برای میانگین، فاصله اطمینان 95% مطرح شد. آیا برای میانه هم فاصله اطمینان 95% قابل طرح هست و وجود دارد؟
با سلام و احترام
بله برای میانه هم می توانید نتایج در سطح اطمینان 95% محاسبه نمایید. برای این کار از آزمون ولکاکسون (wilcoxson) استفاده می شود. در پست آموزشی انتخاب بین آزمون پارامتریک و ناپارامتریک در مقایسات درون و بین آزمایشگاهی معادل تمام آزمون های پارامتری را مشخص کرده ایم.