3-10-4- ضریب تعیین (R2)
مهمترین معیاری است که با آن میتوان رابطه بین دو متغیر x و y را توضیح داد و میزان انحراف مشاهدات y را با برآورد خط رگرسیون اندازهگیری میکند. این ضریب بین صفر تا یک در نوسان بوده به طوری که مقدار صفر بیانگر آن است که خط رگرسیون هرگز نتوانسته تغییرات y را به متغیر مستقل x نسبت دهد. مقدار یک نیز بیانگر آن است که خط رگرسیون به طور دقیق توانسته است تغییرات y را به متغیر مستقل x نسبت دهد.
در رگرسیون چندمتغیره در صورتی که نمونه کوچک باشد، ضریب تعیین تعدیل شده به جای ضریب تعیین استفاده میشود و با بزرگتر شدن حجم نمونه این دو ضریب به همدیگر نزدیک میشوند (مومنی و قیومی، 1386، 122).
3-10-5- مدل های رگرسیون
مدلهای رگرسیون انواع مختلفی دارد که متداولترین آنها رگرسیون ساده و مرکب میباشند. رگرسیون ساده شامل ارتباط بین دو متغیر و رگرسیون چندمتغیره، ارتباط یک متغیر را با دو یا چند متغیر بیشتر نشان میدهد. رگرسیون چندمتغیره رابطه بین متغیر وابسته را با یکی از متغیرهای مستقل، در شرایط ثابت بودن دیگر متغیرهای مستقل نشان میدهد.
در رگرسیون ساده (یک متغیر)، معادله معرف خط رگرسیون جامعه میباشد که با برآورد میشود. در رگرسیون خطی چندمتغیره معادله معرف رگرسیون جامعه به شرح زیر میباشد:
که برای برآورد معادله فوق از معادله زیر استفاده میکنیم:
که در آن
3-10-6- فرضهای اساسی رگرسیون
در صورتی پژوهشگری میتواند از رگرسیون استفاده نماید که شرایط زیر محقق شده باشد:
1- میانگین جمله خطاها مساوی صفر است. : معنی این فرض آن است که عوامل تشکیلدهنده خطاها، اثرات مثبت و منفی خود را طوری بر جای میگذارند که متوسط مقادیر جمله خطاها برابر صفر شود.
2- متغیر وابسته دارای توزیع نرمال است: فرض بر آن است که توزیع متغیر به نحوی است که پراکندگی آن در مجاورت میانگین حداکثر بوده و هر چه از میانگین دورتر شویم در سمت راست و چپ آن به یک نسبت کاهش مییابد؛ در نتیجه توزیع رنگی شکل است.
3- جمله خطاها در مشاهدات مختلف ناهمبسته میباشد. : اگر این فرض نقض شود با مسئلهای موسوم به خودهمبستگی مواجه خواهیم بود. بطور کلی هرگاه جمله خطاها از نظم خاصی پیروی کنند فرض ناهمبسته بودن جمله خطاها نقض شده، خودهمبستگی مثبت، منفی یا تلفیقی از خودهمبستگی مثبت و منفی را خواهیم داشت.
4- واریانس جمله خطاها همگی برابر عدد ثابتی مانند هستند: هرگاه فرض اخیر نقض شود با مسئلهای موسوم به نابرابری واریانسها مواجه خواهیم بود.
5- جمله خطاها مستقل از متغیر مستقل میباشد: در صورت نقض این فرض، مطالعه دقیق اثرات x بر روی y امکانپذیر نخواهد بود.
فرض دیگر که فقط مختص مدل رگرسیون چندمتغیره است، آن است که باید تعداد مشاهدات بر تعداد پارامترها فزونی داشته باشد و بین متغیرهای مستقل رابطه خطی کامل وجود نداشته باشد. این فرض شرط لازم برای حصول جواب معادلات نرمال و برآورد ضرایب رگرسیون چندمتغیره است.
3-10-7- بررسی نرمال یا غیر نرمال بودن دادههای پژوهش
جهت بررسی این نکته که آیا متغیرهایی که مورد بررسی و محاسبه قرار میگیرند، از قابلیت اتکاء مناسبی برخوردارند، آزمون نرمال بودن انحرافات صورت میگیرد که با استفاده از آزمون کلموگروف – اسیمرنوف به بررسی نرمال بودن دادههای آزمون پرداخته میشود. با توجه به اینکه در جامعههای با توزیع نرمال، روشهای پارامتریک و در جامعههای با توزیع غیر نرمال، روشهای ناپارامتریک بهکار گرفته میشود، لذا در ابتدا نرمال یا غیرنرمال بودن دادهها مشخص میشود وسپس فرضیههای پژوهش مورد بررسی قرار میگیرند. به منظور بررسی نرمال بودن از آزمون کلموگوروف- اسمیرنوف(KS)استفاده میشود.
آزمون کلموگروف-اسمیرنوف آزمونی برای پیدا کردن نوع توزیعهای آزمون است. آماره آزمون فوق از مقایسه قدرمطلق بیشترین تفاوتها بین مقادیرمشاهده شده واقعی از مقادیر مورد انتظار بدست میآید. نیکویی برارزش این آزمون نشان میدهد که آیا دادههای آزمون از توزیع خاصی (در اینجا توزیع نرمال) پیروی میکنند یا خیر؟ با توجه به اینکه در جامعههای با توزیع نرمال، روشهای پارامتریک و در جامعههای با توزیع غیرنرمال، روشهای ناپارامتریک بهکار گرفته میشود، لذا در ابتدا نرمال یا غیرنرمال بودن دادهها مشخص میشود و سپس فرضیههای پژوهش مورد بررسی قرار میگیرند.
3-10-8- ازمون معنیدار بودن در الگوی رگرسیون
در رگرسیون چندگانه، دو یا چند متغیر مستقل وجود دارد و لازم است که برای مشخص شدن معنادار بودن آنها دو آزمون انجام گیرد. ابتدا آزمون معنیدار بودن معادله رگرسیون و در مرحله بعد آزمون معنادار بودن هر کدام از ضرایب متغیرهای مستقل صورت میگیرد(مؤمنی، 1386، 120).
3-10-9- ازمون معنیدار برای معادله رگرسیون