روش حداقل مربعات تعمیم یافته، روش حداقل مربعات معمولی

Question Mark Magnifying with crumpled paper ball on the blue background.

و اگر عرض از مبداء هم مابین مقاطع و هم مابین دوره ها متفاوت باشد روش اثرات ثابت دوطرفه نامیده می شود و مدل آن بصورت زیر خواهد بود:
در مدل های فوق متغیری است که برای واحدهای مقطعی متفاوت اما در طول زمان ثابت می باشد ومتغیری است که برای تمام واحدهای مقطعی در زمان مشابه یکسان بوده اما در طول زمان تغییر می کند. برای برآورد روش اثرات ثابت از مدل حداقل مربعات متغیر مجازی (LSDV) استفاده می شود. مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست و از طریق روش حداقل مربعات معمولی قابل برآورد می باشد.
3-7-1-2 روش اثرات تصادفی
مدل های اثرات ثابت تنها درصورتی منطقی خواهد بود که ما اطمینان داشته باشیم که اختلاف بین مقاطع را می توان به صورت انتقال تابع رگرسیون نشان داد، در حالیکه ما همیشه از وجود این موضوع مطمئن نیستیم. برای رفع این مشکل روشی پیشنهاد شده است که به مدل اجزاء خطا یا اثرات تصادفی معروف است. این روش فرض می کند که جزء ثابت مشخص کننده مقاطع مختلف به صورت تصادفی بین واحدها و مقاطع توزیع شده است. بنابراین مدل اثرات تصادفی را می توان بصورت زیر تعریف کرد:
که در آن یک جمله خطای تصادفی با میانگین صفر و واریانس می باشد. بنابراین در مدل اثرات تصادفی جزء اخلال از دو بخش تشکیل شده است؛ یکی که جزء اخلال مقطع می باشد، و دیگری که جزء اخلال ترکیب مقطع و سری زمانی است. با توجه به اینکه در این حالت واریانس های مربوط به مقاطع مختلف با هم یکسان نیستند لذا مدل دچار ناهمسانی واریانس بوده و از روش حداقل مربعات تعمیم یافته (GLS) جهت برآورد مدل استفاده می شود.
3-7-1-3 آزمون چاو یا F مقید
در بررسی داده های مقطعی و سری های زمانی، اگر ضرایب اثرات مقطعی و اثرات زمانی معنی دار نشود، می توان داده ها را با یکدیگر ترکیب کرده و به وسیله یک رگرسیون حداقل مربعات معمولی تخمین بزنیم. از آنجایی که در اکثر داده های ترکیبی اغلب ضرایب مقاطع یا سری های زمانی معنی دار هستند این مدل که به مدل رگرسیون ترکیب شده معروف است کمتر مورد استفاده قرار می گیرد (یافی، 2003). لذا برای اینکه بتوان مشخص نمود که آیا داده های پانل جهت برآورد تابع مورد نظر کارآمدتر خواهد بود یا نه، فرضیه ای را آزمون می کنیم که در آن کلیه عبارات ثابت برآورد با یکدیگر برابر هستند. فرضیه صفر این آزمون که به آزمون چاو یا F مقید معروف است بصورت زیر می باشد:
برای آزمون فرضیه مذکور از آماره F بصورت زیر استفاده می شود:
که در آن N برابر با تعداد واحدهای مقطعی، T طول دوره مورد نظر، K تعداد متغیرهای توضیحی، RRSS مجذور پسماندهای حاصل از برآورد مقید رگرسیون بصورت حداقل مربعات متغیر مجازی و URSS مجذور پسماندهای حاصل از برآورد نامقید رگرسیون بصورت حداقل مربعات معمولی می باشد. در این آزمون فرضیه یعنی یکسان بودن عرض از مبداء ها در مقابل فرضیه یعنی ناهمسانی عرض از مبداء ها قرار می گیرد. در صورتی که فرضیه پذیرفته شود به معنی یکسان بودن شیب ها برای مقاطع مختلف بوده و قابلیت ترکیب شدن داده ها و استفاده از مدل رگرسیون ترکیب شده مورد تأیید آماری قرار می گیرد. اما در صورت رد فرضیه روش داده های پانل پذیرفته می شود و می توان از روش داده های پانل استفاده کرد.
3-7-1-4 آزمون هاسمن
به منظور اینکه مشخص گردد کدام روش (اثرات ثابت و یا اثرات تصادفی) جهت برآورد مناسب تر است (تشخیص ثابت یا تصادفی بودن تفاوت های واحدهای مقطعی) از آزمون هاسمن استفاده می شود. در روش اثرات تصادفی بار متغیرهای حذف شده روی جمله اخلال قرار می گیرند، اما این مشروط بر آن است که بین متغیرهای مستقل و مؤلفه خطای مقطعی همبستگی وجود نداشته باشد. آزمون هاسمن وجود این همبستگی را بررسی می کند. این آزمون مبتنی بر این فرض اولیه است که در صورت وجود همبستگی، روش اثرات ثابت سازگار و روش اثرات تصادفی ناسازگار است. اگر تخمین کننده روش اثرات تصادفی و تخمین کننده روش اثرات تصادفی باشد آماره این آزمون که دارای توزیع کای-دو با درجه آزادی برابر با تعداد متغیرهای مستقل است بصورت زیر قابل تعریف می باشد:
فرضیه صفر در آزمون هاسمن به صورت زیر خواهد بود:
فرضیه صفر به این معنی است که ارتباطی بین جزء اخلال مربوط به عرض از مبدأ و متغیرهای توضیحی وجود ندارد و آن ها از یکدیگر مستقل هستند. در حالی که فرضیه مقابل به این معنی است که بین جزء اخلال مورد نظر و متغیرهای توضیحی همبستگی وجود دارد. از آنجایی که به هنگام وجود همبستگی بین اجزاء اخلال و متغیر توضیحی با مشکل تورش و ناسازگاری مواجه می شویم، بنابراین بهتر است در صورت پذیرفته شدن (رد) از روش اثرات ثابت استفاده کنیم. هنگامی که بین اجزاء اخلال و متغیر توضیحی همبستگی وجود نداشته باشد ( قبول)، هر دو روش اثرات ثابت و اثرات تصادفی سازگار هستند ولی روش اثرات ثابت ناکارا بوده و بایستی از روش اثرات تصادفی استفاده شود (بالتاجی، 1995، ص 73-68 ).
3-7-2 آزمون معنی دار بودن مدل
برای بررسی معنی دار بودن مدل رگرسیون از آماره F استفاده شده است. فرضیه صفر در آزمون F به صورت زیر خواهد بود:

که بوسیله آماره زیر صحت آن مورد بررسی قرار می گیرد:
برای تصمیم گیری در مورد پذیرش یا رد فرضیه صفر، آماره F به دست آمده با F جدول که با درجات آزادی K-1 و N-K در سطح خطای () 5 درصد محاسبه شده، مقایسه می شود، اگر F محاسبه شده بیشتر از F جدول باشد () مقدار عددی تابع آزمون در ناحیه بحرانی قرار
گرفته و فرض صفر () رد می شود. در این حالت با ضریب اطمینان 95 درصد کل مدل معنی دار خواهد بود. در صورتی که مقدار F محاسبه شده کمتر از F جدول باشد فرض پذیرفته شده و معنی داری مدل در سطح اطمینان 95 درصد مورد تأیید قرار نمی گیرد.
3-7-3 آزمون های مربوط به مفروضات مدل رگرسیون خطی
مدل کلاسیک رگرسیون خطی دارای مجموعه ای از فروض تحت عنوان فروض کلاسیک می‌باشد که بیشتر آنها در مورد جمله اخلال مدل مطرح می گردند؛ برای اینکه در مدل رگرسیون خطی، تخمین زن های حداقل مربعات معمولی ضرایب رگرسیون، بهترین تخمین زن های بدون تورش خطی (BLUE) باشند لازم است تا مفروضات این مدل بررسی و آزمون شوند. در ادامه نحوه آزمون این فرضیات بیان می گردد.