روش حداقل مربعات معمولی، حداقل مربعات معمولی

مدل ها از لحاظ استفاده از اطلاعات آماری به سه گروه تقسیم می شوند. برخی از مدل ها با استفاده از «اطلاعات سری زمانی» یا به عبارتی طی دوره نسبتاً طولانی چند ساله برآورد می شوند. بعضی دیگر از مدل ها بر اساس «داده های مقطعی» برآورد می شوند یعنی متغیرها در یک دوره زمانی معین برای مثال یک هفته، یک ماه یا یک سال در واحدهای مختلف بررسی می شوند.
روش سوم برآورد مدل، که در این پژوهش نیز مورد استفاده قرار گرفته است ، برآورد بر اساس «داده های پانل» است. در این روش یک سری واحدهای مقطعی (برای مثال شرکت ها) در طی چند سال مورد توجه قرار می گیرند. با کمک این روش که در مطالعات سال های اخیر نیز زیاد استفاده شده است تعداد مشاهدات تا حد مطلوب افزایش می یابد. با توجه به اینکه مشاهده های ادغام شده موجب تغییرپذیری بالاتر، هم خطی چندگانه کمتر میان متغیرهای توضیحی، درجه آزادی بیشتر و کارآیی بالاتر تخمین کننده ها می شود، مطالعات پانل نسبت به مطالعات مقطعی و سری زمانی دارای مزیت است. (بالتاجی، 2008).
در حالت کلی مدل زیر نشان دهنده یک مدل با داده های پانل می باشد:
که در آن نشانگر واحدهای مقطعی (برای مثال شرکت ها) و نشانگر زمان است. متغیر وابسته را برایامین واحد مقطعی در سال نشان می دهد و نیز امین متغیر مستقل غیرتصادفی برای برایامین واحد مقطعی در سالام است. جمله اخلال بوده و که فرض می شود دارای میانگین صفر () و واریانس ثابت () است.
پارامترهای مدل می باشد که واکنش متغیر مستقل نسبت به تغییراتامین متغیر مستقل درامین مقطع وامین زمان را اندازه گیری می کند. برای برآورد مدل بر اساس داده های پانل روش های مختلفی همچون روش اثرات ثابت و روش اثرات تصادفی وجود دارد که بر حسب مورد، کاربرد خواهند داشت.
3-9-1-1 روش اثراث ثابت:
در روش اثرات ثابت فرض بر این است که ضرایب مربوط به متغیرها (شیب ها) ثابت هستند و اختلافات بین واحدها را می توان به صورت تفاوت عرض از مبداء نشان داد. در این حالت اگر عرض از مبداء تنها برای واحدهای مختلف مقطعی متفاوت باشد اصلاحاً روش اثرات ثابت یکطرفه نامیده شده و مدل آن بصورت زیر می باشد:
و اگر عرض از مبداء هم مابین مقاطع و هم مابین دوره ها متفاوت باشد روش اثرات ثابت دوطرفه نامیده می شود و مدل آن بصورت زیر خواهد بود:
در مدل های فوق متغیری است که برای واحدهای مقطعی متفاوت اما در طول زمان ثابت می باشد ومتغیری است که برای تمام واحدهای مقطعی در زمان مشابه یکسان بوده اما در طول زمان تغییر می کند. برای برآورد روش اثرات ثابت از مدل حداقل مربعات متغیر مجازی (LSDV) استفاده می شود. مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست و از طریق روش حداقل مربعات معمولی قابل برآورد می باشد.
3-9-1-2 آزمون هاسمن
در صورتی که بر اساس نتایج آزمون چاو برای هر یک از فرضیه ها، استفاده از روش داده های پانل مورد تأیید واقع شود، به منظور اینکه مشخص گردد کدام روش (اثرات ثابت و یا اثرات تصادفی) برای برآورد مناسب تر می باشد (تشخیص ثابت یا تصادفی بودن تفاوت های واحدهای مقطعی) از آزمون هاسمن استفاده می شود. در روش اثرات تصادفی بار متغیرهای حذف شده روی جمله اخلال قرار می گیرند، اما این مشروط بر آن است که بین متغیرهای مستقل و مؤلفه خطای مقطعی همبستگی وجود نداشته باشد. آزمون هاسمن وجود این همبستگی را بررسی می کند. این آزمون مبتنی بر این فرض اولیه است که در صورت وجود همبستگی، روش اثرات ثابت سازگار و روش اثرات تصادفی ناسازگار است. اگر تخمین کننده روش اثرات تصادفی و تخمین کننده روش اثرات تصادفی باشد آماره این آزمون که دارای توزیع کای-دو با درجه آزادی برابر با تعداد متغیرهای مستقل است بصورت زیر قابل تعریف می باشد:
فرضیه صفر در آزمون هاسمن به صورت زیر خواهد بود:
نحوه داوری: فرضیه صفر به این معنی است که ارتباطی بین جزء اخلال مربوط به عرض از مبدأ و متغیرهای توضیحی وجود ندارد و آن ها از یکدیگر مستقل هستند. در حالی که فرضیه مقابل به این معنی است که بین جزء اخلال مورد نظر و متغیرهای توضیحی همبستگی وجود دارد. از آنجایی که به هنگام وجود همبستگی بین اجزاء اخلال و متغیر توضیحی با مشکل تورش و ناسازگاری مواجه می شویم، بنابراین بهتر است در صورت پذیرفته شدن (رد) برای آزمون فرضیات از روش اثرات ثابت استفاده کنیم. هنگامی که بین اجزاء اخلال و متغیر توضیحی همبستگی وجود نداشته باشد ( قبول)، هر دو روش اثرات ثابت و اثرات تصادفی سازگار هستند ولی روش اثرات ثابت ناکارآ بوده و بایستی برای آزمون فرضیات از روش اثرات تصادفی استفاده شود. (جانستون و دیناردو، 2005).
3-9-2 آزمون معنی دار بودن مدل
برای بررسی معنی دار بودن مدل رگرسیون از آماره F استفاده شده است. فرضیه صفر در آزمون F به صورت زیر خواهد بود:

که بوسیله آماره زیر صحت آن مورد بررسی قرار می گیرد:
نحوه داوری: برای تصمیم گیری در مورد معنی دار بودن مدل های پژوهش ، با توجه به خروجی های آماری آماره F به دست آمده با F جدول که با درجات آزادی K-1 و N-K در سطح خطای () 5% محاسبه شده، مقایسه می شود، اگر F محاسبه شده بیشتر از F جدول باشد () مقدار عددی تابع آزمون در ناحیه بحرانی قرار گرفته و فرض صفر () رد می شود. در این حالت با ضریب اطمینان 95% کل مدل معنی دار خواهد بود. در صورتی که مقدار F محاسبه شده کمتر از F جدول باشد فرض پذیرفته شده و معنی داری مدل در سطح اطمینان 95% مورد تأیید قرار
نمی گیرد.
3-9-3 آزمون معنی دار بودن ضرایب
برای بررسی معنی دار بودن ضرایب متغیرهای مستقل در هر مدل از آماره t استفاده شده است. فرضیه صفر در آزمون t به صورت زیر خواهد بود: