روش حداقل مربعات معمولی، حداقل مربعات معمولی

که در آن مجموع تمامی متغیرهای اثرگذار بر متغیر مورد بررسی است که قابل اندازهگیری نیستند.
اگر با هر کدام از متغیرهای توضیحی دیگر X همبسته باشد، برآورد و تحلیل از طریق این معادله، دارای تورش مربوط به متغیرهای برآورد نشده خواهد بود. حتی اگر اثر متغیرهای مشاهده نشده به هیچ کدام از متغیرهای توضیحی وابسته نباشد، وجود این متغیرها منجر به برآوردهای ناکارا و ناسازگار خطای تخمین خواهد شد. اما با استفاده از روشهایی در تخمینهای دادههای ترکیبی سریزمانی- مقطعی مانند مدل اثر ثابت و مدل اثر تصادفی که در ادامه به توضیح آنها میپردازیم، این مشکل وجود نخواهد داشت. چنانچه کل دادهها با یکدیگر ترکیب و با روش حداقل مربعات معمولی تخمین زده شود مدل دادههای ادغام شده به دست میآید. به عبارتی دیگر، در بررسی دادههای مقطعی و سری ها زمانی، اگر ضرایب اثر مقطعی و اثر زمانی معنیدار نشود، میتوان تمامی دادهها را با یکدیگر ترکیب، به وسیله یک رگرسیون حداقل مربعات معمولی تخمین بزنیم. از این روش همچنین در رگرسیونهایی استفاده میشود که کلیه متغیرها قابل کنترل و اندازهگیری باشد. این مدل در شکل زیر نشان داده شده است:‌Y
Y
X
X
نمودار 3-1:‌ رگرسیون برآوردی از کل دادهها با یک ضریب ثابت مشابه برای تمامی مقطعها
با توجه به نمودار (1-3) کلیه متغیرها به صورت یک مدل حداقل مربعات معمولی برآورد میگردد.
معادله این مدل به صورت زیر است:
در رابطه فوق عرض از مبدا، شیب رگرسیون، i نشان دهنده مقطع، t نشانگر دوره زمانی، متغیر مستقل مربوط به مقطع i و زمان t و نشان دهنده متغیر وابسته مربوط به مقطع i و زمان t ،‌ خطای رگرسیون است. همانطور که در نمودار و معادله اخیر نشان داده شده است‌، در این روش از اطلاعات مربوط به دادههای ترکیبی استفاده نشده است و کلیه متغیرها که قابل اندازهگیری و مشاهده بوده است، با روش حداقل مربعات معمولی تخمین زده شده است (یافی، 2003). در حالی که در مدل دادههای ترکیبی مطابق با نمودار زیر برای هر مقطع یک رگرسیون جداگانه وجود دارد:‌
Y
Y

X
X
نمودار 3-2: مدل دادههای ترکیبی به روش پنل
این رگرسیونها را با استفاده از دو روش اثر ثابت و اثر تصادفی میتوان برآورد کرد. این دو روش دادههای ترکیبی را در زیر توضیح میدهیم (زراءنژاد و انواری، 1384).
3-10-2- مدلهای مختلف
استفاده از روش دادههای مقطعی ممکن است با مشکلات عدم کارایی و ناسازگاری تخمین مدلها همراه باشد. مشکلات مزبور در تخمین مدلها به روش دادههای ترکیبی و با استفاده از روش هایی مانند مدل اثر ثابت، مدل اثر تصادفی، مدل رگرسیون به ظاهر نامرتبط و مدل دادههای یکپارچه شده، وجود نخواهد داشت. در بررسی دادههای مقطعی و سری زمانی، اگر ضریب اثرات مقطعی و اثر زمانی معنیدار نشود، میتوان تمامی دادهها را با یکدیگر ترکیب کرده و بوسیله رگرسیون حداقل مربعات معمولی تخمین زد. به این روش، دادههای تلفیق شده نیز میگویند. مدلهای اثر ثابت و اثر تصادفی به سبب اهمیت، در این قسمت به اختصار توضیح داده میشوند:
3-2-10-1 – مدل اثر ثابت
در مدل اثر ثابت، شیب رگرسیون در هر مقطع ثابت است و جملهی ثابت از مقطعی به مقطع دیگر متفاوت است. هر چند اثر زمانی معنیدار نیست، اما اختلاف معنیداری میان مقطعها وجود دارد و ضرایب مقطعها با زمان تغییر نمیکند. یکی از روشهای نشان دادن اثر مقطعی استفاده از متغیرهای مجازی است. شکل کلی این مدل به صورت زیر است:
در این رابطه، نشان دهنده ی برداری از متغیر های مستقل، متغیر مجازی برای نشان دادن اثر مقطعی، برداری از متغیرهای وابسته و جملات خطای معادله است. در مدلهای اثر ثابت که شیب ثابت دارند، فرض میشود که واریانس خطاها در مقطع و همچنین، بین مقاطع همسان است و خود همبستگی بین اجزای خطای آن وجود نداشته باشد. به بیان دیگر، برای هر و رابطهی زیر برقرار است (اشرفزاده و مهرگان، 1387؛ زراءنژاد و انواری، 1384).