ناهمسانی واریانس، تحلیل رگرسیون

Paper ships sailing on a sea following the leader. Leadership concept 3d illustration.

در بررسی ارتباط بین یک متغیر وابسته با یک یا چند متغیر مستقل و با استفاده از داده‬های تاریخی از سه نوع داده می توان پارامترهای متغیر(متغیرهای) مستقل را برآورد و با ارائه مدل اقدام به پیش‬بینی نمود، این سه نوع داده را می توان به شرح زیر استخراج کرد:
الف) داده‬های سری زمانی
داده‬هایی هستند که در قالب یک یا چند متغیر خاصی در طول زمان رخ می‬دهند. به عبارت دیگر سری زمانی، مجموعه‬ای از مشاهدات است که بر حسب زمان مرتب شده باشند.
ب) داده‬های مقطعی
داده‬هایی هستند که در یک مقطع مشخص از زمان محاسبه و جمع‬آوری می شوند. به عنوان مثال، اگر متغیر SDA برای 100 شرکت و در یک مقطع خاصی از زمان (مثلا سال 1385 ) جمع آوری گردد، این داده‬ها را مقطعی گویند. در این حالت تعداد مشاهدات (N) برابر 100 است.
ج) داده‬های تابلویی
داده‬هایی هستند که از ترکیب دو دسته داده‬های سری زمانی و مقطعی حاصل می شود. در بسیاری از موارد محققین از این روش برای مواردی که نمی توان مسائل را به صورت سری زمانی یا مقطعی بررسی کرد و یا زمانی که تعداد داده‬ها کم است استفاده می کنند. ادغام داده‬های سری زمانی و مقطعی و ضرورت استفاده از آن بیشتر به خاطر افزایش تعداد مشاهدات و بالا بردن درجه آزادی است. زیرا در بررسی امکان دارد تعداد مقاطع زیاد و دوره‬های زمانی کم باشد و یا برعکس تعداد دوره‬های زمانی نسبتا زیاد و تعداد مقاطع کم باشد. در این صورت تعداد مشاهدات (n ) برابر است با تعداد سال‬های مورد نظر (t ) ضرب در تعداد داده‬های مقطعی در یک سال (n ) .در این تحقیق از تکنیک داده‬های تابلویی استفاده شده است.
3-9 – 1 – 1 مزایای استفاده از داده های تابلویی
استفاده از داده‬های تابلویی دارای مزایای فراوانی است. در ذیل پاره‬ای از این مزایا معرفی می گردد:
1- از آن جایی که داده‬های تابلویی به افراد، بنگاه ها، کشورها و … طی زمان ارتباط دارند، وجود ناهمسانی واریانس در این واحدها محدود می‌شود. تکنیک های تخمین با داده‬های تابلویی می توانند این ناهمسانی واریانس را با متغیرهای تکی خاص مورد بررسی و ملاحظه قرار دهند.
2- با ترکیب مشاهدات سری زمانی و مقطعی، داده‬های تابلویی با اطلاعات بیشتر، تغییرپذیری بیشتر، هم خطی کمتر میان متغیرها، درجات آزادی بیشتر و کارایی بیشتر را ارائه می نمایند.
3- داده‬های تابلویی، چارچوب مناسب برای تحلیل کلی داده‬ها فراهم نموده و در حذف یا کاهش خطای برآورد نقش مهمی را ایفا می نمایند.
4- داده‬های تابلویی، تأثیراتی را که نمی‬توان به سادگی در داده‬های مقطعی و سری زمانی مشاهده کرد، بهتر معین می کنند.
5- داده‬های تابلویی ما را قادر می سازد تا مدل‬های رفتاری پیچیده‬تر را مطالعه کنیم.
بطور کلی باید گفت داده‬های تابلویی تحلیل‬های تجربی را به شکلی غنی می‬سازند که در صورت استفاده از داده‬های سری زمانی و مقطعی این امکان وجود ندارد (گجراتی ، 1385).
3-9-2 تجزیه و تحلیل همبستگی
تحلیل همبستگی ابزار آماری است که به وسیله آن می توان درجه ای که یک متغیر به متغیر دیگر از نظر خطی مرتبط است را اندازه گیری کرد که معمولاً با تحلیل رگرسیون بکار می رود،در همبستگی درباره دو معیار بحث می شود: ضریب همبستگی و ضریب تعیین.(آذر و مومنی،1385).
3-9-2-1 ضریب همبستگی
برای تعیین شدت هبستگی بین دو متغیر X و Y بهتر است شاخصی مورد استفاده قرار گیرد که به واحدهای اندازه گیری دو متغیر بستگی نداشته باشد.شاخص مذکور R است که شدت رابطه بین دو متغیر و نوع رابطه (معکوس و مستقیم) را نشان می دهد.اندازه ضریب همبستگی همواره بین 1+ و 1- می باشد ضریب همبستگی 1+ رابطه مستقیم و کامل و ضریب هبستگی 1- رابطه معکوس و کامل می باشد.اگر