(2-6)
که در معادله (2-6)، و بصورت زیر تعریف میشوند:
نمرهدهی آزمون سنجش انطباقی به روش اوون، تنها یک پاسخ را در یک زمان درنظرمیگیرد. همهی اطلاعات قبلی در پارامترهای توزیع پیشین وارد میشود و بعد از هر سؤال تغییر میکنند. به دلیل اطلاعات پیشین اضافهشده، در شیوههای بیزین این مزیت وجود دارد که نسبت به MLE خطاهای استاندارد کوچکتری در تعداد یکسانی از سؤالات اجراشده دارند. با این وجود، استفاده از یک پیشین نادرست، باعث میشود که برای بهبود برآورد، به تعداد سؤالات بیشتری نیاز داشتهباشیم، و بازگشت به سمت میانگین در برآورد توانایی رخدهد. با این وجود، کاربرد روش بیزین اوون برای برآورد توانایی پایانی، به دلیل وابستگی به ترتیب ارائهی سؤالات توصیه نمیشود (پارشال، اسپری، کالن و دیوی، 2002).
شیوهی بیشینهی درست نمایی
برآورد بیشینهی درست نمایی توانایی از طریق جستجوی مقدار بیشینهی تابع درست نمایی تعیین میشود. از این شیوهی برآورد، زمانی که پارامترهای سؤال معلوم باشند، به کار میرود. در این روش فرض بر این است که یک آزمودنی با الگوی پاسخ که به طور تصادفی انتخاب میشود، به مجموعهای n سؤالی پاسخ میدهد. اگر پاسخ صحیح به سؤال باشد و پاسخ غلط به سؤال باشد. بر اساس مفروضهی استقلال موضعی، احتمال مشترک مشاهدهی الگوی پاسخ برای این آزمودنی برابر است با؛ حاصلضرب احتمالهای مشاهده شدهی پاسخهای او. معادلهی (2-7) این حاصل را نشان میدهد:
(2-7)
با در نظر گرفتن و ، تابع درست نمایی میتواند به صورت معادلهی (2-8) نوشته شود:
(2-8)
حال اگر الگوی پاسخ مشخص باشد، یعنی باشد، دیگر کاربرد احتمال مناسب نخواهد بود، لذا در این شرایط معادلهی احتمال مشترک را تابع درست نمایی مینامیم و آن را با معادلهی (2-9) نشان میدهیم:
(2-9)
از آنجا که تابع درست نمایی حاصلضرب کمیتهایی است که بین صفر و یک قرار دارد، بنابرین، حاصلضرب مقدار فوق بسیار کوچک میشود، مقیاس سازی بهتری از آن این است که از تبدیل لگاریتمی استفاده شود. معادلهی (2-10) این تبدیل لگاریتمی را نشان میدهد:
(2-10)
حال مقدار که تابع درست نمایی یا لگاریتم تابع درست نمایی یک آزمودنی را بیشینه سازد، به عنوان برآورد بیشینهی درست نمایی برای آن آزمودنی تعیین میشود (همبلتون، سوامیناتان و راجرز، 1991). برآورد بیشینهی درست نمایی برای آزمونهای کوتاه با ثبات نیست و تا زمانیکه آزمودنی در الگوی پاسخ خود پاسخ صحیح یا غلط نداشته باشد مقدار نامحدود بدست میآید. MLE مقدار اریب نسبتاً کمی دارد. ولی یکی از مشکلات آن این است که گاهی اوقات چندین نقطهی بیشینه خواهد داشت. این روش به محاسبات طولانیتری نسبت به روشهای بیزین نیاز دارد (پارشال، اسپری، کالن و دیوی، 2002).
مواجههی سؤال
در کل، اغلب روشهای انتخاب سؤال، برخی از سؤالات را بیشتر از سؤالات دیگر، به دلیل، صفات برتر اندازهگیری یا ویژگیهای مطلوب سؤال ترجیح میدهند. در نتیجه، برخی از سؤالات بیشتر از حد مجاز برای آزمودنیها اجرا میشوند. این امر ممکن است باعث فاش شدن سؤال شود، که روایی نمرات آزمون را از بین میبرد (وایس و کینگسبری، 2000). به عبارت دیگر، برخی از سؤالات نیز کمتر مورد استفاده قرار میگیرند که این امر هم باعث اتلاف سرمایهها میشود. بنابراین، انتخاب راهبردی برای کنترل مواجههی سؤالات برای آزمودنیها، بخش جداییناپذیر طراحی آزمون است (داویس و داد، 2003).
یکی از اولین روشهایی که برای برخورد با مسائل کنترل مواجهه ایجاد شده است، روش 5-4-3-2-1 ( هتر و سیمپسون، 1997؛ مکبرید و مارتین، 1983) که در CAT-ASVAB به کار رفت، میباشد. کینگسبری و زارا (1989)، و تامسون (1998) روشهای متفاوت تصادفی را برای کاهش نرخ مواجههی کلی طراحی کردند. روشهای چرخشی خزانهی سؤال (وای، 1998، وای و استفان و اندرسون، 1998، آریل، ولدکمپ و وندرلیندن، 2004 ) و CAST (لانچ و نانگستر، 1998)، به منظور توزیع سؤالات در تستهای متفاوت از طریق یک قیاس ایجاد شدند تا دردسترس بودن انتخاب سؤالات را کاهش دهند. با این وجود، در صنعت CAT، روش کنترل مواجههی سؤال مبتنی بر روش سیمپسون و هتر، (1985) بهطور وسیعتری به کار میرود.
روش کنترل مواجههی سیمپسون-هتر
روش کنترل مواجهه سیمپسون – هتر (S-H) یکی از رایجترین شیوههای انتخاب مشروط سؤال است. در این روش به هر سؤال یک مقدار پارامتر کنترل مواجهه اختصاص داده میشود، که بر اساس فراوانی انتخاب سؤال که در یک شبیهسازی چرخشی CAT تعیین میشود، استوار است. به سؤالاتی با فراوانیهای اجرای زیاد، پارامترهای کنترل مواجهه کوچکتری اختصاص دادهمیشود، که دامنهی آن از 0 تا 1 میباشد. در طول اجرای آزمون، پارامتر کنترل مواجههی سؤال انتخاب شده با عدد یکنواخت تصادفی که دامنهی آن نیز بین 0 تا 1 است، مقایسه میشود. اگر پارامتر کنترل مواجهه بزرگتر از عدد تصادفی باشد، سؤال اجرا میشود، و اگر کوچکتر باشد، سؤال به خزانهی سؤال بازگردانده میشود. به همین صورت، فرآیند یکسانی برای بهترین سؤال بعدی صورت میگیرد. پارامتر کنترل مواجهه مشابه آستانه میباشد. با کنترل آستانهی روش (S-H) اجرای سؤالاتی که بهطورفراوانی در CAT استفاده میشوند، محدود میشود و نرخ بیشینهی مواجههی سؤال برای سؤالاتی که اغلب کمتر مورد استفاده قرار میگیرند را تضمین میکند. معمولاً پ
ارامترهای کنترل مواجهه در روش (S-H) بهوسیلهی مجموعهای از شبیهسازیهای چرخشی اجراهای واقعی CAT تنظیم میشود. به عبارت دیگر، این پارامتر، نسبت نرخ مواجههی هدف برای احتمال انتخاب سؤال در آزمون میباشد. این شیوه به صورت زیر عمل میکند:
فرض کنید که انتخاب سؤال را برای یک آزمودنی که بهطور تصادفی نمونهگیری شده را نشان میدهد، همچنین فرض کنید که اجرای آن سؤال را نشان میدهد. نرخ مواجههی سؤال میتواند بهصورت تفسیر شود، یعنی احتمال اجرای سؤال برای آزمودنی که بهطور تصادفی نمونهگیری شده است. روش (S-H) سؤالاتی را که اجرا شده از سؤالاتی که انتخاب میشود، از طریق رابطهی احتمال جدا میکند و را از طریق کنترل یعنی نسبت انتخابهایی که به اجرا منجر میشود، کنترل میکند. برای هر نرخ مواجههی معین ؛ ، میتواند از طریق تعیین بهدست آید. اگر معلوم باشد، یا بتواند تقریب زده شود، این روش میتواند به آسانی از طریق ایجاد یک متغیر تصادفی یکنواخت اجرا شود.
روش (S-H) بهطور مؤثری، نرخهای مواجههی همهی سؤالات را محدود میکند. با این وجود، چون سؤالاتی که انتخاب نشدند، نمیتوانند اجرا شوند، سؤالاتی با احتمالات انتخاب کوچک، نرخهای مواجهه کوچکی خواهند داشت؛ بنابراین، روش (S-H) نرخهای مواجهه را برای سؤالاتی که کمتر مواجهه میشوند را نمیتواند افزایش دهد. بعلاوه، تا زمانیکه مواجههی یک سؤال در میان سطوح بتواند کنترل شود، میزان کنترل یکسانی برای آزمودنیها در سطح توانایی ویژهای صورت نمیگیرد. برای مثال، حتی اگر مواجههی یک سؤال کنترل شود، بهطوریکه آن سؤال برای بیش از %30 از آزمودنیهای همپوش اجرا نشود، آن سؤال ممکن است برای آزمودنیهایی با توانایی بالا در %100 دفعات اجرا شود. بعلاوه، اجرای این روش به شناخت نیز نیاز دارد، که آن هم به شکل توزیع جامعهی آزمودنی وابسته است. ازاینرو، باید توزیع پیشین پارامتر تعیین شود و سپس مقدار از طریق شبیهسازی تقریب زده شود (سیمپسون و هتر، 1985).
انواع بسیاری از روشهای (S-H) ارائه شدهاند. پارشال و دیوی و نرینگ (1998)، روش (S-H) شرطی را که در آن پارامترهای کنترل مواجهه براساس سطح توانایی مشخص میشود را ایجاد کردند. همچنین تامسون (1995) نیز شیوهای از کنترل مواجههی شرطی را روی توانایی آزمودنی ایجاد کرد. در رویکردهای سیمپسون – هتر شرطی، ماتریسی از پارامترهای مواجههی سؤال با پارامترهای مواجههی متفاوت برای هر سؤال در هریک از سطوح توانایی مجزا ایجاد میشود که با توانایی آزمودنیها رابطه دارد. استوکینگ و لوئیس (1995) روشی برای استفاده از مدل چند جملهای ایجاد کردند. همچنین نوع دیگری از این روش که جایگاههای پارامتر کنترل مواجهه نه تنها فراوانی سؤالی که انتخاب میشود، بلکه سطح را نیز درنظر میگیرد را ارائه کردند (استوکینگ و لوئیس، 1998). این روشی که به روشS-H اضافه شده است (اغلب به عنوان روشS-H شرطی زمانی که مدل چند جملهای بهکار نمیرود، شناخته میشود)، به دلیل مزایای زیادی که برای روش S-H از طریق ایجاد یک پارامتر کنترل مواجهه برای هر سؤال در تعداد متفاوتی از سطوح ایجاد میکند، مطلوب است. همچنین، روش دیوی – پارشال، روی سؤالاتی که قبلاً در طول اجرای یک CAT معین اجرا شده شروطی قرار میدهد (دیوی و پارشال، 1995؛ پارشال، دیوی و نرینگ، 1998). روش “hybrid” یا “Tri-Conditional” این رویکردها را ترکیب میکند و روی هر سؤال، توانایی آزمودنی و زمینه و بافتی که این سؤالات قبلاً اجرا شده است، شرط قرار میدهد (نرینگ، دیوی و تامسون، 1998؛ پارشال، هوگارتی و کرومری، 1999).