و
بنابراین، مشاهده شد که روش WDM با استفاده از الگوریتمهای برنامهنویسی خطی اعداد صحیح استاندارد حلّ میشود. این روش تا حدودی مشکلات روش تست سایه را حلّ میکند ولی همانند دیگر روشهای برنامهنویسی خطی دارای مشکلات کد نویسی میباشد.
رویکرد دوم: رویکرد اکتشافی
ریکسی (2003، 2004)، به منظور طراحی خزانهی سؤال بهینه رویکرد اندکی متفاوت را مطالعه کرد، و استفاده از برنامهریزی اعداد صحیح را کنار گذاشت. همچنین، در مطالعات گوناگون در مورد طراحی خزانههای سؤال بهینه برای CAT استفاده شده است (ریکیسی، 2003، 2004، 2005؛ ریکیسی و هی؛ 2004، 2009) و گو (2007). در این رویکرد فرض نمیشود که سؤالات از قبل وجود دارد. درعوض، در این رویکرد سؤالات برحسب پارامترهای IRT شبیهسازی میشود تا با برآوردهای اخیر توانایی مطابقت داشته باشد و میزان آگاهی به اندازه کافی بهینهای را ایجاد کند. در روش ریکیسی (2003) ابتدا، خزانهی سؤال هدف را بر اساس صفات غیر آماری از قبیل محتوا به خزانههای کوچکتری تقسیمبندی میشوند. سپس فرآیند CAT شبیهسازی میشود، بهطوریکه خزانههای سؤال کوچکتر بهطور همزمان ساختهشوند. شبیهسازی با یک آزمودنی که بهطور تصادفی از توزیع مورد انتظار استخراج میشود، آغاز میشود، تا CAT ایجاد شود. هر سؤال شبیهسازی میشود تا سؤال بهینهای براساس برآورد توانایی اخیر آزمودنی ایجاد شود. فرایند مشابهی برای آزمودنی بعدی نیز تکرار میشود. به همین ترتیب سؤالات برای نمونهی بزرگی از آزمودنیها شبیهسازی میشود و به خزانهی سؤال اضافه میشود، و به همین صورت خزانهی سؤال بهینه ساخته میشود. در این روش برای تصمیم گیری در مورد اینکه چند مرتبه یک سؤال میتواند دوباره استفاده شود، این قابلیت وجود دارد که قواعد کنترل مواجهه در شبیهسازی وارد شود. این روش بهطور موفقیتآمیزی با نرمافزارهای برنامهنویسی قابل انجام است (گو و ریکیسی، 2007).
روش شبیهسازی خزانهی سؤال در رویکرد اکتشافی (ریکیسی)
مفاهیم پایه
همانطور که قبلاً بیان شد، خزانهی سؤال لیستی از پارامترهای سؤال برای هر یک از سؤالات خزانه توصیف میکند. براین اساس، ایدهی اصلی روش ریکیسی، تعیین پارامترهای سؤال براساس آزمودنیهایی است که به طور تصادفی از توزیع مورد انتظار آزمودنیها نمونهگیری شدند. در این روش CAT های شبیهسازی شدهای برای آزمودنیها اجرا میشوند، در این روش فرض بر این است که هر سؤالی که برای آزمودنی اجرا میشود با برآورد موقتی توانایی بهترین برازش را دارد. پس از اینکه از تعداد مشخصی از آزمودنیها آزمون گرفته شد، اجتماع سؤالات ساختگی، خزانهی سؤال بهینه برای برنامهی CAT میباشد (ریکیسی، 2003).
از لحاظ نظری، برآورد هر منحصربهفرد میباشد، و سؤالاتی که بهطور بهینهای برای برآورد مناسب هستند، پارامترهای سؤال منحصربهفردی دارند. فرایند شبیهسازی که در بالا توصیف شد، تعداد زیادی سؤال در خزانه به تعداد کل سؤالاتی که برای آزمودنیها اجرا میشود، ایجاد میکند یعنی، طول آزمون ضرب در تعداد آزمودنیها. با اینوجود، در عمل، عملکرد سؤالات با سؤالات دیگری که پارامترهایی با مقادیر کمی متفاوت دارند، بسیار مشابه است. این سؤالات در خزانه اضافی هستند، زیرا یکی از آنها میتواند برای برآورد سطح توانایی آزمودنی با کاهش بسیار کمی در دقت اندازهگیری، استفاده شود (گو و ریکیسی، 2007).
به همین منظور در این رویکرد مفهوم “bin” ، بهمنظور محاسبهی فراوانی سؤالاتی با پارامترهای مشابه مطرح شد. یک “bin”، یک مخزن سؤال است، که حدود آن براساس صفات کمّی یا عددی سؤالات مشخص میشود، و تعداد سؤالاتی که درون یک “bin” هستند، صفات مشابهی دارند و میتوانند به جای یکدیگر استفاده شوند. اگر سؤالات بر اساس مدل تک پارامتری لوجستیک (1PLM) مدرج شوند، در انتخاب سؤالات تنها پارامتر دشواری (پارامتر b) اثر دارد. به عبارت دیگر، “bin” ها به صورت دامنههایی روی مقیاس، تعریف میشود. برای مثال، دو “bin” متوالی با پهنای 2/0 روی مقیاس به صورت روبرو؛ (2/0: 0) و (4/0: 2/0) نوشته میشود. سؤالاتی با پارامترهای b برابر با 11/0 و 13/0 در انتخاب سؤال در برنامهی CAT میتوانند به جای یکدیگر انتخاب شوند، زیرا آنها به متعلق میباشند. بنابراین، الگوی طرح خزانهی سؤال به لیستی از “bin” هایی با سؤالاتی با ویژگیهای مشابه، تبدیل میشود(هی و ریکیسی، 2010؛ گو و ریکیسی، 2007).
پهنای “bin” هایی که یک خزانهی سؤال را تعریف میکنند، باید بهاندازهی کافی کوچک باشند، تا جایی که همهی سؤالات به یک اندازه برای برآورد سطح توانایی آزمودنی مناسب باشند. حال اگر پهنای “bin” خیلی بزرگ باشد، سؤالاتی که در یک “bin” قرار میگیرند، ممکن است از میزان متفاوتی سودمندی در برآورد سطح توانایی برخوردار باشند. دیدگاهی که برای تعیین پهنای “bin” در این روش وجود دارد، عبارت است از، تعیین دامنهای روی مقیاس برای سؤالی که تابع آگاهیاش بیشینه است و دامنهی اطراف نقطه بیشینه خیلی پایین نباشد. “خیلی پایین نبودن” اغلب بهطور اختیاری بهعنوان %98 بیشینگی تعریف میشود. بهطور یقین، در این استدلال مقدار %96 یا %97 هم میتواند مناسب باشد( ریکیسی، 2007؛ گو و ریکیسی، 2007).
محصول نهایی طراحی خزانهی سؤال بهینه، آرایهای از اعداد صحیح میباشد، که نشان میدهد چه تعداد سؤال در هر “bin
” برای سرهم کردن همهی آزمونها در برنامهی CAT مورد نیاز است. اگر کنترل مواجهه در شبیهسازی بهکار نرود، اعداد صحیح بین صفر و طول آزمون L محدود میشود، زیرا، سؤالات در هر “bin” دوباره میتوانند استفادهشوند و یک آزمون به بیشتر از L سؤال در هر “bin” نیاز ندارد. امّا زمانیکه کنترل مواجههی سؤال در شبیه سازی بهکار میرود، تعدادی از “bin” ها ممکن است شامل سؤالات بیشتری باشند، تا آنجاکه، نرخهای مواجههی توزیع شده سؤالات در “bin” هایی که مواجههی زیادی داشتند، از نرخ مواجههی هدف کمتر باشد(گو و ریکیسی، 2007).
کاربرد روش ریکیسی برای مدل تک پارامتری لوجستیک 1PLM
زمانیکه سؤالات با مدل تک پارامتری مدرج میشود، تنها عامل روانسنجی که تعیین میکند یک سؤال بیشترین آگاهی در برآورد ایجاد میکند، پارامتر دشواری سؤال است. بنابراین زمانیکه خزانههای سؤال بهینهی طراحیشده با مدل تک پارامتری مدرج میشود، روش ریکیسی (2003)، روی تطابق پارامترهای b سؤال و برآوردهای موقتی تمرکز دارد. در این مدل روش ریکیسی شامل چهار گام میباشد:
درک دقیق و روشن از ویژگیهای برنامهی CAT، زیرا، طراحی خزانهی سؤال باید شیوهی آزمون را بهدقیقترین حالت ممکن طراحی کند.
تعیین صفات طبقهای مورد نیاز برای سؤالات، از قبیل حوزههای محتوایی و تقسیمبندی خزانهی سؤال به خزانهی کوچکتر بر اساس این صفات. اگر آزمون بیش از یک صفت طبقهای داشته باشد، هر صفت جداگانه، یک بخش از خزانهی سؤال را گزارش میکند. البته این گام شیوهی شبیهسازی را با تعیین صفات کمّی از قبیل ویژگیهای روانسنجی سؤال بهینه، آسان میکند.
اجرای شبیهسازی CAT روی آزمودنیهایی که بهطورتصادفی از توزیع توانایی مورد انتظار نمونهگیری شدند. اگر توزیع تواناییها از توزیع نرمال استاندارد پیروی کند، سطح اولیهی توانایی در مقیاس برای آزمودنیها برابر با صفر میباشد. سؤال اول برای همهی آزمودنیها یکسان است. این سؤال، سؤالی با بیشینهی آگاهی در برابر با صفر میباشد. سؤال بهینهی بعدی به پاسخ آزمودنی به سؤال اول و برآورد او بستگی دارد. سؤالات بعدی طوری انتخاب میشوند تا بیشینهی آگاهی در جدیدترین برآورد داشتهباشند. اگر سؤالات با مدل یک پارامتری مدرج شوند، سؤال بهینه سؤالی است که مقدار b مساوی با برآورد اخیر داشتهباشد. همچنانکه سؤالات آزمون انتخاب میشوند و اجرا میشوند، به همین منوال به “bin” هایی که مساوی با مقادیر b شان است، اضافه میشوند.
سؤالات اضافهشده به “bin” ها، توزیع سؤالات را برای یک آزمودنی نشان میدهند. برای ساخت خزانهی سؤال برای کل آزمون، اجتماع توزیعها برای نمونهای از آزمودنیها محاسبه میشود. نتایج عملیات اجتماع، خزانهی سؤال برای این طرح CAT و نمونهی مشخصی از آزمودنیها، میباشد.
این روش برای خزانههایی که با مدل تک پارامتری مدرج میشود و زمانیکه پارامتر دشواری سؤال تنها عامل تعیین میزان آگاهی یک سؤال میباشد، بهخوبی کار میکند. در این مورد، سؤالاتی که مقدار b آنها برابر با برآورد اخیر است، همیشه بیشینه آگاهی در برآورد ایجاد میکنند. بنابراین، این سؤالات همیشه در مقایسه با سؤالاتی که پارامترهای b متفاوتی با دارند، سؤالات بهینهای در برآورد محسوب میشوند. زمانیکه سؤالات با مدل دو و سه پارامتری مدرج میشوند، میزان آگاهی سؤالات، حتی زمانیکه پارامترهای b برابری دارند، متفاوت است، زیرا، پارامترهای a و c متفاوتی دارند (گو و ریکیسی، 2007).
کاربرد روش ریکیسی برای مدل سه پارامتری لوجستیک 3PLM
در مدل سه پارامتری، آگاهی سؤال با ترکیب سه پارامتر تعیین میشود: پارامتر ضریب تشخیص a ، پارامتر دشواری سؤال b و پارامتر عامل حدس c. با فرض اینکه، پارامتر b به سطح نزدیک شود، و پارمتر a خیلی بزرگ باشد، یک سؤال مقدار بی نهایتی آگاهی در هر سطح میتواند ایجاد کند. اگرچه، غیر ممکن است که سؤالاتی با پارامترهای a بسیار بزرگ داشته باشیم، امّا این مورد معمول است که سؤالات نسبت به یکدیگر پارامترهای a متفاوتی داشته باشند. این موضوع نشان میدهد، که در یک سطح معین، سؤالی که به بیشینهی آگاهی میرسد، ممکن است لزوماً حداکثر آگاهی در آن سطح ایجاد نکند. بهعبارت دیگر، سؤالی که بیشترین میزان آگاهیاش در یک سطح است، ممکن است، آگاهی بیشتری نسبت به سؤالات دیگر در خزانهی سؤال، برای بیش از یک دامنه از سطوح ایجاد کند. همچنانکه در نمودار 2-6 نشان داده شده است، یک سؤال با پارامترهای آگاهی بیشتری در سطح برابر با ، نسبت به سؤالی با پارامترهای ایجاد میکند، با این که، سؤال دوم، در همین سطح به نقطهی اوج آگاهی خود میرسد.
نمودار 2-6: میزان آگاهی سؤال فراهم شده بوسیلهی دو سؤال متفاوت