ایجاد پارامتر از طریق توزیع هدف
ایجاد پارامتر از طریق که میتواند از طریق بهدست آمده در هر گام انتخاب سؤال تقریب زده شود و از توزیع نرمال (( )) پیروی میکند.
پارامتر دوباره از طریق معادلهی (۲-۲۱) محاسبه میشود.
روش حداقل آگاهی آزمون[۱۸۵]، (MTI)
روش MTI بر این فرض است که زمانیکه آزمونهای CAT مجزایی که از خزانهی سؤال سرهم میشود، عیناً بتواند میزان آگاهی کافی مورد نظر را برای اندازهگیری توانایی آزمودنی فراهم کند، خزانهی سؤال بهینه محسوب میشود. اگر آزمون میزان آگاهی بیشتری بتواند ایجاد کند، آزمون با دقت بیشتری میتواند سطح توانایی آزمودنی را برآورد کند. با این وجود، برای ساخت آزمونی که میزان آگاهی بیشتری بتواند ایجاد کند، به سؤالاتی با ضرایب تشخیص بالا نیاز داریم، در صورتی که معمولاً ساخت این نوع سؤالات گران و دشوار میباشد، مخصوصاً اگر سؤالات آسان باشد، این دشواری دو چندان میشود. روش MTI این اطمینان را به ما میدهد که آزمونها دارای دقت کافی برای برآورد توانایی هستند، ولی شامل سؤالاتی با ضرایب تشخیص بسیار بالا نیستند. در روش MTI، یک مقدار آگاهی هدف برروی دامنهای از مقیاس قرار میدهد. هر سؤالی که برای آزمودنی اجرا میشود در مقدار آگاهی هدف آزمون، سهیم است. پارامترهای c (که از توزیع پارامتر c سؤالات عملیاتی بدست میآید) و پارامترهای b (که بر اساس برآورد جدید برآورد میشود)، هر دو معلوم و مشخص هستند، پارامترهای a میتواند محاسبه شود. برای اجرای رویکرد حداقل آگاهی تست، گام اول، تعیین آگاهی هدف تست میباشد. براساس اطلاعات پیشین در مورد تست از روی خزانهی عملیاتی و توزیع برآوردهای توانایی، حداقل آگاهی هدف تست میتواند از طریق دو معادلهی (۲-۲۵) و (۲-۲۶) تعیین شود:
(۲-۲۵)
(۲-۲۶)
؛ انحراف استاندارد برآوردهای توانایی را نشان میدهد.
؛ خطای استاندارد برآورد را نشان میدهد.
؛ آگاهی تست را نشان میدهد.
زمانیکه ، معلوم شد، پس از آن آگاهی مورد انتظاری که هر سؤال باید فراهم کند، میتواند از طریق تقسیم بر طول تست بدست آید. با توجه به این واقعیت که آگاهی واقعیای که یک سؤال میتواند ایجاد کند، مشروط به برآورد جدید توانایی، ممکن است کاملاً مطابق با آگاهی مورد انتظار نباشد، بنابراین، آگاهی هدف سؤال باید هر بار پس از اینکه یک سؤال اجرا میشود، به روز شود. معادلهی (۲-۲۷) برای بهروز کردن آگاهی هدف سؤال بهکار میرود. ، آگاهی تست را نشان میدهد و ، طول تست را نشان میدهد.
(۲-۲۷)
؛ مقدار تابع آگاهی هدف تست که از قبل تعیین شده است.
؛ مقدار تابع آگاهیای از سؤالات تست که تا الان اجرا شده است.
؛ طول تست که از قبل مشخص شده است.
؛ طول تست، که تا الان اجرا شده است.
در روش MTI سؤالات را در سه مرحله ایجاد میشود:
تعیین میزان آگاهی که یک آزمون برای رسیدن به دقت قابل قبول برآورد یک آزمودنی نیاز دارد. تجزیهی آگاهی هدف (I) برای هر سؤال (i)، بر اساس معادلهی (۲-۲۷) بدست میآید.
بهمنظور پیروی از شیوهای که CAT سؤالات را انتخاب میکند، یعنی، انتخاب سؤالاتی که بیشترین میزان آگاهی در برآورد جدید دارند، آگاهی هدف نیز میتواند دستکاری و یا تغییر داده شود، بهطوریکه با یک مقداری که بهاندازه کافی معقول، بزرگ است، شروع شود، و همچنانکه آزمون به جلو میرود، کاهش یابد، و مقدار آگاهی هدف مورد انتظار در چند سؤال آخر ثابت میشود. درصورتیکه، در شبیهسازی روش کنترل مواجهه a- مرتب شده (چانگ و یینگ، ۱۹۹۹)، آگاهی هدف در سطح پایینتری قرار میگیرد و سپس مقدار مورد انتظار افزایش مییابد، زیرا روش a- مرتبشده، ابتدا از سؤالاتی با پارامتر a پایین استفاده میکند.
ایجاد پارامتر را از طریق توزیع هدف
بر اساس نظر لرد (۱۹۸۰)، رابطهی بین و پارامترهای سؤالی که بیشینهی آگاهی شان در میباشد، برابر با معادلهی (۲-۲۸) است:
(۲-۲۸)
D، عامل مقیاسسازی است و برابر با ۷/۱ میباشد. حداکثر آگاهی یک سؤال لوجستیک با پارامترهای خاص و که در ایجاد میشود، برابر با معادلهی (۲-۱۷) است که برای یادآوری در زیر آورده شده است:
با دوباره نوشتن معادله و جایگذاری با میتوان مقدار را بهدست آورد، که در معادلهی (۲-۲۹) نشان داده شده است:
(۲-۲۹)
با فرض اینکه، و معلوم باشند، پارامتر a بهینه، میتواند از طریق معادلهی (۲-۲۹)بهدست آید، البته به شرطیکه، سؤال از مقدار حداقلی از آگاهی در برآورد جدید برخوردار باشد.
محاسبهی پارامتر b از طریق پارامترهای a و c با بهره گرفتن از معادلهی (۲-۲۱)، البته به شرط آنکه سؤالی که ایجاد میشود حداکثر آگاهیاش در باشد(ریکیسی، ۲۰۰۴، گو و ریکیسی، ۲۰۰۷؛ هی و ریکیسی، ۲۰۱۰).
تعدیل پس از شبیهسازی[۱۸۶]
در نتایج شبیهسازی خزانهی سؤال، بردار و ماتریس ، تعداد سؤالات مورد نیاز برای هر bin که از طریق پارامتر a و b مشخص میشود، را نشان میدهند، مخصوصاً نشان میدهد که چه تعداد سؤال در فواصل پارامترهای b ، مقدار آگاهی معینی که مورد نیاز است را فراهم میکنند. از آنجا که، bins هم بر اساس پارامترهای a و هم b تعریف میشوند، سؤالات در نقطهای که حداکثر آگاهی در آن ایجاد میشود، دستهبندی میشوند. همچنانکه در بالا ذکر شد، در شبیهسازی سؤالات این واقعیت درنظرگرفتهنمیشود که سؤالاتی که به یک bin تعلق دارند، میتوانند نسبت به سؤالاتی که به bin دیگری تعلق دارند که همان سطح مورد نظر را در برمیگیرد، آگاهی بیشتری ایجاد کنند. برای مثال، نمودار ۲-۱۱ نشان میدهد که سؤالات متعلق به ab-bin برابر با ممکن است آگاهی بیشتری در بین و نسبت به سؤالات ab-bin برابر با ایجاد کند، اگرچه، سؤالاتی که درab-bin=B ، قرار دارند، حداکثر میزان آگاهیشان روی همان دامنهی موردنظر خواهد بود. بهعبارت دیگر، در شیوهی انتخاب سؤال، سؤالی که در ab-bin=A قرار دارد بیش از سؤالی که در ab-bin=B قرار میگیرد، برای برآوردهای حدود تا ، انتخاب خواهدشد.
نمودار ۲-۱۱: نمایش سؤالات در یک bin که آگاهی بیشتری نسبت به سؤالات در bin دیگر نشان میدهد
بنابراین، عملاً خزانهی سؤال بهینه، به تعداد کافی از سؤالاتی نیاز دارد که آگاهی بهاندازهی کافی بزرگ، در هر b-bin ایجاد کند، البته بدون توجه به bin که سؤالات به آن تعلق دارند. خزانهی سؤالی که دقیقاً بر اساس تعداد سؤالات مورد نیاز الگویی که از شبیهسازی خزانهی سؤال بهدست آمده، ساخته میشود، دارای سؤالات اضافی خواهد بود.
این سؤالات با بهره گرفتن از یک جدول آگاهی مرتب میشوند. این جدول برای انتخاب سؤالاتی با بالاترین میزان آگاهی از bin هایی که از طریق شیوهی شبیهسازی تعریف شدهاند، ساخته میشود. این کار به شکل دادن طرح پایانی خزانهی سؤال کمک میکند. برای بهدست آوردن بالاتررین میزان آگاهی سؤال برای هر b-bin، نقاط میانی b-bin ها به عنوان لنگر سطح عمل میکند و نقاط میانی a-bin، به عنوان پارامتر a و نقاط میانی b-bin به عنوان پارامتر b ، و نمایانگر bin هستند که سؤال از آن بهدست میآید. برای مثال سطوح هایی که برای تشکیل جدول آگاهی مورد نیاز است، عبارت است از؛ ، بنابراین سؤالی با پارامترهای ، سؤالی است که به bin برابر با را نشان میدهد. اگر سه سؤال از این bin مورد نیاز باشد، سه سؤال با پارامترهای یکسان به جدول آگاهی وارد میشوند. در این شیوه برای نشان دادن تعداد سؤالات مورد نیاز در هر bin سؤالات مناسبی انتخاب میشوند.
همچنانکه نمودار ۲-۱۲ نشان میدهد، هر ستون b-bin را نشان میدهد، و تعداد سؤالات مورد نیاز در آن bin، در ردیف دوم نشان دادهمیشود. ردیفهای زیرین، ID یا شمارههای سؤال با عدد مربوطه را نشان میدهد. همچنین سؤالات بر اساس میزان آگاهی که در حدود b-bin ایجاد میکنند، مرتب میشوند. سؤالاتی که در ردیفهای بالاتری قرار دارند، سؤالاتی هستند که بیشترین آگاهی را ایجاد میکنند. در عمل، سؤالاتی که در مرتبه بالاتری رتبهبندی میشوند، بدون توجه به bin که به آن تعلق دارند، ابتدا انتخاب میشوند. بنابراین، حتی اگر هر b-bin باز هم به تعداد معینی از سؤالات نیاز داشته باشد، سؤالات میتوانند از bin های دیگری انتخاب شوند. روش نموداری که برای انتخاب تعداد سؤالات مورد نیاز وجود دارد، تعداد دقیق سؤالات مورد نیاز برای هر b-bin که حداکثر آگاهی دارد را تعیین میکند. سؤالات خاصی که از بین همهی سؤالات انتخاب میشوند، سؤالات مورد نیاز برای خزانهی سؤال بهینه هستند.
نمودار ۲-۱۲: ترتیب سؤالات بر حسب بالاترین میزان آگاهی در هر b-bin
یکی از خطرهایی که این شیوه دارد، این است که سؤلاتی که آگاهی بیشتری در طول دامنهی سطوح ایجاد میکنند، ممکن است به دفعات بیشتری نسبت به آنچه طراحان آزمون میخواهند انتخاب و اجرا شوند، در یک b-bin، تعداد دفعات مورد انتظاری که یک سؤال اجرا میشود، به رتبهی میزان آگاهی که آن سؤال ایجاد میکند، بستگی دارد. در طول شبیهسازی خزانهی سؤال، تعداد دفعات مورد انتظاری که یک سؤال اجرا میشود، از طریق ثبت تعداد دفعاتی که یک سؤال از هر b-bin شبیهسازی و اجرا میشود، برآورد میشود. اگر سؤالی بیش از نرخ مواجهه هدف انتخاب شود، سؤال جدیدی که به همان ab-bin متعلق است، به خزانهی سؤال نهایی اضافه میشود. برای مثال نمودار ۲-۱۳ کاربرد مورد انتظار سؤال در هر b-bin برای ۸۰۰۰ آزمودنی را نشان میدهد، بهطوریکه سؤالات بر حسب میزان آگاهیشان مرتب شدهاند. انتظار میرود که سؤال ۱۰۹ -که در نمودار ۲-۱۳ نشان دادهشده است-، ۱۱۸۰۰ بار (۱۳۲۹+۲۴۷۱+۸۰۰۰)، انتخاب شود، این مقدار ۴۸/۰ بیشتر از سؤالی است که میتواند انتخاب شود. خزانهی سؤال بهینه، به یک سؤال دیگری در همان ab-bin نیاز دارد. اگر نرخ مواجهه هدف ۳۳/۰ باشد، بنابراین این سؤال ۴۳/۳ مرتبه بیش از نرخ مواجهه هدف است. بنابراین به ۴ سؤال دیگر از همان ab-bin نیاز داریم تا به خزانه اضافه کنیم. نمودار ۲-۱۴ و ۲-۱۵، یک طرح خزانهی سؤال را قبل و بعد از تعدیل بعد از شبیهسازی، نشان میدهد (ریکیسی، ۲۰۰۴، گو و ریکیسی، ۲۰۰۷).
نمودار ۲-۱۳: کاربرد سؤال به ترتیب بالاترین میزان آگاهی در هر b-bin
نمودار ۲-۱۴: توزیع سؤال خزانهی سؤال بهینه قبل از تعدیل
نمودار ۲-۱۵: توزیع سؤال خزانهی سؤال بهینه بعد از تعدیل پس از شبیهسازی
اعمال اصلاحاتی برای روش کنترل مواجهه
نرخ مواجهه یک سؤال، عبارت است از، تعداد دفعاتی که یک سؤال اجرا میشود، تقسیم بر تعداد آزمودنیها. در خلال فرایند طراحی خزانهی سؤال بهینه، سؤالات واقعی در دسترس نیستند، امّا سؤالات شبیهسازی شده، نمایندهی سؤالاتی از bin هایی که به آن تعلق دارند، میباشند. تعداد دفعاتی که سؤالات هر bin اجرا میشوند، برآورد تعداد مواجهه کناری سؤالات در یک bin است که بر تعداد سؤالات مورد نیاز در bin تقسیم میشود. اگر در اجرای CAT کنترل مواجهه اعمال نشود، الگوی طراحی خزانهی سؤال، بعد از تعدیل پس از شبیهسازی، بهطور مستقیمی از همین نسبتهای مواجهه پیروی میکند.
روش سیمپسون-هتر (۱۹۸۵)، مواجهه سؤال را با فهرست احتمالی k از طریق تعدیل تعداد دفعاتی که یک سؤال اجرا میشود، کنترل میکند. به سؤالاتی که بالقوه نسبت مواجهه بالایی دارند، مقدار k کوچکی اختصاص داده میشود، به طوریکه، احتمال اجرا سؤال را تا زیر نرخ مواجهه بیشینه، پایین آورد. زمانیکه به دلیل کنترل مواجهه سؤال، سؤال انتخاب شده اجرا نمیشود، آگاهی دهندهترین سؤال بعدی انتخاب میشود. هدف طراحی خزانهی سؤال بهینه با کنترل مواجهه سیمپسون-هتر این است که، علاوه بر بهینه بودن، طول آزمون، تعادل محتوایی و جنبههای دیگر آزمون را نیز وارد میکند، و این اطمینان را میدهد که کنترل مواجه تنها به میزان اندکی دقت آزمون را کاهش میدهد. با مطمئن شدن از اینکه سؤالات کافی در bin هایی که اغلب، سؤالات از آنها انتخاب میشوند، وجود دارند، به هدف طراحی بهینه خزانهی سؤال میرسیم.
همچنین روش مشابهی در تعدیل پس از شبیهسازی، برای حفظ سؤالات کافی در هر bin بهکار میرود. از آنجا که، تعداد دفعاتی که یک سؤال استفاده میشود، میتواند در طول فرایند طراحی خزانهی سؤال ثبت شود، اگر این تعداد به ( ) سؤال دیگر از همان bin برسد، به طوریکه نسبت مواجهه کل برای هر یک از سؤالات درون bin بزرگتر از r نشود، آن سؤال باقی میماند (ریکیسی، ۲۰۰۴، گو و ریکیسی، ۲۰۰۷).
ملاکهای ارزیابی خزانههای سؤال شبیهسازی شده
ملاکهای ارزیابی خزانهی سؤال عبارتاند از، میانگین آگاهی آزمون در هر سطح ، سوگیری یا بایاس، میانگین مجذور خطا (MSE) و ضرایب همبستگی بین های برآورد شده و واقعی، به منظور سنجش دقت برآورد . میزان چولگی یا کجی توزیع نرخ مواجهه سؤال، درصد سؤالات بیش مواجهه شده، نرخ همپوشی سؤال و درصد سؤالات کم مواجهه شده، همهی این شاخصها به منظور محاسبهی شاخص امنیت آزمون درنظر گرفتهمیشود. در زیر هر یک از آنها را به تفضیل توضیح میدهیم (چانگ و یینگ[۱۸۷] ،۱۹۹۹ ؛ ریکیسی ۲۰۰۵):
آگاهی شرطی آزمون[۱۸۸]
آگاهی آزمون عبارت است از، مجموع کل آگاهیهای فیشر هر یک از سؤالات در آزمون. در آزمونهای CAT که طول ثابت دارند، آگاهی آزمون به عنوان شاخص کارایی آزمون درنظر گرفته میشود. هرچه میزان آگاهی که یک آزمون ایجاد میکند، بیشتر باشد، کارایی آزمون نیز بیشتر است (گو، ۲۰۰۷).
خطای استاندارد شرطی اندازهگیری[۱۸۹] (CSEM)
در هر نقطهی ثابت ، خطای استاندارد اندازهگیری به شیوهی زیر محاسبه میشود:
(۲-۳۰)