دانلود مطالب در مورد طراحی و کاربرد الگوهای تهیه‌ی خزانه‌ی‌ سؤال در بهینه سازی کارکرد سنجش انطباقی ...

ارسال شده در 30 مهر 1400 توسط فاطمه کرمانی در بدون موضوع

ایجاد پارامتر  از طریق توزیع هدف
ایجاد پارامتر  از طریق  که  می‌تواند از طریق  به‌دست آمده در هر گام انتخاب سؤال تقریب زده شود و  از توزیع نرمال ((  )) پیروی می‌کند.
پارامتر  دوباره از طریق معادله‌ی (۲-۲۱) محاسبه می‌شود.
روش حداقل آگاهی آزمون^[۱۸۵]، (MTI)
روش MTI بر این فرض است که زمانی‌که آزمون‌های CAT مجزایی که از خزانه‌ی سؤال سرهم می‌شود، عیناً بتواند میزان آگاهی کافی مورد نظر را برای اندازه‌گیری توانایی آزمودنی فراهم کند، خزانه‌ی سؤال بهینه‌ محسوب می‌شود. اگر آزمون میزان آگاهی بیشتری بتواند ایجاد کند، آزمون با دقت بیشتری می‌تواند سطح توانایی آزمودنی را برآورد کند. با این ‌وجود، برای ساخت آزمونی که میزان آگاهی بیشتری بتواند ایجاد کند، به سؤالاتی با ضرایب تشخیص بالا نیاز داریم، در صورتی که معمولاً ساخت این نوع سؤالات گران و دشوار می‌باشد، مخصوصاً اگر سؤالات آسان باشد، این دشواری دو چندان می‌شود. روش MTI این اطمینان را به ما می‌دهد که آزمون‌ها دارای دقت کافی برای برآورد توانایی هستند، ولی شامل سؤالاتی با ضرایب تشخیص بسیار بالا نیستند. در روش MTI، یک مقدار آگاهی هدف برروی دامنه‌ای از مقیاس  قرار می‌دهد. هر سؤالی که برای آزمودنی اجرا می‌شود در مقدار آگاهی هدف آزمون، سهیم است. پارامترهای c (که از توزیع پارامتر c سؤالات عملیاتی بدست می‌آید) و پارامترهای b (که بر اساس برآورد جدید  برآورد می‌شود)، هر دو معلوم و مشخص هستند، پارامترهای a می‌تواند محاسبه شود. برای اجرای رویکرد حداقل آگاهی تست، گام اول، تعیین آگاهی هدف تست می‌باشد. براساس اطلاعات پیشین در مورد تست از روی خزانه‌ی عملیاتی و توزیع برآوردهای توانایی، حداقل آگاهی هدف تست می‌تواند از طریق دو معادله‌ی (۲-۲۵) و (۲-۲۶) تعیین شود:

(۲-۲۵)
(۲-۲۶)
؛ انحراف استاندارد برآوردهای توانایی را نشان می‌دهد.
؛ خطای استاندارد برآورد را نشان می‌دهد.
؛ آگاهی تست را نشان می‌دهد.
زمانی‌که  ، معلوم شد، پس از آن آگاهی مورد انتظاری که هر سؤال باید فراهم کند، می‌تواند از طریق تقسیم  بر طول تست بدست آید. با توجه به این واقعیت که آگاهی واقعی‌ای که یک سؤال می‌تواند ایجاد کند، مشروط به برآورد جدید توانایی، ممکن است کاملاً مطابق با آگاهی مورد انتظار نباشد، بنابراین، آگاهی هدف سؤال باید هر بار پس از این‌که یک سؤال اجرا می‌شود، به روز شود. معادله‌ی (۲-۲۷) برای به‌روز کردن آگاهی هدف سؤال به‌کار می‌رود.  ، آگاهی تست را نشان می‌دهد و  ، طول تست را نشان می‌دهد.
(۲-۲۷)
؛ مقدار تابع آگاهی هدف تست که از قبل تعیین شده است.
؛ مقدار تابع آگاهی‌ای از سؤالات تست که تا الان اجرا شده است.
؛ طول تست که از قبل مشخص شده است.
؛ طول تست، که تا الان اجرا شده است.
در روش MTI سؤالات را در سه مرحله ایجاد می‌شود:
تعیین میزان آگاهی که یک آزمون برای رسیدن به دقت قابل قبول برآورد  یک آزمودنی نیاز دارد. تجزیه‌ی آگاهی هدف (I) برای هر سؤال (i)، بر اساس معادله‌ی (۲-۲۷) بدست می‌آید.
به‌منظور پیروی از شیوه‌ای که CAT سؤالات را انتخاب می‌کند، یعنی، انتخاب سؤالاتی که بیشترین میزان آگاهی در برآورد جدید  دارند، آگاهی هدف نیز می‌تواند دستکاری و یا تغییر داده ‌شود، به‌طوری‌که با یک مقداری که به‌اندازه کافی معقول، بزرگ است، شروع شود، و همچنان‌که آزمون به جلو می‌رود، کاهش یابد، و مقدار آگاهی هدف مورد انتظار در چند سؤال آخر ثابت می‌شود. درصورتی‌که، در شبیه‌سازی روش کنترل مواجهه‌ a- مرتب شده (چانگ و یینگ، ۱۹۹۹)، آگاهی هدف در سطح پایین‌تری قرار می‌گیرد و سپس مقدار مورد انتظار افزایش می‌یابد، زیرا روش a- مرتب‌شده، ابتدا از سؤالاتی با پارامتر a پایین استفاده می‌کند.
ایجاد پارامتر  را از طریق توزیع هدف
بر اساس نظر لرد (۱۹۸۰)، رابطه‌ی بین  و پارامترهای سؤالی که بیشینه‌ی آگاهی شان در  می‌باشد، برابر با معادله‌ی (۲-۲۸) است:
(۲-۲۸)
D، عامل مقیاس‌سازی است و برابر با ۷/۱ می‌باشد. حداکثر آگاهی یک سؤال لوجستیک با پارامترهای خاص  و  که در  ایجاد می‌شود، برابر با معادله‌ی (۲-۱۷) است که برای یادآوری در زیر آورده شده است:

با دوباره نوشتن معادله و جایگذاری با می‌توان مقدار را به‌دست آورد، که در معادله‌ی (۲-۲۹) نشان داده شده است:
(۲-۲۹)

با فرض اینکه،  و  معلوم باشند، پارامتر a بهینه، می‌تواند از طریق معادله‌ی (۲-۲۹)به‌دست آید، البته به شرطی‌که، سؤال از مقدار حداقلی از آگاهی در برآورد جدید  برخوردار باشد.
محاسبه‌ی پارامتر b از طریق پارامترهای a و c با بهره گرفتن از معادله‌ی (۲-۲۱)، البته به شرط آنکه سؤالی که ایجاد می‌شود حداکثر آگاهی‌اش در  باشد(ریکیسی، ۲۰۰۴، گو و ریکیسی، ۲۰۰۷؛ هی و ریکیسی، ۲۰۱۰).
تعدیل پس از شبیه‌سازی^[۱۸۶]
در نتایج شبیه‌سازی خزانه‌ی سؤال، بردار  و ماتریس  ، تعداد سؤالات مورد نیاز برای هر bin که از طریق پارامتر a و b مشخص می‌شود، را نشان می‌دهند، مخصوصاً نشان می‌دهد که چه تعداد سؤال در فواصل پارامترهای b ، مقدار آگاهی معینی که مورد نیاز است را فراهم می‌کنند. از آنجا‌ که، bins هم بر اساس پارامترهای a و هم b تعریف می‌شوند، سؤالات در نقطه‌ای که حداکثر آگاهی در آن ایجاد می‌شود، دسته‌بندی می‌شوند. همچنان‌که در بالا ذکر شد، در شبیه‌سازی سؤالات این واقعیت درنظر‌گرفته‌نمی‌شود که سؤالاتی که به یک bin تعلق دارند، می‌توانند نسبت به سؤالاتی که به bin دیگری تعلق دارند که همان سطح  مورد نظر را در بر‌می‌گیرد، آگاهی بیشتری ایجاد کنند. برای مثال، نمودار ۲-۱۱ نشان می‌دهد که سؤالات متعلق به ab-bin برابر با  ممکن است آگاهی بیشتری در  بین  و  نسبت به سؤالات ab-bin برابر با  ایجاد کند، اگرچه، سؤالاتی که درab-bin=B ، قرار دارند، حداکثر میزان آگاهی‌شان روی همان دامنه‌ی  موردنظر خواهد بود. به‌عبارت دیگر، در شیوه‌ی انتخاب سؤال، سؤالی که در ab-bin=A قرار دارد بیش از سؤالی که در ab-bin=B قرار می‌گیرد، برای برآوردهای  حدود  تا  ، انتخاب خواهد‌شد.
نمودار ۲-۱۱: نمایش سؤالات در یک bin که آگاهی بیشتری نسبت به سؤالات در bin دیگر نشان می‌دهد
بنابراین، عملاً خزانه‌ی سؤال بهینه، به تعداد کافی از سؤالاتی نیاز دارد که آگاهی به‌اندازه‌ی کافی بزرگ، در هر b-bin ایجاد کند، البته بدون توجه به bin که سؤالات به آن تعلق دارند. خزانه‌ی سؤالی که دقیقاً بر اساس تعداد سؤالات مورد نیاز الگویی که از شبیه‌سازی خزانه‌ی سؤال به‌دست آمده، ساخته می‌شود، دارای سؤالات اضافی خواهد بود.
این سؤالات با بهره گرفتن از یک جدول آگاهی مرتب می‌شوند. این جدول برای انتخاب سؤالاتی با بالاترین میزان آگاهی از bin هایی که از طریق شیوه‌ی شبیه‌سازی تعریف شده‌اند، ساخته می‌شود. این کار به شکل دادن طرح پایانی خزانه‌ی سؤال کمک می‌کند. برای به‌دست آوردن بالاتررین میزان آگاهی سؤال برای هر b-bin، نقاط میانی b-bin ها به عنوان لنگر سطح  عمل می‌کند و نقاط میانی a-bin، به عنوان پارامتر a و نقاط میانی b-bin به عنوان پارامتر b ، و نمایانگر bin هستند که سؤال از آن به‌دست می‌آید. برای مثال سطوح  هایی که برای تشکیل جدول آگاهی مورد نیاز است، عبارت است از؛  ، بنابراین سؤالی با پارامترهای  ، سؤالی است که به bin برابر با  را نشان می‌دهد. اگر سه سؤال از این bin مورد نیاز باشد، سه سؤال با پارامترهای یکسان به جدول آگاهی وارد می‌شوند. در این شیوه برای نشان دادن تعداد سؤالات مورد نیاز در هر bin سؤالات مناسبی انتخاب می‌شوند.
همچنان‌که نمودار ۲-۱۲ نشان می‌دهد، هر ستون b-bin را نشان می‌دهد، و تعداد سؤالات مورد نیاز در آن bin، در ردیف دوم نشان داده‌می‌شود. ردیف‌های زیرین، ID یا شماره‌های سؤال با عدد مربوطه را نشان می‌دهد. همچنین سؤالات بر اساس میزان آگاهی که در حدود b-bin ایجاد می‌کنند، مرتب می‌شوند. سؤالاتی که در ردیف‌های بالاتری قرار دارند، سؤالاتی هستند که بیشترین آگاهی را ایجاد می‌کنند. در عمل، سؤالاتی که در مرتبه بالاتری رتبه‌بندی می‌شوند، بدون توجه به bin که به آن تعلق دارند، ابتدا انتخاب می‌شوند. بنابراین، حتی اگر هر b-bin باز هم به تعداد معینی از سؤالات نیاز داشته باشد، سؤالات می‌توانند از bin های دیگری انتخاب شوند. روش نموداری که برای انتخاب تعداد سؤالات مورد نیاز وجود دارد، تعداد دقیق سؤالات مورد نیاز برای هر b-bin که حداکثر آگاهی دارد را تعیین می‌کند. سؤالات خاصی که از بین همه‌ی سؤالات انتخاب می‌شوند، سؤالات مورد نیاز برای خزانه‌ی سؤال بهینه هستند.
نمودار ۲-۱۲: ترتیب سؤالات بر حسب بالاترین میزان آگاهی در هر b-bin
یکی از خطرهایی که این شیوه دارد، این است که سؤلاتی که آگاهی بیشتری در طول دامنه‌ی سطوح  ایجاد می‌کنند، ممکن است به دفعات بیشتری نسبت به آنچه طراحان آزمون می‌خواهند انتخاب و اجرا شوند، در یک b-bin، تعداد دفعات مورد انتظاری که یک سؤال اجرا می‌شود، به رتبه‌ی میزان آگاهی که آن سؤال ایجاد می‌کند، بستگی دارد. در طول شبیه‌سازی خزانه‌ی سؤال، تعداد دفعات مورد انتظاری که یک سؤال اجرا می‌شود، از طریق ثبت تعداد دفعاتی که یک سؤال از هر b-bin شبیه‌سازی و اجرا می‌شود، برآورد می‌شود. اگر سؤالی بیش از نرخ مواجهه‌ هدف انتخاب شود، سؤال جدیدی که به همان ab-bin متعلق است، به خزانه‌ی سؤال نهایی اضافه می‌شود. برای مثال نمودار ۲-۱۳ کاربرد مورد انتظار سؤال در هر b-bin برای ۸۰۰۰ آزمودنی را نشان می‌دهد، به‌طوری‌که سؤالات بر حسب میزان آگاهی‌شان مرتب شده‌اند. انتظار می‌رود که سؤال ۱۰۹ -که در نمودار ۲-۱۳ نشان داده‌شده است-، ۱۱۸۰۰ بار (۱۳۲۹+۲۴۷۱+۸۰۰۰)، انتخاب شود، این مقدار ۴۸/۰  بیشتر از سؤالی است که می‌تواند انتخاب شود. خزانه‌ی سؤال بهینه، به یک سؤال دیگری در همان ab-bin نیاز دارد. اگر نرخ مواجهه‌ هدف ۳۳/۰ باشد، بنابراین این سؤال ۴۳/۳ مرتبه بیش از نرخ مواجهه‌ هدف است. بنابراین به ۴ سؤال دیگر از همان ab-bin نیاز داریم تا به خزانه اضافه کنیم. نمودار ۲-۱۴ و ۲-۱۵، یک طرح خزانه‌ی سؤال را قبل و بعد از تعدیل بعد از شبیه‌سازی، نشان می‌دهد (ریکیسی، ۲۰۰۴، گو و ریکیسی، ۲۰۰۷).
نمودار ۲-۱۳: کاربرد سؤال به ترتیب بالاترین میزان آگاهی در هر b-bin
نمودار ۲-۱۴: توزیع سؤال خزانه‌ی سؤال بهینه قبل از تعدیل
نمودار ۲-۱۵: توزیع سؤال خزانه‌ی سؤال بهینه بعد از تعدیل پس از شبیه‌سازی
اعمال اصلاحاتی برای روش کنترل مواجهه
نرخ مواجهه‌ یک سؤال، عبارت است از، تعداد دفعاتی که یک سؤال اجرا می‌شود، تقسیم بر تعداد آزمودنی‌ها. در خلال فرایند طراحی خزانه‌ی سؤال بهینه، سؤالات واقعی در دسترس نیستند، امّا سؤالات شبیه‌سازی شده، نماینده‌ی سؤالاتی از bin هایی که به آن تعلق دارند، می‌باشند. تعداد دفعاتی که سؤالات هر bin اجرا می‌شوند، برآورد تعداد مواجهه‌ کناری سؤالات در یک bin است که بر تعداد سؤالات مورد نیاز در bin تقسیم می‌شود. اگر در اجرای CAT کنترل مواجهه اعمال نشود، الگوی طراحی خزانه‌ی سؤال، بعد از تعدیل پس از شبیه‌سازی، به‌طور مستقیمی از همین نسبت‌های مواجهه پیروی می‌کند.
روش سیمپسون-هتر (۱۹۸۵)، مواجهه‌ سؤال را با فهرست احتمالی k از طریق تعدیل تعداد دفعاتی که یک سؤال اجرا می‌شود، کنترل می‌کند. به سؤالاتی که بالقوه نسبت مواجهه‌ بالایی دارند، مقدار k کوچکی اختصاص داده می‌شود، به طوری‌که، احتمال اجرا سؤال را تا زیر نرخ مواجهه‌ بیشینه، پایین آورد. زمانی‌که به دلیل کنترل مواجهه‌ سؤال، سؤال انتخاب شده اجرا نمی‌شود، آگاهی دهنده‌ترین سؤال بعدی انتخاب می‌شود. هدف طراحی خزانه‌ی سؤال بهینه با کنترل مواجهه‌ سیمپسون-هتر این است که، علاوه بر بهینه بودن، طول آزمون، تعادل محتوایی و جنبه‌های دیگر آزمون را نیز وارد می‌کند، و این اطمینان را می‌دهد که کنترل مواجه تنها به میزان اندکی دقت آزمون را کاهش می‌دهد. با مطمئن شدن از اینکه سؤالات کافی در bin هایی که اغلب، سؤالات از آنها انتخاب می‌شوند، وجود دارند، به هدف طراحی بهینه خزانه‌ی سؤال می‌رسیم.
همچنین روش مشابهی در تعدیل پس از شبیه‌سازی، برای حفظ سؤالات کافی در هر bin به‌کار می‌رود. از آنجا که، تعداد دفعاتی که یک سؤال استفاده می‌شود، می‌تواند در طول فرایند طراحی خزانه‌ی سؤال ثبت شود، اگر این تعداد به (  ) سؤال دیگر از همان bin برسد، به طوری‌که نسبت مواجهه‌ کل برای هر یک از سؤالات درون bin بزرگتر از r نشود، آن سؤال باقی می‌ماند (ریکیسی، ۲۰۰۴، گو و ریکیسی، ۲۰۰۷).
ملاک‌های ارزیابی خزانه‌های سؤال شبیه‌سازی شده
ملاک‌های ارزیابی خزانه‌ی سؤال عبارت‌اند از، میانگین آگاهی آزمون در هر سطح  ، سوگیری یا بایاس، میانگین مجذور خطا (MSE) و ضرایب همبستگی بین  های برآورد شده و واقعی، به منظور سنجش دقت برآورد  . میزان چولگی یا کجی توزیع نرخ مواجهه‌ سؤال، درصد سؤالات بیش مواجهه شده، نرخ همپوشی سؤال و درصد سؤالات کم مواجهه شده، همه‌ی این شاخص‌ها به منظور محاسبه‌ی شاخص امنیت آزمون درنظر گرفته‌می‌شود. در زیر هر یک از آنها را به تفضیل توضیح می‌دهیم (چانگ و یینگ^[۱۸۷] ،۱۹۹۹ ؛ ریکیسی ۲۰۰۵):
آگاهی شرطی آزمون^[۱۸۸]
آگاهی آزمون عبارت است از، مجموع کل آگاهی‌های فیشر هر یک از سؤالات در آزمون. در آزمون‌های CAT که طول ثابت دارند، آگاهی آزمون به عنوان شاخص کارایی آزمون درنظر گرفته می‌شود. هرچه میزان آگاهی که یک آزمون ایجاد می‌کند، بیشتر باشد، کارایی آزمون نیز بیشتر است (گو، ۲۰۰۷).
خطای استاندارد شرطی اندازه‌گیری^[۱۸۹] (CSEM)
در هر نقطه‌ی ثابت  ، خطای استاندارد اندازه‌گیری به شیوه‌ی زیر محاسبه می‌شود:
(۲-۳۰)

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

جستجو

موضوعات

فیدهای XML