منابع آموزشی/ارزیابی و پرسشنامه،روانسنجی

روان سنجی، ارزیابی و پرسشنامه

تعریف روان سنجی

لرد کلوین (Kelvin Lord) در جمله ای مطرح کرده است:«اگر بتوانید آنچه را که درباره اش صحبت می کنید، اندازه بگیرید و آن را به صورت کمی بیان کنید، میتوانید مدعی باشید که درباره آن چیزی می دانید، وگرنه دانش شما درباره آن اندک و نارساست». گفته کلوین بیانگر یک واقعیت علمی است. چنانکه روانشناسی از هنگامی به صورت یک علم مستقل درآمد که به آزمایشگاه کشیده شد، پدیدههای روانی به صورت عینی و عملیاتی تعریف گردید و مورد اندازهگیری قرار گرفت. این واقعیت که افراد از نظر استعداد، شخصیت و رفتار تفاوت دارند و اینکه این تفاوتها را میتوان مورد سنجش قرار داد، احتمال از ابتدای تاریخ مکتوب زندگی انسان مورد توجه بوده است

به طور کلی یکی از هدف های عمده علم، اندازه گیری پدیده های مورد نظر و جنبه کمی دادن به آنهاست. وقتی پدیده ها با اعداد نشان داده می شوند به راحتی میتوان آنها را طبقه بندی کرد و قوانینی درباره آنها به دست آورد. سنجش و اندازه گیری در زندگی انسان سابقه ای بس طولنی و قدمتی برابر تاریخ بشر دارد. انسانها در دوران کهن همواره برای مقابله با رقبای خود یا دفاع و مبارزه در مقابل یورشهای قبایل دیگر، به ارزیابی قدرت خویش و دشمن میپرداختند و پس از آن وارد عمل می شدند

سنجش و اندازه گیری روانی و بسط و توسعه آن در علوم تربیتی و روانشناسی در قرن نوزدهم و از زمانی شروع میشود که روانشناسی تحت تأثیر علوم فیزیک و زیست شناسی رابطه اش از فلسفه گسسته میشود و از شناخت و اهمیت روان دست میکشد و به مطالعه رفتار به عنوان موضوع عینی و مشاهدهپذیر نظیر آنچه در سایر علوم تجربی دیگر وجود داشت می پردازد

پیدایش و توسعه شیوه های اندازه گیری در روانشناسی و علوم تربیتی نتیجه تأثیر سه عامل عمده اساسی بود. عامل مهمی که به پیدایش و پیشرفت سنجشهای روانی کمک شایانی کرد، تلاش های فرانسیس گالتون (Galton Francis) و مککین کتل (Cattle keen Mc) در مورد تفاوت های فردی بود. گالتون معتقد بود که بین توانایی های ذهنی و تمییز حسی، رابطه وجود دارد. هر چه میزان هوش بالتر باشد سطح تمییز حسی نیز بالتر است. بررسی تفاوتهای فردی مستلزم ابزار آلت مختلفی بود که به وسیله آنها بتوان هوش و تواناییهای مختلف را اندازهگیری کرد. به همین مناسبت آزمونهای مختلفی ابداع کردند و روشهای آماری خاصی برای کمی ساخت نتایج آزمونها پدید آوردند.

تعریف اندازه گیری

ورثن و ساندرز (Sanders and Worthen) در سال ۱۹۸۷ گفتند، اندازه گیری (Measurement) که معمول در معنای وسیع تری از آزمودن به کار می رود، عبارت است از: توصیف کمی رفتار، اشیاء و وقایع و تعیین کمیت و خصوصیتی که یک چیز یا یک واقعه دارای آن است. اندازهگیری صرفا یک جریان جمعآوری اطلعات است که با استفاده از آنها به تعمیم و ارزشیابی و داوری میپردازیم. اندازهگیری، اگرچه تحقیق و ارزشیابی نیست اما، یک ابزار کلیدی در تحقیق و ارزشیابی هست
در مواردی که نتیجه اندازه گیری با مقیاس عددی قابل تطبیق است میتوان گفت: اندازهگیری عبارت است از اختصاص دادن اعداد به مقادیر مختلف از صفات، بر حسب قواعد معین که صحت آنها را میتوان از راه آزمایش بررسی کرد

تعریف ارزشیابی

ارزشیابی، عبارت است از آزمودن یک پدیده و قضاوت درباره ارزش، کیفیت، اهمیت، میزان یا درجه آن پدیده با توجه به ملکهای معین به منظور عمل تصمیم گیری
ارزشیابی، فرایندی است که مشتمل بر اندازهگیری و احتمال آزمودن است ولی همچنین مفهوم داوری ارزشی را نیز با خود دارد. به طور مثال، اگر معلمی یک آزمون علوم را در یک کلس اجرا کرده و درصد پاسخهای صحیح را محاسبه کند، اندازهگیری و آزمون انجام گرفته است. نمرهها باید تفسیر شود، یعنی ممکن است آنها را به صورت های مختلف ارزشگذاری کرده و یا در مورد آنها داوری کرد و به عنوان عالی، خوب، متوسط و ضعیف، طبقه بندی نمود. این فرایند، به این دلیل که در آن داوری ارزشی(آشکار یا پنهان) انجام شده است ارزشیابی خواهد بود. اگرچه غالبا ارزشیابی شامل ترکیبی از اطلاعات است که از دو یا چند منبع نظیر نمرههای آزمون، ارزشها و برداشتها تحصیل میگردد ولی گاهی نیز منحصرا مبتنی بر یافته های عینی است. به طور کلی ارزشیابی در هر موقعیتی مشتمل بر یک داوری ارزشی است. باید توجه کرد که اندازهگیری همواره به ارزشیابی منتهی نمی شود. اندازهگیری میتواند بدون قضاوت کردن یا اتخاذ یک تصمیم نیز انجام شود. از آنچه گفته شد آشکار میشود که اندازه گیری را نباید با ارزشیابی یکسان دانست

تفاوت بین اندازه گیری و ارزشیابی

الف: ارزشیابی جامعتر از اندازه گیری است، به گونهای که علوه بر جنبههای کمی، جنبههای کیفی رفتار را در برمی گیرد
ب: تفاوت مهم دیگری که بین اندازه گیری و ارزشیابی وجود دارد، به هدف اصلی آنها ارتباط پیدا می کند. ارزشیابی معمول در جهت داوری درباره ارزش یک برنامه کلی، و گاه داوری درباره کارآمدی یک برنامه برای گروه بخصوصی از افراد هدایت میشود، در حالی که اندازهگیری ضمن آنکه پایه و اساس ارزشیابی درست و دقیق را تشکیل میدهد، با واقعیات سروکار دارد و هرگز شامل داوری ارزشی(judgment value (نیست
به طور کلی تحقیق درباره اندازهگیری، تهیه آزمونها و تعیین روایی و کاربرد آنها و یا به طور مختصر، در علم روانشناسی مجموعه شیوههایی که به ما کمک میکند تا ویژگی های روانی انسان را از حالت کیفی به حالت کمی درآوریم اصطلحا روش روانسنجی نامیده میشود. روانسنجی در معنای وسیع کلمه یعنی استفاده از روش آزمایش، اما در معنای محدود کلمه یعنی بهرهگیری از آزمونها

اصول روان سنجی

فهرست
اندازه گیری و ارزیابی
اهداف کاربردی اندازهگیری و آزمون روانی
ملحظات اخلقی در اندازهگیری و استفاده از آزمونها
مراحل اندازهگیری
تعریف ازمون
ارزیابی
روانسنجی
مراحل ارزشیابی
طبقهبندی آزمونها
مراحل به کارگیری آزمون
مراحل آزمونسازی
فرایند تدریس و آموزش اثربخش
فرایند ارزشیابی پیشرفت تحصیلی
طبقه بندی هدفهای آموزشی
طبقه بندی سیمپسون از حوزه روانی ـ حرکتی
طبقه بندی آزمونهای پیشرفت تحصیلی
اجرای آزمونهای پیشرفت تحصیلی
نمره گذاری آزمون
تجزیه و تحلیل آزمونهای عینی
تجزیه و تحلیل نتایج آزمونهای تشریحی
تحلیل گزینه های انحرافی
مراحل تحلیل گزینههای انحرافی
ضریب تمیز و دشواری سوال های تشریحی
تحلیل سئوالهای آزمونهای ملک مرجع
پایایی ازمون
روشهای برآورد پایایی آزمونهای هنجار مرجع
روش کوادر ـ ریچاردسون
روش ضریب آلفا
روشهای برآورد پایایی آزمونهای ملک مرجع
اعتبار ازمون
انواع اعتبار
اندازهگیری و ارزشیابی در آموزش و پرورش
امتحان
تهیه پرسشهای امتحان
اجرای امتحان
آزمون وانواع آن
تجزیه و تحلیل پرسشهای آزمون
روائی آزمون
اعتبار آزمون
نرم یا هنجار
آزمونهای هوشی
آزمونهای شخصیت
آزمون خودسنجی

اندازه گیری و ارزیابی

اندازه گیری و ابزار آن، یکی از مهارتهای حرفهای مشاوران و روانشناسان است، اما نگرش مشاوران نسبت به آن متفاوت است، بعضی از آنها روشهای زیادی را که ممکن است دربرگیرنده مصاحبههای پذیرشمفصل یا شرح حالو نظامهای طبقهبندی تشخیصی (مثل IV-DSM یا ICD10 (باشند را مورد استفاده قرار میدهند، ولی عدهای دیگر نظر مثبتی نسبت به آن ندارند و گاهی آن را زیانبار میدانند .مخالفان استفاده از آزمون در مشاوره و روانشناسی معتقدند که اندازهگیری بیش از حد روی مفاهیم پیچیده تکیه میکند و فهم واقعی مراجعان را نیز به دنبال ندارد
علیرغم این انتقادات، آزمون در کار مشاوره و رواندرمانی نقش اساسی دارد و میتواند وسیله مناسبی در مشاوره و روانشناسی باشد. ارزیابی روانی را میتوان به صورتهای مختلفی تعریف کرد. فیرس و تراول(۱۹۹۷ (معتقدند که ارزیبیای روانی عبارت است از ارزشیابی نقاط قوت و ضعف فرد، مفهومسازیمشکل (و عوامل سببشناختی احتمالی) و تجویز راهکار جهت کاهش مشکل، کتلر و براون (۲۰۰۰ (این فعالیت را یک فرایند چند بعدی برای تعیین ویژگیهای فردی، استعداد، پیشرفتها و صفات شخص میدانند که شامل کارکردهای متنوعی مانند آزمودن یا ارزشیابی میشود

اهداف کاربردی اندازه گیری و آزمون روانی

الف) گزینش (انتخاب): بعضی اوقات مشاوران و روانشناسان، آزمونها را برای استفاده در تصمیمگیریهای گزینشی به کار میبرند. آزمونهای گزینش و سایر ابزارهای اندازه گیری به منظور تصمیمگیری در مورد پذیرش یا رد داوطلبان ورود به یک سازمان مورد استفاده قرار میگیرند. آزمون هایی که برای تصمیم گیری های گزینشی مورد استفاده قرار میگیرند باید بتوانند موفقیت و شکست افراد را با کمترین احتمال خطا برای موسسات و افراد (داوطلبان) پیشبینی کنند

ب) جایگزینی (جایابی) و طبقه بندی: آزمون های جایگزینی یا جایابی معمولً بعد از انتخاب داوطلبان و برای انتقال افراد به سطوح مختلف و یا انواع طبقه ها، اجرا میشوند
تصمیمگیری جایگزینی یا جایابی شامل گروهبندی عمودی افراد در یک شغل خاص، برنامه یا موضوع واحد است. آزمونهای طبقه بندی برای قرار دادن افراد در برنامههای بهینه و به منظور افزایش احتمال موفقیت آنها طراحی شدهاند. مانند جایگزینی در تصمیم گیری های طبقه بندی فرد، فرض بر این است که افراد قبلً انتخاب شدهاند ولی برخلف آزمونهای جایگزینی، طبقهبندی شامل گروهبندی افقی افراد در شغلها یا برنامه های آموزشی مختلف است

ج) تشخیصو ترمیم: آزمونهای تشخیص، توانمندیها و ضعف افراد را به منظور ارتقای عملکرد و رفاه او مشخص میکنند. مشاور و معلم قبل از ارایه کمک های ترمیمی خود باید بداند که دانشآموز یا مراجع در چه زمینه ای مشکل دارد

د) بازخورد: بازخورد فرایند اطلعرسانی به والدین، معلمان و مدیران و خود دانشآموزان درباره پیشرفتهای تحصیلی خودشان است. شواهد زیادی وجود دارند که نشان میدهند آگاهی از نتایج، یادگیری دانشآموزان را ارتقا میدهد

هـ) راهنمایی و انگیزش یادگیری: برخی اوقات آزمونها برای ایجاد انگیزه و هدایت دانشآموزان به یادگیری مورد استفاده قرار میگیرند. چون دانشآموزان با توجه به نوع امتحان مورد انتظار به مطالعه میپردازند، مسئولیت معلم آن است که امتحاناتی را برگزار کند که هدفهای معلم را اندازهگیری کنند. اگر سئوالها به محتوای ناچیز و پیش پا افتاده مربوط باشند، دانشآموزان ممکن است برای مطالعه به میزان ناچیزی برانگیخته شوند

ز) ارتقای برنامه آموزش: اندازهگیری میتواند برای تصمیمگیری در مورد برنامه آموزشی ارزشمند باشد. معلم از طریق آزمون میتواند میزان اثربخشی روشهای تدریس خود را مشخص سازد و در صورت عدم اثربخشی یا اثربخشی کم، با اصلح آنها برنامه آموزشی را ارتقا دهد

ل) تولید و تدوین نظریه: در کنار استفادههای عملی، آزمونها همچنین به تدوین نظریههای تربیتی و روانشناختی کمک میکنند. برای مثال، رشد و تحول کودک به میزان زیادی نتیجه آزمون شخصیت، هوش، استعداد، رغبت، نگرش و پیشرفت کودکان در مراحل مختلف رشد است
ملحظات اخلقی در اندازه گیری و استفاده از آزمونها

ـ صلاحیت
یکی از مهمترین اصول اخلقی در ارزیابی روانی، صلحیت است. وینر(۱۹۸۹) بیان میدارد که در کار با ابزار تشخیص روانی، صلحیت بدون اخلقی بودن امکانپذیر است ولی اخلقی عمل کردن بدون داشت صلحیت، امکانپذیر نیست

ـ رضایت آگاهانه
دومین اصل مهم اخلقی در اندازهگیریهای روانی، رضایت آگاهانه مراجع است. این اصل و موضوع توسط انجمن روانشناسی آمریکا (۲۰۰۲ (در استاندارد ۳/۱۰ ضوابط اخلقی خود به صورت کلی مورد تاکید قرار گرفته و ذکر گردیده است که روانشناسان هنگام ارائه خدمات مختلف با استفاده از زبان قابل فهم برای شخص یا اشخاص، باید رضایت آگاهانه آنها را جلب کنند، مگر در مواردی که به قانون و مقررات اجرای خدمات را بدون جلب رضایت مجاز شمرده باشد
رضایت شامل سه قسمت مجزاست: داوطلبی، صلحیت و اطلعات (هرسن، ۲۰۰۴ .(داوطلبی به این اشاره میکند که آزماینده رضایت متقاضی و داوطلب را بدون اعمال زور، اجبار یا فشار کسب کند
صلحیت به این امر اشاره میکند که داوطلب آزمون باید از لحاظ قانونی برای اظهار موافقت، شایستگی و شرایط لزم را داشته باشد. بزرگسالن معمولً از لحاظ قانونی شرایط لزم را برای اظهار موافقت دارند ولی کودکان معمولً فاقد این شرایط میباشند، لذا در مواجهه با کودکان، رضایت والدین یا مراقبان قانونی آنها باید اخذ شود
اطلعات یعنی اینکه داوطلب آزمون باید اطلعات لزم و ضروری برای رضایت را اخذ کرده باشد. به عبارت دیگر، آزماینده باید اطلعات کافی را در اختیار داوطلب قرار دهد تا با استفاده از این اطلعات، او بتواند در مورد شرکت در اندازهگیریهای روانی به تصمیمگیری آگاهانه دست بزند

ـ رازداری
سومین اصل اخلقی در اندازهگیریهای روانی، رازداری است. اعتماد، شالوده ارتباط مشاورهای و هسته ایجاد و حفظ اعتماد اصل رازداری است . انجمن مشاوره امریکا (۲۰۰۲) در استاندارد ۴/۰۱ ضوابط اخلقی خود رازداری را مورد تاکید قرار داده و بیان میدارد که روانشناس موظف است برای محافظت از اطلعات محرمانه کسب شده از مراجع در خلال جلسات، احتیاطهای لزم را به عمل آورد
استیونس اندازه گیری را اختصاص اعداد و ارقام به موضوعات یا رویدادها (رفتارها، ویژگیها یا پاسخها) بر طبق قانون و قاعده میداند. تریتسچلر (۲۰۰۰) نیز اندازهگیری را فرایند نظامدار برای نسبت دادن ارزشهای عددی به یک صفت یا ویژگی میداند. سیف میگوید: اندازهگیری عبارت است از فرایندی که تعیین میکند یک شخص یا یک شیء چه مقدار از یک ویژگی برخوردار است

مراحل اندازه‌گیری

۱. تعریف عملیاتی صفت مورد اندازهگیری: منظور از تعریف عملیاتی این است که صفت مورد اندازهگیری طوری تعریف شود که همگان در مورد آن درک یکسان و واقعی داشته باشند
۲ـ تهیه ابزار اندازه گیری: دومین گام در اندازهگیری یک صفت، تهیه وسیلهای است که به کمک آن بتوان صفت موردنظر را اندازه گرفت، مانند قدسنج برای اندازهگیری قد و یا ترازو برای اندازه گیری وزن. برای ویژگیهای روانی مانند هوش، استعداد، معلومات و غیره، این وسیله باید به طریقی ساخته شود که بروز رفتارهای موردنظر را به صورتی که تعریف شده اند، موجب گردد.ً به صورت مقیاسه ای کمی بیان می شوند.
۳ـ تهیه مقیاس اندازهگیری: از آنجا که نتایج اندازهگیریهای روانی و تربیتی غالبا مقیاسی در نظر گرفته شود به عبارت دیگر، در این مرحله باید واحدهای اندازهگیری که برای نسبت دادن اعداد به اشیا و ارقام مورد استفاده قرار میگیرد، مشخص شود
۴ـ اجرای اندازهگیری: بعد از ارائه تعریف عملیاتی و دقیق ویژگی که قصد اندازهگیری آن را داریم و پس از تعیین ابزار مناسبی برای اندازهگیری آن تهیه و مقیاس کمی نیز مشخص گردید، ابزار اندازهگیری اجرا و عمل اندازهگیری انجام میگیرد و نتایج به صورت ارزشهای عددی ارائه می شوند

تعریف آزمون

اندازه گیری فرایندی است برای نسبت دادن اعداد و ارقام به ویژگیهای اشیا و افراد. دو نوع اندازهگیری وجود دارد: اندازهگیری فیزیکی و اندازهگیری روانشناختی.در اندازهگیری فیزیکی، اعداد و ارقام به ویژگیهای فیزیکی افراد و اشیا مثل قد، طول و وزن اختصاص مییابد و در اندازهگیری روانشناختی اعداد و ارقام به ویژگیهای روانی افراد مثل هوش، استعداد، رغبت و … نسبت داده میشوند
«آزمون وسیله و ابزاری است برای اندازه گیری غیرمستقیم صفات و ویژگی های روانی.» آناستازی (۱۹۹۷) معتقد است که آزمون وسیله کم یا بیش اسرارآمیزی نیست، بلکه کوششی است برای اندازهگیری نمونهای از رفتار فرد به صورت عینی و پیوسته . به عبارت دیگر آزمون وسیلهای عینی و هنجارشده . برای اندازهگیری نمونهای از رفتار فرد است
ارزیابی
تریتسچلر (۲۰۰۰) ارزیابی را از لحاظ ذهنی فرایندی برای کمی کردن یا از لحاظ کیفی فرایندی برای توصیف یک صفت یا ویژگی میداند. بنتام (۲۰۰۲) ارزیابی را وسیلهای میداند که مستلزم جمعآوری دادهها برای تصمیمگیری است. هوهینشل و گتز (۲۰۰۱ (ارزیابی را فرایند کسب اطلعات برای استفاده در فرایند تشخیص میدانند. آن معتقدند که دادههای اندازهگیری از طریق فنون رسمی و غیررسمی متنوعی شامل آزمونهای استاندارد، پرسشنامه ها، مصاحبه تشخیصی، معاینه وضعیت روانی، مشاهده رفتار و گزارشهای سایر افراد مانند والدین، دوستان و همسر، جمع آوری می شوند

روانسنجی

به نظر کلین (۱۹۹۸ ،(روانسنجی به عنوان یک علم بر اندازهگیری ویژگیهای روانشناختی مانند توانایی، شخصیت، انگیزش و … مربوط میشود. ریبر (۱۹۸۵ (معتقد است که اصطلح روانسنجی دو معنی دارد؛ اولین معنی آن به هر شکلی از سنجش روانی اشاره دارد، نظیر اندازهگیری ویژگیهای شخصیتی، تعیین شاخص های هوش و تعیین استعداد افراد برای ورود به حرفههای مختلف. معنی دوم این اصطلح به کاربرد اصول ریاضی و آماری و تجزیه و تحلیل دادههای روانشناسی اشاره دارد، یعنی هر گونه تجزیه و تحلیل دادههای روانشناسی را میتوان روانسنجی دانست
تریستچلر (۲۰۰۰ (معتقد است، ارزشیابی فرایندی است که در آن براساس دادههای کمی و کیفی حاصل از سنجش و اندازهگیری، به قضاوت و داوری پرداخته می شود
ارزیابی، اندازه گیری، و روانسنجی مقدمهای برای ارزشیابی هستند. به این صورت که، از طریق ارزیابی، اندازهگیری، آزمون و روانسنجی، اطلعا جمعآوری و تجزیه و تحلیل می شود، سپس از طریق فرایند ارزشیابی تعبیر و تفسیر شده و در نهایت در مورد آن ویژگی یا خصوصیت قضاوت ارزشی انجام میگیرد

مراحل ارزشیابی

ـ تعیین هدفهای ارزشیابی
در این مرحله ارزشیاب تعیین میکند که چه موضوعی را و برای رسیدن به چه هدفی مورد ارزشیابی قرار خواهد داد

ـ تدوین طرح ارزشیابی
ارزشیاب پس از تعیین و تعریف هدفهای ارزشیابی باید برای رسیدن به اهداف تعیین شده، طرح مناسبی را تدوین کند

ـ اجرای طرح ارزشیابی و جمعآوری داده ها
بعد از تعیین هدفها و تدوین طرحی مناسب برای ارزشیابی، طبق طرحریزی انجام شده، طرح ارزشیابی اجرا میگردد و دادههای مورد نیاز گردآوری میشد

ـ تحلیل و تفسیر داده ها
بعد از اجرای طرح ارزشیابی و جمعآوری دادههای مورد نیاز، این دادهها مورد تجزیه و تحلیل و تفسیر قرار میگیرند و نتایجی از آنها حاصل میشود

ـ استفاده از یافته های ارزشیابی
بعد از تحلیل دادهها و تعیین یافتههای ارزشیابی، با توجه به اینکه هدف ارزشیابی، ارتقا و بهبود وضع (برنامه، دوره، مداخله و …) موجود است، نتایج به دست آمده از ارزشیابی باید مورد استفاده قرار گیرند

طبقه بندی آزمون‌ها

براساس مقایسه نتایج آزمون با نتایج گروه های مشابه خارج از کلاس (آزمونهای استاندارد شده و معلم ساخته)
گروه یا حیطه ای که افراد با آن مقایسه می‌شوند (آزمون‌های هنجار مرجع و ملک مرجع)
تعداد اشخاصی که آزمون در مورد آنها اجرا میشود (آزمون‌های فردی و گروهی)
معیار نمره‌گذاری (آزمونهای عینی و ذهنی)
میزان زمان اختصاص یافته برای پاسخگویی (آزمون‌های قدرت و سرعت)
درجه یا نوع زبان مورد استفاده (آزمون‌های کلمی، عملی، غیرگفتاری)
ماهیت رفتار نمونه گیری شده (آزمون‌های علمتی و نمونه‌ای)

آزمونهای استاندارد شده و معلم ساخته

آزمون های معلم ساخته آزمونهایی هستند که به وسیله معلمان و برای استفاده در کلسهای درسشان ساخته میشوند. آزمونهای استاندارد شده آزمونهایی هستند که به وسیله متخصصان آزمونسازی و یا متخصصان برنامههای آموزشی و معلمان ساخته میشوند. این آزمونها تحت شرایط یکسان و استاندارد اجرا و نمرهگذاری می‌شوند.

آزمون های هنجار مرجع و ملاک مرجع

آزمون های هنجار مرجع برای اندازه گیری تفاوت های فردی در پیشرفت تحصیلی، هوش، رغبت، نگرش و شخصیت تهیه میشوند و در آنها عملکرد هر آزمودنی با توجه به عملکرد سایر آزمودنیها و افراد گروه، ارزیابی میشود
آزمونهای ملک مرجع آزمون هایی هستند که در آنها عملکرد هر آزمودنی با توجه به یک ملک خاص ارزیابی میشود. مثلً نمره دانشآموز در یک آزمون پیشرفت تحصیلی، با توجه به یک حوزه یا دانش ارزیابی میگردد نه با توجه به نمره سایر دانشآموزان. در این آزمونها معمولً آزمودنیها به دو گروه تقسیم میشوند، یک گروه آزمودنیهایی هستند که به ملاک موردنظر دست یافتهاند و گروه بعدی گروهی هستند که به ملک موردنظر دست نیافته اند
آزمون های فردی و گروهی آزمونهایی که هر بار برای یک فرد اجرا میشوند، آزمونهای فردی و آزمونهایی که در هر بار برای تعداد زیادی از افراد اجرا میشوند، آزمونهای گروه ی نامیده میشوند. اغلب آزمونهای فردی شفاهی هستند و به توجه دایمی آزماینده نیاز دارند چون نحوه و چگونگی پاسخگویی آزمودنی در نمرهدهی اهمیت دارد. آزمونهای فردی زمانبر هستند و به آزماینده مجرب و آموزشدیده نیاز دارند، معمولً اجرای آنها فقط در هنگام تصمیمگیریهای ضروری و حساس مانند انتقال دانشآموز به یک کلاس یا برنامه خاص، مورد استفاده قرار می گیرند. آزمون های گروهی معمولً برای اندازه گیری مهارت های شناختی و اندازه گیری پیشرفت تحصیلی مناسب هستند. آزمونهای مداد ـ کاغذی معمولً گروهی هستند

تعریف روان سنجی

لرد کلوین(Lord Kelvin) در جمله‌ای مطرح کرده است:«اگر بتوانید آنچه را که درباره‌اش صحبت می‌کنید، اندازه بگیرید و آن را به صورت کمی بیان کنید، می‌توانید مدعی باشید که درباره آن چیزی می‌دانید، وگرنه دانش شما درباره آن اندک و نارساست». گفته کلوین بیانگر یک واقعیت علمی است. چنانکه روان‌شناسی از هنگامی به صورت یک علم مستقل درآمد که به آزمایشگاه کشیده شد، پدیده‌های روانی به صورت عینی و عملیاتی تعریف گردید و مورد اندازه‌گیری قرار گرفت. این واقعیت که افراد از نظر استعداد، شخصیت و رفتار تفاوت دارند و اینکه این تفاوت‌ها را می‌توان مورد سنجش قرار داد، احتمالا از ابتدای تاریخ مکتوب زندگی انسان مورد توجه بوده است

به طور کلی یکی از هدف‌های عمده علم، اندازه‌گیری پدیده‌های مورد نظر و جنبه کمی دادن به آنهاست. وقتی پدیده‌ها با اعداد نشان داده می‌شوند به راحتی می‌توان آنها را طبقه‌بندی کرد و قوانینی درباره آنها به دست ‌آورد

سنجش و اندازه‌گیری در زندگی انسان سابقه‌ای بس طولانی و قدمتی برابر تاریخ بشر دارد. انسان‌ها در دوران کهن همواره برای مقابله با رقبای خود یا دفاع و مبارزه در مقابل یورش‌های قبایل دیگر، به ارزیابی قدرت خویش و دشمن می‌پرداختند و پس از آن وارد عمل می‌شدند

سنجش و اندازه‌گیری روانی و بسط و توسعه آن در علوم تربیتی و روان‌شناسی در قرن نوزدهم و از زمانی شروع می‌شود که روان‌شناسی تحت تأثیر علوم فیزیک و زیست‌شناسی رابطه‌اش از فلسفه گسسته می‌شود و از شناخت و اهمیت روان دست می‌کشد و به مطالعه رفتار به عنوان موضوع عینی و مشاهده‌پذیر نظیر آنچه در سایر علوم تجربی دیگر وجود داشت می‌پردازد

پیدایش و توسعه شیوه‌های اندازه‌گیری در روان‌شناسی و علوم تربیتی نتیجه تأثیر سه عامل عمده اساسی بود. عامل مهمی که به پیدایش و پیشرفت سنجش‌های روانی کمک شایانی کرد، تلاش‌های فرانسیس گالتون(Francis Galton) و مک‌کین‌ کتل(Mc keen Cattle) در مورد تفاوت‌های فردی بود. گالتون معتقد بود که بین توانایی‌های ذهنی و تمییز حسی، رابطه وجود دارد. هر چه میزان هوش بالاتر باشد سطح تمییز حسی نیز بالاتر است. بررسی تفاوت‌های فردی مستلزم ابزار آلات مختلفی بود که به وسیله آنها بتوان هوش و توانایی‌های مختلف را اندازه‌گیری کرد. به همین مناسبت آزمون‌های مختلفی ابداع کردند و روش‌های آماری خاصی برای کمی ساختن نتایج آزمون‌ها پدید آوردند

تعریف اندازهگیری

ورثن و ساندرز(Worthen and Sanders) در سال 1987 گفتند، اندازه‌گیری(Measurement) که معمولا در معنای وسیع‌تری از آزمودن به‌کار می‌رود، عبارت است از: توصیف کمی رفتار، اشیاء و وقایع و تعیین کمیت و خصوصیتی که یک چیز یا یک واقعه دارای آن است. اندازه‌گیری صرفا یک جریان جمع‌آوری اطلاعات است که با استفاده از آنها به تعمیم و ارزشیابی و داوری می‌پردازیم. اندازه‌گیری، اگرچه تحقیق و ارزشیابی نیست اما، یک ابزار کلیدی در تحقیق و ارزشیابی هست

در مواردی که نتیجه اندازه‌گیری با مقیاس عددی قابل تطبیق است می‌توان گفت: اندازه‌گیری عبارت است از اختصاص دادن اعداد به مقادیر مختلف از صفات، بر حسب قواعد معین که صحت آنها را می‌توان از راه آزمایش بررسی کرد.

تعریف ارزشیابی

ارزشیابی، عبارت است از آزمودن یک پدیده و قضاوت درباره ارزش، کیفیت، اهمیت، میزان یا درجه آن پدیده با توجه به ملاک‌های معین به منظور عمل تصمیم‌گیری

ارزشیابی، فرایندی است که مشتمل بر اندازه‌گیری و احتمالا آزمودن است ولی همچنین مفهوم داوری ارزشی را نیز با خود دارد. به طور مثال، اگر معلمی یک آزمون علوم را در یک کلاس اجرا کرده و درصد پاسخ‌های صحیح را محاسبه کند، اندازه‌گیری و آزمون انجام گرفته است. نمره‌ها باید تفسیر شود، یعنی ممکن است آنها را به صورت‌های مختلف ارزش‌گذاری کرده و یا در مورد آنها داوری کرد و به عنوان عالی، خوب، متوسط و ضعیف، طبقه‌بندی نمود. این فرایند، به این دلیل که در آن داوری ارزشی(آشکار یا پنهان) انجام شده است ارزشیابی خواهد بود. اگرچه غالبا ارزشیابی شامل ترکیبی از اطلاعات است که از دو یا چند منبع نظیر نمره‌های آزمون، ارزش‌ها و برداشت‌ها تحصیل می‌گردد ولی گاهی نیز منحصرا مبتنی بر یافته‌های عینی است. به طور کلی ارزشیابی در هر موقعیتی مشتمل بر یک داوری ارزشی است. باید توجه کرد که اندازه‌گیری همواره به ارزشیابی منتهی نمی‌شود. اندازه‌گیری می‌تواند بدون قضاوت کردن یا اتخاذ یک تصمیم نیز انجام شود. از آنچه گفته شد آشکار می‌شود که اندازه‌گیری را نباید با ارزشیابی یکسان دانست

تفاوت بین اندازهگیری و ارزشیابی

الف: ارزشیابی جامع‌تر از اندازه‌گیری است، به گونه‌ای که علاوه بر جنبه‌های کمی، جنبه‌های کیفی رفتار را در برمی‌گیرد.

ب: تفاوت مهم دیگری که بین اندازه‌گیری و ارزشیابی وجود دارد، به هدف اصلی آنها ارتباط پیدا می‌کند. ارزشیابی معمولا در جهت داوری درباره ارزش یک برنامه کلی، و گاه داوری درباره کارآمدی یک برنامه برای گروه بخصوصی از افراد هدایت می‌شود، در حالی که اندازه‌گیری ضمن آنکه پایه و اساس ارزشیابی درست و دقیق را تشکیل می‌دهد، با واقعیات سروکار دارد و هرگز شامل داوری ارزشی(value judgment) نیست.

به طور کلی تحقیق درباره اندازه‌گیری، تهیه آزمون‌ها و تعیین روایی و کاربرد آنها و یا به طور مختصر، در علم روان‌شناسی مجموعه شیوه‌هایی که به ما کمک می‌کند تا ویژگی‌های روانی انسان را از حالت کیفی به حالت کمی درآوریم اصطلاحا روش روان‌سنجی نامیده می‌شود. روان‌سنجی در معنای وسیع کلمه یعنی استفاده از روش آزمایش، اما در معنای محدود کلمه یعنی بهره‌گیری از آزمون‌ها

اصول روان سنجی

فهرست

اندازه گیری و ارزیابی

اهداف کاربردی اندازه‌گیری و آزمون روانی

ملاحظات اخلاقی در اندازه‌گیری و استفاده از آزمون‌ها

مراحل اندازه‌گیری

تعریف ازمون

ارزیابی

روانسنجی

مراحل ارزشیابی

طبقه‌بندی آزمون‌ها

مراحل به کارگیری آزمون

مراحل آزمون‌سازی

فرایند تدریس و آموزش اثربخش

فرایند ارزشیابی پیشرفت تحصیلی

طبقه‌بندی هدف‌های آموزشی

طبقه‌بندی سیمپسون از حوزه روانی ـ حرکتی

طبقه‌بندی آزمون‌های پیشرفت تحصیلی

اجرای آزمون‌های پیشرفت تحصیلی

نمره‌گذاری آزمون

تجزیه و تحلیل آزمون‌های عینی

تجزیه و تحلیل نتایج آزمون‌های تشریحی

تحلیل گزینه های انحرافی

مراحل تحلیل گزینه‌های انحرافی

ضریب تمیز و دشواری سوال های تشریحی

تحلیل سئوال‌های آزمون‌های ملاک مرجع

پایایی ازمون

روش‌های برآورد پایایی آزمون‌های هنجار مرجع

روش کوادر ـ ریچاردسون

روش ضریب آلفا

روش‌های برآورد پایایی آزمون‌های ملاک مرجع

اعتبار ازمون

انواع اعتبار

اندازه‌گیری و ارزشیابی در آموزش و پرورش

امتحان

تهیه پرسش‌های امتحان

اجرای امتحان

آزمون وانواع آن

تجزیه و تحلیل پرسش‌های آزمون

روائی آزمون

اعتبار آزمون

نرم یا هنجار

آزمون‌های هوشی

آزمون‌های شخصیت

آزمون خودسنجی

اندازه گیری و ارزیابی

اندازه‌گیری و ابزار آن، یکی از مهارت‌های حرفه‌ای مشاوران و روان‌شناسان است، اما نگرش مشاوران نسبت به آن متفاوت است، بعضی از آنها روش‌های زیادی را که ممکن است دربرگیرندة مصاحبه‌های پذیرشمفصل یا شرح حالو نظام‌های طبقه‌بندی تشخیصی (مثل DSM-IV یا ICD10) باشند را مورد استفاده قرار می‌دهند، ولی عده‌ای دیگر نظر مثبتی نسبت به آن ندارند و گاهی آن را زیانبار می‌دانند .مخالفان استفاده از آزمون در مشاوره و روان‌شناسی معتقدند که اندازه‌گیری بیش از حد روی مفاهیم پیچیده تکیه می‌کند و فهم واقعی مراجعان را نیز به دنبال ندارد.

علی‌رغم این انتقادات، آزمون در کار مشاوره و روان‌درمانی نقش اساسی دارد و می‌تواند وسیلة مناسبی در مشاوره و روان‌شناسی باشد. ارزیابی روانیرا می‌توان به صورت‌های مختلفی تعریف کرد. فیرس و تراول(1997) معتقدند که ارزیبیای روانی عبارت است از ارزشیابی نقاط قوت و ضعف فرد، مفهوم‌سازیمشکل (و عوامل سبب‌شناختی احتمالی) و تجویز راهکار جهت کاهش مشکل، کتلر و براون (2000) این فعالیت را یک فرایند چند بعدی برای تعیین ویژگی‌های فردی، استعداد، پیشرفت‌ها و صفات شخص می‌دانند که شامل کارکردهای متنوعی مانند آزمودن یا ارزشیابی می‌شود.

اهداف کاربردی اندازهگیری و آزمون روانی

الف) گزینش (انتخاب): بعضی اوقات مشاوران و روانشناسان، آزمون‌ها را برای استفاده در تصمیم‌گیری‌های گزینشی به کار می‌برند. آزمون‌های گزینش و سایر ابزارهای اندازه‌گیری به منظور تصمیم‌گیری در مورد پذیرش یا رد داوطلبان ورود به یک سازمان مورد استفاده قرار می‌گیرند. آزمون‌هایی که برای تصمیم‌گیری‌های گزینشی مورد استفاده قرار می‌گیرند باید بتوانند موفقیت و شکست افراد را با کمترین احتمال خطا برای موسسات و افراد (داوطلبان) پیش‌بینی کنند.

ب) جایگزینی (جایابی) و طبقه‌بندی: آزمون‌های جایگزینی یا جایابی معمولاً بعد از انتخاب داوطلبان و برای انتقال افراد به سطوح مختلف و یا انواع طبقه‌ها، اجرا می‌شوند. تصمیم‌گیری جایگزینی یا جایابی شامل گروه‌بندی عمودی افراد در یک شغل خاص، برنامه یا موضوع واحد است. آزمون‌های طبقه‌بندیبرای قرار دادن افراد در برنامه‌های بهینه و به منظور افزایش احتمال موفقیت آنها طراحی شده‌اند. مانند جایگزینی در تصمیم‌گیری‌های طبقه‌بندی فرد، فرض بر این است که افراد قبلاً انتخاب شده‌اند ولی برخلاف آزمون‌های جایگزینی، طبقه‌بندی شامل گروه‌بندی افقی افراد در شغل‌ها یا برنامه‌های آموزشی مختلف است.

ج) تشخیصو ترمیم: آزمون‌های تشخیص، توانمندی‌ها و ضعف افراد را به منظور ارتقای عملکرد و رفاه او مشخص می‌کنند. مشاور و معلم قبل از ارایة کمک‌ های ترمیمی خود باید بداند که دانش‌آموز یا مراجع در چه زمینه‌ ای مشکل دارد.

د) بازخورد: بازخورد فرایند اطلاع‌رسانی به والدین، معلمان و مدیران و خود دانش‌آموزان دربارة پیشرفت‌های تحصیلی خودشان است. شواهد زیادی وجود دارند که نشان می‌دهند آگاهی از نتایج، یادگیری دانش‌آموزان را ارتقا می‌دهد.

هـ) راهنمایی و انگیزش یادگیری: برخی اوقات آزمون‌ها برای ایجاد انگیزه و هدایت دانش‌آموزان به یادگیری مورد استفاده قرار می‌گیرند. چون دانش‌آموزان با توجه به نوع امتحان مورد انتظار به مطالعه می‌پردازند، مسئولیت معلم آن است که امتحاناتی را برگزار کند که هدف‌های معلم را اندازه‌گیری کنند. اگر سئوال‌ها به محتوای ناچیز و پیش پا افتاده مربوط باشند، دانش‌آموزان ممکن است برای مطالعه به میزان ناچیزی برانگیخته شوند.

ز) ارتقای برنامة آموزش: اندازه‌گیری می‌تواند برای تصمیم‌گیری در مورد برنامة آموزشی ارزشمند باشد. معلم از طریق آزمون می‌تواند میزان اثربخشی روش‌های تدریس خود را مشخص سازد و در صورت عدم اثربخشی یا اثربخشی کم، با اصلاح آنها برنامة آموزشی را ارتقا دهد.

ل) تولید و تدوین نظریه: در کنار استفاده‌های عملی، آزمون‌ها همچنین به تدوین نظریه‌های تربیتی و روان‌شناختی کمک می‌کنند. برای مثال، رشد و تحول کودک به میزان زیادی نتیجة آزمون شخصیت، هوش، استعداد، رغبت، نگرش و پیشرفت کودکان در مراحل مختلف رشد است.

ملاحظات اخلاقی در اندازهگیری و استفاده از آزمونها

صلاحیت

یکی از مهم‌ترین اصول اخلاقی در ارزیابی روانی، صلاحیت است. وینر(1989) بیان می‌دارد که در کار با ابزار تشخیص روانی، صلاحیت بدون اخلاقی بودن امکانپذیر است ولی اخلاقی عمل کردن بدون داشتن صلاحیت، امکان‌پذیر نیست.

رضایت آگاهانه

دومین اصل مهم اخلاقی در اندازه‌گیری‌های روانی، رضایت آگاهانه مراجع است. این اصل و موضوع توسط انجمن روان‌شناسی آمریکا (2002) در استاندارد 10/3 ضوابط اخلاقی خود به صورت کلی مورد تاکید قرار گرفته و ذکر گردیده است که روان‌شناسان هنگام ارائة خدمات مختلف با استفاده از زبان قابل فهم برای شخص یا اشخاص، باید رضایت آگاهانة آنها را جلب کنند، مگر در مواردی که به قانون و مقررات اجرای خدمات را بدون جلب رضایت مجاز شمرده باشد.

رضایت شامل سه قسمت مجزاست: داوطلبی، صلاحیت و اطلاعات (هرسن، 2004). داوطلبی به این اشاره می‌کند که آزماینده رضایت متقاضی و داوطلب را بدون اعمال زور، اجبار یا فشار کسب کند.

صلاحیت به این امر اشاره می‌کند که داوطلب آزمون باید از لحاظ قانونی برای اظهار موافقت، شایستگی و شرایط لازم را داشته باشد. بزرگسالان معمولاً از لحاظ قانونی شرایط لازم را برای اظهار موافقت دارند ولی کودکان معمولاً فاقد این شرایط می‌باشند، لذا در مواجهه با کودکان، رضایت والدین یا مراقبان قانونی آنها باید اخذ شود.

اطلاعات یعنی اینکه داوطلب آزمون باید اطلاعات لازم و ضروری برای رضایت را اخذ کرده باشد. به عبارت دیگر، آزماینده باید اطلاعات کافی را در اختیار داوطلب قرار دهد تا با استفاده از این اطلاعات، او بتواند در مورد شرکت در اندازه‌گیری‌های روانی به تصمیم‌گیری آگاهانه دست بزند.

رازداری

سومین اصل اخلاقی در اندازه‌گیری‌های روانی، رازداری است. اعتماد، شالودة ارتباط مشاوره‌ای و هستة ایجاد و حفظ اعتماد اصل رازداری است . انجمن مشاورة امریکا (2002) در استاندارد 01/4 ضوابط اخلاقی خود رازداری را مورد تاکید قرار داده و بیان می‌دارد که روانشناس موظف است برای محافظت از اطلاعات محرمانه کسب شده از مراجع در خلال جلسات، احتیاط‌های لازم را به عمل آورد.

استیونس اندازه‌گیری را اختصاص اعداد و ارقام به موضوعات یا رویدادها (رفتارها، ویژگی‌ها یا پاسخ‌ها) بر طبق قانون و قاعده می‌داند. تریتسچلر (2000) نیز اندازه‌گیری را فرایند نظام‌دار برای نسبت دادن ارزش‌های عددی به یک صفت یا ویژگی می‌داند. سیف می‌گوید: اندازه‌گیری عبارت است از فرایندی که تعیین می‌کند یک شخص یا یک شیء چه مقدار از یک ویژگی برخوردار است.

مراحل اندازهگیری

ـ تعریف عملیاتی صفت مورد اندازه‌گیری: منظور از تعریف عملیاتی این است که صفت مورد اندازه‌گیری طوری تعریف شود که همگان در مورد آن درک یکسان و واقعی داشته باشند.

ـ تهیة ابزار اندازه‌گیری: دومین گام در اندازه‌گیری یک صفت، تهیة وسیله‌ای است که به کمک آن بتوان صفت موردنظر را اندازه گرفت، مانند قدسنج برای اندازه‌گیری قد و یا ترازو برای اندازه‌گیری وزن. برای ویژگی‌های روانی مانند هوش، استعداد، معلومات و غیره، این وسیله باید به طریقی ساخته شود که بروز رفتارهای موردنظر را به صورتی که تعریف شده‌اند، موجب گردد.

ـ تهیة مقیاس اندازه‌گیری: از آنجا که نتایج اندازه‌گیری‌های روانی و تربیتی غالباً به صورت مقیاس‌های کمی بیان می‌شوند، بنابراین برای بیان نتیجة هر نوع اندازه‌گیری باید مقیاسی در نظر گرفته شود .به عبارت دیگر، در این مرحله باید واحدهای اندازه‌گیری که برای نسبت دادن اعداد به اشیا و ارقام مورد استفاده قرار می‌گیرد، مشخص شود.

ـ اجرای اندازه‌گیری: بعد از ارائة تعریف عملیاتی و دقیق ویژگی که قصد اندازه‌گیری آن را داریم و پس از تعیین ابزار مناسبی برای اندازه‌گیری آن تهیه و مقیاس کمی نیز مشخص گردید، ابزار اندازه‌گیری اجرا و عمل اندازه‌گیری انجام می‌گیرد و نتایج به صورت ارزش‌های عددی ارائه می‌شوند.

تعریف آزمون

اندازه‌گیری فرایندی است برای نسبت دادن اعداد و ارقام به ویژگی‌های اشیا و افراد. دو نوع اندازه‌گیری وجود دارد: اندازه‌گیری فیزیکی و اندازه‌گیری روان‌شناختی.در اندازه‌گیری فیزیکی، اعداد و ارقام به ویژگی‌های فیزیکی افراد و اشیا مثل قد، طول و وزن اختصاص می‌یابد و در اندازه‌گیری روان‌شناختی اعداد و ارقام به ویژگی‌های روانی افراد مثل هوش، استعداد، رغبت و … نسبت داده می‌شوند.

«آزمون وسیله و ابزاری است برای اندازه‌گیری غیرمستقیم صفات و ویژگی‌های روانی.» آناستازی (1997) معتقد است که آزمون وسیلة کم یا بیش اسرارآمیزی نیست، بلکه کوششی است برای اندازه‌گیری نمونه‌ای از رفتار فرد به صورت عینی و پیوسته . به عبارت دیگر آزمون وسیله‌ای عینی و هنجارشده . برای اندازه‌گیری نمونه‌ای از رفتار فرد است.

ارزیابی

تریتسچلر (2000) ارزیابی را از لحاظ ذهنی فرایندی برای کمی کردن یا از لحاظ کیفی فرایندی برای توصیف یک صفت یا ویژگی می‌داند. بنتام (2002) ارزیابی را وسیله‌ای می‌داند که مستلزم جمع‌آوری داده‌ها برای تصمیم‌گیری است. هوهینشل و گتز (2001) ارزیابی را فرایند کسب اطلاعات برای استفاده در فرایند تشخیص می‌دانند. آن معتقدند که داده‌های اندازه‌گیری از طریق فنون رسمی و غیررسمی متنوعی شامل آزمون‌های استاندارد، پرسشنامه‌ها، مصاحبة تشخیصی، معاینة وضعیت روانی، مشاهدة رفتار و گزارش‌های سایر افراد مانند والدین، دوستان و همسر، جمع‌آوری می‌شوند.

روانسنجی

به نظر کلاین (1998)، روان‌سنجی به عنوان یک علم بر اندازه‌گیری ویژگی‌های روان‌شناختی مانند توانایی، شخصیت، انگیزش و … مربوط می‌شود. ریبر (1985) معتقد است که اصطلاح روان‌سنجی دو معنی دارد؛ اولین معنی آن به هر شکلی از سنجش روانی اشاره دارد، نظیر اندازه‌گیری ویژگی‌های شخصیتی، تعیین شاخص‌های هوش و تعیین استعداد افراد برای ورود به حرفه‌های مختلف. معنی دوم این اصطلاح به کاربرد اصول ریاضی و آماری و تجزیه و تحلیل داده‌های روان‌شناسی اشاره دارد، یعنی هر گونه تجزیه و تحلیل داده‌های روانشناسی را می‌توان روان‌سنجی دانست.

تریستچلر (2000) معتقد است، ارزشیابی فرایندی است که در آن براساس داده‌های کمی و کیفی حاصل از سنجش و اندازه‌گیری، به قضاوت و داوری پرداخته می‌شود.

ارزیابی، اندازه‌گیری، و روان‌سنجی مقدمه‌ای برای ارزشیابی هستند. به این صورت که، از طریق ارزیابی، اندازه‌گیری، آزمون و روان‌سنجی، اطلاعا جمع‌آوری و تجزیه و تحلیل می‌شود، سپس از طریق فرایند ارزشیابی تعبیر و تفسیر شده و در نهایت در مورد آن ویژگی یا خصوصیت قضاوت ارزشی انجام می‌گیرد.

مراحل ارزشیابی

ـ تعیین هدف‌های ارزشیابی

در این مرحله ارزشیاب تعیین می‌کند که چه موضوعی را و برای رسیدن به چه هدفی مورد ارزشیابی قرار خواهد داد.

ـ تدوین طرح ارزشیابی

ارزشیاب پس از تعیین و تعریف هدف‌های ارزشیابی باید برای رسیدن به اهداف تعیین شده، طرح مناسبی را تدوین کند.

ـ اجرای طرح ارزشیابی و جمع‌آوری داده‌ها

بعد از تعیین هدف‌ها و تدوین طرحی مناسب برای ارزشیابی، طبق طرح‌ریزی انجام شده، طرح ارزشیابی اجرا می‌گردد و داده‌های مورد نیاز گرد‌آوری می‌شد.

ـ تحلیل و تفسیر داده‌ها

بعد از اجرای طرح ارزشیابی و جمع‌آوری داده‌های مورد نیاز، این داده‌ها مورد تجزیه و تحلیل و تفسیر قرار می‌گیرند و نتایجی از آنها حاصل می‌شود.

ـ استفاده از یافته‌های ارزشیابی

بعد از تحلیل داده‌ها و تعیین یافته‌های ارزشیابی، با توجه به اینکه هدف ارزشیابی، ارتقا و بهبود وضع (برنامه، دوره، مداخله و …) موجود است، نتایج به دست آمده از ارزشیابی باید مورد استفاده قرار گیرند.

طبقهبندی آزمونها

براساس مقایسة نتایج آزمون با نتایج گروه‌های مشابه خارج از کلاس (آزمون‌های استاندارد شده و معلم ساخته)

گروه یا حیطه‌ای که افراد با آن مقایسه می‌شوند (آزمون‌های هنجار مرجع و ملاک مرجع)

تعداد اشخاصی که آزمون در مورد آنها اجرا می‌شود (آزمون‌های فردی و گروهی)

معیار نمره‌گذاری (آزمون‌‌های عینی و ذهنی)

میزان زمان اختصاص یافته برای پاسخگویی (آزمون‌های قدرت و سرعت)

درجه یا نوع زبان مورد استفاده (آزمون‌های کلامی، عملی، غیرگفتاری)

ماهیت رفتار نمونه‌گیری شده (آزمون‌های علامتی و نمونه‌ای)

آزمونهای استاندارد شده و معلم ساخته

آزمون‌های معلم ساخته آزمون‌هایی هستند که به وسیلة معلمان و برای استفاده در کلاس‌های درسشان ساخته می‌شوند. آزمون‌های استاندارد شده آزمون‌هایی هستند که به وسیلة متخصصان آزمون‌سازی و یا متخصصان برنامه‌های آموزشی و معلمان ساخته می‌شوند. این آزمون‌ها تحت شرایط یکسان و استاندارد اجرا و نمره‌گذاری می‌شوند.

آزمونهای هنجار مرجع و ملاک مرجع

آزمون‌های هنجار مرجع برای اندازه‌گیری تفاوت‌های فردی در پیشرفت تحصیلی، هوش، رغبت، نگرش و شخصیت تهیه می‌شوند و در آنها عملکرد هر آزمودنی با توجه به عملکرد سایر آزمودنی‌ها و افراد گروه، ارزیابی می‌شود.

آزمون‌های ملاک مرجع آزمون‌هایی هستند که در آنها عملکرد هر آزمودنی با توجه به یک ملاک خاص ارزیابی می‌شود. مثلاً نمرة دانش‌آموز در یک آزمون پیشرفت تحصیلی، با توجه به یک حوزه یا دانش ارزیابی می‌گردد نه با توجه به نمرة سایر دانش‌آموزان. در این آزمون‌ها معمولاً آزمودنی‌ها به دو گروه تقسیم می‌شوند، یک گروه آزمودنی‌هایی هستند که به ملاک موردنظر دست یافته‌اند و گروه بعدی گروهی هستند که به ملاک موردنظر دست نیافته‌اند.

آزمون‌های فردی و گروهیآزمون‌هایی که هر بار برای یک فرد اجرا می‌شوند، آزمون‌های فردی و آزمون‌هایی که در هر بار برای تعداد زیادی از افراد اجرا می‌شوند، آزمون‌های گروهی نامیده می‌شوند. اغلب آزمون‌های فردی شفاهی هستند و به توجه دایمی آزماینده نیاز دارند چون نحوه و چگونگی پاسخگویی آزمودنی در نمره‌دهی اهمیت دارد.

آزمون‌های فردی زمان‌بر هستند و به آزمایندة مجرب و آموزش‌دیده نیاز دارند، معمولاً اجرای آنها فقط در هنگام تصمیم‌گیری‌های ضروری و حساس مانند انتقال دانش‌آموز به یک کلاس یا برنامة خاص، مورد استفاده قرار می‌گیرند. آزمون‌های گروهی معمولاً برای اندازه‌گیری مهارت‌های شناختی و اندازه‌گیری پیشرفت تحصیلی مناسب هستند. آزمون‌های مداد ـ کاغذی معمولاً گروهی هستند.

(اینها سرفصل اصلی مطالب مندرج بود، برای مطالعه بیشتر می توانید کتب مربوطه را مطالعه بفرمایید)