ERIC - Search Results

Publication Date

In 2025	0
Since 2024	0
Since 2021 (last 5 years)	1
Since 2016 (last 10 years)	7
Since 2006 (last 20 years)	8

Source

Educational and Psychological…	3
Language Testing	2
Educational Measurement:…	1
International Journal of…	1
Journal of Educational…	1

Author

Wind, Stefanie A.	8
Engelhard, George, Jr.	2
Kobrin, Jennifer L.	1
Patil, Yogendra J.	1
Schumacker, Randall E.	1

Publication Type

Journal Articles	8
Reports - Research	8

Education Level

High Schools	2
Secondary Education	2
Higher Education	1
Postsecondary Education	1

Audience

Location

Georgia

Laws, Policies, & Programs

Assessments and Surveys

SAT (College Admission Test)

What Works Clearinghouse Rating

Wind, Stefanie A. X

Showing all 8 results Save | Export

A Nonparametric Procedure for Exploring Differences in Rating Quality across Test-Taker Subgroups in Rater-Mediated Writing Assessments

Peer reviewed

Direct link

Wind, Stefanie A. – Language Testing, 2019

Differences in rater judgments that are systematically related to construct-irrelevant characteristics threaten the fairness of rater-mediated writing assessments. Accordingly, it is essential that researchers and practitioners examine the degree to which the psychometric quality of rater judgments is comparable across test-taker subgroups.…

Descriptors: Nonparametric Statistics, Interrater Reliability, Differences, Writing Tests

Exploring Incomplete Rating Designs with Mokken Scale Analysis

Peer reviewed

Direct link

Wind, Stefanie A.; Patil, Yogendra J. – Educational and Psychological Measurement, 2018

Recent research has explored the use of models adapted from Mokken scale analysis as a nonparametric approach to evaluating rating quality in educational performance assessments. A potential limiting factor to the widespread use of these techniques is the requirement for complete data, as practical constraints in operational assessment systems…

Descriptors: Scaling, Data, Interrater Reliability, Writing Tests

Nonparametric Evidence of Validity, Reliability, and Fairness for Rater-Mediated Assessments: An Illustration Using Mokken Scale Analysis

Peer reviewed

Direct link

Wind, Stefanie A. – Journal of Educational Measurement, 2019

Numerous researchers have proposed methods for evaluating the quality of rater-mediated assessments using nonparametric methods (e.g., kappa coefficients) and parametric methods (e.g., the many-facet Rasch model). Generally speaking, popular nonparametric methods for evaluating rating quality are not based on a particular measurement theory. On…

Descriptors: Nonparametric Statistics, Test Validity, Test Reliability, Item Response Theory

A Sequential Approach to Detecting Differential Rater Functioning in Sparse Rater-Mediated Assessment Networks

Peer reviewed

Direct link

Wind, Stefanie A. – Language Testing, 2023

Researchers frequently evaluate rater judgments in performance assessments for evidence of differential rater functioning (DRF), which occurs when rater severity is systematically related to construct-irrelevant student characteristics after controlling for student achievement levels. However, researchers have observed that methods for detecting…

Descriptors: Evaluators, Decision Making, Student Characteristics, Performance Based Assessment

Adjacent-Categories Mokken Models for Rater-Mediated Assessments

Peer reviewed

Direct link

Wind, Stefanie A. – Educational and Psychological Measurement, 2017

Molenaar extended Mokken's original probabilistic-nonparametric scaling models for use with polytomous data. These polytomous extensions of Mokken's original scaling procedure have facilitated the use of Mokken scale analysis as an approach to exploring fundamental measurement properties across a variety of domains in which polytomous ratings are…

Descriptors: Nonparametric Statistics, Scaling, Models, Item Response Theory

Detecting Measurement Disturbances in Rater-Mediated Assessments

Peer reviewed

Direct link

Wind, Stefanie A.; Schumacker, Randall E. – Educational Measurement: Issues and Practice, 2017

The term measurement disturbance has been used to describe systematic conditions that affect a measurement process, resulting in a compromised interpretation of person or item estimates. Measurement disturbances have been discussed in relation to systematic response patterns associated with items and persons, such as start-up, plodding, boredom,…

Descriptors: Measurement, Testing Problems, Writing Tests, Performance Based Assessment

Exploring Rating Quality in Rater-Mediated Assessments Using Mokken Scale Analysis

Peer reviewed

Direct link

Wind, Stefanie A.; Engelhard, George, Jr. – Educational and Psychological Measurement, 2016

Mokken scale analysis is a probabilistic nonparametric approach that offers statistical and graphical tools for evaluating the quality of social science measurement without placing potentially inappropriate restrictions on the structure of a data set. In particular, Mokken scaling provides a useful method for evaluating important measurement…

Descriptors: Nonparametric Statistics, Statistical Analysis, Measurement, Psychometrics

Exploring Differential Subgroup Functioning on SAT Writing Items: What Happens When English Is Not a Test Taker's Best Language?

Peer reviewed

Direct link

Engelhard, George, Jr.; Kobrin, Jennifer L.; Wind, Stefanie A. – International Journal of Testing, 2014

The purpose of this study is to explore patterns in model-data fit related to subgroups of test takers from a large-scale writing assessment. Using data from the SAT, a calibration group was randomly selected to represent test takers who reported that English was their best language from the total population of test takers (N = 322,011). A…

Descriptors: College Entrance Examinations, Writing Tests, Goodness of Fit, English

Writing Tests	8
Item Response Theory	5
Nonparametric Statistics	4
Statistical Analysis	4
Case Studies	2
Data	2
English	2
Evaluators	2
Goodness of Fit	2
High School Students	2
Interrater Reliability	2
Item Analysis	2
Measurement	2
Performance Based Assessment	2
Scaling	2
Test Validity	2
Academic Achievement	1
Accuracy	1
Achievement Rating	1
Bias	1
Classification	1
College Entrance Examinations	1
Comparative Analysis	1
Correlation	1
Decision Making	1
More ▼