Искусственный интеллект подводит Massachusetts: сбой в оценке экзаменов MCAS

В штате Массачусетс произошел значительный скандал, связанный с оценкой экзаменов для школьников, который затронул почти 200 округов. Более 1,400 эссе, написанных учащимися, были неправильно оценены из-за сбоя в системе искусственного интеллекта (AI), используемой для проверки экзаменов в рамках Massachusetts Comprehensive Assessment System (MCAS). Об этом сообщается в репортаже NBC Boston.

Масштаб проблемы оказался серьезным: некоторые работы получили оценку «0», хотя на самом деле должны были быть оценены на уровне 6 по шкале от 1 до 7. Департамент начального и среднего образования Массачусетса сообщил СМИ, что все эссе были пересмотрены, о проблеме были уведомлены затронутые округа, а данные были исправлены в августе. Результаты MCAS, опубликованные в прошлом месяце, продемонстрировали, что недостатки в образовательных результатах, возникшие во времена пандемии COVID-19, остаются серьезной проблемой на всех уровнях обучения в штате.

Как утверждает DESE, сбой в оценивании стал следствием «временной технической проблемы» в процессе, и такие ошибки «представляют собой лишь небольшую долю» от примерно 750,000 эссе, оцененных по всей территории Массачусетса. Заявление вызывает вопросы о надежности системы, использующей искусственный интеллект для оценки работ. В течение последних двух лет искусственный интеллект применялся для оценки экзаменов MCAS, причем около 10% работ затем вновь проверялись людьми, чтобы обеспечить последовательность в оценивании.

Данная ситуация складывается на фоне общественного недовольства тем, как проводятся экзамены. Жители Массачусетса на прошедших выборах подавляющим большинством проголосовали против введения требования о прохождении определенного порога оценок MCAS для получения аттестата о среднем образовании, что говорит о росте недовольства среди родителей и учителей. Почти 60% избирателей отклонили стандарт, действующий в штате на протяжении двух десятилетий.

Кроме того, в штате создается новый совет по выпускным требованиям K-12, который разрабатывает новые стандарты, возможно, включая возобновление использования стандартизированных «итоговых оценок» по основным предметам. В проекте рекомендаций Совета предусмотрено создание «итоговых оценок», которые будут «разработаны, администрироваться и оцениваться на государственном уровне для обеспечения единых стандартов по всему Массачусетсу».

Эти события поднимают важные вопросы о будущих путях оценки учащихся и о том, как технологии могут как помогать, так и подводить системы образования. В условиях стремительного развития технологий и изменения образовательных стандартов, необходимо внимательное отношение к обеспечению качества образования и доверия к оценочным системам.