Разработка программного продукта для прохождения тестов. Основы BDD: Юнит, Интеграционные и End-to-End тесты

Главная / Суд

Классы и виды тестов.

Существуют два основных класса тестов: традиционные и нетрадиционные .

Тест обладает составом , целостностью и структурой . Он состоит из:

  • заданий;
  • правил их применения;
  • оценок за выполнение каждого задания;
  • рекомендаций по интерпретации тестовых результатов.

Целостность теста означает взаимосвязь заданий, их принадлежность общему измеряемому фактору. Каждое задание теста выполняет отведенную ему роль и потому ни одно из них не может быть изъято из теста без потери качества измерения.

Структуру теста образует способ связи заданий между собой. В основном, это так называемая факторная структура , в которой каждое задание связано с другими через общее содержание и общую вариацию тестовых результатов.

Традиционный тест представляет собой единство, по меньшей мере, трех систем:

  • содержательной системы знаний, описываемой языком проверяемой учебной дисциплины;
  • формальной системы заданий возрастающей трудности;
  • статистических характеристик заданий и результатов испытуемых.

Традиционный педагогический тест нужно рассматривать в двух существенных смыслах: как метод педагогического измерения и как результат применения теста .

тест - это система заданий, образующих наилучшую методическую целостность . Целостность теста - это устойчивое взаимодействие заданий, образующих тест как развивающуюся систему.

Гомогенные тесты

К традиционным тестам относятся тесты гомогенные и гетерогенные .

Гомогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по одной учебной дисциплине .

Гомогенные тесты распространены больше других. В педагогике они создаются для контроля знаний по одной учебной дисциплине или по одному разделу такой, например, объемной учебной дисциплины, как физика. В гомогенном педагогическом тесте не допускается использование заданий, выявляющих другие свойства. Наличие последних нарушает требование дисциплинарной чистоты педагогического теста. Ведь каждый тест измеряет что-то заранее определенное.



Гетерогенные тесты

Гетерогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по нескольким учебным дисциплинам .

Нередко в такие тесты включаются и психологические задания для оценки уровня интеллектуального развития.

Обычно гетерогенные тесты используются для комплексной оценки выпускника школ, оценки личности при приеме на работу и для отбора наиболее подготовленных абитуриентов при приеме в вузы. Поскольку каждый гетерогенный тест состоит из гомогенных тестов, интерпретация результатов тестирования ведется по ответам на задания каждого теста (здесь они называются шкалами) и кроме того, посредством различных методов агрегирования баллов делаются попытки дать общую оценку подготовленности испытуемого.

Интерпретация результатов тестирования ведется преимущественно на языке тестологии, с опорой на среднюю арифметическую, моду или медиану и на так называемые процентильные нормы, показывающие - сколько процентов испытуемых имеют тестовый результат хуже, чем у любого взятого для анализа испытуемого с его тестовым баллом. Такая интерпретация называется нормативно-ориентированной .

Интегративные тесты

Интегративным можно назвать тест, состоящий из системы заданий, отвечающих требованиям интегративного содержания, тестовой формы, возрастающей трудности заданий, нацеленных на обобщенную итоговую диагностику подготовленности выпускника образовательного учреждения .

Диагностика проводится посредством предъявления таких заданий, правильные ответы на которые требуют интегрированных (обобщенных, явно взаимосвязанных) знаний в области двух и большего числа учебных дисциплин. Создание таких тестов дается только тем преподавателям, которые владеют знаниями ряда учебных дисциплин, понимают важную роль межпредметных связей в обучении, способны создавать задания, правильные ответы на которые требуют от учащихся знаний различных дисциплин и умений применять такие знания.

Интегративному тестированию предшествует организация интегративного обучения . К сожалению, существующая сейчас классно-урочная форма проведения занятия, в сочетании с чрезмерным дроблением учебных дисциплин, вместе с традицией преподавания отдельных дисциплин (а не обобщенных курсов), еще долго будут тормозить внедрение интегративного подхода в процессы обучения и контроля подготовленности.

Преимущество интегративных тестов перед гетерогенными заключается в большей содержательной информативности каждого задания и в меньшем числе самих заданий.

Адаптивные тесты

Целесообразность адаптивного контроля вытекает из необходимости рационализации традиционного тестирования.

Каждый учитель понимает, что хорошо подготовленному ученику нет необходимости давать легкие и очень легкие задания, потому что слишком высока вероятность правильного решения. К тому же легкие материалы не обладают заметным развивающим потенциалом. Симметрично, из-за высокой вероятности неправильного решения нет смысла давать трудные задания слабому ученику. Известно, что трудные и очень трудные задания снижают учебную мотивацию многих учащихся.

Самая главная характеристика заданий адаптивного теста - это уровень их трудности, полученный опытным путем, что означает: прежде чем попасть в банк, каждое задание проходит эмпирическую апробацию на достаточно большом числе типичных учащихся интересующего контингента. Слова "интересующего контингента" призвано представлять здесь смысл известного в науке более строгого понятия "генеральная совокупность".

Тестирование обладает следующими преимуществами перед другими методами педагогического контроля:

· повышение скорости проверки качества усвоения знаний и умений учащимися;

· осуществление хотя и поверхностного, но полного охвата всего учебного материала;

· снижение воздействия негативного влияния на результаты тестирования таких факторов как настроение, уровень квалификации и др. характеристики конкретного учителя, т.е. минимизация субъективного фактора при оценивании ответов;

· высокая объективность и, как следствие, большее позитивное стимулирующее воздействие на познавательную деятельность учащегося;

· ориентированность на современные технические средства, на использование в среде компьютерных обучающих и контролирующих систем;

· возможность математико-статистической обработки результатов контроля, и как следствие, повышение объективности педагогического контроля;

· осуществление принципа индивидуализации и дифференциации обучения благодаря использованию адаптивных тестов;

· возможность увеличить частоту и регулярность контроля за счет уменьшения времени выполнения заданий и автоматизации проверки;

· облегчение процесса интеграции системы образования страны в европейскую.

Тесты можно классифицировать по следующим основаниям:

1. Предметная область применения тестов : монопредметные, полипредметные, интегративные.
Интегративным можно назвать тест, состоящий из таких заданий, правильные ответы на которые требуют интегрированных (взаимосвязанных, обобщенных) знаний двух или большего числа учебных дисциплин. Использование таких тестов в школе, как контролирующих, так и обучающих, - отличное средство реализации межпредметных связей в обучении.

2. Общая ориентация замысла построения теста : нормативно-ориентированные или критериально-ориентированные (предметно-ориентированные).
При нормативно-ориентированном подходе разрабатываются тесты для сравнения испытуемых по уровню учебных достижений.
Главным отличительным признаком предметно-ориентированного тестирования является интерпретация выполнения теста с точки зрения его смыслового содержания. Упор делается на строго определенную содержательную область (что тестируемые могут и что знают), а не на то, как они выглядят на фоне других.

3.Дидактико-психологическая ориентация теста: тест достижений для контроля знаний теории; тест достижений для контроля умений и навыков различной степени сложности по данному предмету, тест обучаемости (диагностики реальных учебных возможностей по данному кругу предметных или цикловых знаний – математической, лингвистической и т.п.).

4.Ориентация на определенный этап контроля : тесты предварительного контроля, тесты текущего контроля, тесты итогового контроля.

5. Доминирующая деятельность испытуемого при выполнении тестов – устные, письменные, компьютерные.

6. Количество объектов контроля : тесты, имеющие один объект контроля (например, количество выполняемых на должном уровне операций) или несколько (качество, количество, скорость, строгую последовательность, осознанность тех же операций).

7. Степень гомогенности тестовых заданий : тесты с однородными или разнородными формами построения заданий.

8. Скоростной фактор : скоростные (с обязательным фиксированием времени выполнения) и нескоростные.

9. Форма организации тестирования : массовые, индивидуальные, групповые .

Отдельно выделяют так называемые адаптивные тесты, основанные на принципе индивидуализации обучения. Каждый учитель понимает, что хорошему ученику нет смысла давать легкие и очень легкие задания, так же как нет смысла давать трудные задания слабому ученику. В теории педагогических измерений была найдена мера трудности заданий и мера уровня знаний, сопоставимые в одной шкале. После появления компьютеров эта мера легла в основу методики адаптивного контроля знаний, где трудность и число предъявляемых заданий регулируются в зависимости от ответов учеников.

Перевод: Анна Радионова

Существует много видов ПО тестов. Практики BDD можно применять в любых аспектах тестирования, но BDD фреймворки используются далеко не во всех типах тестов. Поведенческие сценарии, по сути, являются функциональными тестами - они проверяют, что тестируемый продукт работает корректно. Для тестирования производительности могут использоваться инструменты, в то время как BDD фреймворки не предназначены для этих целей. Задача данной статьи, в основном, состоит в описании роли BDD автоматизации в Пирамиде Тестирования. Прочитайте статью BDD 101: Manual Testing для того, чтобы понимать как BDD применяется при ручном тестировании. (Всю информацию по BDD можно найти на странице Automation Panda BDD page)

Пирамида Тестирования

Тем не менее, BDD практики могут применяться для юнит-тестов. Каждый юнит-тест должен быть направлен на основную составляющую: один вызов, единичная вариация, определенная комбинация ввода; на поведение .В дальнейшем при разработке спецификация поведения фичи четко отделяет юнит тесты от тестов более высокого уровня. Разработчик функционала также ответственен за написание юнит-тестов, в то время как за интеграционные и end-to-end тесты несет ответственность другой инженер. Спецификация поведения является, своего рода, джентльменским соглашением о том, что юнит-тесты будут являться отдельной сущностью.

Интеграционное и End-to-End тестирование

Тестовые BDD фреймворки наиболее ярко проявляют себя на интеграционных и end-to-end уровнях тестирования .

Поведенческие спецификации однозначно и лаконично описывают, на что именно ориентирован тест-кейс. Шаги могут быть написаны на интеграционном или end-to-end уровне. Тесты сервиса могут быть написаны с помощью поведенческих спецификаций, как, например в Karate . End-to-end тесты фактически представляют собой многошаговые интеграционные тесты. Обратите внимание на следующий пример, который, на первый взгляд, кажется базовой моделью взаимодействия с пользователем, но, по сути, является объемным end-to-end тестом:

Given a user is logged into the social media site
When the user writes a new post
Then the user"s home feed displays the new post
And the all friends" home feeds display the new post

Простая публикация в социальной сети включает процессы взаимодействия с интерфейсом, вызовы сервисов бекенда и внесение изменений в базу данных в режиме реального времени. Описан полный путь прохождения в системе. Автоматизированные шаги могут покрывать эти уровни явно или неявно, но они совершенно точно покрыты тестом.

Длительные End-to-End тесты

Термины часто понимаются разными людьми по-разному. Когда люди говорят “end-to-end тесты,” они подразумевают продолжительные последовательные тесты: тесты, которые покрывают различное поведение продукта одно за другим . Это утверждение заставляет содрогнуться приверженцев BDD, т.к это противоречит основному правилу BDD: один сценарий, одно поведение. Конечно, с помощью BDD фреймворков можно составлять длительные end-to-end тесты, но нужно хорошо подумать, стоит ли это делать и как именно.

Существует пять основных принципов написания длительных end-to-end сценариев в BDD:

  1. Не стоит беспокоиться на этот счет . Если BDD процесс поставлен правильно, то каждое отдельное поведение уже полностью покрыто тестовыми сценариями. Каждый сценарий должен покрывать все классы эквивалентности вводимых и выводимых данных. Таким образом, длительные end-to-end сценарии будут являться, в основном, дублированием тестового покрытия. Вместо того, чтобы тратить время на разработку, лучше отказаться от автоматизации длительных end-to-end сценариев, как от тех, которые не представляют большой ценности и уделить больше времени ручному и исследовательскому тестированию .
  2. Объединить существующие сценарии в новые . Каждая When-Then пара представляет собой индивидуальное поведение. Шаги из существующих сценариев могут быть переопределены в другие сценарии и для этого потребуется лишь незначительный рефакторинг. Это нарушает хорошие практики Gherkin и может привести к появлению длительных сценариев, но это наиболее практичный способ переиспользовать шаги для обширных end-to-end сценариев. Большинство BDD фреймворков не поддерживают пошаговый порядок, а если поддерживают, то шаги должны быть переписаны, чтобы код работал. (Этот подход является наиболее практичным, но менее традиционным .)
  3. Встраивайте проверки в Given и When шаги . Данная стратегия позволяет избежать дуплицирования When-Then пар и убедиться, что проверки производятся. Корректность каждого шага проверяется на протяжении всего процесса с помощью Gherkin текста. Однако, может потребоваться ряд новых шагов.
  4. Воспринимайте последовательность поведений как уникальное отдельное поведение . Это наилучший способ обдумывания длительных end-to-end сценариев, т.к. он усиливает поведенческое мышление. Продолжительный сценарий имеет ценность только в том случае, если он расценивается как уникальное поведение. Сценарий должен быть написан с целью подчеркнуть эту уникальность. В противном случае это не тот сценарий, который стоит использовать. Такие сценарии часто являются декларативными и высокоуровневыми.
  5. Не используйте BDD фреймворки и пишите тесты исключительно с помощью средств автоматизации . Gherkin предназначен для совместной работы в отношении поведения, в то время как продолжительные end-to-end тесты решают проблемы интенсивности работы QA. Бизнес может предоставить поведенческие спецификации, но никогда не станет писать end-to-end тесты. Переписывание поведенческих спецификаций в длинные end-to-end сценарии может блокировать разработку. Гораздо лучшим решением является сосуществование: приемочные тесты могут быть написаны при помощи Gherkin, а продолжительные end-to-end тесты - средствами программирования. Для автоматизации обоих наборов тестов можно использовать одну и ту же базу кода, у них могут быть единые модули поддержки и даже методы определения шагов.

Выберите подход, наиболее подходящий вашей команде.

Аннотация: Лекция является второй из трех рассматривающих уровни процесса верификации. Тема данной лекции - процесс интеграционного тестирования, его задачи и цели. Рассматриваются организационные аспекты интеграционного тестирования - структурная и временная классификации методов интеграционного тестирования, планирование интеграционного тестирования. Цель данной лекции: дать представление о процессе интеграционного тестирования, его технической и организационной составляющих

20.1. Задачи и цели интеграционного тестирования

Результатом тестирования и верификации отдельных модулей, составляющих программную систему, должно быть заключение о том, что эти модули являются внутренне непротиворечивыми и соответствуют требованиям. Однако отдельные модули редко функционируют сами по себе, поэтому следующая задача после тестирования отдельных модулей - тестирование корректности взаимодействия нескольких модулей, объединенных в единое целое. Такое тестирование называют интеграционным . Его цель - удостовериться в корректности совместной работы компонент системы.

Интеграционное тестирование называют еще тестированием архитектуры системы . С одной стороны, это название обусловлено тем, что интеграционные тесты включают в себя проверки всех возможных видов взаимодействий между программными модулями и элементами, которые определяются в архитектуре системы - таким образом, интеграционные тесты проверяют полноту взаимодействий в тестируемой реализации системы. С другой стороны, результаты выполнения интеграционных тестов - один из основных источников информации для процесса улучшения и уточнения архитектуры системы, межмодульных и межкомпонентных интерфейсов. Т.е., с этой точки зрения, интеграционные тесты проверяют корректность взаимодействия компонент системы.

Примером проверки корректности взаимодействия могут служить два модуля, один из которых накапливает сообщения протокола о принятых файлах, а второй выводит этот протокол на экран. В функциональных требованиях к системе записано, что сообщения должны выводиться в обратном хронологическом порядке. Однако, модуль хранения сообщений сохраняет их в прямом порядке, а модуль вывода использует стек для вывода в обратном порядке. Модульные тесты, затрагивающие каждый модуль по отдельности, не дадут здесь никакого эффекта - вполне реальна обратная ситуация, при которой сообщения хранятся в обратном порядке, а выводятся с использованием очереди. Обнаружить потенциальную проблему можно только проверив взаимодействие модулей при помощи интеграционных тестов. Ключевым моментом здесь является то, что в обратном хронологическом порядке сообщения выводит система в целом, т.е., проверив модуль вывода и обнаружив, что он выводит сообщения в прямом порядке, мы не сможем гарантировать, что мы обнаружили дефект.

В результате проведения интеграционного тестирования и устранения всех выявленных дефектов получается согласованная и целостная архитектура программной системы, т.е. можно считать, что интеграционное тестирование - это тестирование архитектуры и низкоуровневых функциональных требований.

Интеграционное тестирование , как правило, представляет собой итеративный процесс, при котором проверяется функциональной все более и более увеличивающейся в размерах совокупности модулей.

20.2. Организация интеграционного тестирования

20.2.1. Структурная классификация методов интеграционного тестирования

Как правило, интеграционное тестирование проводится уже по завершении модульного тестирования для всех интегрируемых модулей. Однако это далеко не всегда так. Существует несколько методов проведения интеграционного тестирования:

  • восходящее тестирование ;
  • монолитное тестирование ;
  • нисходящее тестирование .

Все эти методики основываются на знаниях об архитектуре системы, которая часто изображается в виде структурных диаграмм или диаграмм вызовов функций . Каждый узел на такой диаграмме представляет собой программный модуль, а стрелки между ними представляют собой зависимость по вызовам между модулями. Основное различие методик интеграционного тестирования заключается в направлении движения по этим диаграммам и в широте охвата за одну итерацию.

Восходящее тестирование . При использовании этого метода подразумевается, что сначала тестируются все программные модули, входящие в состав системы и только затем они объединяются для интеграционного тестирования. При таком подходе значительно упрощается локализация ошибок: если модули протестированы по отдельности, то ошибка при их совместной работе есть проблема их интерфейса. При таком подходе область поиска проблем у тестировщика достаточно узка, и поэтому гораздо выше вероятность правильно идентифицировать дефект.


Рис. 20.1.

Однако, у восходящего метода тестирования есть существенный недостаток - необходимость в разработке драйвера и заглушек для модульного тестирования перед проведением интеграционного тестирования и необходимость в разработке драйвера и заглушек при интеграционном тестировании части модулей системы (Рис 20.1)

С одной стороны драйверы и заглушки - мощный инструмент тестирования, с другой - их разработка требует значительных ресурсов, особенно при изменении состава интегрируемых модулей, иначе говоря, может потребоваться один набор драйверов для модульного тестирования каждого модуля, отдельный драйвер и заглушки для тестирования интеграции двух модулей из набора, отдельный - для тестирования интеграции трех модулей и т.п. В первую очередь это связано с тем, что при интеграции модулей отпадает необходимость в некоторых заглушках, а также требуется изменение драйвера, которое поддерживает новые тесты, затрагивающие несколько модулей.

Монолитное тестирование предполагает, что отдельные компоненты системы серьезного тестирования не проходили. Основное преимущество данного метода - отсутствие необходимости в разработке тестового окружения, драйверов и заглушек. После разработки всех модулей выполняется их интеграция, затем система проверяется вся в целом. Этот подход не следует путать с системным тестированием, которому посвящена следующая лекция. Несмотря на то, что при монолитном тестировании проверятся работа всей системы в целом, основная задача этого тестирования - определить проблемы взаимодействия отдельных модулей системы. Задачей же системного тестирования является оценка качественных и количественных характеристик системы с точки зрения их приемлемости для конечного пользователя.

Монолитное тестирование имеет ряд серьезных недостатков.

  • Очень трудно выявить источник ошибки (идентифицировать ошибочный фрагмент кода). В большинстве модулей следует предполагать наличие ошибки. Проблема сводится к определению того, какая из ошибок во всех вовлечённых модулях привела к полученному результату. При этом возможно наложение эффектов ошибок. Кроме того, ошибка в одном модуле может блокировать тестирование другого.
  • Трудно организовать исправление ошибок. В результате тестирования тестировщиком фиксируется найденная проблема. Дефект в системе, вызвавший эту проблему, будет устранять разработчик. Поскольку, как правило, тестируемые модули написаны разными людьми, возникает проблема - кто из них является ответственным за поиск устранение дефекта? При такой "коллективной безответственности" скорость устранения дефектов может резко упасть.
  • Процесс тестирования плохо автоматизируется. Преимущество (нет дополнительного программного обеспечения, сопровождающего процесс тестирования) оборачивается недостатком. Каждое внесённое изменение требует повторения всех тестов.

Нисходящее тестирование предполагает, что процесс интеграционного тестирования движется следом за разработкой. Сначала тестируют только самый верхний управляющий уровень системы, без модулей более низкого уровня. Затем постепенно с более высокоуровневыми модулями интегрируются более низкоуровневые. В результате применения такого метода отпадает необходимость в драйверах (роль драйвера выполняет более высокоуровневый модуль системы), однако сохраняется нужда в заглушках (]. По своей сути такой подход не является новым типом интеграционного тестирования, просто меняется минимальный элемент, получаемый в результате интеграции. При интеграции модулей на процедурных языках программирования можно интегрировать любое количество модулей при условии разработки заглушек. При интеграции классов в кластеры существует достаточно нестрогое ограничение на законченность функциональности кластера. Однако, даже в случае объектно-ориентированных систем возможно интегрировать любое количество классов при помощи классов-заглушек.

Вне зависимости от применяемого метода интеграционного тестирования, необходимо учитывать степень покрытия интеграционными тестами функциональности системы. В работе был предложен способ оценки степени покрытия, основанный на управляющих вызовах между функциями и потоках данных. При такой оценке код всех модулей на структурной диаграмме системы должен быть выполнен (должны быть покрыты все узлы), все вызовы должны быть выполнены хотя бы единожды (должны быть покрыты все связи между узлами на структурной диаграмме), все последовательности вызовов должны быть выполнены хотя бы один раз (все пути на структурной диаграмме должны быть покрыты) .

Интегративный тест тревожности - оригинальная клиническая тестовая методика, созданная в 2005 году в НИПНИ им. Бехтерева к.пс.н. А.П. Бизюком, д.м.н. профессором Л.И. Вассерманом и к.м.н. Б.В. Иовлевым для общей структурной экспресс-диагностики тревоги и тревожности, в том числе в клинике псхосоматических заболеваний.

Теоретические основы

Авторы исходили из общих клинико-психопатологических представлений о тревоге как психофизиолгическом процессе и учитывали накопленный опыт в создании и использовании стандартизированных инструментов оценки тревоги.

Тревога относится к числу фундаментальных, но наименее специфических субъективных эмоциональных состояний, постоянно наблюдаемых при различных формах патологии и предпатологии. Являясь одним из наиболее облигатных проявлений острого и хронического стресса, тревога, как известно, выполняет как защитную (мобилизующую) функцию, так и дестабилизирующую в том случае, если ее интенсивность и длительность превышают индивидуальные компенсаторные возможности личности в процессе адаптации.

Ещё одним недостатком многих инструментальных методов исследования является недифференцированность тревоги и тревожности. Тревога и тревожность – различные, но системно связанные понятия, анализировать которые следует сопряжено для того, чтобы понять их личностный смысл в реальной жизненной ситуации человека. Именно таким образом в комплексной многомерной диагностике нарушений психической адаптации исследуется патогенез формирующихся психогений и социогений, внутренней картины болезни, тенденций к саморазрушающему поведению и др. Особенно четко эти общие механизмы формирования клинической картины болезни, где тревога – тревожность играют существенную (а нередко и основополагающую) роль, прослеживаются преимущественно при невротических и неврозоподобных расстройствах соматоформного типа (F4 – МКБ-10). Универсальность тревоги как аффективного регулятора поведения заключается прежде всего в ее опосредующей значимости и включенности в другие психические феномены, поэтому позитивная диагностика этого феномена чрезвычайно важна для квалификации формирующейся клинической картины болезни при тревожно-фобических (F40), других тревожных расстройствах (F.41), особенно при смешанных тревожных и депрессивных расстройствах (F41.2), при посттравматических стрессовых расстройствах (F43.1) и расстройствах адаптации (F43.2), соматоформных вегетативных расстройствах (F45.3), при соматогенных и др. нарушениях аффективного круга. Более того, тревога как эмоциональное состояние и тревожность как фундаментальная личностная характеристика, должна анализироваться во многих сферах функционирования личности: в спорте, военной и операторской деятельности специалистов, профотборе, педагогическом процессе и других областях, где предъявляются специальные требования к адаптивным возможностям человека. Нарушения психической адаптации как сложной многомерной системы приспособительных механизмов личности возникают в силу различных причин и обстоятельств, и в настоящее время одной из наиболее практически значимых задач совместной деятельности психиатров и врачей общего профиля с клиническими психологами является диагностика, содержательная квалификация и комплексная коррекция состояний условно патологического типа, к которым относятся нарушения психической адаптации.

Особенностью этих расстройств являются клинически слабо структурированные, нестойкие, полиморфные симптомы, не имеющие четкой нозологической принадлежности. Частота их встречаемости по данным литературы варьирует в широких пределах (22,0%-89,7%), но имеет четкую тенденцию к увеличению, прежде всего в связи с изменениями качества жизни населения в нашей стране. В их генезе, наряду с влиянием так называемых социально-стрессовых расстройств и социальной фрустрированности имеют место и личностные факторы – неумение людей самостоятельно разрешать кризисные ситуации, внутриличностные, семейные и производственные конфликты, что неизбежно приводит к хроническому стрессу и дистрессам, сопровождающимся тревожными переживаниями.

Клиническая диагностика состояний психической дезадаптации вызывает существенные трудности, особенно у врачей общего профиля, имеющих дело с психосоматическими и соматопсихическими расстройствами, с побочными эффектами лекарственной терапии и т.п. Эти трудности обусловлены, прежде всего, сложностью диагностики состояний тревоги, которая относится, как известно, к числу и неспецифических эмоциональных феноменов, сопровождающих различные патологические процессы, однако отличается поведенчески бедными проявлениями (как и скрытая депрессия), ее диагностика затруднена даже для специалистов – психоневрологов и психотерапевтов. Еще раз следует подчеркнуть, что речь идет о выявлении состояния, весьма бедного поведенческими, речевыми, вегетативно-соматическими проявлениями, без четких диагностических критериев в жалобах людей, даже если они и обращаются за консультативной помощью к врачу или медицинскому психологу (в случаях выраженной, легко определяемой тревоги данная проблема не встаёт).

Внутренняя структура

Для получения стимульного материала – утверждений для личностного субъективного шкалирования, отражающих понятия тревога и тревожность, были использованы методы контент-анализа и экспертных оценок множества определений упомянутого состояния и свойства, выделенных из различных источников: руководств по психиатрии и психологии, специальных монографий, специальных словарей, международных классификаций болезней и ряда других специальных опросников (преимущественно клинических) для диагностики тревоги. После необходимых селективных процедур, направленных на устранение синонимичности или смысловой близости вербальных обозначений, экспертами (психиатрами и клиническими психологами) из общего перечня отображенных определений были выделены только 15 наиболее адекватных для решения поставленных задач.

С целью дифференцированного и детализации представления о влияниях различных компонентов самооценки испытуемого как носителя тревоги, в отношении накопленного эмпирического материала был применен метод факторного анализа, что позволило в структуре 15 признаков выделить 5 факторов, интерпретируемых, как уже говорилось, в качестве вспомогательных шкал, а именно “эмоциональный дискомфорт” (ЭД), “астенический компонент тревожности" (АСТ), “фобический компонент” (ФОБ), “тревожная оценка перспективы” (ОП) и “социальная защита" (СЗ) (факторы даны в порядке убывания объяснимой дисперсии – соответственно – 2,082; 1,512; 1,459; 1,458, 1,280). Подробное описание эквивалентных им вспомогательных шкал приводится ниже. Полученные факторные нагрузки по признакам используются в качестве диагностических коэффициентов новых вспомогательных шкал, построенных на базе извлеченных факторов, что повышает диагностический потенциал теста ИТТ. Прежде всего, это усиливает информативность методики в целом, а также повышает ее надежность в принятии решения, обеспечивая тем самым высокий уровень дифференцированности значений отдельных признаков как субкомпонентов тревоги-тревожности. Таким образом оказалось возможным рассматривать психологическую структуру тревоги – тревожности в экспериментально заданных рамках.

Интегративный тест тревожности был валидизирован на популяции не только взрослых, но и подростков, что ещё больше расширяет возможное поле применения методики.

Таким образом, интегративный тест тревожности состоит из двух субтестов, предназначенных для раздельной оценки тревоги и тревожности. Каждый субтест содержит 15 утверждений, с каждым из которых испытуемый должен выразить своё согласие по 4-балльной шкале. Утверждения субтестов полностью идентичны, различается лишь инструкция. В итоге из теста можно извлечь общий балл по каждому субтесту и 5 шкальных значений (всего 12 показателей).

Валидность

Содержательная валидность теста обеспечивалась моделированием экспертного согласия еще в процессе подготовки теста, поскольку основным материалом содержания формулировок утверждений, как уже указывалось, являлись результаты контент-анализа многочисленных литературных источников, авторы которых предметно занимались исследованием данного психического феномена.

Проверка эмпирической валидности, связанной, главным образом, с корреляционными соотношениями между проверяемым тестом и результатами исследований с помощью других методик, позволяющих оценивать исследуемые качества, показала следующие результаты. Параллельные исследования по СТ и 16-факторному опроснику Кеттелла продемонстрировали корреляцию на уровне r= + 0,43 (p<0,01) показателя шкалы общей тревожности и фактора “О” (уверенность в себе – тревожность), причем близкие к такого же уровня значимости корреляции с этим же фактором показали и все вспомогательные шкалы ИТТ (ЭД, АСТ, ФОБ, ОП и СЗ). Кроме того, выявилась отрицательная корреляция шкалы АСТ с фактором QЗ (низкий самоконтроль – высокий самоконтроль или низкая интеграция чувства “Я” – высокая интеграция) r= – 0,406 (р<0,01). Остальные шкалы также имели достаточно отчетливую отрицательную связь с показателем фактора Q3, но не достигшую уровня статистической достоверности. Подобные же на уровне выраженной тенденции отрицательные корреляции продемонстрировали все вспомогательные шкалы и с фактором “С” (эмоциональная неустойчивость – эмоциональная устойчивость или низкая сила “эго” – высокая сила “эго”). Определенный интерес с точки зрения эмпирической валидности представляет и связь шкалы ОП с фактором Q4 (раccлабленность – напряженность) (r= + 0,36; р<0,05), что свидетельствует о наличии общих корней тревожной оценки перспективы в ее содержательном значении по методике СТ и мотивационной неудовлетворенностью, репрезентируемой фактором Q4 теста Кеттелла.

В корреляционной матрице методик СТ и 16 РF обнаружилась еще одна корреляционная зависимость, подтверждающая эмпирическую валидность выделенных шкал – это положительная связь шкалы ЭД с фактором “L” (доверчивость – подозрительность), отражающим, главным образом, настороженно-эмоциональное отношение к людям (г = + 0.387; р<0,01).

Апробация методики

В процессе разработки методика использовалась при изучении особенностей психологической адаптации участников отечественных антарктических экспедиций на ряде полярных станций, а также в период их транспортировки на Шестой континент и обратно. При этом проводились параллельные ежемесячные (иногда через два месяца) исследования эмоционального состояния с помощью блока психологических методик, в число которых входили СТ и широко известная личностная шкала проявлений тревоги J. Тауlоr. Этот материал послужил дополнительным основанием для суждения о концептуальной валидности рассматриваемого метода.

Прежде всего, наблюдалось общее, практически синхронное, совпадение профиля кривых динамики оценки тревожности по обеим методикам, отражающим один и тот же процесс эмоционального приспособления к экстремальным условиям как на уровне включения в специфическую природную среду, так и необычные социально-психологические условия, свойственные подобным экспедициям. С другой стороны, результат частного анализа изменения основной и вспомогательных шкал методики СТ и их пики полностью соответствуют ситуации, характеризовавшейся психологическим напряжением и спецификой различных этапов зимовки, ранее отписанных в литературе и наблюдаемых врачами экспедиций (первый месяц работы, вершина полярной ночи, период выхода судов за отзимовавшей партией и т.д.). При этом эмоциональная реактивность определялась как особенностями личностно-средового взаимодействия, так и фоном интерперсонального взаимодействия. Для подтверждения общей чувствительности методики к специфическим личностным особенностям, предрасполагающим или включающим в себя тревожность как один из основных компонентов клинико-психологического статуса, было проведено сравнительное исследование практически здоровых лиц и группы больных с различными формами неврозов и неврозоподобных расстройств с клинически подтвержденными диагнозами и наличием в структуре расстройств тревожного компонента. Исследования показали, что общий уровень самооценки изучаемых свойств среди группы больных статистически значимо отличается от контрольной – средний показатель ситуативной тревожности у них составил 20,0, а личностной 26,8 балла (в обоих случаях достоверность различий с р<0,001), что может свидетельствовать и о способности методики улавливать более общие характеристики адаптивности человека как многокомпонентного (системного) образования, биопсихосоциального по своей сущности.

В связи с задачами практической апробации методика ИТТ была включена в программу скринингового исследования педагогов общеобразовательных школ Челябинска в целях первичной психопрофилактики. Обследовано 7300 педагогов с помощью формализованных анкет, опросников и различных медико-психологических тестов. У 89% отмечались нарушения здоровья уровня “группы риска”, т.е. выявлялись признаки психической дезадаптации, у 43% выявлены нарушения уровня повышенного риска или начальных проявлений болезни. Среди них с признаками неврозов – 60%, патологии сердечно-сосудистой системы – 34 7%, сосудов головного мозга – 38,2%, пищеварительного тракта – 28,6% и др. У большинства из обследованных педагогов группы повышенного риска отмечались неврозоподобные расстройства в виде тревоги, астении, снижения настроения и работоспособности.

Исследование особенностей и уровня тревожности с помощью методики Ч. Спилбергера проведено у 349 педагогов, выявлены в среднем достоверно высокие уровни ситуативной и личностной тревожности (соответственно 49,3±5,4 балла и 47,0±5,9 баллов) при высоком уровне их взаимной корреляции. Для уточнения структуры тревожности была выделена репрезентативная группа из 86 человек с высокими показателями уровня тревожности. Эта группа была обследована с помощью теста ИТТ.

В целом у исследованной группы преобладала личностная тревожность, в особенности тревожная оценка перспектив. Это прослеживается и в оценке ситуативной тревоги. Характерно, что факторная структура личностной тревожности определяется также эмоциональным дискомфортом и астеническими нарушениями. Полученные данные на высоком статистическом уровне коррелируют с результатами тестирования по методике 16-РF Кеттелла и шкалой актуальной ригидности Томского опросника психической ригидности .

Коротко обобщая эти данные, можно утверждать, что содержательный характер тревожных расстройств у педагогов общеобразовательных школ, а именно у представителей группы высокого риска психической дезадаптации, определяется главным образом спецификой переработки личностных конфликтов вследствие нарушений личностно-средового взаимодействия. Отсюда следует, что в комплексной коррекции указанных состояний важное место наряду с психотерапией должен занять и социально-психологический тренинг личностного роста, коммуникативности и преодоления конфликтных ситуаций как наиболее адекватный способ повышения социальной компетентности личности.

Интерпретация

Общие принципы

Оценки выраженности симптомов переводятся в числовые значения следующим образом: 0 – отсутствие данного признака, два других связываются с наличием слабо и умеренно выраженных признаков (баллы 1 и 2) и последний – как чрезвычайная, с точки зрения испытуемого, степень выраженности – 3 балла. Таким образом, по каждому субтесту испытуемый может набрать не более 45 баллов.

Для подсчёта сырых значений дополнительных шкал необходимо в соответствии с таблицей сложить баллы, соответствующие ответам на входящие в кажду шкалу утверждения:

ЭД АСТ ФОБ ОП СЗ
0 1 2 3 0 1 2 3 0 1 2 3 0 1 2 3 0 1 2 3
1 0 25 49 74
2 0 24 49 73
3 0 37 74 110
4 0 27 53 80
5 0 32 65 98
6 0 24 49 73
7 0 37 74 111
8 0 30 61 91
9 0 28 56 85
10 0 57 114 171
11 0 43 86 129
12 0 29 58 87
13 0 41 81 122
14 0 29 58 87
15 0 31 61 92

Нормативные показатели

Средний фактический балл, полученный для нормативной группы из 540 практически здоровых лиц в возрасте от 22 до 55 лет равен 11,91 (стандартное отклонение – 4,58). Статистически достоверных различий для СТ-Л и СТ-С, а также отдельно для мужчин и женщин получено не было, хотя тенденцию более высокой тревожности женщин все же следует отметить, что, как известно, отмечается и в литературе.

Нормативные материалы для подростков (12-15 лет – 520 человек) дали средний балл 12,88 (сигма = 5,5), однако здесь, в отличие от взрослого контингента разница средних для юношей и девушек оказалась статистически достоверной с надежностью р<0,001 (соответственно, юноши – 11,64 и девушки – 14,13 балла).

Для облегчения процедуры оценки результатов между собой был осуществлён математический перевод сырых баллов в нормативные - станайны .

Клиническая значимость

Главное и основное применение методики - выявление скрытой, маскированной тревоги и тревожности среди широкого контингента лиц, в том числе подростков, в рамках массовых обследований. Простота и небольшой размер методики позволяют минимизировать время на заполнение бланков, а высокая чувствительность позволяет отобрать контингент, нуждающийся в более пристальном внимании специалистов.

В качестве изолированной методики также возможно применение в качестве оценочного инструмента в клинике для оценки динамики состояния на фоне психотерапии и/или психофармакотерапии. Методика может быть рекомендована в качестве вспомогательного инструмента для индивидуальных исследований уровня психической дезадаптации, а также для анализа основных факторов, влияющих на эмоциональное состояние испытуемого. При этом целесообразно, чтобы данный инструмент использовался в комплексе с другими методиками оценки эмоциональных состояний, в частности уровня невротизации, депрессии и др.

В обоих случаях следует помнить, что данные теста сами по себе, как и данные любых других, не могут заменить собой процесс постановки диагноза и не могут служить единственным средством его установления. Следует учитывать целый комплекс данных, среди которых: предъявляемые жалобы, анамнез жизни и заболевания, общая картина заболевания и т.д.

Следует также помнить, что тест не имеет мотивацонной защиты и его результаты могут быть леко искажены.

РАЗВИТИЕ ТЕСТОВОЙ ТЕХНОЛОГИИ КОНТРОЛЯ УРОВНЯ ОБУЧЕННОСТИ СТУДЕНТОВ.

Белоногова Наталья Николаевна, преподаватель математики ГБОУ СПО МО « Московский областной гуманитарный колледж»

Педагогические технологии должны идти в ногу со временем. Темп современной жизни предъявляет новые требования к процессу обучения. Если раньше выпускные экзамены по математике были в форме письменной контрольной работы , то сейчас это уже ЕГЭ. Тесты дают возможность заметно улучшить образовательный процесс, потому что обладают рядом преимуществ перед другими методами контроля знаний; являясь обязательной частью многих педагогических новаций, они снижают затраты времени на проверку знаний, помогают выявить индивидуальный темп обучения, а также пробелы в текущей и итоговой подготовке.

Раньше тесты применялись в двух основных сферах: в образовании и в сфере профотбора-профориентации. Затронутые тестами столь важные сферы жизни и прямое влияние результатов тестового контроля на судьбы миллионов людей породили широкую гамму мнений в пользу и против тестов. Большой энтузиазм тех, кто их применял, и не меньший пессимизм тех, кто видел несовершенство этого метода или пострадал в результате его неправильного использования, привели к тому, что одни видели в тестовом контроле средство принижения роли педагога, воспринимали тесты как средство выражения недоверия к традиционно выставляемым оценкам и потому проявляли определенную настороженность, и только немногие рассматривали их как средство радикального преобразования учебного процесса в сторону его объективизации - и становились энтузиастами этого метода.

В сочетании с ПК, тесты помогают перейти к созданию современных систем адаптивного обучения и контроля - наиболее современных в организации учебного процесса. Без тестов невозможен переход к прогрессивному обучению на основе принятой у нас системы полного усвоения знаний. Обучение начинается с входного тестирования, сопровождается текущим контролем с помощью заданий в тестовой форме и заканчивается объективным тестированием учебных достижений. Кроме того, тесты позволяют наладить самоконтроль - самую полезную для обучения и гуманную форму контроля знаний, а также организовать рейтинг - эффективное средство повышения учебной мотивации.

Слово "тест" вызывает у людей самые различные представления. Одни полагают, что это вопросы или задачи с одним готовым ответом, который надо угадать. Другие считают тест формой игры или забавы. Третьи пытаются истолковать это как перевод с английского слова "test", (проба, испытание, проверка). В наши дни существует много видов тестов, поэтому дать универсальное определение для всех этих видов вряд ли можно.

Существуют два основных класса тестов: традиционные и нетрадиционные.

Традиционный тест представляет собой стандартизованный метод диагностики уровня и структуры подготовленности. В таком тесте все испытуемые отвечают на одни и те же задания, в одинаковое время, в одинаковых условиях и с одинаковыми правилами оценивания ответов.

Педагогический тест определяется как система заданий определенного содержания, возрастающей трудности, специфической формы, позволяющая качественно и эффективно измерить уровень и оценить структуру подготовленности учащихся. В педагогическом тесте задания располагаются по мере возрастания трудности - от самого легкого до самого трудного.

К традиционным тестам относятся тесты гомогенные и гетерогенные .

Гомогенные тесты

Гомогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по одной учебной дисциплине.

Легко видеть, что в своей основе определение гомогенного теста совпадает с определением традиционного теста.

Гомогенные тесты распространены больше других. В педагогике они создаются для контроля знаний по одной учебной дисциплине или по одному разделу такой, например, объемной учебной дисциплины, как физика. В гомогенном педагогическом тесте не допускается использование заданий, выявляющих другие свойства. Наличие последних нарушает требование дисциплинарной чистоты педагогического теста. Ведь каждый тест измеряет что-то заранее определенное.

Гетерогенные тесты

Гетерогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по нескольким учебным дисциплинам.

Главная цель применения традиционных тестов - установить отношение порядка устанавливаемых между испытуемыми по уровню проявляемых при тестировании знаний. И на этой основе определить место (или рейтинг) каждого на заданном множестве тестируемых испытуемых. В тест стараются отобрать минимально достаточное количество заданий, которое позволяет сравнительно точно определить уровень и структуру подготовленности. Интерпретация результатов тестирования ведется преимущественно с опорой на среднюю арифметическую и, на так называемые, процентные нормы, показывающие, - сколько процентов испытуемых имеют тестовый результат худший, чем у любого другого испытуемого. Такая интерпретация тестовых результатов называется нормативно-ориентированной .

Интегративные тесты

Интегративным можно назвать тест, состоящий из системы заданий, отвечающих требованиям интегративного содержания, тестовой формы, возрастающей трудности заданий, нацеленных на обобщенную итоговую диагностику подготовленности выпускника образовательного учреждения.

Преимущество интегративных тестов перед гетерогенными заключается в большей содержательной информативности каждого задания и в меньшем числе самих заданий.

Адаптивные тесты

Адаптивный тест работает, как хороший экзаменатор. Сначала он "задает" вопрос средней сложности, и полученный ответ немедленно оценивается. Если ответ правильный, то оценка возможностей тестируемого повышается. В этом случае задается более сложный вопрос. При успешном ответе следующее задание ПК подбирает более трудным, при неуспешном - легким.

Содержание теста можно определить как оптимальное отображение учебного материала в системе тестовых заданий . Внеучебное содержание (например, проверка уровня интеллектуального развития) в педагогический тест не включается. Это предмет психологического измерения.

Поскольку в педагогическом тесте задания упорядочиваются по принципу возрастающей трудности, одни испытуемые "заваливаются" уже на самом легком, первом задании, другие - на последующих заданиях. Ученики среднего уровня подготовленности могут ответить правильно только на половину заданий теста и, наконец, только самые знающие в состоянии дать правильный ответ на задания самого высокого уровня трудности, расположенные в конце теста.

Ответ на задание педагогического теста представляет собой краткое суждение, связанное по содержанию и по форме с содержанием задания. Каждому заданию ставятся в соответствие ответы правильные и неправильные. Критерии правильности заранее определяются авторами теста. Вероятность правильного ответа на любое задание зависит от соотношения уровня знаний испытуемого и уровня трудности задания. При наличии сопоставимых шкал эту вероятность выражают значением от нуля до единицы. Посредством тестирования, чаще других признаков, проверяются знания, умения, навыки и представления. С точки зрения педагогических измерений полезно ввести два основных показателя качества знаний - уровень и структура знаний . Они оценивается посредством регистрации оценок, как за знание, так и за незнание всех требуемых компонентов проверяемого материала. Для объективизации этого процесса все компоненты должны быть одинаковы. Одинаковыми являются и правила выставления оценок испытуемым. Эти условия открывают дорогу для объективного сравнения индивидуальных структур знания и незнания.

Уровень знаний выявляется при анализе ответов каждого ученика на все задания теста. Чем больше правильных ответов, тем выше индивидуальный тестовый балл испытуемых. Один и тот же уровень знаний может быть получен за счет ответов на различные задания.

Планомерное осуществление тестового контроля позволяет преподавателю, учебному заведению оценить степень усвоения учебного материал студентами за определенный период, выявить успехи в учении, пробелы и недостатки в знаниях, умениях и навыках у отдельных студентов и у всей группы в целом, определить качество усвоения пройденного и соответствие уровня обученности требованием ГОС. Объективный анализ результатов тестового контроля за учебной деятельностью студентов служит для преподавателей и руководителей ссузов основой определения состояния учебно-воспитательной работы и мер, необходимых для ее совершенствования. Тестовый контроль, осуществляемый преподавателем, в сочетании с другими формами контроля и самоконтролем дает возможность каждому студенту видеть результаты учения и принимать меры к устранению обнаруженных недостатков.

Объективный, надежный и валидный тестовый контроль имеет важное образовательное и развивающее значение, способствуя всестороннему изучению программы, расширению, углублению и совершенствованию знаний, умений и навыков, развитию познавательных интересов студентов. Каждый студент вынужден активно, мотивированно участвовать в процессе тестового контроля, так как технология научно-организованного педагогического теста не допускает невнимательного отношения испытуемых к выполнению заданий.

Объективный тестовый контроль в процессе обучения характеризуется также большим воспитательным значением, так как он повышает ответственность за выполняемую работу не только студентов, но и преподавателя, приучает студентов к систематическому труду и аккуратности в выполнении учебных заданий, формирует у них положительные нравственные качества и создает здоровое общественное мнение.

Комплексное использование тестовых и не тестовых форм контроля над учебной деятельностью студентов, в конечном счете, направлено на повышение качества обучения.

Анализируя теоретические исследования отечественных и зарубежных ученых, а также практику массового тестирования, можно утверждать, что педагогические тесты, отвечающие высоким критериям качества, обладают несомненными преимуществами перед традиционными субъективными формами контроля уровня обученности студентов. Надежный и валидный педагогический тест полностью отвечает требованиям к технологии контроля знаний, умений навыков студентов на всех этапах обучения.

К преимуществам тестовой технологии контроля относятся:

    Индивидуальный характер контроля, возможность осуществления контроля над работой каждого студента, за его личной учебной деятельностью.

    Возможность регулярного систематичного проведения тестового контроля на всех этапах процесса обучения.

    Возможность сочетания ее с другими традиционными формами педагогического контроля.

    Всесторонность, заключающаяся в том, что педагогический тест может охватывать все разделы учебной программы, обеспечивать полную проверку теоретических знаний, интеллектуальных и практических умений и навыков студентов.

    Объективность тестового контроля, исключающая субъективные (часто ошибочные) оценочные суждения и выводы преподавателя, основанные на недостаточном изучении уровня подготовки студентов или предвзятом отношении к некоторым из них.

    Учет специфических особенностей каждого учебного предмета и отдельных его разделов за счет применения современных методик разработки и многообразия форм тестовых заданий.

    Возможность проведения традиционного ("бумажного") и компьютеризованного (в локальной сети) тестирования.

    Возможность применения современной технологии компьютерно-адаптивного тестирования.

    Возможность массового широкомасштабного стандартизованного тестирования путем распечатки и тиражирования параллельных форм (вариантов) теста и доставки его в различные учебные заведения.

    Учет индивидуальных особенностей специфической выборки испытуемых, требующий применения в соответствии с этими особенностями различной методики разработки теста и тестовых заданий.

    Единство требований ко всем испытуемым, вне зависимости от их прошлых учебных достижений.

    Стандартизованность тестового контроля, возможность разработки единого теста для различных учебных заведений на основе требований ГОС СПО.

    Дифференцированность шкалы тестовых баллов, позволяющей в широком диапазоне ранжировать уровень учебных достижений студентов.

    Высокая надежность тестового контроля, позволяющая говорить о полноценном педагогическом измерении уровня обученности.

    Высокая содержательная валидность тестового контроля, основанная на включении всех дидактических единиц программы обучения в задания теста.

    Высокая прогностическая валидность вступительных тестовых испытаний, позволяющая предвидеть успехи студентов в будущем.

    Высокая критериальная (текущая) валидность итоговых аттестационных тестов.

    Эффективность педагогического теста, позволяющая проводить контроль любой выборки испытуемых, за короткое время с минимальными затратами.

    При правильной организации проведения тестирования и применение методов информационной безопасности можно исключить недобросовестное отношение некоторых студентов к выполнению письменных контрольных испытаний (списывание использование подсказок, шпаргалок и т.п.).

    Тестовый контроль стимулирует постоянную работу всех студентов, и это в известной степени достигается проведением широкомасштабного неожиданного для испытуемых тестирования.

    Возможность учета при тестировании региональных особенностей ГОС СПО.

Обеспечение и реализация достоинств тестовой технологии может быть выполнена только при учете требований классической и современной тестовой теории. Только на базе тестовой теории и современных методик разработки тестов можно обеспечить надежность, валидность 1 и эффективность контроля, выполнение им своих задач в процессе обучения и итоговой аттестации студентов.

Содержание педагогического теста определяется дидактическими задачами на различных этапах обучения, спецификой учебных предметов, уровнем подготовки и развития студентов. Очень важно, чтобы тестовый контроль не сводился исключительно к проверке знаний студентов путем простого воспроизведения полученной ими от преподавателя или из учебников информации. В процессе тестового контроля большое значение имеет комплексная проверка всей учебной деятельности ученика, в том числе динамики его общего развития, формирования специальных умений и навыков, активности, познавательных интересов, творческих спосо Результаты контроля учебно-познавательной деятельности студентов выражаются в ее оценке. В широком смысле слова оценкой называют характеристику ценности, уровня или значения каких-либо объектов или процессов. Оценить - значит установить уровень, степень или качество чего-нибудь. Применительно к учебно-познавательной деятельности оценка означает установление степени выполнения студентами задач, поставленных перед ними в процессе обучения, уровня их подготовки и развития, качества приобретенных знаний, сформированных умений и навыков. Поскольку оценка тесно связана с контролем и является его следствием, к ней в полной мере относятся педагогические требования, предъявляемые к контролю объективность, систематичность, индивидуальный подход, и др.

СПИСОК ИСПОЛЬЗОВАННЫХИСТОЧНИКОВ

    Ж.Н. Зайцева, В.И. Солдатин Информатизация образования: состояние проблемы и перспективы М.; ИЦПКПС, 1998, 38с.

    Христовский С.А. Методические основы проектирования электронного учебника, Проектирование образовательных информационных ресурсов, систем и технологий. Сб. докладов и сообщений.- М., ИЦПКПС, 1998, 75с.

    Аванесов В.С. "Научные основы тестового контроля знаний". М. Иссл. центр, 1994 .

    http://www.usatic.narod.ru

1 ВАЛИДНОСТЬ означает пригодность тестовых результатов для той цели, ради чего проводилось тестирование.



© 2024 solidar.ru -- Юридический портал. Только полезная и актуальная информация