Оглавление

Общественное здоровье и здравоохранение : руководство к практическим занятиям: учеб. пособие / В. А. Медик, В. И. Лисицин, М. С. Токмачев. - 2012. - 400 с.: ил.
Общественное здоровье и здравоохранение : руководство к практическим занятиям: учеб. пособие / В. А. Медик, В. И. Лисицин, М. С. Токмачев. - 2012. - 400 с.: ил.
МОДУЛЬ 1.8. АНАЛИЗ ЗАВИСИМОСТЕЙ СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ

МОДУЛЬ 1.8. АНАЛИЗ ЗАВИСИМОСТЕЙ СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ

Цель изучения модуля: показать значение зависимостей между статистическими показателями для изучения общественного здоровья, деятельности системы (организаций) здравоохранения, в клинической практике.

После изучения темы студент должен знать:

- типы зависимостей между статистическими показателями;

- непараметрические методы оценки корреляционной зависимости;

- методику расчета, анализа и интерпретации выявленных зависимостей между статистическими показателями.

Студент должен уметь:

- установить тип зависимости между статистическими показателями;

- выбрать тот или иной тип зависимости между статистическими показателями при анализе общественного здоровья и деятельности системы (организаций) здравоохранения;

- рассчитать выборочный коэффициент корреляции;

- провести оценку корреляционной зависимости с помощью непараметрических методов;

- использовать полученные знания при обучении на клинических кафедрах.

1.8.1. Блок информации

Типы зависимостей. Многие прикладные задачи, например изучение причинно-следственных связей факторов риска и заболеваемости населения, требуют установления вида зависимости между показателями, которые выступают как случайные величины. Сама постановка множества задач в различных медико-социальных иссле-

дованиях предполагает построение и реализацию алгоритмов «фак- тор-отклик», «доза-эффект».

Случайные величины X и Y могут быть независимыми либо зависимыми.

Зависимость случайных величин называют стохастической (статистической), если изменение одной из них приводит к изменению закона распределения другой. Если изменение одной из случайных величин влечет изменение среднего другой случайной величины, то стохастическую зависимость называют корреляционной (например, зависимость заболеваемости населения от воздействия внешних факторов - эколого-гигиенических (климатические факторы, содержание различных соединений в атмосферном воздухе, воде, почве, пищевых продуктах), медико-организационных (уровень диспансеризации населения, обеспеченность больничными койками, медицинским персоналом) и т.д.). Сами случайные величины, связанные корреляционной зависимостью, оказываются коррелированными. При корреляционной зависимости Y и X возможно наблюдать тенденцию роста: с увеличением значений Х среднее значение Y возрастает или с увеличением значений Х среднее значение Y уменьшается. В этих случаях говорят соответственно о положительной или отрицательной корреляции.

Выборочный коэффициент корреляции. Как известно, степень зависимости случайных величин Х и Y (двух признаков) характеризуется значением коэффициента корреляции:

где K(X, Y) - корреляционный момент (ковариация) случайных величин X и Y, D(X) и D(Y) - дисперсии случайных величин.

Отметим, что всегда -1   r 1. Чем больше значение r отличается от нуля, тем сильнее зависимость X и Y. Если |r| = 1, то случайные величины X и Y связаны линейной функциональной зависимостью, Y = аХ + b, причем при r = -1 коэффициент а <0 (зависимость X и Y обратная), а при r = 1 коэффициент а >0 (зависимость X и Y прямая).

При этом коэффициент корреляции, как и всякая другая теоретическая характеристика, вычисляется, исходя из всех возможных значений Хи Y. На практике мы не имеем возможности охватить наблюдениями все указанное множество, а используем лишь огра-

ниченное число наблюдений: двухмерную выборку1 значений (x, y). Полученные числа можно занести в таблицу.

Таблица. Запись двумерной выборки

По данным наблюдений можно вычислить значение коэффициента корреляции так же, как и в случае системы дискретных случайных величин, с той лишь разницей, что вместо известных вероятностей для каждой пары возможных значений будем использовать соответствующий аналог: относительную частоту 1/n. Формула для вычисления выборочного коэффициента корреляции генеральных совокупностей (случайных величин) X и Y, исходя из двухмерной выборки, выглядит так:

Если наблюдения объединяются по интервалам, т.е. все значения, попавшие в интервал, округляются до значения середины интервала, то каждая из наблюдаемых пар значений может встретиться неоднократно. В этом случае обычно данные заносят в таблицу с учетом частот встречаемости. Такую таблицу сгруппированных данных называют корреляционной.

Выборочный коэффициент корреляции rB - оценка коэффициента корреляции r, рассчитанного по всей генеральной совокупности, т.е. rB r. Следовательно, рассчитав rB, можно судить о силе линейной связи. В случае если выборка имеет достаточно большой объем n, порядка сотен, то целесообразно воспользоваться rB как точечной оценкой коэффициента корреляции r.

1 Отметим, что в случае двумерной выборки значения случайных величин Х и Y располагаются не произвольно, а в соответствии с номером испытания i, т.е. каждому xi соответствует yi.

Непараметрические методы оценки корреляционной зависимости.

Приведем ряд характеристик, оценивающих тесноту связи различных факторов (признаков), причем не только количественных, но и качественных. В простейшем случае это признаки, представленные двумя альтернативными исходами типа «да-нет», «жив-умер», «заболел- не заболел» и т.д. Показатели тесноты связи вычисляются с использованием таблиц сопряженности.

Таблица. Сопряженность признаков

Для характеристики тесноты связи между признаками используются коэффициент ассоциации Юла и коэффициент контингенции Пирсона.

Коэффициент ассоциации Юла (KJ в соответствии с приведенной таблицей рассчитывают по формуле:

Коэффициент ассоциации Ка может принимать значения от -1 до +1. В случаях когда Ка = ±1, теснота связи между признаками считается наиболее сильной, причем так же, как и для коэффициента корреляции, положительный или отрицательный знак Ка свидетельствует о прямой или соответственно обратной зависимости значений признаков.

Коэффициент контингенции Пирсона Кк рассчитывают по формуле:

Коэффициент контингенции также изменяется от -1 до +1, но его значения всегда (за исключением граничных случаев KK = ±1)

несколько меньше значений коэффициента ассоциации. Эта характеристика имеет тот же смысл, что и Ka.

Для качественной оценки силы связи при использовании коэффициента ассоциации Юла и коэффициента контингенции Пирсона можно руководствоваться шкалой Чеддока.

Таблица. Шкала Чеддока

В случае когда каждый из двух качественных признаков содержат более двух групп значений, тесноту связи признаков измеряют с помощью коэффициента взаимной сопряженности, который рассчитывается по специальным формулам1.

1.8.2. Задания для самостоятельной работы

1. Изучить материалы соответствующей главы учебника [1], модуля, рекомендуемой литературы.

2. Ответить на контрольные вопросы.

3. Разобрать задачу-эталон.

4. Ответить на вопросы тестового задания модуля.

5. Решить задачи.

1.8.3. Контрольные вопросы

1. Дайте определение корреляционной зависимости. Приведите примеры.

2. Опишите методику вычисления выборочного коэффициента корреляции.

3. Какая связь между выборочным коэффициентом корреляции и коэффициентом корреляции генеральной совокупности?

4. Какова структура таблицы сопряженности признаков?

5. Для изучения каких признаков используют коэффициент ассоциации Юла и коэффициент контингенции Пирсона? О чем свидетельствуют отрицательные и положительные значения этих коэффициентов?

6. Для чего используют шкалу Чеддока?

1 Подробнее см.: Математическая статистика в медицине : учеб. пособие / В.А. Медик, М.С. Токмачев. - М.: Финансы и статистика, 2007. - С. 457-459.

1.8.4. Задача-эталон

Исходные данные

1. При изучении общественного здоровья населения некоторого субъекта РФ возникла необходимость провести анализ зависимости показателя смертности от возраста и пола. Необходимые статистические данные представлены в таблице.

Таблица. Возрастно-половые статистические показатели смертности населения (на 1000 населения соответствующего пола и возраста)

2. Для углубленного изучения смертности от туберкулеза в зависимости от пола больных потребовалось выявить возможную связь между полом больных и исходом заболевания. Были взяты две группы больных туберкулезом органов дыхания - мужчины и женщины. В первой группе (мужчины) из 221 заболевшего 68 умерли в течение первого года после заболевания. Во второй группе (женщины) из 194 заболевших 83 умерли. Полученные данные представлены в таблице.

Таблица. Распределение больных туберкулезом по полу и исходу заболевания (абсолютные числа)

Задание

На основание исходных данных, представленных в таблицах:

1) оценить степень зависимости показателя смертности в группах мужчин и женщин с помощью коэффициента корреляции;

2) оценить корреляционную зависимость между признаками «пол» и «исход» с использованием непараметрических методов

(коэффициента ассоциации Юла) и коэффициента контингенции Пирсона. Решение

1. Расчет выборочного коэффициента корреляции

Для удобства вычислений поместим значения в таблицу и представим результаты вычислений.

Таблица. Расчетная таблица к задаче 1

Все значения из таблицы переносим в формулу расчета выборочного коэффициента корреляции:

2. Оценка корреляционной зависимости непараметрическими методами

2.1. Расчет коэффициента ассоциации Юла - Ka:

2.2. Расчет коэффициента контингенции Пирсона - KK:

Вывод

1. Оценка значения коэффициента корреляции по шкале Чеддока 0,927 свидетельствует о прямой и достаточно высокой зависимости коэффициента смертности в группах мужчин и женщин.

2. Хотя значения коэффициентов Ka и KK отличаются друг от друга, согласно шкале Чеддока качественная характеристика тесноты связи одна и та же: сила связи слабая. Логически эта характеристика вполне закономерна, так как в нашем примере градация «мужчина-женщина» не является определяющей для второго признака «живы-умерли», а лишь оказывает некоторое влияние; величину этого влияния и описывают коэффициенты ассоциации и контингенции.

1.8.5. Тестовые задания

Выберите только один правильный ответ.

1. Дайте определение стохастической зависимости:

1) изменение одной случайной величины приводит к изменению закона распределения другой;

2) изменение двух случайных величин приведет к изменению одной из них;

3) изменение одной случайной величины не всегда приводит к изменению другой величины;

4) изменение одной из случайных величин приводит к изменению среднего другой случайной величины.

5) изменение двух случайных величин приведет к изменению третьей величины.

2. Если изменение одной из случайных величин приводит к изменению среднего другой случайной величины, то стохастическую зависимость называют:

1) случайной;

2) линейной;

3) достоверной;

4) корреляционной;

5) функциональной.

3. Назовите непараметрические методы оценки корреляционной зависимости:

1) критерий Колмогорова-Смирнова; коэффициент контингенции Пирсона;

2) коэффициент регрессии; критерий соответствия;

3) коэффициент ассоциации Юла; коэффициент контингенции Пирсона;

4) коэффициент ассоциации Юла; критерий соответствия;

5) коэффициент контингенции Пирсона; критерий Вилкоксона.

4. Укажите значения, которые может принимать коэффициент ассоциации:

1) от 0 до +1;

2) от -2 до +2;

3) от -1 до 0;

4) от -1 до +1;

5) от -1,5 до +1,5.

5. Какое значение имеет шкала Чеддока?

1) позволяет дать качественную оценку силы связи согласно коэффициентам ассоциации Юла и контингенции Пирсона, а также коэффициента корреляции пирсона;

2) позволяет выявить зависимость между двумя случайными величинами;

3) устанавливает средние значения коэффициентов ассоциации Юла и контингенции Пирсона;

4) устанавливает границы показателей стохастической зависимости;

5) позволяет прогнозировать силу связи коэффициентов ассоциации Юла и контингенции Пирсона.

1.8.6. Задачи для самостоятельного решения

Задача 1

Исходные данные

1. При изучении общественного здоровья населения субъектов РФ возникла необходимость провести анализ зависимости показателей общей смертности и общей заболеваемости. Исходные статистические данные представлены в таблице.

Таблица. Общая заболеваемость и смертность населения РФ в 2009 г. (на 1000 населения)

2. Для оценки эффективности проведенной вакцинации была изучена заболеваемость среди привитых мальчиков и девочек. Были взяты две группы вакцинированных. В 1-й группе (мальчики) из 81 вакцинированного заболели 5. Во 2-й группе (девочки) из 96 вакцинированных заболели 3. Полученные данные приведены в таблице.

Таблица. Распределение вакцинированных по полу и эффективности прививки (абсолютные числа)

Задание

На основании исходных данных, представленных в таблицах:

1) оценить степень зависимости показателей общей смертности и общей заболеваемости с помощью коэффициента корреляции;

2) оценить эффективность прививок среди мальчиков и девочек с использованием непараметрических методов (коэффициентов ассоциации Юла и контингенции Пирсона).

Задача 2

Исходные данные

1. Для изучения факторов, оказывающих влияние на рождаемость в субъектах РФ, была изучена зависимость между числом браков и количеством родившихся. Статистические данные представлены в таблице.

Таблица. Число браков и количество родившихся за 2009 г. в субъектах РФ

2. Для углубленного изучения влияния стажа работы на возможность возникновения профессионального заболевания работающие были разделены на 2 группы: 1-я - со стажем работы до 10 лет, 2-я - свыше 10 лет. В 1-й группе из 125 работающих профессиональные заболевания выявлены у 5, во 2-й - из 132 работающих - у 8. Полученные данные приведены в таблице.

Таблица. Распределение работающих по стажу и наличию профессионального заболевания (абсолютные числа)

Задание

На основании исходных данных, представленных в таблицах:

1) оценить степень зависимости между количеством родившихся и числом браков с помощью коэффициента корреляции;

2) оценить корреляционную зависимость между стажем работы и наличием профессионального заболевания с использованием непараметрических методов (коэффициента ассоциации Юла и коэффициента контингенции Пирсона).

Задача 3

Исходные данные

1. Для изучения факторов, оказывающих влияние на смертность в субъектах РФ, была изучена зависимость между числом больных злокачественными новообразованиями и числом умерших. Статистические данные представлены в таблице.

Таблица. Число больных злокачественными новообразованиями и число умерших в 2009 г. в субъектах РФ

2. Для углубленного изучения летальности больные, доставленные в стационар для оказания экстренной медицинской помощи, были разделены на 2 группы: в 1-ю включены больные, доставленные в стационар до 24 ч после обострения, во 2-ю - позже 24 ч. В 1-й группе из 72 больных умерли 8, во 2-й - из 54 больных умерли 15. Полученные данные приведены в таблице.

Таблица. Распределение больных, доставленных для оказания экстренной помощи (абсолютные числа)

Задание

На основании исходных данных, представленных в таблицах:

1) оценить степень зависимости числа пенсионеров и числа умерших с помощью коэффициента корреляции;

2) оценить корреляционную зависимость между сроком доставки больных для оказания экстренной помощи и числом умерших с использованием непараметрических методов (коэффициента ассоциации Юла и коэффициента контингенции Пирсона).

1.8.7. Рекомендуемая литература

1. Медик В.А., Юрьев В.К. Общественное здоровье и здравоохранение: учебник. - 2-е изд., перераб. и доп. - М.: ГЭОТАР-Медиа,

2012.

2. Медик В.А., Токмачев М.С. Статистика здоровья населения и здравоохранения: учеб. пособие. - М.: Финансы и статистика, 2009. -

368 с.

3. Медик В.А., Токмачев М.С. Математическая статистика в медицине: учеб. пособие. - М.: Финансы и статистика, 2007. - 800 с.

4. Ефимова М.Р., Бычкова С.Г. Практикум по социальной статистике: учеб. пособие / под ред. М.Р. Ефимовой. - М:. Финансы и статистика,

2005. - 448 с.

Общественное здоровье и здравоохранение : руководство к практическим занятиям: учеб. пособие / В. А. Медик, В. И. Лисицин, М. С. Токмачев. - 2012. - 400 с.: ил.

LUXDETERMINATION 2010-2013