Факультет математики и компьютерных наук. Рабочая программа дисциплины. пакетами для обработки и анализа. экспериментальных данных. 4. Объем, структура и содержание дисциплины.


Чтобы посмотреть этот PDF файл с форматированием и разметкой, скачайте его и откройте на своем компьютере.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение высшего
образования
«ДАГЕСТАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
Факультет математики и компьютерных наук
РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ
СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ДАННЫХ
Кафедра
прикладной математики
факультета
математики и
компьютерных наук
Образовательная программа
01.04.02
Прикладная математика и информатика
Профиль подготовки
Математическое моделирование
и вычислительная мате
матика
Уровень высшего образования
магистратура
Форма обучения
Очная
Статус дисциплины:
Вариативная
Махачкала,
201
1











2
Аннотация рабочей программы дисциплины
Дисциплина
Статистические методы обработки данных
входит в
вариативную
часть
Б1.В.ОД10
образовательной программы подготовки
магистров
по направлению
01.04.02
Прикладная математика и информатика
Дисциплина реализуется на факультете
М и КН
кафедрой
Данный курс лекций ориентирован на изучение простых, но наиболее
част
о используемых методов статистической обработки данных.
Курс лекций носит сугубо прикладной характер. Особое внимание при
разборе материала уделяется анализу ошибок, которые обычно делают
начинающие исследователи при применении того или
иного метода
статистической обработки данных
измерений.
Курс лекций преподается с использованием компьютерной сети.
Лекционный материал содержит множество конкретных примеров, которые
разбираются в интерактивном режиме.
При изучении курса “
Статистические
методы об
работки данных
студенты должны иметь теоретическую подготовку по информатике и
основным разделам математического анализа, дифференциального и
интегрального исчисления. Студенты также должны обладать начальными
практическими навыками работы на ко
мпьютере.
Дисциплина нацелена на формирование следующих компетенций
выпускника:
общекультурных
, профессиональных
1, ПК
Преподавание дисциплины предусматривает проведение следующих
видов учебных занятий:
лекции,
лабораторные занятия и
самостоятельная
работа.
Рабочая программа дисциплины предусматривает проведение
следующих видов контроля успеваемости в форме
коллоквиума
промежуточный контроль в форме
экзамена
Объем дисциплины
зачетн
единиц
, в том числе в академических
часах по
видам учебных занятий
Семес

Учебные занятия
Форма
промежуточной
аттестации (зачет,
дифференцирован
ный зачет,
экзамен
в том числе
Контактная работа обучающихся с преподавателем
СРС,
в том
числе
экзам
k_]
из них
Лекц
ии
Лабораторн
ые занят
ия
Практиче
ские
занятия
dhgkmevlZ
pbb
экзамен
1. Цели освоения дисциплины
Цель изучения курса
«Статистические методы обработки данных»
является введение студентов в проблематику прикладной математики и
информатики
расширение и уг
лубление знаний студентов по вопросам
статистической обработки данных,
закрепление студентами ряд понятий
изученных в курсах
позволяющего выпускнику успешно работать в
избранной сфере деятельности, обладать универсальными и предметно
специализированными к
омпетенциями, способствующими его социальной
мобильности, востребованности на рынке труда и успешной
профессиональной карьере.
2.Место дисциплины в структуре ООП
магистратуры
Дисциплина
«Статистические методы обработки данных»
входит в
вариативную
часть
образовательной программы подготовки
магистров
по
направлению
Прикладная математика и информатика
Курс
«Статистические методы обработки данных»
вводится после
изучения дисциплин алгебра, информатика, математический анализ,
теория
вероятностей
и математическая статистика,
дифференциальные уравнения,
так как для успешного усвоения этого курса студентам необходимы знания
по указанным дисциплинам.
Данный курс лекций ориентирован на изучение простых, но наиболее
часто используемых методов статистиче
ской обработки данных.
Курс лекций носит сугубо прикладной характер. Особое внимание при
разборе материала уделяется анализу ошибок, которые обычно делают
начинающие исследователи при применении того или иного метода
статистической обр
аботки данных биометрических
измерений.
Лекционный материал содержи
т множество конкретных примеров
При изучении курса “Статистические методы обработки данных”
студенты должны иметь теоретическую подготовку по информатике и
основным разделам математическог
о анализа, дифференциального и
интегрального исчисления. Студенты также должны обладать начальными
практическими навыками работы на компьютере.
3. Компетенции обучающегося, формируемые в результате
освоения дисциплины (перечень пл
анируемых результатов о
бучения)
ОК
Способность к
абстрактному мышлению,
анализу, синтезу.
Знать:
основные формулы
основы математической статистики,
сбора, обработки и анализа
статистических данных.
Уметь:
на основе применения
аппарата математической статистики
принимать ну
жные решения. Строить
модели различных прикладных задач и
перекладывать их на ЭВМ.
Владеть:
навыками дискуссии
по профессиональной тематике
Способность
проводить научные
исследования и получать
новые прикладные
результаты самостоятельно и
в составе
научного
коллектива.
Знать
современные
тенденции ра
звития научных и
прикладных до
стижений и их
использование в прикладном
исследовании;
подходы
использования современных методов
для решения научных и практических
задач.
Уметь
самостоятельно
разбирать
ся в современных методах и
способах представления данных
Владеть:
навыками поиска
информации
метода
сбора
информации
навыками применения
набора стандартных методов
статистической обработки данных
Kihkh[ghklv�
jZajZ[Zlu\Zlv�
b�
hilbfbabjh\Zlv�[b
ag_k
планы научно
прикладных
проектов.
Знать
основные методы
обработки статданных. Особое
внимание при разборе материала
уделяется анализу ошибок, которые
обычно делают начинающие
исследователи при применении того
или иного метода статистической
обработк
Уметь:
строить математические
модели различных прикладных задач;
программировать их для ЭВМ,
проводить численное моделирование и
по результатам этого находить новые
закономерности и, если нужно, менять
прежние модели.
Владеть:
статистическими
пакетами
для обработки и анализа
экспериментальных данных
4. Объем, структура и содержание дисциплины.
4.1. Объем дисциплины составляет
зачетн
единиц
108
академических
часов.
4.2. Структура дисциплины.
Раздел
дисциплины
Семестр
Неделя семестра
Виды уче
бной работы,
включая самостоятельную
работу студентов и
трудоемкость (в часах)
Формы текущего
контроля
успеваемости
(по
неделям семестра)
Форма
промежуточной
аттестации
(по семестрам)
Лекции
Лабор.
Сам.
раб
Ih^]��d�
wda�
H[s��lj
Обработка
данных в рамках линейной регрессионной
модели
Массивы данных в
прикладных
задачах.
Статистический и
детерминированны
й подходы.
Постановка задачи
обработки данных.
Формы текущего
троля:
устные опросы,
реферат,
выполнение
лабораторно
й работы
Понятие
функции
распределения
случайной
величины и ее
числовых
характеристик
Точечные и
интервальные
оценки массива
данных
J_]j_kkbb��
Ziijhdkbfbjmxsb
_�nmgdpbb
Blh]h�ih���fh^mex
Модуль 2
NZdlhjguc�b�
deZkl_jguc�
ZgZeba
uy\e_gb_�
\ebyxsbo�
nZdlhjh\��
We_f_glu�
fgh]hnZdlhjgh]h�
ZgZebaZ�
Формы текущего
троля:
устные опросы,
реферат, доклады
Кластерный
анализ.
Методы
иерархической
классификации.
6
Многомерное
шкалирование
Итого по 2 модулю
Модуль 3
Подготовка к экзамену
Подготовка к
экзамену
экзамен
Итого по
модулю
ИТОГО:
экзамен
4.3. Содержание дисципл
ины, структурированное по темам
(разделам
Лекции

Модуль 1
Обработка данных в рамках линейной регрессионной модели
Тема
1.Массивы данных в
прикладных задачах
. Статистический и
детерминированный подходы. Постановка задачи обработки данных.


Массивы данных как основной метод получения количественно информации о
технических объектах с изменяемыми характеристиками. Философские
обоснования статистической и детерминированной природы физических
объектов. Задачи обработки массивов данных в зависимос
ти от их природы
(одномерные массивы, массивы функций двух и более переменных,
интегральные зависимости связи между влияющими факторами, выявление
различия/согласия различных массивов. Примеры массивов данных в задачах
техногенной безопасности (загрязняющи
е вещества, воздействия ЭМП на
население, многомерные задачи расчетов рисков и т.п.).
Тема
2. Понятие ФР случайной величины и ее числовых характеристик
Точечные и интервальные оценки массива данных

Функции распределения случайной величины (СВ) как осно
вная форма ее
представления. Математическое ожидание и дисперсия распределения СВ.
Основные законы распределения: нормальный ЗР, бинормальный ЗР,
равномерной плотности, распределение Пуассона и редких событий.
Применение пакетов
прикладных
программ.
Исполь
зуемые инструменты Mathcad. Машинные формы массивов
данных (выборок). Способы вычисления оценок математического ожидания и
дисперсии. Понятия доверительной вероятности и доверительного интервала.
7
Способы вычислений доверительных интервалов для оценок матем
атического
ожидания и дисперсии (стандарта отклонения). Применения инструментов
пакетов
Office
Mathcad
Тема
3. Регрессии, аппроксимирующие функции, МНК

Линейная регрессия для массива двух переменных. Нелинейная регрессия.
Метод наименьших квадратов
и его машинная реализация. Выбор
аппроксимирующих функций. Применения инструментов пакетов Mathcad,
Statistics.
Модуль 2.
Факторный и
кластерный
анализ
Тема 4
Выявление влияющих факторов. Элементы многофакторного анализа.

Однофакторный дисперсионный ан
ализ. Двухфакторный дисперсионный
анализ. Применения инструментов пакетов
Office
Mathcad.
Понятие о критериях согласия. Проверка гипотезы о принадлежности
двух выборок одной генеральной совокупности. Проверка гипотезы о функции
распределения выборки. П
роверка гипотезы о равенстве математических
ожиданий двух выборок при равных неизвестных дисперсиях. Применения
инструментов пакетов Mathcad
Тема 5. Кластерный анализ.
Методы иерархической классификации.
Общие
принципы
кластерного
анализа.
Виды
кластерн
анализа:
двухэтапный
кластерный
анализ,
иерархический
кластерный
анализ,
кластерный
анализ
методом
средних.
Иерархический
кластерный
анализ.
Задание
метода
иерархического
кластерного
анализа
(Метод
кластеризации,
мера,
преобразование
значений,
преобр
азование
меры).
Статистики
процедуры
Иерархический
кластерный
анализ
(порядок
агломерации,
матрица
близостей,
принадлежность
кластерам).
Графики
процедуры
Иерархический
кластерный
анализ
(дендограмма,
сосульчатый
график).
Сохранение
новых
перемен
ных
процедуре.
Кластеры
факторах.
Интерпретация
результатов
кластерного
анализа.
Тема 6.
Многомерное шкалирование.
Суть
логика
многомерного
шкалирования.
Взаимосвязь
факторного
анализа
многомерного
шкалирования.
Возможности
визуализации
представления
данных.
Задание
размерности
осей
координат.
Интерпретация
результатов
многомерного
шкалирования.
8
Обработка данных в рамках линейной р
егрессионной модели
СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ОПЫТНЫХ
ДАННЫХ. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ВБОРКИ
Научиться основным методам обработки данных,
представленных выборкой. Изучить графические представления данных.
Овладеть навыка
ми расчета с помощью ЭВМ основных числовых
характеристик выборки.
Основным объектом исследования в эконометрике является выборка.
Выборкой объема
называются числа х
….х
получаемые на практике при
кратком повторении эксперимента в неизменных услов
иях. На практике
выборку чаще всего представляют статистическим рядом. Для этого вся
числовая ось, на которой лежат значения выборки, разбивается на
интервалов ( это число выбирается произвольно от 5 до 10), которые обычно
равны, вычисляются середины инт
ервалов z
и считается число элементов
выборки, попадающих в каждый интервал n
. статистическим рядом
называется последовательность пар (z
). Рассмотрим решение задачи на
ЭВМ и ППП
CEL на следующей примере.
ПРИМЕР
. Дана выборка чисел выручки магазина
за 30 дней:
Построим статистический ряд, полигон, гистограмму и кумулятивную
кривую.
Откроем книгу программы
CEL. Введем в первый столбец (ячейки
А30) исход
ные данные. Определим область чисел, на какой лежат
данные. Для этого найдем максимальный и минимальный элементы
выборки. Введем в В1 «Максимум», а в В2 «Минимум», а в соседних
ячейках С1 и С2 определим функции «МАХ» и «МIN», в качестве
аргументов которых
(в графе «число») обведем область данных (ячейки А1
А30). Результатом будут 64 и 81. видно, что все данные укладываются на
отрезке [64;81]. Разделим его на 9 (выбирается произвольно от 5 до 10)
интервалов:
66; 66
68: 68
70: 70
72: 72
74, 74
76, 76
78, 7
80, 80
82. в ячейке
10 вводим верхние границы интегралов группировки
числа 66, 68, 70,
72, 74, 76, 78, 80, 82. Для вычисления частот n
используют функцию
ЧАСТОТА, находящуюся в категории «Статистические». Введем ее в ячейку
Е1. в строке «Массив да
нных» введем диапазон выборки (ячейки А1
А30). В
строке «Двоичный массив» введем диапазон верхних границ интервалов
группировки (ячейки
9). Результат функции является массивом и
выводится в ячейках Е1
Е9. для полного выбора (не только первого числа в
1) нужно выделить ячейки Е1
Е9, обведя их мышью, и нажать
2, а далее
одновременно CTRL+SHIFT+ENTER. Результат
частоты интервалов
2,2,5,7,3,7,3,0,1.
Для построения гистограммы нужно выбрать
ВСТАВКА/ДИАГРАММА или нажать на соответствующий значок на
основн
ой панели (при этом курсор должен стоять в свободной ячейке) далее
выбрать тип: ГИСТОГРАММА, вид по выборке, нажать «ДАЛЕЕ», в строке
«ПОДПИСИ ОСИ Х» ввести интервалы ячейках
5, нажать «ДАЛЕЕ»
ввести название «ГИСТОГРАММА», подписи осей «ИНТЕВАЛЫ» и
АСТОТА», нажать «ГОТОВО». Для создания полигона сделать то же
самое, только вместо типа диаграммы «ГИСТОГРАММА», выбрать
«ГРАФИК». Для построения кумулятивной кривой нужно посчитать
накопленные частоты. Для этого в ячейку
1 вводим «=Е1», в
вводим
1+Е2» и автозаполнением перетаскиваем эту ячейку до
9. далее строим
график как и в случае полигона, но в строке «ДИАПАЗОН» вводим
накопленные частоты, ссылаясь на
9, а на вкладке «РЯД», в
строке «ПОДПИСИ ОСИ Х» вводим интервалы в ячейках
Нах
одим основные числовые характеристики выборки. Для их ввода
выделяем два столбца, например
, в первом вводим название
характеристики, во втором
функцию, в которой в качестве массива данных
(строка»ЧИСЛО1»), указать ссылку на А1
Существ
ует другой способ вычисления числовых характеристик
выборки. Для этого ставим курсор в свободную ячейку (например
11).
Затем вызываем в меню «Сервис» подменю «Анализ данных». Если в меню
«Сервис» отсутствует этот пункт, то в меню «Сервис» нужно выбрать пу
нкт
«Надстройки» м в нем поставить флажок напротив пункта «Пакет анализа».
В окне «Анализ данных» нужно выбрать пункт «Описательная статистика».
В появившемся окне в поле «Входной интервал» делаем ссылку на выборку
А23. Оставляем группирование «По столб
цам» в разделе «Параметры
вывода» ставим флажок на «Выходной интервал» и в соседнем поле создаем
ссылку на верхнюю левую ячейку области вывода (например
11), ставим
флажок напротив «Описательная статистика», нажимаем «ОК». результат
основные характерист
ики выборки (сделайте шире столбцов
, переместив
его границу в заголовок).
Гистограмма
Интервалы
Частота
Ряд1

Полигон
1
2
4
5
7
8
68
70
72
74
76
78
80
82
Интервалы
Частота
Ряд1
Кумулята
5
10
25
30
35
68
70
72
74
76
78
80
82
Интервалы
Накопленая частота
Ряд1
11
Лабораторная работа № 2
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
: Ознакомиться с методом проверки основных статистических
гипотез, используемых в экономике, с помощью ЭВМ.
1. ПРОВЕРКА ГИПОТЕЗЫ О СООТВЕТСТВИИ (КРИТЕРИЙ
СОГЛАСИЯ)
Используется для проверки предположения о том, что полученные в
результате наблюдений данные соответствуют нормам. Рассматривается
гипотеза о том, что отклонения от норм невелики, и ими можно пренебр
ечь.
При этом задается доверительная вероятность
которая имеет смысл
вероятности не ошибиться при принятии гипотезы. Рассмотрим проверку на
примере.
ПРИМЕР
: 1. при производстве микросхем процессоров используются
кристаллы кварца. Стандартом предусмотрен
о, чтобы 50% образцов не было
обнаружено ни одного дефекта кристаллической структуры, у 15%
один
дефект, у 13%
2 дефекта, у 12%
3 дефекта, у 10% более 3 дефектов. При
анализе выборочной партии оказалось, что из 100 экземпляров
распределение по дефект
ам партии оказалось, что из 1000 экземпляров
распределение по дефектам следующего (вариант соответствует ЭВМ):
Можно ли с вероятностью 0,99 считать, что партия соответствует стандарту?
Введем в А1 заголовок «НОРМА» и ниже в А2
А6 показатели
числа
500, 15
0, 130, 120, 100. в ячейку В1 введем заголовок «НАБЛЮДЕНИЯ» и
ниже в В2
В6 наблюдаемые показатели 516, 148, 131, 110, 95. в третьем
столбце вводятся формулы для критерия: С1 заголовок «КРИТЕРИЙ», в С2
формулу «=(А2
В2)*(А2
В2)/А2». Автозаполнением размножи
м эту формулу
на С3
С6. в ячейку С7 запишем общее значение критерия
сумму столбца
С6. для этого поставим курсор в С6 и вызвав функцию в категории
«Математический» найдем СУММ и в аргументе «Число 1» укажем ссылку
на С2
С6. получиться результат критери
я
= 1,629692308. Для ответа на
вопрос, соответствуют ли опытные показатели нормам,
сравнивают с
критическим значением
Zkp
. Вводим в
1 текст “критическое значение» в
Е1 вводим функцию ХИ2ОБР (категория «Статистические») у которой два
аргумента: «Вероятн
ость»
вводим уровень значимости α =1
и «Степени
свободы»
вводят число n
1, где n
число норм). Результат 13,27670414.
видно, что критическое значение больше критерия, следовательно опытные
данные соответствуют стандартным и партия с заданной вероятн
остью
можно отнести как соответствующую стандарту.
2. ПРОВЕРКА ГИПОТ
ЕЗЫ О РАВЕНСТВЕ ДИСПЕРСИЙ
Используется в случае, если нужно проверить различается ли разброс
данных (дисперсии) у двух выборов. Это может использоваться при
сравнении точностей обработки деталей на двух станках, равномерности
продаж товара в течении некот
орого периода в двух городах и т.д. Для
проверки статистической гипотезы, о равенстве дисперсий служит F
критерий Фишера. Основной характеристикой критерия является уровень
значимости α, которой имеет смысла вероятности ошибиться, предполагая,
что диспер
сии и, следовательно, точность, различаются. Вместо α в задачах
так же иногда задают доверительную вероятность
α, имеющую смысл
вероятности того, что дисперсии и в самом деле равны. Обычно выбирают
критическое значение уровня значимости, например 0,05
или 0,1, и если α
больше критического значения, то дисперсии считаются равными, в
противном случае, различны. При этом критерий может быть
односторонним, когда нужно проверить, что дисперсия конкретной
выделенной выборки больше, чем у другой, и двусторонн
им, когда просто
нужно показать, что дисперсии не равны. Существует два способа проверки
таких гипотез. Рассмотрим их на примерах.
ПРИМЕР 2.
четыре станка в цеху обрабатывают детали. Для проверки
точности обработки, взяли выборку размеров деталей у каждого
станка.
Необходимо сравнить с помощью
теста попарно точности обработки всех
станков (рассмотреть пары 1
2, 1
3, 1
4, 2
3, 2
4, 3
4) и сделать вывод, для
каких станков точности обработки (дисперсии) равны, для каких нет. Взять
уровень значимости α=0,02.
1 станок
㌵,2
㈳,4
㈹,3
㌳,3
㈶,7
2 станок
㈸,5
㌵,9
㌲,6
㌷,1
㈸,0
3 станок
㌰,1
㈹,0
㌶,6
㈴,8
㈷,8
4 станок
㌱,7
㌰,4
㈷,3
㌵,7
㌱,5
Уровень значим
ости α=0,02. вводим данные выборок (без подписей) в
4 строчки в ячейки А1
1 и А2
2 и т.д. соответственно. Для вычисления
ФТЕСТ (массив1; массив2). Вводим А5 подпись А5 «Уровень значимости», а
в В5 функцию, ФТЕСТ, аргументами которой должны быть ссылки на
ячейку А1
1 и А2
2 соответственно. Результат 0,873340161 говорит о том,
что вероятность ошибиться, приняв гипотезу о различии дисперсий, около
0,9, что больше критического значения, заданного в условии задачи 0,02.
следовательно, можно говорить что опыт
ные данные с большей
вероятностью подтверждают предположения о том, что дисперсии
одинаковы и точность обработки станков одинакова, такие же результаты
показало сравнение остальных пар. Следует отметить, что функции ФТЕСТ
выходит уровень значимости двустор
оннего критерия и если нужно
использовать односторонний, то результат необходимо уменьшить вдвое.
29,1
26,2
30,7
33,8
33,6
35,2
23,4
29,3
33,3
26,7
28,9
29,7
39,4
28,5
35,9
32,6
37,1
25,7
27,5
25,4
28,9
29,9
30,1
36,6
24,8
27,8
32,1
27,2
29,3
30,4
31,7
30,4
27,3
35,7
31,5
Уровень
значимости








0,873340161
0,688084317
0,190932274
0,575576041
0,144572063
0,357739717
3. ПРОВЕРКА ГИПОТЕЗЫ О РА
ВЕНСТВЕ СРЕДНИХ
Используется для проверки предложения о том, что среднее значения
двух показателей, представленных выборками, значимо различаются.
Существует три разновидности критерия: один
для связанных выборок, и
два для несвязных выборок (с одинаков
ыми и разными дисперсиями). Если
выборки не связны, то предварительно нужно проверить гипотезу о
равенстве дисперсий, чтобы определить, какой из критериев использовать.
Так же как и в случае сравнения дисперсий имеются 2 способа решения
задачи, которые рас
смотрим на примере.
ПРИМЕР 3.
имеются данные о количестве продаж товара в двух
городах. Проверить на уровне значимости 0,01 статистическую гипотезу о
том, что среднее число продаж товара в городах различно.

14
Используем пакет «Анализ данных». В зависимости от типа критерия
выбирается один из трех: «Парный двухвыборочный t
тест для средних»
для связных выборок, и «Двухвыборочных t
тест с одинаковыми
дисперсиями» или «Двухвы
борочных t
тест с разными дисперсиями»
для
несвязных выборок. Вызовите тест с одинаковыми дисперсиями, в
открывшемся окне в полях «Интервал переменной 1» и «Интервал
переменной 2» вводят ссылки на данные (А1
1 и А2
2, соответственно),
если имеются подп
иси данных, то ставят флажок у надписи «Метки» (у нас
их нет, поэтому флажок не ставится). Далее вводят уровень значимости в
поле «Альфа»
0,01. Поле «Гипотетическая средняя разность» оставляют
пустыми. В разделе «Параметры вывода» ставят метку около «Вых
одной
интервал» и поместив курсор в появившемся поле напротив надписи,
щелкают левой кнопкой в ячейке В7. вывод результата будет осуществляться
начиная с этой ячейки. Нажав на «ОК» появляется таблица результата.
Сдвиньте границу между столбцами В и С, С и
и Е увеличив ширину
столбцов В, С и
так, чтобы умещались все надписи. Процедура выводит
основные характеристики выборки,
статистику, критические значения этих
статистик и критические уровни значимости «Р(Т<=
) одностороннее» и
«Р(Т<=
) двухсторонн
ее». Если по модулю
статистика меньше
критического, то средние показатели с заданной вероятностью равны. В
нашем случае│
1,784242592│ < 2,492159469, следовательно, среднее число
продаж значимо не отличается. Следует отметить, что если взять уровень
значи
мости α=0,05, то результаты исследования будут совсем иными.
15
Модуль 2.
Факторный и
клас
терный
анализ
Лабораторная работа №3
ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
: Освоить методы построения линейного уравнения парной
регрессии с помощью ЭВМ, научиться получать и анализировать основные
характеристики регрессионного уравнения.
Рассмотрим методику п
остроения регрессионного уравнения на
примере.
ПРИМЕР.
Даны выборки факторов
. По этим выборкам найти
уравнение линейной регре
сии
ỹ = ах +
. Найти коэффициент парной
корреляции. Проверить на уровне значим
сти
= 0,05 регрессионную
модель на адек
ватность.
Для нахождения коэффициентов
уравнения регрессии служат
функции НАКЛОН и ОТРЕЗОК, категории «Статистические». Вводим в А5
подпись «а=» а в соседнюю ячейку В5 вводим функцию
НАКЛОН, ставим
курсор в поле «Изв_знач_у» задаем ссылку на ячейки В2
2, обводя их
мышью. Результат 0,14303. Найдем теперь коэффициент
. Вводим в А6
подпись «
=», а в В6 функцию ОТРЕЗОК с теми же параметрами, что и
функции НАКЛОН. Результат 5,976364. сле
довательно, уравнение линейной
регрессии есть у=0,14303х+5,976364.
Построим график уравнения регрессии. Для этого в третью строчку
таблицы введем значения функции в заданных точках Х (первая строка)
у(х
). Для получения этих значений используются функция
ТЕНДЕНЦИЯ
категории «Статистические». Вводим в А3 подпись «Y(X) и, поместив
курсор в В3, вызываем функцию ТЕНДЕНЦИЯ. В полях «Изв_знач_у» и
«Изв_знач_х» даем ссылку на В2
2 и В1
1. в поле «Нов_знач_х» вводим
также ссылку на В1
1. в поле «Константа» вво
дят 1, если уравнение
регрессии имеет вид
, и 0, если
у=ах
. В нашем случае вводим
единицу. Функция ТЕНДЕНЦИЯ является массивом, поэтому для вывода
всех ее значений выделяем область В3
3 и нажимаем
2 и
Ctrl
Shift
Enter
Результат
значения уравнени
я регрессии в заданных точках. Строим
график. Ставим курсор в любую свободную клетку, вызываем мастер
диаграмм, выбираем категорию «Точеная», вид графика
линия без точек (в
нижнем правом углу), нажимаем «Далее», в поле «Диагноз» вводим ссылку
на В3
3. п
ереходим на закладку «Ряд» и в поле «Значения Х» вводим
ссылку на В1
1, нажимаем «Готово». Результат
прямая линия регрессии.
Посмотрим, как различаются графики опытных данных и уравнения
регрессии. Для этого ставим курсор в любую свободную ячейку, вызыв
аем
мастер диаграмм, категория «График», вид графика
ломанная линия с
точками (вторая сверху левая), нажимаем «Далее», в поле «Диапазон»
вводим ссылку на вторую и третью строки В2
3. переходим на закладку
«Ряд» и в поле «Подписи оси Х» вводим ссылку на
1, нажимаем
«Готово». Результат
две линии (Синяя
(ряд 1)
исходные, красная
(ряд 2)
уравнение регрессии). Видно, что линии мало различаются между собой.
1
3
4
5
6
7
8
2
4
6
8
10
Ряд1
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
Ряд1
Ряд2
Для вычисления коэффициента корреляции
служит функция
ПИРСО
Н. Размещаем график так, чтобы они располагались выше 25 строки,
и в А25 делаем подпись «Корреляция», в В25 вызываем функцию ПИРСОН,
в полях которой «Массив 2» вводим ссылку на исходные данные В1
1 и
2. результат 0,993821. коэффициент детерминации
это квадрат
коэффициента корреляции
. В А26 делаем подпись «Детерминация», а в
В26
формулу «=В25*В25». Результат 0,265207.
Однако, в
Excel
существует одна функция, которая рассчитывает все
основные характеристики линейной регрессии. Это функция ЛИН
ЕЙН.
Ставим курсор в В28 и вызываем функцию ЛИНЕЙН, категории
«Статистические». В полях «Изв_знач_у» и «Изв_знач_х» даем ссылку на
2 и В1
1. поле «Константа» имеет тот же смысл, что и функции
ТЕНДЕНЦИЯ, у нас она равна 1. поле «Стат» должно содержать
1, если
нужно вывести полную статистику о регрессии. В нашем случае ставим туда
единицу. Функция возвращает массив размеров 2 столбца и 5 строк. После
ввода выделяем мышью ячейку В28
С32 и нажимаем
2 и
Ctrl
Shift
Enter
Результат
таблица значений, числа
в которой имеют следующий смысл:



Анализ результата: в первой строчке
коэффициенты уравнения
регрессии, сравните их с рассчитанными функциями НАКЛОН и ОТРЕЗОК.
Вторая строчка
ста
ндартные ошибки коэффициентов. Если одна из них по
модулю больше, чем сам коэффициент, то коэффициент считается нулевым.
Коэффициент детерминации характеризует качество связи между факторами.
Полученное значение 0,070335 говорит об очень хорошей связи факт
оров,
статистика проверяет гипотезу о адекватности регрессионной модели.
ное число нужно сравнить с критическим значением, для его получения
вводим в Е33 подпись «
критическое», а в
33 функцию
РАСПОБР,
аргументами которой вводим с
ответственно «0
,05» (уровень значимости),
«1» (число факторов Х) и «8» (степени своб
ды).
Видно, что
статистика меньше, чем
критическое, значит,
регрессионная модель не адекватна. В последней строке приведены
регрессионная сумма квадратов
b�hklZlhqgu_�kmffu�
квадратов
��Z`gh��qlh[u�j_]j_kkbhggZy�kmffZ�
� h[tykg_ggZy�j_]j_kkb_c�\f�[ueZ�gZfgh]h�[hevr_�hklZlhqghc�� g_�h[
ykg_ggZy�
j_]j_kkb_c��\ua\ZggZy�kemqZcgufb�nZdlhjZfb�\f���gZr_f�kemqZ_�wlh�mkeh\b_�
g_�\uihegy
_lky��qlh�]h\hjbl�h�iehohc�j_]j_kkbb�
Вывод:
В ходе работы я освоил методы построения линейного
уравнения парной регрессии с помощью ЭВМ, научился получать и
анализировать основные характеристики регрессионного уравнения.
Лабораторная работа № 4
НЕЛИНЕЙН
АЯ РЕГРЕССИЯ
Цель:
освоить методы построения основных видов нелинейных
уравнений парной регрессии с помощью с п
мощью ЭВМ (внутренне
линейные модели), научиться получать и анализировать показатели
качества регрессио
ных уравнений
Рассмотрим случай, когд
а нелинейные модели с помощью
преобразования данных можно свести к линейным (внутренне линейные
дели).
ПРИМЕР.
Построить уравнение регрессии
) для выборки
= 1,2,…,10). В качестве
) рассмотреть четыре типа функций
линейная,
степенная,
показател
ная и гиперболу:
у = Ах + В;
у = Ах
у = Ае
Вх
у = А/х + В.
Необходимо найти их коэффициенты
, и сравнив показатели
качества, выбрать функцию, которая наилучшим образом описывает
висимость.
Введем данные в таблицу вместе с подписями (ячейки
2).
Оставим свободными три строчки ниже таблицы для ввода преобразова
ных
данных, выделим первые пять строк, проведя по лев
ой серой границе по
числам от 1 до 5 и в
брать какой
либо цвет (светлый
желтый или розовый)
раскрасить фон ячеек. Далее, начиная с
6, выводим п
раметры линейной
регрессии. Для этого в ячейку
6 делаем подпись «Линейная» и в с
седнюю
ячейку
6 вводим фун
кцию ЛИНЕЙН. В полях «Изв_знач_
» даем ссылку
на
2 и
1, сл
дующие два поля принимают значения по единице.
Далее обводим область ниже в 5 стр
чек и левее в 2 строки и нажимаем
2 и
Ctrl
Shift
Enter
. Результат
лица с параметрами регрессии, из ко
торых
наибольший интерес представляет коэффиц
ент детерминации в первом
столбце третий сверху. В н
шем случае он равен
= 0,951262. Значение
критерия, позволяющего проверить адекватность модели
= 156,1439
(четвертая строка, первый столбец). Уравнен
ие регрессии равно
= 12,96
+6,18 (коэффициенты
приведены в ячейках
6 и
6).
Определим аналогичные характеристики для других регрессий и в
результате ср
нения коэффициентов детерминации найдем лучшую
регрессионную модель. Рассмотрим гиперболическую регрессию. Для ее
получения преобразуем данные. В третьей строке в ячейку
3 введем
подпись «1/
» а в ячейку
3 введем формулу «=1/
2». Растянем
автоз
полнени
ем данную ячейку на область
3. Получим характеристики
регрессионной м
дели. В ячейку А12 введем подпись «Гипербола», а в
соседнюю функцию ЛИНЕЙН. В полях «Изв_знач_
» и «Изв_знач_
2 даем
ссылку на
1 и преобразованные данные а
гумента
3,
сле
дующие два поля принимают значения по единице. Далее обводим
ласть ниже 5 строчек и левее в 2 строки и нажимаем
2 и
Ctrl
Shift
Enter
Получаем таблицу параметров регрессии. Коэффициент детерминации в
данном случае равен
= 0,475661, что намного хуже,
чем в случае
линейной регрессии.
статистика равна
= 7,257293. Уравнение ре
рессии
равно
6,25453
18,96772
Рассмотрим экспоненциальную регрессию
. Для ее линеаризации получаем
уравнение
, где
~
. Видно, что надо сделать преобразование
данных
заменить на
. Ставим курсор в ячейку А4 и делаем заголовок «
».
Ставим курсор в В4 и вв
одим формулу
(категория «Математические»). В качестве
аргумента делаем ссылку на В1. Автозаполнением распространяем формулу на четве
тую
строку на ячейки В4
4. Далее в ячейке
6 задаем подпись «Экспонента» и в соседней
вводим функцию ЛИНЕЙН, аргумен
тами кот
рой будут преобразованные данные В4
(в поле «Изв_знач_
»), а остальные поля такие же как и для случая линейной регрессии
2, 1, 1). Далее обводим ячейки
10 и нажимаем
2 и
Ctrl
Shift
Enter
. Результат
= 0,89079,
= 65,25304, что го
ворит об очень хорошей регрессии. Для нахождения
коэ
фициентов уравнения регрессии
ставим курсор в
6 и делаем заголовок
«а=», а в соседней К6 формулу «=ЕХР(Н6)», в
7 даем заголовок «
=», а в К7 формулу
6». Ура
нение регресси
и есть
= 0,511707·
6,197909
Рассмотрим степенную регрессию. Для ее линеаризации получаем
уравнение

, где
ln
=
ln
x
ã

=
b
,
~
. Видно, что надо
сделать преобразование да
ных
заменить на
ln
заменить на
ln
Строчка с
ln
у нас уже есть. Преобразуем переменные
. В ячейку А5 даем
дпись «
», а в В5 и вводим формулу
(категория «Математические»).
В качестве аргумента делаем ссылку на В2. Автозаполнением
пространяем формулу на пятую строку на ячейки
5. Далее в ячейке
12 задаем по
пись «Степенная» и в соседней
12 вводим ф
ункцию
ЛИНЕЙН, аргументами которой б
дут преобразованные данные
4 (в
поле «Изв_знач_
»), и
5 (в поле «Изв_знач_
»), остал
ные поля
единицы. Далее освободим ячейки
16 и нажимаем
2 и
Ctrl
Shift
Enter
. Результат
= 0,997716,
= 3494,117, ч
то говорит об
хорошей ре
рессии. Для нахождения коэффициентов уравнения регрессии
ставим курсор в
12 и делаем заголовок «а=», а в соседней К12
формулу «=ЕХР(Н12)», в
13 даем заголовок «
=», а в К13 фо
мулу «=
12».
Уравнение регрессии есть
= 4,90767
7,341268.
1,590799

a=
4,90767
Проверим, все ли уравнения адекватно описывают данные. Для этого
нужно сра
нить
статистики каждого критерия с критическим значением.
Для его получения вводим в А21 подпись «
критическое», а в В21 функцию
РАСПОБР, аргументами которой вв
дим соответственно «0,05» (уровень
значимости), «1» (число факторов Х в строке «
вень значимости 1») и «8»
(степень свободы 2 =
2). Результат 5,317655.
критическое больше
статистики значит модель адекватна. Также адекватны и остальные
регрессии. Для того, чтобы определить, какая модель наилучшим образом
описывает данные,
сравним индексы детерминации для каждой модели
. Наибольшим является
= 0,997716. Значит опытные данные
лучше оп
сывать
= 4,90767/
х+
7,341268.
Вывод:
В ходе работы я освоил методы построения основных видов
21
нелинейных уравнений парной рег
рессии с помощью с п
мощью ЭВМ
(внутренне линейные модели), научился получать и анализировать
показатели качества регрессио
ных уравнений.
1/x
ln y
97
ln x
29
Линей
ная
Экспон
ента
Гипер
бола
Степен
ная
критическое
Лабораторная работа № 5
ПОЛИНОМИНАЛЬНАЯ РЕГРЕСС
Цель:
По опытным данным построить уравнение регрессии вида у = ах
х + с.
ХОД РАБОТЫ:
Рассматривается зависимость урожайности некоторой культуры
от
количества внесенных в почву минеральных удобрений
. Предполагается, что
эта зависимость ква
тичная. Необходимо найти уравнение регрессии вида
ỹ =
Введем эти данные в электронную таблицу вместе с подписями в ячейки
2. Построим график. Для этого о
едем данные
(ячейки В2
2),
вызываем мастер диаграмм, выбираем тип диаграммы «График», вид
диаграммы
график с точками (второй сверху левый), нажимаем «Далее»,
переходим на закладку «Ряд» и в поле «Подписи оси Х» дел
ем ссылку на В2
2, нажимаем «Готово
». График можно приблизить полиномом 2 степени
у =
х + с
. Для нахождения коэффициентов
нужно решить систему
уравнений:
Рассчитаем суммы. Для этого в ячейку А3 вводим подпись «Х^2», а в В3
вводим формулу «= В1*В1» и Ав
тоз
полнением переносим ее на всю строку
3. В ячейку А4 вводим подпись «Х^3», а в В4 формулу «=В1*В3» и
Автозаполнением переносим ее на всю строку В4
4. В ячейку А5 вводим
«Х^4», а в В5 формулу «=В4*В1», автозаполняем строку. В ячейку А6 вводим
а в В8 формулу «=В2*В1», автозаполняем строку. В ячейку А7 вводим
«Х^2*
», а в В9 формулу «=В3*В2», автозаполняем строку. Теперь считаем
суммы. В
деляем другим цветом столбец
, щелкнув по заголовку и выбрав
цвет. В ячейку
1 п
мещаем курсор и щелкнув по
кнопке автосуммы со
значком ∑, вычисляем сумму первой строки. Автозаполн
нием переносим
формулу на ячейки
710.
Решаем теперь систему уравнений. Для этого вводим основную матрицу
системы. В ячейку А13 вводим подпись «А=», а в ячейки матрицы В13
вводи
м ссылки, отраже
ные в таблице
=L5
=L4
=L3
=L3
=L2
=L1
=L2
=L1
Вводим также правые части системы уравнений. В
13 вводим подпись
«В=», а в Н13
Н15 вводим, соответственно ссылки на ячейки «=
7», «=
6»,
2». Р
шаем систему матричн
ым методом. Из высшей математики известно,
что решение равно
. Находим обратную матрицу. Для этого в ячейку
вводим подпись «А обр.» и, п
ставив курсор в
13 задаем формулу МОБР
(категория «Математические»). В качестве а
гумента «Массив» даем ссылку
на
ячейки В13:
15. Результатом также должна быть ма
рица размером 4×4. Для ее
получения обводим ячейки
-
М15 мышью, выделяя их и нажимаем
2 и
Ctrl
Shift
Enter
. Р
зультат
матрица
. Найдем теперь произведение этой
матрицы на столбец В (ячейки Н13
5). Вводим в ячейку А18 подпись
«Коэффициенты» и в В18 задаем функцию МУМНОЖ (категория
«Математические»). Аргументами фун
ции «Массив 1» служит ссылка на
матрицу
(ячейки
М15), а в поле «Массив 2» д
ем ссылку на столбец В
(ячейки Н13
Н16). Далее вы
деляем В18
В20 и нажимаем
2 и
Ctrl
Shift
Enter
Получившийся массив
коэффициенты уравнения регрессии
. В
результате получаем ура
нение регрессии вида:
= 1,201082
5,619177
+
78,48095.
Построим графики исходных данных и полученных на основе
уравнения
регрессии. Для этого в ячейку А8 вводим подпись «Регрессия» и в В8 вводим
формулу «=$В$18*В3+$В$19*В1+$В$20». Автозаполн
нием переносим
формулу в ячейки В8
8. Для построения графика выделяем ячейки В8
8 и,
удерживая кл
вишу
Ctrl
, выделяем такж
е ячейки В2
М2. Вызываем мастера
диаграмм, выбираем тип диаграммы «График», вид диаграммы
график с
точками (второй сверху левый), нажим
ем «Далее», переходим на закладку
«Ряд» и в поле «Подписи оси Х» дел
ем ссылку на В2
М2, нажимаем «Готово».
Видно, что
кривые почти совпадают.
ВЫВОД: в процессе работы я по опытным данным научился строить
уравнение регрессии вида у = ах
х + с.
1
2
3
4
5
6
9
58,8
72,2
101,5
141
135,1
156,6
208,2
X^2
1
4
9
16
25
36
81
X^3
1
8
27
64
125
216
729
X^4
1
16
81
256
625
1296
6561
X*Y
58,8
144,4
304,5
564
675,5
939,6
1873,8
X^2*Y
58,8
288,8
913,5
2256
3377,5
5637,6
16864,2
Регрес
85,30121
94,52364
106,1482
120,175
136,603
155,435
226,3412
A Обр.
285
45

7565,3


0,03247
0,67857
45
9

1301,5


0,67857
1,619048
Коэффиц.

50
100
150
200
250
1
2
3
4
5
6
7
8
9
внесено удобрений
урожайность
5. Образовательные технологии
В ходе изучения дисциплины используются активные и инт
рактивные
формы проведения занятий: самостоятельный подбор материала по
поставленным пр
подавателем темам, работа с тематическими слайдами и
стовыми заданиями на компьютере и др. Предусматривается применение
современных обучающих технологий, электронных учебно
методических
комплексов и электронных учебников, а также компьютерная презентационная
техника. Для этого на факультете математики и ком
пьютерных наук имеются
специальные, оснащенные такой техникой классы лекционные аудитории. При
кафедре прикладной математики функционирует студенческая научно
исследовательская лаборатория «Математическое моделирование», оснащенное
5 новыми ПК, презента
ционной и другой оргтехникой.
При проведении занятий кроме указанных средств используются также
интернет ресурсы.
внесено удобрений
урожайность
6. Учебно
методическое обеспечение самостоятельной работы студентов.
В процессе самостояте
льной работы над каждой темой студентом дол
осуществляться следующие виды деятельности:
Проработка учебного материала по конспектам лекций, основной и
рекоме
дуемой учебной литературе.
• Работа над домашними заданиями
Работа над вопросами и задания
ми для самоподготовки,
представле
ными.
Написание рефератов.
Работа с тестами.
Поиск и обзор научных публикаций и электронных источников
инфо
мации.
Задания для самостоятельной работы, их содержание и форма контроля
приведены в форме таблицы.
Контр
оль
самостоятельной
работы
Сравнение
средних.
Рассчитать
средний
балл,
разных
населенных
пунктах
(переменная
Населенный
пункт
Обосновать
выбор
метода
проверки
различий
средних:
тесты
или
дисперсионный
анализ?
почему?
Проверить
наличие
статисти
чески
значимых
различий
среднего
уровня
дохода
разных
должностных
группах.
Интерпретировать
полученные
данные.
Проиллюстрируйте
результат
помощью
графика
«Столбики
ошибок».
Линейная
регрессия.
Вычислите
зависимость
продолжительности
жизни
женщин
раз

странах
(переменная
«Average
male
life
expectancy»)
калорийности
питания
(переменная
Daily
calorie
intake).
Проинтерпретируйте
полученные
данные.
Каков
объяснительный
потенциал
полученной
регрессионной
модели?
Запишите
уравнение
регрессии.
Проиллюст
рируйте
результат
помощью
графика
(на
графике
обязательно
должна
быть
линия
регрессии).
Кластерный
анализ.
Осуществить
кластеризацию
массива
основании
переменных
(метод
кластеризации
means,
количество
кластеров
3).
забудьте
вариант
«затрудня
юсь
ответить»
закодировать
как
пропущенное
значение!!!
Определить
наполненность
кластеров.
Проанализировать
различия
между
кластерами
основании
тех
переменных,
которые
были
использованы
для
кластеризации.
Придумать
кластерам
названия.
Задания
выполняютс
индивидуально
каждым
студентом.
Результаты
работы
должны
быть
оформлены
формате
Word.
Работа
должна
содержать
все
необходимые
для
аргументации
таблицы
показателями
подробное
объяснение
того,
что
дает
нам
тот
или
иной
показатель,
какие
выводы
позвол
яет
сделать
относительно
полученных
данных.
Примерные
вопросы
для
самостоятельного
изучения
(рефераты)
Классификация
методов
статистического
анализа
социологической
информации.
Подготовка
баз
данных
статистическому
анализу
Анализ
различий:
обоснование
выбора
метода
оценки
Реализация
теста
SPSS
Реализация
однофакторного
дисперсионного
анализа

Регрессионный
анализ,
общая
характеристика
метода
Реализация
линейной
регрессии
SPSS
Vortex
Факторный
анализ
общая
характеристика
метода.
Реализация
факторного
анализа
SPSS
Кластерный
анализ
общая
характеристика
метода.
Реализация
кластерного
анализа
SPSS
Vortex
Многомерное
шкали
рование
общая
характеристика
метода.
Реализация
многомерного
шкалирования
SPSS
Наименование
тем
Содержание
самостоятельной работы
Форма
контроля
Тема
Общие
понятие теории
массового
обслуживания.
Моделирование систем
массового
обслуживания
JZ[hlZ�k�mq_[ghc�
ebl_jZlmjhc��Ih^]hlh\dZ�
j_n_jZlZ�
«Динамическое
моделирование систем массового
обслуживания»
Опрос, оценка
выступлений, защита
реферата, проверка
конспекта
Тема 1.2.
Уравнения
Колмогорова.
Процессы
«рождения
гибели»
Одноканальная С
Работа с учебной
литературой. Подготовка
реферата.
«Открытая
одноканальная СМО»,
Опрос, оценка
выступлений, защита
реферата, проверка
заданий
Тема 1.3. Модели
систем массового
обслуживания.
Одноканальная СМО с
отказами
в
обслуживании
Работа с учеб
ной
литературой. Подготовка
реферата.
«Моделирование
систем массового обслуживания»
Опрос, оценка
выступлений, защита
реферата, проверка
проведенного
анализа
Тема 1.4.
Одноканальная СМО с
ограниченной длиной
очереди
Работа с учебной
литературой. Подготовк
реферата.
Одноканальная
открытая
СМО с ограниченной длиной очереди
Опрос, оценка
выступлений, защита
реферата. Проверка
заданий.

Тема 2.1
Многоканальная СМО с
отказами
в
обслуживании
Модель
многофазной системы
обслуживания
JZ[hlZ�k�mq_[ghc�
ebl_jZlmj
hc��Ih^]hlh\dZ�
j_n_jZlZ��
Модель многофазной
системы обслуживания
. Исследование
числовых характеристик»
Опрос, оценка
выступлений, защита
реферата. Проверка
заданий.
Тема 2.2.
Многоканальная СМО с
ограниченной длиной
очереди
Работа с учебной
литератур
ой. Подготовка
реферата.
«Многоканальная СМО без
ограничения длины очереди но с
ограничением времени ожидания
Hijhk��hp_gdZ�
\uklmie_gbc��aZsblZ�
j_n_jZlZ��Ijh\_jdZ�
dhgki_dlZ�
Тема 2.3
Многоканальная СМО с
неограниченной
очередью
Работа с учебной литератур
ой.
Подготовка реферата.
«Многоканальная система
массового обслуживания с
отказами и с неограниченной
очередью
Опрос, оценка
выступлений, защита
реферата. Проверка
заданий.
Тема 3.1
Алгоритм метода
имитационного
моделирования СМО
(пошаговый подход)
Бло
схема программы
Работа с учебной
литературой. Подготовка
реферата.
«Основные понятия
имитационного моделирования»
Опрос, оценка
выступлений, защита
реферата. Проверка
заданий.
Тема 3.2.
Расчет
показателей
эффективности СМО на
основе результатов ее
ими
тационного
моделирования
Работа с учебной
литературой. Подготовка
реферата. «Имитационное
моделирование»
Опрос, оценка
выступлений, защита
реферата. Проверка
конспекта.
Тема 3.3.
Статистическая
обработка результатов и
их сравнение с
результатами
аналитич
еского
моделирования.
JZ[hlZ�k�mq_[ghc�
ebl_jZlmjhc��Ih^]hlh\dZ�
j_n_jZlZ���©BfblZpbhggh_�
fh^_ebjh\Zgb_�
Статистическая
обработка результатов »
Опрос, оценка
выступлений, защита
реферата. Проверка
заданий.
Целью подготовки реферата является приобретение нав
ыков творческого
обобщения и анализа имеющейся литературы по рассматриваемым вопросам,
что обычно является первым этапом самостоятельной работы. По каждому
модулю предусмотрены написание и защита одного реферата. Всего по
дисциплине студент может представи
ть шесть рефератов. Тему реферата
студент выбирает самостоятельно из предложенной тематики. При написании
реферата надо составить краткий план, с указанием основных вопросов
избранной темы. Реферат должен включать введение, несколько вопросов,
посвященных
рассмотрению темы, заключение и список использованной
литературы. В вводной части реферата следует указать основания,
послужившие причиной выбора данной темы, отметить актуальность
рассматриваемых в реферате вопросов. В основном разделе излагаются
наиболее
существенные сведения по теме, производится их анализ, отмечаются
отдельные недостатки или нерешенные еще вопросы и т.д. В заключении
реферата на основании изучения литературных источников должны быть
сформулированы краткие выводы и предложения.
Список ли
тературы
оформляется в соответствии с требованиями ГОСТ 7.1
84
«Библиографическое
описание документа». Перечень литературы составляется в алфавитном
порядке
фамилий первых авторов, со сквозной нумерацией. Примерный объем
реферата 15
20 страниц.
Предусмотре
но проведение индивидуальной работы (консультаций) со
студентами в ходе изучения материала данной дисциплины.
7. Фонд оценочных средств для проведения текущего контроля
успеваемости, промежуточной аттестации по итогам освоения дисциплины.
7.1. Перечень к
омпетенций с указанием этапов их формирования в
процессе освоения образовательной программы.
Перечень компетенций с указанием этапов их формирования приведен в
описании образовательной программы.
Компетенция
Знания, умения, навыки
Процедура
освоения
Способность к
абстрактному
мышлению, анализу,
синтезу.
Знать:
основные формулы
исчисления вероятностей, предельные
теоремы ТВ, основы математической
статистики, сбора, обработки и анализа
статистических данных.
Уметь:
на основе применения
аппарата матема
тической статистики
принимать нужные решения. Строить
модели различных прикладных задач и
перекладывать их на ЭВМ.
Владеть:
навыками дискуссии
по профессиональной тематике
Устный опрос,
написание
рефератов.

Способность
проводить научные
исследовани
я и получать
новые прикладные
результаты
самостоятельно и в
составе научного
коллектива.
Знать
современные
тенденции развития научных и
прикладных до
стижений и их
использование в прикладном
исследовании;
подходы
использования современных методов
решения научных и практических
задач.
Уметь:
использовать
современные теории прикладной
математики для решения научно
исследовательских и прикладных
задач;
использовать знание
иностранного языка в профессиональ
ной деятельности, профессиональной
комм
уникации и межличностном
общении
использовать современные
методы для исследования и решения
научных и практических задач
применять методы прикладной
математики и информатики
Владеть:
навыками поиска
информации и методах сбора
информации
навыками пр
именения
набора стандартных методов
статистической обработки данных.
Mklguc�hijhk���
gZibkZgb_�
j_n_jZlh\
Способность
разрабатывать и
оптимизировать бизнес
планы научно
прикладных проектов.
Знать
основы методов
оптимизации и теории игр, методы
статист
ического моделирования
Уметь:
строить математические
модели различных прикладных задач;
программировать их для ЭВМ,
проводить численное моделирование и
по результатам этого находить новые
закономерности и, если нужно, менять
прежние модели.
Владеть:
стати
стическими
пакетами для обработки и анализа
экспериментальных данных
Mklguc�hijhk���
gZibkZgb_�
j_n_jZlh\
7.2. Описание показателей и критериев оценивания компетенций, описание
шкал оценивания.
Схема оценки уровня формирования компетенции «
Способно
сть к
абстрактному мышлению, анализу, синтезу
Уровень
Показатели (что
обучающийся
должен
продемонстриров
ать)
Hp_ghqgZy�rdZeZ
M^h\e_l\hjbl
_evgh
Хорошо
Отлично
Пороговый
Знать:
основные формулы
исчисления
вероятностей,
предельные
теоремы ТВ,
основы
атематической
статистики, сбора,
обработки и
анализа
статистических
данных.
Демонстрирует
слабые знания
по основным
дисциплинам
кафедры:
численные
методы, теория
вероятностей,
математическая
статистика,
методы
оптимизации
Показывает
хорошие
знания и
умени
я в
указанной для
получения
«удовлетв.»
оценки графе
(см. слева)
областях..
В дополнение к
знаниям
необходимых
для получения
оценки
«хорошо»,
умеет четко
ставить задачу,
сформулировать
и находить
наиболее
оптимальный
способ ее
решения.
Базовый
Уметь:
основе применения
аппарата
математической
статистики
принимать нужные
решения. Строить
модели различных
прикладных задач
и перекладывать
их на ЭВМ.
е умеет точно
сформулировать
задачу.
Показывает
хорошие
умения
указанной для
получения
«удовлетв.»
оцен
ки графе
(см. слева)
областях.
меет четко
ставить задачу,
сформулировать
и находить
наиболее
оптимальный
способ ее
решения. умеет
четко ставить
задачу, знаниям
Продвинутый
Владеть:
навыками
дискуссии по
профессиональной
тематике
Слабо
владеет
навыками
дискуссии по
профессиональн
ой тематике
Владеет
технологиями
сбора и
обработки
информации.
Хорошо владеет
современными
информационны
ми методами
сбора и анализа
данных, умеет
по ним
принимать
нужные
решения.
Схема оценки уровня формирования компетенци
и «
Способность проводить
научные исследования и получать новые прикладные результаты
самостоятельно и в составе научного коллектива
Уровень
Показатели (что
обучающийся
должен
продемонстрировать)
Hp_ghqgZy�rdZeZ
M^h\e_l\hjb
l_evgh
Хорошо
Отлично
Порого
Знать:
современные
тенденции развития
научных и прикладных
стижений и их
использование в
прикладном
исследовании;
подходы
использования
современных методов
для решения научных и
практических задач.
Демонстрирует
слабые знания
по основным
дисц
иплинам
кафедры:
численные
методы, теория
вероятностей
математическа
я статистика,
методы
оптимизации;
не умеет точно
сформулироват
ь задачу
IhdZau\Z_l�
ohjhrb_�
agZgby�\�
mdZaZgghc�^ey�
ihemq_gby�
�©m^h\e_l\��ª�
hp_gdb�]jZn_�
� kf��ke_\Z�\f�
h[eZklyo�
Хорошо
владеет
етодами
сбора и
анализа
данных
умеет по
ним
принимать
нужные
решения.
Базовый
Уметь:
использовать
современные теории
прикладной математики
для решения научно
исследовательских и
прикладных задач;
использовать знание
иностранного языка в
профессионал
ой
деятельности,
профессиональной
коммуникации и
межличностном
общении
использовать
современные методы для
исследования и ре
шения научных и
практических задач
применять методы
прикладной математики
и информатики
е умеет точно
сформулироват
ь задач
у; не
владеет в
полной мере
методами
сбора и
обработки
информации
методами
математическо
й статистики;
Показывает
хорошие
умения в
указанной для
получения
«удовлетв.»
оценки графе
(см. слева)
областях.
Умеет четко
ставить
задачу,
формулиров
ать и
находить
наиболее
оптимальны
й способ ее
решения.
Продвинутый
Владеть:
навыками
поиска информации и
методах сбора
информации
навыками
применения набора
Не
владеет в
полной мере
методами
сбора и
обработки
Однако
допускает
некоторые
неточности.
Владеет
Хорошо
владе
ет
современны
ми
информацио

стандартных методов
статистической
обработки данных.
нформации
методами
математическо
й статистики;
неуверенно
отвечает на
вопросы по
использованию
современных
ППП для
решения
поставленной
задачи.
bgl_jg_l�
l_ogheh]byfb�
k[hjZ�b�
h[jZ[hldb�
bgnhjfZpbb�
нными
методами
сбора и
анализа
данных,
умеет по
ним
принимать
нужные
решения.
Схема оценки уровня формирования компетенции
Способность разрабатывать
и оптимизировать бизнес
планы научно
прикладных проектов
Уровень
Пока
затели (что
обучающийся должен
продемонстрировать)
Оценочная шкала
Удовлетвори
тельно
Хорошо
Отлично
Пороговый
Знать
основы
методов оптимизации
и теории игр, методы
статистического
моделирования
Показывает
слабые знания
по методам
вычислений, по
мате
матическо
й статистике и
другим
прикладным
дисциплинам.
Показывает
хорошие
знания по
современным
пакетам
прикладных
программ
Matlab
MathCAD
другим.
\eZ^__l�
l_hj_lbq_kdbf
b�agZgbyfb�ih�
^bkpbiebgZf�
ki_pbZebaZpbb�
ih�
gZijZ\e_gbx�
ih^]hlh\db�
fZ]bkljZ�
Zah\uc
Уметь
строить
математические
модели различных
прикладных задач;
программировать их
для ЭВМ, проводить
численное
моделирование и по
результатам этого
находить новые
закономерности и,
если нужно, менять
прежние модели.
Плохо умеет
проводить
численно
моделирование
Может
использовать
их при
решении
прикладных
задач.
Кроме
указанных
умений,
необходимых
для получения
оценки
«хорошо»,
показывает
отличные
знания в
предметной
области,
хорошо
владеет
теоретическим

и знаниями по
дисциплинам
специализации
h^\bgmluc
Владеть:
пакетами
для обработки и
анализа
экспериментальных
данных
Имеет слабые
познания по
использованию
пакетов
прикладных
программ
Matlab
MathCAD
Statis
а и
текстовым
редакторам.
KeZ[h�\eZ^__l
kh\j_f_gguf
пакетам
прикладных
программ
Matl
MathCAD
другим.
Владеет
пакетами для
обработки и
анализа
экспериментал
ьных данных
Если хотя бы одна из компетенций не сформирована, то положительная оценки
по дисциплине быть не может.
7.3. Типовые контрольные задания
Вопросы к экзамену
Выбороч
ный метод в статистике.
Эмпирическая функция распределения
выборки
Выборочное среднее квадратическое отклонение. Выборочные начальные
и центральные моменты. Асимметрия. Эксцесс
Понятие о точечной оценк
числовой характеристике случайной
величины и свойства
точечной оценки.
Методы получения точечных
оценок
Доверительные интервалы для оценки числовых характеристик
Метод произведения для вычисления выборочной средней и дисперсии
Функциональная и корреляционная зависимости
Определение формы связи. Понятие ре
грессии
Выборочный коэффициент корреляции
Методика вычисления
выборочного коэффициента корреляции
Проверка статистических гипотез
Сравнение двух средних нормальных генеральных совокупностей,
дисперсии которых известны.
Массивы данных как основной метод
получения количественно
информации о технических объектах с изменяемыми характеристиками

Задачи обработки массивов данных в зависимости от их природы
(одномерные массивы, массивы функций двух и более переменных,
интегральные зависимости связи между влияющи
ми факторами,
выявление различия/согласия различных массивов).
Примеры массивов данных в задачах техногенной безопасности
(загрязняющие вещества, воздействия ЭМП на население, многомерные
задачи расчетов рисков и т.п.).
Функции распределения случайной вел
ичины как основная форма ее
представления.
Математическое ожидание и дисперсия распределения случайной
величины.
Используемые инструменты Mathcad. Машинные формы массивов
данных (выборок). Способы вычисления оценок математического
ожидания и дисперсии.
нейная регрессия для массива двух переменных.
Метод наименьших квадратов и его машинная реализация.
Однофакторный дисперсионный анализ.
Двухфакторный дисперсионный анализ.
7.4. Методические материалы, определяющие процедуру оценивания
знаний, умений, навы
ков и (или) опыта деятельности, характеризующих
этапы формирования компетенций
Общий результат выводится как интегральная оценка, складывающая из
текущего контроля
30 % и промежуточного контроля
Текущий контроль по дисциплине включает:
посеще
ние занятий
баллов,
участие на практических занятиях
баллов,
выполнение домашних (аудиторных) контрольных работ
баллов.
Промежуточный контроль по дисциплине включает:
устный опрос
баллов,
письм
енная контрольная работа
балло
8. Перечень основной и дополнительной учебной литературы, необходимой
для освоения дисциплины

Основная литература
А.А.Боровков Математическая статистика. Учебник. 4
е издание Санкт
Петербург, Лань, 2010, 704 с
2⸠
А.Н. Бородин Элементарный ку
рс теории вероятностей и математической
статистики: Учебное пособие. 7
е изд. Санкт
Петербург, Лань, 2010, 256с
В.Н. Калинина, В. Ф. Панкин. Математическая статистика. 2
е издание,
стереотипное, М: Высшая школа, 1998, 336 с.
4⸠
И. И. Елисеева, М.М. Ю
збашев. Общая теория статистики. М: Финансы и
статистика, 1995, 368 с.
Mathcad 2000 Pro. Руководство пользователя
Дополнительная литература
Харин Ю.С., Малюгин В.И., Кирлица В.П. и др. Основы имитационного и
статистического моделирования.
Минск
: Дизайн ПРО, 1997.
288 с.
Е.Н. Львовский Статистические методы построения эмпирических
формул. Учебное пособие для вузов. М: Высшая школа, 1988, 239 с.
3.
Дж. Бендат, А. Пирсол. Прикладной анализ случайных данных. М.:Мир,
1989, 540 с.
9. Переч
ень ресурсов информационно
телекоммуникационной сети
«Интернет»
, необходимых для ос
воения дисциплины
Федеральный портал российское образование
http://edu.ru
Электронные каталоги Научной библиотеки Даггосуниверситета
http
://
elib
dgu
/?
node
/256
Образовательные ресурсы сети Интернет
http://catalog.iot.ru/index.php
Электронная библиотека
http:
//elib.kuzstu.ru

://
poiskknig
электронная библиотека учебников Мех
Мата МГУ, М
сква
://
.mathn
et
общероссийский математический портал
://
.lib.m
exmat
электронная библиотека механико
математического
факул
тета Московского государственного университета
://
onlinelibrary
wiley
com
научные журналы издатель
ства
Wiley
Sons
://
sciencedirect
com
научные журналы издательства
Elsevier
10. Методические указания для обучающихся по освоению дисциплины.
Перечень учебно
методических изданий, рекомендуемых студ
ентам, для
подготовки к занятиям представлен в разделе «Учебно
методическое
обесп
чение. Литература».
Лекционный курс.
Лекция является основной формой обучения в вы
шем
учебном заведении. В ходе лекционного курса проводится систематич
ское
изложение научны
х материалов, освещение основных понятий дисц
плины и
закрепление теоретического материала.
В тетради для конспектирования лекций необходимо иметь поля, где по
ходу конспектирования студент делает необходимые пометки. Записи должны
быть избирательными, св
оими словами, полностью следует запис
вать только
определения. В конспектах рекомендуется применять сокращ
ния слов, что
ускоряет запись. В ходе изучения дисциплины
Статистические методы
обработки данных
особое значение имеют формулы, схемы и р
сунки,
поэ
тому в конспекте лекции рекомендуется делать все рисунки, сд
ланные
преподавателем на доске. Вопросы, возникшие у студента в ходе лекции,
рекомендуется записывать на полях и после окончания лекции обр
титься за
разъяснением к преподавателю.
Студенту необх
одимо активно работать с конспектом лекции: после
окончания лекции рекомендуется перечитать свои записи, внести поправки и
дополнения на полях, используя указанную литературу. Ко
спекты лекций
следует использовать при подготовке к экзамену, контрол
ным те
стам, при
выполнении самостоятельных заданий.
Лабораторные занятия.
Лабораторные работы по дисциплине
Статистические методы обработки данных
имеют целью реально научить
студентов решению практических задач, научить их навыкам выполнения
расчетных работ с
использованием современной вычислительной техники и
кетов прикладных программ, и главное научить их самих алгоритмизации,
программированию и решению задач на ЭВМ. Защита и сдача всех
лабор
торных работ является обязательным условием допуска студента к
экзамену. В случае пропуска занятий по уважительной причине пропущенное
лабор
торное занятие подлежит отработке.
Студент должен вести активную познавательную работу. Важно
научиться включать вновь получаемую информацию в систему уже име
щихся
знаний. Необ
ходимо также анализировать численные результаты, п
лученные в
ходе выполнения лабораторной работы, делать по ним опред
ленные выводы и
находить общие закономерности, даваемые теорией, сра
нивать с другими
численными результатами (напр. по аналитическим фо
мулам), с
экспериментом. Важное место в самостоятельном обучении ст
дентов должна
занимать работа в образовательной среде ИНТЕРНЕТа. Такие ресурсы указаны
в разделе «Программное обеспечение и интернет ресурсы» данного УМК.
Дисциплина «
Статистические мето
ды обработки данных
» содержит внутри
модул
я.
модуля изучаются в
семестре. Эти модули имеют
определенную логическую завершенность по отношению к установленным
целям и результатам обу
чения. Именно при изучении этих модулей
должны
развиваться компете
нции
общекультурны
1, профессиональны
1,
-
При изучении дисциплины рекомендуется рейтинговая технология
обучения, которая позволяет реализовать комплексную систему оценивания
учебных достижений студентов. Текущие оценки усредняются на про
тяжении
семестра при изучении модулей. Комплексность означает учет всех форм
учебной и творческой работы студента в течение семестра.
Рейтинг направлен на повышение ритмичности и эффективности
самостоятельной работы студентов. Он основывается на широком
пользовании тестов и заинтересованности каждого студента в получении
более высокой оценки знаний по дисциплине.
Принципы рейтинга: непрерывный контроль (в идеале на каждом из
аудиторных занятий) и получение более высокой оценки за работу,
выполненную в ср
ок. При проведении
лабораторных
занятий необходимо
предусматривать широкое использование активных и интерактивных форм
(компьютерных симуляций, деловых и ролевых игр).
Рейтинг включает в себя два вида контроля: текущий, промежуточный и
итоговый по дисципл
ине.
Текущий контроль (ТК)
основная часть рейтинговой системы,
основанная на беглом опросе раз две недели. Формы: тестовые оценки в ходе
лабораторных
занятий, оценки за выполнение индивидуальных заданий и
лабораторных работ. Важнейшей формой ТК, позволяю
щей опросить всех
студентов на одном занятии являются короткие тесты из 2
3 тестовых заданий.
Основная цель ТК: своевременная оценка успеваемости студентов,
побуждающая их работать равномерно, исключая малые загрузки или
перегрузки в течение семестра.
Лекц
ионные занятия желательно проводить в режиме презентаций с
демонстрацией применения основных методов анализа и синтеза. Это
существенно улучшает динамику лекций.
Целесообразно обеспечивать студентов на 1
2 лекции вперед раздаточным
материалом в электронно
м виде (сложные схемы, графики, аналитические
исследования и опорный конспект). Основное время лекции лучше тратить на
подробные аналитические комментарии и особенности применения
рассматриваемого материала в профессиональной деятельности студента.
Лабора
торный практикум
, который
использует компьютерное
моделирование, следует проводить в компьютерном классе либо
самостоятельно на домашнем компьютере. При этом и коллоквиум, и защита
результатов исследований проводятся по традиционной методике в классе.
Про
межуточный контроль (ПК)
это проверка знаний студентов по
разделу программы. Формы: тест из 7−10 заданий. Тестирование проводится в
компьютерных классах в часы самостоятельной работы студентов по заранее
составленному расписанию.
Цель ПК: побудить студе
нтов отчитаться за усвоение раздела дисциплины
накопительным образом, т.е. сначала за первый, затем за второй, затем за
третий разделы каждого семестра.
Итоговый контроль
по дисциплине (ИКД)
это проверка уровня учебных
достижений студентов по всей дис
циплине за семестр. Формы контроля:
экзамен
семестр
. Цель итогового контроля: проверка базовых знаний
по
дисциплине
, полученных при изучении
всех модулей семестра
ИКД в
семестре является выходным контролем по дисциплине, после
которого можно рассчиты
вать на то, что процесс обучения по дисциплине
завершен и в дальнейшем студент может сам при необходимости
совершенствовать свои знания.
Примеры оценочных средств (тестовых заданий) для текущего
промежуточного и выходного контроля успеваемости по дисцип
лине:
Первый уровень сложности тестовых заданий (ТЗ) соответствует
удовлетворительному владению предметом. Он представляет минимум базовых
знаний, необходимых для дальнейшего обучения в университете и включает в
себя знания
копии ключевых понятий и форму
л. Проверке этого уровня
посвящены простейшие тестовые задания с нормой трудности в 1 балл.
Второй уровень ТЗ соответствует хорошим знаниям и предполагает
глубокое понимание понятий и формул, умения их преобразовывать и
интерпретировать.
Проверке второго
уровня посвящены тестовые задания повышенной
трудности, с нормой трудности в
2 балла.
Третий уровень ТЗ соответствует отличным знаниям и предполагает
навыки по использованию ключевых понятий и формул в стандартных, а иногда
и в не стандартных ситуациях. П
роверке третьего уровня посвящены наиболее
трудные задания, с нормой трудности в
3 балла.
Задания каждого уровня снабжены соответствующими обозначениями. Это
позволяет адаптивно строить усвоение программы дисциплины, когда каждый
студент по мере усвоения
курса на более низком уровне будет пробовать себя
на более высоком уровне.
11. Перечень информационных технологий, используемых при
осуществлении образовательного процесса по дисциплине, включая
перечень программного обеспечения и информационных справочн
ых
систем.
Для успешного освоения дисциплины, обучающийся использует
следующие программные средства: пакеты для решения задач
Mathcad
Office
12. Описание материально
технической базы, необходимой для
осуществления образовательного процесса по дисципли
не.
Учебные аудит
ории для проведения лекционных,
и лабораторных
занятий, компьютерные классы факультета и ИВЦ ДГУ. В университете
имеется пакет необходимого лицензионного программного обеспечения.
При кафедре прикладной математики имеется студенческая науч
исследовательская лаборатория «Математическое моделирование».

Приложенные файлы

  • pdf 31166983
    Размер файла: 723 kB Загрузок: 0

Добавить комментарий