Спорт  ->  Автоспорт  | Автор: | Добавлено: 2015-03-23

Математическая обработка экспериментальных данных

Вычислительный эксперимент - такая организация исследований, при которой на основе математических моделей изучаются свойства объектов и явлений, проигрывается их поведение в различных условиях и на основе этого выбирается оптимальный режим. Другими словами, вычислительный эксперимент предполагает переход от изучения реального объекта к изучению его математической модели. Такой моделью, как правило, является одно или несколько уравнений.

К основным преимуществам вычислительного эксперимента можно отнести следующие:

• возможность исследования объекта без модификации установки или аппарата;

• возможность исследования каждого фактора в отдельности, в то время как в реальности они действуют одновременно;

• возможность исследования нереализуемых на практике процессов.

В ряде случаев именно результаты экспериментальных исследований дают толчок к теоретическому обобщению изучаемого явления. Экспериментальное исследование дает более точное соответствие между изучаемыми параметрами.

Целью данной работой является рассмотрение основных методов обработки экспериментальных данных – графический метод, метод средних и метод наименьших квадратов, а также самостоятельные решения задач по обработке опытных данных с применением вышеуказанных методов.

МАТЕМАТИЧЕСКОЙ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Основой всего познания является наблюдение, эксперимент. Экспериментальное исследование дает более точное соответствие между изучаемыми параметрами и, как правило, результаты этих исследований нуждаются в некоторой математической обработке. В настоящее время процедура обработки экспериментальных данных достаточно хорошо формализована и исследователю необходимо только ее правильно использовать. Круг вопросов, решаемых при обработке результатов эксперимента, не так уж велик. Это - вопросы подбора эмпирических формул и оценка их параметров, вопросы оценки истинных значений измеряемых величин и точности измерений, вопросы исследования корреляционных зависимостей и некоторые другие.

1. Некоторые понятия математической статистики

Установление зависимости между двумя и более наблюдаемыми величинами является одним из основных методов математической статистики.

Статистика – функция от результатов наблюдений, являющаяся случайной величиной.

Математическая статистика – раздел математики, посвященный математическим методам систематизации, обработки и исследования статистических данных для научных и практических выводов.

В своей работе я буду использовать такие понятия математической статистики, как регрессия, корреляция и коэффициент корреляции.

Регрессия – зависимость среднего значения какой-либо случайной величины от некоторой другой величины или нескольких величин.

Регрессия тесно связана с корреляцией.

Корреляция – зависимость между случайными величинами, выражающаяся в том, что распределение одной величины зависит от значения, принятого другой величиной.

Коэффициент корреляции (rxy) – числовая характеристика совместного распределения двух случайных величин x и y, выражающая их взаимосвязь. Коэффициент корреляции обладает следующим свойством:

-1≤ r ≤1.

При этом чем ближе r к нулю, тем слабее корреляция. И наоборот, чем ближе r к 1 или -1, тем сильнее корреляция, т. е. зависимость между X и Y близка к линейной. Если r в точности равно 1 или -1, то зависимость прямая.

Понятия “корреляция” и “регрессия” тесно связаны между собой. В корреляционном анализе оценивается сила связи, а в регрессионном анализе исследуется её форма. Корреляция в широком смысле объединяет корреляцию в узком смысле и регрессию.

К задачам корреляционного анализа относят:

• Измерение степени связности двух или более явлений.

• Отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения связи между ними.

• Обнаружение неизвестных причинных связей. Корреляция устанавливает степень необходимости этих связей и достоверность суждений об их наличии.

К задачам регрессионного анализа относят:

• Установление формы зависимости (линейная или нелинейная, положительная или отрицательная и т. д. )

• Определение функции регрессии и установление влияния факторов на зависимую переменную.

• Оценка неизвестных значений зависимой переменной.

2. Цели математической обработки результатов эксперимента

Целью любого эксперимента является определение качественной и количественной связи между исследуемыми параметрами. В некоторых случаях вид зависимости между переменными величинами известен по результатам теоретических исследований. Как правило, формулы, выражающие эти зависимости, содержат некоторые постоянные, значения которых и необходимо определить из опыта. Другим типом задачи является определение неизвестной функциональной связи между переменными величинами на основе данных эксперимента. Такие зависимости называют эмпирическими. Однозначно определить неизвестную функциональную зависимость между переменными невозможно даже в том случае, если бы результаты эксперимента не имели ошибок. Поэтому следует четко понимать, что целью математической обработки результатов эксперимента является не нахождение истинного характера зависимости между переменными или абсолютной величины какой-либо константы, а представление результатов наблюдений в виде наиболее простой формулы с оценкой возможной погрешности ее использования.

Обычно полученные в результате наблюдений данные представляют собой набор чисел. Просматривая этот набор, довольно трудно выявить какую-либо закономерность, поэтому результаты экспериментальных исследований нуждаются в определенной математической обработке.

В своей работе я буду рассматривать три основных метода обработки экспериментальных данных:

• Графический метод

• Метод средних

• Метод наименьших квадратов.

2. МЕТОДЫ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

1. 2 Графический метод обработки данных

Пусть данные опыта представлены таблицей. Через точки, определяемой этой таблицей или близкие к ним, проводим график и по виду графика подбираем вид эмпирической формулы. Простейшим случаем считается тот, для которого данные опыта приводят к точкам, располагающимися приблизительно на прямой y = a0 + a1x или на кривых, уравнения которых

S = Atα и S = Aeαt преобразуются заменой переменных к линейной функции. Решая эту задачу графическим способом, наносим точки на координатную сетку (с равномерной или логарифмической шкалой) и проводим прямую приблизительно через эти точки, так, чтобы она лежала возможно ближе к каждой из нанесенных точек, а затем берем две произвольные точки на этой прямой (совершенно произвольно) и подставляем их координаты в соотношении y = a0 + a1x. Из полученных таким образом двух уравнений найдем a0 и a1.

2. 2 Метод средних.

Уклонение – расстояние между приближаемой и приближающей функциями.

Способ средних основывается на допущении, что наиболее подходящей линией служит та, для которой алгебраическая сумма уклонений равна нулю. Для этого чтобы найти этим способом неизвестные постоянные в эмпирической формуле, сначала подставляем в эту формулу все пары наблюдавшихся или замеренных значений x и y и получаем столько уклонений, сколько пар значений (x;y) в таблице (уклонения – вертикальные расстояния от данных точек до графика функции). Затем распределяем эти уклонения по группам, составляя столько групп, сколько неизвестных параметров эмпирической формулы надо найти. Наконец, приравнивая нулю сумму уклонений по каждой группе, получим систему линейных уравнений относительно параметров.

2. 3 Метод наименьших квадратов.

Предположим, что зависимость между случайными величинами X и Y близка к линейной (в этом случае коэффициент корреляции r близок к 1 или к -1). Тогда ставится вопрос об отыскании функции:

, (2. 1)

Которая наилучшим образом выражает зависимость Y от X. Для нахождения такой функции пользуются методом наименьших квадратов.

Пусть даны n пар чисел:

Требуется найти такую прямую, чтобы сумма квадратов “отклонений” этих точек от прямой (3. 1) была как можно меньше. Значит, выражение

2 (2. 2) должно быть минимальным.

Рис. 2. 1

Отклонения (рис. 2. 1) изображены в виде вертикальных отрезков (перпендикуляров).

Выражение (2. 2) является функцией двух переменных a и b. Можно сказать, что выражение (2. 2) принимает минимальное значение, если величины a и b связаны соотношениями (полное выведение см. в )

Эта система имеет единственное решение:

. (2. 3)

Найдя неизвестные a и b, мы найдем тем самым прямую (2. 1), наилучшим образом выражающую статистическую связь между величинами X и Y. Полученная прямая называется прямой регрессии Y на X.

3. РЕШЕНИЕ ЗАДАЧ

Задача_1

Стационарное распределение температуры в теплоизолированном тонком стержне описывается линейной функцией u = a0 +a1x. Определить постоянные a0 и a1, если дана таблица измеренных температур в соответствующих точках стержня:

T 0 2 6 8 10

Число зрителей (в тыс. ) 8,1 9,4 11,3 6,9 9,7

Определить: коэффициент корреляции между числом проданных накануне билетов и числом зрителей и построить прямую регрессии.

Р е ш е н и е.

Примем число билетов за X, а число зрителей за Y. В таблице даны пять реализаций пары случайных величин – пары чисел i=1,,5. Для расчета коэффициента корреляции(rxy) используются следующие формулы:

Где - среднее арифметическое исходных данных x, - среднее арифметическое исходных данных у, - средне квадратичные отклонения x, у соответственно.

Найдем суммы:

Эти суммы подставим в формулы (3. 1)-(3. 4). Имеем:

Таким образом, коэффициент корреляции r оказался довольно близким к единице. Для прогнозирования числа зрителей надо найти прямую регрессии Y на X. Подставим найденные значения в формулы (2. 3).

Получим:

Таким образом, прямая регрессии имеет уравнение и графически изображается на рис. 3. 2.

Рис. 3. 2

Ответ :.

Задача 4

При измерении в баллах результатов тестирования по математике (X) и физике (Y) получены следующие пары чисел для четырех школьников: (2,2), (4,5), (6,7), (8,10).

Найти : коэффициент корреляции и прямую регрессии Y на X.

Р е ш е н и е.

Найдем коэффициент корреляции, используя формулы (3. 1)-(3. 4).

Сначала найдем суммы:

Эти суммы подставим в формулы (3. 1)-(3. 4). Имеем:

Таким образом, коэффициент корреляции r оказался довольно близким к единице. Найдем прямую регрессии Y на X. Подставим найденные значения в формулы (2. 3).

Получим:

Таким образом, прямая регрессии имеет уравнение и графически изображается на рис. 3. 4.

Рис. 3. 3

Задача 5

Проводится исследование спроса на некоторый вид товара. Пробные продажи показали следующие данные о зависимости дневного спроса от цены:

Цена, руб. 10 12 14 16 18

Спрос, ед. товара 91 76 68 59 53

Требуется : коэффициент корреляции между ценой X и спросом Y, построить прямую регрессии Y на X.

Р е ш е н и е.

Найдем коэффициент корреляции, используя формулы (3. 1)-(3. 4).

Сначала найдем суммы:

Эти суммы подставим в формулы (3. 1)-(3. 4). Имеем:

Таким образом, коэффициент корреляции r оказался довольно близким к единице. Найдем прямую регрессии Y на X. Подставим найденные значения в формулы (2. 3).

ЗАКЛЮЧЕНИЕ

Математическая обработка экспериментальных данных является важной составляющей многих научных и производственных процессов. С её помощью можно значительно упростить процедуру исследования каких-либо явлений или событий. Допустим, довольно дорогой эксперимент не нужно будет проводить несколько раз, так как его результаты можно будет прогнозировать, исходя из выводов, сделанных на основе раннее проделанного опыта. Поэтому значимость обработки экспериментальных данных приобретает всё более масштабный характер.

Тема работы “Математическая обработка опытных данных” широко применима в различных науках, где целью познания является эксперимент, а он в свою очередь нуждается в математической обработке, например, в физике, экономике, химии, геологии и других. Отсюда вытекает большое значение в теоретическом и практическом применении такого рода знаний в научном и техническом аспектах современной жизни.

Для написания теоретической части работы автором был изучен ряд первоисточников, что позволило привести во второй главе примеры самостоятельного решения пяти задач на применение описанных методов. Поскольку для решения подобных задач требуется решение с большим количеством громоздких вычислительных операций, мною была предпринята попытка облегчить этот процедуру. В приложении представлена программа, написанная на языке программирования Turbo Pascal, для решения задач методом наименьших квадратов, как наиболее часто используемого и точного метода для обработки экспериментальных данных.

Комментарии


Войти или Зарегистрироваться (чтобы оставлять отзывы)