Attributes | Values |
---|
rdfs:label
| |
rdfs:comment
| - Регрессионный анализ - статистический метод исследования зависимости (регрессии) между зависимым признаком и независимыми (регрессорами, предикторами) . Строго регрессионную зависимость можно определить следующим образом. Пусть , случайные величины с заданным совместным распределением вероятностей. Если для каждого набора значений определено условное математическое ожидание ,
* равенства условных дисперсий: ;
* независимости ошибок от предикторов и нормального их распределения с нулевым средним и постоянной дисперсией;
* попарного нормального распределения всех признаков модели.
|
dcterms:subject
| |
dbkwik:resource/35rzF-BhL_otm9wCtVTaeg==
| |
dbkwik:resource/4AivDxIwDSIeegYP-z9FLQ==
| |
dbkwik:resource/8WZQ1ZzI1NKp0sap4bN5GA==
| |
dbkwik:resource/9AXiqEjPKQ6Z9TSFEgu5Dg==
| - Норман Дрейпер, Гарри Смит
|
dbkwik:resource/QjxfzC_GfdpB3emLTkwFmA==
| |
dbkwik:resource/aACyUJQp1ag0ZbZvZtvlug==
| |
dbkwik:resource/fco9BXc0-68mng7EiSFwrA==
| |
dbkwik:resource/hEinrC5DRtFi1sSnEzNC-w==
| - Прикладной регрессионный анализ. Множественная регрессия
|
dbkwik:ru.math/pro...iPageUsesTemplate
| |
dbkwik:resource/kUq4r6m06kqYMRfOFZ7m_g==
| - Applied Regression Analysis
|
ISBN
| |
abstract
| - Регрессионный анализ - статистический метод исследования зависимости (регрессии) между зависимым признаком и независимыми (регрессорами, предикторами) . Строго регрессионную зависимость можно определить следующим образом. Пусть , случайные величины с заданным совместным распределением вероятностей. Если для каждого набора значений определено условное математическое ожидание , то функция называется регрессией величины Y по величинам , а ее график линией регрессии по , или уравнением регрессии. Зависимость от проявляется в изменении средних значений Y при изменении . Хотя при каждом фиксированном наборе значений величина остается случайной величиной с определенным рассеянием. Для выяснения вопроса, насколько точно регрессионный анализ оценивает изменение Y при изменении , используется средняя величина дисперсии Y при разных наборах значений (фактически речь идет о мере рассеяния зависимой переменной вокруг линии регрессии). На практике линия регрессии чаще всего ищется в виде линейной функции (линейная регрессия), наилучшим образом приближающей искомую кривую. Делается это с помощью метода наименьших квадратов, когда минимизируется сумма квадратов отклонений реально наблюдаемых Y от их оценок (имеются в виду оценки с помощью прямой линии, претендующей на то, чтобы представлять искомую регрессионную зависимость): (N - объем выборки). Этот подход основан на том известном факте, что фигурирующая в приведенном выражении сумма принимает минимальное значение именно для того случая, когда . Применение метода наименьших квадратов при регрессионном анализе для оценивания параметров модели возможно при выполнении следующих условий:
* равенства условных дисперсий: ;
* независимости ошибок от предикторов и нормального их распределения с нулевым средним и постоянной дисперсией;
* попарного нормального распределения всех признаков модели. Параметры являются частными коэффициентами корреляции; интерпретируется как доля дисперсии Y, объясненная , при закреплении влияния остальных предикторов, т.е. измеряет индивидуальный вклад в объяснение Y. В случае коррелирующих предикторов возникает проблема неопределенности в оценках , которые становятся зависимыми от порядка включения предикторов в модель. В таких случаях необходимо применение методов анализа корреляционного и пошагового регрессионного анализа. Говоря о нелинейных моделях регрессионного анализа важно обращать внимание на то, идет ли речь о нелинейности по независимым переменным (с формальной точки зрения легко сводящейся к линейной регрессии), или о нелинейности по оцениваемым параметрам (вызывающей серьезные вычислительные трудности). При нелинейности первого вида с содержательной точки зрения важно выделять появление в модели членов вида , , свидетельствующее о наличии взаимодействий между признаками , и т.д.
|