Определение регрессионной статистической модели

Регрессия анализирует отношения между переменными

Регрессия – это метод интеллектуального анализа данных, используемый для прогнозирования диапазона числовых значений (также называемых непрерывными значениями ) для конкретного набора данных. Например, регрессия может использоваться для прогнозирования стоимости продукта или услуги с учетом других переменных.

Регрессия используется во многих отраслях для планирования бизнеса и маркетинга, финансового прогнозирования, моделирования окружающей среды и анализа тенденций.

Регрессия против Классификации

Регрессия и классификация – это методы извлечения данных, используемые для решения подобных проблем, но они часто путаются. Оба используются в анализе прогнозирования, но регрессия используется для прогнозирования числового или непрерывного значения, в то время как классификация назначает данные в дискретные категории.

Например, регрессия будет использоваться для прогнозирования стоимости дома на основе его местоположения, квадратных футов, цены в момент последней продажи, цены на аналогичные дома и других факторов. Классификация будет в порядке, если вы хотите вместо этого организовать дома по категориям, таким как проходимость, размер участка или уровень преступности.

Типы методов регрессии

Самая простая и самая старая форма регрессии – это линейная регрессия, используемая для оценки взаимосвязи между двумя переменными. Этот метод использует математическую формулу прямой линии (y = mx + b). Проще говоря, это просто означает, что, учитывая график с осью Y и X, связь между X и Y является прямой линией с небольшим количеством выбросов. Например, мы можем предположить, что при увеличении численности населения производство продуктов питания будет увеличиваться с той же скоростью – это требует прочной линейной взаимосвязи между этими двумя показателями. Чтобы визуализировать это, рассмотрим график, на котором ось Y отслеживает увеличение населения, а ось X – производство продуктов питания. По мере увеличения значения Y значение X будет увеличиваться с той же скоростью, что делает связь между ними прямой линией.

Продвинутые методы, такие как множественная регрессия, предсказывают взаимосвязь между несколькими переменными – например, существует ли корреляция между доходом, образованием и местом проживания? Добавление большего количества переменных значительно увеличивает сложность прогноза. Существует несколько типов методов множественной регрессии, включая стандартные, иерархические, пошаговые и пошаговые, каждый со своим приложением.

На этом этапе важно понять, что мы пытаемся предсказать (зависимая или прогнозируемая переменная) и данные, которые мы используем для прогнозирования (независимый или предикатор переменные). В нашем примере мы хотим предсказать место, где человек хочет жить (переменная прогнозируемая ), с учетом дохода и образования (обе переменные предикатор ).

  • Стандартная множественная регрессия рассматривает все переменные предиктора одновременно. Например 1) какова связь между доходом и образованием (предикторы) и выбором соседства (прогнозируемые); и 2) в какой степени каждый из отдельных предикторов способствует этим отношениям?
  • Пошаговая множественная регрессия отвечает на совершенно другой вопрос. Алгоритм пошаговой регрессии будет анализировать, какие предикторы лучше всего использовать для прогнозирования выбора окрестности. Это означает, что ступенчатая модель оценивает порядок важности переменных предиктора и затем выбирает соответствующее подмножество. Этот тип проблемы регрессии использует «шаги» для разработки уравнения регрессии. Учитывая этот тип регрессии, все предикторы могут даже не появиться в окончательном уравнении регрессии.
  • Иерархическая регрессия , как и поэтапно, представляет собой последовательный процесс, но переменные предиктора вводятся в модель в заранее заданном порядке, определенном заранее, т.е. алгоритм не содержит встроенного набора уравнений для определения порядка ввода предикторов. Это используется чаще всего, когда человек, создающий уравнение регрессии, обладает экспертными знаниями в этой области.
  • Пошаговая регрессия также похожа на пошаговую, но анализирует наборы переменных, а не отдельные переменные.
Оцените статью
Solutics.ru
Добавить комментарий