Как сделать прогнозирование в excel?
Содержание
- 1 Процедура прогнозирования
- 2 Примеры использования функции ПРЕДСКАЗ в Excel
- 3 Анализ прогноза спроса продукции в Excel по функции ПРЕДСКАЗ
- 4 Прогнозирование будущих значений в Excel по условию
- 5 Особенности использования функции ПРЕДСКАЗ в Excel
- 6 Подготовка к прогнозированию в Excel.
- 7 Прогнозирование в Excel сроков изготовления заказов.
- 8 Анализ результатов.
- 9 Заключение.
Прогнозирование – это очень важный элемент практически любой сферы деятельности, начиная от экономики и заканчивая инженерией. Существует большое количество программного обеспечения, специализирующегося именно на этом направлении. К сожалению, далеко не все пользователи знают, что обычный табличный процессор Excel имеет в своем арсенале инструменты для выполнения прогнозирования, которые по своей эффективности мало чем уступают профессиональным программам. Давайте выясним, что это за инструменты, и как сделать прогноз на практике.
Процедура прогнозирования
Целью любого прогнозирования является выявление текущей тенденции, и определение предполагаемого результата в отношении изучаемого объекта на определенный момент времени в будущем.
Способ 1: линия тренда
Одним из самых популярных видов графического прогнозирования в Экселе является экстраполяция выполненная построением линии тренда.
Попробуем предсказать сумму прибыли предприятия через 3 года на основе данных по этому показателю за предыдущие 12 лет.
- Строим график зависимости на основе табличных данных, состоящих из аргументов и значений функции. Для этого выделяем табличную область, а затем, находясь во вкладке «Вставка», кликаем по значку нужного вида диаграммы, который находится в блоке «Диаграммы». Затем выбираем подходящий для конкретной ситуации тип. Лучше всего выбрать точечную диаграмму. Можно выбрать и другой вид, но тогда, чтобы данные отображались корректно, придется выполнить редактирование, в частности убрать линию аргумента и выбрать другую шкалу горизонтальной оси.
- Теперь нам нужно построить линию тренда. Делаем щелчок правой кнопкой мыши по любой из точек диаграммы. В активировавшемся контекстном меню останавливаем выбор на пункте «Добавить линию тренда».
- Открывается окно форматирования линии тренда. В нем можно выбрать один из шести видов аппроксимации:
- Линейная;
- Логарифмическая;
- Экспоненциальная;
- Степенная;
- Полиномиальная;
- Линейная фильтрация.
Давайте для начала выберем линейную аппроксимацию.
В блоке настроек «Прогноз» в поле «Вперед на» устанавливаем число «3,0», так как нам нужно составить прогноз на три года вперед. Кроме того, можно установить галочки около настроек «Показывать уравнение на диаграмме» и «Поместить на диаграмме величину достоверности аппроксимации (R^2)». Последний показатель отображает качество линии тренда. После того, как настройки произведены, жмем на кнопку «Закрыть».
- Линия тренда построена и по ней мы можем определить примерную величину прибыли через три года. Как видим, к тому времени она должна перевалить за 4500 тыс. рублей. Коэффициент R2, как уже было сказано выше, отображает качество линии тренда. В нашем случае величина R2 составляет 0,89. Чем выше коэффициент, тем выше достоверность линии. Максимальная величина его может быть равной 1. Принято считать, что при коэффициенте свыше 0,85 линия тренда является достоверной.
- Если же вас не устраивает уровень достоверности, то можно вернуться в окно формата линии тренда и выбрать любой другой тип аппроксимации. Можно перепробовать все доступные варианты, чтобы найти наиболее точный.
Нужно заметить, что эффективным прогноз с помощью экстраполяции через линию тренда может быть, если период прогнозирования не превышает 30% от анализируемой базы периодов. То есть, при анализе периода в 12 лет мы не можем составить эффективный прогноз более чем на 3-4 года. Но даже в этом случае он будет относительно достоверным, если за это время не будет никаких форс-мажоров или наоборот чрезвычайно благоприятных обстоятельств, которых не было в предыдущих периодах.
Урок: Как построить линию тренда в Excel
Способ 2: оператор ПРЕДСКАЗ
Экстраполяцию для табличных данных можно произвести через стандартную функцию Эксель ПРЕДСКАЗ. Этот аргумент относится к категории статистических инструментов и имеет следующий синтаксис:
=ПРЕДСКАЗ(X;известные_значения_y;известные значения_x)
«X» – это аргумент, значение функции для которого нужно определить. В нашем случае в качестве аргумента будет выступать год, на который следует произвести прогнозирование.
«Известные значения y» — база известных значений функции. В нашем случае в её роли выступает величина прибыли за предыдущие периоды.
«Известные значения x» — это аргументы, которым соответствуют известные значения функции. В их роли у нас выступает нумерация годов, за которые была собрана информация о прибыли предыдущих лет.
Естественно, что в качестве аргумента не обязательно должен выступать временной отрезок. Например, им может являться температура, а значением функции может выступать уровень расширения воды при нагревании.
При вычислении данным способом используется метод линейной регрессии.
Давайте разберем нюансы применения оператора ПРЕДСКАЗ на конкретном примере. Возьмем всю ту же таблицу. Нам нужно будет узнать прогноз прибыли на 2018 год.
- Выделяем незаполненную ячейку на листе, куда планируется выводить результат обработки. Жмем на кнопку «Вставить функцию».
- Открывается Мастер функций. В категории «Статистические» выделяем наименование «ПРЕДСКАЗ», а затем щелкаем по кнопке «OK».
- Запускается окно аргументов. В поле «X» указываем величину аргумента, к которому нужно отыскать значение функции. В нашем случаем это 2018 год. Поэтому вносим запись «2018». Но лучше указать этот показатель в ячейке на листе, а в поле «X» просто дать ссылку на него. Это позволит в будущем автоматизировать вычисления и при надобности легко изменять год.
В поле «Известные значения y» указываем координаты столбца «Прибыль предприятия». Это можно сделать, установив курсор в поле, а затем, зажав левую кнопку мыши и выделив соответствующий столбец на листе.
Аналогичным образом в поле «Известные значения x» вносим адрес столбца «Год» с данными за прошедший период.
После того, как вся информация внесена, жмем на кнопку «OK».
- Оператор производит расчет на основании введенных данных и выводит результат на экран. На 2018 год планируется прибыль в районе 4564,7 тыс. рублей. На основе полученной таблицы мы можем построить график при помощи инструментов создания диаграммы, о которых шла речь выше.
- Если поменять год в ячейке, которая использовалась для ввода аргумента, то соответственно изменится результат, а также автоматически обновится график. Например, по прогнозам в 2019 году сумма прибыли составит 4637,8 тыс. рублей.
Но не стоит забывать, что, как и при построении линии тренда, отрезок времени до прогнозируемого периода не должен превышать 30% от всего срока, за который накапливалась база данных.
Урок: Экстраполяция в Excel
Способ 3: оператор ТЕНДЕНЦИЯ
Для прогнозирования можно использовать ещё одну функцию – ТЕНДЕНЦИЯ. Она также относится к категории статистических операторов. Её синтаксис во многом напоминает синтаксис инструмента ПРЕДСКАЗ и выглядит следующим образом:
=ТЕНДЕНЦИЯ(Известные значения_y;известные значения_x; новые_значения_x;)
Как видим, аргументы «Известные значения y» и «Известные значения x» полностью соответствуют аналогичным элементам оператора ПРЕДСКАЗ, а аргумент «Новые значения x» соответствует аргументу «X» предыдущего инструмента. Кроме того, у ТЕНДЕНЦИЯ имеется дополнительный аргумент «Константа», но он не является обязательным и используется только при наличии постоянных факторов.
Данный оператор наиболее эффективно используется при наличии линейной зависимости функции.
Посмотрим, как этот инструмент будет работать все с тем же массивом данных. Чтобы сравнить полученные результаты, точкой прогнозирования определим 2019 год.
- Производим обозначение ячейки для вывода результата и запускаем Мастер функций обычным способом. В категории «Статистические» находим и выделяем наименование «ТЕНДЕНЦИЯ». Жмем на кнопку «OK».
- Открывается окно аргументов оператора ТЕНДЕНЦИЯ. В поле «Известные значения y» уже описанным выше способом заносим координаты колонки «Прибыль предприятия». В поле «Известные значения x» вводим адрес столбца «Год». В поле «Новые значения x» заносим ссылку на ячейку, где находится номер года, на который нужно указать прогноз. В нашем случае это 2019 год. Поле «Константа» оставляем пустым. Щелкаем по кнопке «OK».
- Оператор обрабатывает данные и выводит результат на экран. Как видим, сумма прогнозируемой прибыли на 2019 год, рассчитанная методом линейной зависимости, составит, как и при предыдущем методе расчета, 4637,8 тыс. рублей.
Способ 4: оператор РОСТ
Ещё одной функцией, с помощью которой можно производить прогнозирование в Экселе, является оператор РОСТ. Он тоже относится к статистической группе инструментов, но, в отличие от предыдущих, при расчете применяет не метод линейной зависимости, а экспоненциальной. Синтаксис этого инструмента выглядит таким образом:
=РОСТ(Известные значения_y;известные значения_x; новые_значения_x;)
Как видим, аргументы у данной функции в точности повторяют аргументы оператора ТЕНДЕНЦИЯ, так что второй раз на их описании останавливаться не будем, а сразу перейдем к применению этого инструмента на практике.
- Выделяем ячейку вывода результата и уже привычным путем вызываем Мастер функций. В списке статистических операторов ищем пункт «РОСТ», выделяем его и щелкаем по кнопке «OK».
- Происходит активация окна аргументов указанной выше функции. Вводим в поля этого окна данные полностью аналогично тому, как мы их вводили в окне аргументов оператора ТЕНДЕНЦИЯ. После того, как информация внесена, жмем на кнопку «OK».
- Результат обработки данных выводится на монитор в указанной ранее ячейке. Как видим, на этот раз результат составляет 4682,1 тыс. рублей. Отличия от результатов обработки данных оператором ТЕНДЕНЦИЯ незначительны, но они имеются. Это связано с тем, что данные инструменты применяют разные методы расчета: метод линейной зависимости и метод экспоненциальной зависимости.
Способ 5: оператор ЛИНЕЙН
Оператор ЛИНЕЙН при вычислении использует метод линейного приближения. Его не стоит путать с методом линейной зависимости, используемым инструментом ТЕНДЕНЦИЯ. Его синтаксис имеет такой вид:
=ЛИНЕЙН(Известные значения_y;известные значения_x; новые_значения_x;;)
Последние два аргумента являются необязательными. С первыми же двумя мы знакомы по предыдущим способам. Но вы, наверное, заметили, что в этой функции отсутствует аргумент, указывающий на новые значения. Дело в том, что данный инструмент определяет только изменение величины выручки за единицу периода, который в нашем случае равен одному году, а вот общий итог нам предстоит подсчитать отдельно, прибавив к последнему фактическому значению прибыли результат вычисления оператора ЛИНЕЙН, умноженный на количество лет.
- Производим выделение ячейки, в которой будет производиться вычисление и запускаем Мастер функций. Выделяем наименование «ЛИНЕЙН» в категории «Статистические» и жмем на кнопку «OK».
- В поле «Известные значения y», открывшегося окна аргументов, вводим координаты столбца «Прибыль предприятия». В поле «Известные значения x» вносим адрес колонки «Год». Остальные поля оставляем пустыми. Затем жмем на кнопку «OK».
- Программа рассчитывает и выводит в выбранную ячейку значение линейного тренда.
- Теперь нам предстоит выяснить величину прогнозируемой прибыли на 2019 год. Устанавливаем знак «=» в любую пустую ячейку на листе. Кликаем по ячейке, в которой содержится фактическая величина прибыли за последний изучаемый год (2016 г.). Ставим знак «+». Далее кликаем по ячейке, в которой содержится рассчитанный ранее линейный тренд. Ставим знак «*». Так как между последним годом изучаемого периода (2016 г.) и годом на который нужно сделать прогноз (2019 г.) лежит срок в три года, то устанавливаем в ячейке число «3». Чтобы произвести расчет кликаем по кнопке Enter.
Как видим, прогнозируемая величина прибыли, рассчитанная методом линейного приближения, в 2019 году составит 4614,9 тыс. рублей.
Способ 6: оператор ЛГРФПРИБЛ
Последний инструмент, который мы рассмотрим, будет ЛГРФПРИБЛ. Этот оператор производит расчеты на основе метода экспоненциального приближения. Его синтаксис имеет следующую структуру:
= ЛГРФПРИБЛ (Известные значения_y;известные значения_x; новые_значения_x;;)
Как видим, все аргументы полностью повторяют соответствующие элементы предыдущей функции. Алгоритм расчета прогноза немного изменится. Функция рассчитает экспоненциальный тренд, который покажет, во сколько раз поменяется сумма выручки за один период, то есть, за год. Нам нужно будет найти разницу в прибыли между последним фактическим периодом и первым плановым, умножить её на число плановых периодов (3) и прибавить к результату сумму последнего фактического периода.
- В списке операторов Мастера функций выделяем наименование «ЛГРФПРИБЛ». Делаем щелчок по кнопке «OK».
- Запускается окно аргументов. В нем вносим данные точно так, как это делали, применяя функцию ЛИНЕЙН. Щелкаем по кнопке «OK».
- Результат экспоненциального тренда подсчитан и выведен в обозначенную ячейку.
- Ставим знак «=» в пустую ячейку. Открываем скобки и выделяем ячейку, которая содержит значение выручки за последний фактический период. Ставим знак «*» и выделяем ячейку, содержащую экспоненциальный тренд. Ставим знак минус и снова кликаем по элементу, в котором находится величина выручки за последний период. Закрываем скобку и вбиваем символы «*3+» без кавычек. Снова кликаем по той же ячейке, которую выделяли в последний раз. Для проведения расчета жмем на кнопку Enter.
Прогнозируемая сумма прибыли в 2019 году, которая была рассчитана методом экспоненциального приближения, составит 4639,2 тыс. рублей, что опять не сильно отличается от результатов, полученных при вычислении предыдущими способами.
Урок: Другие статистические функции в Excel
Мы выяснили, какими способами можно произвести прогнозирование в программе Эксель. Графическим путем это можно сделать через применение линии тренда, а аналитическим – используя целый ряд встроенных статистических функций. В результате обработки идентичных данных этими операторами может получиться разный итог. Но это не удивительно, так как все они используют разные методы расчета. Если колебание небольшое, то все эти варианты, применимые к конкретному случаю, можно считать относительно достоверными.
Мы рады, что смогли помочь Вам в решении проблемы.
Задайте свой вопрос в комментариях, подробно расписав суть проблемы. Наши специалисты постараются ответить максимально быстро.
Помогла ли вам эта статья?
Да Нет
Практически в любой сфере деятельности, от экономики до инженерии, существует востребованность предсказать результат того или иного действия, получить значения и приблизительные данные. В этом направлении есть масса различного софта. И большинство этого программного обеспечения имеет платные функции.
Табличный процессор Microsoft имеет в своем программном обеспечении мощный инструмент для прогнозирования, который позволяет построить целый ряд различных моделей и с легкостью на практике применять различные методы. При этом в большинстве случаев этот инструмент дает более достоверные результаты, чем у платных программ. Как и каким образом? Давайте разберемся.
Прогнозирование – поиск темпов развития и получаемого результата относительно исходных данных в конкретное время.
Рассмотрим несколько способов, которые могут дать прогнозированный результат:1. Линия трендаЛиния тренда – графическое отображение прогнозирования за счет экстраполяции. Звучит заумно? На практике все проще.
Давайте попробуем спрогнозировать сумму доходов компании через 36 месяцев на основе показателей за прошлые 12 лет.
Построим точечную диаграмму на основе исходных данных компании, а именно ее прибыль в течение всех 12 лет. Запишем исходные данные по прибыли в таблицу, выделим все ее поля и перейдем в меню «Вставка» — «Диаграмма» и выберем точечный вид диаграммы.
Для построения линии тренда выберем любую точку на диаграмме, откроем контекстное меню правой клавишей мышки и выберем из списка «Добавить линию тренда…». В появившемся меню выбора аппроксимации выберем тип «Линейная».
Произведем небольшие настройки формата линии: «Прогноз» установим на три года, вписываем «3.0», и укажем, чтобы показывалась величина достоверности и само уравнение на диаграмме.
По построенной линии тренда можем спрогнозировать доход через три года – он будет более 4500 тыс. руб. Достоверность прогнозирования принято считать верным при «0.85» ед. Эффективность прогнозирования не будет успешным, если период будет превышать 30% от периода базы.
2. Использование оператора ПРЕДСКАЗТакже в наборе функций программы есть ряд стандартных фунций создания прогноза. Одним из таких является оператор «ПРЕДСКАЗ», синтаксис которого таковой: «=ПРЕДСКАЗ(X;известные_значения_y;известные значения_x)».
Аргумент «Х», исходя из нашей таблицы, это искомый год для прогнозирования. «Значения у» — прибыль за прошлое время. «Значения х» — года, в течение которых были собраны данные.
Узнаем, на основе уже полученных данных прогноз на следующий год с помощью оператора «ПРЕДСКАЗ». Для этого вставим в ячейку прибыли на 2018 год с помощью мастера функций оператор «ПРЕДСКАЗ».
В появившемся диалоговом окне укажем все исходные данные, согласно описанию выше.
Полученный результат совпадает с результатом предыдущего метода, поэтому можно считать прогнозирование прибыли достоверным. Для визуального подтверждения можем построить диаграмму.
3. Использование оператора ТЕНДЕНЦИЯ
Еще одним статическим оператором, который можно использовать для прогнозирования, является оператор «ТЕНДЕНЦИЯ» со следующим синтаксисом: «=ТЕНДЕНЦИЯ(Известные значения_y;известные значения_x; новые_значения_x;)». Аргументы оператора идентичны аргументам оператора «ПРЕДСКАЗ».
Попробуем провести прогнозирование на следующий год, используя оператор «ТЕНДЕНЦИЯ». В новую ячейку вставим функцию из мастера функций.
Заполняем аргументы исходными данными и убеждаемся, что очередной метод прогнозирования прекрасно справляется со своей задачей – его результат схож с результатами прошлых шагов и является достоверным.
4. Использование оператора РОСТАналогичным методом для прогноза данных является функция «РОСТ», за исключением того, что он использует при расчете прогноза экспоненциальную зависимость, в отличие от предыдущих методов, которые использовали линейную. Его аргументы идентичны аргументам оператора «ТЕНДЕНЦИЯ».
Как и в предыдущих шагах, вставляем в новую ячейку функцию «РОСТ», заполняем аргументы исходными данными и сравниваем результат прогнозирования. Он также дает достоверные данные, схожие с предыдущими.
5. Использование оператора ЛИНЕЙНДругой оператор, который может спрогнозировать результат на определенный период времени, оператор «ЛИНЕЙН», который основан на линейном приближении. Его синтаксис схож с прошлыми операторами: «=ЛИНЕЙН(Известные значения_y;известные значения_x; новые_значения_x;;)».
Вставим новую функцию в ячейку с прогнозированным годом и заполним аргументы.
Как видим, у оператора отсутствует аргумент новых значений. Он измеряет само значение выручки. А сам результат прогнозирования необходимо подсчитать отдельно.
Чтобы получить прогнозирование на следующий год, необходимо полученное значение линейного тренда умножить на период времени, в нашем случае «3» года, и добавить прибыль за последний год. Получаемый прогноз также схож со всеми предыдущими.
Несмотря на используемый метод, все результаты прогнозирования очень схожи и дают достоверный результат, на который можно опираться для дальнейших действий. Стоит учитывать, что этот результат всегда может измениться из-за нестабильной компании или любых других форс-мажорных ситуаций.
Функция ПРЕДСКАЗ в Excel позволяет с некоторой степенью точности предсказать будущие значения на основе существующих числовых значений, и возвращает соответствующие величины. Например, некоторый объект характеризуется свойством, значение которого изменяется с течением времени. Такие изменения могут быть зафиксированы опытным путем, в результате чего будет составлена таблица известных значений x и соответствующих им значений y, где x – единица измерения времени, а y – количественная характеристика свойства. С помощью функции ПРЕДСКАЗ можно предположить последующие значения y для новых значений x.
Примеры использования функции ПРЕДСКАЗ в Excel
Функция ПРЕДСКАЗ использует метод линейной регрессии, а ее уравнение имеет вид y=ax+b, где:
- Коэффициент a рассчитывается как Yср.-bXср. (Yср. и Xср. – среднее арифметическое чисел из выборок известных значений y и x соответственно).
- Коэффициент b определяется по формуле:
Пример 1. В таблице приведены данные о ценах на бензин за 23 дня текущего месяца. Согласно прогнозам специалистов, средняя стоимость 1 л бензина в текущем месяце не превысит 41,5 рубля. Спрогнозировать стоимость бензина на оставшиеся дни месяца, сравнить рассчитанное среднее значение с предсказанным специалистами.
Вид исходной таблицы данных:
Чтобы определить предполагаемую стоимость бензина на оставшиеся дни используем следующую функцию (как формулу массива):
Описание аргументов:
- A26:A33 – диапазон ячеек с номерами дней месяца, для которых данные о стоимости бензина еще не определены;
- B3:B25 – диапазон ячеек, содержащих данные о стоимости бензина за последние 23 дня;
- A3:A25 – диапазон ячеек с номерами дней, для которых уже известна стоимость бензина.
Результат расчетов:
Рассчитаем среднюю стоимость 1 л бензина на основании имеющихся и расчетных данных с помощью функции:
=СРЗНАЧ(B3:B33)
Результат:
Можно сделать вывод о том, что если тенденция изменения цен на бензин сохранится, предсказания специалистов относительно средней стоимости сбудутся.
Анализ прогноза спроса продукции в Excel по функции ПРЕДСКАЗ
Пример 2. Компания недавно представила новый продукт. С момента вывода на рынок ежедневно ведется учет количества клиентов, купивших этот продукт. Предположить, каким будет спрос на протяжении 5 последующих дней.
Вид исходной таблицы данных:
Как видно, в первые дни спрос был небольшим, затем он рос достаточно большими темпами, а на протяжении последних трех дней изменялся незначительно. Это свидетельствует о том, что основным фактором роста продаж на данный момент является не расширение базы клиентов, а развитие продаж с постоянными клиентами. В таких случаях рекомендуют использовать не линейную регрессию, а логарифмический тренд, чтобы результаты прогнозов были более точными.
Рассчитаем значения логарифмического тренда с помощью функции ПРЕДСКАЗ следующим способом:
Как видно, в качестве первого аргумента представлен массив натуральных логарифмов последующих номеров дней. Таким образом получаем функцию логарифмического тренда, которая записывается как y=aln(x)+b.
Результат расчетов:
Для сравнения, произведем расчет с использованием функции линейного тренда:
И для визуального сравнительного анализа построим простой график.
Полученные результаты:
Как видно, функцию линейной регрессии следует использовать в тех случаях, когда наблюдается постоянный рост какой-либо величины. В данном случае функция логарифмического тренда позволяет получить более правдоподобные данные (более наглядно при большем количестве данных).
Прогнозирование будущих значений в Excel по условию
Пример 3. В таблице Excel указаны значения независимой и зависимой переменных. Некоторые значения зависимой переменной указаны в виде отрицательных чисел. Спрогнозировать несколько последующих значений зависимой переменной, исключив из расчетов отрицательные числа.
Вид таблицы данных:
Для расчета будущих значений Y без учета отрицательных значений (-5, -20 и -35) используем формулу:
C помощью функций ЕСЛИ выполняется перебор элементов диапазона B2:B11 и отброс отрицательных чисел. Так, получаем прогнозные данные на основании значений в строках с номерами 2,3,5,6,8-10. Для детального анализа формулы выберите инструмент «ФОРМУЛЫ»-«Зависимости формул»-«Вычислить формулу». Один из этапов вычислений формулы:
Полученные результаты:
Особенности использования функции ПРЕДСКАЗ в Excel
Функция имеет следующую синтаксическую запись:
=ПРЕДСКАЗ(x;известные_значения_y;известные_значения_x)
Описание аргументов:
- x – обязательный для заполнения аргумент, характеризующий одно или несколько новых значений независимой переменной, для которых требуется предсказать значения y (зависимой переменной). Может принимать числовое значение, массив чисел, ссылку на одну ячейку или диапазон;
- известные_значения_y – обязательный аргумент, характеризующий уже известные числовые значения зависимой переменной y. Может быть указан в виде массива чисел или ссылки на диапазон ячеек с числами;
- известные_значения_x – обязательный аргумент, который характеризует уже известные значения независимой переменной x, для которой определены значения зависимой переменной y.
Примечания:
- Второй и третий аргументы рассматриваемой функции должны принимать ссылки на непустые диапазоны ячеек или такие диапазоны, в которых число ячеек совпадает. Иначе функция ПРЕДСКАЗ вернет код ошибки #Н/Д.
- Если одна или несколько ячеек из диапазона, ссылка на который передана в качестве аргумента x, содержит нечисловые данные или текстовую строку, которая не может быть преобразована в число, результатом выполнения функции ПРЕДСКАЗ для данных значений x будет код ошибки #ЗНАЧ!.
- Статистическая дисперсия величин (можно рассчитать с помощью формул ДИСП.Г, ДИСП.В и др.), передаваемых в качестве аргумента известные_значения_x, не должна равняться 0 (нулю), иначе функция ПРЕДСКАЗ вернет код ошибки #ДЕЛ/0!.
- Рассматриваемая функция игнорирует ячейки с нечисловыми данными, содержащиеся в диапазонах, которые переданы в качестве второго и третьего аргументов.
- Функция ПРЕДСКАЗ была заменена функцией ПРЕДСКАЗ.ЛИНЕЙН в Excel версии 2016, но была оставлена для обеспечения совместимости с Excel 2013 и более старыми версиями.
- Для предсказания только одного будущего значения на основании известного значения независимой переменной функция ПРЕДСКАЗ используется как обычная формула. Если требуется предсказать сразу несколько значений, в качестве первого аргумента следует передать массив или ссылку на диапазон ячеек со значениями независимой переменной, а функцию ПРЕДСКАЗ использовать в качестве формулы массива.
Опубликовано 20 Июл 2014
Рубрика: Справочник Excel | 8 комментариев
Аппроксимация функции нескольких независимых переменных (множественная регрессия) – очень интересная, имеющая огромное практическое значение задача! Если научиться ее решать, то можно стать почти волшебником, умеющим делать очень достоверные прогнозы…
…результатов различных процессов на основе данных предыдущих периодов времени. В этой статье мы рассмотрим прогнозирование в Excel при помощи очень мощного и удобного инструмента — встроенных статистических функций ЛИНЕЙН и ЛГРФПРИБЛ.
Не пугайтесь «умных» терминов! Все, на самом деле, не так страшно, как кажется вначале! Не пожалейте время и прочтите эту статью внимательно до конца. Умение применять на практике эти функции существенно увеличит ваш «вес» как специалиста в глазах коллег, руководителей и в своих собственных глазах!
В одной из самых популярных статей этого блога подробно рассказано об аппроксимации функции одной переменной в Excel (рекомендую прочесть). Но в реальных жизненных процессах результат, как правило, зависит от многих независимых друг от друга факторов (переменных). Как выявить и учесть все эти факторы, связать их воедино и на основании накопленных статистических данных спрогнозировать расчетный конечный результат для некоего нового набора исходных параметров? Как оценить достоверность прогноза и степень влияния на результат каждой из переменных? Ответы на эти и другие вопросы – далее в тексте статьи.
Что можно научиться прогнозировать? Очень многое! В принципе, можно научиться прогнозировать любые самые разнообразные результаты процессов в повседневной жизни и работе. Всегда, когда возникает вопрос: «А что будет, если…?» зовите на помощь Excel, рассчитывайте прогноз и проверяйте его достоверность!
Можно научиться прогнозировать зависимость прибыли от цены и объемов продаж любого товара.
Можно научиться прогнозировать зависимость цены автомобилей на вторичном рынке от марки, мощности, комплектации, года выпуска, количества предыдущих владельцев, пробега.
Можно научиться устанавливать зависимость объемов продаж товаров от затрат на различные виды рекламы.
Можно научиться выполнять прогнозирование в Excel стоимости наборов любых услуг в зависимости от их состава и качества.
В производстве, используя косвенные простые параметры, можно научиться прогнозировать трудоемкость и объем выпускаемой продукции, потребление материалов и энергоресурсов, и т.д.
Прежде чем начать решать практическую задачу, хочу обратить внимание на один весьма важный момент. Научиться выполнять прогнозирование в Excel с использованием вышеназванных функций ЛИНЕЙН и ЛГРФПРИБЛ технически не очень сложно. Гораздо сложнее научиться анализировать процесс, приводящий к результату и находить простые факторы, влияющие на него. При этом желательно (но не обязательно) понимать — КАК зависит результат (функция) от каждого из факторов (переменных). Линейная это зависимость или может быть степенная или какая-нибудь другая? Понимание физического смысла процесса поможет вам правильно выбрать переменные. Подбор аппроксимирующей функции следует производить при полном понимании логики и смысла процесса, приводящего к результату.
Подготовка к прогнозированию в Excel.
1. Четко формулируем название и единицу измерения интересующего нас результата процесса. Это и есть искомая функция — y, аналитическое выражение которой мы будем определять с помощью MS Excel.
В примере, представленном чуть ниже, y— это срок изготовления заказа в рабочих днях.
2. Производим анализ процесса и выявляем факторы — аргументы функции — x1, x2, … xn — наиболее сильно на наш взгляд влияющие на результат – значения функции y. Внимательно назначаем единицы измерений для переменных.
В примере это:
x1 — суммарная длина всех прокатных профилей в метрах, из которых изготавливается заказ
x2 — общая масса всех прокатных профилей в килограммах
x3 — суммарная площадь всех листов в метрах квадратных
x4 — общая масса всех листов в килограммах
3. Собираем статистику – фактические данные – в виде таблицы.
В примере – это фактические данные о металлопрокате и фактических сроках выполненных ранее заказов.
Очень важно при выборе переменных x1, x2, … xn учесть их доступность. То есть, значения этих факторов должны быть у вас в виде достоверных статистических данных. Очень желательно, чтобы получение значений статистических данных было простым, понятным и нетрудоемким процессом.
Прогнозирование в Excel сроков изготовления заказов.
Переходим непосредственно к рассмотрению примера.
Небольшой участок завода производит строительные металлоконструкции. Входным сырьем является листовой и профильный металлопрокат. Мощность участка в рассматриваемом периоде времени неизменна. В наличии есть статистические данные о сроках изготовления 13-и заказов (k=13) и количестве использованного металлопроката. Попробуем найти зависимость срока изготовления заказа от суммарной длины и массы профильного проката и суммарной площади и массы листового проката.
В рассмотренном примере срок изготовления заказа напрямую зависит от мощности производства (люди, оборудование) и трудоемкости выполнения технологических операций. Но детальные технологические расчеты очень трудоемки и, соответственно, длительны и дороги. Поэтому в качестве аргументов функции выбраны четыре параметра, которые легко и быстро можно посчитать при наличии спецификации металлопроката, и которые косвенно влияют на результат – срок изготовления. В результате анализа была установлена сильнейшая связь между изменениями исходных данных и результатами процесса изготовления металлоконструкций.
Примечательно, что найденная зависимость связывает в одной формуле параметры с различными единицами измерения. Это нормально. Найденные коэффициенты не являются безразмерными. Например, размерность коэффициента b – рабочие дни, а коэффициента m– рабочие дни/м.
1. Запускаем MS Excel и заполняем ячейки B4…F16 таблицы Excel исходными статистическими данными. В столбцы пишем значения переменных xi и фактические значения функции y, располагая данные, относящиеся к одному заказу в одной строке.
2. Так как функции ЛИНЕЙН и ЛГРФПРИБЛ — функции выводящие результаты в виде массива, то их ввод имеет некоторые особенности. Выделяем область размером 5×5 ячеек — ячейки I9…M13. Количество выделенных строк всегда — 5, а количество столбцов должно быть равно количеству переменных xi плюс 1. В нашем случае это: 4+1=5.
3. Нажимаем на клавиатуре клавишу F2 и набираем формулу
в ячейках I9…M13: =ЛИНЕЙН(F4:F16;B4:E16;ИСТИНА;ИСТИНА)
4. После набора формулы необходимо для ее ввода нажать сочетание клавиш Ctrl+Shift+Enter. (Знак «+» нажимать не нужно, в записи он означает, что клавиши нажимаются последовательно при удержании нажатыми всех предыдущих.)
5. Считываем результаты работы функции ЛИНЕЙН в ячейках I9…M13.
Карту, поясняющую значения каких параметров в каких ячейках выводятся, я расположил в ячейках I4…M8 для удобства чтения сверху над массивом значений.
Общий вид уравнения аппроксимирующей функции y, представлен в объединенных ячейках I2…M2.
Значения коэффициентов b, m1, m2, m3, m4 считываем соответственно
в ячейке M9: b=4,38464164
в ячейке L9: m=0,002493053
в ячейке K9: m=0,000101103
в ячейке J9: m=-0,084844006
в ячейке I9: m=0,002428953
6. Для определения расчетных значений функции y — срока изготовления заказа — вводим формулу
в ячейку G4: =$L$9*B4+$K$9*C4+$J$9*D4+$I$9*E4+$M$9 =5,0
y=b+m1*x1+m2*x2+m3*x3+m4*x4
7. Копируем эту формулу во все ячейки столбца от G5 до G17 «протягиванием» и сверяем расчетные значения с фактическими. Совпадение очень хорошее!
8. Предварительные действия все выполнены. Уравнение аппроксимирующей функции y найдено. Пробуем выполнить прогнозирование в Excel срока изготовления нового заказа. Вписываем исходные данные.
8.1. Длину прокатных профилей по проекту x1 в метрах пишем
в ячейку B17:
8.2. Массу прокатных профилей x в килограммах пишем
в ячейку C17:
8.3. Площадь листового проката, используемого в новом заказе по проекту, x3 в метрах квадратных заносим
в ячейку D17:
8.4. Общую массу листового проката x4 в килограммах вписываем
в ячейку E17:
9. Расчетный срок изготовления заказа y в рабочих днях считываем
в ячейке G17: =$L$9*B17+$K$9*C17+$J$9*D17+$I$9*E17+$M$9 =25,4
Прогнозирование в Excel выполнено. На основе статистических данных мы рассчитали предположительный срок выполнения нового заказа — 25,4 рабочих дней. Остается выполнить заказ и сверить фактическое время с прогнозным.
Анализ результатов.
Мы не будем погружаться глубоко в дебри статистических терминов и расчетов, но некоторых практических аспектов все же придется коснуться.
Обратимся к другим данным в массиве, которые вывела функция ЛИНЕЙН.
Во второй строке массива в ячейках I10…M10 выведены стандартные ошибки se4, se3, se2, se1, seb для расположенных выше в первой строке массива соответствующих коэффициентов уравнения аппроксимирующей функции m, m, m, m, b.
В третьей строке в ячейке I11 выведено значение коэффициента множественной детерминации r2, а в ячейке J11 — стандартная ошибка для функции — sey.
В четвертой строке в ячейке I12 находится, так называемое F-наблюдаемое значение, а в ячейке J12 — df – количество степеней свободы.
Наконец, в пятой строке в ячейках I13 и J13 соответственно размещены ssreg — регрессионная сумма квадратов и ssresid — остаточная сумма квадратов.
На что следует в регрессионной статистике обратить особое внимание? Что для нас наиболее важно?
1. На сколько достоверно прогнозирует срок изготовления полученное уравнение функции y? При высокой достоверности аппроксимации значение коэффициента детерминации r2 близко к максимуму — к 1! Если r2tкрит, то это означает, что все выбранные переменные xi полезны при расчете сроков изготовления заказов – y.
Наиболее значимой переменной при прогнозировании в Excel сроков изготовления заказов y является x4, так как |t|>|t|>|t|>|t|.
3. Не является ли случайным полученное значение коэффициента детерминации r2? Проверим это, используя F-статистику (распределение Фишера), которая характеризует «неслучайность» высокого значения коэффициента r2.
3.1. F-наблюдаемое значение считываем
в ячейке I12:
3.2. F-распределение имеет степени свободы v1 и v2.
v1=k— df-1=13-8-1=4
v2=df=8
Рассчитаем вероятность получения значения F-распределения большего, чем F-наблюдаемое
в ячейке I12: =FРАСП(I12;4;J12) =6,97468*10-13
Так как вероятность получения большего значения F-распределения, чем наблюдаемое чрезвычайно мала, то из этого следует вывод — найденное уравнение функции y можно применять для прогнозирования сроков изготовления заказов. Полученное значение коэффициента детерминации r2 не является случайным!
Заключение.
Применение функции MS Excel ЛГРФПРИБЛ почти не отличается от работы с функцией ЛИНЕЙН кроме вида уравнения искомой функции, которое принимает для рассмотренного примера следующий вид:
y=b*(m1x1)*(m2x2)*(m3x3)*(m4x4)
Статистика множественной регрессии, которую рассчитывает функция ЛГРФПРИБЛ, базируется на линейной модели:
ln (y)=x1*ln (m1)+x2*ln (m1)…+xn*ln (mn)+ln (b)
Это означает, что значения, например, sei нужно сравнивать не с mi, а с ln (mi). (Подробнее об этом почитайте в справке MS Excel.)
Если в результате использования функции ЛГРФПРИБЛ коэффициент детерминации r2 окажется ближе к 1, чем при использовании функции ЛИНЕЙН, то применение аппроксимирующей функции вида
y=b*(mx)*(mx)…*(mnxn),
несомненно, является более целесообразным.
Если прогнозное значение функции y находится вне интервала фактических статистических значений y, то вероятность ошибки прогноза резко возрастает!
Для обеспечения высокой точности прогнозирования в Excel необходима точная и обширная статистическая база данных – информация об известных из практики результатах процессов. Но, даже имея в наличии такую базу, вы не будете застрахованы от ложных предположений и выводов. Процесс прогнозирования коварен и полон неожиданностей! Помните об этом всегда! Глубже вникайте в суть прогнозируемого процесса. Тщательней относитесь к выбору и назначению переменных. На полученные результаты всегда смотрите через «очки скептика». Такой подход поможет избежать серьезных ошибок в важных вопросах.
Для получения информации о выходе новых статей и для скачивания рабочих файлов программ прошу вас подписаться на анонсы в окне, расположенном в конце статьи или в окне вверху страницы.
Отзывы, вопросы и замечания, уважаемые читатели, пишите в комментариях внизу страницы.
ПРОШУ уважающих труд автора СКАЧАТЬ файл ПОСЛЕ ПОДПИСКИ на анонсы статей!
Ссылка на скачивание файла: prognozirovaniye-v-excel (xls 46,5KB).
Другие статьи автора блога
На главную