не мысленный эксперимент

Во вложении экселевский файлик, в котором я рассчитал по указанной формуле суммарную дисперсию для недель и дней на одном и том же массиве. Придерживаясь рекомендаций я выбрал такое количество дней и для периода поставки и для отклонения, которые давали бы целое число недель, однако итоговые значения суммарной дисперсии всё равно не сходятся...

если я правильно понял, вопрос в том, почему они не сошлись?

тогда ответ в том, что мы имеем дело с выборкой, а не с генеральной совокупностью. проверить очень просто: в ячейку R73C3 вставить формулу =RC[-1]*SQRT(7). если бы была генеральная совокупность, именно такое значение отклонения мы бы получили :)

In reply to by stanley

если посчитать отклонение по дням по формуле стандартного отклонения по генеральной совокупности получается 28,21.  28,27 * корень(7) = 74,63  Что больше чем отклонение по неделям, посчитанное по формуле стандартного отклонения по генеральной совокупности (73,35).

Если в суммарное отклонение недель подставить 74,63,  то результат будет такой же, как если считать по дням 366,62

Может это связано с тем, что данные по неделям имеет меньший разброс данных? Ведь 73,35<74,63

А ещё интересно, как играет это "-1 в знаменателе" в формуле стандартного отклонения по выборке, ведь вывод формулы суммарного отклонение сделан именно по СКО генеральной совокупности. Может и в расчётах тогда ей пользоваться?

In reply to by Дмитрий_Л

[quote=Дмитрий_Л]

если посчитать отклонение по дням по формуле стандартного отклонения по генеральной совокупности получается 28,21.  28,27 * корень(7) = 74,63  Что больше чем отклонение по неделям, посчитанное по формуле стандартного отклонения по генеральной совокупности (73,35).

[/quote]

так 28.21 или 28.27?

[quote]

Если в суммарное отклонение недель подставить 74,63,  то результат будет такой же, как если считать по дням 366,62

Может это связано с тем, что данные по неделям имеет меньший разброс данных? Ведь 73,35<74,63

А ещё интересно, как играет это "-1 в знаменателе" в формуле стандартного отклонения по выборке, ведь вывод формулы суммарного отклонение сделан именно по СКО генеральной совокупности. Может и в расчётах тогда ей пользоваться?

[/quote]

мало что понял.
там и так -1, stddev именно так считает, насколько я помню.

в таблице использована генеральная совокупность с равномерным распределением в диапазоне [0;100]. как написано в справочнике, среднее значение в этом случае 50, отклонение ~28.87.
в данном примере берется случайная выборка из 70 значений, реально получаемые значения можно наблюдать. не забудь, при любом изменении листа исходный ряд генерируется заново. можно поставить указатель на пустую ячейку и нажимать del, наблюдая великое чудо непредсказуемости Вселенной :)

In reply to by stanley

[quote=stanley]

так 28.21 или 28.27?

[/quote]

оказалось именно то самое  великое чудо непредсказуемости Вселенной :)

Но все же - суммарное отклонение расчитанное через ско по дням всё время больше, через ско по неделям. 

[quote=stanley]

мало что понял.
там и так -1, stddev именно так считает, насколько я помню.
 

[/quote]

В листе ско по дням и неделям посчитано по выборке. Формула сммарное отклонения  - видел примеры с расчётом с использованем ско, как по выборке, так и по генеральной совокупности, кто-то говорит, что вообще нет принципиальной разницы, хотя продажи ведь и есть именно выборка. Но в любом случае, отклонение по дням больше, если была бы статистика по часам, то по часам отклонение было бы ещё больше.

в ячейку R73C3 вставить формулу =RC[-1]*SQRT(7)  -  втавил и получил СКО большее, чем по неделям. Не понял, как это связано с генеральной совокупностью? Если посчитать СКО по дням и по неделям по формуле генеральной совокупности и дневную умножить на корень(7), то опять получим значение больше, чем СКО по неделям.

 

In reply to by Дмитрий_Л

[quote=Дмитрий_Л]

Но все же - суммарное отклонение расчитанное через ско по дням всё время больше, через ско по неделям. 

[/quote]
относительное? так и должно быть, чем больше период агрегирования, тем больше сглаживаются флуктуации. если это стационарный процесс, во всяком случае.

[quote]
в ячейку R73C3 вставить формулу =RC[-1]*SQRT(7)  -  втавил и получил СКО большее, чем по неделям. Не понял, как это связано с генеральной совокупностью? Если посчитать СКО по дням и по неделям по формуле генеральной совокупности и дневную умножить на корень(7), то опять получим значение больше, чем СКО по неделям.

[/quote]

если вставить эту формулу, итоговые значения суммарной дисперсии (те, что справа) становятся одинаковыми. я только об этом говорил, как иллюстрация.

In reply to by RazVal

[quote=RazVal]

Нет, я не понял, почему нельзя использовать данную формулу для дробных (не натуральных ;0) значений недель? Расхождения итогов от этого не происходит.

[/quote]

с математической точки зрения - потому, что число слагаемых не может быть ненатуральным.

по жизни - если продажи за неделю составили 10 шт, мы ничего не можем сказать про продажи за полнедели, это любое число [0;10].