Статистические расчеты
Статистические расчеты
- Статистические расчеты — пакет Statistics
- Построение гистограмм
- Статистика распределен и и
- Статистическая обработка данных
- Сглаживание данных
- Регрессия различного вида
В ядре системы Mathematica практически нет статистических функций. Зато пакет расширения Statistics дает сотни функций, охватывающих практически все разделы теоретической и прикладной статистики. Тем не менее, вопрос о привлечении универсальных математических систем к выполнению серьезных математических расчетов является спорным из-за существования множества специальных статистических компьютерных систем, таких как Statistica, StatGraphics и т. д.
Большинство специализированных статистических программ предлагают специальный интерфейс, базирующийся на обработке табличных данных большого объема, реализуют многовариантный расчет необходимых статистических параметров (например, регрессию сразу по десяткам формул) и отсев заведомо ошибочных данных. Поэтому при статистических расчетах применение подобных программ предпочтительно.
Статистические расчеты— пакет Statistics
Учитывая ограниченный объем книги и приведенные выше обстоятельства, данный раздел не содержит исчерпывающего описания всех сотен функций расширения Statiatics, а лишь дает обзор этого пакета с описанием наиболее часто используемых средств статистики, относящихся к обработке данных. Это не слишком снижает ценность описания, поскольку функции статистики по большей части просты и имеют вполне очевидные (для специалистов) имена.
Состав пакета Statistics
Пакет расширения Statistics содержит следующие подпакеты:
- Confidencelntervals — функции доверительных интервалов;
- ContinuousDistributions — функции непрерывных распределений;
- DataManipulation — манипуляции с данными;
- DataSmoothing — сглаживание данных;
- DescriptiveStatistics — статистика распределений;
- DiscreteDistributions — функции дискретных распределений;
- HypothesisTests — проверка статистических гипотез;
- LinearRegression — линейная регрессия;
- MultiDescriptiveStatistics — статистика многомерных распределений;
- MultinormalDistribution — функции многомерных нормальных распределений;
- NonlinearFit — нелинейная регрессия;
- NormalDistribution — функции нормального распределения;
- Common — данные общего характера.
Как и ранее, для работы каждого из подпакетов требуется его загрузка в память компьютера с помощью команды
<<Statistics`Имя_подпакета`
Имена подпакетов расширения статистики приведены выше.
Манипуляции с данными — DataManipulation
Статистические данные обычно бывают представлены в виде списков — как одномерных, так и двумерных (таблиц и матриц) и даже многомерных. Большая часть функций, обеспечивающих манипуляции с данными, сосредоточена в подпакете DataManipulation.
Данные могут вводиться в строках ввода или считываться из файлов с помощью функции ReadList. Для манипуляций с данными могут использоваться многие функции ядра системы, описанные ранее, — в частности, все функции обработки списков. Подпакет DataManipulation дает ряд удобных функций. Ниже представлена первая группа таких функций:
- Column [data, n] — возвращает n-й столбец списка data;
- Column [data, {nl, n2,…}] — возвращает список из столбцов ni списка данных;
- ColumnTake [data, spec] — возвращает столбцы списка data с данной спецификацией spec;
- ColumnDrop [data, spec] — удаляет столбцы списка data с данной спецификацией spec;
- Column Jo in [datal, data2,…] — объединяет столбцы списков datai;
- RowJoin [datal, data2,…] — объединяет строки списков datai;
- DropNonNumeric [data] — удаляет из списка data нечисловые элементы;
- DropNonNumericColumnfdata] — удаляет из списка data столбцы с нечисловыми элементами.
Примеры применения этих функций:
<<Statistics`DataManipulation `
data = {{а, 3}, {b, 6}, {с, 4}, {d, i},
{e, 5}, {i 4}}
{{a, 3}, {b, 6}, {c, 4}, {d, i}, {e, 5), {f, 4}}
col2 = Column[data, 2]
{3, 6, 4/i, 5, 4}
newdata = DropNonNumeric[col2]
{3, 6, 4, 5, 4}
Полезны также следующие функции подпакета:
- BooleanSelect [list, sel] — удаляет из list элементы, которые дают True при тестировании выражения sel;
- TakeWhile [list,pred] — удаляет из list все элементы, начиная с того, для которого pred дает True;
- LengthWhile [list,pred] — возвращает число элементов, которые были удалены после того, как pred дало значение True (отсчет с начала списка).
Примеры применения этих функций:
TakeWhile[col2, NumberQ]
(3,6, 4}
LengthWhile[col2, NumberQ]
3