Data Analysis Toolpak в Excel - это надстройка в Excel, которая позволяет нам выполнять анализ данных и различные другие важные вычисления. Эта надстройка не включена по умолчанию в Excel, и мы должны вручную включить ее на вкладке "Файл" в разделе "Параметры", затем на вкладке "Надстройки" мы нажимаем на "Управление надстройками", затем отмечаем Analysis Toolpak, чтобы иметь возможность использовать его в Excel.
Шаги по загрузке надстройки Data Analysis Toolpak
- Шаг 1 - Нажмите "Файл.
- Шаг 2 - Нажмите на "Опции" из списка.
- Шаг 3 - Нажмите на "Дополнения", а затем выберите "Дополнения Excel" для "Управления". Нажмите кнопку "Go".
- Шаг 4 - В разделе "Дополнения Excel" появится диалоговое окно со списком дополнений. Выберите "Analysis Toolkit" и нажмите "OK".
- Шаг 5 - Команда "Анализ данных" появится на вкладке данные" в Excel в крайнем правом углу ленты, как показано ниже.
Список функций, доступных в пакете инструментов анализа данных Excel
Ниже приведен список доступных функций в надстройке Excel Toolpak для анализа:
- ANOVA: Одномерный анализ в Excel
- Корреляция в Excel
- Баллы и процентили в Excel
- Описательная статистика в Excel
Теперь давайте обсудим каждый из них в деталях -.
# 1 — ANOVA: однофакторный анализ в Excel
ANOVA (дисперсионный анализ) - это первый набор опций, доступных в надстройке Excel Toolpak для анализа. В одностороннем ANOVA мы анализируем, существует ли статистическая разница между средними значениями трех или более независимых групп. Нулевая гипотеза заключается в том, что в наборе данных наблюдений нет статистической значимости. Мы проверяем эту гипотезу, проверяя p-значение.
Давайте разберем это на примере ANOVA в excel.
пример
Предположим, у нас есть следующие данные эксперимента, проведенного для проверки: "Можно ли восстановить самоконтроль во время опьянения?". Мы разделили 44 мужчин на 4 равные группы, по 11 мужчин в каждой группе.
- Группа А получила 0,62 мг/кг алкоголя.
- Группа АС получала алкоголь плюс кофеин.
- Группа АР получала алкоголь и денежное вознаграждение за выполнение задания.
- Группа P получала плацебо.
Баллы были зарегистрированы для основной задачи на вознаграждение, которая включала "контролируемые (с усилием) процессы памяти", и результат был следующим:
Нам нужно проверить нулевую гипотезу о том, что все средние равны (нет значимых различий).
Как провести тест ANOVA?
Чтобы провести односторонний тест ANOVA, нам необходимо выполнить следующие шаги:
- Шаг 1: Нажмите на команду 'Анализ данных', доступную на вкладке 'Данные' в разделе 'Анализ'.
- Шаг 2: Выберите "Anova: Однофакторный" из списка и нажмите "ОК".
- Шаг 3: Вы получите сообщение "Anova: Единый фактор". Нам нужно выбрать диапазон ввода в качестве данных заголовка столбца.
- Шаг 4: Поскольку мы взяли заголовки столбцов в нашем выборе, нам нужен флажок "Ярлыки в первой строке".
- Шаг 5: Мы выбрали F1 для выходного диапазона. Пожалуйста, нажмите "OK".
Теперь мы имеем дело с анализом ANOVA.
Чем больше значение F-статистики в Excel, тем больше вероятность того, что группы имеют разные средние, что отвергает нулевую гипотезу о том, что все средние равны. F-статистика больше критического значения эквивалентна p-значению в Excel меньше альфа, и оба значения означают, что мы отвергаем нулевую гипотезу. Исходя из этого, можно сделать вывод, что между группами существует значительная разница.
# 2 — Корреляция в Excel
Корреляция - это статистическая мера, доступная в надстройке Excel Toolpak для анализа и показывающая степень, в которой две или более переменных изменяются вместе. Положительная корреляция в Excel указывает на степень параллельного увеличения или уменьшения этих переменных. Отрицательная корреляция указывает на то, что одна переменная увеличивается, а другая уменьшается.
Вы можете скачать этот шаблон Excel ToolPak здесь - Шаблон Excel ToolPak для анализа
пример
У нас есть следующие данные, касающиеся расходов на рекламу и продаж компании. Мы хотим найти корреляцию между этими двумя показателями, чтобы составить соответствующий бюджет и ожидать продаж (установить цель, учитывая и другие факторы).
Как найти корреляцию между двумя наборами переменных?
Чтобы выяснить корреляцию между двумя наборами переменных, мы выполним следующие действия:
- Шаг 1: Нажмите на "Анализ данных" в группе "Анализ", доступной в разделе "Данные".
- Шаг 2: Выберите "Корреляция" из списка и нажмите "OK".
- Шаг 3: Выберите "$ A $ 1: $ B $ 16" в качестве входного диапазона и $ F $ 1 в качестве выходного диапазона. Установите флажок 'Labels in first row', потому что у нас есть заголовки столбцов в нашем диапазоне ввода и потому что у нас есть разные заголовки в другом столбце. Мы выбрали 'Columns' для 'Grouped by'.
- Шаг 4: Выберите диапазон вывода и нажмите 'OK'.
- Получаем результат.
Как мы видим, корреляция между затратами на рекламу (заголовок столбца) и продажами (заголовок строки) составляет примерно +0,86274, что свидетельствует о положительной корреляции и составляет 86,27%. Теперь мы можем определить рекламный бюджет и ожидаемые продажи соответственно.
# 3 — Рейтинг и процентиль в Excel
Процентиль в Excel - это число, когда определенный процент оценок ниже этого числа, и он доступен в надстройке Excel Toolpak для анализа. Например, если результат находится в 90-м процентиле, это означает, что студент набрал больше, чем 90% участников теста. Давайте разберем это на примере.
пример
У нас есть следующие данные об оценках, полученных студентом в классе.
Мы хотим найти ранг и процентиль для каждого студента.
Как найти ранг и процентиль?
Шаги будут выглядеть следующим образом:
- Шаг 1: Нажмите на "Анализ данных" в группе "Анализ", доступной в разделе "Данные".
- Шаг 2: Выберите из списка 'Rank and percentile', затем нажмите 'OK'.
- Шаг 3: Выберите '$ B $ 1: B $ 17' в качестве входного диапазона и '$ D $ 1' в качестве выходного диапазона.
- Шаг 4: Поскольку у нас заголовки полей данных расположены в столбцах, что означает, что данные группируются по столбцам, нам нужно выбрать "Столбцы" для "Группировать по".
- Шаг 5: Мы выбрали заголовок столбца в нашем диапазоне ввода; поэтому нам нужно выбрать "Ярлыки в первой строке", а затем нажать "OK".
- Мы получили результат, как на следующем изображении.
# 4 — Описательная статистика в Excel
Описательная статистика, включенная в надстройку Excel Toolpak для анализа, содержит следующую информацию о выборке:
- Mainstream
- Среднее значение: Это называется средним значением.
- Медиана: Это середина распределения.
- Режим: Это наиболее часто встречающийся номер.
- Меры изменчивости
- Спектр: Это разница между самой большой и самой маленькой переменной.
- Разница: Это показывает, насколько далеко друг от друга находятся цифры.
- Стандартное отклонение: Это показывает, насколько сильно отклонение от среднего/среднего значения.
- Асимметрия: Это говорит о том, насколько симметрично распределение переменной.
- Перекос: показывает, насколько пикообразным или плоским является распределение.
пример
Ниже приведены результаты, полученные студентами по предмету экономика. Мы хотим получить описательную статистику.
Чтобы сделать то же самое, выполните следующие действия:
- Шаг 1: Нажмите на команду "Анализ данных", доступную в группе "Анализ" на вкладке "Данные".
- Шаг 2: Выберите "Описательная статистика" из списка и нажмите "ОК".
- Шаг 3: Выберите 'US$1: $15 Australian' в качестве диапазона ввода, выберите 'Columns' для 'Grouped by, ' выберите 'Labels in first row',
- Шаг 4: Выберите '$ C $ 1' в качестве диапазона вывода и убедитесь, что мы поставили галочку в поле "Сводная статистика". Нажмите 'OK'.