Случайная мастерская
Цель нашей мастерской — научить людей, не владеющих математической статистикой, но столкнувшихся с ней по учебе или работе, правильно ее использовать.
Мы рассказываем не просто в какие формулы нужно подставлять числа и какие кнопки нужно нажимать на компьютере, чтобы получить результат, но то, как и почему эти формулы и кнопки работают. Или не работают: у всего есть своя область применения (про это тоже расскажем).
Мы хотим немного спасти этот мир, показав всем интересующимся простую красоту идей теории вероятностей и математической статистики, из которых выросли большинство инструментов анализа данных в современной науке, бизнесе, маркетинге, медицине и много ещё где.
Наш желанный результат — чтобы по окончании мастерской участники не только уверенно владели основами математической статистики и могли ими пользоваться на практике, но и чувствовали бы себя комфортно, изучая её дальше уже самостоятельно.
Кто вы?
Студент старших курсов или молодой ученый из естественнонаучной области, который уже столкнулся в своей жизни с математической статистикой и ощутил всю боль от этого столкновения на практике: во время написания диплома, диссертации, статьи, гранта, отчета или какого-то иного труда.
Неважно, помните ли вы начала математического анализа или какой-нибудь язык программирования — это не имеет значения и никак не скажется на успеваемости в усвоении программы мастерской.
Кто мы?
Наша команда наполовину состоит из математиков, а наполовину из естественников, использующих математику, и этим мы достигаем баланса между уходом в сложную теорию и упрощением программы до набора примеров на все случаи жизни.
Что будет в программе, а чего в ней не будет?
На мастерской мы не будем уделять много времени вопросам анализа данных — их загрузке, фильтрации, препроцессингу, визуализации, поиску утечек, аномалий и т.д. Однако, мы будем изучать как работают инструменты для анализа данных, например:
Как и почему работают статистические критерии? Какие условия их применения? Как быть если эти условия нарушаются?
Что такое Центральная предельная теорема и как она работает при тестировании гипотез?
Что такое p-value, почему эта величина должна быть меньше 0.05 и как подходить к её интерпретации?
Чем критерии типа Манна-Уитни отличаются от критериев типа Стьюдента по постановке задачи и по интерпретации результатов?
Как формулируются задачи регрессии? Каковы условия использования регрессий, свойства и интерпретации их коэффициентов? Как оценить качество моделей и при чем тут машинное обучение?
К окончанию мастерской мы обязательно найдем ответы на эти и некоторые другие важные вопросы.
Почему это важно?
Сегодня есть огромное множество пакетов и решений (SPSS, Statistica, Stata, R, Python, Excel на крайний случай), в среде которых мы нажатием пары кнопок можем вмиг провести хитроумный анализ. Это привело к ускорению работы, но одновременно к снижению понимания принципов используемых математических инструментов и, как следствие, к снижению критического осмысления результатов не только своих, но и чужих исследований.
Поэтому мы в первую очередь ориентированы на понимание, и уже потом — на использование.
Послесловие
Конечно же, чуть меньше чем за две недели мы не сделаем из вас гуру математической статистики. Но, мы изучим ее базовые методы и приёмы, чтобы помочь вам пройти самую трудную часть пути к полному пониманию предмета — начало.