Читать Математика для DATA SCIENTIST. Анализ данных и математическое моделирование (путеводитель)

Шрифт

Интервал

ISBN 978-5-0053-4495-3

Создано в интеллектуальной издательской системе Ridero

Математика (Математическое обучение) для DATA SCIENTIST

Предисловие

Когда спрашивают – зачем DATA SCIENTIST’у дифференциальные уравнения, можно вспомнить графики Курта Воннегута в координатах (время по оси Х, уровень счастья-несчастья по оси Y).

https://www.youtube.com/watch?v=EEL-PIZVO08

Например, постепенное затухание жизненных сил описывается кратко и понятно одной формулой exp (-k* t), которую сразу видно на графике, где t – время, а что может быть понятнее этой переменной? Или атомный взрыв- той же экспонентой, только с положительным аргументом exp (k*t), качания на качелях или супружескую эмоциональную жизнь – одним уравнением x’' = – k*x. И траекторией y= sin (t). Как тут не вспомнить один из лучших учебников по Микроэкономике Вэриана, где автор долго и добросовестно уговаривает американцев выучить производные, чтобы одной строчкой записывать то, что иначе надо на целую страницу разъяснять.

Совсем недавно мне нужно было консультировать магистерскую диссертацию по «Применение DATA SCIENCE в классификации архетипов американских киносценариев», там была взята за основу тройка хэппи-ендов и тройка трагедий в тех же координатах, что и у Курта Воннегута.

Теперь давайте предположим, что у нас есть случайная величина Z по всему сценарию как оценка (счастья-несчастья) в данный момент времени t. Ну и соответственно выборка Z (n). Как нам найти главного героя? Если есть только реплики? Я предложил ввести аналогичные Х1 (t), X2 (t) и т. д. Конечно, чтобы определить главного героя DATA SCIENCE будем вычислять ковариацию и/или корреляцию corr (Z, Xi). То есть достаточно всего одного числа – по выборке. А как определить врага главного героя? Надо искать отрицательную максимальную корреляцию. А если корреляция близка к нолю? Это кто, как вы думаете, Уважаемый Читатель? Вот вам и потребность в Теории вероятностей и Корреляционном анализе для DATA SCIENTIST.

Иногда также сомневаются в нужности Векторной алгебры и даже матриц, но это снимается теми соображениями, что бальшие массивы данных частно необходимо делить на блоки с малыми связями, как бы нарезать подмножества из всего большого множества. А также уметь смотреть под разными углами или с разных точек зрения. Но ведь это не что иное, как замена базиса пространства и определение ортогональных подпространств меньшей размерности. Вообще говоря, Линейная алгебра – должна быть в преподавании доведена до максимальной степени простоты и это только улучшает ее понимание учащимися.

Что касается предмета «Математический анализ бесконечно малых переменных величин», то мне трудно представить начинающего DATA SCIENTISTa, кто бы сомневался в необходимости этого фундаментального раздела высшей математики.

1. Алгебра

1.1 Комплексные числа. Геометрическое представление, алгебраическая и тригонометрическая форма записи, извлечение корней, корни из минус единицы.

1.2 Метод Жордано-Гаусса к системам линейных уравнений. Прямоугольные матрицы как способ представления систем линейных уравнений. Приведение матриц и систем линейных уравнений к ступенчатому виду. Самый простой и надежный метод.