Метод к-средних. Датчики случайных чисел, зерно датчика. Визуализация алгоритма метода к-средних. Методы определения числа кластеров. Библиотека NbClust. Каменистая осыпь/локоть. Многомерное шкалирование для визуализации кластеров.
Лекция №4 в курсе «Анализ данных на R в примерах и задачах» (весна 2016).
Преподаватель курса: Вадим Леонардович Аббакумов
Страница лекции на сайте CS центра: goo.gl/s5XUcm
Ссылка на все лекции курса: goo.gl/1VmEdf
курс: Информатика. Алгоритмы и структуры данных на Python 3.
лектор: Хирьянов Тимофей Фёдорович
прочитана 05.09.2017
Темы, рассмотренные на лекции №1:
— Что есть «информатика» и что понимает под этим лектор
— Что значит «уметь программировать»
— Hello, World!
— Концепция присваивания в Python
— Обмен двух переменных значениями через одну временную и две временные переменные.
— Множественное присваивание в кортежи переменных.
— Обмен значений.
— Арифметические операции. Возведение в степень, деление нацело.
— Цикл while. Инструкции управления циклом.
— Вложенный цикл while
— Условный оператор if
— Цикл for и его особенности в Python.
— Функция range()
— Оператор continue
Преподаватели Академии анализа данных StatSoft на реальных примерах продемонстрировали основные методы, необходимые для грамотного проведения медицинского исследования, написания научных публикаций в тематические журналы, а также для статистической проверки квалификационных работ…
Краткое введение в основы машинного обучения. Терминология, виды задач, решаемых машинным обучением. Этапы процесса машинного обучения, виды моделей и метрики качества.
Анализ нормальности распределения STATISTICA. Как провести анализ нормальности распределения данных в программе STATISTICA. Содержание: нормальное распределение, график кривой Гаусса, асимметрия, эксцесс, стандартная ошибка асимметрии, стандартная ошибка эксцесса, частотные гистограммы, ящичные диаграммы, нормально-вероятностные графики, критерий Колмогорова-Смирнова, критерий Шапиро-Уилка в Статистике.
1. Введение
1.1 Общая информация о курсе
1.2 Генеральная совокупность и выборка
1.3 Типы переменных. Количественные и номинативные переменные
1.4 Меры центральной тенденции
1.5 Меры изменчивости
1.6 Квартили распределения и график box-plot
1.7 Нормальное распределение
1.8 Центральная предельная теорема
1.9 Доверительные интервалы для среднего
1.10 Идея статистического вывода, p-уровень значимости
Анатолий Карпов — выпускник факультета психологии СПбГУ, научный сотрудник, аспирант кафедры общей психологии СПбГУ. Занимается экспериментальными исследованиями в области когнитивной психологии. Преподает курс математической статистики для биологов в Институте биоинформатики.
Курс вводный и рассчитан на слушателей, не обладающих специализированными знаниями в области математики. Он подойдет как тем, кто только начинают познавать тонкости математической статистики, так и тем, у кого уже есть некоторый опыт обработки и анализа данных.
В рамках курса рассматриваются подходы к описанию получаемых в исследованиях данных, основные методы и принципы статистического анализа, интерпретация и визуализация получаемых результатов. Слушатели познакомятся с такими методами статистического анализа как дисперсионный, регрессионный и кластерный анализ. Мы научимся сравнивать группы между собой, рассчитывать коэффициенты корреляции и строить регрессионные уравнения.
Основной акцент делается на математических идеях, интуиции и логике, которые обуславливают методы и расчетные формулы. Изученный материал будет применим для решения широкого круга задач, возникающих в рамках исследовательской работы практически любого направления.
Курс подготовлен на базе программы Института биоинформатики.
Опираясь на концепцию открытых данных, государство делится с гражданами информацией. В России концепцией начали пользоваться в 2013 году, и до недавнего времени она оставалась малоизвестной, хотя в мире давно популярна. Елена расскажет, почему Python и открытые данные тесно связаны друг с другом и какие интересные задачи ждут питонистов в этой области. А также будет немного инсайда о том, какие открытые данные создают наши государственные органы и как в этом можно поучаствовать.