Краткое введение в основы машинного обучения. Терминология, виды задач, решаемых машинным обучением. Этапы процесса машинного обучения, виды моделей и метрики качества.
Анализ нормальности распределения STATISTICA. Как провести анализ нормальности распределения данных в программе STATISTICA. Содержание: нормальное распределение, график кривой Гаусса, асимметрия, эксцесс, стандартная ошибка асимметрии, стандартная ошибка эксцесса, частотные гистограммы, ящичные диаграммы, нормально-вероятностные графики, критерий Колмогорова-Смирнова, критерий Шапиро-Уилка в Статистике.
1. Введение
1.1 Общая информация о курсе
1.2 Генеральная совокупность и выборка
1.3 Типы переменных. Количественные и номинативные переменные
1.4 Меры центральной тенденции
1.5 Меры изменчивости
1.6 Квартили распределения и график box-plot
1.7 Нормальное распределение
1.8 Центральная предельная теорема
1.9 Доверительные интервалы для среднего
1.10 Идея статистического вывода, p-уровень значимости
Анатолий Карпов — выпускник факультета психологии СПбГУ, научный сотрудник, аспирант кафедры общей психологии СПбГУ. Занимается экспериментальными исследованиями в области когнитивной психологии. Преподает курс математической статистики для биологов в Институте биоинформатики.
Курс вводный и рассчитан на слушателей, не обладающих специализированными знаниями в области математики. Он подойдет как тем, кто только начинают познавать тонкости математической статистики, так и тем, у кого уже есть некоторый опыт обработки и анализа данных.
В рамках курса рассматриваются подходы к описанию получаемых в исследованиях данных, основные методы и принципы статистического анализа, интерпретация и визуализация получаемых результатов. Слушатели познакомятся с такими методами статистического анализа как дисперсионный, регрессионный и кластерный анализ. Мы научимся сравнивать группы между собой, рассчитывать коэффициенты корреляции и строить регрессионные уравнения.
Основной акцент делается на математических идеях, интуиции и логике, которые обуславливают методы и расчетные формулы. Изученный материал будет применим для решения широкого круга задач, возникающих в рамках исследовательской работы практически любого направления.
Курс подготовлен на базе программы Института биоинформатики.
Опираясь на концепцию открытых данных, государство делится с гражданами информацией. В России концепцией начали пользоваться в 2013 году, и до недавнего времени она оставалась малоизвестной, хотя в мире давно популярна. Елена расскажет, почему Python и открытые данные тесно связаны друг с другом и какие интересные задачи ждут питонистов в этой области. А также будет немного инсайда о том, какие открытые данные создают наши государственные органы и как в этом можно поучаствовать.
Долгожданный выпуск о популярном ныне языке Python.
В гостях разработчик компании Todoist и просто крутой парень — Олег Шидловский.
В рамках интервью мы пообщались про олимпиадное программирование, про фишки языка, про асинхронность, про популярные фреймворки django, twisted, tornado, flask, SQLAlchemy, про machine learning
Модель нейрона. Активационная функция. Сети прямого распространения. Архитектура нейронной сети. Коннективизм. Обучение нейронной сети. Обратное распространение ошибки. Метод скорейшего спуска. Эпохи и batchи. Инициализация нейронной сети. Пример: задача Обучающее или. Библиотека Neuralnet. Пороговое значение.
Лекция №1 в курсе «Анализ данных на R в примерах и задачах, часть 2» (весна 2017).
Преподаватель курса: Вадим Леонардович Аббакумов
Страница лекции на сайте CS центра: goo.gl/JH1KPD
Лекции курса по порядку: www.youtube.com/watch?v=orgXajB6z58