Краткое введение в основы машинного обучения. Терминология, виды задач, решаемых машинным обучением. Этапы процесса машинного обучения, виды моделей и метрики качества.
Анализ нормальности распределения STATISTICA. Как провести анализ нормальности распределения данных в программе STATISTICA. Содержание: нормальное распределение, график кривой Гаусса, асимметрия, эксцесс, стандартная ошибка асимметрии, стандартная ошибка эксцесса, частотные гистограммы, ящичные диаграммы, нормально-вероятностные графики, критерий Колмогорова-Смирнова, критерий Шапиро-Уилка в Статистике.
1. Введение
1.1 Общая информация о курсе
1.2 Генеральная совокупность и выборка
1.3 Типы переменных. Количественные и номинативные переменные
1.4 Меры центральной тенденции
1.5 Меры изменчивости
1.6 Квартили распределения и график box-plot
1.7 Нормальное распределение
1.8 Центральная предельная теорема
1.9 Доверительные интервалы для среднего
1.10 Идея статистического вывода, p-уровень значимости
Анатолий Карпов — выпускник факультета психологии СПбГУ, научный сотрудник, аспирант кафедры общей психологии СПбГУ. Занимается экспериментальными исследованиями в области когнитивной психологии. Преподает курс математической статистики для биологов в Институте биоинформатики.
Курс вводный и рассчитан на слушателей, не обладающих специализированными знаниями в области математики. Он подойдет как тем, кто только начинают познавать тонкости математической статистики, так и тем, у кого уже есть некоторый опыт обработки и анализа данных.
В рамках курса рассматриваются подходы к описанию получаемых в исследованиях данных, основные методы и принципы статистического анализа, интерпретация и визуализация получаемых результатов. Слушатели познакомятся с такими методами статистического анализа как дисперсионный, регрессионный и кластерный анализ. Мы научимся сравнивать группы между собой, рассчитывать коэффициенты корреляции и строить регрессионные уравнения.
Основной акцент делается на математических идеях, интуиции и логике, которые обуславливают методы и расчетные формулы. Изученный материал будет применим для решения широкого круга задач, возникающих в рамках исследовательской работы практически любого направления.
Курс подготовлен на базе программы Института биоинформатики.
Опираясь на концепцию открытых данных, государство делится с гражданами информацией. В России концепцией начали пользоваться в 2013 году, и до недавнего времени она оставалась малоизвестной, хотя в мире давно популярна. Елена расскажет, почему Python и открытые данные тесно связаны друг с другом и какие интересные задачи ждут питонистов в этой области. А также будет немного инсайда о том, какие открытые данные создают наши государственные органы и как в этом можно поучаствовать.
Долгожданный выпуск о популярном ныне языке Python.
В гостях разработчик компании Todoist и просто крутой парень — Олег Шидловский.
В рамках интервью мы пообщались про олимпиадное программирование, про фишки языка, про асинхронность, про популярные фреймворки django, twisted, tornado, flask, SQLAlchemy, про machine learning
Модель нейрона. Активационная функция. Сети прямого распространения. Архитектура нейронной сети. Коннективизм. Обучение нейронной сети. Обратное распространение ошибки. Метод скорейшего спуска. Эпохи и batchи. Инициализация нейронной сети. Пример: задача Обучающее или. Библиотека Neuralnet. Пороговое значение.
Лекция №1 в курсе «Анализ данных на R в примерах и задачах, часть 2» (весна 2017).
Преподаватель курса: Вадим Леонардович Аббакумов
Страница лекции на сайте CS центра: goo.gl/JH1KPD
Лекции курса по порядку: www.youtube.com/watch?v=orgXajB6z58
В этом видео пойдет речь о ключевых понятиях для описания количественных непрерывных данных с нормальным распределением. Будут затронуты такие понятия, как:
-Вероятность,
-Случайные виличины,
-Вариационныя ряд,
-Разобраны примеры описания вариационного ряда,
-Правило трех сигм
-Нормальное распределение,
-Стандартное отклонение.
Статьи полезные материалы здесь: lit-review.ru/biostatistika/
Ведущий:
Кирилл Мильчаков, доцент Высшей школы управления здравоохранением ПМГМУ им. И.М. Сеченова, научный директор НМА Литобзор.
Запрос консультации и предложения о сотрудничестве: info@lit-review.ru
Заказчики (клиенты, руководители) хотят видеть красивые отчеты, а не длинные таблицы. Проблема — как визуализировать данные, чтобы заказчику «понравилось»? Ведь топ-менеджер не поставит подробную задачу, какие KPI, в каком виде показать в отчете, и что для него значит «красиво».
Во-первых, визуализация отчетов — это уже не вопрос творчества, а вопрос логики, понимания структуры данных. Я расскажу о матрице выбора диаграмм и чеклистах, с которыми вы будете понятно и наглядно показывать информацию для принятия решений. Начиная от офисной графики до продвинутой визуализации.
Во-вторых, технологии дали новый носитель – дашборды (информационные панели). Я разберу типовые ошибки их построения, дам правила и лучшие практики из 10-летнего опыта внедрения BI-проектов. И покажу, как на дашборде провожу совещание отдела продаж, при вас построю годовой отчет службы HelpDesk.