Основы анализа данных в международных отношениях 22/23 — различия между версиями
м (тест) |
(Первичное заполнение страницы) |
||
| Строка 1: | Строка 1: | ||
| + | == О курсе == | ||
| + | Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательной программы ''«Международные отношения»'' и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. | ||
| + | |||
| + | Дисциплина реализуется с помощью онлайн-курса ''«Статистика для анализа данных»''. | ||
| + | |||
| + | [# Ссылка на ПУД Курса на сайте ОП] | ||
| + | |||
| + | [# Ссылка на ПУД НЭ на сайте ОП] | ||
| + | |||
| + | == Необходимые ссылки == | ||
| + | |||
| + | [# Канал новостей в телеграме] | ||
| + | |||
| + | [# Ссылка на ведомость] | ||
| + | |||
| + | [# Ссылка на онлайн-курс «Статистика для анализа данных»] | ||
| + | |||
| + | [# Спецификация НЭ] | ||
| + | |||
| + | Приложение №17 к ПОПАТКУСу, [https://www.hse.ru/dataculture/exams Порядок организации Независимых экзаменов по Цифровым компетенциям] | ||
| + | |||
| + | == Команда курса == | ||
| + | {| class="wikitable" | ||
| + | |- | ||
| + | ! Группа !! Преподаватель !! Контакты !! Ассистент !! Контакты | ||
| + | |- | ||
| + | | БМО211, [# чат группы в Телеграме] | ||
| + | | Бурова Маргарита || @Burritas || Мохова Елизавета || @SuntAmara | ||
| + | |- | ||
| + | | БМО21#, [# чат группы в Телеграме] | ||
| + | | Маркина Дарья || @MarkinaDaria|| Прохоров Кирилл || @Kirillp001 | ||
| + | |- | ||
| + | | БМО21#, [# чат группы в Телеграме] | ||
| + | | Маркина Дарья || @MarkinaDaria|| Рубанов Владислав || @rubanoww | ||
| + | |- | ||
| + | | БМО21#, [# чат группы в Телеграме] | ||
| + | | Бочарова Александра || @ashebulka|| Капустина Лика || @lika_kapustina | ||
| + | |} | ||
| + | |||
| + | == Материалы курса == | ||
| + | === План курса === | ||
| + | {| class="wikitable" | ||
| + | |- | ||
| + | ! № !! Тема !! Описание | ||
| + | |- | ||
| + | | 1|| '''Введение в инструменты''' || Инструменты для работы с Python. | ||
| + | |- | ||
| + | | 2|| '''Введение в статистику. Базовые манипуляции с данными''' || Фильтрация данных, сортировка данных, использованием функций. | ||
| + | |- | ||
| + | | 3|| '''Типы данных. Создание новых переменных''' || Типы признаков. Создание новых переменных по условию. | ||
| + | |- | ||
| + | | 4 || '''Генеральная совокупность и выборка. Частотные таблицы и распределения''' || Понятия генеральной совокупности, выборки, репрезентативности. Составление частотных таблиц, визуализация частотных таблиц: гистограмма и полигон. Группировка данных и сводные таблицы. | ||
| + | |- | ||
| + | | 5 || '''Описательные статистики: меры центральной тенденции и разброса''' || Методы центральной тенденции (мода, среднее арифметическое, медиана). Меры разброса ( размах, стандартное отклонение, дисперсия, межквартильный размах). Вычисление описательных статистик с группировкой. | ||
| + | |- | ||
| + | | 6 || '''Z-оценка. Выбросы''' || Перевод значений в z-оценки. Работа с пропущенными значениями и с выбросами. | ||
| + | |- | ||
| + | | 7 || '''Корреляция''' || Вычисление коэффициента корреляции Пирсона. Построение уравнения простой линейной регрессии, линия тренда. | ||
| + | |- | ||
| + | | 8 || '''Введение в визуализацию данных''' || Использование простейших визуализаций. Линейный график, столбчатая диаграмма, точечная диаграмма. | ||
| + | |- | ||
| + | | 9 || '''Продвинутая визуализация данных''' || Использование продвинутых методов визуализации данных, создание различных диаграмм. Разведочный анализ данных. Создание интерактивных визуализаций. | ||
| + | |- | ||
| + | | 10 || '''Введение в тестирование гипотез. Непараметрические критерии''' || Основы тестирования гипотез. Использование непараметрических критериев. Критерий согласия Хи-квадрат и критерий независимости Хи-квадрат. | ||
| + | |- | ||
| + | | 11 || '''Параметрические критерии для проверки гипотез''' || Параметрические статистические критерии. Т-тест : одновыборочный, парный, двухвыборочный. | ||
| + | |- | ||
| + | | 12 || '''Линейная регрессия''' || Предпосылки линейной регрессии. Построение уравнения простой и множественной линейной регрессии. Оценка качества построенной модели. | ||
| + | |- | ||
| + | | 13 || '''Логистическая регрессия''' || Введение в логистическую регрессию. Построение предсказаний с использованием логистической регрессии, интерпретация коэффициентов. | ||
| + | |- | ||
| + | | 14 || '''Введение в машинное обучение''' || Основные понятия, связанные с машинным обучением. Решение задачи регрессии и классификации. Оценка качества. | ||
| + | |} | ||
| + | |||
| + | == Правила выставления оценок == | ||
| + | === Формула === | ||
| + | Итог = МИН(10, 0.2*КР1 + 0.2*Экзамен + 0.2*ДЗ + 0.2*Тесты + 0.2*Проект + 0.1*Квизы) | ||
| + | |||
| + | * 0.2 * КР1 | ||
| + | * 0.2 * Экзамен | ||
| + | * 0.2 * ДЗ (среднее арифметическое по 6 дз) | ||
| + | * 0.2 * мини-тесты на семинарах | ||
| + | * 0.2 * исследовательский проект | ||
| + | * 0.1 * Квизы | ||
| + | |||
| + | Округление стандартное арифметическое. Округляется только итоговый результат. | ||
| + | |||
| + | === Правила дедлайнов === | ||
| + | * Домашние задания: дедлайн + поздний дедлайн со штрафом 1 балл за каждый день просрочки. | ||
| + | * Проект: проект не может быть засчитан, если студент не пришел на защиту - даже если проект групповой и защищает группа без студента - непришедшему ставится ноль, или не сдал проект ДО ЗАЩИТЫ в установленное время. | ||
| + | * Контрольные: жёсткий дедлайн. | ||
| + | * Все дедлайны – общие для всего курса. | ||
| + | |||
| + | == Литература == | ||
| + | ==== Рекомендуемая основная литература ==== | ||
| + | * Elementary statistics : a step by step approach, Bluman, A. G., | ||
| + | * Essentials of Statistics for the Behavioral Sciences. Frederick J. Gravetter, Larry B. Wallnau. Wadsworth. | ||
| + | |||
| + | ==== Рекомендуемая дополнительная литература ==== | ||
| + | * Савельев В. Статистика и котики. | ||
| + | |||
| + | |||
[[Категория:Data_Culture]] | [[Категория:Data_Culture]] | ||
[[Категория:Курсы по Анализу данных (DC) в 2022/23 году]] | [[Категория:Курсы по Анализу данных (DC) в 2022/23 году]] | ||
| − | |||
| − | |||
Версия 16:20, 25 августа 2022
Содержание
О курсе
Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательной программы «Международные отношения» и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных.
Дисциплина реализуется с помощью онлайн-курса «Статистика для анализа данных».
[# Ссылка на ПУД Курса на сайте ОП]
[# Ссылка на ПУД НЭ на сайте ОП]
Необходимые ссылки
[# Канал новостей в телеграме]
[# Ссылка на ведомость]
[# Ссылка на онлайн-курс «Статистика для анализа данных»]
[# Спецификация НЭ]
Приложение №17 к ПОПАТКУСу, Порядок организации Независимых экзаменов по Цифровым компетенциям
Команда курса
| Группа | Преподаватель | Контакты | Ассистент | Контакты |
|---|---|---|---|---|
| БМО211, [# чат группы в Телеграме] | Бурова Маргарита | @Burritas | Мохова Елизавета | @SuntAmara |
| БМО21#, [# чат группы в Телеграме] | Маркина Дарья | @MarkinaDaria | Прохоров Кирилл | @Kirillp001 |
| БМО21#, [# чат группы в Телеграме] | Маркина Дарья | @MarkinaDaria | Рубанов Владислав | @rubanoww |
| БМО21#, [# чат группы в Телеграме] | Бочарова Александра | @ashebulka | Капустина Лика | @lika_kapustina |
Материалы курса
План курса
| № | Тема | Описание |
|---|---|---|
| 1 | Введение в инструменты | Инструменты для работы с Python. |
| 2 | Введение в статистику. Базовые манипуляции с данными | Фильтрация данных, сортировка данных, использованием функций. |
| 3 | Типы данных. Создание новых переменных | Типы признаков. Создание новых переменных по условию. |
| 4 | Генеральная совокупность и выборка. Частотные таблицы и распределения | Понятия генеральной совокупности, выборки, репрезентативности. Составление частотных таблиц, визуализация частотных таблиц: гистограмма и полигон. Группировка данных и сводные таблицы. |
| 5 | Описательные статистики: меры центральной тенденции и разброса | Методы центральной тенденции (мода, среднее арифметическое, медиана). Меры разброса ( размах, стандартное отклонение, дисперсия, межквартильный размах). Вычисление описательных статистик с группировкой. |
| 6 | Z-оценка. Выбросы | Перевод значений в z-оценки. Работа с пропущенными значениями и с выбросами. |
| 7 | Корреляция | Вычисление коэффициента корреляции Пирсона. Построение уравнения простой линейной регрессии, линия тренда. |
| 8 | Введение в визуализацию данных | Использование простейших визуализаций. Линейный график, столбчатая диаграмма, точечная диаграмма. |
| 9 | Продвинутая визуализация данных | Использование продвинутых методов визуализации данных, создание различных диаграмм. Разведочный анализ данных. Создание интерактивных визуализаций. |
| 10 | Введение в тестирование гипотез. Непараметрические критерии | Основы тестирования гипотез. Использование непараметрических критериев. Критерий согласия Хи-квадрат и критерий независимости Хи-квадрат. |
| 11 | Параметрические критерии для проверки гипотез | Параметрические статистические критерии. Т-тест : одновыборочный, парный, двухвыборочный. |
| 12 | Линейная регрессия | Предпосылки линейной регрессии. Построение уравнения простой и множественной линейной регрессии. Оценка качества построенной модели. |
| 13 | Логистическая регрессия | Введение в логистическую регрессию. Построение предсказаний с использованием логистической регрессии, интерпретация коэффициентов. |
| 14 | Введение в машинное обучение | Основные понятия, связанные с машинным обучением. Решение задачи регрессии и классификации. Оценка качества. |
Правила выставления оценок
Формула
Итог = МИН(10, 0.2*КР1 + 0.2*Экзамен + 0.2*ДЗ + 0.2*Тесты + 0.2*Проект + 0.1*Квизы)
- 0.2 * КР1
- 0.2 * Экзамен
- 0.2 * ДЗ (среднее арифметическое по 6 дз)
- 0.2 * мини-тесты на семинарах
- 0.2 * исследовательский проект
- 0.1 * Квизы
Округление стандартное арифметическое. Округляется только итоговый результат.
Правила дедлайнов
- Домашние задания: дедлайн + поздний дедлайн со штрафом 1 балл за каждый день просрочки.
- Проект: проект не может быть засчитан, если студент не пришел на защиту - даже если проект групповой и защищает группа без студента - непришедшему ставится ноль, или не сдал проект ДО ЗАЩИТЫ в установленное время.
- Контрольные: жёсткий дедлайн.
- Все дедлайны – общие для всего курса.
Литература
Рекомендуемая основная литература
- Elementary statistics : a step by step approach, Bluman, A. G.,
- Essentials of Statistics for the Behavioral Sciences. Frederick J. Gravetter, Larry B. Wallnau. Wadsworth.
Рекомендуемая дополнительная литература
- Савельев В. Статистика и котики.