Поделиться

Сегодня хотелось бы пробежаться по верхам на тему моей программы мобильности: что такое, какие предметы, немного отличий и перспектив.

О программе

Предлагали нам такое счастье – обзор и бюллетень, но, как часто это бывает, в дороге планы претерпели изменения. У нас программа смешанная: есть курсы со второго курса, а есть с третьего, есть с факультета математики – Ingénierie Mathématiques (IM), а есть с компьютерных наук – Ingénierie des Systèmes de Décision et de Production (ISDP). А первый год куда делся, спросите Вы. А он для подготовки и получения фундамента.

В итоге у меня были такие предметы:

Knowledge Extraction. 3 год ISDP. Вводный курс про интеллектуальный анализ данных текстов, поиск ассоциативных правил, использование решеток для FCA (Formal Concept Analysis) и RCA (Relational Concept Analysis), немного про базы знаний и SPARQL. Зачетом был проект – прочитать научную статью про data mining и подробно рассказать о методологии и результатах.

Statistics in high dimensions. 3 год ISDP. Мы прошлись по тестированию гипотез, критериям выбора оптимальной модели, регрессиям и их регуляризации, уменьшение пространства (например, PCA), общим аддитивным моделям. По окончанию курса нужно было представить проект с большим многомерным набором данных с различными типами данных, подготовить их, применить несколько моделей и выбрать лучшую. Использование новых инструментов приветствовалось, так что применение привычные для нас деревья решения и сети Байеса было встречено на ура 🙂

Анализ переменных из проекта

Optimization. 2 год IM. Тут уже математика с двумя практическим занятиями на matlabe в конце. Мы прошлись по оптимизационным задачам и доказательства существования решения для них, рассмотрели методы их поиска с ограничениями и без, рассмотрели основные градиентные методы, в т.ч. BFGS, вкратце – генетический метод. В конце нас ждал теоретический экзамен, где нужно было искать оптимальные решения и доказывать их существование. Хотя в течении курса у нас было два мини-теста, экзамен был действительно сложный и требовал хорошего понимания теории. Подробнее об особенностях экзаменов в школе можно почитать тут.

Machine learning. 3 год ISDP. Начали с введения в машинное обучение, backpropagation, discriminative & generative models, overfitting/underfitting, вероятностные графические модели, Байесовские методы, цепи Маркова, CRF, плавно перешли к глубинному обучению и pytorch, а в конце прошлись по основным и актуальным сеткам (CNN, RNN, различные autoencoders, attention and memory models, GAN). Пока курс доступен на сайте преподавателя – Machine Learning course. Если брать во внимание еще большое количество ссылок на обзоры и статьи, то получилось “галопом по европам” и времени явно не хватало, как нам, так и преподавателю. 😀

Spatial statistics. 3 год IM. Этот предмет стал для меня открытием и интенсивным повторением пройденного. Пришлось вспомнить теорию меры, интегралы, функциональный анализ, теорию вероятности и статистику, чтобы использовать это счастье для упражнений, выведения формул и доказательства теорем. К счастью, преподаватель был благосклонен и дал проект вместо экзамена. Для проекта нам нужно было прочитать научную статью, объяснить ее и выполнить реализацию на R. Тут мы брали временем и маленькими шажками, чтобы осмыслить, как и для чего используется пространственный анализ. И если на лекциях я понимала, что он говорит, но не успевала связать все это в единое целое, то такой проект помог реально разобраться в том, что происходило на протяжении курса. Лекции доступны по ссылке: https://drive.google.com/file/d/1ktxnNXtke5T405bNYI1PcKB98uMkL_rl/view и на сайте преподавателя: https://sites.google.com/site/radustefanstoica.

Все сводится к тому, чтобы понять, какой точечный процесс перед нами

Scalable architecture. 3 год ISDP. Обзорный курс про NoSQL и используемые типы, ACID vs. BASE, теорему CAP и такие хитрости как Vector Clocks, Sharding, Consistent Hashing, Membership Changes. Большое внимание было уделено MapReduce и примерам использования. В конце были упражнения с использованием mongodb, нужно было импортировать большой датасет, выполнить базовые процедуры (выбор, проекции, обновление, получение статистики), применить map и reduce, испытать проблемы связанные с отсутствием индексирования и выполнить join таблиц. В конце был тест с … отрицательными баллами! 🙂 И кто-то таки умудрился уйти в минус. 😀

Распределение оценок по масштабируемым архитектурам

Information theory. 3 год IM. Курс был теоретический, объяснялись энтропия Шеннона, расстояние Кульбака — Лейблера, информация Фишера, информационный критерий Акаике, особенности их применения и примеры использования информационной теории к различным типам данным, а на закуску – универсальная машина Тьюринга. Также были упражнения на Python на использование формул и теоретических выводов для закрепления. Как по мне, курс был достаточно тяжелым, а может быть и я под конец семестров в двух универах была уставшей 🙂 На экзамене у нас было два упражения с кучей подпунктов, насколько мне известно, ко второму добрались немногие, а те, кто добрались, едва смогли что-то сделать.

Management of innovate projects. 2 год. Это был практический курс, где мы должны были разработать проект для выставки в Le Vaisseau или прибор для помощи инвалидам и людям в возрасте. Мы выбрали первое, так что нам нужно было представить нечто, что поможет детям понять, как работает искусственный интеллект. Первая часть курса состояла из обзора литературы, составления различных диаграмм и таблиц, составление PoC (Proof of Concept) с аргументацией, почему это можно сделать и как это будет интересно детям. После защиты нам давали обратную связь и во время второй части курса мы делали работу над ошибками, бизнес-план, анализ рисков, маркетинговое исследование и план работ. Что мне понравилось в данном курсе – это работа непосредственно с компанией, которая дала эти задания для проектов, и то, что половина лекций читались профессионалам из индустрии.

Пример экспоната из выставочного центра. Но у нас будет круче 🙂

Tutored research project. 3 год. В начале семестра нам предлагали список тем и научных руководителей на различные темы. Мы должны были выбирать, выходить с ними на контакт, проходить небольшое собеседование и, если все хорошо, начинать проект. Как правило, нам предоставляют или помогают собрать данные, затем мы должны сделать обзор литературы для данной задачи, сформулировать свой подход и провести эксперимент. На презентации нужно обосновать выбор инструментов и методов и продемонстрировать их успешность.

Личное впечатление и сравнение

Сравнение с Украиной. Это программа стала для меня больше повторением и углублением знаний, чем обучением с нуля, поэтому было весьма посильно. Не успела поинтересоваться местным бакалавриатом, но на базовом уровне многое мы проходили на первых курсах, что-то на последних. Если сравнивать обучение в целом (очень субъективно), то у нас в студентов впихивают неимоверное количество материала, но тестируют более поверхностно, здесь требуют с одной стороны более глубокого понимания, но ввиду относительной системы оценивания, студенты не всегда выходят с намного большим уровнем, чем у нас. Также здесь выпускаются, как правило, узкопрофильные специалисты, а у нас – широкопрофильные. Но, в целом, как мне показалось, студенты здесь более мотивированы учиться. Если у нас обычно пару “ботанов” и остальные мутятся, то тут вроде наоборот.

Про инструменты. Наверное, как и везде, есть три основных лагеря – математики используют matlab, статистики – R, инженеры – python. Для НН очень популярен pytorch

Кстати, все наши материалы в электронном виде и некоторые в открытом доступе.

Перспективы

Тут образование ключевая цепочка карьерной лестницы. Особенно французы (которых в % не так много) весьма ответственно подходят к делу. Возможно, еще дело в том, что бизнес и академия тесно связаны, и часто компании отдают на проекты студентам свои идеи. Например, сейчас исследовательский проект делаю в лаборатории, но для стартапа. В следующем семестре у них стажировка. Так что, если ты молодец, то это прямая дорога на работу. Если мне все-таки по душе больше универ, тоже не проблема – немало компании отдают на phd.

Также во Франции немного другая система аспирантуры: ты должен найти финансирование. Наиболее привлекательный способ – с компанией, но можно и с универом, можно найти грант. Контракт заключается между студентом, лабораторией и компанией. Без финансирования не разрешат.

Поделиться