YRP MSU & Microsoft
MSU BigDATA ImagineHack
5-6 марта 2018
С 5 по 6 марта в МГУ им. М.В. Ломоносова прошел хакатон MSU BigDATA Imagine Hack, который был посвящен построению предиктивных моделей на основе научных данных и приурочен к международному студенческому конкурсу ИТ-проектов Imagine Cup.
Лучшими проектами были признаны команды CoffeeBreakTeam и Devian, которые прошли на региональный этап ImagineCup. Кроме того, каждая команда получила $100 на использование Azure сервисов.
Хемометрика для определения вкусов вина и кофе
Хемометрика зародилась как химическая дисциплина, использующая методы статистики, прикладной математики и информатики для извлечения полезной информации из измеренных химических данных и позволяющей оптимизировать аналитические химические процессы.

Хемометрика позволяет давать ответы на нетривиальные вопросы о сложных системах с большим количеством факторов.

Один из таких вопросов - вопрос о вкусе продукта.

Далеко не каждому человеку под силу по достоинству оценить вкусовое многообразие таких популярных продуктов как вино и кофе.

Можно долго ходить вдоль витрин в отделе алкогольной продукции среди ассортимента из тысяч бутылок вина, выбирая себе одну из них к ужину. То же самое и с кофе. Его вкус сильно зависит от сорта, региона, в котором он вырос, процесса обработки и обжарки кофейных зерен и, наконец, от способа заваривания. Тут можно довериться советам сомелье и бариста, однако даже они при оценке вкуса ориентируются на субъективные параметры их выбор может не всем оказаться по вкусу.

Возникает потребность выработать объективные критерии оценки вкуса.

Такие критерии могут быть выработаны с использованием хемометрических методик.

Вкусовые особенности обусловленны химическим составом продукта.

Исследовать химический состав продукта можно методами оптической спектроскопии. Суммарный вклад взаимодействия молекул продукта с оптическим излучением оставляет в оптическом спектре уникальные отпечатки. Анализ оптических спектров позволяет получить информацию о вкусовых характеристиках.

Постановка задачи:

Для некоторого набора вин и разных типов кофе сформирован датасет состоящий из оптических спектров и фотографий. Данные спектры и фотографии сопоставлены с типами вина и кофе, уровнем сладости, кислотности и экстракции полученными объективными методами измерения.

На основе этих данных построить модель, способную классифицировать вина, кофе, а также модель способную различать сладость, кислотность вина и уровень экстракции кофе.

Прогнозирование дорожных аварий в Москве
Погодные условия и их резкое изменение влияют на число ДТП. В плохую погоду (во время ливней, снегопадов, резких перепадов температуры) число происшествий закономерно возрастает. Но значительное влияние оказывают не только явные факторы. Например, изменение атмосферного давления снижает уровень внимания участников дорожного движения, в результате, количество аварий значительно увеличивается.

ЦОДД Москвы предоставил уникальные данные по ДТП в 2013-2017 гг. Информация собрана по всей территории Москвы, включая Новую Москву и насчитывает около 2 млн событий. Отдельно отражена статистика по авариям с человеческими жертвами и материальным ущербом, каждая запись содержит дату и время происшествия.

Вам предстоит, используя технологии машинного обучения, предоставленные ЦОДД актуальные данные об авариях, а также открытые источники метеосводок, построить прогнозную модель, предсказывающую число аварий в Москве в зависимости от календарного дня, времени года, часа дня и погодных условий.

Определение типа личности по фотографии
Существует множество типологий личности. Одной из самых популярных является соционика основанная на теории Юнга, где типы определяются четырьмя дихотомиями (взаимоисключающими свойствами).

Дихотомии в соционике это:

− Логика – этика,
− Интуиция – сенсорика,
− Экстраверсия – интроверсия,
− Рациональность – иррациональность.

Каждому человеку можно сопоставить только одну дихотомию из пары, таким образом, получив 16 возможных типов личности.

Подробнее о соционике и типах можно прочитать здесь..

В зависимости от типа, люди имеют различные сильные и слабые стороны, можно предсказать их предпочтения и характерные особенности поведения. Поэтому соционика активно применяется в кадровом консалтинге, профориентировании, командообразовании и тд. Известные компании используют или планируют использовать психотипы пользователей для кастомизации рекламы и клиентского сервиса.

Соционический тип определяется в ходе подробного интервью, при этом особое внимание специалисты обращают на внешность человека и его невербальные проявления. Существует гипотеза о том, что отдельные дихотомии и соционический тип человека с достаточной точностью можно предположить по набору его фотографий. Проблемой построения предсказательных моделей является отсутствие верифицированных наборов данных о типах людей.

Вам будут предложены списки известных людей, про которых достоверно известно к какому типу они относятся и обладающих наиболее характерными чертами. Анализируя их фотографии, вам предстоит построить модель, предсказывающую по фотографии как отдельные дихотомии, так и типы целиком.
Перевод с языка жестов
Как минимум 1% населения нашей Планеты только по официальным данным имеет проблемы со слухом, сопоставимые с невозможностью использовать вербальные символы в коммуникации.
Вам представлена база из фотографий 10 различных жестов, изображенных на них.

Постановка задачи.

Используя имеющиеся данные, построить модели, способные распознавать язык жестов в режиме реального времени

© All Right Reserved. YRP MSU.
yrp.msu@gmail.com
Made on
Tilda