Машинное обучение в текстовом анализе: продвинутый трек
Вы ждали, вы просили - и вот он! Продвинутый трек мастерской компьютерного анализа текстов.
Данный трек отлично подходит как тем, кто уже был у нас и хочет углубить знания, так и тем, кто пока не знаком с ЛШ, но уже знаком с базовыми понятиями мира NLP и хочет больше.
Ты сможешь послушать интересные лекции про все те многочисленные подходы, которые применяют NLP-специалисты, познакомиться с другими NLP-энтузиастами и найти единомышленников, а в свободное время посмеяться (или покринжевать) с лингвистических шуток, сидя за очередной настолкой. В конце программы вам нужно будет представить командный проект вместе с участниками базового трека.
Вот примерное содержание мастерской:
- Основы предобработки текста;
- Предобработка текстовых данных;
- Препроцессинг и регулярные выражения;
- Продвинутая статистика и введение в математику для ML;
- Классификация и кластеризация текстов (продвинутый уровень);
- Визуализация данных;
- PyTorch;
- Большие языковые модели (LLM);
- Парсеры (продвинутый уровень);
- BERT, ELMO, GPT;
- Обучение больших языковых моделей: Обучение с нуля vs Тонкая настройка (Finetuning);
- Retrieval-Augmented (RAG) LLM.
Даты проведения
1-3 циклы: с 2 июля по 17 июля
Возрастные ограничения
от 18 лет
Кого ищут
Если ты знаешь Питон и основы NLP и хочешь большего, то тебе к нам!
Машинное обучение в текстовом анализе: базовый трек
Интересуешься NLP, но не знаешь, с чего начать? Начни с нашей мастерской!
НЛП не обещаем, но обещаем две недели весёлого и интенсивного изучения методов обработки естественного языка. Ты сможешь послушать интересные лекции про все те многочисленные подходы, которые применяют NLP-специалисты, познакомиться с другими NLP-энтузиастами и найти единомышленников, а в свободное время посмеяться (или покринжевать) с лингвистических шуток, сидя за очередной настолкой. В конце программы вас ожидает командный проект, который нужно будет представить вместе с участниками продвинутого трека.
Вот примерное содержание мастерской:
- Основы предобработки текста;
- Предобработка текстовых данных;
- Препроцессинг и регулярные выражения;
- Базовая статистика и введение в математику для ML;
- Классификация и кластеризация текстов;
- Основы визуализации данных;
- PyTorch;
- Большие языковые модели;
- Парсеры;
- Предобученные модели;
- Анализ тональности;
- Дистрибутивная семантика и word embeddings.
Даты проведения
1-3 циклы: с 2 июля по 17 июля
Возрастные ограничения
от 18 лет
Кого ищут
Если ты знаешь Питон и интересуешься NLP, то тебе к нам!