Научно-исследовательский семинар

Возможности и перспективы анализа текстов и машинного обучения

Научно-исследовательские семинары “Возможности и перспективы анализа текстов и машинного обучения” предназначены для обсуждения вопросов по темам корпусной лингвистики, анализа текстов и машинного обучения. Семинары являются открытыми и проводятся при участии преподавателей и студентов ИИЯ и ИМИТ, а также сотрудников ЦИИ ПетрГУ. Конференции ведутся в смешанном формате: очно в аудитории 153 и на платформе ZOOM. Докладчиками выступают преподаватели, аспиранты и студенты различных университетов не только из России, но и из-за рубежа. Семинар проводится регулярно - раз в две недели.

К участию в семинаре приглашаются специалисты, обучающиеся магистратуры, бакалавриата и аспирантуры как из ПетрГУ, так и из ВУЗов по всему миру.

Целью этих семинаров является обсуждение проблемных вопросов, перспектив и достижений в соответствующих областях науки. Помимо этого, одним из важнейших аспектов этих семинаров является возможность поделиться опытом с коллегами, работающими в смежных областях и направлениях.

 

Видеоролики на конкурс «XII Молодежная премия в области науки и инноваций»:

 

 

Новости:

Искусственный интеллект в преподавании иностранных языков

Особенности устройства и работы ChatGPT

Использование Spacy в лингвистических исследованиях

Cеминар "Revita: Изучение языка на основе искусственного интеллекта"

Семинар "Национальный корпус русского языка: состав, возможности, новый функционал" прошел в ПетрГУ

Студенты ПетрГУ – участники всероссийского конкурса «XII Молодежная премия в области науки и инноваций»

Презентация информационной системы "Лингвистика"

Научное сотрудничество с НИУ "Высшая школа экономики"

Преподаватели тоже учатся

Семинар "Корпус студенческих текстов ПАКТ: текущие работы и разработки"

Студент ИИЯ в числе победителей конкурса "УМНИК"

 Преподаватель ПетрГУ – победитель конкурса Фонда Потанина

Вопросы использования технологий искусственного интеллекта обсудили в ПетрГУ

Заседание научной секции "Актуальные проблемы германской филологии и лингводидактики"

 

Руководители семинара:

Щеголева Людмила Владимировна, док.тех.н, доц., Институт математики и информационных технологий  

Котюрова Ирина Аврамовна, канд.филол.н., доц. Институт иностранных языков

  

Научный секретарь семинара:

Вернигорова Маргарита margaritavernigorova@yandex.ru

Расписание


2023 год

29 мая 19:00 | Понедельник

Искусственный интеллект в преподавании иностранных языков. Продолжение.
Место проведения: Zoom, ЦИИ, ул. Ленина, 33 ауд. 153
На семинаре, который является логичным продолжением обсуждения, начатого 20.04, продолжим говорить об опыте преподавания иностранных языков с помощью технологий искусственного интеллекта. Основным докладчиком на семинаре выступит Щипицина Лариса Юрьевна, доктор филологических наук, профессор, заместитель директора по научной работе Северного (Арктического) федерального университета имени М.В. Ломоносова. К обсуждению приглашаются все желающие - преподаватели, программисты и все, кого интересует тема генеративного искусственного интеллекта.

Семинар проводится в смешанном формате: очно в ауд. 153 в главном корпусе ПетрГУ (Центр искусственного интеллекта, пр.Ленина, 33), а также дистанционно в Zoom. Ссылку для дистанционного подключения к семинару можно получить по запросу по адресу: koturova@petrsu.ru
К описанию

15 мая 19:00 | Понедельник

Примеры задач по оценке состояния общества на основе анализа текстовой информации из интернета
Место проведения: Zoom, ЦИИ, ул. Ленина, 33 ауд. 153
15 мая в 19:00 в рамках серии научно-исследовательских семинаров «Возможности и перспективы анализа текстов и машинного обучения» пройдет встреча под общим названием "Примеры задач по оценке состояния общества на основе анализа текстовой информации из интернета".
На семинаре планируется обсуждение 2 сообщений, объединенных этой общей темой:

1). «Динамика левой, правой, провластной и национальной парадигмы в материалах политических партий РФ в 2018-2023 гг..»
Докладчики: В.М. Решетов, М.А. Александров

2) «Aннотирование историй болезни пациентов при заболеваниях легочной системы (кратко о проекте Life-Film)»
Докладчик: Докладчик: М.А. Иванченко
Подробнее К описанию

24 апреля 19:00 | Понедельник

Искусственный интеллект в преподавании иностранных языков
Место проведения: Zoom, ЦИИ, ул. Ленина, 33 ауд. 153
То, что технологии с использованием искусственного интеллекта стремительно проникают в нашу жизнь, уже никого не удивляет. Генеративный ИИ активно начинают применять в самых разных областях жизни,и образование тоже не может остаться в стороне. На семинаре, который является логичным продолжением предыдущего обсуждения GPT-чата, поговорим о том, что сегодня может и чего не может ChatGPT в плане преподавания иностранных языков. Основным докладчиком на семинаре выступит Лытаева Мария Александровна, академический руководитель магистерской программы «Педагогическое образование» Высшей школы экономики и ее студенты, которые провели несколько экспериментов по использованию искусственного интеллекта в разных аспектах работы преподавателя иностранных языков. К обсуждению результатов этих экспериментов приглашаются все желающие - преподаватели, программисты и все, кого интересует тема генеративного искусственного интеллекта.

Семинар проводится в смешанном формате: очно в ауд. 153 в главном корпусе ПетрГУ (Центр искусственного интеллекта, пр.Ленина, 33), а также дистанционно в Zoom. Ссылку для дистанционного подключения к семинару можно получить по запросу по адресу: koturova@petrsu.ru

К описанию

10 апреля 19:00 | Понедельник

Особенности устройства и работы ChatGPT
Место проведения: Zoom, ЦИИ, ул. Ленина, 33 ауд. 153
На семинаре в качестве основного докладчика выступит магистрант 2 курса обучения ИМИТ ПетрГУ Сафонов Георгий.
В рамках доклада будут рассмотрены особенности структуры и процесса обучения нейронной сети, лежащей в основе чат-бота ChatGPT, а также проведено сравнение с иными популярными архитектурами нейронных сетей, применяемыми в области обработки естественного языка.
К участию приглашаются все заинтересованные лица.
Семинар проводится в смешанном формате: очно в ауд. 153 в главном корпусе ПетрГУ (Центр искусственного интеллекта, пр.Ленина, 33), а также дистанционно в Zoom. Ссылку для дистанционного подключения к семинару можно получить по запросу по адресу: koturova@petrsu.ru
К описанию

27 марта 19:00 | Понедельник

Примеры задач по оценке состояния общества на основе анализа текстовой информации из интернета
Место проведения: Zoom, ЦИИ, ул. Ленина, 33 ауд. 153
27 марта в 19:00 в рамках серии научно-исследовательских семинаров «Возможности и перспективы анализа текстов и машинного обучения» пройдет встреча под общим названием "Примеры задач по
оценке состояния общества на основе анализа текстовой информации из интернета".
На семинаре планируется обсуждение 3 сообщений, объединенных этой общей темой:
Сообщение 1
«Оценка отношения к зарубежным союзникам и противникам РФ по регионам России в период 2022 гг. по запросам в сервис Яндекса»
Борисова Татьяна Алексеевна, магистрант совместной программы МФТИ-РАНХиГС, институт ИЭМИТ

Сообщение 2
«Динамика левой, правой, провластной и национальной парадигмы в материалах политических партий РФ в 2022 г.»
Решетов Владислав Максимович, магистрант совместной программы МФТИ-РАНХиГС, институт ИЭМИТ

Сообщение 3
«Оценка достоверности новостной ленты в категориях ложной, правдивой, полу-правдивой и прочей информации»
Шушкевич Елена Николаевна, аспирант факультета компьютерных наук Технологического Университета Дублина (Ирландия)
Примечание. Материалы представляет Александров М.А., доцент РАНХиГС, один из научных руководителей аспирантки

К участию в семинаре приглашаются все желающие.
Семинар проводится в смешанном формате: очно в ауд. 153 в главном корпусе ПетрГУ (Центр искусственного интеллекта, пр.Ленина, 33), а также дистанционно в Zoom. Ссылку для дистанционного подключения к семинару можно получить по запросу по адресу: margaritavernigorova@yandex.ru
Подробнее К описанию

13 марта 19:00 | Понедельник

Визуализация данных корпуса студенческих текстов ПАКТ
Место проведения: Zoom, ЦИИ, ул. Ленина, 33 ауд. 153
На семинаре в качестве основного докладчика выступит магистрантка 1 курса обучения ИМИТ Осипова Полина, которая представит результаты своей работы по визуализации данных корпуса студенческих текстов ПАКТ. Этот доклад станет поводом для совместных обсуждений программистов и лингвистов о том, какие данные и в каком виде требуется и возможно получить для различных лингвистических и лингводидактических исследований. К участию приглашаются все заинтересованные лица.
Семинар проводится в смешанном формате: очно в ауд. 153 в главном корпусе ПетрГУ (Центр искусственного интеллекта, пр.Ленина, 33), а также дистанционно в Zoom. Ссылку для дистанционного подключения к семинару можно получить по запросу по адресу: margaritavernigorova@yandex.ru
К описанию

27 февраля 19:00 | Понедельник

Использование Spacy в лингвистических исследованиях
Место проведения: Zoom, ЦИИ, ул. Ленина, 33 ауд. 153
27 февраля в 19:00 в рамках серии научно-исследовательских семинаров «Возможности и перспективы анализа текстов и машинного обучения» пройдет встреча, на которой докладчиком выступит к.ф.н., научный сотрудник Института языкознания РАН Кротова Елена Борисовна, с докладом на тему "Использование Spacy в лингвистических исследованиях".
Елена Борисовна – один из специалистов по корпусной лингвистике, сочетающий знания филолога-германиста и программиста и использующий эти знания в своих исследованиях.
Нередко случается, что есть большие корпуса текстов, но там либо нет нужной исследователю разметки, либо этой разметке нельзя доверять (например, когда речь идет о частеречных тегах в корпусах с неснятой омонимией). В таких случаях можно брать в корпусе имеющиеся тексты и с помощью Spacy и самостоятельно написанных скриптов искать в корпусе нужные структуры и получать по ним статистику.
На семинаре Кротова Е.Б. расскажет и покажет, как именно она пользуется Spacy для лингвистических исследований.
К участию в семинаре приглашаются все желающие.
Семинар проводится в смешанном формате: очно в ауд. 153 в главном корпусе ПетрГУ (Центр искусственного интеллекта, пр.Ленина, 33), а также дистанционно в Zoom. Ссылку для дистанционного подключения к семинару можно получить по запросу по адресу: margaritavernigorova@yandex.ru
К описанию
2022 год

19 декабря 19:00 | Понедельник

Автоматическая генерация тестовых заданий по текстовому документу  
Место проведения: Главный корпус, ауд. 153, Zoom
19 декабря в 19:00 в рамках серии научно-исследовательских семинаров «Возможности и перспективы анализа текстов и машинного обучения» пройдет встреча, на которой докладчиком выступит сотрудник ЦИИ ПетрГУ Семенов Никита Дмитриевич с докладом на тему "Автоматическая генерация тестовых заданий по текстовому документу".
 
Как известно, одной из форм оценки знаний являются тестовые задания разных типов. На семинаре будут представлены подходы и результаты исследования на тему генерации вопросов, формирования правильного ответа, генерации дистракторов.
 
К участию в семинаре приглашаются все желающие.
Семинар проводится в смешанном формате: очно в ауд. 153 в главном корпусе ПетрГУ (Центр искусственного интеллекта, пр.Ленина, 33), а также дистанционно в Zoom. Ссылку для дистанционного подключения к семинару можно получить по запросу по адресу: margaritavernigorova@yandex.ru
К описанию

05 декабря 19:00 | Понедельник

ИЗУЧЕНИЕ СОЧЕТАЕМОСТИ СЛОВ ОНЛАЙН с помощью ресурса CoCoCo
Место проведения: Главный корпус, ауд. 153
5 декабря в 19:00 в рамках серии научно-исследовательских семинаров «Возможности и перспективы анализа текстов и машинного обучения» пройдет встреча, на которой в качестве приглашенного лектора выступит адъюнкт-профессор Хельсинского университета, доктор филологических наук, выпускник 1995 года филологического факультета Петрозаводского государственного университета, специалист мирового уровня в области корпусной лингвистики Копотев Михаил Вячеславович.
Михаил Вячеславович является руководителем известного среди корпусных лингвистов проекта «CoCoCo» (Collocation Colligations Corpora)
CoCoCo - это своего рода учебный словарь сочетаемости, представляющий собой открытую систему, которая автоматически извлекает коллокации (устойчивые, синтаксически и семантически целостные словосочетания) из корпуса текстов, обрабатывает их, описывает грамматические и семантические признаки, ранжирует их по частотности.
Встреча будет интересна как для программистов, занимающихся вопросами анализа текстов и машинного обучения, так и для преподавателей иностранных языков, в том числе и русского языка как иностранного, поскольку на семинаре будет дан новаторский инструмент для практического использования в преподавании. К участию в семинаре приглашаются все желающие.
К описанию

21 ноября 19:00 | Понедельник

Revita: Изучение языка на основе корпусных подходов
Место проведения: Главный корпус, ауд. 153
21 ноября в рамках серии научно-исследовательских семинаров "Возможности и перспективы анализа текстов и машинного обучения" состоится семинар по теме "Revita: Изучение языка на основе искусственного интеллекта".

Лектор − Роман Янгарбер, д-р техн.наук, профессор, руководитель проекта "Revita: Изучение языка на основе искусственного интеллекта".

Система REVITA представляет собой новаторский подход к разработке индивидуализированных упражнений и проведению индивидуальных тестов, для создания которых активно используются инструменты автоматического анализа текста. Данные, собранные в процессе использования системы, открывают путь к индивидуальному подходу в изучении языка, к описанию индивидуальной грамматики ученика.

К участию в семинаре приглашаются все желающие. Встреча будет интересна как программистам, занимающимся вопросами анализа текстов и машинного обучения, так и преподавателям иностранных языков, в том числе и русского языка как иностранного, поскольку на семинаре речь пойдет о новаторском инструменте для практического использования в преподавании.

Семинар проводится в смешанном формате: очно в ауд. 153 в главном корпусе ПетрГУ (Центр искусственного интеллекта, пр.Ленина, 33), а также дистанционно в Zoom.
К описанию

07 ноября 19:00 | Понедельник

Теоретико-графовые модели, методы и программные средства интеллектуального анализа фольклорных и литературных текстов
Место проведения: ЦИИ, ул. Ленина, 33 ауд. 153 + Zoom
7 ноября в 19:00 в рамках серии научно-исследовательских семинаров «Возможности и перспективы анализа текстов и машинного обучения» выступит Москин Николай Дмитриевич, к.т.н., доцент кафедры теории вероятностей и анализа данных Института математики и информационных технологий Петрозаводского государственного университета, технический секретарь Диссертационного совета по физико-математическим и техническим наукам.
Тема семинара: «Теоретико-графовые модели, методы и программные средства интеллектуального анализа фольклорных и литературных текстов».
Николай Дмитриевич расскажет о задачах, которые возникают при анализе фольклорных и литературных произведений, о теоретико-графовых моделях языковой структуры текстов, а также о методах их анализа и программных средствах, которые можно использовать в задаче атрибуции, перевода, выявления неоднородных фрагментов и др.
К участию приглашаются все желающие. Ссылку для дистанционного подключения к семинару можно получить по запросу по адресу: margaritavernigorova@yandex.ru

К описанию

31 октября 19:00 | Понедельник

Национальный корпус русского языка: состав, возможности, новый функционал.
Место проведения: Zoom, ЦИИ, ул. Ленина, 33 ауд. 153
31 октября в 19:00 в рамках серии научно-исследовательских семинаров «Возможности и перспективы анализа текстов и машинного обучения» пройдет встреча, на которой в качестве приглашенного лектора выступит Анастасия Дмитриевна Козеренко, к.ф.н., старший научный сотрудник, ученый секретарь отдела экспериментальной лексикографии Института русского языка им В.В. Виноградова РАН, менеджер Национального корпуса русского языка.
Анастасия Дмитриевна как один из разработчиков НКРЯ расскажет о составе и возможностях крупнейшего корпуса русского языка, в том числе функциях, разработанных в корпусе в последнее время.
К участию приглашаются все, кто интересуется корпусными технологиями: лингвисты, преподаватели иностранных языков, программисты. Ссылку для дистанционного подключения к семинару можно получить по запросу по адресу: margaritavernigorova@yandex.ru


К описанию

17 октября 19:00 | Понедельник

Корпус ПАКТ сегодня и завтра. Текущее положение дел. Планы на год.
Место проведения: Zoom, ЦИИ, ул. Ленина, 33, ауд. 153.
17 октября в 19:00 в рамках серии научно-исследовательских семинаров «Возможности и перспективы анализа текстов и машинного обучения» пройдет первая в этом учебном году встреча, на которой выступит Котюрова Ирина Аврамовна, к.ф.н., доцент кафедры немецкого и французского языков Института иностранных языков Петрозаводского государственного университета, которая расскажет о созданном в ПетрГУ корпусе студенческих текстов на немецком и французском языках ПАКТ.
На данном семинаре планируется обсуждение текущего положения дел в разработке корпуса ПАКТ, а также обсуждение основных планов на год.
К описанию

03 июня 17:05 | Пятница

Типы поисковых запросов в лингвистических корпусах
Место проведения: Zoom, ЦИИ, ул. Ленина, 33.
13 мая в 17.00 в рамках серии научно-практических семинаров «Возможности и перспективы анализа текстов и машинного обучения» прошла завершающая встреча этого учебного года, на которой в качестве приглашенного лектора выступил Захаров Виктор Павлович, к.ф.н., доцент кафедры математической лингвистики Санкт-Петербургского государственного университета. Виктор Павлович - автор многочисленных работ по корпусной лингвистике, включая учебник "Корпусная лингвистика", который входит в любой библиографический список публикаций по темам, связанным с корпусными технологиями в лингвистике.

Встречей на тему «Типы поисковых запросов в лингвистических корпусах» завершился учебный год в проекте «Возможности и перспективы анализа текстов и машинного обучения».

 

13 мая в 17.00 в рамках серии научно-практических семинаров «Возможности и перспективы анализа текстов и машинного обучения» прошла завершающая встреча этого учебного года, на которой в качестве приглашенного лектора выступил Захаров Виктор Павлович, к.ф.н., доцент кафедры математической лингвистики Санкт-Петербургского государственного университета. Виктор Павлович - автор многочисленных работ по корпусной лингвистике, включая учебник "Корпусная лингвистика", который входит в любой библиографический список публикаций по темам, связанным с корпусными технологиями в лингвистике.

Темой онлайн-встречи, на которую пришли студенты, магистранты и преподаватели ПетрГУ, стали типы поисковых запросов в лингвистических корпусах.  После краткого введения о том, что такое лингвистический корпус, Захаров В.П. сначала рассказал, а затем и наглядно в онлайн-режиме показал несколько различных лингвистических корпусов и их возможности в плане поисковых запросов.

Кроме наиболее известных крупных корпусов НКРЯ, SketchEngine,  COCA, Aranea, были показаны и менее известные корпуса InterCorp, Google Books Ngram Viewer, Corpora Collection Leipzig, ХАНКО и на их примере представлены различные системы поиска – (No)SketchEngine, Treq, Word at a Glance, SyD и другие.

Как отметила соорганизатор мероприятия Котюрова И.А.: «Возможности работы с многомиллиардными объемами текстов в многоязычных корпусах  очень впечатляют. Для лингвистов в последние годы отрылась целая новая Вселенная под названием корпусная лингвистика.  А знания, которыми поделился с нами на научно-практическом семинаре Захаров В.П., схожи космическому кораблю, на котором можно  взглянуть на эту Вселенную. И насколько подробно мы хотим ее изучить, теперь зависит только от желания лингвиста. Инструмент у нас в руках».

 

К описанию

13 мая 17:00 | Пятница

Sketch Engine for Language Learning
Место проведения: 153 каб. ГК ПетрГУ
13 мая 2022 г. в рамках серии научно-практических семинаров «Возможности и перспективы анализа текстов и машинного обучения» состоялся открытый вебинар “Sketch Enginge for Language Learning” для всех, кто интересуется изучением и преподаванием иностранных языков.
Запись практической части вебинара доступна по ссылке:
https://drive.google.com/file/d/18ESFITrcAmefS6-0asosvTgNrM27SmRM/view?usp=sharing
Подробнее К описанию

28 апреля 16:00 | Четверг

Выступления на конференции Fruct 31
Место проведения: 153 каб. ГК ПетрГУ
Доклады на научной конференции The 31st Conference of Open Innovations Association FRUCT 27 – 29 апреля 2022.

В рамках конференции будут заслушаны доклады участников семинара, согласно программе https://www.fruct.org/sites/default/files/files/FRUCT31_Program.pdf
Подробнее К описанию

22 апреля 17:00 | Пятница

Научно-исследовательская работа в вузе: информационная система экспертного анализа «Лингвистика»
Место проведения: 153 каб. ГК ПетрГУ
На семинаре профессор Богоявленская Юлия Валерьевна представит информационную систему экспертного анализа "Лингвистика", разработанную в Уральском федеральном университете.
«Лингвистика» представляет собой электронную среду, в которой пользователи могут создавать научно-исследовательские проекты различных типов (одно- и полиязыковые, индивидуальные и коллективные, для изучения вербальных и креолизованных текстов). Адаптированная под нужды лингвистических исследований, система представляет собой комфортное пространство для работы опытных специалистов и молодых ученых.
Подробнее К описанию

08 апреля 17:00 | Пятница

Генератор упражнений на основе учебного корпуса REALEC
Место проведения: 153 каб. ГК ПетрГУ
Логин Никита, разработчик Test Maker (Москва)
Подробнее К описанию

28 марта 16:20 | Понедельник

Корпус ПАКТ - текущие работы и разработки
Место проведения: 153 каб. ГК ПетрГУ
Текущие работы и разработки. Семинар совместно с ВШЭ (Москва)
- Котюрова И.А.
- Ремшу Н.
- Сафонов Г.
К описанию

11 марта 17:00 | Пятница

Стартовый семинар
Место проведения: 153 каб. ГК ПетрГУ
1) Обнаружители фейковых новостей на BERT-моделях текста
2) Простой алгоритм оценки тональности сложных фраз
3) Life-film на истории болезни пациента
4) Вертикальный отбор терминов для изучения корпуса документов с помощью МГУА-подобного алгоритма
5) ИИ и машинное обучение
Подробнее К описанию
Мероприятие