Вакансии
Над Корпусом работает большое количество ученых, программистов, преподавателей и студентов. Всех их можно разделить на несколько рабочих групп, каждая из которых выполняет определенную задачу. Ниже мы перечислили основные такие рабочие группы и описали актуальные “вакансии” для каждой из них. В скобках вы найдете указание на то, представитель какой профессиональной сферы этим будет вероятнее всего заниматься; однако это не жесткие требования и мы обсуждаем любые ваши предложения. Так что обязательно пишите!
Работа с сайтом
- Веб-дизайн страницы поиска (программисты)
- Разработка мобильной версии Корпуса (программисты)
Пополнение Корпуса
- выравнивание параллельных текстов (китаисты)
- поиск новых параллельных текстов на гоюй (國語, Тайвань), хуаюй (华语, Сингапур) (китаисты)
Корпус переводов с языка вэньянь (文言)
- Поиск новых параллельных текстов на вэньяне (китаисты)
- Поиск и разработка технологий, связанных (китаисты)
Образовательная среда на основе Корпуса
- Создание алгоритма автоматического упрощения русских и китайских текстов для того или иного уровня знания языка (программисты, лингвисты, китаисты, РКИ)
- Создание дополнительной фичи в корпусе - аудио- и видеопримеров для цитат из книг, которые содержатся в корпусе (программисты, китаисты, РКИ)
- Создание расширения для Chrome, которое показывает наиболее частые контексты для того или иного слова (программисты, китаисты, РКИ)
- Создание методических пособий по русскому как иностранному и китайскому как иностранному (лингвисты, китаисты, РКИ)
Разработка новой разметки для Корпуса
- Создание алгоритма, который бы подсвечивал наиболее вероятный перевод того или иного слова (программисты, лингвисты, китаисты)
- Создание лингвистической разметки для китайских текстов - словоделения, PoS-тэгов, аннотации пиньиня, синтаксической и семантической разметки (программисты, лингвисты, китаисты)
- Проверка существующей разметки для текстов в традиционной орфографии (китаисты, программисты)
Исследовательские задачи на будущее
- Создание алгоритма, который будет автоматически порождать тексты разных стилей
- Исследования по переводоведению, китайской стилистике и филологии
СММ и популяризация
- СММ для TikTok
- СММ для WeChat (носитель китайского языка)
По вопросам совместной работы пишите координатору проекта Кириллу Семенову (kir.semenow@yandex.ru)