CHUKLANG
О корпусе

Всего в ходе экспедиций был записан корпус текстов общей длительностью около 4 часов. Из них полностью разобраны, затранскрибированы, снабжены поморфемной нотацией и переводом на русский и английский языки, а также комментариями на русском языке, синхронизированы с аудиозаписью и выложены на сайте — 65 текстов. Перед выкладкой на сайт тексты прошли предварительный этап разбора в программной среде Fieldworks Language Explorer (FLEx) и  разметки в программе ELAN, при этом все тексты были разобраны вручную.

Корпус включает тексты различных жанров, в частности, анекдоты, песни, притчи, автобиографические рассказы, сказки, бытовые диалоги, пересказы фрагментов немых фильмов. Корпус создан в равном объёме Иваном Стениным (глоссирование текстов) и Екатериной Герасименко (техническая реализация) при участии Полины Касьяновой (перевод на английский части текстов). При этом создание корпуса было бы невозможно, если бы не вклад всех участников проекта, записывавших и расшифровывавших тексты в экспедициях.

Корпус предоставляет возможность поиска по следующим полям: словоформа, морфема, перевод основы, глосса и др. (как по точному соответствию, так и с использованием регулярных выражений). Можно задавать подкорпус, включать те или иные фильтры, сохранять результаты выдачи. Перед использованием поиска в корпусе рекомендуется ознакомиться со справкой, общей для всех корпусов на платформе tsakorpus. Справка вызывается нажатием на пиктограмму вопросительного знака.

Создание аудиокорпуса идиома, не имеющего длительной письменной традиции и нормативного стандарта, ставит перед исследователями нетривиальные вопросы. В процессе работы над аудиокорпусом амгуэмского говора было принято решение по возможности отражать в записи вариативность, а также фальстарты (глоссируются как FST) и маркеры хезитации (=ŋe / =ŋa, =e / =a, =ə), являющиеся энклитиками и образующие с предшествующим морфосинтаксическим словом единое фонетическое слово (глоссируются как =PTCL), но не маркеры хезитации между паузами и не другие невербальные сегменты.

Для просмотра, прослушивания и сохранения в форматах WAV и PDF доступны также полные версии текстов, в разделе «Полные тексты».


Полнотекстовый поиск: точное соответствие

Дополнительные настройки поиска и отображения

Контекстов на странице:
Сортировка
Расстояния между словами только как в запросе
Выдача:
Показать эмфатические энклитики

(Тут будут результаты.)