CHUKLANG

Тексты

Всего в ходе экспедиций был записан корпус текстов общей длительностью около 4 часов. Из них полностью разобраны, затранскрибированы, снабжены поморфемной нотацией и переводом на русский и английский языки, а также комментариями на русском языке, синхронизированы с аудиозаписью и выложены на сайте — 65 текстов. Перед выкладкой на сайт тексты прошли предварительный этап разбора в программной среде Fieldworks Language Explorer (FLEx) и разметки в программе ELAN, при этом все тексты были разобраны вручную.

Корпус включает тексты различных жанров, в частности, анекдоты, песни, притчи, автобиографические рассказы, сказки, бытовые диалоги, пересказы фрагментов немых фильмов. Корпус создан в равном объёме Иваном Стениным (глоссирование текстов) и Екатериной Герасименко (техническая реализация) при участии Полины Касьяновой (перевод на английский части текстов). При этом создание корпуса было бы невозможно, если бы не вклад всех участников проекта, записывавших и расшифровывавших тексты в экспедициях.

Корпус предоставляет возможность поиска по следующим полям: словоформа, морфема, перевод основы, глосса и др. (как по точному соответствию, так и с использованием регулярных выражений). Можно задавать подкорпус, включать те или иные фильтры, сохранять результаты выдачи. Перед использованием поиска в корпусе рекомендуется ознакомиться со справкой, общей для всех корпусов на платформе tsakorpus. Справка вызывается нажатием на пиктограмму вопросительного знака в разделе «Поиск в мультимедийном корпусе».

Создание аудиокорпуса идиома, не имеющего длительной письменной традиции и нормативного стандарта, ставит перед исследователями нетривиальные вопросы. В процессе работы над аудиокорпусом амгуэмского говора было принято решение по возможности отражать в записи вариативность, а также фальстарты (глоссируются как FST) и маркеры хезитации (=ŋe / =ŋa, =e / =a, =ə), являющиеся энклитиками и образующие с предшествующим морфосинтаксическим словом единое фонетическое слово (глоссируются как =PTCL), но не маркеры хезитации между паузами и не другие невербальные сегменты.

Для просмотра, прослушивания и сохранения в форматах WAV и PDF доступны также полные версии текстов, представленные ниже.

Абрамович
Баня
Бегущая Полина
Бесконечная сказка
Бренди
Бульон из раздробленных костей
В детстве
Вечером
Водовозка
Ворон и лис
Выттал
ГУМ
Гонка на измор
Грибы
Грудь
Давай поедем в Эгвекинот купаться
Деньги
Ездок на собаках
Жизнь
За грибами
Злой дух и птичка
Изо дня в день
Катюша
Комсомолец
Комсомолец (снова)
Кочёвка
Ледниковый период
Лица
Личинки
Мать
Москвичка
Мухоморы
Не едящая личинок
Ножи
Олень-производитель
Орёл
Отпуск
Палатка
Парень
По грибы с Полиной
По следу овода
Позавчера
Половая тряпка
Прогулка
Родители
Рождение
Рыбалка с Ильёй
С медвежьими ушками
Сапоги
Скороговорка
Случай
Телёпка
Трава
Туалет
Тэнылькот и Экэлькот
Хулиган
Чайник
Чапаев
Червяки
Шаман
Эракор
Эскимос рыбачит
Юргаюк
Я с Чукотки
Языкастая и гулящая