О дене-енисейском родстве, миграции носителей этих языков и классификации их языков в свете исследований М. Сиколи и Г. Холтона
16 февраля 2017 года в журнале Phys.org появилась новостная заметка «Linguist's 'big data' research supports waves of migration into the Americas» о докладе М.А. Сиколи на ежегодной встрече «Американской ассоциации содействия развитию науки» в Бостоне (рус.версию новости см. на нашем сайте).
Сайт «Мир индейцев» обратился за комментариями по данной новости к лингвисту, кандидату филологических наук, доценту Сектора компаративистики ИВКА РГГУ, с.н.с. Лаборатории востоковедения и сравнительно-исторического языкознания Школы актуальных гуманитарных исследований Института общественных наук РАНХиГС Михаилу Александровичу Живлову.
К сожалению, дать осмысленный комментарий к самой новости невозможно, т.к. в ней речь идёт о неопубликованном и не находящемся в открытом доступе тексте доклада, а из журналистского пересказа непонятны ни выводы, ни методика авторов. Но можно прокомментировать опубликованную в 2014 году теми же авторами (М.А. Сиколи и Г. Холтоном) статью «Linguistic Phylogenies Support Back-Migration from Beringia to Asia» (http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0091722).
Авторы исходят из ставшей в последнее время популярной гипотезы дене-енисейского родства, т.е. родства между небольшой семьёй енисейских языков в Сибири (к которой относятся кетский и коттский языки) и семьей на-дене в Америке (в эту семью входит атапаскская группа, язык ияк и язык тлингит). В статье они задаются вопросом: если дене-енисейская гипотеза верна, идёт ли речь о миграции носителей языков на-дене из Сибири в Америку или об обратной миграции енисейцев с Аляски в Сибирь? (Обратной потому, что в конечном счёте все языки Америки вместе с их носителями пришли из Сибири). Для того, чтобы ответить на этот вопрос, авторы используют математические методы, применяемые в биологии для построения филогенетических классификаций. В результате они приходят к выводу, что енисейцы мигрировали с Аляски в Сибирь: применяемые авторами методы указывают на то, что разные подгруппы языков на-дене не ближе друг к другу, чем к енисейским языкам. Это проще объяснить, если праязык дене-енисейской семьи распался на Аляске, а енисейцы мигрировали оттуда в Сибирь – иначе надо было бы предполагать независимую миграцию разных подгрупп на-дене из Сибири на Аляску.
Насколько достоверны эти выводы?
Прежде всего надо сказать, что родство енисейских языков с на-дене не может пока что считаться строго доказанным методами сравнительно-исторического языкознания (см. об этом полемику Г.С. Старостина с автором дене-енисейской гипотезы Э. Вайдой: http://www.jolr.ru/files/(98)jlr2012-8(117-137).pdf). Родство же самих языков на-дене, т.е. атапаскских языков, ияк и тлингита, доказано. Более того, бесспорно установлена и внутренняя структура этой семьи: сначала праязык на-дене разделился на две ветви: тлингит и ияк-атапаскскую группу, а уже затем ияк-атапаскский праязык разделился в свою очередь на язык ияк и атапаскскую группу. Наконец, распался и праатапаскский язык, породив многочисленные атапаскские языки.
Если выводы авторов статьи верны, енисейские языки должны входить в семью на-дене. Это достаточно смелое утверждение: никто из сторонников дене-енисейской гипотезы, включая её автора, такого не предлагал. Более того, полученное авторами генеалогическое древо дене-енисейских языков предполагает деление их на четыре равноудалённые группы: 1) енисейские языки, 2) ияк + тлингит, 3) атапаскские языки Калифорнии (хупа, маттоле, вайлаки, като), 4) все остальные атапаскские языки. Абсурдность такой классификации очевидна: в ней разбивается единство бесспорной атапаскской группы, а ияк объединяется не с атапаскскими, а с тлингитом. Эта классификация входит в неразрешимое противоречие с методом и результатами сравнительно-исторического языкознания.
Как же авторы пришли к столь парадоксальным результатам? Я не буду рассматривать сами математические методы или оспаривать правомерность их применения к языковой истории. В данном случае, как и во многих других, действует принцип “garbage in – garbage out”: если сколь угодно совершенным алгоритмам подать на вход «мусор» – ненадёжные или непригодные для целей исследования данные, то на выходе ничего, кроме такого же «мусора», не получится.
Надёжнее всего классификация языков, полученная в результате применения сравнительно-исторического метода, подразумевающего реконструкцию праязыка и построение модели его распада. Именно так были классифицированы языки на-дене. Однако это дело крайне трудоёмкое и требующее длительной работы. На данный момент о полноценной реконструкции дене-енисейского праязыка (если такой праязык вообще существовал) не может быть и речи.
Менее надёжны различные автоматизированные методы построения классификации, основанные на подсчёте количества общих признаков из фиксированного списка. В качестве таких признаков может выступать фонетическое сходство морфем с одинаковым значением (обычно корней слов из списка базисной лексики) или типологические признаки из области фонетики, морфологии или синтаксиса.
Традиционно в сравнительно-историческом языкознании считается, что типологические признаки непригодны для классификации языков: они легко меняются под влиянием ареальных контактов; кроме того, типологическое сходство часто бывает и просто случайным. Однако в последнее время появляется много работ, в которых генетическую (не типологическую!) классификацию языков пытаются строить по типологическим признакам. Вызвано это прежде всего тем, что с такими признаками легче иметь дело – по ним есть готовые базы данных, не требующие предварительной обработки. В качестве курьёза можно заметить, что в одной из недавних попыток построить классификацию языков Евразии по типологическим признакам кетский язык объединяется с... ирландским (http://www.jolr.ru/files/(43)jlr2010-4(177-198).pdf).
Признаки, используемые для автоматизированной классификации, должны обладать определёнными свойствами. Во-первых, необходимо, чтобы эти признаки были независимы друг от друга. В случае с лексическими признаками это требование выполняется: фонетический облик слова со значением «солнце» никак не зависит от фонетического облика слова «рука» и т.п. Многие типологические признаки, наоборот, связаны друг с другом: так, если основной порядок слов в языке «субъект – объект – глагол», то в этом языке с большой вероятностью будут иметься послелоги. Таких взаимозависимостей много и в фонологии, и в морфологии, и в синтаксисе.
Во-вторых, чем меньше значений может принимать признак, тем вероятнее чисто случайное совпадение по этому признаку. Например, если мы два раза подбросим монету (орёл или решка – бинарный признак), то шанс получить оба раза одинаковый результат будет больше, чем если мы подбросим два раза кубик с шестью гранями.
Типологические признаки часто бывают бинарными (наличие или отсутствие какой-то черты, «плюс» или «минус»). Напротив, методы, основанные на автоматическом определении фонетического сходства слов, оперируют признаками с большим количеством возможных значений. Возьмём один из таких методов – так называемый «метод консонантных классов». Все согласные языков мира разбиваются на десять классов по месту и способу артикуляции (губные, зубные и т.п.). Рассматриваются только первые два согласных в слове. Если для сравниваемых слов классы, к которым относятся эти согласные, совпадают, такие слова считаются фонетически сходными (например, русское «сидеть» и английское sit). Таким образом, признак «фонетический облик слова со значением N» может принимать 10 x 10 = 100 значений.
Какие же признаки были использованы авторами для классификации дене-енисейских языков?
Это 116 типологических признаков из области фонетики и морфологии; все они бинарные. Известно, что фонетика в языке может меняться буквально на глазах, поэтому большинство из использованных фонетических признаков явно непригодны для получения выводов о далёком языковом прошлом. Например, признак №50 «наличие губного фрикативного» неоднократно менял своё значение на хорошо изученном отрезке истории интересующих нас языков: в праенисейском губного фрикативного звука [f] не было, а в коттском он появился из праенисейского [p]. Не было этого звука и в праатапаскском, но он есть в атапаскских языках цецаут и хэр. Совпадение хэр, цецаут и коттского по признаку наличия [f], таким образом, представляет собой «информационный шум» (кстати, авторы пишут, что при исключении из подсчётов кетского языка коттский оказывается ближе всего к языкам ияк и цецаут).
Но самое интересное то, что многие использованные в статье признаки жёстко взаимозависимы: значение, принимаемое одним признаком, автоматически обусловливает значение нескольких других. Так, признаки с 1 по 18 относятся к устройству системы гласных: признак 1 принимает положительное значение, если в языке три гласных фонемы, признаки 2 и 3 относятся к возможным типам устройства системы из трёх гласных; признак 4 – «четыре гласных фонемы», признаки 5-7 – конкретные варианты системы из четырёх гласных и т.п. Это значит, что, например, «плюс» для признака номер 5 автоматически подразумевает «плюс» для номера 4 и «минус» – для всех остальных признаков с 1 по 18. Дальше – то же: «плюс» для номера 27 («две серии смычных: глухая и глоттализованная») или 28 («три серии смычных: глухая/звонкая/глоттализованная») подразумевает «плюс» для номера 30 («серия глоттализованных смычных»). «Плюс» для признака 105 «показатели субъекта – префиксы» или признака 106 «показатели субъекта – суффиксы», подразумевает «плюс» для признака 107 «наличие показателей субъекта». Подобных примеров можно привести много. Неудивительно, что результаты статистического обсчёта таких некорректно выбранных признаков оказываются парадоксальными и даже абсурдными.
М. Живлов