Как диалекты становятся языками
Языки постоянно развиваются, подобно живым организмам. Некоторые из них умирают и исчезают бесследно, другие оставляют наследников.
Эти наследники иногда воспринимаются как обновленная версия того же самого языка (например, древнеанглийский и современный английский, древнерусский и современный русский), а иногда – как совершенно иные языки. Так, например, произошло с латынью и развившимися из нее романскими языками. Как раз о подобных случаях мы сегодня и поговорим.
Современные романские языки связывает общий предок – латынь, и они развились из различных ее диалектов. Резонным представляется вопрос, в какой момент они превратились из говоров в самостоятельные языки. Вопрос более чем актуальный в наше время, потому как и сегодня временами ведутся жаркие споры по этому поводу.
Так, например, в мире спорят о статусе скотса (также известного как шотландский английский), нижненемецкого (не то диалект немецкого, не то самостоятельный язык), хорватского, черногорского и боснийского (то ли языки, то ли диалекты сербского), молдавского и румынского, ну и, конечно же, особенно в этих ваших интернетах, украинского и белорусского языков.
Проблема здесь заключается, в первую очередь, в том, что внятных лингвистических критериев различения языков и диалектов попросту нет.
Если попробовать сформулировать хоть какие-нибудь признаки, которые могут помочь отличить язык от диалекта, получится примерно такой список:
1. Он должен быть родным для некоторой группы людей;
2. Он должен быть непонятным для других групп людей, что подразумевает некоторые особенности лексики, фонетики и грамматики;
3. У него должны быть различные стилевые регистры и собственный литературный стандарт.
Список, на самом деле, достаточно условный, и его можно хоть дополнять, хоть сокращать, но одно останется неизменным — все эти критерии, по сути, бессмысленны. Какими бы убедительными они ни казались, всегда найдутся языки, к которым их применить невозможно.
Разберем по пунктам.
1. Не все языки, чей статус не оспаривается, имеют «свое» население. Это, в первую очередь, мертвые языки: какой-нибудь шумерский или готский не являются родными ни для кого вообще.
Во вторую очередь – искусственные языки. Те же квенья или клингонский, без сомнения, языками являются, но коренных носителей у них тоже нет и вряд ли когда-то будут (да и слава богу).
2. Критерий понятности/непонятности вообще не очень внятный и весьма субъективный, потому что то, что понятно одному человеку, может оказаться совершенно непонятно другому.
Если же говорить о чем-то более конкретном, то есть языки, которые считаются разными, но их носители понимают друг друга вполне неплохо. Это, например, все славянские языки: никто не будет спорить, что польский, русский и сербский – разные языки, но в целом люди, которые владеют хотя бы одним из них, могут хотя бы худо-бедно понять друг друга.
То же самое справедливо и применительно к континентальным северогерманским языкам, а также к большинству романских языков. Так испанцы, португальцы и итальянцы, например, неплохо понимают друг друга, списывая различия на «говорок». А вот французов все они понимают не очень хорошо.
Сравним, для интереса, как на испанском, итальянском, португальском и французском будет выглядеть одна и та же фраза «Я покупаю книги в магазине»:
Исп. Compro libros en una tienda
Ит. Compro libri in un negozio
Порт. Eu compro livros em uma loja
Фр. J’achète des livres dans un magasin
Несмотря на то, что слово «магазин» сильно различается во всех четырех случаях (а слово книги, наоборот, везде почти одинаковое), очевидно, что у первых трех языков степень сходства заметно выше.
В то же время, бывает и так, что люди, которые говорят (как считается) на одном языке, совершенно не понимают друг друга из-за диалектных особенностей. Это, в первую очередь, справедливо по отношению к английскому. Причем я не говорю о различиях между британским, американским и австралийским английскими, и даже не о всяких «неанглийских» английских вроде индийского или ямайского — здесь как раз понятность еще более-менее присутствует. А вот в крошечной по размерам Англии диалекты могут различаться прямо-таки радикально. Тем, кто говорит на «стандартном» RP, который обычно преподается в школах по всему миру, или на чем-то более-менее к нему близком, будет крайне сложно понять кокни (даже без сленга) или, скажем, скауз (ливерпульский английский). Причем сложно будет не только нам, изучающим английский как иностранный, но и носителям. Тем не менее, это один язык.
Вот неплохое видео по теме, которое я нашел на ютубе, для наглядности:
3. Со стилевыми регистрами и литературным стандартом тоже все не так однозначно. Во-первых, не у всех языков в принципе есть письменность, а следовательно и литературные стандарты, что, естественно, не делает их диалектами. С другой стороны, стандарты разных языков могут быть очень похожими, как у все тех же скандинавских языков, в особенности у датского и норвежского букмола. При этом у того же норвежского есть два литературных стандарта на один язык.
Разберем все ту же фразу, записанную по-норвежски (на двух стандартах), а также по-датски и по-шведски.
Норв.б: Jeg kjøper bøker i en butikk
Норв.н.: Eg kjøper bøker i ein butikk
Дат.: Jeg køber bøger i en butik
Шв.: Jag köper böcker i en butik
Очевидно, что, зная один из этих языков, читать другие не составит большого труда. С произношением будет чуть сложнее (по крайней мере с датским).
Пример выше также не совсем отражает это, но словоупотребление в норвежском и датском совпадает друг с другом чаще, чем со шведским, да и орфография последнего обычно имеет более значительные отличия.
Если говорить о регистрах, то их количество не может быть критерием, ведь у разных языков может быть в принципе разное число регистров, но это не делает их языками в большей или меньшей степени.
Так что же все-таки позволяет отличить язык от диалекта? Сошлюсь на глубоко мной уважаемого профессора Дэвида Кристала (книга English as a Global Language), который вывел всего два критерия. Оба они совершенно нелингвистические. Итак, для того, чтобы признать тот или иной диалект полноценным языком необходимо следующее:
— наличие сообщества говорящих, которые единогласно считают свою речь отдельным языком;
— наличие у этого сообщества определенных политических и экономических возможностей, которые заставили бы другие народы считаться с мнением данного сообщества.
На деле таких сообществ, возможно, было и больше, но не у всех оказалось достаточно «политических и экономических возможностей» отстоять свою идентичность. Поэтому, например, неспециалисты говорят об итальянском языке, как о некоем целом, несмотря на большое количество диалектов и значительные различия между ними.
Чем полноценный язык отличается от диалекта (спойлер: не только названием)
Спросите специалистов по языковедению, в чем разница между языком и диалектом, — и ваш разговор затянется на несколько часов. Потому что короткого однозначного ответа нет. Но его пытается найти датский лингвист Серён Вихманн: он разработал программу, которая анализирует языки и сравнивает их друг с другом. Почитайте, как он рассказывает об этом порталу Aeon.
С точки зрения политики, язык — это то, на чем говорит нация. С 1850 по 1992 годы, например, существовал язык, который был известен как сербо-хорватский. Он включал в себя три диалекта: сербский, хорватский и боснийский. Но так как в середине 90-х Югославия разделилась на несколько независимых государств, эти диалекты были признаны самостоятельными языками.
Политическое определение языка в какой-то степени работает, но в конечном итоге создает больше проблем, чем решений. Есть языки, на которых говорят в разных странах — например, испанский в Латинской Америке. Никому не придет в голову заявить, что испанский, на котором говорят в Мексике, и испанский Колумбии — это два разных языка. А испанский, на котором говорят в некоторых частях Испании, так сильно отличается от своих латиноамериканских разновидностей, что впору было бы объявить его полноценным языком.
Может, разницу между этими понятиями можно объяснить с точки зрения того, насколько хорошо люди, говорящие на языке и диалекте, понимают друг друга? К сожалению, и этот подход не выдерживает критики. Датчанин поймет шведа лучше, чем швед — датчанина. У человека, который говорит на своеобразном сельском диалекте британского английского, гораздо больше шансов понять американца из Лос-Анджелеса, чем наоборот. Взаимопонимание собеседников зависит скорее от взаимодействия, чем от языковых факторов. А взаимодействие между людьми — вещь довольно изменчивая, его трудно контролировать.
Поэтому давайте придерживаться сугубо лингвистического подхода. Представьте, что мы можем измерить разницу (обозначим ее D) между двумя вариантами речи. Тогда величина D, принимая определенное значение, может определить границу между двумя диалектами и двумя языками. Величина D однозначно существует, ведь в языках полно особенностей, которые можно сравнить: звуки, грамматические характеристики, лексика.
Как алгоритмы помогают назвать вещи своими именами
Недавно мы поняли, как измерить разницу между речевыми вариантами и определить значение переменной D. В 2008 году группа лингвистов создала автоматизированную программу оценки сходства (Automated Similarity Judgment Program, или ASJP). Я один из ее основателей и ежедневных кураторов. Эта программа тщательно отбирает, систематизирует и сравнивает языковые данные.
В ASJP хранятся 7655 списков слов из двух третей мировых языков, если ориентироваться на ISO 639-3 (международный стандарт классификации языков мира, где каждому языку присваивается уникальный идентификационный код — Прим. ред.). Поскольку каждый список слов содержит фиксированный набор из 40 понятий и расшифровывается единообразно, их можно легко сравнить и измерить разницу.
Разницу между двумя словами измеряется очень просто — с помощью версии расстояния Левенштейна (названо в честь советского ученого Владимира Левенштейна). В 1965 году он разработал алгоритм для сравнения двух строк символов. Он определил «расстояние» как количество замен, вставок и удалений одного символа, нужное для превращения одной строки в другую.
Чтобы можно было поместить этот показатель на шкалу от 0 до 1, мы делим расстояние Левенштейна на количество символов одной из двух строк (той, которая длиннее). Получается «нормализованное расстояние Левенштейна», или LDN.
Понятия «язык» и «диалект», возможно, присваиваются произвольно и даже интуитивно. Но здесь есть многообещающие подвижки. Если посмотреть на все языковые семейства в ASJP (а там довольно много близких, родственных вариантов), можно увидеть, что пара языков и пара язык-диалект проявляют себя по-разному. Вот что интересно: нормализованное расстояние Левенштейна склонно колебаться либо относительно небольшого значения переменной, либо относительно достаточно крупного. Между этими двумя значениями — внушительный «зазор».
Как выяснилось, этот «зазор» чаще всего находится в довольно узком диапазоне. Его среднее значение — 0,48 LDN
Разновидности речи, скорее, не похожи друг на друга в основной лексике. Если они больше похожи, мы можем определить их как диалекты (и значение LDN меньше 0,48), если же они меньше похожи или совсем не похожи — это разные языки (значение LDN выше 0,48). Вот вам и главное различие между языком и диалектом.
Диалекты, вероятно, «удаляются» друг от друга по мере того, как люди переселяются на новые места и формируют новые идентичности. Но если люди продолжают контактировать, их язык все-таки сохраняет точки соприкосновения. Пусть речевые разновидности совпадают лишь наполовину, это будет все еще один и тот же язык. Стоит им лишь немного разойтись, наступает своеобразная точка невозврата: диалекты становятся все менее и менее похожими, расстояние Левенштейна между ними увеличивается — и вот это уже два разных языка.
Некоторые диалекты лишь маскируются под полноценный язык. И наоборот
Поскольку мы нашли объективный и непроизвольный критерий, по которому можно отличить язык от диалекта, мы можем применить его к языкам мира. Некоторые пары речевых разновидностей, которые считаются национальными языками (боснийский и хорватский), на шкале нормализованного расстояния Левенштейна LDN находятся ниже предельного порога в 0,48 LDN. То есть, несмотря на распад Югославии, это один и тот же язык.
Некоторые языковые разновидности совсем чуть-чуть не дотягивают до этого порога — например, хинди и урду (то есть разными языками их можно назвать с большой натяжкой). А показатель LDN у разновидностей китайского, которые часто рассматриваются как один язык, взлетает выше отметки 0,48, поэтому на самом деле речь идет о разных языках. Та же ситуация — с арабским.
Есть несколько пар языковых разновидностей, которые мы рассматриваем как самостоятельные языки, а на самом деле их значение LDN тоже опасно близко к предельному порогу. К примеру, LDN шведского и датского языков равняется 0,4921.
За какой срок диалекты становятся самодостаточными языками
Наконец, есть метод, с помощью которого можно определить, сколько времени потребуется диалектам, чтобы окончательно разделиться и стать отдельными языками. Этот метод, который мы назвали ASJP-хронологией, был получен на основе наборов языковых данных.
Учитывая возможную погрешность, мы пришли к выводу, что речь идет приблизительно о 1059 годах
Чтобы подтвердить эту цифру, мы анализировали, за какое время протоязык (язык-прародитель — Прим. ред.) какой-либо языковой семьи распадался на дочерние языки — предков языковых ветвей. Для этого используются другие методы подсчета, но результаты совпадают: пройдет примерно тысячелетие, прежде чем диалекты станут самостоятельными языками. В этом мы уверены, потому что теперь знаем, чем одно отличается от другого.
Об авторе: Сёрен Вихманн — датский лингвист, который сотрудничал с Лейденским университетом в Нидерландах, Казанским федеральным университетом в России и Пекинским университетом языка и культуры в Китае. Соавтор книги Temporal Stability of Linguistic Typological Features.



