Русско-татарский онлайн-переводчик и словарь
Государственный язык Республики Татарстан и второй по распространенности язык в Российской Федерации. На татарском говорит свыше 5 млн человек, живущих в национальной республике, а также в Башкортостане, Удмуртии, Мордовии и других регионах РФ. В Татарстане полноценное функционирование национального языка обеспечено преподаванием в учебных заведениях, в частности, в Казанском университете обучение на татарском введено на юридическом, филологическом и факультете журналистики. Способствуют поддержанию языка многочисленные печатные издания, теле- и радиопередачи и т. д.
История татарского языка
У истоков татарского языка находятся языки тюркской группы: булгарский, кыпчакский, чагатайский. Процесс становления происходил одновременно с развитием культуры татар, расселявшихся в Поволжье и Приуралье. При тесном общении с представителями коренного и пришлого населения обживаемых земель происходило взаимное обогащение языков. В татарском ясно прослеживается влияние русского, мордовского, удмуртского, угорского, арабского и персидского языков. Особенно показательны фонетические особенности татарского, перенятые из финно-угорских языков и отличающие его от других представителей тюркской группы.
Самым древним памятником татарской литературы является поэма «Кысса-и Йосыф», написанная в первой половине XIII в. Кул Гали. В поэме булгаро-кыпчакские элементы сочетаются с огузскими. Во времена Золотой Орды на территориях, населенных татарами, употреблялся поволжский язык тюрки́. При владычестве Казанского ханства сложился старотатарский язык со многими заимствованиями из арабского и персидского. Язык был доступен грамотным представителям общества, простые люди не владели этой формой языка. Русизмы проникли в татарский в результате завоевания Казани Иваном Грозным.
На рубеже XIX–XX вв. интеллигенция осваивала османскую лексику. Современный татарский язык на основе казанского диалекта начал оформляться во второй половине XIX в. После революции 1905 года наметилось слияние литературной и разговорной форм языка. Активное развитие терминологии произошло в 20-30-х годах прошлого века, когда язык пополнился новыми словами арабо-персидской, русской и интернациональной лексики. В это же время произошел переход на кириллицу.
Интересные факты
- На испанском, португальском и баскском языках «Татарстан» пишется «Tartaristán, Tartaristão, Tartaria». Двойная буква «р» применяется во французском (sauce tartare), английском (Strait of Tartary), итальянском (Stretto dei Tartari), норвежском (Tartarsundet) и некоторых других языках.
- Англичане называют упрямых мальчиков татарчатами – «young tartar».
- Решительный поступок у японцев получил название «татарский шаг».
- В толковом словаре Даля и энциклопедии Брокгауза и Ефрона сказано, что клич «ура» – форма татарского слова «ур» – бей.
- Татарская письменность до 1927 г. базировалась на арабском алфавите, в 1927-1939 гг. на латинском, с 1939 г. – на кириллице.
- Конституция Татарстана закрепляет право каждого гражданина получить российский паспорт с вкладышем на татарском языке.
- Поэма Кул Гали «Кысса-и Йосыф», написанная в XIII веке, до XIX в. передавалась в рукописях. Литературное произведение было популярным настолько, что книга должна была быть в приданном каждой татарской девушки.
- Первая печатная книга на татарском языке была издана в Лейпциге в 1612 году.
Мы гарантируем приемлемое качество, так как тексты переводятся напрямую, без задействования буферного языка, по технологии Яндекс.Переводчика.
Опережая время: татарский онлайн-переводчик заинтересовал башкир
В Казани презентовали русско-татарский машинный переводчик «Татсофт»
Казанские специалисты разработали русско-татарский машинный переводчик Tatsoft. С помощью сайта любой пользователь сможет переводить с языка Пушкина на язык Тукая и обратно. Презентация проекта состоялась сегодня в Казани. Что предлагает система, насколько она лучше «Яндекса» и чем заинтересовались в Уфе — в репортаже корреспондента «Реального времени».
Опередили время
Сегодня в Казани состоялась презентация русско-татарского машинного переводчика «Татсофт». Мероприятие прошло на площадке молодежного центра «Сэлэт». Сервис, работающий на основе нейросетевых технологий, представляет собой онлайн-переводчик с русского языка на татарский и с татарского на русский.
Чтобы перевести необходимую фразу с русского на татарский и наоборот, достаточно набрать ее в специальном поле на сайте translate.tatar и кликнуть «перевести». Кроме этого, система предлагает озвучивание результатов перевода на татарском и русском языках, двуязычный интерфейс и возможности оценки качества работы. Программа самообучающаяся.
Если пользователю перевод покажется некорректным, он может поставить «дизлайк». Это предложение или словосочетание попадет в специальную базу, которую рассмотрят специалисты, чтоб в последующем предложить правильный вариант перевода.
Проект разработан коллективом Института прикладной семиотики Академии наук Республики Татарстан (ИПС АН РТ). Как рассказал корреспонденту «Реального времени» директор ИПС АН РТ Джавдет Сулейманов, технологию разрабатывали пять человек. К работе привлекались филологи-лингвисты, переводчики, программисты.
В совокупности над сервисом трудились порядка 60 человек. И над этим проектом специалисты работали 30 лет.
«По нашим обязательствам мы должны были показать свой продукт в следующем году. Но мы опередили время», — говорит Ринат Гильмуллин (на фото — слева)
— Более акцентированно мы начали работать над ним с начала 2014 года в рамках государственной программы, — отметил заместитель директора института Ринат Гильмуллин в беседе с нашим корреспондентом. — По нашим обязательствам мы должны были показать свой продукт в следующем году. Но мы опередили время.
Пять лет назад татарстанские айтишники начали сотрудничество с компаниями ABBYY и «Яндекс». В 2018 году ИПС АН РТ разработал первую версию переводчика. В основе подхода была выбрана архитектура encoder-decoder-attention. В 2019 году система была обновлена: построены модели на базе архитектуры Transformer, использовались алгоритмы внедрения языковых моделей в нейросеть. Впервые для русско-татарской пары были проведены эксперименты по использованию параллельных данных для других языков с целью переноса знаний (transfer learning).
Неосвоенный «птичий язык»
В качестве основных обучающих данных используется созданный параллельный корпус объемом 983,3 тыс. пар русско-татарских предложений, включающий тексты новостей, художественную литературу, нормативно-правовые акты. В планах — набрать 10 млн пар предложений.
Как сообщил Сулейманов, всего на создание базы переводчика ушло порядка 40 млн рублей.
По его словам, сайт смогли запустить благодаря АО «СМП-Нефтегаз», которое предоставило им мощный сервер стоимостью 18 млн рублей.
Во время презентации старший научный сотрудник ИПС АН РТ Айдар Хусаинов подчеркнул, что переводчик пригодится 5 млн носителям татарского языка, тем, кто желает освоить «туган тел», журналистам, переводчикам, школьникам и студентам. Кроме того, в Татарстане татарский наряду с русским является государственным, поэтому документы, надписи дублируются на двух языках.
Айдар Хусаинов подчеркнул, что переводчик пригодится 5 млн носителям татарского языка, тем, кто желает освоить «туган тел», журналистам, переводчикам, школьникам и студентам
Более того, он предложил присутствующим сказать какую-нибудь фразу на русском или татарском и опробовать переводчик в деле. Собравшиеся предлагали как простые предложения, так и довольно сложные. В целом сервис достойно справился. Даже смог неплохо перевести пушкинские строки из стихотворения «К***»: «Я помню чудное мгновенье…».
Заминка произошла при переводе на русский названия лакомства «кош теле». Система упорно предлагала варианты «птичий язык» и «язык птиц». Хотя те, кто пробовал это блюдо, понимают, что речь идет о сладком хворосте.
— Разным названиям, именам собственным, фразеологизмам программе еще предстоит учиться, — выкрутился Хусаинов.
Заинтересовались в Башкирии
Подобный сервис (русско-татарский переводчик) есть и у компании «Яндекс». Но Сулейманов и Гильмуллин уверены, что их разработка лучше всех аналогов. Поэтому продукт заинтересовал и другие регионы. Например, в Башкортостане (АН РБ и УФИЦ РАН) теперь тоже хотят взять на вооружение ноу-хау казанцев.
— Башкиры хотят вместе с нами создать свой переводчик — русско-башкирский, — говорит Сулейманов. — Этот проект мы готовы предложить всем народам Российской Федерации, поскольку мы знаем, как это делать. Наши технологии могут работать в любых парах.
«Башкиры хотят вместе с нами создать свой переводчик — русско-башкирский, — говорит Сулейманов. — Этот проект мы готовы предложить всем народам Российской Федерации, поскольку мы знаем, как это делать. Наши технологии могут работать в любых парах»
В частности, уфимский создатель Машинного фонда башкирского языка Зиннур Сиразетдинов, заведующий лабораторией лингвистики и информационных технологий УФИЦ РАН, хочет работать с казанскими коллегами. Также к татарстанцам обращались ученые из республик Средней Азии.
Русско-татарский онлайн-переводчик
На государственном языке Татарстана разговаривает более 5 млн этнических татар и людей других национальностей, проживающих в республике, а также в Мордовии, Башкортостане и Удмуртии. По уровню распространенности в РФ татарский язык уступает только русскому. Национальный язык полноценно функционирует в Татарстане, его преподают в школах и высших учебных заведениях, в Казанском университете на нескольких ключевых факультетах введено преподавание на татарском. Средства массовой информации, вещающие и выходящие на национальном языке, поддерживают и популяризируют национальный язык.
История татарского языка
Основой для формирования татарского были тюркские языки: булгарский, кыпчакский, чагатайский. Татары расселялись в приуральских и приволжских районах, и вместе с этим развивалась их национальная культура. В процессе контактов с коренными и пришлыми этносами взаимно обогащались национальные языки. В современном татарском очевидно прослеживается взаимодействие с русском, мордовским, удмуртским, угорским, арабским и персидским языками. Татарский язык выделяется их тюркской группы фонетическими особенностями, характерными для финно-угорской группы.
Древнейший памятник татарской литературы относится к первой половине XIII века — поэма Кул-Гали «Кысса-и Йосыф», в которой сочетаются булгаро-кыпчакские и огузские элементы. В период владычества Золотой Орды татары пользовались поволжским языком тюрки. Старотатарская форма языка с арабскими и персидскими заимствованиями сформировалась во времена Казанского ханства. Простые люди не пользовались этим языком, которым могли овладеть только грамотные представители общества. Первые русские заимствования появились в татарском языке, когда Иван Грозный завоевал Казань.
Османская лексика вошла в татарский язык в конце XIX — начале XX вв. В это же время начал формироваться современный татарский, основанный на казанском диалекте. Литературный и разговорный языки сблизились после 1905 года, но пополнение языка интернациональными терминами наметилось только в 20-30-х годах. В этот период татарский язык был переведен на кириллицу.
Письменность
Тюрки — предки татар — имели собственную руническую письменность до переселения на Поволжье. Древний язык содержал 8 гласных звуков, для написания которых использовались 4 знака. Согласные записывали 27 знаками. Направление письма — справа налево.
С Х в. более тысячи лет использовалась арабская графика, состоявшая из 28 букв. Алфавит не изменялся до XIX века, потом встал вопрос о несоответствии арабского алфавита и системы звуков языка. За столетия применения арабского алфавита на татарском языке были написаны научные труды, литературные произведения и другие образцы национальной культуры.
В двадцатых годах прошлого века на основе латиницы был разработан общий для всех тюркоязычных народов алфавит. Латинице стали обучать в школах с 1927 года и этот алфавит, называвшийся «яналиф», оставался в употреблении до 1939 года.
Вариант алфавита на основе кириллицы был представлен в 1938 г., и в следующем году его ввели официально. В 1997 году порядок букв в алфавите был изменен. Начиная с 2013 года, разрешено использование латиницы и арабицы в официальном обращении, а парламент Татарстана утвердил закон о языках, включающий пункт об использовании арабицы.
Интересные факты
- Испанцы, португальцы и баски пишут «Татарстан» с двойной буквой «р» — «Tartaristán, Tartaristão, Tartaria». Подобный вариант используется также во французском, английском, итальянском, норвежском и некоторых других языках.
- В Англии татарчатами называют упрямых мальчиков — «young tartar».
- Для японцев решительный поступок — «татарский шаг».
- Согласно Конституции Республики Татарстан каждый гражданин имеет право получить вкладыш к паспорту на татарском языке.
- Поэма XIII века «Кысса-и Йосыф» настолько чтима татарами, что эта книга входила в приданое каждой татарской девушки. До XIX века поэма передавалась в рукописях.
- Первая книга на татарском языке была напечатана в 1612 году в Лейпциге.
Мы гарантируем приемлемое качество, так как тексты переводятся напрямую, без задействования буферного языка, по технологии «Яндекс.Переводчика».