ЧаВо по Фонетическому Транскриптору

  1. Как это работает?
  2. Ничего не понимаю, некоторые слова почему-то не переводятся!
  3. В транскрипции какие-то точки-запятые сверху и снизу,.. скобки,.. Как это понимать?
  4. У вас одна транскрипция, а в словаре другая. Не знаю кому теперь верить!
  5. У вас такая транскрипция, а в гуглопереводчике это слово звучит по-другому.
  6. Копирую в MS Word, а там квадратики. Спасите-помогите!
  7. Сделайте, чтобы транскрипция с подстрочником копировалась в Word! Копируется не пойми что!
  8. Что значит «Учитывать слабую позицию»?
  9. Транскрипция — это хорошо. Но где перевод?
  10. А можно как-нибудь прослушать произношение слов?
  11. Мне кажется, я знаю, как улучшить транскрипцию русскими буквами!
  12. Я задал вопрос в комментариях, но мне лень было его чётко и однозначно сформулировать. Я полагаюсь на ваши телепатические способности.

1. Как это работает?

Этот онлайн-сервис переводит в фонетическую транскрипцию связный английский текст. Это значит, что:

  1. транскрибируются не только словарные формы слов, но и любые производные формы;
  2. транскрипция слов зависит от контекста.
    «Number two» — [ˈnʌmbə tuː], но «number eight» — [ˈnʌmbər eɪt].
    «The cat» — [ðə kæt], но «the hour» — [ði ˈaʊə].

Если вам нужно получить транскрипцию отдельных слов целым списком, то слова должны быть либо разделены знаками препинания, либо находиться каждое на отдельной строке. В этом случае транскриптор интерпретирует каждое слово как отдельный фрагмент и игнорирует контекст.

2. Ничего не понимаю, некоторые слова почему-то не переводятся!

Включить в словарную базу абсолютно все существующие слова не под силу ни одному словарю. Ненайденные слова выделяются красным цветом, регистрируются и наиболее часто повторяющиеся время от времени добавляются в словарь (если это действительно существующее английское слово). В числе ненайденных слов обычно оказываются специальные термины и имена собственные. Тем не менее, на сегодняшний день, больше двух третей таких красных слов это результат орфографических ошибок при вводе исходного текста. Так что, если слово не транскрибировалось, первым делом проверьте есть ли такое слово вообще в английском языке. В особенности это касается «ненайденных» слов из школьного репертуара.

3. В транскрипции какие-то точки-запятые сверху и снизу,.. скобки,.. Как это понимать?

«Маленькие запятые» — это знаки ударения. В английском произношении различается основное и вторичное ударение. «Запятая» вверху строки — это основное ударение, внизу — вторичное. Знаки ударения ставятся перед ударным слогом. Например, [ˌɪntəˌnæʃnlaɪˈzeɪʃ(ə)n].

Символы заключенные в круглые скобки могут игнорироваться при произношении. Например, слово [ˈjɒgə(ː)t] может произноситься и как [ˈjɒgət], и как [ˈjɒgɜːt]. Когда варьируется длительность гласного, как в этом примере, в транскрипции даётся любой гласный из пары короткий-длинный: [ə] — [ɜː], [ɪ] — [iː], [ʊ] — [uː], и т.д.

Другой частый пример — это выпадающий нейтральный безударный звук [ə]: [ˈɒft(ə)n] может произноситься [ˈɒftn] или [ˈɒftən].

4. У вас одна транскрипция, а в словаре другая. Не знаю кому теперь верить!

Расхождения в транскрипции между разными словарями можно разделить на несколько категорий:

  • Разные диалекты. Возможно, вы просто сравниваете британскую транскрипцию с этого сайта с американским словарём. В американском английском есть несколько специфичных звуков и для него используется соответствующий набор символов. Например, британскому гласному [əʊ] соответствует американский [oʊ]. Или скажем, символ длительности гласных [ː] редко используется с американским произношением. И т.д.
  • Разный набор символов фонетической транскрипции. Тут у каждого словаря свои мотивы. Для британского произношения на этом сайте используется набор символов для британского нормативного произношения. В числе наиболее частых расхождений:
    • [ɛ] вместо [е]. На той же странице в Википедии смотрим раздел с гласными. Обратите внимание на звёздочку рядом с [e] в таблице монофтонгов и сноску под таблицей: «В большинстве словарей указывается как /e/, на самом деле верный вариант — [ɛ~e̞].» Ещё одна причина использовать для звука [ɛ] отдельный символ — он произносится иначе, чем [e-] в дифтонгах [eɪ] и [eə]. А здесь развёрнутые аргументы в пользу использования символа [ɛ] (на английском).
    • [-i] в конце слова вместо [-ɪ]. Для этого транскриптора выбран первый вариант из соображений, что, строго говоря, в слове «city», например, две гласные произносятся и звучат не одинаково — [sɪti]. В то же время конечный гласный не такой длинный, как [i:]. Кембриджский словарь тоже использует [i] в конце слова.
    • апроксимант [ɹ] вместо дрожащего [r]. Строго говоря, в английском языке звук «r» — апроксимированный (в отличие от дрожащего русского «р») и в МФА для него есть специальный символ [ɹ]. Тем не менее, в подавляющем большинстве английских словарей используется символ [r].
    • Ещё немного о различиях в наборах фонетических символов — тут, тут и в более систематизированной форме тут.
  • Несущественные фонетические различия. Есть ряд примеров, когда вариации в произношении настолько незначительны и нестабильны, что выбор определяется составителем конкретного словаря, изменениями в языке и прочими второстепенными факторами. Большинство таких случаев так или иначе связаны с редукцией.
    • Редуцированные формы слов. В некоторых словарях может быть указана редуцированная форма слова. Например, [ˈɔːlwɪz] вместо полной формы [ˈɔːlweɪz] для слова «always». Вы можете сообщить о таких случаях в комментариях. Мы стараемся учитывать все варианты произношения, если только они не являются узко диалектными.
    • Переход безударной [ɪ] в [ə]. Например, слово «interest» может произноситься и как [ˈɪntrɪst], и как [ˈɪntrəst] — безударная [ɪ] в аналогичных случаях часто редуцируется в [ə] либо в силу диалектных отличий, либо из-за изменений в языке.
    • Выпадающий [ə]. Нейтральный безударный [ə] (шва) подвержен дальнейшей редукции вплоть до полного выпадения. Поэтому слово «dangerous», например, может транскрибироваться как [‘deɪnʤrəs], [‘deɪnʤərəs] или [‘deɪnʤ(ə)rəs], что по сути одно и то же.
  • Неправильная транскрипция. Безусловно, в любой словарь могут вкрасться ошибки, в том числе и в наш. Если вы увидите на этом сайте слово с сомнительной транскрипцией и сообщите нам об этом в комментариях, то мир станет немножечко лучше благодаря вам. 🙂

5. У вас такая транскрипция, а в гуглопереводчике это слово звучит по-другому.

Расхождения вполне возможны, если вы смотрите британскую транскрипцию, поскольку переводчик Гугла воспроизводит американское произношение.

6. Копирую в MS Word, а там квадратики. Спасите-помогите!

У вас проблема со шрифтами. Прочитайте «Техническое примечание» внизу этой страницы в Википедии:

Большинство символов МФА не включены в наиболее широко используемый шрифт Times New Roman (хотя они включены в версию, поставляемую с Windows Vista), — шрифт, используемый по умолчанию для латиницы в Internet Explorer для Windows. Чтобы просмотреть символы МФА в этом браузере, вы должны настроить его на использование шрифтов, которые включают расширенные символы МФА. К таким шрифтам относятся Lucida Sans Unicode, который поставляется с Windows XP; Gentium, Charis (SIL), Doulos (SIL), DejaVu Sans или TITUS Cyberbit, которые свободно доступны, или Arial Unicode MS, который поставляется с Microsoft Office.

Специальные символы должны отображаться правильно без дальнейших конфигураций в Mozilla Firefox, Konqueror, Opera1, Safari и большинстве других современных браузеров.

Шрифты с поддержкой МФА можно найти здесь.

7. Сделайте, чтобы транскрипция с подстрочником копировалась в Word! Копируется не пойми что!

Опция с подстрочником выравнивает каждое слово относительно его транскрипции с помощью веб-разметки, и потому выглядит так, как она выглядит, только на странице сервиса в браузере. Для того, чтобы получить аналогичный «подстрочник» в Ворде, есть другое решение.

Если вы транскрибируете отдельные слова или короткие фразы, разбитые по строкам, то вместо «подстрочника» вам нужно выбрать опцию «Параллельно с оригиналом». В этом случае текст и транскрипция будут показаны бок о бок и выравнены по абзацам, но при копировании в Word каждая строка транскрипции окажется под оригиналом (хотя и без выравнивания по словам).

Аналогично с длинным текстом, — перед транскрибированием вы можете разбить его клавишей Enter на короткие строчки-абзацы, затем выбрать опцию «Параллельно с оригиналом», скопировать оба столбца, вставить в Ворд — вуаля, у вас получилась транскрипция подстрочником в Ворде.

8. Что значит «Учитывать слабую позицию»?

Некоторые служебные слова могут произноситься в связной речи по-разному в зависимости от позиции в предложении. Подробнее здесь.

9. Транскрипция — это хорошо. Но где перевод?

Поскольку этот сайт даёт транскрипцию связного английского текста, а не отдельных слов, то и перевод логично было бы давать связный. Это задача совсем другого порядка сложности, но мы не теряем надежды. 🙂

Кроме того, у этого сервиса интернациональная аудитория, т.е. перевода только на русский язык будет недостаточно.

Что касается использования бесплатных переводческих API, то все известные нам сервисы накладывают суточные ограничения по бесплатному трафику, которые этот сайт перекрывает за пару часов. Так что, пока в поиске.

10. А можно как-нибудь прослушать произношение слов?

В версии для устройств Apple озвучка уже давно есть. Здесь на сайте озвучка реализована скорее в тестовом варианте, а именно нужно иметь ввиду два момента:

  1. Синтез речи в веб-браузерах разрабатывается не так давно, техстандарты ещё не вполне устоялись, и не все браузеры поддерживают эту технологию. Если ваш браузер поддерживает, то вы увидите кнопки воспроизведения над транскрибированным текстом.
  2. Даже браузеры с поддержкой синтеза речи делают это пока далеко не идеально. Наиболее работоспособная реализация у Safari (7-й версия и старше). Chrome (с версии 33) тоже в принципе воспроизводит речь, но не очень хорошо контролирует воспроизведение: не полностью воспроизводит длинные предложения, слабо справляется с паузой/возобновлением и т.п. Firefox обещает поддержку с версии 45. В текущей версии (42) поддержка есть только под Windows, но она откровенно неудовлетворительна, и вам нужно будет включить флаг media.webspeech.synth.enabled в about:config.

Иными словами, совершенствование этой функции транскриптора в большей степени зависит от дальнейшего развития самой технологии и её будущей поддержки в браузерах. Держим за них кулачки.

11. Мне кажется, я знаю, как улучшить транскрипцию русскими буквами!

Русскими буквами невозможно адекватно передать полный набор английских звуков. Мы старались добиться максимального приближения к английскому звучанию и в то же время максимального удобства чтения для тех, кто совсем не знаком с английским языком.

Скажем, гласный [ɛ] в слове «bed» не такой открытый, как русский «э». К тому же буква «э» и так уже занята под сразу несколько других более открытых английских гласных. Таким образом, слово «never» — [ˈnɛvə], в котором второй гласный намного более открытый, чем первый, мы записываем не [ˈнэвэ], а [ˈневэ]. По крайней мере такая запись не вводит в заблуждение, будто в обоих слогах один и тот же звук.

Другой пример, транскрипция «уёлд» для слова «world» — это попытка отразить полугласный [w] и ни на что в русском языке непохожий напряжённый гласный [ɜː].

Мы посчитали оправданным ограничиться исключительно существующими в русском алфавите буквами (за исключением знаков ударения), поскольку любая компетентная попытка адаптировать кириллицу (или любой другой алфавит) завершилась бы созданием международного фонетического алфавита, который, к счастью, уже изобретён.

12. Я задал вопрос в комментариях, но мне лень было его чётко и однозначно сформулировать. Я полагаюсь на ваши телепатические способности.

Отлично, мы готовы! Эра Водолея и всё такое. Ответ вам тоже отправим телепатически. (Если у вас сломался приёмник, то попробуйте всё же внятно сформулировать свой вопрос в комментариях.)

24 thoughts on “ЧаВо по Фонетическому Транскриптору

  1. Копирование в Word большого отрезка текста с параллельно с оригиналом путем разбиение его на короткие отрезки вручную — это неудачное решение: занимает много времени. Если ставиться цель сделать лучшую программу транскрипции, необходимо как-то решить эту проблему — пусть будет не точно под словом, хотя бы строка под строкой располагалась автоматически. А если учитывать, что многие читают книги в планшетах или электронных книгах, то в перспективе желательно и там решить этот вопрос.
    В идеале (цель -лучшая программа) — возможность подстрочной транскрипции текстов различных форматов.
    Тем не менее огромное благодарность Дмитрию за уже проделанную работу.

    • Владимир, спасибо за критику. В версии для айфона это уже реализовано. В браузере не исключено в будущем, но пока неясно как определять ширину строки, которая нужна пользователю. Возможно, у вас есть соображения на этот счёт?

  2. В кембриджском словаре в транскрипции встречаются точки (например, [ˈɡræn.mʌð.ə] ). Не объясните, что они означают?

  3. Можно вместе с танскрипцией русскими буквами сделать сразу и перевод на русский рядом в скобках

  4. Можно ли сделать паузу между словами? Допустим задержку в 3-5 секунд, и если это возможно сейчас подскажите пожалуйста как это сделать.

    • Спасибо за вопрос. Нужно подумать. Для чего вы хотите это использовать? Не идеально, но как вариант можно паузу нажимать.

  5. Приветствую вас, уважаемые разработчики, спасибо вам за ваш безусловно полезный ресурс. Я с его помощью записал много слов для своего словарика. И всё же, позвольте не согласиться с вами, что любая попытка создать английскую фонетическую систему на основе кириллицы обречена на провал или на впадание в МФА. Вовсе нет. И знаете почему? Кириллистическая- не значит русская, и вообще славянская. Среди букв русского языка действительно, мало звуков для английского, но добавьте к нему букв из башкирского, да у-краткую из белорусского и алфавит для английского на основе кириллицы готов. И это — не безликая международная система, а родные символы для миллионов представителей наших братских народов в республиках Беларусь, Татарстан, Башкортостан. Я хотел написать раньше, но нашёл в ЧаВо данный ответ и самокритично решил воздержаться. Но со временем я понял, что создал не очередную тщетную попытку, а вполне жизнеспособную систему, достойную стать пусть не единственной, но одной из хоть иногда используемых. Прошу взглянуть: http://intensiv.ru/blog/blog_1/mozhno-li-zapisyvat-anglijskie-slova-kirillicej.php извините за ссылку, это ни в коем случае не реклама, просто кроме этого блога мой материал нигде пока не размещён. Готов с вами обсудить все вопросы.
    С уважением,
    магистр Невзоров А.А.

  6. Сайт интересный! Все нравится, но СКОРОСТЬ звучания очень большая! Ползунок практически не работает. Так, в переводчике ПРОМТ, ползунок имеет несколько скоростей. Я пользовался самой малой скоростью, кажется 60 слов в минуту. Если Вы скопируете как у них, то будет замечательно. Федор Зольников. Пока.

    • Расширить нижний диапазон пробовал. К сожалению, это предел в реализации озвучки браузерами. Может быть со временем они её усовершенствуют, тогда расширим на сайте тоже.

  7. Здравствуйте! Как сохранить озвученный текст, чтобы потом прослушать на другом устройстве? Например на телефоне.

    • На сегодняшний день речь синтезируется вашим браузером (не на сервере), поэтому могу только посоветовать поискать среди расширений для вашего браузера. Возможно, есть такие, которые умеют сохранять TTS на диск.

  8. Здравствуйте.
    А можно сделать так, чтобы одновременно выводились и американская и британская транскрипции?

    • Знаки препинания обычно не обозначаются, однако есть соглашения по обозначению изменения интонации. Этот сервис сохраняет знаки препинания, чтобы проще было соотнести транскрипцию с исходным текстом.

  9. Добрый день, будет ли добавлена функция перевода транскрипции в слово, включая омофоны: [red] —> red, read. [mi:t] —> meet, meat. Таким образом, можно было бы по звучанию, которое помним, восстановить слово, которое не помним.

    • Да, будет, но для этого требуется серьезная переработка словаря, поэтому без прогнозов. Работаем над этим.

  10. Здравствуйте. Сайт действительно удачный, благодарю. Лично мне в нем не хватает возможности скопировать сгенерированный текст в буфер обмена. Впрочем, может быть, я этой фичи просто не нашел.

Добавить комментарий для LingoradoОтменить ответ