словари произношения и user generated content

те программы-словари, которыми мне приходилось пользоваться, обычно включали в себя очень полезную возможность послушать, как слово произносится носителем языка. То же самое есть и на Яндекс.Словарях и на Google Translate. Однако онлайн-словари и «Лингво» используют собственные базы, и наверняка ни с кем не захотят ими делиться. И, если хочется иметь на наладоннике хороший словарь, то «Лингво» (если он вообще выпущен под эту ОС) стоит денег, а на gprs-трафик денег за границей не напасёшься.

хорошо, что есть, например, открытая база WyabdcRealPeopleTTS — 70 мегабайт wav-файлов с 20 тысячами английских слов. Плохо, что это только для английского языка. Кроме того, как я понимаю, ей уже довольно много лет.

возможно, проблему может решить хороший движок text-to-speech. Правда, я довольно далёк от темы, и последнее, что я слышал про хорошее TTS, — что весит оно гигабайта полтора, и, видимо, тоже только для английского. Наверное, если отрезать от него всё, кроме произнесения отдельных слов, он станет полегче, но сомневаюсь, что сильно легче. Интересно, какая с ними сейчас ситуация на самом деле?

возможно, на помощь может прийти толпа. Довольно легко сделать сайт, который показывает посетителю три слова по очереди и просит произнести их в микрофон. Флеш записывает звук, жмёт его хотя бы в ogg и шлёт на сервер. Другой посетитель получает три варианта произношения одного слова и выбирает из них лучший. Все получают какие-нибудь бейджики и соревнуются друг с другом. Сервер же раздаёт торрентами готовые базы произношений на 5, 10, 20, 50 тысяч самых употребляемых слов каждого языка.

понятно, что ugc не без проблем, обычно их можно преодолеть. Но нужны ли словари произношения кому-нибудь? Имеет ли смысл заниматься этим?

ps: долгое время я пользовался Stardict и ценил его за перевод текущего выделения. Однако его бесчеловечность мне всё-таки надоела, так что теперь я не могу нарадоваться на фичи GoldenDict, чего и вам рекомендую.

Артемий Трегубенко,

comments powered by Disqus