|
Приводом до написання цієї статті послужили три, на перший погляд, мало узгоджувані між собою факти: український “касетний скандал” і викриття чисельних фінансових махінацій в бухгалтерських звітах бельгійської компанії-розробника мовних технологій Lernout &
Houspie, які дивно співпали у часі, та відчайдушний зойк відчаю українських патріотів “То де ж наші українські “ґейтси?”, який широко тиражується на шпальтах національних ЗМІ. Тоня
БІЛОУС
Отож, по черзі.
Поки непересічний українець разом з пересічним ламають собі голову над питаннячком, чи можливо в принципі сфабрикувати записи, підробивши манеру розмови живої людини, не вдаючись до примітивних засобів незграбного звукомонтажу, чи ба навіть комп’ютерного, коли обривки справжніх промов склеюються до купи, в результаті чого голос Пана легко впізнається, але ось збитий темп дихання, невідповідність інтонацій видає фальшивку. І поки “рідні” експерти не можуть дійти згоди щодо того, наскільки складно було б сфабрикувати такого роду плівку, яку вже вивчали і іноземні спеціалісти, а засмучений президент навіть висуває сміливу гіпотезу про існування якогось суперпристрою, відповідь на це питання легко знаходиться на веб-сторінці вже вище згадуваної бельгійської компанії Lernout & Houspie – безперечного лідера розробок у сфері мовних технологій, штабквартира якої розташована на території Фламандської Долини Мов (Flanders Language Valley), що поблизу м.Іпр.
Виявляється, що цей “суперпристрій”, точніше, запатентовані компанією технології натурального (в противагу штучному прим. автора) синтезу мовлення (L&H's patented Natural Language Technology™ чи L&H RealSpeak™) спокійненько собі існують вже багато років, успішно модернізуються та реалізуються у вигляді найрізноманітніших програмних продуктів, походження одного з яких, до речі, видає “український” слід, про що, даруйте, на закуску.
Що ж це воно за “суперштука” така, ця технологія натурального синтезу мовлення? На веб-сторінці L&H
(http://www.lhsl.com/realspeak/features.asp)
маємо змогу у розділі L&H RealSpeak™ прочитати в досить доступній навіть для непрофесіонала формі принципи дії цієї технології та її технічні козирі. Звідки слідує в дещо скороченому вигляді в перекладі з англійської, що:
” Мовна технологія RealSpeak, назва якої може бути перекладена як “природнє звучання” у вигляді її програмного продукту “текст-на-озвучення” (Lernout & Hauspie's RealSpeak Text-to-Speech solution) дозволяє набраний на комп’ютері текст конвертувати (перетворювати) в його озвучений людським голосом варіант. Технологія базується на компілюючих алгоритмах, за допомогою яких “живі” сегменти людського голосу, реалізованого в мовному потоці, зберігаються в базі даних, щоб при нагоді бути використаними синтезатором RealSpeak для конверсії друкованого тексту в його озвучений варіант... Ця система послуговується широким набором сегментів (елементів) мовлення, таких як дифони, склади, а також більш довші звукові послідовності. Це поєднання сегментів мовленнєвого потоку та глибоке лінгвістичне усвідомлення законів цього процесу забезпечують природньо озвучену реалізацію різноманітних текстових вхідних даних.”
Ітак, до найбільших переваг синтезатора RealSpeak в прорівнянні з його попередниками, які всі до одного базувались на принципі штучного синтезу мовлення і відповідно стовідсотково страждали ріжучим вухо штучним, роботоподібним звучанням, є його натуральне звучання, яке уможливлюється завдяки сегментації та компіляції елементів саме живого мовлення. При цьому супутні синтезованому тексту інтонаційні моделі теж реалізуються “живцем”. Такий собі “натур-продукт”.
Нехай мене пробачить читач, необізнаний з “кухнею” такої галузі лінгвістики, як комп’ютерна лінгвістика, в якій все сегментується, компілюється чи конкатинується, а потім генерується, але у світлі нинішніх темних “касетних” перепетій назрів момент і для “чайників” розібратись, куди ж нас ці “буржуйські” дифони можуть довести. Як казав мій один знайомий філософ з одеського Привозу: ”Главноє шо бы усьо было у контєкстє, тоді і коню і конюху буде ясно”.
Отож для “чайників” оповідаю як на духу і дуже простою лексикою, за що в свою чергу прошу пробачення у дипломованих комп’ютерних лінгвістів, яким би я чином сфабрикувала записи з голосом Михайла Горбачова при умові, що у мене є синтезатор RealSpeak компанії L&H.
А чому саме голос пана Михайла, запитаєте ви мене, а чому не голос “с украинской горячей точки”? А тому, що російський синтезатор RealSpeak уже існує, і я особисто знайома з принципом його дії, це – по-перше, а по-друге, Горбачов був найбалакучішим президентом, що є дуже важливою передумовою для успішної генерації його голосу. Саме з його багаточисельних досить емоційних, що теж дуже суттєво, промов, записаних на звукові файли, дуже легко скласти повноцінну, представницьку звукову базу даних.
Для цього спершу потрібно пропустити звукові файли через розумну програму, до того розроблену спеціально для російської мови, яка поетапно конвертує звуковий потік, витворений голосом Горбачова, у відповідний йому текст, потім за кожною графемою (літерою) закріпить відповідну “горбачовську” фонему (звук), а потім все це розріже на звукові “горбачовські” сегменти (відрізки) з відповідно належною до них натуральною “горбачовською” інтонацією і складе в базу даних.
Ітак, у базі даних будуть зберігатись порізані на багато різних шматочків звукові промови нашого екс-лідера, де кожен шматочок отримає оціночний бал його здібності на зворотню конкатинацію (склеювання) з іншими сегментами. Така собі синтезована “груповуха”, де від ступеня успішності сегментного “парування” - і справа і зліва - залежить якість звучання. Уф, здається, готово.
Ну ще трошки прийдеться помарудитись з підлаштунком синтезатора під явно хохляцький пронанс російськой рєчі шанованого екс-президента і - готово, можна запускати. Тепер я просто на комп’ютері набираю любий текст, який мені взбреде в голову і - о, небо, о, боги, він промовляє до мене голосом Михайла Горбачова:” Ну так вот, товарищи. Гласность, перестройка и новое м’ышление, должен вам сказать, сыграли свою далеко не последнюю роль при создании синтезатора RealSpeak! Черт бы их побрал этих проклятых буржуев!”. Бачите, чогось сердиться. Але звучить непогано, навіть наголос на “мышлении” – горбачовський, що викликало зразу підступну ностальгію “за бесцельно прожытыми годами”.
А якщо десь в своїх архівних промовах Горбачов ненароком гикнув, прицмокнув чи, даруйте, перд..в? То це теж не біда, це навіть плюс. Такі синтезовані супроводжувальні ефекти живого мовлення створять чаруючий природній звуковий фон в процесі озвучення ваших текстів.
Коротше, дайош синтезатор Lernout & Hauspie's
RealSpeak! Як ви вже здогадались, мої любі “чайники”, таким синтезатором можна генерувати голос любого улюбленого вам актора, політика, олігарха чи дружнього вам силовика, при умові, якщо він балакає однією з західно-європейських чи російською мовою, ну, в крайньому разі, китайською чи корейською і при цьому балакає багато і “ж’ивенько” ну і при умові, як співається в українських різдвяних колядках:”А ви дядьку гроші - будете хороші.”
А яка опція додається завдяки RealSpeak технології для дядьків-любителів екзотичного сексу з гумовою лялькою? Ця піддатлива розумна лялечка за її допомогою зможе до вас природньо муркотіти і заохочувати до дій голосом чарівної Марлін Монро або не менш чарівного лідера соціалістів Наталії Вітренко, звичайно, при умові, що вона надасть право на користування її соковитим тембром.
В цьому плані україномовним клієнтам не повезло. По причині того, що українська мова не є з розряду комерційних, хоча теперішні події і показують зворотнє, розробку українського синтезатора уповільнено. А розробка синтезатора українського суржика ще й не розпочиналась. Хоча хто його знає, чим займається з 1998 року німецька розвідка, яка так ніжно опікується Слов’янською мовною компанією SlavicDC, яка була чи не найпершим супутником, запущеним в орбіту L&H, і котра об’єднала три, нерозлучні на віки, братні мови: російську, українську та білоруську.
Про це та інші фінансові махінації компанії L&H ви можете дізнатись зі статті бельгійського журналу “Standaart” від 30.12.00, підготовленої редактором цієї газети Вимом Де Притером (Wim De Preter), під інтригуючим заголовком “Приховані питання з порядку денного компанії L&H” та з не менш інтригуючим підзаголовком “Працівники Німецької служби розвідки налагоджували контакти з промисловим сектором” (De verborgen agenda van L&H. Netwerk rond Duitse geheime dienst legde contacten met bedrijfsleven.), яку я вам і додаю до тексту цієї статті в перекладі з фламандської, як дуже цікавий пізнавальний матеріял з містерій сучасного світу мовних технологій.
Ну а тепер і закусить можна. А оповідка буде про козаків-“ґейтсів” зі славного міста Вінниця і про їх славного отамана Олександра Усача.
Але спочатку процитую один з рекламних вигуків з веб-сторінки L&H стосовно її найвідомішого програмного продукта Talking Max™ (розмовляючий папуга Макс), що це - “The World's First Interactive Virtual Talking Pet! (Найперша у світі інтерактивна віртуальна розмовляюча пташка!).
http://www.lhsl.com/talkingmax
І ще про неї написано, що Talking MAX використовує Microsoft Agent технологію. Але ніде я не змогла знайти на цій сторінці жодного натяку на те, що ця комп’ютерна “витівка” була придумана саме у нас на Україні, саме хлопцями-вінничанами (зараз L&H Ukraine), в той час коли кожен бувалий менеджер компанії L&H, проходячи повз рекламний стенд з цим Максом, не лінився черговий раз мені нагадати, що це результат роботи мізків українських вундеркіндів.
Я особисто дуже цим гордилась, але нишком, бо мені по-змовницьки тут же додавали, що це велика комерційна таємниця. Але яка ж то таємниця, коли про неї “чужі” знають, а рідний народ про своїх героїв - ні слухом, ні духом. Та й ім’я Макс, присвоєне цій віртуальній пташині, одразу мені все і видало, чого не вписано в її технічну документацію.
Та це ж Максим, який до біса Макс, це - Максим Залізняк, наш славний запорожець, ім’я якого гриміло на вінницьких та уманських землях. Ось як ви, рідненькі соколики, примудрились таки залишити український слід на вже не вашому тепер найвідомішому продукті L&H. І за те спасибі.
Хоча мушу визнати. Все ж високо цінує і поважає, хоч і нишком, топ-верхівка компанії L&H вашу команду, а то б не запрошувала вашого директора 11 листопада 1999 року на урочисте відкриття Фламандської Долини Мов - S.Al.L. Port Flanders Language Valley. Білла Ґейтса не було, а ось Принц Бельгії Філіп, прем’єр-міністр Бельгії, міністер-президент Фландрії і Сашко Усач були. “І я там був, мед-горілку пив, по вусах текло, а в рот не попадало”.
Ось так, шановні українські шукачі “ґейтсів”. Є вони, не сумуйте. Вони спокійненько собі “гонять” тут, на місці, класний програмний продукт і валять ним і Європу, і Америку, правда, під торговою маркою сильніших, хоч і з добряче підмоченою репутацією, але як ви помітили, все ж не забувають залишити хоч якийсь український слід по собі для прийдешніх потомків гайдамацького роду.
14.02.01
Тоня БІЛОУС,
Бельгія, Фландрія
Декілька слів про автора цієї статті:
В 1993 році закінчила Одеський університет
на кафедрі романо-германської філології,
англійська мова та література,
захистила диплом на кафедрі експериментальної фонетики.
2000 – працювала по контракту в компанії Lernout & Hauspie Speech Products N.V., CR&D Department (Corporate Research & Development), LDC Slavic, в якості лінгвіста (слов'янські мови). Приймала участь у розробці російської та української text-to-speech systems (систем текст-на-озвучення).
Контракт з компанією не був продовжений за взаємною згодою обох сторін.
|