Автоматска транскрипција на македонски јазик како табу-тема?

Апликации на македонски јазик поврзани со создавање и обработка на содржини на македонски јазик постојат, но не се совршени и обичниот човек тешко доаѓа до нив.

Проблемот со автоматска транскрипција на македонски јазик

Пред извесно време тимот на Арно.мк помина денови во барање апликација која прави транскрипција на македонски говор. Пробавме многу апликации, помеѓу кои платените: Riverside, Rask, Flixier, Goodtape, како и бесплатните достапни на Гитхаб: Seamless, audio-to-transcript, whisper-jax, artificialguy и други.

На ниту една (а ги издвоивме само најдобрите) не добивме задоволителни резултати. Дури и тие кои имаат опција за транскрипција на македонски јазик (македонскиот е наведен како еден од јазиците), резултатот е делумно добар.

Проблемот е најчесто во мешањето зборови, т.е. во транскрипцијата се појавуваат и зборови на бугарски јазик.

Се поставува прашање, дали во 21 век немаме апликација за транскрипција на видео/аудио на македонски јазик и колку воопшто се работи на (условно речено) дигитализацијата и автоматизацијата на македонскиот јазик?

Истражувања постојат, на темата Препознавање на говор на македонски (ASR) се работи веќе речиси 25 години, со последни врвни резултати од препознавање на континуиран говор со голем вокабулар на македонски јазик од 2016-та година.

И покрај тоа се уште немаме достапна и слободна апликација за транскрипција. Зошто?

ФЕИТ работи активно на полето, но…

Со истражување откривме неколку значајни проекти, пред се Говор@ФЕИТ.

Таму ќе најдете неколку значајни проекти:
Сузе – глас за синтеза на говор за асистивни технологии.
Сиборд – апликација за асистивна комуникација AAK.
Вториот том од Фонетика и фонологија на македонскиот стандарден јазик.
Говорко – апликација за асистивна комуникација AAK.

Слушнете ги експертите за нивните мотивации и постигнувања:

Тука се гледа историјата на синтезата на говор на македонски јазик, од Зборувај македонски до Сузе.

Според нашето (лаичко) мислење Сузе има доста недостатоци (со сета почит кон тимот), во однос да речеме на веќе достапниот text-to-speech или read aloud кој е дел од Edge браузерот, каде Microsoft Marija и Aleksandar имаат сосема реалистичен говор.

Но, сепак ова наше мислење не е поткрепено со научни факти и го кажуваме без да ја знаеме заднината на двете апликации (а се разбира Мајкрософт има и неограничени средства).

Исто така значаен е и Говорко, алатка за аугментирана и асистивна комуникација за деца со попречености развиена од студентите на насоката КХИЕ на ФЕИТ.

На Гитхаб пред 4 години беше објавен проект наречен Speech Recognition Macedonian од Благој Христов, но за неговата употреба надвор од програмерските кругови не можеме да зборуваме. Освен тоа, моделот нема упатство за користење и соодветна документација.

Исто така Whisper на OpenAI има можност за транскрипција на македонски, меѓутоа прави грешки и не е бесплатен.

Многу прашања, малку одговори

Се поставува прашањето: зошто сите сајтови и апликации на технолошки и информатички институции во Македонија изгледаат како да се правени во 1990-тите?

Сега да бидеме сериозни: зошто овие апликации не се популаризираат и не се поттикнува нивната употреба во поширока популација и во образованието?

Се разбира тие се значајни за лица со попреченост, но ние сметаме дека секој кој живее во Македонија е, на еден поинаков начин, лице со попреченост во неговиот светоглед.

Опкружени сме (и нашите млади) со негативни влијанија, сиромаштија, пропаганда, турбо-фолк, коцкарници, теории на заговор – постојат многу малку содржини на македонски јазик кои можат да ги инспирираат младите, да им го покажат вистинскиот пат и да им помогнат да се унапредат како личности.

Ние покажавме неколку примери како со помош на вештачка интелигенција, со базични познавања и можности, може да се направат интересни едукативни видеа или илустрирани содржини:

Сепак, проблемот со транскрипцијата на видеата на македонски јазик останува. На пример, за едитирање на видеата ние ја користевме апликацијата CapCut (народска бесплатна верзија на Adobe premiere), но и двете апликации немаат транскрипција на македонски јазик. Затоа моравме да комбинираме повеќе апликации и да ја менуваме рачно транскрипцијата од англиски.

Ова е значајно прашање зашто нашите домашни видеа немаат автоматска транскрипција на YouTube (а таа и инаку знае да биде грешна). Ако сакаме да ја промовираме нашата култура надвор од Македонија, преводот (оригинално на македонски, а потоа и на англиски) е од големо значење.

Доколку некој има направено ваква апликација се замолува да не контактира на contact.arno.mk@gmail.com.

Напишете коментар

Вашата адреса за е-пошта нема да биде објавена. Задолжителните полиња се означени со *