Логотип Магариф уку
Цитата:

Ярдәмче TatSoft

Әле кайчан гына интервьюдан кайткач, диктофондагы аудиоязманы төннәр буе биткә төшереп, текстка әйләндерә-әйләндерә арып бетә идек. Бүген исә югары ритмлы тормышта заманча технологияләр, аерым алганда, ясалма интеллектны куллану эшне җиңеләйтү өчен менә дигән мөмкинлекләр ача. ТР Фәннәр академиясенең Гамәли семиотика институты белгечләре тарафыннан эшләнгән TatSoft проекты да татар телендә аралашучылар, телне өйрәнергә теләүчеләр һәм, әлбәттә, аны үз эшендә даими рәвештә кулланучыларны күздә тотып, аларга ярдәм йөзеннән тормышка ашырыла. Бүгенге көндә әлеге сервисны кулланучылар саны 2 миллионнан узды инде. Институт директоры, физика-математика фәннәре кандидаты Ринат Гыйльмуллин белән TatSoft платформасын мәгариф тармагында куллану мөмкинлекләре хакында сөйләштек.

– Ринат әфәнде, мондый проект булдыру идеясе ничек барлыкка килде?

– Заман таләбе дип әйтер идем. Ул дөнья буйлап таралган миллионлаган милләттәшебез өчен заманча мәгълүмати-коммуникация технологияләрен үз туган телендә файдалану мөмкинлеген бирә. Республикада яшәүчеләр өчен ике дәүләт теленең берсен өйрәнү, алга җибәрү буларак әһәмиятле. Күп кенә белгечләр, үз эшчәнлекләрен нәтиҗәлерәк итү максатында, Тукай теле мөмкинлекләрен файдаланырга тырыша. Моның өчен локальләштерү, ягъни мәгълүматны тәрҗемә ясалган телдәге халык яки төбәкнең мәдәни контекстына адаптацияләү белән бәйле ысул кулланыла. TatSoft проектының төп максаты компьютерларны һәм программа тәэминатын, мобиль җайланмаларны һәм кушымталарны, шулай ук веб-ресурсларны татар теленә локальләштерү турында мәгълүматны бер урында туплаудан гыйбарәт. Бу  үз чиратында мәгълүматны эзләп табуны җиңеләйтә. Шул рәвешле, телне куллану даирәсе дә киңәя.

Татар шрифты, тора-бара онлайн  тәрҗемә программасы барлыкка килү үз чиратында язма телне кулланучыларга эшләрен җиңеләйтә. «Татарстан Республикасы дәүләт телләрен һәм Татарстан Республикасында башка телләрне саклау, өйрәнү һәм үстерү» дәүләт программасы нигезендә җирле үзидарә органнарында эш ике дәүләт телендә алып барылырга, шулай ук элмәтакталар, юл күрсәткечләре, плакатлар һ.б. шундый мәгълүмати чаралар ике телдә урнаштырылырга тиеш. Бу җәһәттән безнең Tatsoft платформасы әлеге эшне җиңеләйтергә ярдәм итә – тизрәк һәм сыйфатлырак башкарырга мөмкинлек бирәчәк.

 

Тарих:

Институт 1993 елда Казан университеты базасында Ясалма интеллект лабораториясе буларак эшли башлый. Компьютерлаштыру башланган чорда компьютерларны үз телебездә куллана алу өчен татар шрифтлары булдырырга, татар телендәге өстәмә 6 хәрефне клавиатурага урнаштырырга, һәрберсенең кодын язарга кирәк була. Эшчәнлекнең нәтиҗәсе буларак, татар теле төрки телләр арасында беренчеләрдән булып Microsoft пакетына кертелә. Нәкъ менә шул вакыттан алып теләгән һәркем татар шрифтын үз компьютерында куллана ала башлый.

 

Тел мәсьәләсенә яшьләрне тарту юнәлешендә 2021 елдан бирле Р.Г. Бохараев исемендәге Tatar. Бу Хакатон оештырылып килә. Фәннәр Академиясе һәм «Сәләт» хәрәкәте башлангычы белән үткәрелә торган әлеге проект аша укучылар һәм студентлар мәгълүмати технологияләр өлкәсендә татар телен саклау һәм үстерүгә юнәлтелгән кушымта һәм сервислар булдыра, җиңүчеләр акчалата бүләктән тыш Фәннәр академиясендә эшләп алу, белгечләр белән аралашу мөмкинлеге ала. Быелгы Хакатон, мәсәлән, KAZAN DIGITAL WEEK кысаларында 12–14 сентябрьдә узачак.

 

­– Күптән түгел Казан (Идел буе) федераль университетының Филология һәм мәдәниятара багланышлар институтында республика районнарыннан килгән рәсми документларны, сайт материалларын ике дәүләт теленә тәрҗемә итүчеләр квалификация күтәрү курслары узды. Шул вакытта сүзлекләр белән тәэмин ителеш мәсьәләсе дә күтәрелде.

– Татарча-русча, русча-татарча сүзлекләр шактый, алар басма вариантта да, электрон вариантта да бар. Тик алар, гадәттә, аерым сүзләрне генә тәрҗемә итә. Грамматика, семантик мәгънәләрен бөтенләй исәпкә алмый. Ә TatSoft русча-татарча, татарча-русча машина тәрҗемәсе аерым сүзләр белән түгел, җөмләләр белән эш итә. Шул ук вакытта бүген инде ул һәрвакыт кул астында – мобиль кушымтаны Android платформалы һәр телефонга урнаштырып була, үзең белән том-том сүзлек күтәреп йөрергә кирәкми.

 

Туган телебездә яратып кулланыла торган канатлы гыйбарәләр дә күп бит. Аларны система һәрвакыт дөрес аңламаска да мөмкин.

­– Дөрес, машина тәрҗемә иткәндә хаталар да булырга мөмкин. Хатаны һәр кулланучы төзәтә ала. Моның өчен «дизлайк» тамгасына басарга һәм, хатаны күрсәтеп, хат язып җибәрергә кирәк. Лингвистлар моны тикшерәчәк һәм, чыннан да, хаталы икәне ачыкланса, программага дөрес тәрҗемәне «өйрәтәчәкләр». Программа үзенә керткән барлык җөмләләрне дә «хәтере»ндә саклап калдыра. Бер сүз белән әйткәндә, аюны биергә өйрәткән кебек, кеше үзе уйлап тапкан ясалма интеллектны да «иярли» ала.

 

Мондый акыллы ярдәмче укытучы-тәрбиячеләр өчен дә файдалы булачак.

Әлбәттә, педагоглар өчен туган тел дәресләрендә, тәрбия сәгатьләрендә интерактивлык алымнарын кулланып, укучыларны ана телебезне өйрәтүгә кызыксындыру мөмкинлеге зуррак. Чөнки бүгенге көндә текстларны шулай ук тавыш ярдәмендә дә тәрҗемә итеп була.

Әлеге сервисларны әзерләү өчен, зур күләмдәге сөйләм базалары тупланган. Эшебездә датасет дигән технологик термин кулланабыз, ул яздырылган сөйләм үрнәкләре базасы дигәнне аңлата. Сөйләм технологияләре ике юнәлештә эшли: телдән әйтелгән сөйләмне тану һәм текстны синтезлау. Мәсәлән, кушымтаны ачып, фраза әйтеләчәк телне сайлыйсың. Аннары микрофонга басып, фразаны әйтәсең һәм тавыш текстка әверелеп, экранда шуның тәрҗемәсе барлыкка килә.

Әлбәттә, мондый нәтиҗәгә килгәнче, шактый эш башкарылды. Сөйләмне тану өчен тавышлар, сөйләмнәр төрле булырга тиеш, чөнки безнең сөйләм рәвеше бертөсле генә түгел, шул ук дикция кимчелекләре дә бар. Боларның барысын да исәпкә алу өчен заманча технологияләргә мөрәҗәгать иттек. Махсус телеграм бот ясап, кешеләргә төрле фраза, җөмләләрне тавыш белән яздырып җибәрергә сорадык. Бер ел дәвамында 500 дән артык тавыш яздырылды, базага меңгә якын кешенең тавышы кертелде. Җыелган сөйләм үрнәкләре нигезендә нейрочелтәр технологиясе ярдәмендә махсус модель өйрәтелде.

Шулай ук киресенчә дә эшләргә була. Бирелгән текстны система үзе тавышка әйләндерү, ягъни синтезлау өчен сөйләм үрнәкләрен яздырганда камил һәм матур итеп сөйли торган дикторларны яздыру мөһим иде, чөнки теләсә кайсы текст шул кеше тавышы белән яңгырый. Шуңа күрә бу эштә Камал театры артистлары ярдәм итте. Аларның тавышлары махсус студиядә яздырылды. Нәтиҗәдә TatSoft проекты төрле вариантларда эшли ала, ягъни теләгән һәркем текстны язып яисә үзе сөйләп тәрҗемә иттерә ала. Шулай итеп, бу сервис телне өйрәнүчеләргә һәм өйрәтүчеләргә генә түгел, тәрҗемәчеләргә, журналистларга һәм татар мәдәниятен яратучыларга да файдалы булачак.

Татарстан Республикасы Рәисе каршындагы Татар телен һәм Татарстан Республикасында яшәүче халыклар вәкилләренең туган телләрен саклау, үстерү мәсьәләләре комиссиясе ярдәме белән башланып киткән әлеге сервис бүгенге көндә мобиль кушымта һәм аерым телеграм-бот рәвешендә дә эшли. Шуны да әйтергә кирәк: бу хезмәт бушлай.

 

– Ясалма интеллект укытучыларны, журналистларны алыштыра аламы?

Юк, ул һәркем өчен эшне җиңеләйтә торган ярдәмче генә булачак.

 

– Ел башында ТР Фәннәр академиясе тарафыннан фәнне популярлаштыру, фәнни җәмәгатьчелекне фәнни-тикшеренү эшләренең нәтиҗәлелеген күтәрүгә стимуллаштыру һәм яшьләрне фәнни тикшеренүләргә җәлеп итү, фәнни хезмәтнең абруен күтәрү максатларында гамәлгә куелган «Фәнни алга китеш» премиясенең беренче җиңүчеләре билгеле булды. Сез «Фәндә цифрлаштыру» номинациясендә җиңеп чыктыгыз.

– Бу шәхси җиңү генә түгел, мин аны институт белгечләре белән уртак җиңүебез дип кабул итәм. Чөнки туган телне саклау, үстерү, киләчәк буынга җиткерү юнәлешендә цифрлы технологияләрне кулланып алып барылган эшкә һәркем үз өлешен кертә.

 

– Бер чыгышыгызда тел цифрлы мохиттә актив кулланылмаса, киләчәге булмаячак дигән фикер әйттегез.

– Цифрлаштыру – татар телен киләчәккә алып баруның төп ысулы. Без заман белән бергә атларга, аның таләпләренә җавап бирерлек итеп эшләргә тиеш. Шуңа күрә телне турыдан-туры үз эшендә кулланучы мөгаллимнәр, тәрҗемәчеләр, журналистлар белән һәрдаим элемтәдә булу, аларның сорауларына җавап бирүне эшебездәге бер бурыч дип саныйбыз. Шуңа күрә аларны да безнең белән элемтәдә булырга чакырабыз.

 

«TatSoft» – русча-татарча һәм татарча-русча машина тәрҗемәчесе. Еш кына аны сүзлек яки сөйләүлекләр белән бутаучылар күп. Тик машина тәрҗемәчесе ул бер телдән икенче телгә компьютер программасы ярдәмендә тәрҗемә итү дигәнне аңлата.

 

Бу кызык!

Тәрҗемәчеләрне әзерләүдә өч ысул бар:

1. Rule-based – кагыйдәләргә нигезләнгән машина тәрҗемәчесе.

2. Phrase-based, ягъни статистик ысул – ул фразаларга нигезләнгән, бу ысул белән «Яндекс», «Google» эшләгән.

3. Нейрочелтәрле – махсус программа кеше биргән мәгълүматны укый (рәсем, текст, тавыш). Система төгәл мисаллар ярдәмендә өйрәтелә, алгоритмны истә калдыра. Кешенең баш миенә охшатып ясалган нейрочелтәрле «TatSoft» программасы да эш процессын автоматизацияләргә ярдәм итәчәк.

 

Фотолар шәхси архивтан

 

Ландыш Нәсыйхова

 

 

Язмага реакция белдерегез

0

0

0

0

0

Реакция язылган инде

Комментарийлар

БАШКА ЯЗМАЛАР

Ишетми калмагыз

Аудиоязмалар

  • Гильм Камай

  • Җәлилнең якын дусты

  • Ирек Нигъмәти - "Кояш сүнде ул йортта"

  • Ләйлә Минһаҗева - "Милләтебезгә тугры, буыннарга үрнәк шәхес"


ТӘКЪДИМ ИТӘБЕЗ