Kuidas masintõlge muudab pilti Eestist?

Kuigi Eestil on kaks maismaanaabrit, on meie riik ühes mõttes kindlasti saar. Ma pean siin silmas meie keeleruumi, mis on meid läbi ajaloo eraldanud muust maailmast. Ma ei taha praegu peatuda pikalt selle olukorra plussidel või miinustel, vaid hoopis sellel, et saar on kadumas, oleme ühendumas kogu maailma informatsiooni hiidkontinendiga. Seda muuhulgas tänu masintõlke tehnoloogiatele, mida mõnekümne aasta eest peeti lootusetult ulmelisteks.

Google Translate ei ole küll kaugelt täiuslik tööriist, kuid ta muutub paremaks iga kuuga ning täna võib öelda, et kui mõni välismaalane ikka soovib kohaliku poliitiku kõne läbi lugeda, siis vähemalt kõne üldisest mõttest saab ta aru.

Kuid Google Translate pole ainus, masintõlke tehnoloogiast on huvitatud suur hulk tehnoloogiafirmasid ning nende laboratooriumides on tänaseks valmis juba sellised tõlkeriistad, mis on võimelised vahendama isegi reaalajas toimuvat inimkõnet. Nende osalt sõjanduslikel eesmärkidel arendatud tehnoloogiate rakendamine igapäevaellu võtab kindlasti veel aega, kuid masinate õppimiskiirus kasvab tõusvas tempos ning kuigi ma ei oma mingit vastavat infot, ei imestaks ma kriipsuvõrd, kui just Microsofti tiiva all Skype’i kõned mõne aasta pärast masin-sünkroontõlke lisavõimaluse saavad.

See on ajalooline ja uus olukord ning loogiline hüpotees on selline, et isegi kui tõlketehnoloogia ei suuda asendada nõudlikku täppistõlget, on sel tehnoloogial siiski väga suur mõju sellele, kuidas Eestist info välja liigub ning muidugi ka sellele, kuidas ta sisse liigub. Toon vaid ühe näite – Eestit kajastavad täna pigem Eesti fännidest ajakirjanikud nagu näiteks Edward Lucas või siis Eestiga emotsionaalseid sidemeid omavad inimesed. See määrab reeglina ära meie kajastamise küllalt positiivses kastmes.

Ainsad korrad, kui see on teisiti olnud, on olnud siis, kui toimub midagi suurt nagu Estonia katastroof või Eurovisiooni lauluvõistlus, mil tõesti saabub siia suurte kanalite korrespondente Moskvast, Varssavist, Londonist ja muljal. Muul ajal ei tasu investeering kohaloluks, tõlkeks või keeleõppeks ennast välismeedia jaoks ära. See oli nii ja on nii veel viimaseid kuid või heal juhul paar aastat. Tänu masintõlkele on info edaspidi Eestist nii kättesaadav, et meie ministri kõne potentsiaalne publik kasvab hüppeliselt.

Ma usun, et kõik usuvad, et muutused tulevad, kuid millised täpselt? Eesti pole maailma mõistes tähtis koht, kuid sellest hoolimata muudab tõlke odavnemine meie kohta leviva info välja. Kuidas?

Et arutada seda küsimust laiema ringi inimestega, palus Memokraat kuuel eri ala asjatundjal vastata kahele küsimusele.

1. Eesti keelt oskavad maailmas vähesed inimesed ja see on tinginud selle, kuidas Eestist pärit informatsioon on kajastamist leidnud. Kas te arvate, et masintõlke tarkvara (näiteks Google Translate) kiire areng muudab seda, kuidas maailm Eestit näeb?
2. Kui jah, siis kas oskate tuua näiteid konkreetsetest võimalikest muutustest (teie oma valdkonnas või laiemalt)

Allpool on nende vastused (mõned tekstid on inglise keeles, kuid kas ma pean nüüd ütlema, mida nendega tegema peaks…).

Jaan Tallinn, ettevõtja, üks Skype’i loojatest
1. Jah, muidugi muudab. Keelebarjäär on ju alati olnud oluline tõke info levikul. Iseasi et praegu eesrinnas oleva Google Translate’i lähenemine masintõlkele on puht-statistiline ja selliste “jõumeetoditega” teadaolevalt tõlget kunagi perfektseks ei saa. Seega jääb lahti küsimus – kui intelligentsed peaksid masinad olema selleks, et inimkeelt täiuslikult tõlkida? Kui peaks selguma, et ikkagi väga intelligentsed, siis on meil enne masintõlke saabumist hoopis suuremad probleemid.
2. Kujutan ette, et teksti keelevalik saaks sama rutiinseks kui fondivalik – kõige sellest tulenevaga.

Vello Vikerkaar, Eestis elav kanadalane
It’s push versus pull. For translation software to bring news of Estonia to the world an individual reader still has to be pre-disposed to search for (pull) that information. The software itself can’t do it. (How often have I used Google Translate to learn about goings-on in, say, Burkina Faso?) And so on this end (in Estonia) it still takes a human being to give the information a push in a widely-spoken language. Publishing something in Estonian is only slightly more effective than not publishing it at all, and I don’t see Google Translate changing that in any significant fashion. But I’d be pleased if someone would prove me wrong.

Indrek Ibrus, meediauurija
1.  Google’i tõlkemasina arengu osas tuleb esmalt silmas pidada, et selle eesmärgiks on pikas perspektiivis kaasa aidata Google’i enda mitmesuguste teenuste, eriti muidugi reklaamiteenuste lokaliseerimisele. Kohalike keelte automatiseeritud mõistmine aitab üheltpoolt kaasa veebireklaamide täpsemale sihtimisele, teiseltpoolt pakuvad need tõlkemootorid ka võimalust reklaame hõlpsamalt mitmesugustesse kohalikesse keeltesse ümber panna. Et selle viimase eesmärgi saavutamiseni täna veel kuigi lähedal ei olda, teame me kõik – reklaamide piinlikud automaattõlked jäävad neil päevil ju küllap kõigile internetikasutajaile ette.

Ometi on põhjust uskuda, et nende mootorite kvaliteedi märkimisväärne paranemine on vaid mõne lähiaasta küsimus. Lisaks oma teenuste lokaliseerimisele on Google’i eesmärgiks ka teatud laiem ‘vaba veebi’ toestamine. St. selline vaba veeb, mis peab olema vastukaaluks nö interneti balkaniseerumistendentsidele – nähtused nagu suletud ‘teenuste-silod’ (Facebook) või ka näiteks veebist eraldi toimivad mobiili-äppid.

Tõsi, selles “vabas veebis” tahab Google muidugi ise etendada keskset ja asendamatut struktureerijat. Ning needsamad tõlkemootorid on selle rolli teostamisel muidugi oluliseks abimeheks. Jõudes nüüd ringiga esitatud küsimuse juurde, on vastus lihtne: muidugi.

Vajadus mitmesuguseid veebiteenuseid lokaliseerida toob paratamatult kaasa ka selle, et need mitmesugused “kohad” ja senised perifeeriad muutuvad ka ise laiale maailmale kättesaadavamateks. See on lausa omamoodi paradoks – lokaliseerimine toob potentsiaalis kaasa teatud kultuuri-universiaalid – üleilmse tõlgitavuse.

Samas, tõenäoliseks väljakutseks on, et meie ja tegelikult ka kõigi teiste rahvaste nö senine suletud autokommunikatsioon muutub väliselt lihtsalt vaadeldavaks. Vahe riikide siseste autokommunikatiivsete protsesside ja riikide vaheliste dialoogiliste protsesside vahel hakkab hägustuma. Et enese paremas valguses näitamine muutub seega paratamatult raskemaks, siis võiks see anda teed teatud ausamaks rahvusvaheliseks kommunikatsiooniks.

Kui oma probleeme või tegelikku sisemist meelsust enam nii hästi varjata ei õnnestu, siis ehk oskavad riigid lõppeks üksteisega paremini arvestada? Teisalt võimaldavad sedalaadi tõlkemootorid potentsiaalis ka kiiremaid dialooge ühiskondade vahel – ehk siis hüpoteetiliselt võiks ehk rääkida ka teatud piirideülese “avaliku sfääri” toimimisest internetikeskkonnas. Seni on meediateoreetikud sellisesse võimalusesse pigem skeptiliselt suhtunud. Kuid needsamad tõlkemootorid võiksid teatud perspektiivis ehk ses osas uusi uksi avada.

2.  Selliseid juhtumisi, kus välismaalased Eesti asjadest midagi tänu tõlkemootoritele teada saavad ja see minu elu kuidagi puudutaks, pole mul ette tulnud. Küll aga kasutan ma ise neid mootoreid aeg-ajalt välisajakirjanduse uurimiseks. Näiteks loen ma tihti aja kokkuhoiu huvides nõnda Der Spiegelit. Ja kindlasti on see aidanud mul sakslaste nö autokommunikatiivsest diskursist mõnevõrra paremini aru saada.

Kristjan Lepik, finantsist
1. Kui osata kasvõi mõõdukal määral inglise, saksa ja/või prantsuse keelt, siis mõningase grammatika tudeerimise järel on võimalik Google Translate abil kirjutada üsna mõistliku kvaliteediga kiri näiteks hispaania või itaalia keeles. Seega võib öelda, et kui on konkreetne keelebarjäär nii väikese keele nagu eesti keel puhul, siis Google translate lammutab seda mõlemalt poolt – välismaailmal kergem meiega suhelda ja meil ka välismaailmaga. Ja kui vaadata kui kiiresti Google Translate viimase kahe aastaga arenenud, siis viie aasta pärast on tõlkevõimalused sellises kohas, kus me täna hästi ette ei kujutagi. Veebis lokaaliseerimise vajadus kaob ilmselt ära, valid menüüst lihtsalt keele, milles lugeda soovid. Tõenäoliselt sarnased lahendused ka kõne jaoks.
2. Näide: meil on lasteaias mingid saksa neiud praktikal, üks Eesti õpetaja on vanuselt kuuendas kümnes, väga tore tädi, aga saksa keelt siiski ei räägi. Nad suhtlevad siis omavahel nii, et kirjutavad kordamööda oma laused Google Translate’i (nurgas on arvuti) ja saavad suurepäraselt suheldud.

Marek Tamm, ajaloolane, Tallinna Ülikool
1. Maailma huvi Eesti vastu ei piira mitte niivõrd keel, kui huvipuudus; seega ma ei
usu, et masintõlke tarkvara muudaks fundamentaalselt seda, kuidas maailm Eestit näeb.
Mulle tundub üks teine aspekt ehk isegi olulisem: me oleme Eestis harjunud, et keegi
meie omavahelisest suhtlusest aru ei saa, torkab näiteks silma, kuidas meie poliitikud
kommunikeerivad tihti sise- ja välispublikule erinevaid sõnumeid. Kui masintõlke tarkvara
muutub heaks ja üldkasutatavaks, ei saa enam keegi olla kindel, et tema koduauditooriumile
mõeldud seisukohti ei loeta hetk hiljem üle maailma (nagu see juhtub tihti suurtes riikides). Ja see võib meie avalikke arutelusid üksjagu distsiplineerida.

2. Kui vaatan kitsalt akadeemiliselt mättalt, siis on masintõlge muidugi abiks rahvusvahelise
erialakirjanduse jälgimisel. Kui mul on vaja saada teada, mida üks leedukas või hollandlane
on kirjutanud mulle olulisel teemal (ja humanitaarteadustes ei ole kogu teadus õnneks
endiselt üksnes ingliskeelne), siis on masintõlkest üksjagu kasu. Kasu on mul masintõlkest
olnud samuti rahvusvahelise trükimeedia jälgimisel. Kuid üldiselt ma ei usu, et nähtavas
tulevikus masintõlge miski vaimse revolutsiooni põhjustaks. Pigem on muutused lokaalsed ja konkreetsed.

Wolfgang Drechsler, Tallinna Tehnikaülikooli riigiteaduste professor
1. A language that is basically spoken only by a closed set of people (it may be possible to enter the circle, but the costs are very high) serves like a protective wall around that community. Google translate (etc.) really broke down that wall in places, and a wall down in places is, in the long run, down together, even if Leonidas’ successors will valiantly defend the Thermopylae for a while. In some areas, Estonian has effectively worked to protect the people inside the wall from competition and created a sheltered biotope – partially just by self-logic, partially, as I would say from experience, by design (it is normal to try to keep competition away).

Add to this that the logic of the free market, which is central to Estonian civil religion today, is inherently internationalist and anti-nationalist, presenting a problem for political parties that try to be nationalist and free-market at the same time, and you see why this issue is crucial for Estonian development.  It has become so much easier to access documents, read articles, etc. if one’s Estonian is limited that it enables those with very little Estonian to follow discourses but also to participate in decision-making and advisory bodies in an unprecedented way.

This has always been the main obstacle, because of the bulk of information, while to listen to and participate in discussions (with the help of colleagues or assistants as concerns listening) is really not an issue – information is.  Naturally, it will take a while until the consequences become clear, but the trajectory is there.

2. A secondary effect that fits into this question is, I think, that the Estonian functional elite had more or less control over what part of the Estonian discourse would be accessed outside, i.e. a strategic and highly effective consensus to present Estonia to the world.  With Google translate, one can access hitherto untranslated sources that nobody bothered to acces but that may change the picture considerably.  A good example of that are commentaries in blogs, online newspapers etc., which of course, if anonymous or semi-anonymous, always and everywhere attract the lunatics, but the kind of conspiracy theories that seem to be prevalent in Estonia are really astounding, and they enter the mental landscape of those interested, but not overly engaged, in Estonia only now and through this avenue.

Vot sellised lood siis. Mida arvate teie?

  • http://www.argoideon.com archiei

     Lingin ühe paar aastat vana samateemalise kolumni http://www.postimees.ee/?id=160671http://www.postimees.ee/?id=160671

  • http://www.facebook.com/tsarv Tõnn Sarv
  • http://twitter.com/aabram sven vahar

    Tehnoskeptikuna väidan, et masintõlkel kulub veel õige palju aega, enne kui see jõuab aktsepteeritavale tasemele, mis ulatub kaugemale fraasidest “käisin täna kinos” või “mis kell täna lõunasöök on?”. See, et Google Translate midagi justkui teeb, ei näita mitte midagi peale selle, et asi on põhimõtteliselt võimalik. Kuul käisid inimesed aastatel 69-72 ja tõestasid, et jah, läbi häda saab seda teha, aga igapäevaseks pole see senimaani muutunud, kuigi kõik kohe agaralt kosmoseturismi tormilist arengut ennustama asususid.

    Ja isegi kui masintõlge peakski ime läbi jõudma tasemele, kus me mitte ei pea lause mõtet ära arvama, siis ega see tõik iseenesest midagi ei muuda. Keel on vahend, mitte eesmärk ja kui Eesti ei tekita suures mahus huvipakkuvat teavet, mis on saadaval ainult eesti keeles, siis ei ole maailma põhjust ka tõlkemasinate abil meie tegemisi jälgida. Masintõlge võib ära lahendada hulga probleeme, aga Eesti kapseldumine ei ole mitte tehniline vaid psühholoogiline ja sotsiaalne probleem. Toore masinjõuga seda ei lahenda.

    Sellesse utoopiasse ma samuti ei usu, et kõik hakkaksid kohemaid suvaliste keelepaaride vahel infot vahetama, umbes nii, et eestlasest firmajuht kirjutab indoneeslasele tema omas keeles ja too vastab talle eesti keeles. Tegelikult on meil olemas juba üsna hästi töötav universaaltõlkesüsteem ja selle nimeks on inglise keel. See on töötav süsteem koos reaalajalise inimkontrollimehhanismiga.

  • http://www.argoideon.com archiei

    Mu meelest võrdlus kuureisidega pole päris õnnestunud, sest iga kuureis on suuresti püsikulu, masintõlkesüsteemi tegemiseks on aga jõupingutus loodetavasti peamiselt ühekordne – kui ükskord valmis saab, siis toimib ja püsikulud võivad olla üpris väikesed. 

    Inglise keele pointiga aga nõustun, ning sama toimib ju ka masintõlkes – st hetkel on tulemus oluliselt parem kui tõlkida Google abil nt türgi keelest inglise keelde, mitte eesti keelde.

  • http://www.facebook.com/karel.aasrand Karel Aasrand

    mõõduka skeptikuna väidan, et tehnika tapab ka keele ning polüklotluse. Kas pole ahvatlevam osta omale ipad ning sellega sujuvalt võõrlinnas ristelda kui võtta ette kulukas ning ajamahukas keeleõpe… See kõik viib olukorrani kus toimub paratamatu irdumine inimesega otse ja vabalt suhelda. Aset hakkavad leidma avalikud jututoad just nagu seal lasteaias kus nurgas on arvuti. Aga üldiselt ikka positiivsust ning arenguid!

  • http://tarmojuristo.wordpress.com Tarmo Jüristo

    Oh, Google-il on juba täna märksa komplekssemad masintõlke algoritmid olemas kui need, mis avalikus kasutuses on. M.h. tegelevad nad näiteks luule masintõlkega: http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en//pubs/archive/36745.pdf Tegin seda artiklit lugedes ise väikse eksperimendi ning lasin Google-i praegusest, avalikust tõlkemasinast läbi ühe Pablo Neruda kuulsa soneti ning tulemused olid vähemalt minu jaoks tõsiselt üllatavad. Mõnes kohas oli Google-i versiooni vaja pisut kõpitseda (hispaania keel lubab isikulisi asesõnu liberaalsemalt ära jätta, kui inglise), samas oli kohti, kus mina isiklikult kaldusin Google-i versiooni eelistama Stephen Tapscott-i kanoonilisele tõlkele, mida ma võrdluseks kasutasin.

    Sama asja eesti keelde pannes oli tulemuseks muidugi katk ja ikaldus – mis on aga spetsiifilisem probleem ning tuleneb vast eelkõige sellest, et hetkel peetakse nt. hispaania-inglise tõlkemootoriga tegelemist veidi prioriteetsemaks, kui eesti oma lihvimist.

  • http://profiles.google.com/toivo.ellakvere toivo ellakvere

    Tore idee, et artikli kirjutamine on autsoorsitud, sellisel moel on produtseeritud 910 sellest artiklist. magnifisänt.  Ajakirjanik oleks näinud vaeva teksti editeerimisega ala “A ütles et “maakera on ümmargune.” B ei ole nõus.”

  • Anonüümne

    Kõik kordub, mingid piltkirjad, siis hieroglüüfid, tähestik(ud) ja pange tähele internet on toonud uue piltkirja kasutusse – emotikonid. Pole vaja mingeid tõlke, et mõista uut piltkirja. Paar põlvkonda vahetub ja kõik suhtlevad emotikonidega. Tõlgid kaovad ajaloo hämarusse, ainult mõned friigid saavad veel tänastest raamatutest aru ja tõlgivad neid emotikonide keelde.

  • http://www.facebook.com/karikas Kari Käsper

    Masintõlge iseenesest ei muuda lähemas perspektiivis Eesti kajastamise suhtes midagi. Pikemas perspektiivis vist polegi sellist tänases mõistes Eestit, mida oleks mõtet eraldi kajastada.

    Masintõlge on eelkõige kasulik neile miljarditele noortele, kes võiksid/tahaksid saada midagi kõrgharidusega sarnast, aga kellel praegu keelebarjääride tõttu ligipääs teadmistele puudub.

  • http://twitter.com/aabram sven vahar

    > Sama asja eesti keelde pannes oli tulemuseks muidugi katk ja ikaldus
    > – mis on aga spetsiifilisem probleem ning tuleneb vast eelkõige sellest,
    > et hetkel peetakse nt. hispaania-inglise tõlkemootoriga tegelemist veidi
    > prioriteetsemaks, kui eesti oma lihvimist

    Aga selles suuresti probleemi olemus ju seisnebki. Iga keel ja iga keele sees iga spetsiifiline tekstitüüp vajab erinevat lähenemist ja kui selle alla pandav töö õigustab end hispaania ja hiina keele puhul, siis eesti keele puhul kardetavasti see jääbki kategooriasse “see oleks tore, kui kellelgi selleks aega/raha/viitsimist oleks”. Kosmosevallutuse analoogiaga jätkates võib öelda, et meil tasub ära välja töötada teadlaste kiire ja turvaline kosmosejaama viimise viis ja tehnoloogia, sest sealt saadav kasu on suur, aga ei tasu ära kosmoseturisti ja tema koera transpordiühenduse väljaehitamine, sest saadav tulu ei ole samas suurusjärgus. Ja kohalikus mastaabis oleme me ka heal juhul võimelised ise välja töötama enam-vähem talutavad tõlketehnoloogiad inglise, vene ja ehk ka soome või võru keele jaoks. Eesti-malagassi sujuvat automaattõlget kardetavasti meie põlvkonna silmad ei näe.

    Arvestades seda, et inimesed, kes teevad tehnilist tõlget ei tee reeglina luuletõlkeid ja vastupidi ning teades, et seal vahel on terve hulk kitsama spetsiifikaga tõlkevaldkondi, ei usu ma endiselt lähimate aastakümnete jooksul saavutatavasse piisava tasemega masintõlkesse. Tõlge on suuresti kultuurikonteksti ülekandmine teise konteksti ja isegi Google oma mõõtmatute rahahunnikute otsas ei suuda masinale kultuurikonktesti selgeks teha kaugemale kui sinnamaani, et “to have nine lives” tuleb tõlkida hispaania keelde “tener siete vidas”, mitte “tener nuevo vidas”. Ma ei usu, et rehe- ja rohepaplus, tuumamutlus ja muu säärane keele loov osa saaks kunagi masinale jõukohaseks.

    See on ka põhjus, miks tõlkemootori või -tehnoloogia tegemine ei ole ühekordne kulutus. See ei ole asi, mida saab valmis teha ja mis siis järgmised 150 aastat lihtsalt intresse teenib. Vastupidi, see on asi, millega peab kogu aeg  tegelema. Keel ei ole mägi, keel on jõgi. Keelekasutus muutub pidevalt ja kui tõlketehnoloogia selle kaasas ei käi, siis on kogu esialgne investeering olnud suures osas mahavisatud raha.

  • http://www.facebook.com/kronja Jaan Kronberg

    mulle väga meeldis vello vikerkaare seisukoht – see, et teised
    “saavad” lugeda eestikeelseid kõnesid ja uudiseid ei tähenda, et seda ka
    tehakse. vaadakem kas või meie uudisteportaalide sisu – seal ei ole sisu.
    sealt pole mitte midagi võtta, mitte midagi, mis rikastaks muud maailma.
    mis on, muidugi, kurb..

    natuke provokatiivsemat lugemist ka, minu meelest haakub teemaga :)
    http://kronja.osteopathy.ee/pages/posts/e-riik-voi-eesti-keel—kumb-on-olulisem154.php