Kielen päällä

14.11.2016

Hyvä, paha konekäännin

Keväällä konekäännösten jälkieditoinnista väitellyt tutkija Maarit Koponen pohtii, millainen asema konekääntimillä on ja voi olla käännösalalla.

Google Translaten tapaiset enemmän ja vähemmän epämääräisiä käännöksiä suoltavat koneet ovat monille tuttuja eikä niillä vielä sellaisenaan ole paljoakaan tekemistä laadukkaiden käännösten kanssa. Konekääntimiä on kuitenkin mahdollista räätälöidä paremmin tiettyihin tarpeisiin sopiviksi, jolloin ne voivat olla suuri apu yhtenä käännöstyökaluna.

Konekääntimistä puhuttaessa viitataan yleensä joko sääntöpohjaiseen tai tilastolliseen konekääntimeen. Ensin mainitulle opetetaan joukko
Maarit Koponen_kuva Suvi Seikkula
- Jokaisen kääntäjän pitäisi olla tietoinen siitä, mitä konekäännöksen jälkieditointi ihan oikeasti on, sanoo Maarit Koponen.
leksikaalisia ja kielioppisääntöjä. Niiden perusteella se rakentaa kohdekielisiä lauseita. Jälkimmäiseen syötetään valtavat määrät lähde- ja vastaavaa kohdekielistä tekstiä, jonka perusteella se ”oppii”, mikä on minkäkin käännös.

- Itse en osaa ottaa kantaa siihen, olisiko jompikumpi parempi tai olisiko sittenkin jonkinlainen hybridi paras, Koponen pohtii.

- Mielestäni olennaista on nimenomaan se, että käännin on jollakin tavalla räätälöity juuri käännettäville teksteille. Jos kyseessä on sääntöpohjainen käännin, on otettu huomioon käännettävän tekstin piirteet tai jos valitaan tilastollinen lähestymistapa, on kone koulutettu juuri niillä saman tyyppisillä teksteillä kuin mitä käännetään.

Koponen pyrkii aina tähdentämään, että ne konekääntimet, joita on ammattikäytössä järkevää käyttää, ovat kaukana Google Translatesta. Tosin eivät perusajatukseltaan niinkään.

- Yksi esimerkki on Euroopan Komissio ja Euroopan parlamentti. Jos heidän käyttämäänsä konekäännintä vertaa Google Translateen, on idea sama ja taustalla olevan teknologian eroja on vaikea nähdä, mutta se mitä komissiossa tehdään eri tavalla on, että siellä on nimenomaan EU-teksteillä koulutettu käännin.

Likinäköinen työkalu

Millainen sitten olisi ihanteellinen konekäännin? Koponen toivoisi ainakin, että se pystyisi käsittelemään yhtä virkettä laajemman alueen kerralla.

- Tällä hetkellä konekääntimet eivät muista tai tajua, mitä on sanottu edellisessä virkkeessä, eli ne eivät huomioi, miten jokin yksittäinen käännös vaikuttaa mahdollisesti johonkin myöhempään kohtaan tai miten myöhempien muutosten olisi pitänyt vaikuttaa aiemmin, Koponen harmittelee.

Konekääntimien kehittäjät pohtivatkin parhaillaan, miten koneet saataisiin tarkastelemaan laajempaa tasoa niin, että ne esimerkiksi osaisivat aiemman tekstin perusteella päätellä, mitä pronominia käännöksessä kuuluisi käyttää. Koponen mainitsee esimerkkinä Jörg Tiedemannin, joka on tutkinut teknisiä toteutustapoja sille, miten kone saataisiin ”muistamaan”.

- Hän on käyttänyt esimerkkinä englanninkielistä sanaa honey, joka tarkoittaa hunajaa mutta voi olla myös esimerkiksi hellittelynimi. Tiedemann pyrkii kehittämään tietynlaisia teknisiä ratkaisuja, niin että jos siinä samassa tekstissä on aiemmin puhuttu mehiläisestä, olisi koneella muistissa, että koska aiemmin on puhuttu mehiläisistä, niin todennäköisesti nyt puhutaan hunajasta.

Kääntäjästä tulevaisuuden sekatyöläinen

Käännösalalla konekäännöksistä on todellista hyötyä vain, kun kuvioissa on mukana jälkieditointi. Se viittaa työvaiheeseen, jossa konekääntimen tekemä raakakäännös hiotaan valmiiksi käännökseksi. Ilman tätä työvaihetta ei saada aikaiseksi laadukasta käännöstä. Siksi ei ole vaaraa, että koneet syrjäyttäisivät aivan heti ihmistyön. Työnteon tavat tulevat tosin muuttumaan.

- Näkisin että varmasti roolit rupeavat sekoittumaan. Entistä enemmän tulee olemaan sellaisia, jotka tekevät monenlaista: kääntämistä, jälkieditointia ja perinteisempää kielentarkastusta. Myös projektien sisällä tehtävät työt tulevat sekoittumaan. Tulee esimerkiksi olemaan välimuotoja, joissa osittain käytetään konekäännöstä käännöksen pohjana ja joitain muita osia taas käännetään perinteisesti.

Tässä yhteydessä laadun arvioinnin merkitys tulee kasvamaan.

- Silloin pyritään jo ennalta arvioimaan tai ennustamaan, kuinka hyvä jokin konekäännös on ja kuinka hyvin se sopii jälkieditointiin. Jos vastaavuus on liian pieni, voi sanoa koneelle, että älä edes näytä sitä. Eli yksi virke käännetään konekäännöksen pohjalta ja seuraava ilman, koska vastaavuus on liian huono.

Huimaa kehitystä muutamassa vuodessa

Koposen oma väitöskirjatutkimus konekäännösten jälkieditoinnista julkaistiin keväällä. Kuusi vuotta aiemmin, kun matka kohti valmista väitöskirjaa alkoi, oli Koponen vielä hyvin epäluuloinen konekäännösten käytettävyyden suhteen.

- Vuonna 2010 konekäännökset suomeen päin olivat tasoltaan vielä niin heikkoja, että tuntui ettei niiden käyttämisessä ole mitään järkeä. Tutkimukseni alkuvaiheen aineisto oli siksi englanti-espanja-konekäännöksiä, joiden suhteen oltiin jo paremmalla tasolla. Pystyi jo jotakin tutkiakin pitemmälle kuin vain sanoa, että tämä on ihan hirveätä. Jossain vaiheessa tuli sitten suomenkin osalta sellainen tunne, että tässähän on ihan oikeasti potentiaalia, tämähän ei olekaan ihan mahdoton ajatus.

"Vielä muutama vuosi sitten oli voimakkaita mielipiteitä, että miksi edes puhumme tällaisesta asiasta opiskelijoille."


Vuonna 2014 pidettiin Helsingin yliopistossa ensimmäinen jälkieditointia käsittelevä kurssi. Sen veti Maarit Koponen.

- Muutama vuosi sitten oli joillakin kääntämisen opettajilla voimakkaita mielipiteitä, että miksi edes puhumme tällaisesta asiasta opiskelijoille. Nyt puhutaan laajemminkin Suomen yliopistoissa, että mitä meidän pitäisi tästä opettaa opiskelijoille, että mitä heidän pitäisi tietää tästä aiheesta, Koponen kertoo muutoksesta.

Lisää tietoisuutta mahdollisuuksista

Koponen itse näkee, että tällä hetkellä ollaan vaiheessa, jossa olisi hyvä alkaa lisätä käännösalan opiskelijoiden tietoisuutta siitä, mitkä ovat konekäännösten jälkieditoinnin tuomat mahdollisuudet, hyödyt ja uhkat.

- Olen opettanut käännösteknologiaa ja puhun paljon konekääntämisestä, mutta painotan aina, etten missään nimessä halua tehdä opiskelijoista siinä mielessä teknologiauskovaisia, että tämä olisi heistä jotenkin paras juttu ikinä, joka ratkaisee kaikki ongelmat. Jokaisen kääntäjän pitäisi olla tietoinen siitä, mitä konekäännöksen jälkieditointi ihan oikeasti on. Aina pitäisi olla realistinen kuva siitä, mikä milloinkin on mahdollista ja mikä ei ainakaan ole mielekästä käyttöä.

Mielekästä käyttöä ei ole esimerkiksi Google Translatella tehty raakakäännös, joka vain ”nopeasti katsotaan läpi”. Mielekkyyteen liittyvät oikeat työtavat ja välineet sekä kohtuulliset odotukset.

Roska pysyy roskana muistissakin

Jotkut suomalaiset freelance-kääntäjät ovat jo ottaneet käyttöönsä suomalaisyrityksen kehittämän Sunda-konekääntimen. Konekäännin pitäisikin nähdä nimenomaan yhtenä kääntämistä avustavana työkaluna.

- Siitä saattaa joskus olla hyötyä ja joskus ei. Eihän käännösmuististakaan aina ole. Laadusta puhuttaessa käännösmuisteihin pätee se sama kuin konekäännöksiinkin, eli ”garbage in, garbage out.” Jos pistät sinne huonon käännöksen, niin ei sieltä hyvää käännöstä ulos tule.

"Siihen, miten määritellään hyvä konekäännös, liittyy vahvasti se, mihin tarkoitukseen se on menossa."


Konekäännösten käyttökelpoisuuden parantumiseen liittyy myös alan asiakkaiden muuttuneet odotukset. Enää ei käännetä vain lähinnä julkaisukelpoista tekstiä, vaan käännöstä käytetään hyvin monenlaiseen tarkoitukseen. Joskus tarvitaan vain ylimalkainen kuva tekstin sisällöstä. Silloin ei tarvita ammattikääntäjän loppuunsa hiomaa kielellistä helmeä.

- Mielenkiintoinen havainto matkan varrella on, että siihen, miten määritellään hyvä konekäännös, liittyy vahvasti se, mihin tarkoitukseen se on menossa. Tiedän että tämä on kääntäjien parissa vähän sellainen herkkä aihe. Toiset eivät tykkää, että ”tarpeeksi hyvästä” edes puhutaan. Elämän realiteetti on kuitenkin se, että ketään ei kiinnosta, kuinka hyvä se käännös olisi ensi maanantaina, jos se tarvitaan tänä perjantaina.

Toisaalta, jos asiakas tarvitsee huippuunsa hiotun käännöksen, joka tavoittaa kaikki kulttuurilliset nyanssit, on konekäännöksillä vielä pitkä matka sellaiseen laatuun, että jälkieditointi tulee kannattavammaksi kuin alusta asti ammattilaisen tekemä käännös.

Teksti ja kuva: Suvi Seikkula

Lisää aiheesta
Yksikin myrkyllinen keksi voi pilata konekäännöksen


Palaa otsikoihin


Poutapilvi web design - P4 - julkaisujärjestelmä