Hoppa till innehållet

Google Translate är (fortfarande) hopplöst dåligt på att översätta svenska klassiker

Med en ny teknik vill Google Translate göra yxiga och kantiga översättningar till ett minne blott. Tjänsten rullades nyligen ut i Sverige. Men hur fungerar den? Di Digital har testat och är inte helt imponerade.

August Strindberg och Selma Lagerlöf. Kollage.
August Strindberg och Selma Lagerlöf. Kollage.

Dagligen använder miljontals människor över hela världen Googles översättningstjänst Google Translate som lanserades 2006. De flesta som har använt verktygen har nog reagerat på de ibland yxiga och kantiga översättningar den producerar.

Längre fraser eller meningar från skönlitteratur blir ofta obegripliga eller helt manglade.

Eller blev.

Hösten 2016 uppmärksammade nämligen en del användare att översättningarna plötsligt hade blivit bättre och lättare att förstå. Sökjätten hade då rullat ut tjänsten i en ny tappning, med stöd för åtta språk, som översatte på ett sätt som ligger närmare hur vi människor använder språket.

I stället för att översätta fraser i mindre delar så har Google gått över till ett system som de kallar ”neural machine translation” som översätter hela meningar på en och samma gång. Genom att ta hänsyn till meningens kontext menar sökjätten att de kan hitta den mest relevanta översättningen.

”Översättningarna blir nu mer exakta och liknar bättre det språk vi människor använder när vi pratar med varandra”, säger Andrea Lewis Åkerman, som är kommunikationsansvarig på Google i Sverige och Finland, till Di Digital.

Ett reportage i New York Times från i vintras visade på närmast perfekta översättningar från japanska till engelska tack vare den nya tekniken. Nyligen fick den uppdaterade översättningsalgoritmen stöd för översättning från svenska till engelska och vice versa.

Maskininlärning är ett central tema, säger Andrea Lewis Åkerman.

”Google Translate kommer bara att fortsätta bli bättre allt eftersom fler översätter genom tjänsten, eftersom teknologin gör att systemet nu lär sig att skapa mer naturliga och lättförståeliga översättningar.”

Hur blir då översättningarna efter att Google bytt ut sin översättningsalgoritm?

Di Digital har testat med två klassiska inledningar ur den svenska litteraturhistorien och en från den amerikanska.

Selma Lagerlöfs vackra inledning till ”Gösta Berlings saga” lyder:

”Äntligen stod prästen i predikstolen. Församlingens huvuden lyftes. Så, där var han ändå! Det skulle inte bli mässfall denna söndagen såsom den förra och många söndagar förut. Prästen var ung, hög, smärt och strålande vacker.”

I Google Translates översättning blir det:

”At last the priest stood in the pulpit. The heads of the congregation are lifted. So, there he was anyway! It would not be fairfall this sunday like the last and many sundays before. The priest was young, tall, painful and radiantly beautiful.”

Google Translate missar alltså översättningen av ”mässfall” och gör den meningen svårförståelig överlag. ”Smärt” förvandlas dessutom till ”painful”. Resten är, om inte perfekt, så åtminstone läsbart.

August Strindbergs klassiska inledning till ”Hemsöborna” lyder:

”Han kom som ett yrväder en aprilafton och hade ett höganäskrus i en svångrem om halsen. Clara och Lotten voro inne med skötekan att hämta honom på Dalarö brygga; men det dröjde evigheter innan de kommo i båt.”

I Google Translates översättning blir det:

”He came as an appetite an aprilafton and had a tall easter egg in a strap around his throat. Clara and Lotten were in a hurry to pick him up at Dalarö Pier; But it lasted forever before they got into a boat.”

Strindbergs mer komplexa språk ställer till det för Google Translate. ”Yrväder” blir ”appetite”, ”aprilafton” översätts inte alls och ”höganäskrus” blir ”tall easter egg”, för att nämna några problem.

Inte särskilt imponerande, enligt Anna Sågvall Hein. Hon är professor emeritus i datorlingvistik vid Uppsala universitet och vd för Convertus, ett maskinöversättningsbolag som grundades vid universitetet.

”I en riktig litterär översättning jobbar översättaren otroligt mycket med att skapa rätt stämning och rätt känsla. Allt går förlorat i en mekanisk översättning”‚ säger Anna Sågvall Hein som påpekar att Google Translate fortfarande ger ett mycket mindre varierat språk än traditionell litterär översättning.

Googles översättningar grundar sig inte på ett lexikon, där till exempel ”bord” alltid blir ”table”. Därmed riskerar ”smärt” att översättas till ”painful”, som i fallet med Selma Lagerlöfs text ovan, i stället för till exempel ”slender”.

”Google Translate bygger på sannolikheter. Östergötland kan bli Västergötland eftersom de två har förekommit i samma kontext många gånger. Det är en fundamental skillnad mot annan översättning.”

Resultaten blir dock något bättre i översättningen från engelska till svenska.

Vi testade detta med inledningen från Scott F Fitzgeralds klassiker ”The Great Gatsby”.

Den lyder:

”In my younger and more vulnerable years my father gave me some advice that I’ve been turning over in my mind ever since.

'Whenever you feel like criticizing any one,' he told me, 'just remember that all the people in this world haven’t had the advantages that you’ve had.'”

I Google Translates översättning blir det:

”I mina yngre och mer sårbara år gav min far mig några råd som jag har vända mig om i mitt sinne ända sedan.

'När du känner för att kritisera någon', berättade han för mig, 'kom bara ihåg att alla människor i den här världen inte har haft de fördelar du har haft.'”

Exakt vad som vänder sig inuti huvudpersonen är inte helt klart i Googles version, men resten är nästan prickfritt. Till sin hjälp har Google i detta fall ett relativt enkelt språkbruk i originaltexten.

Det finns dock ännu mer pricksäkra Google-översättningar. 

New York Times testade den nya översättningsalgoritmen med en passage från Ernest Hemingways ”Snön på Kilimanjaro”. Den nya algoritmen hade då stöd för översättning från engelska till japanska och vice versa, men ännu inte svenska och engelska.

Originalet:

”Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa. Its western summit is called the Masai “Ngaje Ngai,” the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.”

Google Translate (från en mänsklig japansk översättning tillbaka till engelska):

”Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa. The summit of the west is called “Ngaje Ngai” in Masai, the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.”

New York Times noterar att det enda egentliga felet med Googles översättning är att ordet ”leopard” saknar artikel, i det här fallet alltså ”a” och ”the”.

Innan uppdateringen översatte Google Translate passagen på ett betydligt yxigare sätt:

”Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said that the highest mountain in Africa. Top of the west, “Ngaje Ngai” in the Maasai language, has been referred to as the house of God. The top close to the west, there is a dry, frozen carcass of a leopard. Whether the leopard had what the demand at that altitude, there is no that nobody explained.”

Google Translates motor verkar alltså ha gjort avsevärda framsteg, åtminstone med vissa språkpar. Men det lär dröja innan de litterära översättningarna övertygar experterna på bred front.

Hösten 2015 gjorde Di Digitals Viktor Ström en längre genomgång av problemet för datorer med att översätta mänskliga språk. Kontentan är att tekniker har försökt lösa språkförbistringen med datorer i 60 år, utan att riktigt lyckas därför att språk är mer komplext och tvetydigt än matematik. I matematik betyder 6 alltid 6, men det gäller inte för språket.

Läs hela artikeln: Varför blir Google translate inte bättre?

Innehåll från Exclusive NetworksAnnons

Upptäck framtidens datalagring med Cloudian

Cloudian omdefinierar datalagring med innovativa lösningar som hanterar ostrukturerad data i stor skala, så att organisationer kan dra största möjliga nytta av denna värdefulla tillgång. Med ett öga på framtiden prioriterar Cloudian säkerhet, enkel skalbarhet och sömlös integration med populära AI- och dataanalysverktyg.

I takt med att mängden digital information ökar ställs allt fler företag inför utmaningen att effektivt hantera och utvinna värde ur ostrukturerad data som bilder, dokument och maskindata. Cloudians främsta mål sedan företaget grundades 2011 har varit att tillhandahålla innovativa och skalbara datalagringslösningar, vilket har blivit allt mer relevant med den exponentiella tillväxten av data som genereras av AI-applikationer, arbetsbelastningar för dataanalys och IoT-enheter (Internet of Things). Cloudians flaggskeppsplattform HyperStore erbjuder nästa generations S3-kompatibla objektlagring och skapar ett effektivt, AI-optimerat data lake-ekosystem. Halvor Evensen, Regional Sales Manager för Norden och Baltikum, kommenterar:

– Ostrukturerad data, som inte följer en specifik modell eller ett specifikt format, utgör en stor del av all data som skapas idag. Dess värde förblir dock ofta outnyttjat på grund av svårigheter med hantering och analys. Det är viktigt att företag förstår de möjligheter som dagens dataexplosion innebär. Cloudians lösningar är inte bara utformade för att skydda information utan också för att ge organisationer möjlighet att utnyttja denna data för innovation och tillväxt.

Säkerhet och skalbarhet: Cloudians löfte

Cloudians plattform har blivit känd för sin förmåga att hantera stora datamängder och för sitt fokus på säkerhet. Erkänd för sin robusta hantering av massiva datauppsättningar, prioriterar Cloudian säkerhet med funktioner som datakryptering och nyckelhantering, tillsammans med S3 Object Lock för att skydda data mot ransomware genom att göra den oföränderlig. Denna säkerhetsnivå, kombinerat med plattformens skalbarhet, har lett till att flera statliga och offentliga organisationer i Europa har valt Cloudian som en lösning. Halvor fortsätter:

– Säkerhet är hörnstenen i allt vi gör. Våra kunder värderar möjligheten att behålla full kontroll över sina data, samtidigt som de också kan skalas upp vid behov.

Lösningar för den moderna digitala eran

Cloudian fokuserar på att möta behoven hos större företag som står inför utmaningen att hantera omfattande datamängder på ett sätt som är både effektivt och kostnadseffektivt. Genom att noggrant lyssna och anpassa sig till varje organisations unika krav har Cloudian etablerat sig som en tankeledare inom datalagring, alltid med målet att förenkla komplexiteten i den digitala världen

– Genom att anamma rätt strategier för datalagring kan företag inte bara skydda sin mest värdefulla tillgång - data - utan också omvandla den till en katalysator för innovation och tillväxt. Vårt mål är att hjälpa stora organisationer att navigera i datalagringslandskapet med våra skräddarsydda lösningar, avslutar Halvor.

 

 

Mer från Exclusive Networks

Artikeln är producerad av Brand Studio i samarbete med Exclusive Networks och ej en artikel av Dagens industri

Det verkar som att du använder en annonsblockerare

Om du är prenumerant behöver du logga in för att fortsätta. Vill du bli prenumerant kan du läsa Di Digitalt för 197 kr inkl. moms de första 3 månaderna.

spara
1180kr
Prenumerera