Sprekers van de twee belangrijkste Koerdische talen, Kurmanji en Sorani, kunnen nu bij Google Translate terecht als ze iets in een vreemde taal willen vertalen. Het belang daarvan kan bijna niet worden overschat.
Even de feiten: nadat Google in 2016 al het Kurmanji toevoegde aan de vertaalmachine, volgde onlangs het Sorani. Het zijn geen kleine talen: Kurmanji, dat vooral onder Koerden in Turkije en Syrië wordt gesproken heeft 15 miljoen sprekers, Sorani heeft er zeker 8 miljoen, vooral in Irak en Iran. De eerste taal gebruikt het Latijnse alfabet, de tweede het Perzisch-Arabische. Het zijn beide Indo-Europese talen en zo verschillend dat mensen moeite hebben elkaar te verstaan, al heeft de komst van Koerdische TV dat wel verminderd.
Dat die landsgrenzen bepaald niet de taalgrenzen zijn, geeft meteen aan hoe politiek de kwestie is. Een eeuw geleden werd het Ottamaanse Koerdistan door de winnaars van de Eerste Wereldoorlog verdeeld over vier landen, waarmee de Koerdische identiteit ondergeschikt werd gemaakt aan geopolitieke belangen. Het heeft geleid tot een Koerdische strijd om onafhankelijkheid die tot op de dag van vandaag voortduurt.
Autonomie is er inmiddels formeel in Irak, met de Koerdistan Regio van Irak, en de facto in Syrië met de regio Rojava. De twee regio’s hebben twee verschillende talen. In Irak is het Sorani de bestuurstaal van Koerdistan en de tweede officiële taal van het land. In Rojava wordt Kurmaji gesproken en geschreven.
Politiek
Taal is meer dan een communicatiemiddel. Ze is ook politiek. Dat blijkt bijvoorbeeld uit het feit dat initiatieven om een standaard-Koerdisch te ontwikkelen zijn vastgelopen op politieke tegenstellingen. Omdat het de bestuurstaal is in Iraaks Koerdistan, ontwikkelt het Sorani zich nu min of meer als zodanig. Maar tegelijkertijd is er ook binnen de Koerdistan Regio van Irak een taalgrens langs politieke lijnen: in het noorden van de regio, waar de KDP het machtigst is, wordt vooral Kurmanji gesproken, in PUK-gebied Sorani.
In de andere Koerdische regio’s wordt het Koerdisch onderdrukt. Terwijl Turkije nog niet zo heel lang geleden een Koerdische TV-zender toevoegde, is het spreken van de taal een politiek statement geworden waarvoor politici en zangers worden opgepakt. In Iran, waar ook nog een kleinere variant van het Koerdisch, het Zaza door miljoen wordt gesproken, wordt lesgeven in het Koerdisch niet toegestaan. Overigens heeft Google Translate ook de toevoeging van het Zaza in gang gezet.
Voor de Koerden is het feit dat twee van hun taalvarianten te vinden zijn op Google een belangrijke erkenning. Vergeet niet hoe bijvoorbeeld Koerdische asielzoekers jarenlang geregistreerd zijn op basis van hun (Turkse, Iraakse, Syrische of Iraanse) nationaliteit. Daarbij is hun Koerdische identiteit stelselmatig genegeerd. Met hun taal ligt die aparte, eigen identiteit nu dus ook vast.
Dank
De Koerdische premier Masrour Barzani tweette dan ook zijn dank aan Google. Het cynische is dat de toevoeging van het Sorani aan de vertaalmachine niets met hem van doen heeft. Het is het resultaat van vele oproepen van Soranisprekers, en het contact dat een groepje taalfanaten zelf met Google heeft gezocht. President Nerchirvan Barzani ontving een aantal om hen daarvoor te bedanken.
De drijvende kracht was Bokan Jaff uit Halabja, die het Amerikaanse consulaat in Erbil verzocht hem met Google in contact te brengen. Hij blijkt een man van weinig woorden, als hij via Twitter Message vragen over zijn werk beantwoordt. Nadat het consulaat hem in contact had gebracht met het technische team van Google en hun ingenieurs, creëerde hij de Google Crowdsource community in Koerdistan, vertelt hij. Iedereen die aan het project bijdroeg, was taalspecialist en vrijwilliger.
Zoals Sarchia Khursheed, die vertelt dat hun rol vooral was om zinnen te vertalen en de vertalingen van anderen goed te keuren. Google Translate werkt met een combinatie van teksten die op het internet beschikbaar zijn, en vrijwilligers die via een speciale app teksten goedkeuren en fouten verwijderen. Dat is de crowdsource-groep die Bokan samenstelde en die doorgaat de vertalingen verder te verbeteren.
Volgens Sarchia bestond die groep uit een man/vrouw of honderd, die vanuit huis meedeed en contact met elkaar had via een Facebookgroep. Twaalf van hen leverden de meeste bijdragen. Google noemde zes van hen ook bij de bekendmaking van de nieuw toegevoegde talen.
Onbegrijpelijk
Ik herinner me nog dat Engels naar Nederlands vertalen via Google Translate jaren geleden nog vooral onbegrijpelijke zinnen opleverde. Volgens Sarchia geldt dat ontwikkelingsprobleem nauwelijks voor het Sorani, omdat Google inmiddels nieuwe technieken toepast. “Er zijn kleine fouten, maar ik denk dat het vooral komt omdat we geen groot tekst corpora hebben voor het Koerdisch.” Hij legt uit dat vertalingen het best lukken als er al veel data in die taal beschikbaar is waar de Googlemachine uit kan putten. Hij roept Koerdische instituties op meer boeken en geschriften online te zetten.
Een groot probleem is echter dat andere talen afkortingen gebruiken, bijvoorbeeld voor de Koerdische partijen (zoals KDP, PUK, PKK). Het Koerdisch heeft, net als het Arabisch, geen afkortingen. Partijen hebben verkorte namen: de KDP is ‘partia’, de PUK ‘yeketi’. Lastig in een vertaalmachine, waar de PKK ook ‘partia’ wordt, wat al tot de eerste klachten heeft geleid.
Google Translate is niet de enige vertaalmachine die Koerdisch aanbiedt, maar wel de grootste. De Microsoft Translator heeft beide talen al sinds 2020. Facebook biedt vertaling in en uit het Sorani, maar Kurmanji kan het nog niet aan. Volgens Bokan zal Twitter ook snel volgen, want dat gebruikt de Google vertaalmachine.
Dat maakt het Koerdisch niet alleen toegankelijk voor niet-Koerden, maar even belangrijk is dat ook voor Koerden veel meer informatie toegankelijk wordt. Buitenlandse talen worden er nog te weinig gesproken, maar met de vertaalmachine kunnen Koerden ook buitenlandse kranten lezen en meediscussiëren op sociale media in een andere taal dan hun eigen. Het opent de wereld dus weer wat verder voor hen.
Vinkentouw
Hoewel de politiek dus geen rol had in het toevoegen van het Sorani aan Google Translate, zitten politici wel op het vinkentouw om Koerdistan steeds meer op de kaart te zetten. Zo werkt vicepremier Qubad Talabani aan het toevoegen van de Koerdische vlag als emoji. Dat is bijvoorbeeld belangrijk voor wie Twittertaal volgt: vaak worden landen daar aangeduid door hun vlag.
Voor onze Nederlandse oren klinkt het misschien als klein nieuws. Voor het Koerden zijn dit belangrijke mijnpalen, waarmee ze hun Koerdische identiteit steeds weer iets meer verankeren. Je hoeft alleen maar naar de oorlog in Oekraïne te kijken om te begrijpen hoe belangrijk dat is. De Oekraïense vlag is nu overal, terwijl de meeste mensen tot voor kort niet wisten hoe die eruitzag. Ook de Oekraïners hebben een strijd gevoerd voor hun taal en hun onafhankelijkheid.
Wie weet hoe de Koerdische vlag eruitziet? Hoe het Koerdisch klinkt en eruitziet? Dankzij de technologie geldt dat voor steeds meer mensen. Nu het Koerdische nationale team nog naar de wereldcup, roepen voetballiefhebbers. Want daarmee wordt het steeds moeilijker om te ontkennen dat Koerdistan, als het huis van de Koerden, bestaansrecht heeft.