AKP-arkivet

Samisk på data
- ein framtidsdraum?

av Svein Lund Oversikt over e-post-adresser

Artikkelen er publisert i Klassekampen 2. februar 1998.


Fleire artiklar om samiske spørsmål | Hovudside kronikkarkiv | Heimesida til AKP |

Like før jul kom gladmeldinga til alle som har behov for å skrive samiske tekstar eller einskilde ord på datamaskin: I månadsskiftet januar / februar skal samiske teiknsett bli gratis tilgjengelig for alle. Men ei veke før månadsskiftet er det klart at ein fortsatt må vente - enno ei tid vil dei som skriv samisk måtte slite med store ekstrautgifter og mye ekstraarbeid.

- Vi hadde nesten alt ferdig, seier Atle Kåven i Arcticnet i Kárásjohka, datafirmaet som fikk anbodet på å lage ei løysing som skulle bli gratis tilgjengelig for alle. - Men så fikk vi melding frå Samisk datautval om at vi skulle bruke ein anna standard, og så måtte vi starte nesten på nytt igjen. Derfor vil det dei samiske teiknsetta for Windows 95 tidligast bli tilgjengelige sist i februar. For Windows 3.1. og Windows NT samt for Macintosh vil det nok ta enno minst ein månad.

Den viktigaste grunnen til at dette ikkje er løyst for fleire år sidan er at sentrale styresmakter ikkje har vore villige å betale. Samisk næringsråd måtte ta av eigne pengar etter at sentrale styresmakter ikkje klarte å vere av med ein halv million. Så alvorlig tar dei grunnlovsparagraf 110a: "Det paaligger Statens Myndigheter at lægge Forholdene til rette for at den Samiske Folkegruppe kan sikre og udvikle sitt Sprog, sin Kultur og sitt Samfundsliv."

Nokre av lesarane vil hugse at herverande redaktør Michelet har lova at Klassekampen no endelig skal skaffe samiske fontar. I denne artikkelen vil du finne bakgrunnen for at dette enno ikkje er løyst. I tillegg kan du lese litt om ka for problem brukarar av samisk og ein del andre språk med anna alfabet enn det engelske har hatt og har i ei dataverd dominert av engelsk språk og amerikansk kapital. Dette er ei forkorta (!) utgåve av ein enno lengre artikkel, og vil du vite meir finn du den lange utgåva på Klassekampen-forum (www.klassekampen.no /debatt). Der går vi bl.a. nærare inn på det tekniske og tar fram eksempel på liknande problem i andre språk.

Åtvaring!

I denne teksten vil sikkert noko bli feil når det kjem i avisa. Årsaka til det er forklart i teksten, dette blir ein ufrivillig praktisk demonstrasjon av dei problema artikkelen handlar om.

Data = fornorsking?

Om du skal ha ein heimedatamaskin og skrive norsk eller engelsk på han, får du ein god maskin med det du treng av lovlig programvare for 10-12.000 kr. Da kan du bruke utstyret og programma til det er utslitt eller forelda. Men har du tenkt å skrive samisk på han, må du ut med omlag 3.000 kroner ekstra. Og for kvart år du skal bruke det, må du ut med nesten ein tusenlapp i tillegg. Det er ikkje vanskelig å gjette ka som blir konsekvensen for eit språk som frå før er sterkt pressa.

Ved sida av film- og platebransjen er databransjen i dag den som betyr mest i å utbreie engelsk språk over heile verda. Marknaden blir oversvømma av engelskspråklige program, men datateknologien har enno større konsekvensar for språket. For mens alle datamaskinar i verda leveras med program som kan skrive engelsk, er det svært mange rundt i verda som har tilgang til datamaskin, men som ikkje kan skrive sitt eige språk med han. For dei som snakkar minoritetsspråk blir konsekvensen eit press til å bruke engelsk eller majoritetsspråket i landet når dei skal uttrykke seg skriftlig.

Verdas sterkaste monopol

Aldri i verdshistoria har eit land hatt slik dominans innafor utviklinga av ein viktig teknologi som den USA har i datateknologien. Aldri har eit språk vore så fullstendig utan konkurranse på eit viktig felt i verdsmålestokk. Aldri har verda sett eit privatkapitalistisk selskap med så stor innverknad over heile kloden som Microsoft. Uttrykket monopolkapitalisme blir nesten for svakt til å skildre det som no skjer. I USA sit Bill Gates og har avgjørande innverknad på omfanget av skriftlig bruk av språk han aldri har hørt namnet på. Datateknologien er blitt ein viktig reiskap i å innføre den anglo-amerikanske monokulturen i verdsmålestokk..

I omlag fem år har eg og andre forsøkt å få fire redaktørar i Klassekampen til å gå til innkjøp av samiske fontar slik at ein kan gjengi samiske ord rett. Dei tre første sa ja og ha og gjorde så ingen ting. Den fjerde, derimot, tok dette så alvorlig at han ikkje torde skrive "Guovdageaidnu" av redsle for at ordet skulle innehalde ein eller annan skjult samisk font. Så derfor synas det på tide med litt folkeopplysning.

ä, ö, æ, ø, å

Dei fleste nordmenn som har brukt ein datamaskin har holdt seg til ord og bokstavar frå norsk og evt. engelsk. Men kjem du utafor norsk / engelsk / latin støyter du med ein gong på problem med at du ikkje finn alle bokstavane på tastaturet. Da eg i avsnittet over skreiv ä, måtte eg først trykke ^ og deretter a. Om eg skal skrive namnet på den samiske avisa Min Áigi, må eg først trykke tastane Alt + Ctrl + Bcksp samtidig. Når eg så trykker på tasten q, får eg istaden ein á. Før eg skal skrive ord med ø eller å i må eg så trykke Alt + Ctrl + Bcksp igjen for å komme tilbake.

No er det sikkert nokon lesarar som alt har gått til datamaskina si for å teste om dette fungerer. Og det gjør det sjølvsagt ikkje. For dette følger ikkje med verken når du kjøper datamaskinar eller tekstbehandlingsprogram. Å skrive med samiske fontar kostar det omlag 3.000 kr i innkjøp + nesten ein tusenlapp i året i lisens for å fortsette å bruke programmet. Men for få år sidan var det enno mye dyrare.

Fontlære for amatørar

På eit vanlig datatastatur kan vi få fram i overkant av 100 forskjellige teikn. Men prosessoren i datamaskina forstår ikkje meir enn to. Vi kallar dei 0 og 1, det er bare alternativa av eller på, ikkje-straum eller straum. Ved hjelp av 8 slike brytarar som står av eller på kan vi få 28 eller 256 kombinasjonar, som igjen kan stå for kvar sin bokstav eller teikn. Som så mye anna er standarden for dette laga i USA. Den seier at kombinasjonen 01000001 er A, mens 01011010 er Z, og tabellen for alle disse kallas for ASCII.

På 256 plassar er det ikkje plass nok til alle bokstavar i dei forskjellige alfabeta i verda. For eksempel har ein tatt med dei svenske ä, ö og å, men ikkje dei norske æ og ø. Dei som hugsar tilbake til dei første personlige datamaskinane som kom hit til landet, hugsar at dei ikkje hadde tastar for æ, ø eller å. Men i alle fall dei siste 10 åra har alle datamaskinar som blir solgt i Noreg hatt æ ø å fast plassert på tastaturet. ASCII finst etterkvart i ei rekke variantar, tilpassa forskjellige språk. Leitar vi i varianten "Nordisk" finn vi kodar for æ, ø og å. Så lenge vi opererer innafor eit system med 8 bits og 256 teikn må vi ha ein slik utgåve av ASCII for alle språk som vi vil skrive på data.

Samtidig må vi ha eit program for tolking mellom tastaturet og den ASCII-varianten vi brukar. Eit slikt program kallas for kodetabell. Når eg no skriv på ein "norsk" maskin, står det i oppstartfilene for maskinen at ein skal bruke kodetabell 865 for norsk. Da blir det æøå når eg skriv æøå og ikkje heilt andre teikn som ville ligge på dei plassane i eit engelsk eller russisk tastatur. Til daglig tenker vi ikkje over at grunnen til at æøå ligg der er at Noreg er eit rikt land, dei norskskrivande er mange og rike nok til å utgjøre ein viktig marknad for Microsoft. Dei samiskskrivande er i lag med brukarar av mange andre minoritetsspråk i verda ikkje like heldige. Derfor ligg ikkje dei samiske bokstavane (ᢤ±³¸º) inne i Microsoft sine program. Skal ein skrive samisk må ein derfor ha eit anna program i tillegg.

½,¼,P,¬,

Dei første forsøka på å skrive samisk på data kom sist på 80-talet. Det var flinke datafolk i samiske område som laga seg eigne program, men oftast måtte dei lage eigne program for kvar maskintype. Nokre av dei første programma fikk ikkje samiske bokstavar opp på skjermen, men kråketær som ½,¼,P,¬, . Men om ein og kjøpte ein skrivar av eit bestemt slag kunne ein få med eit program for å overføre disse teikna slik at dei kom ut som samiske teikn på skrivaren. Så kom det program som viste samiske teikn på skjermen i Word Perfect, men fortsatt måtte eit eige program for utskrift lastas inn i skrivaren for kvar gong.

Så kom plutselig Windows over heile linja. Når ein skreiv norsk kunne ein boltre seg med mus og fikse oppsett i Word 2.0. og ei rekke skrifttyper. Skulle ein skrive samisk derimot, var det tilbake til gamle Word Perfect.

SamiiWin eller WinSam?

I 1992 kom første løysinga for å skrive samisk i Windows. Etter kvart kom det fleire og fleire løysingar; SamiiWin, WinSam, SkrivSamisk og omlag fem andre løysingar bare innafor Windows. Felles var at dei kosta pengar. Mye pengar. For marknaden var ikkje så stor og ingen andre enn private datafirma tok ansvar for dette. Den første utgåva kosta heile 12.000 pr datamaskin. Det leiande firmaet på dette området var Karasjokfirmaet Vplan. No er firmaet Arcticnet skilt ut frå Vplan og har tatt med seg fontane og rettane til dei. Dei har tatt 5000 kr for programmet, men no gått ned til omlag 3.000.

Macintosh m.m.

Macintosh var tidlig ute med måtar å skrive samisk på, og liksom DOS har dei hatt fleire variantar. Og sjølvsagt har disse vore så forskjellige frå løysingar i Windows at vanlige konverteringsprogram ikkje har vore nok. Men fordelen med Mac-maskinar er at her er dei samiske teikna inkludert i operativsystemet. Det samme gjeld for operativsystemet OS/2, men dette er eit system for større maskinar og brukas lite privat og på skolar og kontor.

Standardiseringsarbeid

I juni 1996 vedtok ein samisk datakonferanse i Kárá³johka ein ny samisk standard for dei største samiske hovuddialektane i Noreg, Finland og Sverige. Basert på denne standarden har Arcticnet laga tastaturdrivaren Multitast, der ein kan velge mellom nordsamisk, lulesamisk, sørsamisk, norsk og svensk/finsk tastatur.

Hausten 1996 blei Samisk datautvalg oppnemnt av det norske Sametinget. Det har medlemmar også frå svensk og finsk side. I februar 1997 gikk dei ut med open anbodskonkurranse på frikjøp av rettar til samiske typer etter den nye standarden. Arcticnet fikk anbodet, men pengane lot vente på seg. Eit halvt år sto arbeidet stille fordi ingen i staten ville betale den halve millionen dette ville koste. I desember fann Samisk Næringsråd ut at ein ikkje kunne vente lenger og skar igjennom og tok fem hundre tusen av sitt eige budsjett for støtte til næringsutvikling. Sentrale styresmakter har altså ikkje betalt eit øre for at det skal vere mogleg å skrive samisk på data.

Vi ventar

Eit halvt års utprøving av standarden frå i fjor har vist at denne ikkje var god nok. Derfor vedtok Samisk datautval midt i januar å endre denne til ein ny standard. Derfor er arbeidet forsinka igjen, men i løpet av februar skal ein kunne laste ned samisk teiknsett frå Internett - om det ikkje kjem nye hindringar i vegen.

Internett

Dei som har kikka på heimesidene til Samisk utdanningsråd eller Samisk høgskole vil kanskje ha undra seg over at disse to sentrale institusjonane for samisk språk har heimesidene bare på norsk. Men dette er ikkje utan grunn. For så langt har det ikkje vore bare-bare å skrive samiske web-sider. Og ein ting er å skrive dei, ein anna ting er å lese dei. Det finst nokre få samiskspråklige web-sider, men det er helst datautvalet sjølv som har laga dei som eit eksperiment. Når eg har søkt etter samiskspråklige web-sider har eg ikkje funne fleire sider enn eg kan telle på to hender. Skal ein lese dei må ein stille inn på ein bestemt måte i leseprogrammet. Men sjølv da er det ikkje alle web-sider som er like greie å lese, og nokre blir så fulle av kråketær at ein like godt gir opp.

Å skrive e-post på samisk er heller ikkje bare, men det fungerer bra om mottakaren har dei samme samiske fontane, og ein sender sender brevet som vedlegg eller stiller inn fontane i e-post-programmet.

65.536 tegn!

Men grensa på 256 teikn er no i ferd med å bli ettertrykkelig sprengt. For i fleire år har det vore jobba med eit nytt teiknsett kalla Unicode. Da kan ein lage 256*256 = 65.536 teikn, noko som gir god plass til samiske teikn ved sida av japansk, kinesisk og eit utall andre språk. Det finst allereie eit slikt for omlag 40.000 teikn. Dette er lagt inn i den nyaste utgåva av Windows NT, som vi noko forenkla kan kalle nettverksutgåva av Windows 95. Men det er ei lita ulempe; for verken dei "gamle" programma som WinSam eller det siste Multitast klarer å fungere i Windows NT, så det hjelper så langt lite at teikna er ein plass der inne, det er ikkje bare å søke blant 40.000 teikn kvar gong ein skal ha tak i ein bokstav.

Unicode er enno i barndommen og kan bli svært viktig for å sikre at dei fleste i verda skal kunne bruke sitt eige språk på data. Når og om dette slår gjennom skal det ikkje bli verre å skrive arabisk, khmer, samisk eller ewe enn det er å skrive engelsk eller norsk. Dei tekniske problema er i ferd med å bli løyst, kor stor grad det skal bli tatt i bruk er meir eit politisk spørsmål.

Windows 98?

Om staten går inn og kjøper opp eit samisk tastaturprogram med fontar vil det på kort sikt vere eit godt skritt framover. Men ettersom utviklinga går framover vil det bli behov for stadig nye program og fikse løysingar. Den einaste permanente løysinga vil vere at dette leggas inn i operativsystemet, og dei einaste som kan gjøre dette, er nettopp Microsoft. No er dei ute med prøveutgåve av Windows 98, men denne har heller ikkje samisk tastaturdrivar. Samisk datautval har forsøkt å påvirke Microsoft. Microsoft Scandinavia var i prinsippet positive, men det er i USA alt blir avgjort. Det er klart at det tekniske er enkle handgrep for Mictosoft, det er bare viljen som manglar.

Avis

Men ein ting er å skrive ut tekst på ein vanlig blekk- eller laserskriver, noko anna er å trykke i avis. For fotosettarar forstår gjerne ikkje dei vanlige teiknsetta for datamaskinar. Mens disse kallas TrueType, brukar avisene PostScript. Dei fleste aviser brukar Macintosh-maskinar til redigering og ferdiggjøring for trykking, det gjør bl.a. dei samiske avisene. Derfor er det laga samiske PostScript-fontar for Macintosh. Klassekampen brukar derimot MS-DOS / Windows. Derfor ser det ut som Klassekampen må skaffe seg noko som ingen har brukt før: Samiske PostScript-fontar for Windows. Men no skal avisa skifte trykkeri og da kan noko skje. Og så kjem den nye samiske standarden forhåpentligvis i løpet av vinteren. Så enno må vi visst smøre oss med enno meir tolmodigheit vi som ventar på rettskrevne samiske stadnamn og Klassekampen si nye vekentlige spalte på samisk.

Men no veit vi i alle fall litt meir om korfor vi ventar.


Fleire artiklar om samiske spørsmål | Hovudside kronikkarkiv | Heimesida til AKP |

Til AKP si heimeside