Viser opslag med etiketten Stavekontrol. Vis alle opslag
Viser opslag med etiketten Stavekontrol. Vis alle opslag

søndag den 29. april 2018

Stavekontrolden 2.4 er frigivet

af Esben Aaberg

Den 15. april 2018 frigav vi Stavekontrolden 2.4.
Denne version føles som drægtig elefant, fordi projektet pludselig blev meget større end først planlagt. 2½ år er der gået, hvilket er for lang tid og det er bestemt noget vi vil prøve at undgå i fremtiden. 

En større rettelse i byggescriptet medførte at skeletterne begyndte at rasle ud af skabet. Mange gamle småfejl, fra den oprindelige ordhøst, blev til store synlige nye fejl. Da vi helst ikke udgiver med nye kendte fejl, betød det at andre stabile rettelser heller ikke kunne frigives, mens der blev luset ud i de gamle småfejl.

Over 8500 ord er enten blevet lagt ind eller ændret i forhold til version 2.3 af Stavekontrolden, hvilket svarer til ca. 8% af alle ord der er i ordbogen.

Yderligere forbedringer i denne version, er en del tilføjelser vedr. ordsammensætning. Bl.a. har 1200 flere ord fået opmærkningen, at de kan være første led i et sammensat ord. Der er rettet en fejl på ca. 3500 ord, typisk en flertalsform i genitiv, at disse ord også kan være sidste led i en ordsammensætning. 

Der er kommet understøttelse for ordsammensætning, hvor det er både-og, f.eks. svinekød, i sammensætning svinekød- el. svinekøds- og valnød, i sammensætning valnød- el. valnødde-.

Alt i alt er kvaliteten forbedret, og der vil være færre falske positive, specielt sammensatte ord. 

I første omgang skal du selv følge linket herunder og downloade udvidelsen fra extensions.libreoffice.org og på et senere tidspunkt bliver denne version standard og præinstalleret i LibreOffice og Firefox.

Vi vurderer at der er ca. en halv million brugere i alt, og med sådan en brugerskare, kan det undre én at vores nationalsport ”fadøl”, i en årrække har været opmærket forkert uden at det er blevet opdaget. Hvis du finder fejl i ordbogen, enten i form af at en fejl ikke bliver identificeret, eller det omvendte, at et korrekt stavet bliver markeret som fejlagtig, vil vi meget gerne høre fra dig. Du kan melde det ind på http://forum.liboforum.dk/ eller ved at sende en mail til Esben Aaberg.

God fornøjelse med Stavekontrolden 2.4.

Link:
Udvidelsen til LibreOffice: https://extensions.libreoffice.org/extensions/stavekontrolden-danish-dictionary
Add-on til Firefox: https://addons.mozilla.org/da/firefox/addon/dansk-ordbog/
Hjemmesiden: http://www.stavekontrolden.dk
 
Stavekontrolden er en dansk ordbog til stavekontrol. Stavekontrolden udgives under tre forskellige populære open source-licenser, og kan distribueres frit med langt de fleste open source-programmer.

Stavekontrolden distribueres i dag med den danske udgaver af følgende open source-programmer: kontorpakkerne LibreOffice og OpenOffice.org, webbrowseren Firefox samt e-mail-programmet Thunderbird.

Grundstammen i Stavekontroldens ordliste er data, som venligt er stillet til rådighed for projektet af Det Danske Sprog- og Litteraturselskab.

mandag den 11. december 2017

Forbedring af stavekontrollen (brugerordbogen)

LibreOffice har som bekendt en stavekontrol, som dækker det danske sprog ganske godt. Ordbogen dækker dog kun det almindelige sprog, og ikke f.eks. fagtermer eller specielle ord.

Du kan til gengæld oprette din egen tilføjelse i form af en brugerordbog. Det gør du f.eks. når du højreklikker på et understreget ord, og vælger ”Tilføj til ordbog”. Brugerordbogen består af en lang række enkeltord, og understøtter for øjeblikket ikke bøjninger og andre sprogregler.

Ordbogen finder du under Funktioner – Indstillinger under afsnittet Sprogindstillinger – Skrivehjælp. Du skal finde afsnittet ”Brugerdefinerede ordbøger” hvor ordbogen hedder ”standard[Alle]”. 


Hvis du markerer den og klikker på ”Rediger...” åbner du en liste med alle dine ord. Ordbogen kan du også finde som fil på placeringen [Placering]/libreoffice/4/user/wordbook/standard.dic. Indholdet kan f.eks. se sådan ud:

OOoUserDict1
lang: Alle
type: positive
---
Crowdfund
lummergøj

Et lille trick er, at du faktisk kan dele denne fil mellem flere computere, og evt. med dine kollegaer på kontoret.

Nyhed i LibreOffice 6
Fra version 6 bliver det muligt for dig at lade dine egne ord i brugerordbogen arve eksempelvis bøjningsregler fra et andet eksisterende ord. Først skal du redigere ordbogen på den måde, at du gør den specifik for dansk. Klik på Rediger… og feltet sprog ændrer du fra Alle til Dansk. Klik ok og luk dialogen.
Åbn nu dialogen igen, hvorved du ser et nyt felt ”Grammatik af”. For hvert ord i ordbogen kan du her vælge hvilket eksisterende ord dit eget ord skal arve sine regler fra.


Hvis du f.eks. har ordet lummergøj i ordbogen vil lummergøjen og lummergøjer blive markeret som stavefejl. Hvis du vælger at ”lummergøj” skal arve sine regler fra ordet ”bil”, vil alle bøjningsformer blive genkendt: lummergøj, lummergøjen, lummergøjer, lummergøjerne og brandlummergøj såvel som lummergøjvask.

Et andet og måske mere brugbart eksempel er byen Brno, som ikke findes i ordbogen. Det gør til gengæld Berlin, og du kan oprette Brno i brugerordbogen og lade ordet arve fra Berlin. Herefter vil både Brno og Vestbrno blive genkendt af stavekontrollen.


søndag den 31. maj 2015

Bedre dansk stavekontrol

LibreOffice 5.0 udkommer med den nyeste version af dansk stavekontrol. Stavekontrollen blev frigivet i december 2014, og kommer altså nu med i installationspakken.

Kvalitetssikringen er fortsat et fokusområde, hvilket betyder mange rettelser. Det kommer også til at være gældende i kommende versioner.

Primær fokus i denne version har været tilpasninger af nye stavemåder introduceret i Retskrivningsordbogen fra 2012, hvor over halvdelen af de ord Dansk Sprognævn har lagt frem, nu er opmærket efter de nye stavemåder.

Over 800 rettelser i forbindelse med Retskrivningsordbogen af 2012.

Ca. 145 ord ud af 328 ord er blevet korrigeret for en fejl, der betød at de sidste former manglede.

359 verber med dobbeltkonsonant har fået en strammere opmærkning.

I alt er over 3000 ord er blevet ændret eller tilføjet.

Hvis du ikke kan vente til LibreOffice 5.0 udkommer, kan ud downloade ordbogen som udvidelse her: http://extensions.libreoffice.org/extension-center/stavekontrolden-danish-dictionary

torsdag den 25. december 2014

Stavekontrolden 2.2 og Retskrivningsordbogen af 2012

Artiklen er skrevet af Esben Aaberg.

Nu er det slut med at tage til Svejts og spise rostbøf med majonæse, og jogurt til dessert. Men til gengæld er det OK at gå ombord som bidragsyder.

Selv om jeg synes det er en ”fadaise!” at man nu kun kan bruge den temmelig udanske stavemåden mayonnaise, så prøver vi på at lægge os op af Retskrivningsordbogen, så derfor er der rettet/slette/tilføjet ca. 800 ord i henhold til Retskrivningsordbogen af 2012 i version 2.2 af Stavekontrolden.

Arbejdet med at tilpasse Stavekontrolden til de ændringer af opslagsord og bøjninger der blev introduceret i Retskrivningsordbogen af 2012 fortsætter, da vi kun er lidt over halvvejs.

I Retskrivningsordbogen af 2012 blev der introduceret flere sammenskrivninger af ord som fremfor og engros, men her undre det mig så at man ikke har medtaget ord som idag og iaften, da jeg ser det brugt rigtigt mange steder.

Et andet fokus område i Stavekontrolden 2.2 har været oprydning i ord der var markeret som stærkt bøjet, men reelt ikke er det 100%. Her er den ene type ord der har været ramt af en variabel der maks. kunne være 255 tegn, hvor f.eks. bestemt flertal i genitiv ofte manglede, et eksempel var størrelsesordnernes, som var blevet kortet af til størr. Typisk for disse ord har de enten flere stave- eller bøjningsmåder, eller helt uofficielle stavemåder. Uofficielle stavemåder slettes når de opdages. Den anden type er verber med dobbeltkonsonant f.eks. aftrappe med en normal svag bøjning ­r, ­de, ­t, for denne type er der kun tale om en mere skarp opmærkning som ingen forskel giver i stavekontrolleringen. Af identificerede forekomster er der for første type tale om ca. 145 ud af ca. 328, for den anden type ca. 359 ud af ca. 763.

Selvom der er slettet uofficielle stavemåder, er der totalt set kommet flere ord til, men på grund af den mere skarpe opmærkning er antallet af af linjer i dic­-filen blevet reduceret med over 7000 linjer. Over 3000 ord er enten blevet lagt ind eller ændret i forhold til version 2.1 af Stavekontrolden. De 3000 ord svare til ca. 3% af alle ord der er i ordbogen.

Udvidelserne til henholdsvis LibreOffice og Mozilla­produkterne Firefox og Thunderbird er tilgængelige nu. For de danske udgaver af programmerne til Windows og Mac, der vil versionen 2.2 følge med LibreOffice 4.4.0, og for Firefox der vil den følge med en version der p.t. er planlagt til 24. februar. For Linux-folket der er udgivelsestidspunktet ukendt, men som noget nyt vil vi prøve at bede om at få den opdateret, ved de distributioner hvor vi ved vi er repræsenteret.

Udvidelse til LibreOffice
Tilføjelse til Firefox

tirsdag den 4. november 2014

Man skal tage sin egen medicin

Stavekontrollen i LibreOffice er efterhånden blevet ganske god, hvilket vi kan takke folkene bag Stavekontrolden for. De har igennem de seneste år arbejdet intensivt for at gøre stavekontrollen bedre.

De har, blandt andet for at teste stavekontrollen, kontrolleret hjælpen i LibreOffice for stavefejl. Det resulterede i ikke mindre end 81 stavefejl, som alle er rettet i næste version.

Tak for indsatsen til de frivillige.

lørdag den 14. december 2013

Stavekontrol af hjælpen

En af de frivillige bidragsydere har fået den gode idè, at bruge vores egen stavekontrol på hjælpen i LibreOffice. Formålet har været at høste ord til ordbogen, men også at kontrollere at vejledningerne i hjælpen ikke har for mange sproglige fejl.

Resultatet var en liste med 28 stavefejl som nu er rettet.

Vi planlægger at stavekontrollere hjælpen igen inden frigivelsen af LibreOffice 4.2

torsdag den 17. oktober 2013

Lille rettelse med stor effekt

En lille rettelse kan have en stor effekt på LibreOffice. Et eksempel er en ændring til højreklik-menuen, som er planlagt til version 4.2

Problemet er kollision mellem to forskellige elementer, som hver i sær anvender højreklik-menuen. Du ved sandsynligvis godt, at stavefejl kan vises med røde understregninger. Du ved sikkert også at stavefejlen kan rettes ved at højreklikke på ordet, og fra menuen der dukker op, kan du vælge den rigtige stavemåde. Så langt så godt.

Problemet er, hvis du sidder med et dokument, hvor ændringshåndtering er aktiveret. Hvis der er stavefejl i en ændring, viser højreklik-menuen kun mulighederne fra ændringshåndtering (accepter eller afslå ændringen) og ikke noget fra stavekontrollen. Du er altså nødt til først at acceptere ændringern for derefter at rette fejlen. Alternativt kan du midlertidigt vælge ikke at få ændringerne vist, men det er dog noget besværligt.

Denne lille "fejl" er med til at gøre arbejde med ændringshåndtering til en øv-oplevelse.

Fra version 4.2 vil det være  muligt at udføre både ændringshåndtering og stavekontrol fra samme højreklik-menu.
Højreklik-menuen med ændringshåndtering og stavekontrol

Fejlen er rettet af Miklos Vajna fra Ungarn, som arbejder for firmaet Collabora Ltd. Collabora tilbyder blandt andet at rette fejl i LibreOffice mod betaling. Miklos er altså ansat fuld tid til at arbejde med LibreOffice. Fejlen er rettet på foranledning af en af firmaets kunder.

onsdag den 28. august 2013

Stavekontrol


Som en udspringer af statens "grunddataprogram", hvor offentligt ejede data principelt stilles til borgernes rådighed, har vi fået adgang til Retskrivningsordbogen anno 2001. Vi har fået adgant til ordbogens rå digitale data af Dansk Sprognævn (DSN).

Den såkaldte "Retskrivningsordbogs fuld­forms­ordliste (2001)", må vi benytte til at forbedre sprogværktøjerne. Specielt forventer vi at arbejdet med at forbedre stavekontrollen med disse data. Selvom arbejdet med at tilpasse stavekontrollen til retningslinjerne fra "Retskrivningsordbogen 2012", allerede er godt i gang, er vi overbevist om, at vi også vil kunne hive noget positiv effekt ud af den gamle ordbog, da det trods alt kun er en lille  af ordene der ændres, så forskellen mellem 2001 og 2012 er begrænset.

Vi forventer at bruge ordbogen til automatisk kvalitetskontrol af den eksisterende stavekontrol.
Tak til Keld Simonsen, som har forhandlingerne med Dansk Sprognævn.

Information fra Keld Simonsen: http://listarchives.libreoffice.org/da/dansk/msg00530.html
Om grunddata: http://www.digst.dk/Loesninger-og-infrastruktur/Grunddata/Aftale-om-grunddata

tirsdag den 21. maj 2013

Stavefejl i stavekontrolden?


Vi modtager jævnligt besked om, at der er en stavefejl i stavekontrollen. Nemlig i selve navnet "Stavekontrolden".

Fejlen er bevidst!

Det er et forsøg på en lille ordleg, hvor stavekontrol bliver til stavekontrold, hvilket da også giver sig udtryk i logoet.

Du kan læse mere om sprogprojektet her: http://www.stavekontrolden.dk

lørdag den 27. april 2013

Sprogværktøjer


Vi arbejder konstant med at forbedre de sprog­værktøjer, som f.eks. indgår i LibreOffice. De fleste af deltagerne er amatørlingvister, men erfaringerne fra arbejdet gør, at alle efterhånden er blevet temmelig skrappe til det der med sprog.
Det er et langsommeligt arbejde at behandle alle ordene, og det er til tider ret frustrerende. Bøjning, deling og sammensætning afhænger af ordtypen, og en af de største udfordringer er, at visse ord har to eller endda mange forskellige betydninger.
Tænk bare på ordet "Ringe"!
Ringe er en by på Midtfyn. (egennavn)
Du kan ringe på klokken. (udsagnsord)
Ringer du til mig når du er færdig med mødet? (udsagnsord). Udtrykket er afledt af at ringe på klokke (fra den gang der kun var en "ringetone"). (udsagnsord).
Det er for ringe at maden ikke er færdig endnu (tillægsord)
Det spreder sig som ringe i vandet (navneord)
Gammel betydning: At anstrenge sig for at faa magt over noget, at vinde i en (kappe)strid; kæmpe. (udsagnsord).
Men det er ikke kedeligt arbejde det hele. Fra tid til anden, ser vi også morsomme indslag, som f.eks. disse fuldstændigt ubrugelige statistiske facts:
Længste ord med bogstaver i "stigende" rækkefølge: afgjort
.. i faldende rækkefølge: utrolige
Længste ord, hvor man starter med to bogstaver og så tilføjer bogstaver i enden (hvor hvert nyt ord skal eksistere): deltagerens
(de, del, delt, delta, deltag, ...)
Længste ord, man kan skrive med øverste bogstavrække på et dansk qwerty-tastatur: opprioriteret
.. midterste række: affaldssæk
.. nederste række: mm (og lignende forkortelser)
Længste ord skrevet kun med venstre hånd med tifingersystemet: straffeattesters
.. med højre hånd: polynomium, millionkup
Kun vokaler: yoyo
Kun konsonanter: vvs
Længste ord med kun fem forskellige bogstaver: regenereringerne
... med fire: antennenettene
.. med tre: essensens
.. med to: vovvov
Længste ord med flest forskellige bogstaver: femogtyveårsjubilæum
(18 ud af 20 bogstaver er unikke - "e" og "m" optræder to gange)
Længste ord med kun unikke bogstaver: præcolumbiansk, porcelænsbutik, filmproducents, valgforbundets.
Længste ord der ikke kan deles: springskt
Længste sekvens efter vokalen: borsjtjs

Andre forslag til sjove opslag?
Tak til Peter Brodersen (G+)
https://plus.google.com/104724014751924900780/posts