MK Förlags ordbok

MK Förlags ordbok är en svensk ordbok jag började skriva 24 mars 2007 och har arbetat med då och då sedan dess. Med tanke på att jag inte förrän 23 september 2012 publicerade en version av ordboken som kändes användbar kan man inte med bästa vilja i världen påstå att arbetet gått snabbt.

Sedan 25 juni 2013 finns två versioner av ordboken tillgängliga för nedladdning. I version 2 finns information om frekvens och ordklass för drygt 100 000 uppslagsord. [1] Med uppslagsord avses här kombination av bokstäver och tecken. Ingen hänsyn tas till om bokstäverna är stora eller små eller vilken ordklass orden hör till. Substantivet a, den första bokstaven i det svenska alfabetet, substantivet A, beteckning för den elektriska enheten ampere och prepositionen a, från, räknas alltså som samma uppslagsord. I version 3 finns, förutom information om frekvens och ordklass, också definitioner och information om bruklighet. Antalet uppslagsord i version 3 av ordboken kommer till en början att vara relativt få, men under sommaren, hösten och vintern 2013 kommer de att bli allt fler.

I version 2 finns för närvarande 107 602 uppslagsord och 521 805 faktauppgifter (413 977 uppgifter om frekvens och 107 828 uppgifter om ordklass).

I version 3 finns för närvarande 31 397 uppslagsord (A - MÖTESSTATION) och 206 856 faktauppgifter (124 874 uppgifter om frekvens, 31 320 uppgifter om ordklass eller frasklass, 74 förkortningar, 45 290 definitioner, 4 761 uppgifter om bruklighet, 529 uppgifter om grammatik och 8 illustrationer).


Så här kan resultatet av en sökning i ordboken se ut:

aber
Frekvens alla texter: mindre än 1 per 500 000 löpord
Relativ position alla texter: inte bland de 28 121 vanligaste orden
Procent av filerna alla texter: i mindre än 5 % av 845 filer
aber
Ordklass substantiv
hinder, streck i räkningen

Aber är inte ett av de allra vanligaste orden. Informationen om frekvens (från en 13,0 miljoner ord eller 845 filer stor corpus, som jag samlade in från webben mellan november 2008 och augusti 2009) är därmed kortfattad. [2] Exakt information om frekvens för ovanligare ord kan hittas i listor som följer med ordboken. För ett vanligare ord kan resultatet av en sökning i ordboken se ut så här:

barn
Frekvens alla texter: 388 per 500 000 löpord information från myndigheter: 114 per 100 000 löpord [3] 100 000 löpord är den ungefärliga längden på en normallång roman och 500 000 löpord således den ungefärliga längden på fem normallånga romaner. protokoll och rapporter: 73 per 100 000 löpord tidskriftsartiklar och -krönikor: 59 per 100 000 löpord webbtext: 69 per 100 000 löpord yngre skönlitteratur: 47 per 100 000 löpord äldre skönlitteratur: 102 per 100 000 löpord
Relativ position alla texter: 120 information från myndigheter: 78 protokoll och rapporter: 124 tidskriftsartiklar och -krönikor: 153 webbtext: 127 yngre skönlitteratur: 235 äldre skönlitteratur: 109
Procent av filerna alla texter: i 56 % av 845 filer information från myndigheter: i 54 % av 93 filer protokoll och rapporter: i 41 % av 115 filer tidskriftsartiklar och -krönikor: i 79 % av 62 filer webbtext: i 58 % av 404 filer yngre skönlitteratur: i 69 % av 36 filer äldre skönlitteratur: i 100 % av 50 filer
barn
Ordklass substantiv
son eller dotter
inte vuxen person

Informationen om frekvens är utförligare och mer exakt. Inte bara uppgifter för hela corpusen redovisas utan också uppgifter för de olika typer av texter som ingår i corpusen (information från myndigheter, protokoll och rapporter, tidskriftsartiklar och -krönikor, webbtext, yngre skönlitteratur samt äldre skönlitteratur).

Jämförelser med några andra ordböcker

Uppslagsord
Skolordlista: cirka 30 000

Bonniers svenska ordbok: cirka 50 000

Illustrerad svensk ordbok: cirka 110 000

Nationalencyklopedins ordbok: cirka 60 000

MK Förlags ordbok 3.12.0: 31 397

Faktauppgifter
Skolordlista: cirka 80 000

Bonniers svenska ordbok: cirka 120 000

Illustrerad svensk ordbok: cirka 240 000

Nationalencyklopedins ordbok: cirka 360 000

MK Förlags ordbok 3.12.0: 206 856

Löpord
Skolordlista: cirka 0,2 miljoner

Bonniers svenska ordbok: cirka 0,6 miljoner

Illustrerad svensk ordbok: 1,3 miljoner

Nationalencyklopedins ordbok: cirka 2,5 miljoner

MK Förlags ordbok 3.12.0: 1,79 miljoner

Tecken
Skolordlista: cirka 1,5 miljoner

Bonniers svenska ordbok: cirka 4,0 miljoner

Illustrerad svensk ordbok: 9,0 miljoner

Nationalencyklopedins ordbok: cirka 18,0 miljoner

MK Förlags ordbok 3.12.0: 10,4 miljoner

Anm: För MK Förlags ordbok är uppgifterna om antal uppslagsord, faktauppgifter, löpord och tecken exakta. För de andra ordböckerna är dessa uppgifter uppskattningar baserade på hur många uppslagsord, faktauppgifter, löpord och tecken som finns på fem slumpmässigt utvalda sidor.

Jämförelserna kan tyckas vara haltande, eftersom de olika ordböckerna innehåller olika typer av faktauppgifter.

NE:s ordbok är den till omfånget största ordbok över det nutida svenska språket som utgivits (bokrecensioner.se).

Allmänna principer

Uppslagsorden är kombinationer av bokstäver och tecken som förekommer eller kan tänkas förekomma i texter av olika slag (från trafikskyltar till vetenskapliga avhandlingar). Ingen hänsyn tas till om bokstäverna är stora eller små eller vilken ordklass orden hör till.

Utifrån att jag tror att ju mer rik på information en text är desto begripligare blir den använder jag fler ord och fler tecken snarare än färre. Till exempel förekommer inga förkortningar (eller kommer åtminstone inte att göra det när texten är ordentligt korrekturläst).

För att de lättare ska hittas är fasta uttryck av olika slag, t.ex. försäga sig (ofrivilligt säga något som borde ha hållits hemligt) och ha bra på fötterna (ha bra underlag för ett påstående eller ett ställningstagande), inte, som i andra ordböcker jag känner till, placerade under sitt huvudord utan egna uppslagsord.

Om definitionerna

Ungefärliga riktlinjer för hur ord i MK Förlags ordbok ska definieras:


Vill du kommentera den här sidan eller någon annan sida? Skicka ett email till mats.kristiansson.skovde@gmail.com eller ett brev till Mats Kristiansson, Timmervägen 3A, 541 64 Skövde med titeln på sidan du vill kommentera, kommentaren och ditt namn eller en pseudonym.