To pomeni, da zbrana besedila odražajo dejansko pisno rabo jezika. Koncept smo sicer zasnovali na Medianinih podatkih o gledanosti, branosti in razširjenosti časopisov, revij ..., v praksi pa smo se ravnali predvsem po dveh podobnih projektih - BNC (British National Corpus) in češkem nacionalnem korpusu. Pri tvorbi BNC, ki tudi vsebuje sto milijonov besed, so bili Angleži zelo pazljivi in so zbirali podatke o branosti v knjižnicah, nobenega besedila niso vključili v celoti, pazili so na to, da so vključili tekste iz vseh delov Velike Britanije; v take podrobnosti se mi zaradi časovne in finančne omejenosti sicer nismo spuščali, vendar smo upoštevali osnovne parametre, kot so količine besedil iz periodičnega, dnevnega, strokovnega tiska, leposlovja ... O tem, kdaj je korpus uravnotežen, obstajajo različna mnenja, jasno pa je, da ne more biti uravnotežen, če vsebuje tekste samo nekaterih slovenskih revij, časopisov in založb.
Beseda | Osnovna oblika | Oblikoslovne lastnosti osnovne oblike |
---|---|---|
To | ta | kazalni zaimek; srednji spol, ednina, imenovalnik |
pomeni | pomeniti | glavni glagol; dvovidski, sedanjik, 3. oseba, ednina |
da | da | podredni veznik |
zbrana | zbran | deležniški pridevnik; nedoločena stopnja, srednji spol, množina, imenovalnik |
besedila | besedilo | samostalnik, občno ime; srednji spol, množina, imenovalnik |
odražajo | odražati | glavni glagol; nedovršni, sedanjik, 3. oseba, množina |
dejansko | dejansko | splošni prislov; nedoločena stopnja |
pisno | pisen | splošni pridevnik; nedoločena stopnja, ženski spol, ednina, tožilnik |
rabo | raba | samostalnik, občno ime; ženski spol, ednina, tožilnik |
jezika | jezik | samostalnik, občno ime; moški spol, ednina, rodilnik |
Koncept | koncept | samostalnik, občno ime; moški spol, ednina, imenovalnik |
smo | biti | pomožni glagol; sedanjik, 1. oseba, množina, nezanikani |
sicer | sicer | členek |
zasnovali | zasnovati | glavni glagol; dovršni, deležnik, množina, moški spol |
na | na | predlog; mestnik |
Medianinih | Medianin | svojilni pridevnik; nedoločena stopnja, moški spol, množina, mestnik |
podatkih | podatek | samostalnik, občno ime; moški spol, množina, mestnik |
o | o | predlog; mestnik |
gledanosti | gledanost | samostalnik, občno ime; ženski spol, ednina, mestnik |
branosti | branost | samostalnik, občno ime; ženski spol, ednina, rodilnik |
in | in | priredni veznik |
razširjenosti | razširjenost | samostalnik, občno ime; ženski spol, ednina, rodilnik |
časopisov | časopis | samostalnik, občno ime; moški spol, množina, rodilnik |
revij | revija | samostalnik, občno ime; ženski spol, množina, rodilnik |
v | v | predlog; mestnik |
praksi | praksa | samostalnik, občno ime; ženski spol, ednina, mestnik |
pa | pa | priredni veznik |
smo | biti | pomožni glagol; sedanjik, 1. oseba, množina, nezanikani |
se | se | povratni zaimek;, klitična naslonskost |
ravnali | ravnati | glavni glagol; nedovršni, deležnik, množina, moški spol |
predvsem | predvsem | členek |
po | po | predlog; mestnik |
dveh | dva | glavni števnik; besedni zapis, moški spol, dvojina, mestnik |
podobnih | podoben | splošni pridevnik; nedoločena stopnja, moški spol, množina, mestnik |
projektih | projekt | samostalnik, občno ime; moški spol, množina, mestnik |
BNC | BNC | samostalnik, lastno ime; moški spol, ednina, imenovalnik |
British | British | samostalnik, lastno ime; moški spol, ednina, imenovalnik |
National | National | samostalnik, lastno ime; moški spol, ednina, imenovalnik |
Corpus | Corpus | samostalnik, lastno ime; moški spol, ednina, imenovalnik |
in | in | priredni veznik |
češkem | češki | splošni pridevnik; nedoločena stopnja, moški spol, ednina, mestnik |
nacionalnem | nacionalen | splošni pridevnik; nedoločena stopnja, moški spol, ednina, mestnik |
korpusu | korpus | samostalnik, občno ime; moški spol, ednina, mestnik |
Pri | pri | predlog; mestnik |
tvorbi | tvorba | samostalnik, občno ime; ženski spol, ednina, mestnik |
BNC | BNC | samostalnik, lastno ime; moški spol, ednina, imenovalnik |
ki | ki | podredni veznik |
tudi | tudi | členek |
vsebuje | vsebovati | glavni glagol; nedovršni, sedanjik, 3. oseba, ednina |
sto | sto | glavni števnik; besedni zapis, množina, tožilnik |
milijonov | milijon | samostalnik, občno ime; moški spol, množina, rodilnik |
besed | beseda | samostalnik, občno ime; ženski spol, množina, rodilnik |
so | biti | pomožni glagol; sedanjik, 3. oseba, množina, nezanikani |
bili | biti | pomožni glagol; deležnik, množina, moški spol |
Angleži | Anglež | samostalnik, lastno ime; moški spol, množina, imenovalnik |
zelo | zelo | splošni prislov; nedoločena stopnja |
pazljivi | pazljiv | splošni pridevnik; nedoločena stopnja, moški spol, množina, imenovalnik |
in | in | priredni veznik |
so | biti | pomožni glagol; sedanjik, 3. oseba, množina, nezanikani |
zbirali | zbirati | glavni glagol; nedovršni, deležnik, množina, moški spol |
podatke | podatek | samostalnik, občno ime; moški spol, množina, tožilnik |
o | o | predlog; mestnik |
branosti | branost | samostalnik, občno ime; ženski spol, ednina, mestnik |
v | v | predlog; mestnik |
knjižnicah | knjižnica | samostalnik, občno ime; ženski spol, množina, mestnik |
nobenega | noben | nikalni zaimek; srednji spol, ednina, rodilnik |
besedila | besedilo | samostalnik, občno ime; srednji spol, ednina, rodilnik |
niso | biti | pomožni glagol; sedanjik, 3. oseba, množina, zanikani |
vključili | vključiti | glavni glagol; dovršni, deležnik, množina, moški spol |
v | v | predlog; mestnik |
celoti | celota | samostalnik, občno ime; ženski spol, ednina, mestnik |
pazili | paziti | glavni glagol; nedovršni, deležnik, množina, moški spol |
so | biti | pomožni glagol; sedanjik, 3. oseba, množina, nezanikani |
na | na | predlog; tožilnik |
to | ta | kazalni zaimek; srednji spol, ednina, tožilnik |
da | da | podredni veznik |
so | biti | pomožni glagol; sedanjik, 3. oseba, množina, nezanikani |
vključili | vključiti | glavni glagol; dovršni, deležnik, množina, moški spol |
tekste | tekst | samostalnik, občno ime; moški spol, množina, tožilnik |
iz | iz | predlog; rodilnik |
vseh | ves | celostni zaimek; moški spol, množina, rodilnik |
delov | del | samostalnik, občno ime; moški spol, množina, rodilnik |
Velike | velik | splošni pridevnik; nedoločena stopnja, ženski spol, ednina, rodilnik |
Britanije | Britanija | samostalnik, lastno ime; ženski spol, ednina, rodilnik |
v | v | predlog; mestnik |
take | tak | kazalni zaimek; ženski spol, ednina, rodilnik |
podrobnosti | podrobnost | samostalnik, občno ime; ženski spol, ednina, rodilnik |
se | se | povratni zaimek;, klitična naslonskost |
mi | jaz | osebni zaimek; 1. oseba, ednina, dajalnik, klitična naslonskost |
zaradi | zaradi | predlog; rodilnik |
časovne | časoven | splošni pridevnik; nedoločena stopnja, ženski spol, ednina, rodilnik |
in | in | priredni veznik |
finančne | finančen | splošni pridevnik; nedoločena stopnja, ženski spol, ednina, rodilnik |
omejenosti | omejenost | samostalnik, občno ime; ženski spol, ednina, rodilnik |
sicer | sicer | členek |
nismo | biti | pomožni glagol; sedanjik, 1. oseba, množina, zanikani |
spuščali | spuščati | glavni glagol; nedovršni, deležnik, množina, moški spol |
vendar | vendar | priredni veznik |
smo | biti | pomožni glagol; sedanjik, 1. oseba, množina, nezanikani |
upoštevali | upoštevati | glavni glagol; dvovidski, deležnik, množina, moški spol |
osnovne | osnoven | splošni pridevnik; nedoločena stopnja, moški spol, množina, tožilnik |
parametre | parameter | samostalnik, občno ime; moški spol, množina, tožilnik |
kot | kot | podredni veznik |
so | biti | pomožni glagol; sedanjik, 3. oseba, množina, nezanikani |
količine | količina | samostalnik, občno ime; ženski spol, množina, imenovalnik |
besedil | besedilo | samostalnik, občno ime; srednji spol, množina, rodilnik |
iz | iz | predlog; rodilnik |
periodičnega | periodičen | splošni pridevnik; nedoločena stopnja, srednji spol, ednina, rodilnik |
dnevnega | dneven | splošni pridevnik; nedoločena stopnja, moški spol, ednina, rodilnik |
strokovnega | strokoven | splošni pridevnik; nedoločena stopnja, moški spol, ednina, rodilnik |
tiska | tisk | samostalnik, občno ime; moški spol, ednina, rodilnik |
leposlovja | leposlovje | samostalnik, občno ime; srednji spol, ednina, rodilnik |
O | o | predlog; mestnik |
tem | ta | kazalni zaimek; srednji spol, ednina, mestnik |
kdaj | kdaj | splošni prislov; nedoločena stopnja |
je | biti | pomožni glagol; sedanjik, 3. oseba, ednina, nezanikani |
korpus | korpus | samostalnik, občno ime; moški spol, ednina, imenovalnik |
uravnotežen | uravnotežen | deležniški pridevnik; nedoločena stopnja, moški spol, ednina, imenovalnik, določnost=ne |
obstajajo | obstajati | glavni glagol; nedovršni, sedanjik, 3. oseba, množina |
različna | različen | splošni pridevnik; nedoločena stopnja, srednji spol, množina, imenovalnik |
mnenja | mnenje | samostalnik, občno ime; srednji spol, množina, imenovalnik |
jasno | jasno | splošni prislov; nedoločena stopnja |
pa | pa | priredni veznik |
je | biti | pomožni glagol; sedanjik, 3. oseba, ednina, nezanikani |
da | da | podredni veznik |
ne | ne | členek |
more | moči | glavni glagol; nedovršni, sedanjik, 3. oseba, ednina |
biti | biti | pomožni glagol; nedoločnik |
uravnotežen | uravnotežen | deležniški pridevnik; nedoločena stopnja, moški spol, ednina, imenovalnik, določnost=ne |
če | če | podredni veznik |
vsebuje | vsebovati | glavni glagol; nedovršni, sedanjik, 3. oseba, ednina |
tekste | tekst | samostalnik, občno ime; moški spol, množina, tožilnik |
samo | samo | členek |
nekaterih | nekateri | nedoločni zaimek; ženski spol, množina, rodilnik |
slovenskih | slovenski | splošni pridevnik; nedoločena stopnja, ženski spol, množina, rodilnik |
revij | revija | samostalnik, občno ime; ženski spol, množina, rodilnik |
časopisov | časopis | samostalnik, občno ime; moški spol, množina, rodilnik |
in | in | priredni veznik |
založb | založba | samostalnik, občno ime; ženski spol, množina, rodilnik |