Jagten på hverdagssproget – brugen af tekster fra internetfora i arbejdet med Den Danske Ordbog


  • Kirsten Appel
  • Nathalie Hau Sørensen
  • Jonas Jensen




Ordbøger, korpusser og digitale resurser

Aspell-de. ftp.gnu.org/gnu/aspell/dict/0index.html (januar 2024).

Baby.dk. baby.dk/debat/grupper.aspx (december 2023).

Bold.dk. bold.dk/snak (november 2023).

CSTLEMMA. github.com/kuhumcst/cstlemma (oktober 2023). Danmarks Statistik. sprogteknologi.dk/dataset/fornavne-og-efternavne-i-befolkningen-i-danmark-i-januar-2020 (marts 2023).

DDO = Den Danske Ordbog. Det Danske Sprog- og Litteraturselskab. ordnet.dk/ddo (marts 2024).

Debatten.net. debatten.net/forum/ (december 2023).

Fakta om DDO. ordnet.dk/ddo/fakta-om-ddo/ordbogens-tilblivelse (marts 2024).

HardwareOnline. hardwareonline.dk/forum_list.aspx?fid=23 (november 2023).

Hestenettet. heste-nettet.dk/forum/1/ (august 2023).

Moby Crosswords word list. gutenberg.org/files/3201/files/ (januar 2024).

Pokernet. pokernet.dk/forum/kategorier/frontpage/off-topic.html (december 2023).

Reddit.com/r/denmark. reddit.com/r/denmark (november 2023).

ScandiNER. huggingface.co/saattrupdan/nbailab-base-ner-scandi (januar 2024).

Tetragrammodel for dansk. github.com/dsldk/lexiscore (januar 2024).

Word2vec-model for dansk. korpus.dsl.dk/resources/details/word2vec.html (oktober 2023).

Wordclouds. wordclouds.com (marts 2024).

Anden litteratur

Falk, Ingrid, Delphine Bernhard & Christophe Gérard (2014): From Non Word to New Word: Automatically Identifying Neologisms in French Newspapers. I: LREC-The 9th edition of the Language Resources and Evaluation Conference. Reykjavik, Iceland. 4338-4344. lrec-conf.org/proceedings/lrec2014/pdf/288_Paper.pdf.

Halskov, Jakob & Pia Jarvad (2010): Manuel og maskinel excerpering af neologismer. I: NyS – Nydanske Sprogstudier 38, 39-68.

Kerremans, Daphné, Susanne Stegmayr & Hans-Jörg Schmid (2012): The NeoCrawler: Identifying and Retrieving Neologisms from the Internet and Monitoring Ongoing Change. I: Kathryn Allan & Justyna A. Robinson (eds.): Current Methods in Historical Semantics 73. Berlin, Boston: De Gruyter Mouton. 59-96.

Langemets, Margit, Jelena Kallas, Kaisa Norak & Indrek Hein (2020): New Estonian Words and Senses: Detection and Description. I: Dictionaries: Journal of the Dictionary Society of North America 41(1), 69-82.

Norling-Christensen, Ole & Jørg Asmussen (1998): The Corpus of the Danish Dictionary. I: Lexikos 8, 223-242. https://doi.org/10.5788/8-1-955.

Paulsen, Mikkel Ekeland (2023): Wheat or Chaff? A Compound Selection Model Based on Look-Up Data. I: International Journal of Lexicography 36(3), 306-324.

Sørensen, Nathalie Hau, Nicolai Hartvig Sørensen, Kirsten Lundholm Appel & Sanni Nimb (2023): Trawling the corpus for the overlooked lemmas. I: Marek Medveď, Michal Měchura, Carole Tiberius, Iztok Kosem, Jelena Kallas, Miloš Jakubíček & Simon Krek (eds.): Electronic lexicography in the 21st century (eLex 2023): Invisible Lexicography. Proceedings of the eLex 2023 conference. Brno, 27-29 June 2023. Brno: Lexical Computing CZ s.r.o. 392-409.





Appel, K., Hau Sørensen, N., & Jensen, J. (2024). Jagten på hverdagssproget – brugen af tekster fra internetfora i arbejdet med Den Danske Ordbog. LexicoNordica, 1(31). https://doi.org/10.7146/ln.v1i31.151284



Tematiske bidrag