СУЧАСНІ КОРПУСНІ ТЕХНОЛОГІЇ У СТВОРЕННІ ЕЛЕКТРОННОГО СЛОВНИКА
DOI:
https://doi.org/10.24919/2522-4565.2023.53.11Ключові слова:
електронний словник, зіставлення слів, корпусна лінгвістика, корпус тексту, корпусні технології, створення корпусівАнотація
У статті розглянуто роль корпусної лінгвістики як самостійної галузі, що розробляє та вдосконалює методики збору реальних мовних явищ, писемних та усних текстів, а також способів їх збереження та аналізу. Корпусна лінгвістика має вагоме значення, оскільки сприяє оптимізації епістемічної функції, пов’язаної зі збереженням і передачею знань та відображенням національної самосвідомості. Автори зазначають, що дослідження корпусної лінгвістики спрямовані переважно на вивчення питань теорії та практики створення корпусів, типологію корпусу, структурування та принципи відбору базових одиниць, а також вивчення мови за допомогою корпусних методів. У статті розкрито об’єкт, предмет, особливості та мету корпусної лінгвістики, що полягає у здійсненні об’єктивного лінгвістичного опису мовної системи на основі вивчення людської комунікації; з’ясовано етапи та особливості її розвитку. Установлено, що базовим поняттям корпусної лінгвістики є корпус тексту, під яким розуміють (у широкому сенсі) низку письмових чи усних текстів, використовуваних із метою дослідження мови. Значну увагу приділено створенню мовних корпусів. Наголошено, що корпусні технології можуть бути застосовані для створення електронних словників. Вони особливо корисні в процесах лематизації та стемінгу. Послуговуючись базовою формою слова, вони скорочують обсяг словника, зменшуючи тим самим кількість записів і полегшуючи пошук необхідного слова. Звернено увагу на корпусну організацію лінгвальних даних, яка потребує врахування типології текстових корпусів, оскільки це сприяє виробленню стратегій та принципів створення. У дослідженні встановлено, що корпусні технології ефективні в міжмовному зіставленні лексичних одиниць, покликаному встановити спільні та відмінні ознаки різних мов, що допоможе окреслити особливості їх уживання.
Посилання
Бобкова Т. В. Корпус текстів : основні аспекти визначення. Науковий вісник кафедри ЮНЕСКО Київського національного лінгвістичного університету. Філологія, педагогіка, психологія. 2014. Вип. 29. С. 11–20. URL : http://www.mova. info/ corpus_papers/bobkova-corpus.pdf/.
Демська-Кульчицька О. Основи національного корпусу української мови : [монографія]. Київ : Інститут української мови НАНУ, 2005. 219 с.
Жуковська В. В. Вступ до корпусної лінгвістики : навчальний посібник. Житомир : Вид-во ЖДУ імені Івана Франка, 2013. 142 с.
Лендау С. І. Словники : мистецтво та ремесло лексикографії [пер. з англ.]. Київ : К. І. С., 2012. 480 с.
Aarts J., Meijs. W. Corpus Linguistics : Recent developments in the Use of Computer Corpora in English Language Research. Amsterdam : Rodopi, 1984. 425 p.
Biber D. Corpus-based and corpus-driven analyses of language variation and use. The Oxford Handbook of Linguistic Analysis / eds. B. Heine, H. Narrog. Oxford, 2010. P. 159–191.
Dash N. S. Corpus linguistics and language technology : with reference to Indian Languages. New Dehli : Mittal Publications, 2005. 445 p.
Kennedy G. Introduction to corpus linguistics. London : Longman, 1998. 315 р.
Leech G. Corpora and theories of linguistic performance. Directions in corpus linguistics / ed. J. Startvik. Berlin, 1992. P. 105–122.
Leech G., Fligelston S. Computers and corpus analysis. Computers and written texts / [ed. C. S. Butler]. Oxford : Blackwell Oxford, 1992. P. 115–140.
McEnery T., Hardie A. Corpus linguistics : method, theory and practice. Cambridge : Cambridge University Press, 2012. 294 p.
McEnery T., Xiao R., Tono Y. Corpus-Based Language Studies : An Advanced Resource Book. London, New York, 2006. 408 p.
Meyer Ch. F. English corpus linguistics. An introduction. Cambridge : Cambridge University Press, 2002. 168 p.
Tognini-Bonelli E. Corpus Linguistics at Work. Amsterdam : John Benjamins, 2001. 219 p.
Francis W. N. Language Corpora B. C. Directions in Corpus Linguistics / [ed J. Svartvik]. Berlin and New York : Moutin, 1992. P. 17–34.