SPECIFICITY OF COMPILING AND PERSPECTIVES OF USING OF ENGLISH-UKRAINIAN PARALLEL CORPUS OF IT TEXTS

Authors

DOI:

https://doi.org/10.24919/2522-4565.2021.47.16

Keywords:

parallel corpus, IT texts, technical terminology, translation difficulties

Abstract

The article deals with the topicality of creating an English-Ukrainian parallel corpus of texts in the field of information technology and outlines the prospects for its use primarily in translation and linguistic studies. Particular attention is paid to the main stages of building a parallel corpus, including data collection, proofreading and normalization of texts, deletion of nontextual information, transformation of texts into files of the needed format, uploading the corpus to the corpus manager and text analyzer Sketch Engine, adding corpus markup, providing individual access to users. Although some corpora already exist in Ukrainian corpus linguistics (Ukrainian National Linguistic Corpus, General Regional Annotated Corpus of the Ukrainian Language, etc.), there is still a lack of parallel corpora, including English-Ukrainian ones. And, given how powerfully and rapidly the IT sector is developing these days, as well as taking into account the peculiarities and difficulties of translating IT discourse and, in particular, terminology, it will be useful to create an English-Ukrainian parallel corpus of IT texts. The main value of the English-Ukrainian parallel corpus of IT texts is that it can be a source of a large number of translation solutions, which will facilitate the process of translating IT texts, as well as improve their quality, avoid spontaneous translations. At the same time, it is shown how the constructed corpus of texts can be used for linguistic research into IT discourse. It allows us to make valid conclusions about the use of language units based on real contexts and statistical parameters (identify features of IT terminology, analyze frequently used structural models and translation approaches, highlight features of the style of texts in the field of IT).

References

Бобер Н. Корпусний підхід у контексті досліджень прикладної лінгвістики. Актуальні питання іноземної філології. 2018. № 8. С. 34–40.

Паралельний корпус текстів ПарКУМ / Н.П. Дарчук, М.О. Лангенбах, В.М. Сорокін, Я.В. Ходаківська. Науковий часопис НПУ імені М. П. Драгоманова. Серія 9 «Сучасні тенденції розвитку мов». 2017. № 15. С. 28–35.

Демська-Кульчицька О. Дещо про класифікацію текстових корпусів. Наукові записки. Серія «Мовознавство». 2004. № 1 (11). С. 153–157.

Жуковська В.В. Вступ до корпусної лінгвістики : навчальний посібник. Житомир : ЖДУ ім. І. Франка, 2013. 142 с.

Сидор А.Р., Нанівський З.С. Урахування лексичних особливостей сфери інформаційних технологій під час перекладу з англійської мови українською. Закарпатські філологічні студії. 2019. № 7. С. 47–51.

Широков В.А., Бугаков О.В., Грязнухіна Т.О. Корпусна лінгвістика. Київ : Довіра, 2005. 471 с.

Published

2022-01-27