1_korpusnaya-ling - Страница 11

Анализът на значението на думите се усложнява от факта, че много словоформи

на английски имат много граматически функции. По този начин сделките могат да се използват като глагол в единствено число и като съществително име в множествено число. Deal и dealing могат да се използват както като глагол, така и като съществително. Честотните списъци, изградени от неанотирани данни от корпуси, са ограничени в своята полезност, защото не показват кои граматически употреби на думи са често срещани и кои са редки.

в единствено число (gramme nn) 115 пъти, като собствено име (np) - 1 път, като глагол (vb) - 66 пъти и т.н. С такава информация от анотирания корпус може да се продължи по-подробно изучаването на появата на DEAL, като се обърне внимание на разпространението на неговите глаголни и субстантивни форми и се сравнява тяхното използване в различни регистри.

Честота на формите DEAL в анотирания корпус

Разпределение на ДЕЛ по регистри

Думите често се използват в различни регистри, така че общите характеристики на една дума може да не отразяват реалното състояние на нещата в езика. Първо, разгледайте лексемата DEAL като съществително в анотирания корпус, като обърнете внимание само на формите за единствено и множествено число (сделка и сделки).

Тъй като корпусът е съставен от текстове от различни регистри, като нехудожествена литература, художествена литература, приключенска литература и каубойски романи, е възможно да се сравни честотата на сделката и сделките в различни регистри

Таблица 6 включва необработени преброявания и нормализирани преброявания. Преките преброявания показват броя на срещанията на думата във всеки регистър; например в съобщения в пресатаУстановени са 14 срещания на съществителното сделка, в прегледите на пресата - 4, в научната литература - 16 и др.

Честота на съществителното DEAL в определени регистри, нормализирана до 100 хиляди думи

Тези подкорпуси обаче включват различен брой думи: в репортажите в пресата - 88 хиляди думи, в прегледите на пресата - 34 хиляди думи, а в научната литература - 160 хиляди думи. Поради тази причина сравнението на преките преброявания не може да се използва като критерий за извеждане на повече или по-малко честота на дума в един регистър в сравнение с друг. В края на краищата, ако започнете да анализирате по-голям пример на текст от същия регистър, вероятно ще бъдат разкрити други случаи на използване на търсената дума. Може да се очаква, че преките преброявания за DEAL в отразяването в пресата ще бъдат по-ниски от тези в научната литература, просто защото се анализира много по-малък подкорпус от отразяване в пресата и това не означава непременно, че DEAL се среща по-рядко в отразяването в пресата. По-скоро са необходими измервания за това колко често читателят среща DEAL като съществително.

Такива измервания се наричат ​​"нормализирана" (нормализирана) честота. Нормализираните преброявания преобразуват броя на срещанията на дадена дума според стандарта

мащаб, обикновено по отношение на 1 милион употреби, или в този случай 100 000. Когато преброяването се нормализира, има 15,9 срещания на 100 000 думи в съобщенията в пресата, но само 10 срещания на 100 000 думи в научната литература и т.н. Следователно само нормализираните преброявания осигуряват валидна основа за сравнение между регистрите.

Когато случаите на сделката на съществителното са разпределени по падежи, проблемът с размера на корпуса за лексикографска работа става още по-очевиден.Таблица 6 показва, че четири от осемте подкорпуса имат общо срещания. Нито един от регистрите няма достатъчно голям брой употреби на DEAL, максималният брой е 24 (фикция). Ясно е, че корпусът е твърде малък за подробен анализ на употребата на DEAL като съществително, така че по-нататъшните модели на разпределението му по регистри ще бъдат разгледани върху материала на по-солиден като обем корпус.

Честотата на съществителното име и глагола се разглеждат в подкорпуси на два регистъра на корпуса

Нормализирани брои за

думи в подкорпус

Таблица 7 показва, че сделката и сделките се срещат много по-често в корпуса и това осигурява по-солидна основа за анализиране на тяхното използване. От данните в тази честотна таблица стават очевидни няколко интересни модела.

нормализираните преброявания за всички примерни текстове (изчерпателни преброявания) показват, че deal/deals като глагол е само малко по-често срещан от deal/deals като съществително (119 wpm срещу 90 wpm). Ако обаче разгледаме възникването по регистър, се очертава друга картина. В научната литература сделка/сделки функционира два пъти по-често като глагол, отколкото като съществително (176 срещу 74 на милион думи). Художествената литература показва обратния модел, където сделка/сделки е много по-често срещано като съществително, отколкото като глагол (107 срещу 63 на милион думи).

Тези модели на използване на DEAL също подчертават друг важен момент при създаването на корпус: корпус, ограничен от един от регистрите, няма да представлява езика в другите регистри. По този начин не е възможно да се правят обобщения от един регистър за модели, които да бъдат намерени в други регистри. Примерът показва товаотносителната честота на DEAL като съществително и като глагол в нехудожествената литература е напълно противоположна на относителната им честота в художествената литература. Корпус, ограничен до един от тези регистри, изобщо не би показал какво се намира в другия регистър и изграждането на модели на езиковата употреба на думата би било неправилно.

Освен това този пример показва колко погрешни и ненадеждни могат да бъдат изчерпателните обобщения. Те крият противоположни модели на употреба, които действително се срещат, и в резултат на това често са неточни за всеки вкус, описвайки тип език, който всъщност изобщо не съществува.

За да се отговори на въпроса какво може да обясни различното разпределение на субстантивните и словесните форми по регистри, е необходимо да се анализират различните значения на думата и начините, по които тя се използва във всеки регистър.

Разпределение на значенията (стойностите) по регистри

Корпусите ви позволяват да изследвате значенията на думите чрез използването на конкорданси. Можете да започнете изучаването на значенията на думите, като анализирате техните колокати (колокати) - думи, с които анализираната дума (често) се среща заедно. За всяко колокация има силна тенденция да се свързва с единичен смисъл или значение (въпреки че повече от една комбинация може да бъде свързана с едно и също значение). Следователно, чрез подчертаване на най-честите колокации на една дума, човек може ефективно и надеждно да анализира значенията. След това трябва да сравните какво демонстрира анализът на колокатите на съществителното DEAL в корпуса с дефинициите в неговия речник.

Таблица 8 показва колокации за сделката на съществителното в два случая от корпуса. Подобни таблици, показващи списък от комбинации, сортирани по честота, могат да бъдат получени с помощтаразлични програми за съгласуване.

Левите колокации са думи, които непосредствено предхождат съществителното сделка. Например от данните, представени в таблица 8, следва, че думата good е често срещано ляво колокация за сделка. Десните колокации са думи, които следват непосредствено съществителното сделка. Например, думата на е често срещано правилно съпоставяне за сделка. Списъците в тази таблица представляват само първата дума отдясно и отляво на сделката, но същите техники ви позволяват да изследвате съвместимостта от разстояние (например на разстояние от две или три думи). Както се вижда от таблицата, в научната литература най-честият ляв колокат на съществителното сделка е прилагателното great (45 пъти на милион думи), следвано от прилагателното good (23 пъти на милион думи). Колокациите следващи по ред (пакет и това) се появяват два пъти и следователно не са включени в таблица 8, която показва само колокации, които се срещат поне 3 пъти на милион думи във всеки случай.

Чести колокации на съществителното сделка в два подкорпуса (5,7 милиона думи) на корпуса

Нормализиран брой на 1

(подкорпус 2,7 милиона думи)

(подкорпус 3 милиона думи)

В научната литература, очевидно, колокациите добра сделка и голяма сделка ще означават голям брой или транзакции в даден бизнес. Когато разглеждаме правилните колокации, става ясно, че значението, свързано с количеството, е най-често срещаното за сделка. Това се потвърждава и от честотата на дясната колокация на (39 пъти на милион думи). Честотата на следващото колокатиране е много по-малка, сравнете: повече (7 пъти на милион думи), в и до (3 пъти на милион думи). И така, съществителното сделка най-често има значението на количество, както във фразите a good / great deal of.

срв.: много общо,се различават много в разбиранията си, много да се желае, много да се предложи.

Таблица 8 показва, че фразите в художествената литература имат интересни прилики и разлики с фразите в научната литература. Отново, най-често срещаните леви колокации са страхотни и добри. Наистина, съвместната поява на добра сделка и голяма сделка е много сходна в двата регистъра (около 68 пъти на милион думи). В художествената литература обаче има значителен брой случаи (96 примера), които не принадлежат към модела „добро/страхотно + сделка“. Collocates са по-широко разпространени тук - the се среща 8 пъти на милион думи и big се среща 3 пъти на милион думи, докато останалите 37 collocats се срещат не повече от два пъти.

Моделът на фразите предполага, че значението на количеството е централно за художествената литература, но не и единственото. Например лявото съпоставяне на се използва със СДЕЛКА, за да означава споразумение, тъй като в примерите част от сделката е... и Не е ли това сделката? Големият колокат представлява различно значение. Това показва липсата на важност в изрази като нищо голямо и какво е голямото?

В допълнение, много колокации, които не са често срещани поотделно, са свързани с бизнес транзакции: сделка за собственост, сделка за записи, сделка за парични средства, сделка със земя, сделка за добив. Въпреки че тези думи не се отнасят до петте основни колокации на DEAL, заедно те показват важно значение.

Фразите за сделка в художествената литература също разкриват значение, което не се среща в нехудожествената литература. В списъка с правилни колокации има 4 срещания на маса и 1 срещане на кутия, когато става дума за вида дърво (дърво). Тези колокации не са чести, но сочат към друга употреба на сделката в художествената литература и тяхнатапоявата в 5 различни текста предполага, че тази употреба е относително често срещана.

Таблица 9 показва 7-те значения на съществителното сделка, които се срещат най-често в пет речника. Повечето речници споменават всичките 7 стойности, но редът им е различен. Например, значението „голямо, но неопределено количество“ е въведено в първия речников запис в Третия речник на Webster в дефиниция 2 и в Random House Dictionary в дефиниция

21. Сравнявайки тези речникови дефиниции с резултатите от изследването на съществителното сделка с помощта на корпуси, могат да бъдат идентифицирани няколко проблема. Употребата на съществителното сделка в значението на количество несъмнено е най-често срещаната и в двата анализирани регистъра на корпуса. Това значение обаче не е развито до или дори определение в два речника. В допълнение, анализът на колокатите разкри сравнително често значение, което не е отбелязано в тези речници: употребата на голяма сделка в смисъла на „незначителност“. И накрая, във всичките пет речника не се вземат предвид разликите в падежите, макар и повече

по-късните речници, базирани на данни от корпуса, започват да вземат предвид важни регистрови модели.