0 Честота и честотно разпределение за големи и малки запаси
Опис в лингвистиката[редактиране]
- описи по фонология (Международна фонетична азбука, система на Jacobson-Fant-Halle от диференциални фонологични характеристики),
- по морфология (опис от етикети за обозначаване на граматически значения),
- в синтаксиса (опис на синтактичните отношения).
Езиковата система има йерархична структура: единици от по-високи нива са комбинации от единици от по-ниски нива. Езиковата система прави разлика между речник като опис на готови единици и граматика като механизъм за комбинирането им.
Езиков списък, състоящ се само от прости думи, би бил чист лексикон - книга, която практически няма да има почти никаква полза. Всичко, което обозначава сложни семантични комплекси, в този речник по дефиниция би отсъствало; до каква степен да се включат думи, които са само частично производни една от друга, трябва да се определи със специално споразумение.
Честоти и разпределения[редактиране]
Емпирична закономерност на разпределението на честотата на срещане на думи от естествен език в достатъчно голям текст. Професорът по лингвистика в Харвард Джордж Зипф (1902-1950) установи, че честотата на N-тата най-често използвана дума в естествените езици е приблизително обратно пропорционална на N.
Многократно са публикувани трудове, от които следва, че този тип разпределение, освен за лингвистиката, е характерно за обекти в областта: биология, икономика, социология, наука за науката и др.
Така че, ако изградите рейтинг на специалистите в определена предметна област, въз основа на броя на споменаванията на името на специалиста влитература или интернет, получаваме връзка, подобна на кривата на Zipf между броя на споменаванията и позицията в рейтинга:
Ясно е, че малък брой, например, бизнес коучове ще имат много висок рейтинг (лявата страна на графиката, т.нар. „Топ десет“), ограничен брой бизнес коучове ще имат среден рейтинг.
Има име за това явление. Нарича се Закон на Ципф, на името на Джордж Кингсли Зипф (1902-1950), филолог и професор в Харвардския университет. Той установи, че най-често срещаната дума на английски („the“) се използва десет пъти по-често от десетата най-често срещана дума, 100 пъти по-често от 100-та най-често срещана дума и 1000 пъти по-често от 1000-та най-често срещана дума.
Освен това беше установено, че същият модел се прилага за пазарния дял на софтуер, безалкохолни напитки, автомобили, бонбони и честотата на посещения в интернет сайтове. [. ]
Стана ясно, че в почти всяка сфера на дейност да си номер едно е много по-добре от номер три или номер десет. Освен това разпределението на възнагражденията в никакъв случай не е равномерно, особено в нашия свят, оплетен в различни мрежи. А в интернет залозите са още по-големи. Пазарната капитализация на Priceline, eBay и Amazon достига 95% от комбинираната пазарна капитализация на всички други електронни бизнеси. Няма съмнение, че победителят получава много.”