Организация на съхранение и извличане на информация в Интернет
По темата: "Организация на съхранение и извличане на информация в Интернет"
Интернет като средство за информация в България все още не може да се конкурира с традиционните медии, но има големи перспективи в това отношение и ще може да бъде наравно с други информационни ресурси в бъдеще.
В момента повече или по-малко редовно използват над 500 милиона души
Интернет, а след две години техният брой, според експертите, ще надхвърли 1 милиард, с други думи, повече от 16% от населението на света. Разбира се, такава колосална аудитория не можеше да остане непотърсена - Интернет отдавна се превърна в огромна информационна платформа.
1. Съхраняване на данни в мрежатаИнтернет
1.1 Хипертекстови документи, типове файлове
Хипертекстовият документ е документ, съдържащ така наречените връзки към друг документ. Всичко това се реализира чрез HyperText Transfer Protocol (HTTP).
Информацията в уеб документите може да се търси по ключови думи. Това означава, че всеки уеб браузър съдържа определени връзки, чрез които се формират така наречените хипервръзки, позволяващи на милиони интернет потребители да търсят информация по целия свят.
Главните и малките букви не се разграничават при писане на тагове.В повечето случаи таговете се използват по двойки. Двойката се състои от отварящи (начален етикет) и затварящи (краен етикет) тагове. Синтаксис на отворен етикет:
Скобите, използвани в описанието на синтаксиса, означават, че елементът може да бъде пропуснат. Името на затварящия таг се различава от името на отварящия таг само по това, че е предшествано от наклонена черта:
Атрибутите на етикета се записватследния формат:
Кавичките при посочване на стойността на аргумента не са задължителни и могат да бъдат пропуснати. За някои атрибути стойността може да не е посочена. Затварящият таг няма атрибути.
Действието на всеки сдвоен таг започва от мястото, където се среща отварящият таг, и завършва, когато се срещне съответният затварящ таг. Често двойката начален и краен тагове се наричаконтейнер, а частта от текст, заобиколена от началния и крайния тагове, се наричаелемент.
Последователността от знаци, съставляващи текста, може да бъде интервали, табулатори, нови редове, връщане на каретка, букви, препинателни знаци, цифри и специални знаци (напр. +, #, $, @),с изключение наследните четири знака, които имат специално значение в HTML: (по-голямо от), & (амперсанд) и " (двойни кавички). Ако трябва да включите някой от тези знаци в текста, трябва да го кодирате със специална последователност от знаци.
Неразделените интервали също могат да бъдат класифицирани като специални знаци. Използването на този знак е един от начините за увеличаване на разстоянието между някои думи в текст. Обикновените интервали не могат да се използват за тези цели, тъй като група от последователни интервали се интерпретира от браузъра като едно.
1.2 Графични файлове, техните видове и характеристики
Понастоящем използването на пълноцветни, висококачествени графики в реалистични цветове на компютри от клас PC изглежда напълно ежедневие. Въпреки че не толкова отдавна това беше привилегията на системите за публикуване, които обикновено бяха изградени на платформи Macintosh или графични станции на Silicon Graphics. Потребителите на компютри бяха доволни, като последна инстанция, с графики с цвят, максимална дълбочина от 8 бита/пиксел (256 цвята) сдоста слаба резолюция 320X200 или 16 цвята при резолюция 640X480.
Освен това, през последните 5 години, поради светкавичното разпространение на Интернет и по-специално на технологиите на World Wide Web, започна да възниква проблем от друг вид - разработването на формати на изображения, достатъчно компактни, за да се предават по мрежата с минимални закъснения и хардуерно независими, тъй като компютри с различни архитектури са свързани към мрежата.
В тази връзка бих искал да прегледам накратко няколко често срещани графични формата и да опиша накратко техните възможности. Цялата тази информация е обобщена в следната таблица:
формат | Макс. Дълбок цветове | Макс. брой цветове | Макс. размер на изображението, пиксел | Методи за компресиране | Кодиране на множество изображения |
BMP | 24 | 16'777'216 | 65535x65535 | RLE* | - |
gif | 8 | 256 | 65535x65535 | LZW | + |
JPEG | 24 | 16'777'216 | 65535x65535 | JPEG | - |
PCX | 24 | 16'777'216 | 65535x65535 | RLE | - |
PNG | 48 | 281'474'976'710'656 | 2147483647x 2147483647 | Дефлация (LZ77) | - |
TIFF | 24 | 16'777'216 | общо 4'294'967'295 | LZW, RLE и други* | + |