Pagini Web
Paginile de Web sunt scrise într-un limbaj numit
HTML (Hypertext Markup Language limbaj de marcare hipertext). HTML permite
utilizatorilor să producă, pagini care includ texte, grafică
şi indicatori la alte pagini de Web. Vom începe să studiem HTML eu
aceşti indicatori, pentru că ei reprezintă tocmai mecanismul
care ţine Web-ul conectat
URL-
Uniform Resource Locators
O pagină de Web poate să conţină
referinţe la alte pagini. Să explicăm cum sunt implementate
aceste referinţe. Încă de la crearea Web-ului a fost clar că
pentru a avea o pagină care să indice spre altă pagină este
necesar un mecanism care să permită numirea şi regăsirea
paginilor. În particular sunt trei întrebări la care trebuie sa se
răspundă înainte de a se putea afişa o pagină:
l.
Cum se numeşte pagina ?
2.
Cum este localizată pagina ?
3.
Cum se face accesul la pagină ?
Dacă fiecare pagină ar avea un nume unic,
atunci nu ar exista nici o ambiguitate în identificarea paginilor. Totuşi,
problema nu este încă rezolvată. Să considerăm de exemplu o
paralelă între oameni şi pagini. În SUA aproape fiecare persoană
are un număr de asigurare socială; care este un identificator unic,
astfel încât nu există două persoane cu acelaşi număr. Totuşi,
cunoscând numai numărul respectiv nu există nici o posibilitate de a
găsi adresa persoanei respective, şi sigur nu se poate afla dacă
persoanei respective trebuie să i se scrie în engleză, spaniolă
sau chineză. Web-ul are practic acelaşi fel de probleme.
Soluţia aleasă identifică paginile
într-un mod care rezolvă toate trei problemele în acelaşi timp. Fiecare pagină are
un URL (Uniform Resource Locater - adresa uniformă pentru localizarea
resurselor) care funcţionează ca nume al paginii general valabil. Un
URL are trei componente: protocolul, numele DNS al maşinii pe care este
memorat fişierul şi un nume local, care indică în mod unic
pagina (de obicei numele fişierului care conţine pagina). De exemplu, URL-ul
departamentului din care face parte autorul este:
http://www.cs.vu.nl/welcome.html
Acest URL este format din trei componente:
protocolul (http), numele DNS al serverului (www.cs.vu.nd) şi numele
fişierului (welcome.html), cu semnele de punctuaţie
corespunzătoare.
Se utilizează notaţii care reprezintă
prescurtări standard. De. exemplu user/ poate să fie pus în
corespondenţă cu directorul WWW al utilizatorului user, folosind
convenţia că o referinţă la directorul respectiv
implică un anumit fişier, de exemplu index.html. De exemplu pagina
autorului poate să fie referită ca:
http://www.cs.vu.nl/~ast/
chiar dacă de fapt numele fişierului este
diferit. Pe multe servere un nume de fişier indică implicit pagina
organizaţiei căreia îi aparţine serverul.
Acum ar trebui să fie clar cum
funcţionează hipertextul. Pentru a face o porţiune de text
selectabilă, cel care scrie pagina trebuie să furnizeze două
elemente: textul prin care se face selecţia şi URL-ul paginii care
trebuie adusă dacă textul este selectat. Când se face selecţia,
programul de navigare caută numele serverului utilizând DNS-ul. Pe baza
adresei IP a serverului, programul de navigare stabileşte o conexiune TCP
spre server. Utilizând
această conexiune, se transmite numele fişierului utilizând
protocolul specificat. Bingo. Acum soseşte pagina.
Protocolul http este protocolul nativ pentru Web; e1
este utilizat de către serverele de HTTP.
Protocolul ftp este utilizat pentru accesul la
fişiere prin FTP (File Transfer Protocol - -protocol pentru transferul de
fişiere), protocolul Internet de transfer de fişiere. FTP este
utilizat de peste douăzeci de ani şi este foarte răspândit. Numeroase
servere de FTP din toată lumea permit ca de oriunde din Internet să
se facă o conectare şi să se aducă orice fişier plasat
pe un server FTP. Web-ul nu aduce schimbări aici, face doar ca
obţinerea fişierelor să se facă mai uşor, pentru
că FT'P are o interfaţă mai puţin prietenoasă. În
viitor probabil că FTP-ul va dispare, deoarece nu există nici un
avantaj pentru o organizaţie să aibă un server de FTP în loc de
un server de HTTP, care poate să facă tot ce face un server de FTP,
şi chiar mai mult (desigur mai există nişte argumente legate de
eficienţă).
Este posibil să se facă acces la un
fişier local ca la o pagină de Web, fie utilizând protocolul file
(fişier), sau pur şi simplu utilizând numele fişierului. Această
abordare este similară utilizării protocolului FTP, dar nu
implică existenţa unui server. Desigur funcţionează numai
pentru fişiere locale.
{Protocolul news permite unui utilizator de Web
să citească un articol din ştiri ca şi cum ar fi o
pagină de Web. Aceasta înseamnă de fapt că un program de
navigare este în acelaşi timp şi un cititor de ştiri. De fapt
multe programe de navigare au butoane sau elemente de meniu care permit citirea
ştirilor USENET mai uşor decât daca se utilizează cititoare de
ştiri obişnuite.
Protocolul news admite două formate. Primul format
specifică un grup de ştiri si poate sa fie utilizat pentru a
obţine o listă de articole de la un server de ştiri
preconfigurat. Al doilea format cere identificatorul unui articol, de exemplu
AA0134223112@csutah.edu. Programul de navigare aduce articolul de la serverul
corespunzător utilizând protocolul NNTP.
Protocolul gopher este utilizat de sistemul Gopher,
care a fost proiectat la universitatea Minnesota. Numele este cel al echipei atletice
a universităţii, the Golden Gopher, de asemenea acest nume este
utilizat în argou pentru “go for”; adică o comandă de aducere
Gopher-ul a precedat Web-ul cu câţiva ani. Este o metodă de regăsire
a informaţiei, similar conceptual cu cea utilizată de Web, dar
acceptând numai text şi imagini. Când un utilizator se conectează la
un server de Gopher, va avea la dispoziţie un meniu de fişiere
şi directoare, fiecare intrare putând să fie conectată la orice
meniu de Gopher oriunde în lume.
Marele avantaj al Gopher-ului în raport cu Web-ul
este că funcţionează foarte bine cu terminale ASCII care
afişează 25 x 80 caractere si din care există încă foarte
multe în lume. Pentru că este bazat pe text, Gopher este foarte rapid. De
aceea în lume există multe servere de Gopher. Utilizatorii de Web pot
să acceseze un server de Gopher şi să vadă fiecare meniu
Gopher ca o pagină Web cu intrări selectabile. Dacă nu aţi
lucrat cu Gopher-ul utilizaţi maşina favorită de căutare în
Web pentru a căuta cuvântul “gopher”.
Este posibil să se trimită cerere de
căutare completă unui server de Gopher utilizând un protocol gopher+.
Ce se va afişa este rezultatul cererii transmise serverului de Gopher.
Ultimele două protocoale nu şunt de fapt
protocoale pentru aducerea unor pagini de Web şi nu sunt suportate de
orice program de navigare, dar sunt utile. Protocolul mailto permite
transmiterea de poştă dintr-un program de navigare. Pentru a face
această operaţie se selectează butonul OPEN şi se
specifică un URL constând din mailto: urmat de adresa destinatarului. Majoritatea
programelor de navigare vor răspunde cu un formular care are intrări
corespunzătoare subiectului şi altor informaţii din antet
şi spaţiu pentru mesaj.
Protocolul telnet este utilizat pentru stabilirea
unei conexiuni pe o maşină aflată la distanţă. Se
utilizează în acelaşi fel ca şi programul Telnet, ceea ce nu
constituie o surpriză, deoarece majoritatea programelor de navigare
utilizează programul Telnet.}
Pe scurt URL-urile au fost proiectate nu numai
pentru a permite utilizatorilor să navigheze prin Web, dar şi pentru
a utiliza FTP, news, Gopher, email şi telnet, ceea ce face inutile
interfeţele specializate pentru aceste protocoale integrând astfel într-un
singur program, navigatorul în Web, aproape toate tipurile de acces în
Internet. Dacă metoda nu ar fi fost proiectată de un fizician ar fi
putut să pară produsul departamentului de publicitate al unei
companii de software.
În ciuda tuturor acestor proprietăţi,
creşterea Web-ului scoate în evidenţă şi o slăbiciune
a metodei utilizării URL-urilor. Pentru o pagină care este foarte des
referită, ar fi de preferat să existe mai multe copii pe servere
diferite, pentru a reduce traficul în reţea. Problema este că
URL-urile nu oferă nici o posibilitate de indicare a unei pagini
fără să se specifice unde este localizată pagina
respectivă. Nu există nici o metodă pentru a spune ceva de
genul: “Vreau pagina xyz, dar nu mă interesează de unde o aduci”. Pentru
a rezolva această problemă şi a permite multiplicarea paginilor
IETF lucrează la un sistem de URL (Universal Resource Identifiers -
identificatori universali de resurse). Un URL poate să fie privit ca un
URL generalizat. Acest subiect este în curs de cercetare.