Digitizare

Evolutii in sistemele integrate de biblioteca

Livrarea de servicii digitale multimedia

Canale de livrare

Descrierea, descoperirea si reinnoirea resurselelor

Personalizarea serviciilor

Raspunsuri tehnice la problemele multilingvistice

 

Pagina principala
Pagina 1 | Pagina 2 | Pagina 3 | Pagina 4 | Pagina 5 | Pagina6 | Pagina 7

DESCRIEREA, DESCOPERIREA SI RECUPERAREA IRESURSELOR

SUMAR

DOMENIU

Aceasta linie directoare se ocupa de problemele ridicate de volumul tot mai mare de continut digital disponibil acum pentru biblioteci etc, inclusiv de metadate, vocabulare si lexicoane controlate, motoare de cautare, dispozitive gateways XML si Z39.50.

PROBLEME LEGATE DE POLITICI

Aparitia Internet-ului inseamna ca bibliotecile au acces la o cantitate in continua crestere de informatii digitale distribuite disponibile pe web. Ele trebuie sa descopere care este modul optim de a acorda asitenta utilizatorilor la descoperirea si recuperarea informatiilor de care au nevoie in mediul digital. Societatea bazata pe cunoastere, educatia permanenta si tendinta tot mai pronuntata spre o interactiune cu guvernul central prin mijloace electronice, confera recuperarii de informatii o importanta crescanda pentru toti cetatenii. Problema cheie este interoperabilitatea informatiilor digitale.

LINII DIRECTOARE PENTRU PRACTICI DE CALITATE

Capitolul practici de calitate este impartit in trei sub-capitole:

Descrierea resurselor: mijloacele diverse prin care resursele sunt descrise astfel incat sa imbunatateasca precizia de recuperare a informatiilor: e.g. metadate, descrierile de colectii, sisteme de vocabular controlat cum ar fi lexicoanele si identificatorii unici

Descoperirea si recuperarea resurselor: mijloacele prin care resursele pot fi gasite si recuperate: de exemplu motoare de cautare, dispozitive gateways, grupuri de organizatii, indici de informatii comunitare.Descoperirea resurselor este logic secundara; daca un articol a fost descris metodic, o masina care cauta metodic are o sansa mai buna de a le gasi. Acesta este un domeniu in care bibliotecilor li se ofera oportunitati de a lucra in parteneriat cu alte institutii, de exemplu cu universitati, colegii etc. pentru a asigura un acces mai bun la resursele lor. In acest sens, un partener isi poate pune la dispozitie serviciile utilizatorilor care apartin celuilalt partener sau sa asigure acces comun la cataloagele lor.

Tehnologii importante cum ar fi XML RDF, Z39.50, recuperarea de imagini incluzand cbir, ontologii si harti tematice care ilustreza acest domeniu.

AGENDA VIITOARE

In viitor oamenii vor fi inconjurati de masini inteligente, sensibile si demne de incredere capabile sa reactioneze ca entitati individuale. Gama de tehnologii descrisa in acest DGM exista in momentul de fata dar interactiunea lor matura este inca doar de domeniul imaginatiei. Ea va afecta case, scoli, hoteluri, automibile, mijloace de transport aeriene - pe scurt fiecare aspect al vietii. Efectul ei asupra bibliotecilor si a altor institutii culturale va fi decisiv.

DOMENIU

Aceasta linie directoare se ocupa de urmatoarele probleme: descrierea resurselor, metadate, descrierea nivelului colectiilor, vocabulare controlate si tezaure, identificatori unici, descoperirea resurselor, cataloage de biblioteca, motoare de cautare, liste de site-uri recomandate, dispozitive gateways si portale, conglomerate, informatii comunitare, sprijinirea educatiei, XML, RDF, Z39.50, cules de date, recuperare de imagini, agenda viitoare, web semantic, ontologii, semnaturi digitale, servicii Web, exemple practice bune - legaturi.

Nota: Se anticipeaza ca bibliotecile vor aborda descrierea, descoperirea si recuperarea resurselor din pozitii de start diferite si ca multe, daca nu majoritatea, ar putea adopta o abordare planificata a implementarii. Se anticipeaza de asemenea ca aceste linii directoare pot fi utilizate pentru a facilita procurarea unor sisteme de biblioteca sau alegerea contractorilor si a consultantilor.

PROBLEME LEGATE DE POLITICI

Relevanta pentru biblioteci

Bibliotecile opereaza intr-un mediu de informatii interconectat. Aparitia Internet-ului inseamna ca pzna si cea mai neinsemnata filiala poate avea acces la o cantitate crescanda de informatii digitale distribuite disponibile pe Web. Bibliotecarii trebuie sa descopere care este modul optim de a-si ajuta utilizatorii la descoperirea si recuperarea informatiilor de care au nevoie. Societatea bazata pe conoastere, educatia permanenta si tendinta crescanda spre interactiunea cu guvernul central prin mijloace electronice confera accesului facil la informatii o impirtanta tot mai mare.

Multe biblioteci creaza chiar ele continut digital nou - e.g. propriile pagini de Web sau un nou continut multimedia - de multe ori finantat prin programe de digitalizare specifice (vezi digitizare si finantare). Ele trebuie sa inteleaga cum sa descrie acest continut pentru a putea fi usor recuperabil de utilizatori si interoperabil cu alt continut digital.

Tehnologiile si standardele din domeniu apar neincetat si vor continua sa se schimbe si sa evolueze in timp. Bibliotecile trebuie sa fie la curent cu stadiul actual al tehnicii pentru a evita adoptarea de tehnologii si standarde necorespunzatoare sau invechite.

Bibliotecile trebuie sa inteleaga aceste probleme pentru a planifica si prioritiza propria activitate, in special cand procura noi sisteme sau cand angajeaza consultanti/contractori externi pentru activitati de dezvoltare.

Ce este interoperabilitatea?
In legatura cu continutul digital interoperabilitate inseamna ca acesta ar trebui sa fie cat mai reutilizabil, portabil (i.e. prin retele, sisteme si organizatii diferite) si durabil posibil. Acest deziderat poate fi atins prin standarde - reguli codificate si linii directoare pentru crearea, descrierea si managementul resurselor digitale ( pentru mai multe informatii vezi Reinventarea rotii D-Lib Magazine, ian. 2002).

De ce este importanta interoperabilitatea?
Pentru ca utilizatorii sa poata cauta si regasi mai usor informatii din diverse surse - de exemplu, din cataloage diferite, din institutii diferite (biblioteci, muzee si arhive) si din diferite tipuri de resurse (carti si vestigii de muzeu)

Servicii noi si sarcini de serviciu diferite

A pune la dispozitie resurse pe Internet, indiferent daca sunt create de biblioteca sau obtinute printr-o modalitate oarecare (cooperare, plata/obtinere de licente etc.) va avea implicatii asupra catorva aspecte din evolutia bibliotecilor: ce tip de personal va fi necesar?; ce instruire va necesita acesta?; ce servicii vor fi furnizate si mai ales cum vor fi furnizate? (vezi multimedia). Bibliotecile vor fi obligate sa faca alegeri strategice la nivel local referitoare la care le sunt prioritatile, cat intentioneaza sa cheltuiasca si ce doresc sa faca.

Dependenta sporita de continutul digital

Bibliotecile vor fi obligate sa manipuleze o cantitate tot mai mare de materiale, vitale pentru utilizatori, disponibile doar in forma digitala. Aceste materiale ar putea fi mai scumpe decat corespondentele lor tiparite si supuse controlului si supravegherii exercitate de editor sau distribuitor. Obtinerea de licente va reprezenta o problema importanta. Vezi de asemenea Conglomerate.

LINII DIRECTOARE DE CALITATE: DESCRIEREA RESURSELOR

Bibliotecile ar trebui sa ia in considerare introducerea de metadate in resursele si paginile web pe care le creaza si, de asemenea, utilizarea XML.

METADATE

Definite in linii mari ca "date structurate despre date". O inregistrare de catalog, de exemplu, este o metadata care descrie o carte particulara. Metadatele s-au impus ca un mijloc de a imbunatati eficienta si eficacitatea gasirii de resurse digitale pe Web prin adoptarea unei structuri consistente de descriere a site-urilor Web si a altor resurse digitale. Tipurile de elemente de metadate asociate cartilor include: autor, titlu, editor, data, ISBN, clasificare etc. Exista o introducere utila pe aceasta tema pe website-ul Diffuse .

Metadatele pot fi utilizate pentru a sprijini o varietate de scopuri:

Metadate de descriere a resurselor - pentru a descrie resurse si a facilita recuperarea. Exista mai multe tipuri dintre care Marc si Dublin Core sunt probabil cele mai cunoscute.

Marc, sau Catalogare citibila de masina este o schema de metadate bibliografice folosita de Biblioteca Congresului. Versiunea actuala este MARC 21.

Dublin Core - un sistem de descriere a " documentelor ca obiecte" care consta din urmatoarele 15 elemente de metadate: 1) titlu; 2) creator; 3) subiect; 4) descrierea cuvintelor cheie pentru subiect; 5) editor; 6) colaborator; 7) data; 8) tip de resurse; 9) format; 10) identificator de resurse; 11) sursa; 12) limba 13) relatie; 14) acoperire 15) managementul drepturilor.

Metadate de prezervare - create pentru a facilita pastrarea si activitatile de arhiva. Proiectul CEDARS s-a ocupat de problemele ridicate de pastrarea resurselor digitale.

Metadate despre drepturi - create pentru a exprima drepturile de proprietate intelectuala intr-o resursa. Vezi de exemplu Proiectul Indecs .

Metadata despre educatie - create pentru a facilita identificarii resurselor institutiilor educationale si a mediilor gestionate sau virtuale de invatare e.g. registrele de studenti si descrierea cursurilor. Vezi site-ul Diffuse pentru mai multe informatii despre metadatele care faciliteaza e-instruirea.

Metadate geospatiale create pentru a fi utilizate cu hartile digitale si sistemele de informatii geografice. Vezi site-ul Diffuse pentru mai multe informatii despre standardele schimbului de date geografice.

Metadatele despre domenii specifice au fost create pentru a raspunde unor cerinte specifice din anumite domenii, de exemplu:

a) Arhivele utilizeaza in mod obisnuit EAD(Descrierea Arhivala Decodata) sau ISAD(G) (Descrierea Arhivala Internationala Standard). Vezi website-ul Diffuse pentru mai multe informatii despre standardele de arhivare.

b) Muzee - CIMI este un consortiu international constand din institutii de mostenire culturala care lucreaza impreuna pentru a incuraja dezvoltarea si aplicarea de standarde pentru informatiile muzeale. Vezi website-ul Diffuse pentru mai multe informatii asupra standardelor de muzeu. .

c) Guvern - GILS sau Serviciul de Localizare a informatiilor Guvernamentale/ Localizarea Informatiilor Globale este utilizat pe scara larga pentru informatii guvernamentale desi se pare ca in ultimul timp multe guverne prefera sistemul Dublin Core. Initiativa de metadate Dublin Core (IDDC) a infiintat un Government Working Group (Grup de Lucru Guvernamental). Multe guverne,e.g. din Marea Britanie, Australia, Canada, SUA, Danemarca au emis linii directoare care ar putea deveni obligatorii pentru institutiile din sectorul public. Vezi e-CIG Cadrul de Interoperabilitate pentru Guvernul Electronic si e-SMG(Standardul de Metadate pentru Guvernul Electronic) realizat de e-Envoy's Office in Marea Britanie. Prima versiune a SMG-urilor s-a bazat pe un sistem simplu de Dublin Core pe cand a doua a preferat un Dublin Core calificat cu anumite elemente suplimentate despre gestionarea documentelor.

Descrierile la nivel de colectie

Uneori in proietele mari realizate in colaborare utilizarea metadatelor de prezentare a colectiilor pentru a descrie colectiile bibliotecilor participante (domeniu, nivel, adancime, limba etc) este benefica. Vezi, de exemplu, Focusul de Descriere a Colectiilor UKOLN pentru informatii referitoare la descrierile de colectii in sectorul de educatie post-liceal si superior si liniile directoare NOF pentru exemple despre modul in care au fost adoptate de organismele de finantare a bibliotecilor publice.

Vocabulare controlate si tezaure

Metadatele reprezinta doar jumatate de solutie. Pentru ca utilizatorii sa poata efectua cautari reusite in set-urile de date distribuite producatorii datelor respective trebuie sa introduca in mod consistent valori in elementele de metadate. Pentru a realiza acest lucru ei sunt nevoiti sa introduca si sa utilizeze scheme de decodare identificabile sau vocabulare controlate pentru indexare. Un exemplu il constituie Clasificare pe subiecte a Bibliotecii Congresului.

Un lexilcon este un vocabular controlat unde termenii sunt aranjati in ierarhii care arata relatii precum termeni mai largi sau mai ingusti, echivalenta sau echivalenta partiala, si in care termenii sunt caracterizati ca termeni preferati sau ca termeni nepreferati ( pentru controlul sinonimelor). Lexicoanele contin si note despre domenii sau alte informatii utile. Exista doua standarde utile pentru lexicoane: ISO 2788, 1986: GHID PENTRU STABILIREA SI DEZVOLTAREA DE TEZAURE MONOLINGVISTICE SI ISO 5964, 1985: Ghid pentru stabilirea si dezvoltarea de lexicoane multi-lingvistice.

Site-ul Muzeului Getty pune la dispozitie o serie de lexicoane, intre care: Tezaurul de Arta si Arhitectura si Tezaurul de Denumiri Geografice Getty. Traugott Koch a compilat o lista utila de vocabulare controlate, tezaure si scheme de clasificare.

Identificatori unici

Pentru a pute fi gasita pe Web, fiecare resursa trebuie sa dispuna de un identificator unic sau de o adresa cum ar fi localizatorul uniform de resurse (URL). Problema cu aceste localizatoare uniforme, asa cum stiu probabil toti utilizatorii, este ca, indiferent de resursa, ele se schimba sau se deplaseaza cu timpul, ingreunand recuperarea de informatii. Identificatorul digital de obiecte (DOI) este un identificator persistent care a rezolvat aceasta problema. Paul Miller a scris un articol usor de inteles in care se ofera explicatii despre identificatorii unici.

LINII DIRECTOARE PENTRU PRACTICI DE CALITATE: DESCOPERIREA SI REGASIREA RESURSELOR

Motoare de cautare

Catalogul de biblioteca este cheia bunurilor detinute de o biblioteca individuala. Totusi, multe biblioteci, daca nu toate, ofera utilizatorilor acces pe Internet si, in consecinta, trebuie sa gaseasca metode de a facilita deschiderea acestor resurse interconectate pentru utilizatori. Metoda cea mai usoara pentru biblioteci este de a le prezenta unul din numeroase motoare de cautare disponibile in unul din urmatoarele tipuri:

Motoare de cautare libera in text care cauta cuvinte cheie, e.g. Altavista, Google.

Motoare de cautare bazata pe index/director in care utilizatorul trece printr-o serie de meniuri restrangandu-si continuu cautarea, e.g. Yahoo

Motoare de cautare Meta/Multi care ruleaza o cautare pe mai mult de un motor, e.g. ixquick.

Motoare de cautare prin limbaj natural in care cautarea poate fi introdusa sub forma de intrebare, e.g. Ask Jeeves.

Pentru o lista atotcuprinzatoare cu motoare de cautare de toate tipurile si pentru mai multe informatii despre aceste motoare vezi www.philb.com si http://searchenginewatch.com.

Liste de site-uri recomandate.

Bibliotecile ar putea sa-si ajute utilizatorii si mai mult prin alcatuirea unor liste cu website-uri utile. Aceste liste trebuie evaluate in prealabil in raport cu niste criterii de calitate (Proiectul Desire a conceput o evaluare utila) si impartite pe subiecte. Reteaua pentru Descoperirea de Resurse (RDN) este un bun exemplu in acest sens.Totusi, mentinerea si actualizarea unei astfel de liste ar putea consuma mult timp, solutia fiind cooperarea dintre biblioteci la alcatuirea si mentinerea unor astfel de liste. Serviciul Comun cu Cataloage de Resurse On-line (CORC) , creat de OCLC este un bun exemplu pentru initiativele de cooperare pentru crearea si descrierea de pagini web (vezi de asemenea portaluri).

Dispozitive gateways si portaluri

Distinctia dintre dispozitivele gateways si portaluri este relativ greu de facut dar in mod obisnuit un dispozitiv gateway consta din seturi de legaturi adnotate la alte website-uri verificate de compilatorii dispozitivului gateway. Utilizatorul primeste o serie de meniuri care il trec de la termeni generali la termeni mai specifici. Astfel de site-uri sunt extrem de utile pentru cercetatori intrucat nu mai esti nevoit sa consulti site dupa site pentru a gasi unul sau doua cu materiale corespunzatoare despre un anumit subiect. Scopul portalurilor este de a livra si servicii utilizatorilor pe langa seturile de legaturi. De exemplu, ele pot furniza servicii de tranzactii on-line, cumparaturi on-line etc. In plus, portalurile faciliteaza cautarea integrata prin continutul site-urilor pe care le leaga.

Este imposibil sa alcatuiesti o lista cu toate portalurile . Iata insa cateva exemple:

General: www.yahoo.com o serie de meniuri care acopera WWW-ul ca intreg.

Guvern: www.ukonline.gov.uk o lista cu website-urile guvernului britanic si ale autoritatilor locale aranjata tematic si alfabetic; www.premier-ministre.gouv.fr un dispozitiv gateway spre agentiile guvernului francez.

Academic: www.rdn.ac.uk Reteaua de Descoperire a Resurselor infiintata pentru a sprijini sectoare de invatamant post-liceal si superior din Marea Britanie. RDN-ul este de fapt o retea de dispozitive gateways individuale pe subiecte (sau axe centrale), fiecare acoperind un anumit subiect.

Biblioteci: portalul bibliotecilor UNESCO

Muzee: Muzeul deschis 24 de ore

Arhive: portalul arhivelor UNESCO

Cultura: noul portal al Comisiei Europene: Portalul cultural european

Altele: www.teldir.com un set de legaturi la directoare telefonice on-line.

Exista soft-uri specializate care faciliteaza dezvoltarea si mentinerea de dispozitive gateways pe subiecte, de exemplu ROADS(Descoperirea si organizarea de resurse in serviciile bazate pe subiecte). Companiile comerciale ofera de asemenea soft-uri de portaluri, e.g Vignette, SAP Portal, Plumtree etc. Unele biblioteci au inceput sa-si infiinteze propriile portaluri si dispozitive gateways - de exemplu pentru a sprijini anumite grupari de organizatii si servicii de informatii comunitare si pentru a contribui la procesul de educatie a utilizatorilor.

Conglomerate

Conglomeratele sunt grupuri de organizatii, de obicei biblioteci publice, biblioteci universitare si alte organizatii (de exemplu muzee si arhive) care cad de acord sa colaboreze in domenii precum achizitionarea in comun de resurse (mai ales de resurse electronice), imprumuturile interbibliotecare si la interconectarea cataloagelor. Un element important al majoritatii conglomeratelor este ca dispun de un dispozitiv gateway sau un portal care include o facilitate ce permite utilizatorilor cautari simultane in cataloagele si/sau bazele de date ale organizatiilor participante. Pentru a reusi crearea acestora, conglomeratul trebuie sa adopte un profil comun de metadate, care sa pastreze caracteristicile diverselor profile utilizate de membrii consortiului. Au fost create mai multe profile pentru a sprijini in mod special acest gen de activitate, de exemplu Profilul BATH si Profilul ONE-2.

Z39.50 XML vor fi utilizate pentru a facilita cautarile in diverse cataloage si/sau baze de date. Obtinerea de licente si de copyright ale diverselor resurse electronice disponibile via conglomerate ar putea fi problematica.

Informatii communitare

Consiliul Comitatului Essex din Marea Britanie experimenteaza un sistem de informatii comunitare distribuite. In loc de baza de date centralizate traditionala de informatii comunitare Essex Online (care s-a dezvoltat din proiectul SEAMLESS) utilizeaza Z39.50 si Harvest pentru a cauta in website-urile si bazele de date ale organizatiilor participante printr-o singura cautare integrata supranumita si integrarea profunda. Peste 30 de organizatii locale (consilii, universitati si colegii, agentii de afaceri, agentii pe baza de voluntariat, companii utilitare, grupul local de ziare, autoritatile sanitare etc.) isi pun la dispozitia sistemului datele in mod cure, iar numarul lor creste repede.

Pentru ca sistemul sa caute in aceste seturi de date distribuite partenerii au adoptat un profil de metadate comun bazat pe e-gms , care la randul lui se bazeaza pe Dublin Core si un lexicon obisnuit pentru alocarea descriptorilor de subiecte. Essex a primit de curand fonduri de la Fondul pentru Noi Oportunitati pentru a dezvolta sistemul la scara nationala prin introducerea de date de la marii furnizori nationali de informatii cum ar fi nhsDirect Online si punerea la dispozitie a facilitatilor de cautare in alte opt zone geografice cu o populatie totala de 6 milioane de oameni. Pentru mai multe informatii vezi website-ul seamlessUK.

Sprijinirea educatiei

Unele biblioteci publice au inceput sa lucreze in parteneriat cu alte institutii, colegii universitati etc. pentru a oferi un sprijin mai consistent celor ce doresc sa studieze. De obicei partenerii sunt de acord sa-si puna la dispozitia utilizatorilor care tin de celelalte organizatii bibliotecile (si serviciile) si sa introduca un permis de biblioteca comun. De multe ori partenerii pun la punct sisteme care sa permita cautarea in toate cataloagele si bazele de date proprii printr-o singura cautare (vezi Conglomeratele de mai sus pentru o afla ce implica acest lucru). Doua exemple: Schema de Acces a bibliotecilor din Sunderland Schema de Access a Bibliotecilor din Sunderland si Proiectul de Bibblioteci Digitale realizat la Glasgow.

In Marea Britanie Comitetul de Servicii Informative Comune (JISC) dezvolta actualmente Resursa Educationala Nationala Distribuita (DNER) care furnizeaza informatii si resurse in sprijinul cercetarii si educatiei.Este un proiect foarte mare si inovator care preia ideea portalurilor pe subiecte lansata prin Reteaua de Distributie a Resurselor (RDN), asigurand cele mai multe resurse in mediul informational interconectat.

Multe biblioteci universitare sunt, de asemenea, implicate in dezvoltarea Mediilor de Invatare Gestionate sau Virtuale (MIG, MIV). In Marea Britanie, UKOLN gestioneaza Metadate pentru Grupul Educational(MEG), preocupandu-se de implicatiile metadatelor care vin in sprijinul unor astfel de sisteme. Si bibliotecile publice pot juca aici un rol activ mai ales in sprijinirea instruirii formale si a educatiei permanente.

LINII DIRECTOARE PENTRU PRACTICI DE CALITATE

TEHNOLOGII DE BAZA

XML

Limbajul de Marcaj Extensibil (XML) este succesorul HTML-ului. El prezinta o serie de avantaje fata de predecesorul sau, o distinctie cheie fiind posibilitatea de a separa continutul de prezentare. W3C a realizat sumar in 10 puncte care acopera principalele trasaturi ale Limbajului de Marcaj Extensibil. Pentru mai multe detalii tehnice vezi sectiunea xml a website-ului creat de W3C sau site-ul xml.com. XML-ul se bucura de mare atentie, in jurul lui avand loc o activitate intensa de cercetare si dezvoltare - pentru date la zi despre instrumentele de solicitare ale limbajului cum ar fi xpath vezi pagina web creata pentru W3C XML Query Group. Bibliotecile ar putea avea in vedere trecerea la XHTML. Unul din rapoartele UKOLN descrie pe scurt impartasirea metadatelor si Limbajul de Marcaj Extensibil, inclusiv limitele sale si modul in care acesta sprijina impartasirea efectiva a informatiilor in diferite contexte.

RDF

Cadrul de Descriere a Resurselor (RDF) permite codificarea, schimbarea si reutilizarea metadatelor structurate, folosind XML-ul ca sintaxa de interschimb. In acest mod RDF sprijina integrarea mai multor aplicatii din cataloagele de biblioteca si directoarele provenite din intreaga lume pentru sindicalizarea si agregarea stirilor, soft-urilor si continutului; pentru colectiile personale de muzica, fotografii si evenimente.

RDF permite declaratii despre o resursa ca set de proprietati care se conformeaza unei scheme desemnate. Declaratiile sunt inregistrate in RDF: elemente XML de DESCRIERE.

Motivul pentru care RDF-ul se dovedeste atat de puternic este ca impune constrangeri structurale care faciliteaza codificarea consistenta si neambigua si schimbul de metadate standardizate, asigurand interschimbabilitatea pachetelor separate de metadate definite de comunitati diferite de descriere a resurselor. In plus, RDF-ul furnizeaza un mijloc de publicare a unor vocabulare citibile de oameni si procesabile de masini concepute pentru a incuraja reutilizarea si extinderea semanticii metadatelor intre comunitati informationale disparate - vezi o introducere in RDF pentru mai multe informatii. Descrierile RDF-ului utilizeaza uneori bibliotecile ca o analogie. Pentru informatii tehnice vezi paginile de Web W3C RDF .

W3C RDF. seamlessUK este un exemplu de sistem de informatii comunitare care recurge la RDF pentru a codifica propriile metadate.

Z39.50

Z39.50 este un protocol international de cautare si regasire (ISO 23950, 1998) care permite cautarea bazelor de date eterogene si regasirea de date, in mod obisnuit de la distanta, via o interfata cu utilizatorul. Z39.50 defineste un mod standard in care comunica si impart informatii doua calculatoare. Conceput pentru a facilita cautarea si regasirearea informatiilor - documente integrale, date bibliografice, imagini si multimedia - el se bazeaza pe o arhitectura client -server si este complet operational pe Internet. Z39.50 permite utilizatorilor sa caute in mai multe cataloage, sau in alte baze de date, printr-o singura cautare integrata. Nota: Pana cand limbajele de solicitare XML nu vor evolua, Z39.50 ar putea ramane protocolul preferat de cautare si regasirere pentru sistemele care ofera o cautare distribuita complexa.

Cules de date

Softurile pentru culesul de date reprezinta un mijloc de a colecta, sau culege, informatii metadate dintr-o lista de surse web predeterminate, de exemplu paginile web ale institutiilor participante. In proiectul Seamless (vezi mai sus), Harvest creaza un fisier de indici in care va cauta sistemul ca raspuns la solicitarea unui utilizator. Rezultatele sunt apoi integrate cu rezultatele cautarilor prin Z39.50 si prezentate utilizatorului ca o singura 'lista de elemente dorite'. Apasand tasta mouse-ului pe oricare din rezultate se deschide fie pagina web ( pentru inregistrarile culese) fie inregistrarea de baze de date (pentru inregistrari Z39.50

Culesul de date formeaza baza Initiativei pentru Arhive Deschise (OAI) realizata in colaborare, si avand ca scop facilitarea gasirii de informatii pe web prin dezvoltarea si aplicarea standardelor de interoperabilitate. Initiativa are potential de aplicare si in cadrul comunitatii muzeelor .

Regasirea imaginilor

Pana de curand imaginile trebuiau cautate de descriptorii de texte sau de codurile de clasificare; cautarile erau in unele cazuri facilitate de pachete de recuperari de texte concepute sau adaptate special pentru a manipula imagini. Tezaurul despre Arta si Arhitectura al lui Getty (AAT) consta din 120.000 de termeni pentru descrierea obiectelor, tesaturilor, imaginilor, arhitecturii si materialelor de patrimoniu. Imaginile pot fi de asemenea clasificate folosind sisteme precum ICONCLASS pentru lucrari de arta si expozitii, TELCLASS pentru televiziune si video si Clasificarea Social-istorica si Industriala pentru obiectele de muzeu.

Sistemele mai moderne pot in momentul de fata recupera imagini care nu au fost descrise verbal.

CBIR (Recuperarea imaginilor bazate pe continut) nu utilizeaza indexarea prin cuvinte cheie ci prefera recuperarea imaginilor prin utilizarea caracteristicilor inerente ale imaginii insasi: culoare, textura, forma; e.g. o scena de plaja va fi albastra in partea de sus si galbena in partea de jos. Actualmente se poarta discutii tehnice despre diferitele tipuri de CBIR. Pe piata exista mai multe sisteme comerciale de CBIR. In QBIC (Solicitatare prin continutul imaginii) lansat de IBM imaginea este descrisa prin zone de culoare si forma, iar soft-ul de regasire executa cautarea imaginilor care corespund descrierii. Mentionarea subiectului din imagine nu este necesara. Pentru o demonstatie pe website-ul Muzeului Ermitraj, recuperarea imaginii piesei Excalibur.

In Cursus se poarta o discutie (in limba franceza) despre tipurille de recuperare a imaginilor si se face o clasificare a acestora. Tot o discutie pe marginea problemelor legate de tipurile de recuperare a imaginilor poate fi intalnita si pe website-ul Diffuse, facandu-so o comparatie intre recuperarea 'cu pierderi' si cea 'fara pierderi': fisierele care deplaseaza imagini electronice fara pierderi de definitie sunt mai voluminoase si mai lente decat cele ce implica anumite pierderi.

AGENDA VIITOARE

Web-ul semantic este o viziune descrisa in articolul de fond al unei reviste stiintifice americane in numarul din mai 2001. Dupa opinia lui Tim Berners-Lee, Director al Consortiului World Wide Web (W3C), "web-ul semantic este un web de date, intr-o oarecare masura asemanator cu o baza de date globala" El are la baza ideea ca unul din scopurile www -ului este nu numai de a fi util in comunicatiile fiinta umana - fiinta umana ci si de a facilita participarea si ajutorul masinilor la acest proces. Dar web-ul semantic mai are un drum lung de strabatut pana la realizarea acestui vis. El va fi construit din segmente, de oamenii cu interese diverse, iar formidabila lui putere se va manifesta dupa ce se va reusi crearea de numeroase programe care colecteaza continuturi de pe web din diverse surse, proceseaza informatiile si schimba rezultatele cu alte programe.

In urmatorul pas vizionar, web-ul semantic va evada din cusca sa virtuala in lumea concreta, palpabila. Viziunea cuptorului cu microunde cu acces pe web care consulta site-ul producatorului de carne congelata in cautarea celor mai bune instructiuni de gatit poate fi extinsa la serviciile asigurate de arhive, muzee si bibliotecile publice. De exemplu, la o simpla cerere verbala, rama virtuala a unui tablou ar putea consulta muzeul sau galeria de arta locale pentru expunerea unui tablou ideal si biblioteca publica virtuala pentru o bibliografie ideala de e-carti insotitoare care sa fie descarcata. In acest context, imaginatia personalului din bibliotecile publice trebuie neaparat incurajata!

Exista deja, sau sunt pe punctul de a fi elaborate, concepte, tehnologii, protocoale si standarde importante pentru crearea WEB-ului semantic, dintre care mentionam XML, RDF si identificarea unica.

Ontologii. O ontologie poate fi definita ca o descriere formala de obiecte si a relatiilor dintre ele. In contextul web-ului semantic, scopul este de a face ca masinile sa vorbeasca masinilor cu inteventie umana minima sau redusa la zero. Vezi Ontoweb si Wonderweb. Exista progresiv abordari tot mai bogate semantic de modelare a ontologiilor, incluzand:

Lista de termeni - relatii nedefinite

Schema de clasificare

Tezaure - mostenire si relatii de asociere

Harti tematice - un nou standard ISO pentru un sistem care descrie structuri de cunostinte si le asociaza resurselor informationale. Hartile ar trebui sa furnizeze modalitati puternice de navigare a unor domenii mari si interconectate. In loc de a reproduce trasaturile unui index de carte harta tematica le generalizeaza extinzandu-le in mai multe directii in acelasi timp.

Limbajul Ontologiei - DAML+Oil - descrierea logica a legaturilor

Ontologiile au o importanta tot mai mare in sistemele de gestionare a cunostintelor si in dezvoltarea web-ului semantic si au aplicatii in sistemele de gestionare a cunostintelor cum ar fi de exemplu in e-comertul pentru descrierea produselor si a serviciilor sau in descrierea si organizarea colectiilor digitale de muzeu.

Semnaturile digitale, infrastructura publica cheie pentru incheierea unor tranzactii sigure, si consolidarea increderii sunt de asemenea vazute ca un element cheie pentru web-ul semantic. Vezi proiectarea serviciilor.

Serviciile pe Web sunt un concept relativ nou care, dupa toate probabilitatile, va evolua rapid in urmatorii cativa ani. Ele ar putea fi prima manifestare practica majora a gandirii bazate pe web-ul semantic. Definitiile detaliate difera, dar serviciile pe web vor permite realizarea unor aplicatii de soft fara obligatia de a sti cine este utilizatorul, unde pot fi gasite, sau orice altceva despre ele. Vezi Diffuse. In urmatorii cativa ani serviciile pe web pot fi dezvoltate, lucru care poate fi inteles si utilizat automat de sistemele apartinand utilizatorilor sau bibliotecilor publice. Furnizorii de servicii cu aplicatii externe (FSAE) pot de asemenea asigura servicii de acest gen. Serviciile pe web sunt bazate pe standarde deschise, de Internet.

Majoritatea standardelor de baza sunt in curs de elaborare si se asteapta ca finalizarea lor sa fie incheiata in cursul anului 2002. Ele includ ( pe langa XML):

Limbajul de descriere a serviciilor web (LDSW) care permite o descriere obisnuita a serviciilor web.

Registrele Universale de Descriere, Descoperire & Integrare (UDDI) care expun informatii despre o afacere sau o alta entitate si interfetele tehnice ale acesteia.

Protocol de Acces la Obiecte Simple (PAOS) care permite schimburi de mesaje structurate intre programele calculatoarelor
Conceptul de servicii web prinde tot mai mult consistenta prin inregimentarea lui sub drapelul fluturat de comertul electronic. Este indubitabil totusi ca exista aplicatii potentiale pentru furnizorii de servicii din sectorul public. De exemplu, interfetele de cautare ar putea fi accesate sau furnizate ca servicii web de bibliotecile publice sau de furnizorii de servicii la cerere care actioneaza in numele lor.

Viitorul va culege fructele numeroaselor evolutii din domeniul recuperarilor de informatii, ceea ce va face ca sistemele actuale sa para primitive. Agenti robotizati personalizati si sofisticati vor cauta permanent intr-un Internet proiectat special pentru ei, in care cautarile lor sunt facilitate de metadate, vocabulare controlate si identificatori unici. Agentii vor recupera exact ce doresc utilizatorii lor, deoarece le cunosc obiceiurile de cautare, si fac acest lucru in timp ce sunt ocupati ocupati cu alte lucruri. In plus, nu vor recupera informatii care se repeta si nu vor omite nimic relevant indiferent de locul in care se gaseste informatia respectiva.

LEGATURI

INTERNATIONALE
Standardul IFLA referitor la descrierea bibliografica a articolelor
http://www.ifla.org/VII/s13/pubs/isbd_m0602.pdf

DANEMARCA
BibHit
Un catalog al resurselor de pe Internet indexat prin utilizarea de metadate. BibHit este un proiect in colaborare care implica trei biblioteci publice- Biblioteca Publica din Hobro, biblioteca Publica Principala din Aarhus si biblioteca Publica din Silkeborg si o biblioteca universitara - Biblioteca Scolii de Comert si Afaceri din Aarhus.
http://www.bibhit.dk/info/english.htm

FINLANDA
Biblioteca de legaturi
Un director al resurselor de pe Internet selectate si descrise de bibliotecari in urma unui efort comun. Directorul contine peste 6000 de legaturi, este organizat conform versiunii finlandeze a Dewey (ykl) si este publicat in doua limbi, finlandeza si suedeza. Include de asemenea o facilitate de metacautare care cauta in cataloagele de biblioteca simultan cu biblioteca de legatura.
http://www.kirjastot.fi

GERMANIA
Catalogare nationala si schema de indexare
Bibliotecile publice din Germania au adoptat aceasta schema pentru descrierea de resurse: ea are 25 de categorii. Multe utilizeaza date realizate la nivel central, livrate tot mai mult online de Biblioteca Nationala sau de cel mai mare furnizor pentru biblioteci, EKZ din Reutlingen
http://www.ekz-bibliotheksservice.de

OLANDA
OCLC PICA
Cautare simultana in paralel a Catalogului central al Olandei si a cataloagelor apartinand altor biblioteci.
http://oclcpica.org/?id=2&ln=uk

MAREA BRITANIE
Co-East, o cooperare dintre mai multe biblioteci publice din estul Angliei
http://www.co-east.net/

Muzeele din Leeds, un website care ofera un tur virtual al muzeelor din oras.
http://www.leedslearning.net

Proiect pentru crearea de biblioteci digitale in Glasgow
http://gdl.cdlr.strath.ac.uk/

schema Sunderland de accesare a bbibliotecilor
http://www.lash.sunderland.ac.uk/

seamlessUK -un sistem de informatii comunitare distribuite.
http://www.seamless-uk.info/

SUA
Solinet
O retea de biblioteci membre care lucreaza impreuna pentru a imbunatati accesul la informatii si pentru a da posibilitatea membrilor sa reactioneze la nevoile de educatie, dezvoltare economica si imbunatatire a conditiilor de viata din zonele respective.
http://www.solinet.net/index.cfm

Pagina principala
Pagina 1 | Pagina 2 | Pagina 3 | Pagina 4 | Pagina 5 | Pagina6 | Pagina 7


Vizualizare optima cu IE 4.0 sau mai nou.