pagine web accademiche di Riccardo Ridi (ridi@unive.it)
professore associato di biblioteconomia

Università Ca' Foscari Venezia Dipartimento di studi umanistici Corso di laurea SGPAB Homepage accademica di Riccardo Ridi

Riccardo Ridi

LA BIBLIOTECA DIGITALE:
DEFINIZIONI, INGREDIENTI E PROBLEMATICHE

scema didattico basato, con aggiornamenti, sull'omonimo articolo pubblicato nel "Bollettino AIB" 2004/3, p. 273-344 e sui
paragrafi 2.1-2.23 e 3.1-3.5 del libro LA BIBLIOTECA COME IPERTESTO (Editrice Bibliografica, 2007)

Indice:

1. Definizioni

in ambito biblioteconomico:

1.1 Collezione digitale primaria e secondaria

  • Collezione digitale primaria (born digital)
  • Collezione digitale secondaria (digitalized)


1.2 Digitalizzazione

  • Ri-digitazione (manuale)
  • Scansione (scanner)
  • Scansione + OCR (optical character recognition)

    Criteri di scelta del materiale da digitalizzare:

  • non duplicazione rispetto ad altri progetti di digitalizzazione passati, presenti o futuri;
  • inesistenza di documenti digitali nativi corrispondenti o comunque sovrapponibili;
  • possesso dei diritti economici e morali per la creazione e l’uso più appropriato della digitalizzazione;
  • rarità, stato di conservazione e frequenza d’uso del documento originale;
  • rischio di danneggiamento dell’originale durante l’acquisizione;
  • costo e complessità della digitalizzazione e della sua successiva conservazione;
  • previsione sul numero degli utenti potenzialmente interessati;
  • esistenza di richieste esplicite (eventualmente anche sollecitabili) da parte degli utenti;
  • importanza storica, culturale e pratica dei contenuti informativi dell’originale, sia in termini assoluti che relativi (rispetto agli interessi dell’utenza locale, ai valori dell’ente di riferimento o di eventuali sponsor, a eventi contingenti, ecc.);
  • capacità della versione digitalizzata di catturare effettivamente gli aspetti più rilevanti dell’originale;
  • consonanza con la mission della biblioteca e del suo ente di riferimento;
  • utilità in ambito didattico e/o di ricerca.


1.3 Formati

    ASCII (American standard code for information interchange).

    DOC (document) e PowerPoint (PPT).

    RTF (rich text format).

    TXT(text).

    HTML (hypertext markup language).

    SGML (standard generalized markup language).

    TEI (text encoding initiative).

    XML (extensible markup language).

    XHTML (extensible HTML).

    PDF (portable document format) e PostScript (PS).

    TIFF (tagged image file format).

    GIF (graphics interchange format) e JPEG (joint photographic experts group).

    PNG (portable network graphics) e MNG (multiple-image network graphics).

    MPEG (moving picture experts group).

    AVI (audio video interleave) e QuickTime.

    WAVe AIFF (audio interchange file format).

    MP3 e DivX.

    RealAudio e RealVideo.

    OeB (open ebook), ePub (electronic publication) e altri formati per e-books.


2. Ingredienti

  • Collezioni
  • Servizi

2.1 Periodici elettronici (e-journals)

  • evoluzione storica e tecnologica (dalle mailing list ai software onnicomprensivi)
  • autorevolezza
  • gratuità o tariffazione
  • copertura e fedeltà rispetto alla versione cartacea
  • struttura logica (dai fascicoli al serbatoio di articoli)
  • parallelismo carta/digitale più longevo del previsto


2.2 Open access

  • Monografie:
    • University press digitali
    • Editoria privata digitale sostenibile


2.3 Libri elettronici (e-books)

  • liquidi/rigidi
  • aperti/proprietari

  • LIT (Microsoft) --> abbandonato nel 2011/2012
  • PDF (Adobe) --> standard ISO dal 2008
  • MOBI (MOBIpocket reader e altri software)
  • AZW (Kindle di Amazon e corrispondenti apps) basato su MOBI
  • OeB (open ebook forum) --> ePub (international digital publishing forum) basato su XML

  • universali (computer con emulatori)
  • semi-universali (tablets e smartphones)
  • dedicati (e-readers)

  • e-paper (con eventuali led laterali)
  • retroilluminazione

    Vantaggi (per tutti):
  • portabilità
  • spazio ridotto
  • cercabilità
  • riutilizzabilità
  • tiratura inesauribile
  • consegna immediata
    • dalla libreria alla biblioteca o all'utente
    • dalla biblioteca all'utente
  • annotazioni (potenzialmente esportabli)
  • prezzi (potenzialmente ridotti)

    Problemi (per gli utenti):
  • annotazioni (di fatto poco esportabili)
  • prezzi (non abbastanza ridotti)
  • distrazioni
  • pluralità di formati e di piattaforme (incompatibili fra loro)
  • DRM (digital right management)
  • watermarking (DRM sociale)
  • assenza di deposito legale

    Problemi (per le biblioteche):
  • prestare i contenuti o i contenitori?
    • prestito di contenitori vuoti
    • prestito di contenitori pieni
  • concetto di prestito (individuale) dei contenuti in ambiente digitale
    • streaming (= lettura in sede)
    • download senza DRM (= riproduzione o dono, ma con timbro)
    • download con DRM (= vero e proprio prestito, e-lending)
    • alternative spesso scelte dall'editore o dal distributore, non dalla biblioteca o dall'utente
    • limitazioni per differenziare dall'acquisto (durata, numero dei dispositivi per ciascun utente, numero dei prestiti contemporanei per ciascuna biblioteca, modificabilità del file, servizi aggiuntivi)
  • concetto di prestito (interbibliotecario) dei contenuti in ambiente digitale
    • fra biblioteche che condividono la stessa piattaforma
    • fra biblioteche che non condividono la stessa piattaforma
  • prestito come semplice intermediazione rispetto alle librerie online
    • library driven
    • patron driven
  • concorrenza con abbonamenti "a pacchetto" delle librerie online
  • ostruzionismo di alcuni editori
  • difficoltà nella acquisizione e gestione di singoli titoli (pick and choose)
  • integrazione con opac e discovery tools
  • chi deve catalogare gli e-books disponibili gratuitamente sul web?


2.4 Banche dati

"Una collezione di informazioni registrate in formato leggibile dall'elaboratore elettronico e relative ad un preciso dominio di conoscenze, organizzata allo scopo di essere consultata dai suoi utilizzatori" [Longo, 1993].

"Quelle ampie collezioni (ad accesso gratuito o tariffato) di dati digitali fortemente strutturati (spesso articolati in record e campi) che vengono prevalentemente utilizzate per la consultazione attraverso specifiche tecniche di information retrieval e solo talvolta per la navigazione attraverso legami ipertestuali, ma quasi mai per la lettura distesa e sequenziale, e che si possono distinguere in primarie (o di fonte), quando contengono informazioni direttamente utilizzabili, e in secondarie (o di riferimento) quando permettono di individuare documenti non disponibili direttamente ma da procurarsi successivamente per altre vie" [Ridi, 2004].

  • primarie (di fonte)
  • secondarie (di riferimento)

  • testuali
  • fattuali (immagini, suoni, numeri)

  • bibliografie
  • cataloghi
  • con abstracts
  • con full-texts

fattori di crisi delle distinzioni classiche:

  • convergenza al digitale
  • web (ipertestualità, delocalizzazione, omogeneizzazione)
  • database networking delle banche dati offline
  • pacchetti integrati
  • diritti di accesso personalizzati


2.5 Print on demand

  • dell'estremamente grande
  • dell'estremamente piccolo

  • "falso" POD
  • "vero" POD


2.6 OPAC / OPAL

OPAL = ONLINE PUBLIC ACCESS LIBRARY = biblioteca digitale

Se gia' il catalogo di una biblioteca analogica, che ne costituisce forse - insieme all'accesso stesso alle raccolte - il principale servizio agli utenti, e' oggigiorno sempre piu' spesso un catalogo elettronico, ovvero un opac, ancora piu' ovvio appare che sia un opac il punto di accesso fondamentale a una biblioteca digitale, tanto che l'acronimo OPAL (online public/patron access library), coniato nel lontano 1987 da Corrado Pettenati, costituisce uno dei piu' intelligenti - benche' poco fortunati - sinonimi di "biblioteca digitale".

"Questo nuovo concetto dovrebbe voler significare che l'opac sara' solo una delle numerose funzioni della biblioteca elettronica nella quale saranno possibili anche consultazioni del testo completo per la parte prodotta con i metodi dell'editoria elettronica. Le biblioteche piu' informatizzate stanno gia' preparando questo futuro. Sara' migliore?" [Pettenati, 1987].

REL e RER NEGLI OPAC

  • OPAC = online public access catalog
  • REL = risorse elettroniche locali
  • RER = risorse elettroniche remote
Le principali opzioni concettuali disponibili per la biblioteca che vuole mettere a disposizione dei propri utenti (locali e remoti) l'accesso più semplice ed efficace possibile ad una selezione di RER sono:

(1) Allargare l'opac tradizionale, includendovi anche link a RER selezionate in base alla mission della biblioteca, nonostante si possa obbiettare che ciò significhi tradire la natura catalografica dell'opac, trasformandolo in un ibrido fra catalogo e bibliografia che include anche documenti che potrebbero in qualsiasi momento mutare, spostarsi o scomparire per scelte dei relativi autori o editori, senza possibilità di preservazione (e anche con grosse difficoltà di aggiornamento dei link) da parte della biblioteca.

(2) Mantenere l'opac tradizionalmente ristretto ai soli documenti posseduti in locale (risorse analogiche e REL), per consultare i quali è necessario recarsi fisicamente in biblioteca e di cui la biblioteca garantisce conservazione e accesso a lungo termine, ma:

    (2a) inserire RER selezionate nell'opac, ma solo dopo averle trasformate in REL, ovvero averle stoccate stabilmente su scaffali virtuali locali (della singola biblioteca o, meglio, di consorzi interbibliotecari), in modo da garantirne accesso e immutabilità a lunga scadenza;

    (2b) delegare l'accesso alle RER a liste o archivi separati dall'opac, gestiti con regole di catalogazione più sbrigative e modalità di interrogazione semplificate, e talvolta alimentati anche con immissioni massicce di metadati forniti dai produttori stessi delle RER o da terze parti, spesso sussumibili nella categoria dei virtual reference desk (VRD);

    (2c) limitarsi a fornire agli utenti delle liste di strumenti generali per la ricerca in internet (motori, metamotori, repertori, virtual reference desk, ecc.). Questo caso è, a rigore, solo un sottocaso del precedente (2b) particolarmente semplificato e ridotto.

La mia proposta di ristrutturare gli accessi all'opac in modo da consentire all'utente la scelta fra la consultazione di:
  • (a) Opac tradizionale (o small opac), che include solo documenti analogici e REL (native o prodotte dalla biblioteca stoccando RER sui propri scaffali virtuali) conservate in loco.

  • (b) VRD (in forma di lista o di archivio, ma comunque creato automaticamente per estrazione a partire dall'archivio di lavoro unitario dei catalogatori di tutte le tipologie di documenti), che include solo le RER selezionate dalla biblioteca.

  • (c) Opac arricchito (o allargato, o portalizzato o big opac), sommatoria di (a) e di (b), che include tutti i documenti posseduti o selezionati dalla biblioteca.

Per la gestione di (b) si stanno diffondendo software (MetaLib, ecc.) che estendono e rendono più flessibile il concetto di database networking, consentendo di creare e gestire "portali" unificati per l'accesso a una pluralità di fonti informative digitali locali e remote. Essi possono generalmente essere estesi fino ad includere l’opac tradizionale (a), proponendosi di fatto come l’opac esteso (c) dell’istituzione utilizzatrice, consentendo una metainterrogazione globale di tutti i documenti posseduti o selezionati dalla biblioteca.

2.7 Servizi tradizionali

Ricerca bibliografica

Accesso ai documenti

Catalogazione (cfr. metadati)

Virtual/digital reference service

  • allestimento di VRD (virtual reference desk) e altre tipologie di indici e repertori che facilitino gli utenti nella ricerca, autonoma, delle informazioni desiderate;
  • creazione di un vero e proprio servizio di assistenza personalizzata, gestito in modalità asincrona (ad esempio via e-mail);
  • gestione in modalità sincrona dell’assistenza personalizzata, grazie a tecnologie che vanno dagli strumenti generici per la comunicazione via internet in tempo reale (chat, instant messaging, videoconferenze) ai più specifici "virtual reference software" che integrano in una cornice comune sia le attività di front-office (scelta dell’interfaccia, dialogo in contemporanea con più utenti, navigazione parallela fra utente e addetto, ecc.) che quelle di back-office (filtraggio e smistamento delle richieste di aiuto, aggiornamento degli strumenti repertoriali, training dello staff, archiviazione di domande e risposte riutilizzabili, ecc.).

Print on demand

Prestito e document delivery (cfr. e-books)

Acquisizioni

  • digitalizzazioni da originali
  • acquisizioni tariffate permanenti
  • accessi tariffati temporanei
  • catalogazione di risorse remote ad accesso gratuito
  • scarto digitale
  • deposito legale digitale

Desiderata

Segnaletica e marketing


2.8 Servizi innovativi

Riserva elettronica

  • indicizzazione più analitica
  • revisione più tempestiva
  • training più esteso
  • minori restrizioni legate al copyright

Data mining

Personalizzazione

  • involontaria (collaborative filtering, reference linking)
  • volontaria (settaggi liberamente impostabili, memorizzazione di ricerche e documenti, disseminazione selettiva)

Disseminazione selettiva

  • delle informazioni (DSI)
  • dei documenti (DSD)
  • current awareness service (CAS)
  • individual article supply (IAS)

Aggregazione degli utenti

Misurazione dell'uso della collezione

Individuazione di plagi


2.9 Altri ingredienti

  • biblioteche digitali
  • biblioteca digitale
  • Biblioteca Digitale

  • limiti nelle collezioni
  • limiti nei servizi

  • biblioteche digitali nazionali
  • biblioteche digitali universitarie
  • biblioteche digitali pubbliche
  • biblioteche digitali scolastiche
  • biblioteche digitali ...........

3. Attori e problematiche

  • Bibliotecari
  • Editori
  • Librai
  • Autori
  • Lettori

3.1 Accesso

  • Online, via internet (ovvero oggi prevalentemente, ma non esclusivamente, via web), senza alcuna restrizione, tariffazione o registrazione, collegandosi da postazioni dislocate ovunque (case, uffici, scuole, biblioteche, ecc.).

  • Online, via internet, da qualunque postazione, ma con "sbarramenti" che possono andare dalla semplice registrazione a fini statistici alla tariffazione una tantum per ogni singola interrogazione, passando attraverso l'accesso riservato solo a determinati utenti tramite password personale.

  • Online, via internet, ma esclusivamente da postazioni autorizzate, generalmente ma non necessariamente dislocate in determinati edifici dell'ente che gestisce la biblioteca digitale stessa e riconosciute automaticamente dal sistema.

  • Online, via rete locale, esclusivamente da postazioni collegate fisicamente con i non troppo distanti server (o juke-box di cd e dvd) della biblioteca digitale.

  • Offline, senza alcun tipo di rete, attraverso computer isolati dislocati nel settore multimediale o digitale di una biblioteca tradizionale, su cui vengono di volta in volta caricate memorie portatili contenenti piccole parti della biblioteca digitale, conservate in magazzino e quindi distribuite dal personale oppure collocate "a scaffale aperto" e quindi direttamente accessibili agli utenti.

  • Sbarramento via password (dell'utente)
  • Sbarramento via numero IP (della postazione)

  • Zone con diverse modalita' di accesso
  • Accesso intermittente

3.2 Conservazione dei documenti digitali

Differenza rispetto alla conservazione dei documenti non-digitali:

  • documenti tradizionali -> conservazione passiva
  • documenti digitali -> conservazione attiva

Problemi:

  • scarsa durata fisica dei supporti per la memorizzazione dei dati (cd, dvd, floppy, ecc.);
  • obsolescenza dell'hardware per la decodifica dei supporti (lettori di vario tipo);
  • obsolescenza dell'hardware per l'esecuzione dei programmi di interpretazione (microprocessori, computer, ecc.);
  • obsolescenza del software per l'interpretazione dei dati (word processor, programmi di grafica, browser, ecc.);
  • decontestualizzazione rispetto all’ambiente di riferimento.

Soluzioni:

  • adozione di linguaggi e software standard;
  • adozione di linguaggi orientati alla struttura logica del documento;
  • preferenza per la distribuzione in rete rispetto a quella su supporti portatili;
  • preferenza per software open source rispetto a quelli proprietari;
  • uso di supporti di alta qualità e resistenza;
  • creazione di musei dell’hardware e del software (archeologia informatica);
  • creazione di raccolte di emulatori software dell’hardware (emulazione);
  • recupero a posteriori dei dati danneggiati o illeggibili (archeologia digitale);
  • duplicazione su supporti digitali alternativi (backup):
    finalizzata più a minimizzare incidenti che alla conservazione a lungo termine
    • completo
    • incrementale (solo i dati cambiati dopo l'ultimo backup)
    • differenziale (solo i dati cambiati dopo l'ultimo backup completo)
  • riversamento periodico sui supporti digitali correnti (refreshing);
  • traduzione periodica nei linguaggi e software correnti (migrazione);
  • istituzione di un deposito legale federativo per i documenti distribuiti in rete;
  • moltiplicazione di copie conservate in depositi multipli di sicurezza assai distanti fra loro;
  • attenuazione delle eccessive protezioni editoriali legate al copyright;
  • miglioramento (quantitativo e qualitativo) delle citazioni e delle catalogazioni di documenti on-line;
  • stampa e conservazione di copie su carta non acida o su microfilm (backup atomico);
  • tempestività nella decisione di iniziare a conservare;
  • continuità senza pause nell'azione di conservazione;
  • contestualizzazione: conservazione non di singoli file, ma di loro insiemi organici.

Standards non ISO:

Standards ISO:

  • HTML (2000)
  • PDF/A (2005)
  • ODF (2006)
  • WARC (2009)
  • OAIS = Open Archival Information System (2002) modello che non abbraccia nessun formato o soluzione tecnica in particolare, ma delinea un modello organizzativo in cui ciascuno di essi possa trovare la migliore applicazione, sottolineando l’importanza del coinvolgimento di istituzioni che si facciano carico della responsabilità sociale a lungo termine della conservazione documentaria.

3.3 Standardizzazione, cooperazione e interoperabilità

Se già nelle biblioteche tradizionali standardizzazione e cooperazione sono parole chiave importantissime, esse diventano nelle biblioteche digitali dei valori assolutamente centrali, venendo a mancare in ambiente elettronico quegli alibi di distanza geografica, problemi di comunicazione o necessità di duplicazioni di documenti o servizi che vengono spesso usati, in buona o cattiva fede, per attenuare la cooperazione e rinviare l'adesione a standard condivisi.

Ciascuno dei precedenti e successivi paragrafi potrebbe essere riscritto (o riletto) guardandolo attraverso la faccetta della standardizzazione come mezzo per permettere e potenziare la cooperazione, che a sua volta è un mezzo per il fine ultimo dell’accesso al maggior numero possibile di documenti da parte del maggior numero possibile di utenti.

Per trattare i documenti digitali, anche tipologie di biblioteche tradizionalmente poco propense a collaborare fra loro, come quelle universitarie, tendono a collegarsi in consorzi per gestire le risorse digitali, soprattutto sullo spinoso fronte delle trattative coi fornitori per le acquisizioni.

  • scaricare e stampare
  • document delivery
  • accesso a utenti occasionali
  • cross access
  • annate arretrate
  • archiviazione
  • abbinamento a sottoscrizioni cartacee
  • rischio di omologazione culturale

Interoperabilità:

  • interoperabilità tecnica, basata su sviluppo e diffusione di standard per la rappresentazione, l’immagazzinamento, il trasferimento e la comunicazione dei dati;
  • interoperabilità semantica, che stipuli le dovute corrispondenze fra termini che indicano gli stessi concetti in sistemi appartenenti ad ambiti disciplinari, professionali e linguistici diversi;
  • interoperabilità interistituzionale, che implica la disponibilità effettiva da parte delle istituzioni di rendere disponibili le proprie risorse informative;
  • interoperabilità intersettoriale, che cerchi di superare le barriere culturali fra comunità disciplinari e professionali diverse, come ad esempio quelle fra biblioteche, musei e archivi;
  • interoperabilità internazionale, che cerchi di superare le barriere culturali e linguistiche fra paesi.


3.4 Metadati

Scopi:

  • individuazione, per scoprire l'esistenza di un documento con determinate caratteristiche;
  • selezione, per analizzare, valutare e filtrare una serie di documenti e scegliere quelli più adatti ai nostri fini;
  • localizzazione, per rintracciare un particolare esemplare del documento individuato e selezionato;
  • disponibilità, per ottenere informazioni sulla effettiva possibilità di fruizione dell’esemplare localizzato;
  • interoperabilità, per permettere la ricerca anche in ambiti disciplinari e linguistici diversi grazie a una serie di equivalenze fra descrittori;
  • gestione, per garantire la conservazione e il mantenimento della possibilità di fruizione dei documenti.

Tipologie:

  • metadati descrittivo-semantici (MDS), che servono per l’identificazione ed il recupero dei documenti primari e sono costituiti da descrizioni normalizzate di tali documenti e dei loro contenuti semantici;
  • metadati amministrativo-gestionali (MAG), che evidenziano le modalità di archiviazione e manutenzione dei documenti nell’ambito della struttura che li accoglie e sono necessari per una corretta gestione della struttura stessa.

All’interno dei MAG c’è chi opera ulteriori distinzioni:

  • metadati tecnici, ad esempio documentazione su hardware e software necessari per gestire il documento, informazioni sulla compressione e altre caratteristiche della procedura impiegata per la digitalizzazione, eventuali dati relativi alla sicurezza come password e chiavi crittografiche;
  • metadati per la conservazione, ad esempio un diario delle procedure di riversamento e migrazione (cfr. 3.2) effettuate nel corso del tempo;
  • metadati per la fruizione, ad esempio informazioni sull’esistenza di una pluralità di versioni o visualizzazioni e sull’uso nel corso del tempo da parte degli utenti.

Querelle sui MDS:

  • Michael Gorman
  • "metadata boys"

Provenienza:

  • Auto-catalogazione professionale
  • Auto-catalogazione non professionale
  • Indicizzatori esterni non professionali
  • Indicizzatori esterni professionali
  • Software

Esempi:

  • Dublin Core un set di 15 elementi descrittivo-semantici (titolo; autore o creatore; soggetto, classe o parole chiave; abstract, indice o altri generi di descrizione del contenuto; editore; eventuali ulteriori responsabili; data; tipo di risorsa; formato dei dati; URL, ISBN, DOI o altro identificatore; fonte di provenienza; lingua; relazioni con altri documenti; copertura spaziale e/o temporale; indicazioni sul copyright) individuati da un autorevole consorzio internazionale di ambito bibliotecario per permettere una descrizione minimale di qualsiasi risorsa digitale. Ricalcato sul MARC, di cui costituisce una radicale semplificazione.
  • MAG dell’ICCU, sviluppati nell’ambito del modello logico-funzionale OAIS (cfr. 3.2) da un apposito gruppo di studio promosso dall’ICCU per standardizzare i metadati necessari alla gestione dei documenti digitalizzati nell’ambito del progetto Biblioteca Digitale Italiana (e, auspicabilmente, più in generale nelle digitalizzazioni effettuate in Italia). Espressi in XML, sono indipendenti da specifici hardware e software e includono anche alcuni, limitati, elementi descrittivi, espressi in formato Dublin Core.
  • DOI (digital object identifier), sviuppato in ambiente editoriale, è una sorta di ISBN assegnato (a pagamento) in modo univoco e permanente da una serie di agenzie coordinate a livello internazionale ad ogni segmento di proprietà intellettuale potenzialmente autonomo (un testo, una immagine, ma anche un e-journal, un e-book, ecc.) disponibile online.

3.5 Interfaccia e ricerca

Interfaccia:

  • Facilmente comprensibile e utilizzabile
  • Ricerca potente e versatile
  • Output dei documenti primari e dei metadati
  • Manualistica e assistenza

  • essere coerenti nell’uso di caratteri, colori, layout, terminologia, comandi, ecc.;
  • permettere all’utente di specificare i parametri dei comandi impartiti al sistema;
  • prevedere sufficiente spazio per il testo che deve essere inserito dall’utente (ad esempio nelle maschere di ricerca);
  • fornire un appropriato feedback rispetto alle azioni effettuate dall’utente, mostrando anche il progresso in corso nella risposta da parte del sistema;
  • permettere all’utente di capire quando una azione (ad esempio una ricerca) è stata completata in modo esaustivo;
  • permettere di annullare l’ultima azione effettuata;
  • mantenere memoria delle azioni effettuate dall’utente e permetterne la ripetizione;
  • segnalare gli errori compiuti dall’utente in modo chiaro e permetterne facilmente la correzione;
  • prevedere scorciatoie (e, eventualmente, diverse interfacce) per gli utenti esperti.

Information retrieval:

  • scorrimento di liste, eventualmente annidate una dentro l’altra a comporre una gerarchia classificatoria, che permetta di esplorare l’intero contenuto documentario del sistema da un estremo all’altro (scan, browse);
  • interrogazione del sistema (sull’intero testo dei documenti o su metadati distinti in campi) per estrarne, grazie anche a vari tipi di operatori (booleani, relazionali, di prossimità, di troncamento, ecc.), un sottoinsieme dei documenti contenuti che soddisfi il più possibile i bisogni informativi dell’utente e che sia ulteriormente combinabile con ulteriori sottoinsiemi (search, query, find);
  • navigazione ipertestuale fra i metadati e i documenti primari, effettuata seguendo singoli link "uno a uno" oppure attraverso link che "lanciano" a loro volta scorrimenti di liste (scan) o interrogazioni del sistema (search).

Frontiere:

  • Multimedia information retrieval (MMIR), ovvero la ricerca di documenti non testuali con tecniche basate prevalentemente sul loro contenuto multimediale, scavalcando l’intermediazione dei metadati testuali.
  • Logica fuzzy (sfocata), che permette di assegnare sia ai termini usati nella ricerca che agli operatori che li connettono valori percentuali diversi dai due casi estremi (100% e 0%) previsti dalla logica classica, producendo risultati meno netti ma, pare, più vicini alla realtà, che - come si suol dire - non è mai nè completamente bianca nè completamente nera.
  • Interfacce tridimensionali, sia del tipo "realtà artificiale" (non intrusive, sullo schermo del computer) che del tipo "realtà virtuale" (intrusive, con l’ausilio di caschi, occhiali, guanti e tute speciali per raggiungere il massimo del realismo).
  • Riconoscimento vocale dei comandi (input) e emissione vocale dei risultati (output).
  • Agenti intelligenti, sistemi esperti, collaborative filtering (cfr. 2.8), knowbots (knowledge robots) e altri metodi basati sostanzialmente sulla capacità del sistema di ricerca di imparare dalla ricerca stessa e dagli input più o meno volontari provenienti da fonti diverse per perfezionare progressivamente la propria efficacia. Alcune delle ricerche in questo settore sono collegate a quelle sull’intelligenza artificiale.
  • Multilinguismo. Approfondimenti delle tecniche di ricerca in ambienti multilinguistici, collegati anche alle ricerche sulla traduzione automatica. A cavallo fra questo ambito di studi e quelli sull’intelligenza artificiale si collocano le ricerche più spinte sull’uso del linguaggio naturale in ambito di information retrieval.
  • Ipertestualità. Approfondimenti delle tecniche di ricerca ipertestuale, che hanno trovato nel web un fondamentale risultato ma non un punto di arrivo definitivo.
  • Integrazione coi motori di ricerca. Esposizione dei contenuti degli opac e delle biblioteche digitali agli strumenti di ricerca sul web di tipo generale o specializzati in ambito accademico-scientifico, sottraendoli ai recessi del web "invisibile". Inversamente, viene approfondita anche l’applicazione dei metodi di ricerca fulltext dei "web search engines" esclusivamente su raccolte di documenti primari omogenei come quelli presenti nelle biblioteche digitali, producendo così risultati più contestualizzati e focalizzati.
  • Relevance ranking. Accanto ai tradizionali metodi di ordinamento utilizzati nei cataloghi e in altre forme di offerta di servizi (bollettini delle nuove acquisizioni, disseminazione selettiva dell’informazione, ecc.), la biblioteca digitale offre la possibilità (che dovrebbe comunque sempre restare solo opzionale) di ordinamenti (ranking) alternativi basati su criteri complessi, mutuati anch’essi dai "web search engines", che cercano di produrre risultati più vicini possibile all’ipotizzata massima rilevanza per l’utente.

Accessibilità

Possibilità di accesso ai contenuti informativi da parte di tutti i cittadini, indipendentemente dall'hardware e dal software da essi utilizzati e dalle loro eventuali disabilità fisiche o cognitive. Obbligatoria in Italia dal 2004 per tutti i siti web della pubblica amministrazione e per quelli considerati di pubblica utilità, che devono adeguarsi alle apposite linee guida redatte dal W3C.

Usabilità

Efficace ergonomia cognitiva, che permetta da una parte all'utente di navigare seguendo liberi percorsi associativi senza rischio di perdersi e dall'altra al gestore del sito di raggiungere nel modo migliore i propri obbiettivi informativi e comunicativi.

3.6 Valutazione

    Livelli di valutazione delle biblioteche digitali:

centrati sugli utenti:
  • livello sociale (in che misura la biblioteca digitale soddisfa le necessità e si adegua alle procedure di una determinata comunità)
  • livello istituzionale (in che misura la biblioteca digitale aiuta una determinata istituzione a raggiungere i propri obbiettivi)
  • livello individuale (in che misura la biblioteca digitale soddisfa le necessità di singoli utenti e di loro piccoli gruppi e ne facilita i compiti)
centrati sul sistema:
  • livello ingegneristico (valutazione del funzionamento dell'hardware, delle reti e delle tecnologie connesse)
  • livello di procedure (valutazione dell'efficacia dei software, degli algoritmi e dell'organizzazione dei servizi)
  • livello di contenuti (valutazione della qualità, della quantità e dell'appropriatezza dei documenti e del modo in cui essi sono stati selezionati e organizzati e vengono gestiti)
centrato sulle interfacce fra gli utenti e il sistema:
  • valutazione dell'efficacia con cui le interfacce permettono e facilitano l'accesso, la ricerca e l'interazione col sistema stesso

    Problemi nella valutazione dell'uso delle biblioteche digitali:

Dal fatto che una determinata banca dati venga poco utilizzata, non consegue necessariamente che essa sia irrilevante per gli studi svolti localmente oppure che quel settore disciplinare sia coperto piu' adeguatamente da un altro repertorio, digitale o analogico, perche' potrebbe anche darsi che gli utenti:

  • ignorino che è stato attivato un abbonamento alla nuova banca dati, non sufficientemente pubblicizzata e promossa (e talvolta neppure inserita nell’opac locale per scarsa sensibilità all’integrazione delle raccolte o, più spesso, per mancanza di risorse umane sufficienti);
  • non si siano accorti che, oltre ai riferimenti bibliografici già sufficientemente coperti dal repertorio già posseduto, quello nuovo fornisce anche l’accesso al fulltext dei documenti primari;
  • pur apprezzando la maggiore copertura e accuratezza del nuovo repertorio rispetto a quello a cui sono ormai abituati, ritengano che tale vantaggio non compensi l’impegno necessario per imparare da soli ad utilizzarlo adeguatamente, senza un adeguato supporto da parte dei bibliotecari;
  • non utilizzino il nuovo repertorio in prova (on trial) per non correre il rischio di impegnare inutimente del tempo per imparare a usare una risorsa che probabilmente non resterà a lungo a loro disposizione;
  • preferiscano comunque utilizzare un repertorio in formato cartaceo rispetto a uno, anche migliore, in formato digitale, perchè privi di adeguata alfabetizzazione all’uso di strumenti elettronici o perchè nelle sedi da loro abitualmente frequentate questi ultimi non sono sufficientemente accessibili per motivi logistici (pochi computer, connettività carente, ecc.).

    Criteri per la valutazione dei servizi:

  • tempo impiegato dal personale per la gestione delle risorse digitali e per la relativa istruzione dell’utenza;
  • tempo di attesa per l’uso delle postazioni che consentono l’accesso alla biblioteca digitale;
  • numero di postazioni per l’accesso alla biblioteca digitale rispetto al numero degli utenti;
  • numero delle richieste di aiuto per l’uso delle postazioni ricevute e di quelle soddisfatte;
  • numero delle richieste di reference virtuale ricevute e di quelle soddisfatte;
  • numero dei file salvati, delle pagine stampate e delle transazioni di document delivery digitale;
  • numero delle sessioni di uso per ciascuna risorsa digitale, anche in rapporto al suo costo;
  • numero delle unità informative recuperate da tali risorse, per sessione e per unità di tempo;
  • numero delle sottoscrizioni a risorse digitali, loro durata e costo;
  • percentuale delle spese per le risorse digitali rispetto a quelle per le risorse analogiche;
  • percentuale degli utenti che usufruisce delle collezioni e dei servizi della biblioteca digitale;
  • soddisfazione dichiarata dagli utenti relativamente all’uso della biblioteca digitale.

    Vantaggi economici delle risorse digitali:

  • accesso multiplo da parte di più utenti, che riduce il numero delle copie necessarie;
  • accesso a distanza, che riduce i costi di viaggio (da parte degli utenti) e di distribuzione (da parte degli editori) e amplia, così come il punto precedente, il numero degli utenti raggiungibili sia contemporaneamente che in termini assoluti;
  • accesso 24/7 (24 ore al giorno, 7 giorni alla settimana);
  • minori limitazioni relativamente alla quantità e alla tipologia delle informazioni distribuite;

  • flessibilità, che permette di usare la stessa risorsa o sue parti per più scopi, più tipologie di utenti e più volte nel corso del tempo;
  • manipolabilità, che permette il riutilizzo dei contenuti informativi risparmiando il tempo impiegato per ridigitarli;
  • minori costi di produzione (soprattutto in caso di successive edizioni e versioni) e distribuzione;
  • possibilità di creare prodotti di nicchia destinati a un numero ridotto di utenti, comunque remunerativi per gli editori ma con investimenti minori in fase produttiva e una maggiore capillarità in fase distributiva;
  • tutti i vantaggi, ancora in fase di sviluppo, legati all’e-commerce, dalla maggiore fidelizzazione dei clienti alla eliminazione degli intermediari di tipo esclusivamente parassitario;
  • economie di scala legate all’interoperabilità fra istituzioni (ad esempio biblioteche, musei e archivi).

    Criteri per la valutazione delle collezioni:


3.7 Copyright e privacy

  • diritti economici dell'autore (o dell'editore)
  • diritti morali dell'autore
  • diritto all'accesso all'informazione dell'utente
  • diritto alla privacy dell'utente

Sul fronte della PRIVACY bisognerà dunque vigilare che alla massa di informazioni relative agli utenti che vengono registrate durante qualsiasi interazione con un sistema documentario elettronico, soprattutto se esso prevede una vasta gamma di servizi personalizzabili, vengano applicate rigorosamente tutte le misure previste dalla vigente normativa, e in particolare che esse siano:

  • scelte e memorizzate esclusivamente per effettive necessità tecniche o legate a servizi richiesti dall’utente stesso (se l’utente chiede in prestito un e-book devo per forza registrare tutti i suoi dati necessari per individuarlo al momento di sollecitare il rientro del documento prestato);
  • mantenute a breve termine nella loro interezza solo fino a quando effettivamente necessarie allo svolgimento del servizio (finchè l’e-book è in prestito non posso cancellare nome e cognome dell’utente);
  • mantenute a lungo termine per scopi statistici esclusivamente dopo aver cancellato il legame coi dati strettamente personali (una volta restituito l’e-book, non è più giustificabile mantenere in memoria l’abbinamento fra i metadati dell’e-book stesso e quelli dell’utente, ma solo il totale progressivo relativo al numero e alle caratteristiche dei prestiti complessivi e del singolo documento, così come quelli sulle tipologie dell’utenza);
  • messe a disposizione esclusivamente dagli operatori addetti al servizio (e non, ad esempio, dai colleghi che non si occupano del prestito) o di soggetti esterni autorizzati dalla legge (ad esempio la polizia, ma esclusivamente se formalmente autorizzata dalla magistratura);
  • non utilizzate per altri servizi non richiesti dall’utente (ad esempio l’invio di bollettini bibliografici);
  • mantenute sempre facilmente visibili dall’utente stesso, anche per sue eventuali rettifiche.

Sul fronte del DIRITTO D'AUTORE e' raccomandabile che le biblioteche:

  • verifichino accuratamente di non ledere i diritti nè di autori nè di editori quando procedono alla digitalizzazione di propri fondi e, a maggior ragione, alla commercializzazione e/o diffusione via internet delle relative scansioni;
  • citino sempre per esteso le fonti originali di tali digitalizzazioni e, più in generale, di qualsiasi documento messo a disposizione degli utenti sul proprio sito web o per altre vie;
  • evitino di dare per scontato (come invece purtroppo fanno molti editori) che la cessione dei diritti effettuata da un autore relativamente all’edizione analogica del proprio prodotto intellettuale (effettuata talvolta prima ancora che si diffondessero forme alternative di pubblicazione) si applichi automaticamente, senza ulteriore trattativa, anche a ogni possibile forma di edizione digitale;
  • evitino la duplicazione (a meno che non sia stata preventivamente concordata e autorizzata) sul proprio sito web di qualsiasi tipo di documentazione liberamente disponibile in internet e avvertano comunque i relativi produttori anche in caso di duplicazione a fini di conservazione e uso non commerciale su supporti digitali offline o a stampa;
  • non siano inutilmente parsimoniose nel diffondere gratuitamente e liberamente via internet, o con altri mezzi non particolarmente dispendiosi, i documenti digitali (nativi o digitalizzati) di cui detengono i diritti, ispirandosi anche in ambiente elettronico ai medesimi criteri della massima pubblicità e gratuità sostenibile che già uniformano la loro azione nel mondo fisico;
  • diffondano il più possibile fra i propri utenti la consapevolezza dei diritti e doveri connessi alla sfera del diritto d’autore, con particolare attenzione alle specificità dell’ambiente digitale;
  • facciano molta attenzione alle clausole dei contratti stipulati coi fornitori di documenti digitali, esercitando eventualmente pressione, direttamente o attraverso consorzi, perchè esse non siano eccessivamente limitanti rispetto ai diritti di accesso e uso dell’informazione da parte delle biblioteche e dei loro utenti;
  • interpretino sempre nel modo più favorevole all’utente tutte le leggi, normative e contratti relativi all’uso di documentazione digitale che abbiano dei margini anche esigui di ambiguità, in particolare quelle con ricadute sui servizi di prestito e document delivery (cfr. 2.7).

 


4. Amalgamare gli ingredienti

Esplosione documentaria:

  • quantitativa, perchè crescono il numero complessivo dei documenti digitali e digitalizzati disponibili e quello delle loro versioni, varianti e localizzazioni;
  • qualitativa, perchè aumentano le tipologie di documenti, dei loro "contenitori" e delle modalità con cui i lettori possono accedervi e gli autori metterli a disposizione;
  • relativa alla granularità, perchè rispetto all’ambiente analogico aumenta l’atomizzazione dei documenti, ovvero la possibilità di individuare micro-documenti all’interno dei macro-documenti oppure meta-documenti costruiti collegando fra loro micro-documenti appartenenti a macro-documenti diversi.

Amalgamare dall'esterno:

  • Ipertestualità
  • World Wide Web
  • Aggregatori
  • Search engines, directories, repertori
  • Web semantico

4.1 Web semantico


4.2 Reference linking

Amalgamare dall'interno:

  • OPAC
  • Software per portali (MetaLib)
  • Software per reference linking (SFX)
Grazie allo standard OpenURL è possibile attivare, all’interno di qualsiasi micro o macro-documento digitale che preveda una connessione con il web, dei link che:

  • non puntino, come avviene abitualmente, verso URL statici, soggetti a rapida obsolescenza a meno di dispendiosi investimenti nella loro continua verifica e aggiornamento, bensì verso URL dinamici, prodotti "al volo" (on the fly) interrogando banche dati come CrossRef (cfr. 3.4), che si prendono cura di seguire e documentare i cambiamenti di URL dei documenti censiti, oppure altri tipi di banche dati mantenute localmente o da fornitori commerciali e spesso denominate knowledge base, che forniscano all’OpenURL in arrivo le necessarie coordinate per proseguire la propria corsa trasformandosi nell’effettivo URL utilizzato al momento dai vari fornitori per localizzare la risorsa ricercata;
  • siano "sensibili al contesto", ovvero tengano automaticamente conto, attingendo ai relativi metadati locali, dei diritti di accesso dell’utente, visualizzando esclusivamente (o, comunque, diversamente) la possibilità di connessione ai documenti (o ai relativi metadati, oppure a servizi di document delivery) effettivamente disponibili dalla postazione (o con la password) utilizzata.
Tale doppia verifica produce link "caldi" o "estesi" massimamente efficaci, perchè contestualizzati oggettivamente sulle reali caratteristiche (prima fra tutte la localizzazione) nel dato momento della risorsa e soggettivamente sui reali diritti di accesso, nel medesimo momento, dell’utente dato.

4.3 Un ricetta triangolare per il futuro

  • Gli open archive garantirebbero la disponibilità universale delle pubblicazioni, ovvero l'accesso democratico e tempestivo ai risultati della ricerca.
  • Gli e-journal offrirebbero la selezione qualitativa dei contributi più rilevanti, grazie al controllo editoriale operato dai propri comitati scientifici.
  • Le bibliografie digitali si occuperebbero del controllo bibliografico universale, per quanto umanamente possibile, grazie a una repertoriazione ampia e capillare.
  • Le biblioteche digitali si concentrerebbero da un lato sulla conservazione a lungo termine dei documenti (grazie anche alla diffusione del deposito legale digitale, che dovrebbe coinvolgere anche gli open archive) e dall’altro su servizi a valore aggiunto mirati su specifiche tipologie di utenti, a cominciare dalla selezione delle acquisizioni e dall’assistenza personalizzata attraverso il reference service virtuale. La sempre più diffusa interoperabilità e la diffusione di software per il reference linking e per la gestione di meta-interrogazioni di fonti digitali etereogenee dovrebbe invece riuscire a sollevare le biblioteche e i rispettivi opac da un eccesso di impegno sul fronte della catalogazione, riutilizzando i metadati prodotti professionalmente da open archive, e-journal e, soprattutto, bibliografie.

Libri piramidali [Darnton, 1999]

Strutturare il libro elettronico per strati disposti come in una piramide. Lo strato superiore potrebbe essere un resoconto conciso dell’argomento, di cui si potrebbe pensare anche un’edizione stampata economica. Nello strato successivo si potrebbero illustrare versioni ampliate di aspetti diversi dell’oggetto della ricerca, ognuna organizzata come unità autosufficiente e con lo scopo di fornire ulteriori approfondimenti. Il terzo strato potrebbe essere composto da documenti di generi diversi accompagnati da saggi interpretativi. Un quarto strato storiografico potrebbe contenere selezioni e discussioni di precedenti ricerche. Il quinto strato potrebbe essere destinato al supporto didattico mentre il sesto potrebbe raccogliere resoconti dei lettori e altri commenti e recensioni.

Galassie di documenti [Ridi, 2004] (o, meglio: "costellazioni di documenti")

Ciascuno studioso o gruppo di ricercatori, invece di riscrivere nel corso della propria carriera mille varianti e aggiornamenti dei propri libri e articoli (ciascuno inevitabilmente separato, in ambiente cartaceo, dagli altri e da tutti gli altri documenti a cui fa riferimento e dei quali deve, altrettanto inevitabilmente, inglobare delle parti), coltiverebbe una o più "galassie di documenti", raccolti e organizzati in open archive, e-journal, bibliografie, repertori, banche dati, rapporti, capitoli, blog, pagine web personali e istituzionali, ciascuna relativa a uno dei propri ambiti di ricerca o comunque di interesse, tutte fittamente "linkate" internamente ed esternamente, mantenute costantemente aggiornate (ma archiviando accuratamente le versioni precedenti) e disponibili per estrazioni personalizzate di "fette informative", anche in collaborazione con realizzazioni di autentico print on demand.

È difficile prevedere se questo scenario si realizzerà mai, e a maggior ragione con quale tempistica, perchè ai già numerosi elementi di incertezza incontrati nel corso dell’articolo si aggiungono quelli relativi a:

  • i tempi necessari perchè le pubblicazioni esclusivamente digitali vengano definitivamente accettate alla stessa stregua di quelle a stampa in ambito legale, accademico e più generalmente sociale;
  • la maggiore o minore diffusione e fortuna del modello culturale ipertestuale;
  • l’evoluzione dei metodi di valutazione della ricerca accademica, tuttora tenacemente radicati al motto "publish or perish", antitetico a quello nelsoniano "deep interconnection, intercomparison and re-use".

pagina a cura di Riccardo Ridi, creata 2004-08-31, ultimo aggiornamento 2017-04-01