Archivio digitale su browser Internet per la Gazzetta di Parma

La Gazzetta di Parma, uno
dei più antichi e blasonati quotidiani della provincia italiana – si
pubblica dal 1735 – ha introdotto da qualche mese un nuovo sistema per
l’archiviazione digitale diretta delle pagine che sfrutta l’architettura
del mondo Internet. Attraverso i browser più diffusi per la navigazione sul
web – Microsoft Explorer e Netscape Navigator – è possibile in pochi
secondi reperire testi ed immagini fotografiche pubblicate sul quotidiano
locale. TecnoMedia ha chiesto a Massimiliano Guatelli, responsabile tecnico
della testata, i dettagli relativi all’introduzione di questo nuovo
strumento editoriale, denominato T@rk, sviluppato dalla società Tera di
Milano.

Dalle esperienze passate…
La Gazzetta di Parma non è nuova all’utilizzo di strumenti digitali per
gestire l’archivio redazionale. L’esperienza è cominciata alcuni anni fa
con un applicativo sviluppato in Argentina, e denominato SoftData, che
consentiva l’archiviazione in due database separati dei testi con le
“immagini” delle pagine e delle fotografie corredate dalle schede
anagrafiche. L’archivista svolgeva la ricerca all’interno del primo dei due
archivi, nel quale poteva semplicemente “vedere” le fotografie pubblicate
di corredo ai testi, e solo successivamente, grazie ai riferimenti
incrociati, ricuperava il file immagine digitale. Un sistema il cui limite
più grosso era costituito dalla duplicità dei contenitori di dati che,
oltre a rendere più tortuoso il percorso delle query di ricerca, non
permetteva di disporre di un’unica banca dati omogenea di informazioni.
Le prime esperienze sul precedente sistema di archiviazione sono state
accompagnate dalla parallela introduzione della videoimpaginazione, che è
stata avviata con il passaggio al sistema editoriale GoodNews di Tera. Oggi
la Gazzetta di Parma è quasi interamente prodotta in digitale, salvo la
quota di pubblicità che ancora arriva su pellicola e che viene montata a
mano in tipografia.

… al sistema attuale
Proprio il passaggio al sistema editoriale GoodNews ha costituito la
premessa tecnologica per la introduzione del nuovo software di
archiviazione automatica delle pagine. La novità più rilevante, dal punto
di vista dell’architettura globale del sistema, è che in T@rk i database
delle immagini e dei testi sono collegati in un’unica struttura,
all’interno della quale vengono archiviate materialmente le pagine del
quotidiano in formato Pdf. In questo modo, quando l’operatore svolge la
ricerca, ottiene immediatamente accesso non solo ai testi ma anche alle
immagini, con il risultato di recuperare con un’unica query di ricerca
tutte le informazioni relative ai documenti, e contemporaneamente i
documenti stessi già in formato digitale, pronti per essere riutilizzati ai
fini della documentazione redazionale oppure – nel caso delle immagini –
per la ri-pubblicazione su nuove edizioni del quotidiano.
Tutte le operazioni di input sono state fortemente automatizzate, sia per
quanto riguarda l’archiviazione delle pagine in formato Pdf che per quanto
riguarda il database delle immagini.
Queste ultime, una volta entrate nel sistema editoriale in formato
digitale, vengono rese disponibili ai giornalisti, che provvedono alle
selezione di quelle da pubblicare e, contemporaneamente, segnalano al
personale tecnico le immagini che sarebbe comunque bene archiviare per
futuri utilizzi. Successivamente, l’immagine viene posizionata in pagina e
lavorata in bassa risoluzione. Mano a mano che il lavoro quotidiano
procede, all’interno della pagina digitale confluiscono testi, elementi
grafici e tutte le altre componenti disponibili nel sistema. La pubblicità
classificata e le necrologie arrivano direttamente dal sistema della
Publiedi, la concessionaria di pubblicità della Gazzetta di Parma, che
invia al sistema editoriale un file Eps successivamente elaborato in
X-Press ed agganciato alla pagina creata all’interno di GoodNews. Al
momento di andare in fotocomposizione il sistema ricupera, con tecnica Opi,
l’alta risoluzione dell’immagine e crea, contemporaneamente, un file Pdf. I
testi redazionali confluiti nella pagina durante il giorno vengono
“parcheggiati” in una apposita directory, e convertiti in linguaggio Html
con una procedura che interviene sui file Ascii riconoscendo in modo
automatico i tag del sistema GoodNews.
La fase finale del processo di archiviazione di ciascun numero avviene nei
giorni immediatamente successivi alla pubblicazione. Il personale
poligrafico incaricato provvede al completamento delle schede anagrafiche
delle fotografie in alta risoluzione pubblicate e di quelle che, pur non
pubblicate, entrano a fare parte del database. Nel primo caso, cioè per le
fotografie stampate, vengono archiviate le immagini così come sono state
elaborate dai tecnici su indicazione dei giornalisti, ovvero con
l’inquadratura stabilita e con le altre eventuali modifiche effettuate
direttamente sull’originale digitale, mentre nel secondo caso (le immagini
non pubblicate) vengono archiviati i file di agenzia così come sono stati
ricevuti dalle linee digitali di Ansa ed Associated Press.
Per quanto riguarda i testi, sono salvati in formato Html, che li rende
gestibili all’interno dei browser più diffusi per Internet. L’architettura
di T@rk, che prevede oggetti digitali – pagine Pdf, immagini Tiff in alta
risoluzione compresse in Jpeg, testi riconvertiti in formato Html –
collegati fra loro in un unico database relazionale, è particolarmente
flessibile per quanto riguarda la fase di riutilizzo dei materiali,
soprattutto le fotografie già pubblicate. Quando queste ultime vengono
riselezionate per corredare articoli da pubblicare in giorni successivi
alla prima pubblicazione – operazione abbastanza frequente per la cronaca
locale – possono venire archiviate una seconda volta, per esempio con un
nuovo “taglio” editoriale, oppure possono essere “agganciate” al primo
originale archiviato, facendo guadagnare al sistema spazio prezioso.
Per quanto riguarda il file di pagina in formato Pdf, questo contiene tutti
gli elementi che sono transitati all’interno del processo di
videoimpaginazione; restano esclusi, almeno per il momento, le inserzioni
pubblicitarie che sono state recapitate alla tipografia del giornale su
pellicola.

Il flusso di lavoro
Rispetto alle esperienze condotte sul primo archivio digitale installato,
non è cambiata, almeno per il momento, l’organizzazione interna per
l’utilizzo dell’archivio. Sia il precedente che quello attuale sono in uso
alla segreteria di redazione, dove personale poligrafico provvede alla
ricerca su richiesta dei giornalisti. T@rk consentirebbe, comunque, un
accesso diretto da parte dei giornalisti, solo che intercorrano accordi in
tal senso condivisi da tutte le componenti che concorrono alla
realizzazione del giornale. Per il momento, il nuovo archivio è in visione
al capo-redattore della Gazzetta di Parma, che sta testandolo sia dal punto
di vista tecnico che per quanto riguarda la possibilità di impiego per le
normali attività redazionali.
L’archivista incaricato della ricerca accede al materiale attraverso una
interfaccia di uso molto intuitivo. Una volta lanciata la query, il motore
restituisce una lista di tutti i materiali rintracciati, ed il passo
successivo è l’accesso ai testi memorizzati in Html o, in alternativa, alle
pagine intere in formato Pdf, all’interno delle quali è possibile
posizionarsi con il cursore a video e compiere tutte le operazioni
consentite dal formato.
L’archivio contiene, per il momento, le pagine del quotidiano a partire dal
29 di settembre 1998. Successivamente verrà trasferito sotto T@rk il
materiale in formato digitale archiviato precedentemente, che comprende
l’ultimo trimestre del 1996 e tutto il 1997.
L’implementazione mensile della banca dati è di circa 1GB fra testi,
immagini e grafica, con un totale prevedibile totale di circa 15-16 GB
all’anno, mentre il patrimonio informativo costituito dalle immagini cresce
di circa 75.000 unità all’anno.

Più che un giornale, un’Istituzione
La Gazzetta di Parma, più che un giornale, è considerata dai lettori una
vera e propria istituzione. Pubblicata con continuità fin dal 1735, con una
diffusione media attorno alle 48.000 copie al giorno ed una penetrazione
capillare nel proprio territorio con una quota di mercato pari al 72%, la
Gazzetta ha di fatto acquisito, tramite il nuovo sistema per l’archivio
redazionale, anche una soluzione per la diffusione del proprio contenuto su
rete Internet, che la S.E.G.E.A. – la società che edita la Gazzetta di
Parma, di proprietà della Unione Industriali – pensa di varare nei primi
mesi del prossimo anno.
Disponendo già del materiale consultabile attraverso i più diffusi browser
per Internet, anche edizioni elettroniche su CD Rom potrebbero diventare di
notevole interesse, non richiedendo all’origine investimenti di notevoli
dimensioni e, soprattutto, non richiedendo da parte degli utenti finali
particolari sforzi per impadronirsi delle interfacce utente; un vantaggio,
quest’ultimo, fondamentale nella diffusione di banche dati su supporto
digitale, strumenti informativi e di consultazione che, come tutti gli
altri canali dell’area “new media”, hanno una soglia di accesso tecnologica
già sufficientemente elevata per potersi permettere ulteriori complicazioni.