tuttocina tuttocina
Google Web https://www.tuttocina.it
INDICE>MONDO CINESE>NUOVI STRUMENTI PER CONOSCERE LA CINA

RUBRICHE

NUOVI STRUMENTI PER CONOSCERE LA CINA

Rubrica a cura di Federico Greselin

Probabilmente, nell'immaginario collettivo, la rivoluzione tecnologica che ha preso piede nel corso dell'ultimo decennio, si identifica spesso in prodotti-icona, vale a dire in oggetti che sono diventati veri e propri simboli del nuovo, al di là della loro adeguatezza al mantenimento di uno standard elevato nell'offerta sostenuta appunto da detta rivoluzione. Questo è il caso del compact disk: per molti di noi, il dischetto inciso con il laser, nella varietà cd-rom, che non è altro poi che il corrispettivo informatico del cd audio, già per suo conto protagonista di una svolta epocale, rappresenta ancora il non plus ultra nell'ambito dell'offerta culturale, il mezzo di diffusione principale e irrinunciabile, la chiave di volta tra il vecchio e il nuovo. Anche l'industria deve essere ben conscia della valenza simbolica del dischetto argentato, se si è affidata e si continua ad affidare a sue va-rianti per ogni nuova iniziativa, così per il DVD, video e audio, il SACD1 ecc.
Nell'ambito degli studi cinesi, molti dei prodotti presentati e analizzati in questa piccola rubrica tendono ad avvalorare l'importanza del cd e, forse, a mantenere un equivoco che può risultare, col tempo, relativamente nocivo. È forse necessario ricondurre la discussione alle sue motivazioni di fondo, e il prodotto che ho scelto di presentare in questo numero ci consente di comprendere come, nell'adeguamento dei nostri metodi di studio e lavoro alle nuove tecnologie, sia sempre opportuno saper distinguere tra mezzo e fine.

Zhongguo da baike quanshu in cd-rom

La Grande biblioteca cinese di tutte le discipline2 è una nota e diffusissima enciclopedia che occupa un ampio spazio negli scaffali delle biblioteche di buona parte degli istituti universitari in cui ci si occupa di studi cinesi, e questo in tutto il mondo. Divisa in una sessantina di sezioni intitolate alle diverse discipline, raccolte in ben 73 volumi di grande formato, fitti di testo e di illustrazioni, la Da baike rappresenta il più ragguardevole tentativo da parte della cultura ufficiale cinese di fornire una summa completa ed esaustiva su ogni argomento possibile. Al momento ignoro se e come sia eventualmente organizzato il meccanismo - invero necessario - di aggiornamento, ma è pur vero che chiunque voglia avere notizie dettagliate su personaggi, fatti e circostanze su qualsiasi aspetto della civiltà umana, trova nelle monografie ospitate nell'opera pane per i suoi denti.
Certo, i limiti culturali di questa operazione sono evidenti: se è comunque apprezzabile la grande disponibilità di informazioni sui vari argomenti, lascia sempre perplessi l'adeguamento dell'estensore di ogni singola voce alla linea interpretativa "ufficiale" che, condivisibile o no che sia, limita le possibilità di approfondimento di un dato argomento. Inoltre, la decisione pur interessante di limitare il numero delle voci a vantaggio di uno spazio maggiore per le singole monografie, e le scelte redazionali operate di conseguenza risultano non sempre condivisibili.
Fatte salve queste premesse, resta comunque notevole l'utilità pratica di questo strumento di consultazione: il target di riferimento, non va dimenticato, è l'utente cinese e, tra tutte le sezioni monografiche, solo alcune presentano una suddivisione d'area tra Cina e non-Cina (Letteratura, Storia, Geografia, e Medicina, per inciso). Pure, anche per lo studioso (e lo studente) che si occupa di cose cinesi, la Da baike costituisce uno strumento prezioso e utile per desumere rapidamente notizie, verificare trascrizioni, controllare dati, rinfrescare il proprio bagaglio di nozioni e altro ancora. Chi scrive, ad esempio, ha ricavato dall'enciclopedia per anni molti testi da affidare ai propri studenti come materiale sia per riferimento che per traduzioni: le voci sono scritte in una lingua piana eppure non sciatta, ed alcune monografie si rivelano anche piuttosto consistenti.
Come per tutte le grandi opere di consultazione, un'edizione elettronica che possa affiancare o addirittura sostituire l'edizione a stampa non può non rappresentare un piccolo evento. Le possibilità offerte da una versione su cd di un simile progetto sono evidenti, e, per altri prodotti, sono state già illustrate in queste stesse pagine: minore occupazione di spazio, rapidità di consultazione, trasportabilità, eventuale contenimento del prezzo costituiscono un valore aggiunto considerevole. Tutto ciò ha contribuito e contribuisce sempre ad alimentare il mito, cui mi riferivo in apertura, del cd come supporto all'avanguardia.
L'uscita della versione guangpan (laser) della Da baike3, avvenuta alla fine dello scorso anno, però, che rappresenta una vera e propria occasione mancata, evidenzia come i limiti dell'innovazione tecnologica, come sempre, non stanno nella tecnologia in sé, ma nel modo in cui viene gestita.
I 4 cd dell'edizione elettronica della Da baike, offerti a un prezzo davvero invitante (50 yuan!), contengono tutti i materiali presenti nell'edizione cartacea, essendo strutturata in 66 sezioni, contenenti in tutto circa 80.000 voci, per il ragguardevole totale di 126.400 milioni di caratteri e più di 50.000 illustrazioni. L'installazione è semplice e veloce, sempre che si disponga di una versione cinese di Windows, oppure di un applicativo, come Richwin, che emuli tale ambiente, o di Windows 2000, gestito in localizzazione RPC come ho avuto modo di spiegare nello scorso numero della rubrica. Effettuato il setup, quattro icone diventano disponibili per aprire rispettivamente l'applicativo di gestione della Da baike, una sorta di indice generale e i due file di aiuto relativi. 
Già un primo esame dell'indice generale rivela il pressapochismo del progetto e la sua totale mancanza di user-friendliness: le 78.000 voci disponibili sono elencate per ordine alfabetico (basato sulla pronuncia resa in pinyin) in una tabella comprendente 4 campi: intestazione della voce, eventuale corrispettivo in alfabeto latino (nella trascrizione ufficiale inglese per i termini non occidentali), locazione (numero del cd e titolo della sezione) ed eventuali informazioni aggiuntive. Una voce dello scarno menu e un'icona permettono di richiamare una finestra di dialogo per effettuare una ricerca. Nessuna possibilità di ricerca full-text, ma solo sulle intestazioni delle voci: in realtà esiste una sorta di indice prestabilito, perché, ad esempio, una ricerca sulla voce "Mao Zedong" non richiama solo le 4 righe della tabella in cui questa compare in modo esplicito (nelle sezioni "Storia", "Politica", "Faccende militari" ed "Economia"), ma anche altre 18. Occorre anche dire che per altri termini non si ottiene tanta abbondanza di informazioni.
La cosa più sorprendente è che niente e nessuno ci può condurre direttamente dall'indice generale ai contenuti dell'enciclopedia. In poche parole, una ricerca mi farà sapere in quale sezione trovo cosa mi interessa, il che, con un piccolo sforzo di fantasia, è possibile dedurre anche senza un indice generale siffatto. Insomma, un ipertesto che è la negazione del concetto stesso di ipertesto.
Aperta la finestra principale dell'applicativo per il browsing, si avverte subito come l'enciclopedia emuli in modo pedante il suo corrispettivo a stampa. La consultazione è concepita solo volume per volume e quindi, di volta in volta, accediamo unicamente alle informazioni presenti nelle singole sezioni, delle quali è messa a disposizione financo la copertina a colori del volume relativo. Un parziale riscatto va riconosciuto al progetto nella preparazione degli indici alle singole sezioni, che raggruppano i dati per ordine alfabetico, per categoria, per numero dei tratti e per trascrizione in pinyin; inoltre sono indicizzati anche i nomi stranieri (attenzione: per NOME e cognome…), i soggetti (zhutici), gli autori delle voci e le illustrazioni. Una ricerca sui soggetti è quanto più si avvicina ad una ricerca full-text, non essendo questi limitati solo all'intestazione delle voci. Così, la struttura ad albero dell'indice per categorie, pur nei limiti di un ossequioso rispetto della struttura originale dell'enciclopedia, può essere utile nello studio organizzato e riesce quasi a trasformare le singole sezioni in veri e propri manuali. 
La finestra di dialogo per la ricerca si apre solo se è già attivato uno degli indici e si basa esclusivamente su questo, senza lasciare nessuna possibilità di effettuare ricerche incrociate di alcun tipo, e quindi tanto meno con operatori booleani.
Pur ridimensionata dai limiti fin qui evidenziati, la versione su cd della Da baike, si dirà, rimane pur sempre uno strumento prezioso: avere a disposizione, pur con meccanismi automatizzati di ricerca ridotti all'osso, i contenuti di un'intera enciclopedia nei tempi veloci consentiti dal supporto non è cosa da poco. È vero, ma questo mette anche in evidenza come il supporto, di per sè, non sia sufficiente a migliorare un prodotto. Se un'edizione elettronica consente solamente una consultazione di tipo tradizionale, qualcuno vorrà allora evitare il fastidio di dover aprire il pc per leggere quello che in fondo non resta che un libro, e ricorrere invece, se già la si possiede, all'edizione a stampa, più elegante, più leggibile e inoltre emanante un buon profumo di carta. Le illustrazioni sono poi leggermente migliori a stampa che non nelle dimensioni minuscole della versione digitale. La consultazione sarà più lenta, ma la si può fare in poltrona…
Personalmente, avrei comunque consigliato l'edizione su cd, se solo non fossi rimasto spiacevolmente colpito dall'accanimento con cui i progettisti hanno cercato di impedire una qualsiasi utilizzazione - diciamo così - estensiva della Da baike. Il risultato di una ricerca non si può copiare negli "appunti" di Windows per riutilizzarlo in altri applicativi; incredibilmente non lo si può nemmeno stampare! Questo, in riferimento alle mie esigenze, limita notevolmente i modi d'utilizzo dell'enciclopedia: soprattutto non posso né disporre di buoni testi già digitalizzati per i miei corsi, né utilizzare Wenlin o altri dizionari "istantanei" per la lettura. 
In definitiva, con Zhongguo da baike quanshu guangpan disponiamo di un prodotto insoddisfacente che, pur avendo una pratica utilità come opera di consultazione, risulta continuamente irritante sia per la farraginosità dei meccanismi di ricerca, sia per la frustrante impossibilità di effettuare operazioni che dovrebbero essere del tutto normali per un applicativo di questo tipo. Nemmeno il basso prezzo d'acquisto può giustificare le gravi lacune che abbiamo evidenziato: si faccia un confronto con la raccolta dei primi 20 anni di Dushu, della quale ho parlato in questa stessa rubrica, per valutare come non sia certo il mantenimento dei costi l'obiettivo principale dei realizzatori della Da baike.
Fatta la legge…
Vorrei ora qui proporre una mia pratica soluzione per superare gli ostacoli frapposti dagli ideatori del prodotto testé presentato tra i testi contenuti nelle pagine dell'enciclopedia e chi volesse gestirli in modo autonomo. Beninteso, le indicazioni che seguono costituiscono solo un mero esercizio teorico e in nessun modo un invito ad infrangere i diritti di copyright detenuti dagli autori.
1. Innanzitutto, aperta la finestra che contiene il testo che ci interessa (una voce della Da baike), dato che si tratta appunto di un vero e proprio testo, e non di un bitmap, ancorché non editabile in alcun modo, modifichiamone l'aspetto. Alla voce di menu Xuanxiang (opzioni), scegliamo la sottovoce Ziti (tipo di carattere) e quindi Zhengwen (corpo del testo principale), scegliamo un font standard e una misura in punti piuttosto alta (24 andrà bene). 
2. Ampliamo al massimo la finestra (è meglio anche usare la maggior risoluzione possibile consentita dal nostro sistema video) e catturiamo la schermata, premendo Alt+Stamp.
3. In un qualsiasi applicativo di ritocco fotografico, salviamo l'immagine in bitmap così ottenuta, avendo cura di: a) selezionare la parte che ci interessa; b) mantenere la risoluzione; c) salvare il risultato in un file di formato standard (BMP o TIFF) in bianco e nero. L'operazione di cattura e salvataggio va ripetuta finché avremo a disposizione tutto il testo che ci serve. Le varie immagini possono essere poi montate insieme in un unico file (prima o dopo il salvataggio definitivo). A questo punto disponiamo di uno o più file a mappa di punti raffigurante/i del testo in cinese, con i caratteri aventi grossomodo le dimensioni che avrebbero se si fosse acquisita tramite scanner una pagina di testo ad una risoluzione di 300 linee per punto.
4. Con un applicativo per l'OCR4 da testi in caratteri cinesi semplificati possiamo ora ricavare dai file bitmap così ottenuti veri e propri e-texts, da editare, trasformare e stampare. Se non disponiamo di un programma per il riconoscimento dei testi, possiamo sempre stampare le schermate ottenute, il che corrisponde più o meno a fotocopiare, dall'edizione a stampa, le pagine che ci interessano.

MONDO CINESE N. 107, APRILE 2001

Note

1 Acronimo per Super Audio Compact Disk, nuovo standard per l'ascolto di musica in alta fedeltà.
2 Zhongguo da baike quanshu, Beijing - Shanghai, Zhongguo da baike quanshu chubanshe, 1982-1993: d'ora in poi verrà citata come Da baike, declinato al femminile.
3 Zhongguo da baike quanshu guangpan (1.1. ban), progetto generale di Dan Jifu e Zhang Zonghou, a cura di Xu Weicheng et alii, Beijing, realizzazione della Beijing Dongfang ding dianzi youxian gongsi per la Zhongguo da baike quanshu chubanshe, 2000.
4 Acronimo per Optical Chacater Recognition, operazione che consiste nel ricavare, tramite algoritmi molto complessi, testo e vero e proprio da "immagini" di pagine a stampa, quali vengono ottenute passando allo scanner un qualsiasi documento. In commercio sono disponibili vari applicativi specializzati per il riconosci-mento di testi in cinese, alcuni dati in dotazione a taluni modelli di scanner, altri acquistabili separatamente. Il più diffuso è probabilmente SharpEye, offerto gratuitamente in bundle con la versione 2000 di Twinbridge Chinese Partner: pur necessitando del noto programma cui è abbinato, funziona anche in Windows 2000, localizzazione RPC, previa installazione e apertura, appunto, di Twinbridge (che resta comunque inutilizzabile per l'input, come risaputo).

 

CENTRORIENTE - P. IVA 07908170017
Copyright Centroriente 1999-2023