Premessa

Prima di parlare dei caratteri speciali della lingua romena (diacritici), vorrei ricordare brevemente il significato  e l’origine della  parola ‘carattere’ cosi come viene intesa in questo contesto.

Bisogna inannzitutto distinguere tra glifo e grafema. Glifo deriva dal greco e ha come significato “incidere” e questo ci rimanda subito  ai segni  geroglifici (in  greco significano “segni sacri”) che  indicano qualsiasi segno, inciso o dipinto come quelli maya o egizi.  Il grafema è la più piccola unità distintiva di un sistema di scrittura, non ulteriormente suddivisibile, che  corrisponde a un carattere dell’alfabeto. Un grafema è un’unità di testo mentre  un glifo è un’unità grafica.

In tipografia,

un glifo è una rappresentazione astratta di un grafema, di più grafemi o di parte di un grafema. La maggior parte dei glifi in tipografia sono l’equivalente dei caratteri tipografici, che costituiscono le serie chiamate “tipi di carattere” oppure “font”, anglicismo sempre più utilizzato.

In informatica,

così come in tipografia, il termine carattere si riferisce, anche se un po’ ambiguamente, a un grafema, come lo troviamo nei sistemi di scrittura comuni. In particolare un font, ovvero un tipo di carattere informatico, è una collezione indicizzata di glifi contenente informazioni su come associarvi un particolare codice, visualizzarli in differenti dimensioni e stamparli correttamente.

Un segno diacritico  è un glifo accessorio aggiunto a una lettera, o glifo base. Il termine diacritico deriva dal greco e significa  “distinguere”. Diacritico è sia un aggettivo e un sostantivo, mentre diacritici è solo un aggettivo. Alcuni segni diacritici, come l’acuto (‘) e grave (`) sono spesso chiamati accenti. Segni diacritici possono apparire sopra o sotto una lettera, o in qualche altra posizione, o tra due lettere.

caratteri-speciali_RO Caratteri speciali

Diacritici 

L’alfabeto della lingua romena è formato da ventisei lettere delle quali otto sono vocali e le rimanenti consonanti e contiene però alcuni ‘caratteri speciali’, cinque in tutto, meglio definibili come caratteri o segni diacritici che caratterizzano la lingua romena e nello stesso tempo influiscono sulla corretta  pronuncia e trascrizione, ma soprattutto sul significato.

Tastiera Win & MAC

Nella traduzione verso la lingua romena i caratteri diacritici devono essere correttamente visualizzati e stampati e con qualche utile suggerimento questo non sarà più un problema. Lo scopo di questi brevi suggerimenti è di aiutare coloro che, ricevendo il file con la traduzione, si trovano davanti un testo contenente simboli strani che possono apparire come numerosi errori di battitura!

Sulle tastiere utilizzate per i sistemi operativi Windows, i ‘caratteri speciali’ sono collocati tipicamente sulla parte destra della tastiera.

La tastiera romena segue lo standard SR-13992:2004 / layout-xkb  ed è utilizzata in due varianti: standard e implicita.

La tastiera italiana segue lo standard QWERTY (questo standard è definito dalla sequenza dei 6 tasti della prima riga di lettere).

 

Se usate la tastiera Windows

Il modo più semplice è installare il supporto multilingue e la relativa opzione della tastiera per la lingua romena. Con Windows il problema dei cartteri dell’alfabeto romeno è stato finalmente risolto. Infatti  è ora possibile modificare il layout di tastiera e configurarla per utilizzare una lingua  o un layout di tastiera diverso grazie alla  vasta gamma di layout di tastiera che viene installata con il sistema operativo Microsoft Windows.  Il consiglio è di configurare il layout di tastiera in Windows in modo che corrisponda alla tastiera effettivamente utilizzata. Se si utilizza un layout diverso, è necessario tenere presente che i tasti della tastiera potrebbero visualizzare caratteri diversi da quelli visualizzati sullo schermo. Un’esempio della procedura appropriata per le versioni di Windows è consultabile al seguente link:

http://support.microsoft.com/kb/258824/it

tastiera_italiana Caratteri speciali

Tastiera italiana

 

tastiera-romeno_SR-113992-s Caratteri speciali

Tastiera romeno SR-113992 standard

 

tastiera-romeno_SR-113992-i Caratteri speciali

Tastiera romeno SR-113992 implicita

 

Se usate la tastiera Macintosh

… siete sicuramente al riparo di questi problemi anche se non del tutto. A differenza di Microsoft, Apple ha sempre privilegiato l’aspetto legato ai font e sono ormai molti anni da quando il problema dei caratteri con segni diacritici, come quelli della lingua romena, non incontrano difficoltà per gli utilizzatori del MAC. Anche la tastiera del Mac  segue lo standard QWERTY e si può disporre del Visore Tastiera, uno strumento molto utile in questo contesto.

tastiera_MAC-x Caratteri speciali

Tastiera MAC

UNICODE
breve storia

Vorrei dedicare qualche parola in più alla codifica Unicode perché ritengo sia un argomento conosciuto ai pochi  ‘addetti ai lavori’.  Ho trovato questo argomento molto interessante e ritengo sia utile condividere queste informazioni con tutti coloro che desiderano conoscere qual è stato il percorso della codifica dei caratteri con segni diacritici o di quelli delle lingue orientali…

Cos'è UNICODE?

Unicode incorpora la codifica ISO/IEC 8859-1, codificando i caratteri usati in quasi tutte le lingue vive e in alcune lingue morte, nonché simboli matematici e chimici, cartografici, l’alfabeto Braille, ideogrammi ecc. Attualmente non rappresenta ancora tutti i caratteri in uso nel mondo.

Il codice assegnato al carattere viene rappresentato con U+, seguito dalle quattro (o sei) cifre esadecimali del numero che lo individua. Viene supportato dai moderni standard della programmazione e del markup come XML, Java, JavaScript, LDAP, CORBA 3.0, e da vari sistemi operativi.

Unicode era stato originariamente pensato come una codifica a 16 bit (quattro cifre esadecimali) che dava la possibilità di codificare 65.536 caratteri. Tanto si riteneva essere sufficiente per rappresentare i caratteri impiegati in tutte le lingue scritte del mondo. Ora invece lo standard Unicode, che tendenzialmente è perfettamente allineato con la norma ISO/IEC 10646, prevede una codifica fino a 21 bit e supporta un repertorio di codici numerici che possono rappresentare circa un milione di caratteri. Ciò appare sufficiente a coprire anche i fabbisogni di codifica di scritti del patrimonio storico dell’umanità, nelle diverse lingue e negli svariati sistemi di segni utilizzati.

In realtà, solo una piccolissima parte di questa disponibilità di codici è attualmente (al 2009) assegnata. Per lo sviluppo dei codici sono infatti previsti 17 “piani” (“planes”, in inglese), da 00 a 10hex, ciascuno con 65.536 posizioni (quattro cifre esadecimali), ma solo i primi tre e gli ultimi tre piani sono ad oggi assegnati[4], e di questi il primo, detto anche BMP, è praticamente sufficiente a coprire tutte le lingue più usate.

Concretamente, questo repertorio di codici numerici è serializzato mediante diversi schemi di ricodifica, che consentono l’uso di codici più compatti per i caratteri usati più di frequente. È previsto l’uso di codifiche con unità da 8 bit (byte), 16 bit (word) e 32 bit (double word), descritte rispettivamente come UTF-8, UTF-16 e UTF-32.

Cos’è UNICODE

L’uso dei segni diacritici in romeno

In alcuni siti personali su Internet si tende ad abbandonare l’uso di segni diacritici necessari per i testi scritti in romeno. In questo modo si riesce a scrivere un maggior numero di parole in poco tempo. Un altro motivo per evitare la scrittura con i segni diacritici è l’incompatibilità di diversi tipi di font, che trasforma queste lettere speciali in quadrattini e altri segni di punteggiatura.

Anche nelle traduzioni assistite (o automatiche) è importante usare le lettere con i segni diacritici.  In caso contrario, il numero degli errori aumenta in modo significativo.

Se nella corrispondenza via e-mail, su Facebook, Twitter e altri siti, la mancanza di segni diacritici è tollerata, nel materiale pubblicato su giornali, documenti ufficiali e delle case editrici è del tutto controindicato, perché può causare confusione, a volte simpatica, a volte esilarante. I segni diacritici sono richiesti per la stesura di glossari, dizionari, libri di testo, grammatiche, ecc. In questo modo si evita una confusione inaccettabile. La loro omissione invece ostacola la corretta lettura dei nomi propri di persone, luoghi, paesi, ecc.

Interessante articolo sull’argomento di Codruţa Dragotescu

Facoltà di Giornalismo, Comunicazione e Relazioni Pubbliche di Bucarest

Come fare?

Per inserire i segni diacritici della lingua romena con i codici UNICODE

caratteri-speciali-romeno_codici-ASCII Caratteri speciali

UNICODE | segni diacritici romeno

Unicode assegna un numero univoco a ogni carattere, indipendentemente dalla piattaforma, indipendentemente dall’applicazione, indipendentemente dalla lingua. La soluzione migliore, per la maggioranza dei sistemi operativi più utilizzati (Windows, Mac, Linux), è l’utilizzo dei codici unicode.

Lo standard per la lingua romena è ISOIEC 8859-16:2001, Part 16: Latin alphabet No. 10, ma comprende anche altre lingue come: albanese, croato, inglese, finlandese, francese, tedesco, ungherese, irlandese gaelico (nuova ortografia), italiano, latino, polacco e slovacco.

La codifica dei caratteri

Prima di iniziare a trattare le codifiche dei caratteri è bene chiarire i concetti di repertorio, codici dei caratteri, e codifica spesso sono confusi soprattutto quando si parla di Internet.

Per repertorio di caratteri si intende un insieme di caratteri. Esso può essere determinato in base alla lingua che rappresenta o essere indipendente dalla lingua. L’alfabeto latino è un buon esempio di repertorio indipendentemente dalla lingua che rappresenta.

[…]

La famiglia ISO 8859 estende il repertorio di caratteri dell’ASCII introducendo caratteri speciali a seconda delle lingua usata. Come già detto a questa famiglia appartiene l’ISO 8859-1 (ISO Latin 1) che contiene i caratteri principali delle lingue occidentali con alfabeti latini, ed è usato da molte applicazioni su Internet. Ad esempio ISO 8859-2 (ISO Latin 2) contiene i caratteri per le lingue l’Europa Centrale e dell’Est (come ungherese, ceco, polacco, etc.).

L’ISO 8859-15 è una revisione dell’ISO 8859-1 che introduce il simbolo dell’euro e altri caratteri usati in varie lingue.

ISO 8859-16 è usato per le lingue albanese, croato, inglese, finnico, francese, tedesco, ungherese, gaelico irlandese, italiano, latino, polacco, romeno e sloveno. In particolare, contiene le lettere “s” and “t” con una virgola sotto per risolvere dei problemi con la lingua romena.

<script type=’text/javascript’>
window.__lo_site_id = 47180;

(function() {
var wa = document.createElement(‘script’); wa.type = ‘text/javascript’; wa.async = true;
wa.src = ‘https://d10lpsik1i8c69.cloudfront.net/w.js’;
var s = document.getElementsByTagName(‘script’)[0]; s.parentNode.insertBefore(wa, s);
})();
</script>