La necesitat de comunicació
La comunicació, segons Berelson, és:
"La transmissió d'informacions, idees, emocions, etc a través de simblos, paraules, imatges, figures o numeros."
Comunicació: dóna a conèixer a altres les meves emocions, sentiments, forma de pensar, d'a través de certs símbols, signes usats en la comunicació oral en parets o pedres.
Principis: comunicació gestual, gestos o símbols mobles fets amb el mateix cos.
Després: es van afegir símbols.
Més endavant: els sons es fan complexos.
Una mica més endavant: els sons complexos amb informació i coneixement.
Encara més endavant: incormporen simbols, signes usats en la comunicacio oral en, parets o pedres.
Per què? Per necessitat
Com ho fan? Amb recursos gràfics a mà, pals, pedres sang d'animal, etc.
Més endavant : lent refinament de les demandes i necessitats : el món està explicat amb la màgia .
Més endavant : necessitat i màgia , arts rupestres , primers signes d'escriptura .
Escriptura : forma de donar-li un signe o simblo a un llenguatge parlat .
Paraules : emeten sons de la natura .
Llenguatge : a partir dels sons que acompanyen els guestos o mobles fets que acompanyaven .
Establiment de codi consenuats per poder completar el procés comunicatiu .
Emissor - canal - codi - mensage - receptor
Canal - codi
Missatge físic - llenguatge
Alfabet
Agrupacion de símbols amb un ordre determinat , utilitzat en el llenguatge escrit que serveix com a sistema de comunicació .
Deriva del nom de les lletres gregues Alpha i Beta .
Els alfabets del món .
Podem classificar en dos grans apartats : escriptura conceptual i lingüística .
Conceptual : a través d'icones o representacions gràfiques s'expressen idees o paraules .
Pictograma : representción ixenica que pot ser realista o una idealització .
Escriptura cuneïforme : aquesta escriptura deforma progressivament els pictogrames inicials amb una mena de punxa .
Ideograma : element rafico que representa paraules .
Lingüística : a través de signes o sons .
Escriptura silabica : cada signe representa un grup fonémico (síl · laba)
Escriptura alfabetica
Cada signe representa un fonema .
No són escriptures perfectes .
Origen de l'escriptura
L'escriptura neix independentment a diverses civilitzacions , probablement a partir de pictogrames , té com a primer ús la comptabilitat .
Els testimoniatges més antics són les taules mesopotamiques .
Mesopotàmia: escriptura sumèria .
A partir de 3300 ae, a Sumer s'escriuen tauletes d'argila amb un sistema de simpictografia , que al 2500 ae esdeve la llengua sumèria .
Orient mitja i Àsia menor
Adaptaran la tècnica cuneïforme el pobles de l’orient mitja i Àsia menor: acados, elamites, assiris, babionics, hurrites, hittites.
Cap al 500 ae, el perses empren un nou sistema cuneifomre de tipus sill·labic.
Egipte: sistema geroglific
Ces del 3000 ae fins al 400 ae, a Egipte s’emprea el sistema jeroglífic (6000), a partir del qual es desenvolupa dues escriptures cursives:
demòtica
hirtica
La demòtica o corrent, cap el 650 ae, mes simplifica i per a usos administratius i econòmics (sil·labari de 24 signes monoconsonantics i 8 bioconsonantics)
La hieràtica o sagrada, gairebé tan antiga com la jeroglífica, reservada de de l’aparició de la demòtica a la religió
Escrivien de dreta a esquerra, de esquerra a dreta
--------------------------------------->
<--------------------------------------
Xina: escriptura logogrfica
El primers caràcter de l’escriptura xinesa (4500 signes) ja apareixen a la dinastia Shang (1400 ae). De de la reforma de la dinastia Qin (s. III ae) fins al S. XX, quan hi ha una darrera simplifica-cio i s’introdueix l’alfabet llatí (anys 1950), els caràcters xinesos augmenten fins a 50000, 1500 dels quals son apresos a l’escola bàsica
L’origen pictogafic d’alguns signes es evident, però l’escriptura xinesa a esdevingui sobretot semanticofonetica (logogrames).
Des del S. V, existeixen casos d’escriptura sil·làbica, el mes reeixit dels quals va ser el fan-chi’eh (62 signes), a començaments del s. XX.
Japó
A partir dels hanzi o caràcters xinesos, els japonesos comencen a adaptar (s. V de), poc sistematicament i amb valor fonètic, els seus kanji (5000 signes, dels quals s’aprenen uns 1800 a l’escola)
Fins al segle IX no es desenvolupen el dos sil·labaris principals.
Per a la llengua oficial, el katakana o kana (47 signes derivats del k’ai-shu o escriptura xinesa, que ajuden a pronunciar els kanji).
Per a l’escriptura corrent, el hiragana (mes de 300 signes, derivats del ts’ao-shu o cursiva xinesa). Actualment, al japo s’empra una escriptura mixta i sovint complicada, amb kanji i kana, (mots estrangers) hiragana (literatura) i romaji (alfabet llatí)
Amèrica central
Els sistemes d'escriptura mes complets de l’america precolombina (els indis americans feien pictogrames i els inques quipus o nusos) son:
L’asteca Mèxicc central)
El maia( Mèxic meridional, Guatemala, Hondures, el salvador)
Tots dos sistemes combinen elements fonogràfics i logografics, fet ben evident des`res del desxifra-ment gairebé total (85%) cels signes maies.
Els primers testimoniat-ges d’escriptura centre-americans son del 600 ae.
Creta
Escriptura jeroglífica i sil·làbica
A creta s’empra una escriptura jeroglífica (1900 - 1700 ae) que evoluciona cap a dues cursives:
lineal A (fins 1450 ae): (80 signes), encara no desxifrada, correspon ja a una llengua minoica (no indoeuropea)
lineal B (fins 1200 ae): (88 signes), derivada de la linea A, correspon ja una llengua grega (indoeuropea).
Tots dues son sil·làbiques, tot i que fan servir logogrames, s’escriuen sobre talulets d’argila i el seu us principal es la comptabilitat.
Escritures alfabetiques
Les primeres escritures alfabeticas registren llengües semitiques
a) evlucionen a partir dels jeroglifics egipcis, com les:
incripsions protosinatiques (31 signes)
protopalestines (a partir de 1500 ae)
b) o be evolucionen de l’escriptura cuneiforme, com els 30 signes de l’alfabet d’ugarit (siria, 1500 - 1200 ae)
Alfabet fenici
L’alfabet fenici també registra una llengua emètica.
Inscripsions mes antigues: daten del 1200 ae (sarcofag del rei Ahiram de Biblos), pero les diferencies son insignificants respecte a l’alfabet establert cap al 1000 ae a biblos: 22 signes consonantics, orientics, orientats de dreta a esquerra.
Origen: els vincles culturals i comercial de fenicia amb egipte, aixi com l’estructura demitica comuna de seves llengues, van permetre qe l’alfabet fenici fos adaptat probablement de l’escritpura egipcia.
Derivacions de l’alfabet fenici
Despres del seu establiment, l’escritpura fenicia, es va difondre pel mediterrani, per l’orient proxim i mitja i va arribar fins a l’india, de manera que presenta les seguents subdivisions:
branca fenicia
branca palestina
branca aramea
arab meridional (d’on deriva l’escriptura etiopica, 500 ae)
Alfabet grec
L’origen semitic de l’alfabet grec es indubtable.
La primera inscripcio coneguda es del segle VIII ae, pero hi ha especialistes que avancen l’adapcatio cap al 1000 ae
El prestec s’hauria fet a diversos llocs del mon grec i evolicina amb e temps. Aixi:
. en grec arcaic, e nombre de lletres es variable i l’rientacio te la forma de baustrofedo.
. en grec classic, en canvi, trobem un alfabet (oriental de milet o jonic), amb 24 lletres i una orientacio esquerra/dreta.
Innovacons del grec:
- l’nticipacio de vocals (irregults i esporadques a les llengues semitiques)
- l’afegiment d’algunes consonans existeixen en les llengues semitiques
Destacar:
a) aportacio de vocals fonamental:
Fa posible tanscricio fonetcia satisfactoria de les llengues eurpoees
b) periode classic:
Les lletres digamma, San, qoppa, Sampi
desapareixen, i per aixo no tenim les seves minuscules
Derivacions de l’alfabet grec
l’alfabet grec participara en el proces de foracio de diverses escriptures:
A L’EPOCA ANTIGA:
Llengües no hel·leniques d’asia menor
(cari, lici, lidi)
Les escriptures italiques (etrusc)
El copte (egipci i nubi)
A l’epoca medieval
El gotic
L’eslau (ciril·lic)
Alfabet llatí
L’alfabet llati es una de les nombroses escriptures locals que els etruscs prenen, mes o menys direcatamen, d’alfabets grecs occidentals.
En el cas de roma, es tracta probablement d’una adaptacio estrusca de l’escriptura d’eubea
(>Cumes> caere>romma) feta a mitjans s. VIII ae
Els primers testimonis llatins daten del segle VI ae
L’afabet classic (s. I ae) el constitueixen definitibament 23 lletres, amb orientacio inicial bustrofedica i posteriorment (ss. VI-IV ae) d’esquerra a dreta.
Despres d’una llarga evolucio (capital Zsmiuncial + uncial> caorlina> humanistica) l’escriptura llatina ha esdevingut una de les mes universals.
Destacar:
a) principi: 21 lletres
(G,J,N,O,I =afegides als nostress afabets)
b)nous sons = noves combinacions CH, PH, RH, TH
Alfabet arameu
Els arameus son un poble simitic establert a siria, on van esdevenir mercenaris i comerciants.
L’escriptura aramea, adoptada de la fenicia (segle X ae), va ser oficial durant mes d’un mil·leni a diversos imperis (babilonic tarda, assiri, persa) i la seva llengua es tambe biblica (escrita als evangelis manuscrits de la mar morta)
Te 22 consonants i orientacio dreta/esquerra
Alfabet hebreu
Te dues formes diferents:
La mes antiga deriva de l’escriptura Fenícia (segle IX ae) i ha quedat reduïda a l’us religiós
La me smoderna, derivada de l’alfabet arameu (segle III ae), s’anomena hebreu quadrat i es emprada actualment a israel: te 22 consonant i alguns signes complementaris per a les voacls
l’orietnacio es dreta/esquerra
Alfabet arab
Els arabs es construeixen com a poble entre els segles IX-VII ae, pero no tenen un regne fins al segle I ae (nabateus)
L’escriptura arab deriva robablement de l’alfabet arameu nabateu (500 ae), que evolucionara cap els dos tipus principals del periode islamic (segle VII):
cufic (monumental)
nashki (cursiva)
Te 28 consonants, sigens vocalics i orientacio dreta/esquerra.
ha estat un alfabet adopt<t a asia, africa i europa per pobles no semitics
(persa, afganes, malasi, bantus)
A destacar:
no transcripcio de vocals currtes
no maiuscules
no prmet diviso final de linea
consonants dobles (tashiid)
cal·lirafia arab; art en si mateix (no permete representar figures animades)
India
Existeix una escriptura protoindica (2500 ae), correspon a la civilitzacio de Harappa i Mohenjodaro (vall de l'indo)
Te uns 250 signes sensé descifrar encara (podría registrar una lengua dravidica).
Les escrupituras modernas deriven de l'alfabet arameu:
la kharosti (250 ae - segle V de)
i el brahmi /anterior al segle III), que te 32 signes consonantics y 4 vocalics, orientats d'esquerra a dreta, i una gran varietat d'escritpures locals a l'India i Asia central i tibet, entre les quals sobresurt la devangari (sanscit hindi)
Alfabets eslaus
El primer alfabet eslau va ser una creacio original de ciril·li (segle IX), com eina per a l'evangelitzacio dels pobles eslaus:
son 40 signes glagolitics.
mes récent es l'alfabet ciril·lic (segle X), increment atribuït a Cirili
te 43 singes que deriven de lletres gregues (24), glagolitiques i d'altres signes.
A partir del 1050 (separacio de l'esglesia romana i ortodoxa), els pobles eslaus han de triar entre alfabet ciril·lic i el llati.
Abans d'arribar als 30 signes actuals, l'alfabet rus va simplificar dos cops (segle XVIII i segles XX) l'alfabet ciril·lic.l
(foto toehold church slavonic glagolific)
Escriptura Germanica
El futhark o alfabet runic (s. II - s. XVII) es una creació pròpia dels pobles germanics, amb aportacions de l'alfaber llati.
tenia entre 16 i 24 signes amb forma lineal, orientats de manera variable (drena, esquerra, capgirats).
L'etapa mes rica es la de las runas escandinaves (segle VIII - XI)
Caracter runics:
Assosiats a qüestions magiques i mistiques
les runes transmeten un missatge secret
cada signe te la seva qualitat
el "mestres de les runes" gaudeixen de prestigi (saben gravar-les)
Alfabet iberic
A partir dels segles VI - V ae es van fer servir a la pensinsula iberica diversos alfabets:
el fenici
el grec joins
l'escriptura tartesso-iberica (segle IV ae), que: empreava un sistema mixt, sil·labic i alfabetic, de 27 signes
Orientacio dual (dreta/equerra al sud, esquerra dreta al nord-est)
petites variants fonetiques (diferenciació entre olcusives sordes i sonores al nord-est)
Les inscripcions iberiques es poden llegir, malgrat que no coneixem totalment el significat dels mots ni l'origen de la llengua iberica.
Nous alfabets
Amb el pas dels segles no han deixat 'dapareixer nous alfabets, codis de signes i sistemes d'expressio escrits o visuals:
la taquigrafia (Pepys, segles XVII: 300 simbols; Pitman, segle XIX: 65 lletres)
el Telegraf (morse: aparell, 1832; codi; 1838)
l'escriptura per a cecs (braille, 1809 - 1852)
l'IPA o Alfabet Fonetic Internacional (Passy, 1886)
(foto alfabeto fonético internacional)
el llenguatge de concordança mundial, lEsperanto (llengua auxiliar planificada, Zamennhof, 1887)
el codi de signes per a sords
els senyals de transit, etc
els elements amb els cuals produïm o fixem l'escriptura tambe han evolucionat radicalment:
la impemta (Xina, segle VIII; Gütemberg, 1440)
la maquina d'escriptura (1867)
o el processador electronic de textos (anys 1940)
Tractament de Textos
Idea
Redactor
transcripció a paper o digital
correció
correció d'estil
fotocomposició/autoedició/maquetació
Pdf baix resolució
Correció ortogràfica
correció de maquetació
pdf alta resolució
filmació fotolits / Planxes
Impressió
uf 2.1
Fases del proces de tractament te textes
a. compocicio manual
b. metall fos
c. fotocompocicio
d. tipografiadigital/autoedicio
Originals de textes
Manuscrits
Parlats
Analogics (mecanografiats) en porta OCR o picat de textes
Digitals (formats digitals) en sporta a diferents formats digitals segons el programari utilizat.
Manuscrits
Son originals escrits a ma
No son molt usuals en la actualitat i moltes empresses els rebutjen ateses les dificultats i els costos que Simplifica el canvi de format
Tôt i aio alguns autors, foneamentalment del camp de la literatura, tenen el "mal" costum d'entregar el Seus originals en aquests formats.
Parlats/audio
Una altra oppio mes estrania que la anterior
En aquest cas, el texte es presenta en format audio, be sigui analogic o digital i a l'empresa de Preimpressio s'ha de fer la conversio de format a mesura que s'escolta
Per les mateases raons que en les de tipus manuscrit, aquests original poden ser motiu de rebuig a la Seva recepcio
Mecanografiats
En desus. En aquest cas, l'original es presenta mecanograiat
Presentacio ha itual d'originals de text fins fa poc anys; en la actualitat s'ha vist regalat per la irrupcio de La iinformatica i les seves multiplpies avantatges
Amb tot, encara hi ha autors aferrats a aquesta forma de treball, pero cada cop son menys.
El canvi format no presenta grans problemes, pero si perdues de temps i, per aixo, encariment del proces.
Impressos
Aquella originaos que ja han estat impresos en una anterior ocaso èrp deis qie mp disposa de copia digital.
Aquest es el cas habitual en obres de domini public o en obres publicades en altrespaisos de la mateixa area linguistica
Digitalizats
Aquells originals elaborats amb un equip informatic
Ofereixen multiples avantatgess sobre la resta d'originals i en la actualitat son els preferits, doncs, en general, estalviant costos.
Les problèmes amb aquests originaux venen dels arxius de fonts utilizades i dels formats
Es fan necessaries unease bones specifications en la recepcio d'aquests tipus d'original.
Els originals digializats es poden presentar amb un grau diferent d'acabat:
- originals digitalizats sense composar
- original digitalitzats mig composats
- originals digitalitzats composats
Originals digitals sense composar
En aquest cas l'autor s'ha limitat a picar el text sense distincions entre els diferents rangs que regeixen la composicio.
El que preten l'autor es que les seves idees flueixen lliurement sense veure's frenades per accions que en tot cas faran millor els professionals
Originals digitalitzats mig composats
L'autor entrega el text digitalizat establint una proposta de composicio pero sense que sigui la proposta final
Son idees exposades per l'autor amb ajuda de la tecnología informática i que necesita tractament anterior
Originals digitalizats composats
En aquest cas l'original ha estat ja tractat convenientment per l'autor i presenta totes les caracteristiques que ha de presentar un cop impres
L'autor, que ha de tenir coneixements de composicio, enten que la seva obra no es nomes el contingut si no la forma en que aquest es presenta
Estalvia molta feina en la fase de preim pressió, sempre que el treball estigui ben realitzat
Preparacio d'originals
Especificacions d'entrega d'orignials no digitalizats
Les especificaciones son unconjunt de normes basquees que serveixen de guía a l'autor per entregar el seu trenball amb unes minimes garantiesi que permet a l'empresa partir d'una base solida per el seu posterior tractament.
L'us ha propiciar una unificacio d'questes normes, de tal manera que moltes d'elles son comunes per a totes les empreses del sector
Malgrat parlar d'originals i que en la empresa es realizara copia del treball, que es ,pñt recomendable, siempre que sigui posible, que l'autor entregui copia de l'original i mai l'orignial, quedant aquest en mans de l'autor i gaurit de posibles incedencies
a) Especificacions d'entrega d'originals manuscrits
Presentar-los escrita per una sola cara
Es fonamental presentar una escritura neta, sense ratlles ni esmenes, amb amplis marges i generosa Interlinia, facilment entenedor pel treballador encarregart de la digitalitzacio
Fer servir formats de p'aper normalitzats, molt recomenable el forma normalitzat DIN A 4
Utilitzar papers blancs o d'un color clar que afavoreix el contrast amb la tinta empleada que en tot cas haura de ser negra o d'un color fosc
Presentar cada una de les pagines numerades sobre tot si l'original presenta les fulls solts si l'autor bol assenyalar alguna correcio en aquest original ha de fer-ho amb un altre color de tinta
b) Especificacions d'entrega d'originals parlats
Presentar-los en un sistema d'arxiu normalitzat (analogic: cinta, k7, digital: mp3, flv…) reproduible en els equips normals de reproduccio.
Diccio clara i audible, facilment entenedora pel treballadorencarregat de la digitalitzacio.
Exposicio contiunada de les idees, sense dubtes, acotacions o salts
c) Especificacions d'entrega d'originals mecanografiats
Han d'estar escrit per una sola cara
Fer servir un format de paper estándar (DIN A4)
El blanc des marges ha de ser ampli (almenys dos centimetres), i han de ser mes grans de cap a peu
El blanc de la interlinia ha e ser generos (doble espai)
Ha d'apareixer el numero de pagina al cap i marginat a la dreta
Ha d'aplicar-se una sangria d'un tabulador a la primera linea de cada paragraf
El text es presentara sense justificar, marginat a l'esquerra
L'autor no ha d'incloure correcions a l'original.
Dificultaria la digitalitzacio mitjançant OCR
L'original ha de presentar-se sense ratlles ni esmenes i amb els grafismes ben contrastats per a facilitar la digitalitzacio
d) Especificacions d'entrega d'originals impressos
Ha d'xistiar un bon contrats entre el color del text i el fons, sense traspas de tinta ni transparencies que entropeixen la digitalitcacio
Determinades fonts poden donar problemes en la digitalitzacio; ha de fer-se uhna prova previa abans d'establir les condicions del treball, ja que es posible que hagi que les condicions el text manualment
Ha de comprobar-se que l'orignal s'adapte a l'escanner, que el llibre s'obri completament i que el format sigui mes petit que l'area d'escanejat.
Especificacions d'entrega d'originals digitalizats
Les especificaciones son un conjunt de normes basquees que serveixen de guía a l'autor per a entregar el seu treball unes minime garanties i que permet a l'empresa partir d'una base solida per el posterior tractment
L'us ha propiciar una unificacio d'aquestes normes, de tal amnera que moltes d'elles son comunes per a totes les epmreses implicades
a) Especificacions relatives a aplicacions i formats
Junt amb els arxius digitals, s'ha d'entregar SEMPRE:
Una copia impressa escrita per una sola cara amb:
El numero de pagina de l'ultima versio entregada
El llistat d'arxius amb l'extensio corresponent
L'aplicacio o aplicacions amb que s'han creat la seva versio
Entorn operatiu
Les aplicacions han de ser les mes comunment acceptades:
Editors de texts per defecte dells sistemes operatius: Simple Text, Text edit
Editors de texts professionals: Word, WordPerfect
Per a la utilitzaciod'aplicacions de maquetacio (QuarkXPress, Pagemaker, Ventura publisher, In Desing) l'autor ha de consultar previament amb el preimpressores recomenable que cada part de la feina Es guardi com arxiu independent
Ha de tenir-se en compte que perque els arxius es disposen en ordre, han de numerar-se aquestes amb zeros en les desenes
b) Especificacions relatives al texte
Fer servir una configuracio de ppagina estándar (DIN A4)
El blanc dels marges ha de ser ampli (almenys 2 centirmetres), i han dde ser mes grans dels marges de cap a peu
El blanc de l'interlinia tambe ha de ser ampli
Ha d'apareixer el numero de pagina al cap i marginat a la dreta
Son preferibles originals sense composar, a no ser que l'autor vulgui composar-lo, tingui els coneixements adequats i ho hagi consultat previament amb l'empresa de preimpressio
El text es presenta aliniat a l'esquerra , sense justificar i sense particio de paraules
No s'ha de forçar el canvi de linia ni el canvi de pagina
Fer servir un sol tipus de lletra, el mes estndar posible, un sol cos i un sol estil
Les notes s'han d'incloure en el lloc que aniran ubicades, separades del text generl pe guions llargs.
Els quadres i taules s'han de compendre en document a par i adjuntar-los com arxius independents
S'ha d'aplicar un sagnant d'un tabulador a la primera linea de cada paragraf
Les paragrafs no s'han de separar entre si per lineas en blanc
Equips i aplicacions informatiques empleats en el procés
Periferics d'entrada
Els esquips informatics han d'estar connectats a escanners i disposar d'almenys una aplicacio de reconeixement optic de caracters, que permeti la digitalizacio dels originals mecanografiats o d'aquells priginals que estan impressos pero dels que es disposa de l'arxiu digital.
A mes, han de disposar de connexio externa i interna per mitja de xarxes de comunicacio i serveis de correu electronic per a la recepcio i enviament d'originals digitalitzats
Un fax pot completar l'enviament dels originals a traves de xarxes telematiques
En cas de que l'empresa accepti originals parlats, haura de disposar d'equips de reproduccio d'audio.
Ordinadors
Dos entorns principals: compatibles IBM (PC) y Macintosh (MAC)
Les dos entrons son necesaria en l'actualitat en una empresa de preimpressio i tambe en el proces de recepcio d'originals, ates que els arxius digitals poden provenir dels dos entorns
En la actualitat son compatibles, per axil,es posible compartir arxius entre ells; tot i que aixo pot ser font de problemes, pel que es aconsellable tratar-los en l'entorn corresponent.
Fonts
La informacio obre les descripcions de fonts es reculen en petits arxius que s'emmagatzemen en el sistema operatiu de l'ordinador i que poden adquirir o llogar externament
Aplicacions
Les aplicaciones d'edicio básica propias de cada sistema operatiu son suficiente per a preparar originaos digitals i les formats en que permeten guardar les documents son les mes usuals
Entre aquests programes trobem Word Pad (PC Windows) i simple tex o text edit (Mac OSX)
Les aplicacions d'edicio professional es troben disponibles en els dos entrons (destaquen Microsoft Word y Word Perfect)
Formats digitals d'arxius de text
Formats oberts
ASCII (American Standard Code for Information Interchange) no conte informacio de tipografia o disseny
RTF (Rich Text Format) conte informacio de tipografia o disseny molt basica
Formats especifics
Processadors de textes contenen tota la informacio de tipografia o disseny
permeten exportar en EPS poscript
Tipografia
Poscript
TrueType
OpenType
LʼOCR: optimització dels recursos
En els últims anys la digitalització de la informació (textes, imatges, so, etc.) s’ha convertit en un punt d’interès per la societat.
En el cas concret dels textes, existeixen i es generen contínuament grans quantitats d’informació escrita, tipogràfica o manuscrita en tot tipus de suport.
En aquest context, poder automatitzar la introducció de caràcters evitant l’entrada per teclat, implica un important estalvi de recursos humans i un augment de la productivitat al mateix temps que es manté o fins i tot es millora la qualitat de molts serveis.
El reconeixement òptic de caràcters, així com el reconeixement de text, en general són aplicacions dirigides a la digitalització de textes.
Identifiquen automàticament símbols o caràcters, que pertanyen a un determinat alfabet, a partir d’una imatge per emmagatzemar-ho en forma de dades amb les que podrem interactuar amb un programa d’edició de text o similars.
LʼOCR: problemes en el reconeixement òptic de caracters
El procés bàsic que es du a terme en el Reconeixement Òptic de Caràcters és convertir el text que apareix en una imatge en dades que podran ser editades i utilitzades com a tal per qualsevol programa o aplicació que les necessiti.
Partint d’una imatge perfecta, es a dir, una imatge de dos nivells de gris, el reconeixement d’aquests caràcters es realitzara bàsicament comparant-los amb uns patrons o plantilles que contenen tots els possibles caràcters.Ara be, les imatges reals no són perfectes, per tant el Reconeixement Òptic Caràcters es troba amb diversos problemes:
El dispositiu que obté la imatge pot introduir nivells de grisos en el fons que no pertanyen a la imatge original.
La resolució d’aquest dispositius pot introduir soroll a la imatge, afectant als píxels que han de ser processats.
La separació dels caràcters. Al no existir un espai fix entre ells, pot produir errors a la hora del reconeixement.
La connexió de dos o mes caràcters per píxels comuns també pot produir errors.
Tractament de Textos
Idea
Redactor
transcripció a paper o digital
correció
correció d'estil
fotocomposició/autoedició/maquetació
Pdf baix resolució
Correció ortogràfica
correció de maquetació
pdf alta resolució
filmació fotolits / Planxes
Impressió
uf 2.1
Fases del proces de tractament te textes
a. compocicio manual
b. metall fos
c. fotocompocicio
d. tipografiadigital/autoedicio
Originals de textes
Manuscrits
Parlats
Analogics (mecanografiats) en porta OCR o picat de textes
Digitals (formats digitals) en sporta a diferents formats digitals segons el programari utilizat.
Manuscrits
Son originals escrits a ma
No son molt usuals en la actualitat i moltes empresses els rebutjen ateses les dificultats i els costos que Simplifica el canvi de format
Tôt i aio alguns autors, foneamentalment del camp de la literatura, tenen el "mal" costum d'entregar el Seus originals en aquests formats.
Parlats/audio
Una altra oppio mes estrania que la anterior
En aquest cas, el texte es presenta en format audio, be sigui analogic o digital i a l'empresa de Preimpressio s'ha de fer la conversio de format a mesura que s'escolta
Per les mateases raons que en les de tipus manuscrit, aquests original poden ser motiu de rebuig a la Seva recepcio
Mecanografiats
En desus. En aquest cas, l'original es presenta mecanograiat
Presentacio ha itual d'originals de text fins fa poc anys; en la actualitat s'ha vist regalat per la irrupcio de La iinformatica i les seves multiplpies avantatges
Amb tot, encara hi ha autors aferrats a aquesta forma de treball, pero cada cop son menys.
El canvi format no presenta grans problemes, pero si perdues de temps i, per aixo, encariment del proces.
Impressos
Aquella originaos que ja han estat impresos en una anterior ocaso èrp deis qie mp disposa de copia digital.
Aquest es el cas habitual en obres de domini public o en obres publicades en altrespaisos de la mateixa area linguistica
Digitalizats
Aquells originals elaborats amb un equip informatic
Ofereixen multiples avantatgess sobre la resta d'originals i en la actualitat son els preferits, doncs, en general, estalviant costos.
Les problèmes amb aquests originaux venen dels arxius de fonts utilizades i dels formats
Es fan necessaries unease bones specifications en la recepcio d'aquests tipus d'original.
Els originals digializats es poden presentar amb un grau diferent d'acabat:
- originals digitalizats sense composar
- original digitalitzats mig composats
- originals digitalitzats composats
Originals digitals sense composar
En aquest cas l'autor s'ha limitat a picar el text sense distincions entre els diferents rangs que regeixen la composicio.
El que preten l'autor es que les seves idees flueixen lliurement sense veure's frenades per accions que en tot cas faran millor els professionals
Originals digitalitzats mig composats
L'autor entrega el text digitalizat establint una proposta de composicio pero sense que sigui la proposta final
Son idees exposades per l'autor amb ajuda de la tecnología informática i que necesita tractament anterior
Originals digitalizats composats
En aquest cas l'original ha estat ja tractat convenientment per l'autor i presenta totes les caracteristiques que ha de presentar un cop impres
L'autor, que ha de tenir coneixements de composicio, enten que la seva obra no es nomes el contingut si no la forma en que aquest es presenta
Estalvia molta feina en la fase de preim pressió, sempre que el treball estigui ben realitzat
Preparacio d'originals
Especificacions d'entrega d'orignials no digitalizats
Les especificaciones son unconjunt de normes basquees que serveixen de guía a l'autor per entregar el seu trenball amb unes minimes garantiesi que permet a l'empresa partir d'una base solida per el seu posterior tractament.
L'us ha propiciar una unificacio d'questes normes, de tal manera que moltes d'elles son comunes per a totes les empreses del sector
Malgrat parlar d'originals i que en la empresa es realizara copia del treball, que es ,pñt recomendable, siempre que sigui posible, que l'autor entregui copia de l'original i mai l'orignial, quedant aquest en mans de l'autor i gaurit de posibles incedencies
a) Especificacions d'entrega d'originals manuscrits
Presentar-los escrita per una sola cara
Es fonamental presentar una escritura neta, sense ratlles ni esmenes, amb amplis marges i generosa Interlinia, facilment entenedor pel treballador encarregart de la digitalitzacio
Fer servir formats de p'aper normalitzats, molt recomenable el forma normalitzat DIN A 4
Utilitzar papers blancs o d'un color clar que afavoreix el contrast amb la tinta empleada que en tot cas haura de ser negra o d'un color fosc
Presentar cada una de les pagines numerades sobre tot si l'original presenta les fulls solts si l'autor bol assenyalar alguna correcio en aquest original ha de fer-ho amb un altre color de tinta
b) Especificacions d'entrega d'originals parlats
Presentar-los en un sistema d'arxiu normalitzat (analogic: cinta, k7, digital: mp3, flv…) reproduible en els equips normals de reproduccio.
Diccio clara i audible, facilment entenedora pel treballadorencarregat de la digitalitzacio.
Exposicio contiunada de les idees, sense dubtes, acotacions o salts
c) Especificacions d'entrega d'originals mecanografiats
Han d'estar escrit per una sola cara
Fer servir un format de paper estándar (DIN A4)
El blanc des marges ha de ser ampli (almenys dos centimetres), i han de ser mes grans de cap a peu
El blanc de la interlinia ha e ser generos (doble espai)
Ha d'apareixer el numero de pagina al cap i marginat a la dreta
Ha d'aplicar-se una sangria d'un tabulador a la primera linea de cada paragraf
El text es presentara sense justificar, marginat a l'esquerra
L'autor no ha d'incloure correcions a l'original.
Dificultaria la digitalitzacio mitjançant OCR
L'original ha de presentar-se sense ratlles ni esmenes i amb els grafismes ben contrastats per a facilitar la digitalitzacio
d) Especificacions d'entrega d'originals impressos
Ha d'xistiar un bon contrats entre el color del text i el fons, sense traspas de tinta ni transparencies que entropeixen la digitalitcacio
Determinades fonts poden donar problemes en la digitalitzacio; ha de fer-se uhna prova previa abans d'establir les condicions del treball, ja que es posible que hagi que les condicions el text manualment
Ha de comprobar-se que l'orignal s'adapte a l'escanner, que el llibre s'obri completament i que el format sigui mes petit que l'area d'escanejat.
Especificacions d'entrega d'originals digitalizats
Les especificaciones son un conjunt de normes basquees que serveixen de guía a l'autor per a entregar el seu treball unes minime garanties i que permet a l'empresa partir d'una base solida per el posterior tractment
L'us ha propiciar una unificacio d'aquestes normes, de tal amnera que moltes d'elles son comunes per a totes les epmreses implicades
a) Especificacions relatives a aplicacions i formats
Junt amb els arxius digitals, s'ha d'entregar SEMPRE:
Una copia impressa escrita per una sola cara amb:
El numero de pagina de l'ultima versio entregada
El llistat d'arxius amb l'extensio corresponent
L'aplicacio o aplicacions amb que s'han creat la seva versio
Entorn operatiu
Les aplicacions han de ser les mes comunment acceptades:
Editors de texts per defecte dells sistemes operatius: Simple Text, Text edit
Editors de texts professionals: Word, WordPerfect
Per a la utilitzaciod'aplicacions de maquetacio (QuarkXPress, Pagemaker, Ventura publisher, In Desing) l'autor ha de consultar previament amb el preimpressores recomenable que cada part de la feina Es guardi com arxiu independent
Ha de tenir-se en compte que perque els arxius es disposen en ordre, han de numerar-se aquestes amb zeros en les desenes
b) Especificacions relatives al texte
Fer servir una configuracio de ppagina estándar (DIN A4)
El blanc dels marges ha de ser ampli (almenys 2 centirmetres), i han dde ser mes grans dels marges de cap a peu
El blanc de l'interlinia tambe ha de ser ampli
Ha d'apareixer el numero de pagina al cap i marginat a la dreta
Son preferibles originals sense composar, a no ser que l'autor vulgui composar-lo, tingui els coneixements adequats i ho hagi consultat previament amb l'empresa de preimpressio
El text es presenta aliniat a l'esquerra , sense justificar i sense particio de paraules
No s'ha de forçar el canvi de linia ni el canvi de pagina
Fer servir un sol tipus de lletra, el mes estndar posible, un sol cos i un sol estil
Les notes s'han d'incloure en el lloc que aniran ubicades, separades del text generl pe guions llargs.
Els quadres i taules s'han de compendre en document a par i adjuntar-los com arxius independents
S'ha d'aplicar un sagnant d'un tabulador a la primera linea de cada paragraf
Les paragrafs no s'han de separar entre si per lineas en blanc
Equips i aplicacions informatiques empleats en el procés
Periferics d'entrada
Els esquips informatics han d'estar connectats a escanners i disposar d'almenys una aplicacio de reconeixement optic de caracters, que permeti la digitalizacio dels originals mecanografiats o d'aquells priginals que estan impressos pero dels que es disposa de l'arxiu digital.
A mes, han de disposar de connexio externa i interna per mitja de xarxes de comunicacio i serveis de correu electronic per a la recepcio i enviament d'originals digitalitzats
Un fax pot completar l'enviament dels originals a traves de xarxes telematiques
En cas de que l'empresa accepti originals parlats, haura de disposar d'equips de reproduccio d'audio.
Ordinadors
Dos entorns principals: compatibles IBM (PC) y Macintosh (MAC)
Les dos entrons son necesaria en l'actualitat en una empresa de preimpressio i tambe en el proces de recepcio d'originals, ates que els arxius digitals poden provenir dels dos entorns
En la actualitat son compatibles, per axil,es posible compartir arxius entre ells; tot i que aixo pot ser font de problemes, pel que es aconsellable tratar-los en l'entorn corresponent.
Fonts
La informacio obre les descripcions de fonts es reculen en petits arxius que s'emmagatzemen en el sistema operatiu de l'ordinador i que poden adquirir o llogar externament
Aplicacions
Les aplicaciones d'edicio básica propias de cada sistema operatiu son suficiente per a preparar originaos digitals i les formats en que permeten guardar les documents son les mes usuals
Entre aquests programes trobem Word Pad (PC Windows) i simple tex o text edit (Mac OSX)
Les aplicacions d'edicio professional es troben disponibles en els dos entrons (destaquen Microsoft Word y Word Perfect)
Formats digitals d'arxius de text
Formats oberts
ASCII (American Standard Code for Information Interchange) no conte informacio de tipografia o disseny
RTF (Rich Text Format) conte informacio de tipografia o disseny molt basica
Formats especifics
Processadors de textes contenen tota la informacio de tipografia o disseny
permeten exportar en EPS poscript
Tipografia
Poscript
TrueType
OpenType
L'OCR
L'OCR (Optical Character Recognition) es el reconeixement optic de caracters, és un programa que llegeix aquestes imatges digitals i busca conjunts de punts que sʼassemblin a lletres, a caracters. Perquè el programa pugui realitzar aquestes tasques amb una certa fiabilitat, sense confondre "t" amb "1", la imatge que li proporcionem ha de complir unes certes característiques.
Normalment ha de tenir una gran resolució, uns 300 ppp per a textes amb tipus de lletra clars o 600 ppp si es tracta de tipus de lletra petits o originals de poca qualitat com els diaris.
Per un altre banda, podem estalviar en lʼaspecte del color: gairebé sempre serà suficient amb blanc i negre.
Si pensem una mica en el procés de escanejat que hem descrit anteriorment, ens donarem de que a lʼescanejar un texte no sʼescanejen lletres, paraules i frases, sinó senzillament els punts que les formen, una mena de fotografia del texte. Evidentement, això pot ser útil per a arxivar textes, però seria desitjable que poguessim agafar totes aquestes referències tan interesants però tan pesades i incorporar-les al nostre processador de texte no com una imatge, sinó com texte editable.
Normalment ha de tenir una gran resolució, uns 300 ppp per a textes amb tipus de lletra clars o 600 ppp si es tracta de tipus de lletra petits o originals de poca qualitat com els diaris.
Per un altre banda, podem estalviar en lʼaspecte del color: gairebé sempre serà suficient amb blanc i negre.
Si pensem una mica en el procés de escanejat que hem descrit anteriorment, ens donarem de que a lʼescanejar un texte no sʼescanejen lletres, paraules i frases, sinó senzillament els punts que les formen, una mena de fotografia del texte. Evidentement, això pot ser útil per a arxivar textes, però seria desitjable que poguessim agafar totes aquestes referències tan interesants però tan pesades i incorporar-les al nostre processador de texte no com una imatge, sinó com texte editable.
LʼOCR: optimització dels recursos
En els últims anys la digitalització de la informació (textes, imatges, so, etc.) s’ha convertit en un punt d’interès per la societat.
En el cas concret dels textes, existeixen i es generen contínuament grans quantitats d’informació escrita, tipogràfica o manuscrita en tot tipus de suport.
En aquest context, poder automatitzar la introducció de caràcters evitant l’entrada per teclat, implica un important estalvi de recursos humans i un augment de la productivitat al mateix temps que es manté o fins i tot es millora la qualitat de molts serveis.
El reconeixement òptic de caràcters, així com el reconeixement de text, en general són aplicacions dirigides a la digitalització de textes.
Identifiquen automàticament símbols o caràcters, que pertanyen a un determinat alfabet, a partir d’una imatge per emmagatzemar-ho en forma de dades amb les que podrem interactuar amb un programa d’edició de text o similars.
LʼOCR: problemes en el reconeixement òptic de caracters
El procés bàsic que es du a terme en el Reconeixement Òptic de Caràcters és convertir el text que apareix en una imatge en dades que podran ser editades i utilitzades com a tal per qualsevol programa o aplicació que les necessiti.
Partint d’una imatge perfecta, es a dir, una imatge de dos nivells de gris, el reconeixement d’aquests caràcters es realitzara bàsicament comparant-los amb uns patrons o plantilles que contenen tots els possibles caràcters.Ara be, les imatges reals no són perfectes, per tant el Reconeixement Òptic Caràcters es troba amb diversos problemes:
El dispositiu que obté la imatge pot introduir nivells de grisos en el fons que no pertanyen a la imatge original.
La resolució d’aquest dispositius pot introduir soroll a la imatge, afectant als píxels que han de ser processats.
La separació dels caràcters. Al no existir un espai fix entre ells, pot produir errors a la hora del reconeixement.
La connexió de dos o mes caràcters per píxels comuns també pot produir errors.