| Linee di scansione (nota1) Su un televisore le immagini sono generate tramite un fascio di elettroni (pennello elettronico) che scandisce tutta la superficie dello schermo una linea alla volta; queste linee, dette linee di scansione, sono in numero ben definito per ogni standard TV. Fotogrammi e campi Tanto al cinema che in TV non vengono proiettate immagini in movimento ma sequenze di immagini statiche dette fotogrammi (frames in inglese), ed è il nostro cervello interpreta la rapida successione dei fotogrammi come movimento. Se la frequenza con cui vengono cambiati i fotogrammi è troppo bassa, il movimento ci sembra poco fluido, ed il numero di fotogrammi al secondo (fps) necessari per dare un'impressione di fluidità cambia al cambiare della fonte. Al cinema i film vengono proiettati a 24 fps (nota 2) ed ogni fotogramma è un'immagine completa (in altre parole è progressivo). Alla TV è necessario ua frequenza di aggiornamento maggiore per dare l'impressione di un movimento fluido, ma per risparmiare banda, ogni fotogramma viene suddiviso in due semiquadri o campi (fields in inglese), uno costituito dalle linee di scansione pari, e l'altro dalle dispari, e vengono trasmessi 50 campi al secondo (PAL) o 60 (NTSC). In altre parole si dice che l'immagine è interlacciata. Passare da un' immagine progressiva ad una interlacciata è banale, basta suddividerla in tante fettine orizzontali ed assegnarne metà ad un campo e metà all'altro, ma il passaggio inverso è più complicato, perchè quando guardiamo la Tv capita spesso che le linee pari non siano perfettamente sincronizzate con quelle dispari, per cui visualizzando due campi consecutivi su un mezzo progressivo otteniamo un fastidioso "effetto pettine": ingrandita si nota un po' meglio: Notate che la cosa è molto evidente sulla mano (in movimento) ed impercettibile sulla manica (statica). Prima di discutere i metodi di deinterlacciamento, ovvero come ottenere un'immagine progressiva derivante da una base simile, dobbiamo parlare della trasmissione dei film in TV. In questa immagine, vediamo tre fotogrammi progressivi che ci serviranno da esempio: Telecine N.B. riguarda quasi tutti i film/anime interlacciati Prima di essere trasmesso in TV un film deve essere adattato tramite un processo detto telecine, che per il PAL porta la frequenza di riproduzione del film da 24 a 25 fps (nota 3), e da ogni frame del film estrae due campi (per NTSC è un po' più complicato, se siete interessati fate riferimento all'appendice sotto). Se un film è composto da una sequenza di fotogrammi tipo: 1 2 3 4 5 6 7 diventa una sequenza di campi tipo (1d= linee dispari del frame 1, 1p= linee pari): 1d 1p 2d 2p 3d 3p 4d 4p 5d 5p 6d 6p 7d 7p In pratica partendo dall'esempio sopra avrò una sequenza tipo questa: Questi campi vengono visualizzati uno alla volta su un normale televisore CRT, ma su dispositivi progressivi come monitor PC e tv LCD o plasma ne vediamo sempre due alla volta, con fotogrammi così composti: 1*=(1d+1p), 2*=(2d+2p), 3*=(3d+3p), ... quando va bene (tutti fotogrammi progressivi) oppure: 1*=(1p+2d), 2*=(2p+3d), 3*=(3p+4d), ... quando va male (tutti fotogrammi interlacciati) e partiamo dal campo sbagliato, cosa che non dipende dal dispositivo che visualizza il segnale ma da quello che l'ha prodotto. Se su TV LCD o plasma non vedete mai l'effetto pettine è solo perchè hanno dei filtri di deinterlacciamento. Telecine inverso Il telecine inverso (IVTC) consiste nel ricostruire il fotogramma progressivo originale prendendo due campi consecutivi della sequenza qui sopr, ma perchè il trucco funzioni è necessario che i due campi vengano effettivamente dallo stesso campo, cosa che crea problemi in quanto se partiamo dal campo sbagliato ci troviamo una roba tipo: 1p 2d 2p 3d 3p 4d 4p 5d 5p 6d 6p 7d 7p e rischiamo di combinare i campi 1p e 2d anzichè 1d ed 1p, per cui è necessario che i filtri per il telecine inverso pongano la massima attenzione nell' identificazione del corretto ordine dei campi (quando i campi sono sempre nell'ordine corretto non sono neppure necessari filtri di deinterlacciamento). I filtri basati su questa tecnica sono i migliori per materiale interlacciato proveniente da pellicola, ma non funzionano con altro tipo di materiale interlacciato. Il motivo di questa superiorità è che i filtri IVTC mantengono la piena definizione dell'immagine originale, mentre gli altri si basano su interpolazioni che per quanto ben fatte sbiadiscono un po' le immagini.Oltre a questo, se abbiamo oggetti che si muovono velocemente in verticale (es: palloni da gioco), molti filtri di deinterlacciamento genereranno due copie semitrasparenti dell'oggetto in ciascun fotogramma, mentre un IVTC ben fatto ne genera una sola e solida. Un esempio di fotogrammi interlacciati di origine progressiva lo vedete nella figura seguente: Prendendo le linee dispari del primo fotogramma e quelle pari del secondo (o viceversa, non ho controllato) è possibile ricostruire il fotogramma 2 dell' immagine sopra, e lo stesso giochetto si può fare con tutti i fotogrammi tranne il primo e l'ultimo della sequenza. Il telecine inverso è proprio questa tecnica di ricombinare le linee pari e dispari di fotogrammi contigui per ottenere fotogrammi progressivi: come vedete è un'algoritmo molto semplice, ma farlo funzionare correttamente richiede un sacco di trucchetti per determinare la sequenza esatta dei campi da ricombinare, e non è per nulla facile. Per fortuna questo è un problema di chi i filtri li scrive, non di chi li usa. Nota: gran parte dei DVD PAL vengono da processi di telecine ed hanno tutti i campi nell'ordine corretto, ma capita che in corrispondenza di qualche taglio i due campi si sfasino ed il film da li in poi richieda un buon filtro di interlacciamento (salvo magari sistemarsi al taglio successivo). I migliori filtri di IVTC sono abbastanza furbi da non toccare i frame progressivi, per cui in questi casi si possono tranquillamente applicare a tutto il film (se fate una cosa simile controllate l'uscita prima di encodare) !!pagebreak!! Video interlacciato puro Ovvero non telecine: quasi tutto cio che si gira con una videocamera, capita spesso per trasmissioni dal vivo, documentari, film "di nicchia", serie tv I filmati girati direttamente in PAL con videocamere, siano esse VHS,DV o professionali, sono praticamente sempre interlacciati, ma a differenza di quanto avviene coi film telecinati in cui un campo dista dal successivo o 0 ms (se vengono dallo stesso frame) o 40 ms se vengono da frame contigui, in questi filmati ogni campo dista dal successivo 20 ms, e combinando due campi contigui ottengo sempre un fotogramma con effetto pettine, per cui questi filmati andranno deinterlacciati con metodi diversi dal telecine inverso, per lo più basati sul buttar via metà delle linee del fotogramma originale e ricostruirle per interpolazione: ad esempio il classico filtro BOB che semplicemente butta via metà delle linee e raddoppia le altre; ovviamente altri filtri della stessa famiglia fanno lavori più sofisticati, per esempio agendo solo nei fotogrammi (o addirittura solo nelle zone dei fotogrammi) dove rilevano l'effetto pettine, fino ad arrivare al tomsmocomp che addiritura si basa sulla predizione del movimento dei campi, ma di questo discuteremo più avanti parlando dei filtri avisynth. Un esempio chiarificatore: In un filmato PAL telecinato, quattro campi potrebbero essere messi così: campo 1: (p1) pari, istante T1 campo 2: (d1) dispari, istante T1 + 40 ms campo 3: (p2) pari, istante T1 + 40 ms campo 4: (d2) dispari, istante T1 + 80 ms un frame ottenuto come p1+d1 o p2+d2 sarà interlacciato (tempi diversi tra linee pari e dispari -> posizioni diverse per gli oggetti in movimento), ma uno ottenuto con p2+d1 sarà progressivo. Le videocamere PAL amatoriali (e buona parte delle professionali) non registrano 25 frame al secondo, ma 50 campi al seconto (ricordiamo che i campi hanno risoluzione verticale dimezzata poichè contengono alternativamente solo le linee pari o dispari). Quindi avrò una sequenza tipo: cattura 1: (p1) pari, istante T1 cattura 2: (d1) dispari, istante T1 + 20 ms cattura 3: (p2) pari, istante T1 + 40 ms cattura 4: (d2) dispari, istante T1 + 60 ms In questo caso non si può ricostruire un perfetto fotogramma progressivo perchè non è mai stato catturato! Infatti abbinando qualunque coppia di fotogrammi contigui avrò un salto di 20 ms tra linee pari e dispari. In pratica questo discorso interessa tutti i filmati non girati su pellicola: film amatoriali, talk show, sport, concerti, film hard, trasmissioni dal vivo,documentari (la mano sopra è di Angela Jr). I campi catturati dalla telecamera in pratica sono simili a questi: Non importa se il fotogramma centrale viene appaiato con il precedente o con il successivo: otterrò sempre un effetto pettine. Telecine NTSC (solo per gli stomaci forti) Abbamo accennato sopra che per portare un filmato in PAL viene leggermente accelerato. Fare lo stesso lavoro per NTSC è improponibile, perchè anzichè un'accelerazione del 4,2% (24->25) servirebbe del 25% (24->30), con un effetto simile a quello delle vecchie comiche. Per questo motivo viene utilizzato il cosiddetto 3:2 pulldown : da 4 fotogrammi progressivi ottengo 5 fotogrammi interlacciati, semplicemente dividendo il primo e terzo frame in due campi ed il secondo e quarto frame in tre campi (ripetendone uno) o viceversa, secondo lo schema riassunto in tabella: Il risultato finale di questo splendido schema è che 1) ricostruendo brutalmente i fotogrammi avremmo (nell'esempio) i frame 1,2 e 5 progressivi, il 3 ed il 4 interlacciati 2) visto che metà fotogrammi generano due campi e metà ne generano tre, il filmato andrà a scatti 3) Nel fare l'operazione inversa, oltre a ricostruire i frames progressivi rimescolando l'ordine dei campi, dovremo buttar via un fotogramma ogni 5 (decimate nella terminologia dei filtri di deinterlacciamento) Notate che una delle maggiori difficoltà nel deinterlacciare un filmato NTSC è appunto nel trovare e mantenere il bandolo della matassa, ovvero il primo fotogramma della sequenza di 5 fotogrammi interlacciati da cui ricostruire i 4 progressivi originali. NTSC FILM Con questa dicitura si indicano i filmati NTSC codificati a 23.976 FPS: il 3:2 pulldown per generare un segnale NTSC viene fatto dal lettore DVD, ed i fotogrammi dovrebbero essere sempre progressivi. Filmati PAL derivati da NTSC telecinati Non mi è mai capitato un simile aborto, ma in rete si parla di DVD PAL ottenuti eliminando un campo ogni 5 in un video NTSC telecinato. Dubito si riesca a fare il telecine inverso su fonti del genere, conviene trattarle come video da telecamera e tenersi un po' di ghosting Opzioni "Force film" e "Swap fields" in DVD2AVI "Force film" serve a "disfare" il 3:2 pulldown. Va applicato tassativamente solo a sorgenti NTSC non FILM "Swap fields" serve a disfare il telecine PAL nel caso in cui tutti i fotogrammi risultino interlacciati a causa di uno sfasamento tra i dispari ed i pari. Entrambe le opzioni funzionano bene solo se il film è uniformemente telecinato, senza tagli, altrimenti conviene lasciare field operation a none e deinterlacciare coi filtri avisynth che vedremo più avanti. Ghosting Nel fare il resize verticale di un video interlacciato, si generano inevitabilmente effetti di ghosting (ovvero immagini fantasma in parte agli oggetti in movimento) Codifica interlacciata In caso stiamo codificando per un dispositivo interlacciato, come la TV,e rinunciamo al resize verticale (il caso più comune è quello dei SVCD) spesso è preferibile non effettuare nessun deinterlacciamento e codificare i fotogrammi interlacciati. Sia MPEG2 (DVD, SVCD) che MPEG4 (divx/xvid) prevedono questa possibilità. Crop Di norma il crop (ritaglio delle bande nere) va effettuato per numeri pari, ma in caso di filmati interlacciati il crop verticale va fatto per multipli di 4 (il motivo è al di la degli scopi di questo documento). Questo discorso si applica a tutti i filmati con codifica interlacciata, anche quando il filmato è PAL ed i campi sono nell'ordine giusto (e quindi vediamo fotogrammi progressivi sul monitor anche senza deinterlacciare) Sovraimpressioni Nel caso di filmati provenienti da TV (VHS/SAT inclusi) è frequente avere scritte in sovraimpressione interlacciate su video progressivo. Che io sappia non c'è modo di deinterlacciarle senza agire anche sul video, per cui consiglio di lasciarle così. Nota 1: La TV è un sistema analogico, per sui non esiste il concetto di pixel o di risoluzione orizzontale; inoltre le linee di scansione sono più di quelle normalmente digitalizzate, ma quelle in più sono quasi tutte fuori dallo schermo (overscan) Nota 2: in realtà al cinema ogni fotogramma viene ripetuto 3 volte per ridurre gli sfarfallii, per cui in realtà il framerate è di 72 fps Nota 3: nel passare da 24 fps a 25 fps ovviamente la durata del film si riduce di un 4% circa, e tutti i suoni diventano leggermente più acuti. Nota 4: In realtà NTSC usa non 60 ma 59.94 campi/s (o 29.97 fotogrammi/s se preferite) per cui il film viene prima portato da 24 a 23.976 fps Direi che per la teoria è tutto, spero che prima o poi troverò il tempo di coprire la parte sull'uso dei filtri di deinterlacciamento, nel frattempo qui sotto è riportato un'articolo di doom9 sul telecine inverso Bibliografia: http://100fps.com/ http://www.lurkertech.com/lg/fields/fields.html http://www.doom9.org/ivtc-tut.htm |


