Jul 8, 2013 ... 230622 - DSAP - Digital Speech and Audio Processing ... techniques of digital
signal processing to communication and audiovisual systems. 2.
Última modificació: 24-03-2017
230622 - DSAP - Processament Digital d'Àudio i Veu Unitat responsable:
230 - ETSETB - Escola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
Unitat que imparteix:
739 - TSC - Departament de Teoria del Senyal i Comunicacions
Curs:
2017
Titulació:
MÀSTER UNIVERSITARI EN TECNOLOGIES DE LA INFORMACIÓ I LA COMUNICACIÓ (Pla 2009). (Unitat docent Optativa) ENGINYERIA DE TELECOMUNICACIÓ (Pla 1992). (Unitat docent Optativa) MÀSTER UNIVERSITARI EN ENGINYERIA DE TELECOMUNICACIÓ (Pla 2013). (Unitat docent Optativa)
Crèdits ECTS:
5
Idiomes docència:
Anglès
Professorat Responsable:
Climent Nadeu
Altres:
Antonio Bonafonte Javier Hernando
Capacitats prèvies Processament de senyal Requisits Processament de senyal Competències de la titulació a les quals contribueix l'assignatura Específiques: 1. Capacitat per aplicar mètodes de la teoria de la informació, la modulació adaptativa i codificació de canal, així com tècniques avançades de processat digital del senyal als sistemes de comunicacions i audiovisuals. Transversals: 2. TREBALL EN EQUIP: Ser capaç de treballar com a membre d'un equip interdisciplinari, ja sigui com un membre més o duent a terme tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes amb pragmatisme i sentit de la responsabilitat, tot assumint compromisos considerant els recursos disponibles. 3. ÚS SOLVENT DELS RECURSOS D'INFORMACIÓ: Gestionar l'adquisició, l'estructuració, l'anàlisi i la visualització de dades i informació de l'àmbit d'especialitat, i valorar de forma crítica els resultats d'aquesta gestió. 4. TERCERA LLENGUA: Conèixer una tercera llengua, preferentment l'anglès, amb un nivell adequat oral i escrit i en consonància amb les necessitats que tindran els titulats i titulades. Metodologies docents -
Classes expositives (50%) Classes d'aplicació (amb Matlab o similar) (50%) Treball en equip: projecte, presentació Treball individual: preparació i finalització (fora de l'aula) de les activitats d'aplicació
Objectius d'aprenentatge de l'assignatura Objectius d'aprenentatge: Adquirir la comprensió i ser competent en un conjunt relevant de conceptes i tècniques del camp del processament digital d'àudio i la seva aplicació als problemes que apareixen en aplicacions reals. Especialment, es consideraran els senyals i
1/5
Universitat Politècnica de Catalunya
Última modificació: 24-03-2017
230622 - DSAP - Processament Digital d'Àudio i Veu
les aplicacions de parla i música. Resultats d'aprenentatge: La capacitat de processar digitalment, en un context orientat a aplicació, els senyals d'àudio i de parla, per tal de fer anàlisi, modelat, extracció d'informació, neteja, modificació, i síntesi/generació. Hores totals de dedicació de l'estudiantat Dedicació total: 125h
Hores grup gran:
39h
31.20%
Hores grup mitjà:
0h
0.00%
Hores grup petit:
0h
0.00%
Hores activitats dirigides:
0h
0.00%
Hores aprenentatge autònom:
86h
68.80%
2/5
Universitat Politècnica de Catalunya
Última modificació: 24-03-2017
230622 - DSAP - Processament Digital d'Àudio i Veu Continguts
1. Introducció
Dedicació: 12h Grup gran: 6h Aprenentatge autònom: 6h
Descripció: Presentació de l'assignatura La diversitat dels senyals d'àudio Característiques de la parla i la música. El model de producció Audició i modelat auditiu La transformada de Fourier a curt termini
2. Anàlisi i síntesi localitzades de senyals (quasi)periòdics
Dedicació: 12h Grup gran: 6h Aprenentatge autònom: 6h
Descripció: Anàlisi / síntesi basades en banc de filtres. El vocoder de fase Banc de filtres i espectrograma Modificació de l'escala temporal i el to Filtres QMF. Codificació MP3. Objectius específics:
3. Modelatge i representació de senyals de parla
Dedicació: 12h Grup gran: 6h Aprenentatge autònom: 6h
Descripció: Modelat només amb pols basat en producció Determinació del to per a parla i música Codificació basada en LPC que es fa servir en telefonia mòbil
4. Millora de senyals de parla i àudio
Dedicació: 12h Grup gran: 6h Aprenentatge autònom: 6h
Descripció: Cancel·lació: eco, interferències Reducció de soroll: substracció espectral, filtrat de Wiener, wavelets Separació cega de fonts: ICA, CASA, NMF
3/5
Universitat Politècnica de Catalunya
Última modificació: 24-03-2017
230622 - DSAP - Processament Digital d'Àudio i Veu
5. Processament multimicrófon d'àudio
Dedicació: 12h Grup gran: 6h Aprenentatge autònom: 6h
Descripció: Acústica de sales Conformació de feix amb agrupació de micròfons Localització de font acústica i seguiment
6. Reconeixement i detecció d'àudio i parla
Dedicació: 12h Grup gran: 6h Aprenentatge autònom: 6h
Descripció: Enfocaments basats en ajustament de patrons Detecció d'activitat d'àudio Aplicació al reconeixement de parla i locutor
Realització i presentació projectes
Dedicació: 54h Grup gran: 3h Aprenentatge autònom: 51h
Descripció: Disseny, implementació i prova d'un sistema de proc. d'àudio per a una aplicació específica
Sistema de qualificació Assistència/participació a classe (10%) Tests (30%) Projecte (50%) Presentació (10%)
4/5
Universitat Politècnica de Catalunya
Última modificació: 24-03-2017
230622 - DSAP - Processament Digital d'Àudio i Veu Bibliografia Bàsica: Quatieri, T.F. Discrete-time speech signal processing: principles and practice. Upper Saddle River, NJ: Prentice Hall, 2002. ISBN 013242942X. Gold, B.; Morgan, N.; Ellis, D. Speech and audio signal processing: processing and perception of speech and music. 2nd rev. ed. Wiley-Blackwell, 2011. ISBN 978-0-470-19536-9. Dutoit, T.; Marqués, F.; Rabiner, L.R. Applied signal processing: a MATLAB-based proof of concept. New York ; London: Springer, 2009. ISBN 978-0-38774534-3.
Complementària: Rabiner, L.R.; Schafer, R.W. Theory and applications of digital speech processing. Prentice Hall, 2010. ISBN 9780136034285. Huang, Y.A.; Benesty, J. (eds.). Audio signal processing for next-generation multimedia communication systems [en línia]. New York: Kluwer Academic Publishing, 2004 [Consulta: 23/07/2013]. Disponible a: . ISBN 1402077688.
Altres recursos: Presentacions usades en les classes Enunciats i programes del treball pràctic Material audiovisual Slides Diapositives usades a les classes Material informàtic Codi programes Codi programes en Matlab o similar
5/5
Universitat Politècnica de Catalunya