Educacion Maestria Dr. Vicente cursos Investigación

EE 7730: Speech Processing


Dr. Luis M. Vicente

Departamento de Ingeniería Eléctrica, Computadoras y Ciencias de Computadoras
Universidad Politécnica de Puerto Rico


| Prontuario | Reglas | Objetivos | Temas y fechas | Notas de otros trimestres |


Trimestre Fa14
Notas de clase en formatoPDF
TBA
 

 

 
 
 

 

Semana fecha
Temas, fechas de asignaciones, exámenes

S1: 10-16 agosto

  • No class

S2: 17- 23 agosto

  • Introduction to Speech Processing.
  • Speech Production Model.
  • Speech Analysis.
  • QUIZ01

S3: 24-30 agosto

  • Speech Coding.
  • Waveform Codec.
  • Source Codec.
  • QUIZ02

S4: 31-6 septiembre

  • Hybrid Codec.
  • Speech Enhancement.
  • SE: Based on Spectral Magnitude.
  • Spectral Subtraction.
  • QUIZ03

S5: 7-13 septiembre

  • Wiener Filtering.
  • SE: Based on Periodicity of Voiced Speech.
  • Comb Filtering.
  • QUIZ04

S6: 14-20 septiembre

  • Adaptive Noise Canceling.
  • QUIZ05
S7: 21-27 septiembre
  • Examen I.
S8: 28-4 octubre
  • Speech Recognition.
  • Classification of SR Systems.
  • A General Pattern Classification System.
  • QUIZ06

S9: 5-11 octubre

  • Dynamic Time Warping.
  • Hidden Markov Model.
  • Description of HMM.
  • QUIZ07
S10: 12-18 octubre
  • Relationship between HMM and Speech Production and Recognition.
  • The Recognition Problem.
  • Baum-Welch Recognition.
  • QUIZ08
S11: 19-25 octubre
  • Viterby Recognition.
  • Training of HMM.
  • Baum-Welch Algorithm.
  • QUIZ09

S12: 26-1 noviembre

  • Training on Multiple Observation Sequences.
  • Viterbi Training.
  • QUIZ10
  • Final Exam.

 

Instructor
  • Dr. Luis M. Vicente
  • Oficina: DSP Lab L 310B (dentro del salon de Capstone)
  • Horas de oficina: Martes y Jueves 12:00 – 2:00 PM
  • Teléfono: 787 622 8000 - ext: 344 Fax: 787 250 8131
  • Correo electrónico : lvicente[@ ]pupr[.] edu
  • Internet: http://www.lmvicente.com/ee4710.htm
Prerequisitos
  • Admission
Libro de Texto

Theory and Applications of Digital Speech Processing (2010) By L.R. Rabiner and R.W. Schafer Prentice Hall ISBN: 0136034284

                              
Referencias bibliográficas

Discrete Time Processing of Speech Signals (2000)
By Deller, J.R.
IEEE Press
ISBN: 0780353862

 

Spoken Language Processing (2001)
By X. Huang, A. Acero and H. Hon 
Prentice Hall
ISBN: 0130226165
 
Discrete-time Speech Signal Processing (2001)
By T.F. Quatieri
Prentice Hall
ISBN: 013242942-X

Speech and Language Processing (2008 )
By D. Jurafsky and J.H. Martin
Prentice Hall
ISBN: 0131873210

Speech Communications: Human and Machine (1999)
By D. O’Shaughnessy
John Wiley and Sons
ISBN: 0780334493

Statistical Methods for Speech Recognition (1998)
By F. Jelinek
MIT Press
ISBN: 0262100665

Fundamentals of Speech Recognition (1993)
By L.R. Rabiner and B. Juang
Prentice Hall
ISBN: 0130151572

Digital Processing of Speech Signals (1978)
By L.R. Rabiner and R.W. Schafer
Prentice Hall
ISBN: 0132136031

Formato de examen Blackboard, dos intentos posibles, la nota es la del ultimo intento.
Reglas de evaluación
  • Examenes y Quizzes se calculara el valor medio: 90%
  • Asistencia: 10% (se pierde si faltan 3 o más veces)
Reglas del curso
  • El estudiante es responsable de firmar la hoja de asistencia diariamente con su firma particular y legible.
  • Para recibir notificaciones por correo electrónico deberá enviarme un e-mail con la cuenta de e-mail de la PUPR. Otras cuentas pueden ser rechazadas por el mail server de la PUPR
  • La ausencia injustificada de 3 clases o más será penalizada con un 10% de la nota final
  • El estudiante debe estudiar las notas de clase (disponibles en formato pdf).
  • El estudiante debe tener disciplina esdtricta o se retrasará en el curso.
  • Las fechas oficiales serán expuestas en el calendario del curso.
  • Los exámenes serán para hacer en Blackboard con libro abierto. Sigan el código de honor.
  • Copiar en el examen será penalizado gravemente.
  • El estudiante es responsable de leer todos los anuncios expuestos.
  • Material nuevo será expuesto según el curso vaya avanzando. Por favor, visiten diariamente los anuncios en esta página y en BlackBoard.
  • Nuevas reglas serán añadidas según el curso progrese.
Objetivos:

Course Description

This course presents an overview of the area of speech processing using computers. The course includes topics such as the speech production process and the necessary mathematical background to study the major applications of the area. The applications presented in the course include speech coding, speech synthesis, speech recognition, and speaker and language identification.

Justification

Computer speech processing is one of the main research areas within digital signal processing. Some of the most interesting applications in speech processing have become indispensable to the telephony, banking, security, and military industries . This course will cover the introductory topics behind these applications along with a description of potential future development in the area.

Objectives

Students will become familiar with the following topics in computer speech processing:

  1. Description of the production and acoustic models of speech.
  2. Development of speech analysis and recognition methods.

 

 

 

Trimestres pasados

 

Luis M Vicente López
Profesor Asociado
Departamento de Ingeniería Eléctrica, Computadoras y Ciencias de Computadoras
Universidad Politécnica de Puerto Rico

Avenida Ponce de León 377
Hato Rey, 00919, Puerto Rico

Officina: L 308B (DSP Lab)
Tel:787 662 8000

Fax: 787 760 7815

lvicente

Inicio Dr. Vicente cursos

© Luis M Vicente.