Please use this identifier to cite or link to this item: http://repositorio.uptc.edu.co/handle/001/1869
Title: Implementación de un sistema de reconocimiento de voz en FPGA como interfaz hombre-máquina en aplicaciones de robótica
Authors: Bustos Gómez, Fabián Alberto
Pantevis Perilla, Henry Navy
metadata.dc.contributor.role: Pérez Holguín, Wilson Javier (Director de tesis)
Keywords: Dispositivos lógicos programables - Diseño - Métodos de simulación
Electrónica digital
Android (Recurso electrónico) - Métodos de simulación
Inteligencia artificial
Robótica
Robots - Diseño y construcción
Control automático
Interfases hombre-máquina
Microcontroladores
Sistemas de control inteligente
Sistemas hombre-máquina
Ingeniería Electrónica - Tesis y disertaciones académicas
Interacción hombre-máquina
Issue Date: 2016
Publisher: Universidad Pedagógica y Tecnológica de Colombia
Citation: Bustos Gómez, F. A. & Pantevis Perilla, H. A. (2016). Implementación de un sistema de reconocimiento de voz en FPGA como interfaz hombre-máquina en aplicaciones de robótica. (Trabajo de grado). Universidad Pedagógica y Tecnológica de Colombia, Soigamoso. http://repositorio.uptc.edu.co/handle/001/1869
Abstract: Las aplicaciones de reconocimiento de voz exigen gran cantidad de recursos y alta velocidad de procesamiento, características que no siempre están disponibles en sistemas de procesamiento secuencial basados en software, tales como los sistemas de cómputo basados en procesadores convencionales. Por esta razón, la comunidad científica ha optado por emplear dispositivos que por su arquitectura paralela se caracterizan por realizar un procesamiento más eficiente de este tipo de señales, tales como los sistemas basados en procesadores digitales de señales DSPs (Digital Signal Processer). Un ejemplo de esto es la aplicación presentada por Yu-Hung Kao (Yu-Hung & Rajasekaran, 2000), en donde se desarrolla un sistema reconocedor de voz de vocabulario dinámico. En (Prevedello, Ledbetter, Farkas, & Khorasani, 2014) se presenta un trabajo orientado a evaluar el impacto de los sistemas de reconocimiento de voz por software (SRS) en tiempos de respuesta de informes radiológicos.
Description: 110 páginas : ilustraciones color, tablas, figuras.
metadata.dcterms.bibliographicCitation: Adeli, M., Rouat, J., Wood, S., Molotchnikoff, S., & Plourde, E. (2016). A Flexible Bio-Inspired Hierarchical Model for Analyzing Musical Timbre. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 24(5), 875-889. doi: 10.1109/TASLP.2016.2530405
Altera, C. (2013). Quartus II Web Edition (Version 13.0).
Digilent, R. (2009). PModMic Reference Component.
Elmisery, F. A., Khalil, A. H., Salama, A. E., & Algeldawy, F. (2004, 5-7 Sept. 2004). Adaptation of ann for FPGA implementation and its application for speaker identification. Paper presented at the Electrical, Electronic and Computer Engineering, 2004. ICEEC '04. 2004 International Conference on.
Hejazi, S. A., Kazemi, R., & Ghaemmaghami, S. (2009, 8-11 Feb. 2009). Isolated Persian digit recognition using a hybrid HMM-SVM. Paper presented at the Intelligent Signal Processing and Communications Systems, 2008. ISPACS 2008. International Symposium on.
Jain, S., Jha, P., & Suresh, R. (2013, 12-14 Dec. 2013). Design and implementation of an Automatic Speaker recognition system using neural and fuzzy logic in Matlab. Paper presented at the Signal Processing and Communication (ICSC), 2013 International Conference on.
Jun-chang, Z., & Yuan-yuan, C. (2010, 4-6 Dec. 2010). Speech feature extraction method of improved KPCA. Paper presented at the The 2nd International Conference on Information Science and Engineering.
Jun, X., Ariyaeeinia, A., Sotudeh, R., & Zaki, A. (2005, 24-0 Oct. 2005). Pre-processing speech signals in FPGAs. Paper presented at the ASIC, 2005. ASICON 2005. 6th International Conference On.
Lan, Y., Harvey, R., & Theobald, B. J. (2012, 25-30 March 2012). Insights into machine lip reading. Paper presented at the 2012 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP).
Lee, C.-H. (2015). Speech Recognition and Production by Machines. In J. D. Wright (Ed.), International Encyclopedia of the Social & Behavioral Sciences (Second Edition) (pp. 259-263). Oxford: Elsevier.
Li, J., An, D., Lang, L., & Yang, D. (2012). Embedded Speaker Recognition System Design and Implementation Based on FPGA. Procedia Engineering, 29, 2633-2637. doi: 10.1016/j.proeng.2012.01.363
Madisetti, V. K., & Williams, D. B. (1999). Digital Signal Processing Handbook: CRC Press LLC.
MathWorks, I. (2013). MATLAB (Version R2013a 8.1.0.604).
Mesaros, A., & Astola, J. (2005, 14-15 July 2005). Inter-dependence of spectral measures for the singing voice. Paper presented at the International Symposium on Signals, Circuits and Systems, 2005. ISSCS 2005.
Prevedello, L. M., Ledbetter, S., Farkas, C., & Khorasani, R. (2014). Implementation of Speech Recognition in a Community-based Radiology Practice: Effect on Report Turnaround Times. Journal of the American College of Radiology, 11(4), 402-406. doi: http://dx.doi.org/10.1016/j.jacr.2013.07.008
Rabiner, L. J., Biing-Hwang. (1993). Fundamentals of Speech Recognition (I. PTR Prentice-Hall Ed. 1 ed.). Englewood Cliffs, New Jersey.
Sarkar, G., & Saha, G. (2010). Real time implementation of speaker identification system with frame picking algorithm. Procedia Computer Science, 2, 173-180. doi: 10.1016/j.procs.2010.11.022
Sharma, P. K., Lakshmikantha, B. R., & Sundar, K. S. (2011, 28-30 Jan. 2011). Real time control of DC motor drive using speech recognition. Paper presented at the India International Conference on Power Electronics 2010 (IICPE2010).
Xu, J., Ariyaeeinia, A., & Sotudeh, R. (2005, 25-25 Oct. 2005). User voice idenfication on FPGA. Paper presented at the Perspectives in Pervasive Computing.
Yu-Hung, K., & Rajasekaran, P. K. (2000, 2000). A low cost dynamic vocabulary speech recognizer on a GPP-DSP system. Paper presented at the Acoustics, Speech, and Signal Processing, 2000. ICASSP '00. Proceedings. 2000 IEEE International Conference on.
Zhang, B., Zhuang, X., Huang, P., Feng, C., & Zhao, J. (2009, 17-19 Oct. 2009). Application of Uni-Directional Microphone Array for Identifying English Pronunciation Errors. Paper presented at the Image and Signal Processing, 2009. CISP '09. 2nd International Congress on.
URI: https://repositorio.uptc.edu.co/handle/001/1869
Appears in Collections:JDG. Trabajos de Grado y Tesis

Files in This Item:
File Description SizeFormat 
TGT-434.pdfArchivo principal1.98 MBAdobe PDFThumbnail
View/Open
A-202.pdf
  Restricted Access
Autorización publicación1.87 MBAdobe PDFView/Open Request a copy


This item is licensed under a Creative Commons License Creative Commons