EDGE-AI IN EMBEDDED SYSTEMS: ENERGY-COMPUTATIONAL MODELS AND METRICS. SYSTEMATIC REVIEW
Main Article Content
Abstract
Edge AI integrates AI, edge computing, and mobile edge computing to process data near the source with low latency, low power consumption, and greater privacy. It addresses the need to run local inference on resource-constrained devices (sensors, MCUs, SBCs like the Jetson Nano or Raspberry Pi, FPGAs, and accelerators like the Edge TPU) without relying on the cloud for real-time processing. This systematic review focuses on hardware-software co-optimization: compact models (quantized and pruned CNNs, lightweight YOLO-lite variants, SNNs) and toolchains (TensorFlow Lite Micro, CMSIS-NN, TVM/microTVM) that balance accuracy, latency, and power while minimizing RAM/Flash footprint. This approach is key in healthcare, transportation, industrial security, and home automation. Although there is a history of this field, it has grown rapidly in the last five years. Articles published between 2020 and 2025 were reviewed using the Google Scholar and Scopus search engines, with Boolean operators applied. Twenty-four articles were included based on computational models, edge hardware, and energy metrics. Edge AI in embedded systems has matured in the development process, but it still relies heavily on prototype development platforms. Similarly, energy metrics need to be standardized to compare realistic performance between solutions, considering external factors that may affect them.
Downloads
Article Details
Section

This work is licensed under a Creative Commons Attribution 4.0 International License.
How to Cite
References
Blanco, G. (2025). Diseño de un modelo de inferencia energéticamente eficiente de un Vision Transformer implementado en FPGA para su aplicación en sistemas embebidos. Tesis de Pregrado, Instituto Tecnológico de Costa Rica. https://repositoriotec.tec.ac.cr/bitstream/handle/2238/16382/TF10069_BIB314353_Gabriel_Eduardo_Blanco-Mora.pdf?sequence=1&isAllowed=y
Burbano, J., & Estévez, M. (2025). Implementación de arquitecturas de despliegue remoto de firmware para optimizar la operatividad de redes de sensores inalámbricos. Tesis de Pregrado, Universidad del Azuay. http://dspace.uazuay.edu.ec/handle/datos/15723
Cabrera, L., & Orozco, K. Caracterización de rendimiento computacional en plataformas embebidas para aplicaciones de Edge AI en modelos de detección de personas. Tecnología en Marcha, 38 (4), 191-201. https://doi.org/10.18845/tm.v38i4.7754
Calandín, A. (2023). Recuento de personas mediante cámaras de vídeo y ML en el Edge [Tesis de Maestría, Universitat Politècnica de València]. https://riunet.upv.es/handle/10251/199177
Cantos, A., & Loor, J. (2025). Implementación de un sistema de clasificación de banano basado en el estado de maduración. Tesis de Pregrado, Universidad Politécnica Salesiana. http://dspace.ups.edu.ec/handle/123456789/30353
de Prado, M., Rusci, M., Capotondi, A., Donze, R., Benini, L., & Pazos, N. (2021). Robustifying the Deployment of TinyML Models for Autonomous Mini-Vehicles. Sensors, 21, 1339. https://doi.org/ 10.3390/s21041339
Fanariotis, A., Orphanoudakis, T., Kotrotsios, K., Fotopoulos, V., Keramidas, G., & Karkazis, P. (2025). Power Efficient Machine Learning Models Deployment on Edge IoT Devices. Sensors, 23(3), 1595; https://doi.org/10.3390/s23031595
Flores, L., & Sandoval, J. (2025). Ciberseguridad con IA y métricas energéticas. Azcatl, 4, 32-37. doi: 10.24275/aZC2025a006
Giannakopoulos, P., van Knippenberg, B., Chandra, K., Calabretta, N., & Exarchakos, G. (2025). Key metrics for monitoring performance variability in edge computing applications. Journal on Wireless Communications and Networking, 2025 (38). https://doi.org/10.1186/s13638-025-02469-6
Haro, A. (2025). Detección de defectos en objetos en movimiento mediante redes neuronales convolucionales con optimizaciones específicas para hardware NVIDIA. Tesis de Pregrado, Universitat Politècnica de València. https://riunet.upv.es/handle/10251/198954
Heydari, S., & Mahmoud, Q. (2025). Tiny Machine Learning and On-Device Inference: A Survey of Applications, Challenges, and Future Directions. Sensors, 25(10), 3191; https://doi.org/10.3390/s25103191
Josphineleela, R., Sam, G., Ramesh, T., & Balamurugan, K. (2025). Optimized multiple object tracking with conformalized graph neural network and narwhal optimizer for embedded system IoT and mobile edge computing. Ain Shams Engineering Journal, 16, 103581. https://doi.org/10.1016/j.asej.2025.103581
Kang, M., Lee, Y., & Park, M. (2020). Energy Efficiency of Machine Learning in Embedded Systems Using Neuromorphic Hardware. Electronics, 9, 1069. doi:10.3390/electronics9071069
Karim, M., Goni, M., Nahiduzzaman, M., Ahsan, M., Haider, J., & Kowalski, M. (2024). Enhancing agriculture through real-time grape leaf disease classification via an edge device with a lightweight CNN architecture and Grad-CAM. Science Reports, 14(1), 16022. doi: 10.1038/s41598-024-66989-9
Lacalle, I. (2022). Diseño y desarrollo de una arquitectura de Internet de las Cosas de nueva generación orientada al cálculo y predicción de índices compuestos aplicada en entornos reales. [Tesis de Doctorado, Universitat Politècnica de València]. Doi: 10.4995/Thesis/10251/190634
López, D. (2025). Estudio e implementación de redes neuronales de bajo consumo sobre RISC-V para aplicaciones espaciales. Tesis de Pregrado, Universidad de Complutense de Madrid. https://hdl.handle.net/20.500.14352/124200
Page, M., McKenzie, J., Bossuyt, P., Boutron, I., Hoffmann, T., Mulrow, C., ShamseerI, L., Tetzlaff, J., Akl, E., Brennan, S., Chou, R., Glanville, J., Grimshaw, J., Hro´bjartsson, A., Lalu, M., Li, T., Loder, E., Mayo, E., McDonald, S.,… Moher, D. (2021) The PRISMA 2020 statement: An updated guideline for reporting systematic reviews. PLOS Medicine 18(3): e1003583. https://doi.org/10.1371/journal.pmed.1003583
Perticari, J. (2025). Implementación de los modelos de redes neuronales convolucionales Yolo en un dispositivo AVNET ULTRA 96 V2 mediante VITIS-AI. Universidad Miguel Hernández de Elche. http://dspace.umh.es/bitstream/11000/36047/1/TFG-Perticari%20Ventura%2C%20Joaqu%C3%ADn.pdf
Pozo, D., Monge, C., & Recalde, P. (2025). Optimización de modelos de lenguaje grande: Una aproximación con Quantization, ONNX y Pruning para aplicaciones en tiempo real. Revista Ingeniería e Innovación del Futuro, 4(2), 130–146. https://doi.org/10.62465/riif.v4n2.2025.177
Puerta, G. (2025). Rendimiento y costo de modelos de aprendizaje automático para la detección de crisis epilépticas en una plataforma adaptativa de salud electrónica basada en IoT sobre nodos Edge y Fog. Revista Colombiana de Computación, 26(1). https://doi.org/10.29375/25392115.5480
Ramírez, M. (2025). Prototipo de órtesis con estimulación muscular controlado por comandos de voz. Tesis de Maestría, Instituto Tecnológico de Chilpancingo. https://rinacional.tecnm.mx/bitstream/TecNM/10923/1/TESIS%20MARIA%20ISABEL.pdf
Romero, L. (2025). Ejecución de Algoritmos de Inteligencia Artificial en Sistemas de Tiempo Real.Tesis de Maestría, Universitat Politècnica de Catalunya. https://upcommons.upc.edu/server/api/core/bitstreams/c8652cd2-6aad-4375-a907-0cf3cf63eb37/content
Saha, S., Sandha, S., & Srivastava, M. (2022). Machine Learning for Microcontroller-Class Hardware: A Review. Institute of Electrical and Electronics Engineers Sensors Journal, 22(22):21362-21390. doi: 10.1109/jsen.2022.3210773.
Sánchez, J. (2024). Comparativas de plataformas software para TinyML Tesis de Maestría, Universitat Politècnica de València. https://riunet.upv.es/server/api/core/bitstreams/cbac7ab1-a167-48bb-8467-a7b9c8287701/content
Senoo, E., Anggraini, L., Kumi, J., Karolina, L, Akansah, E., Sulyman, H., Mendonça, I., & Aritsugi, M. (2024). IoT Solutions with Artificial Intelligence Technologies for Precision Agriculture: Definitions, Applications, Challenges, and Opportunities. Electronics, 13, 1894. https://doi.org/10.3390/ electronics13101894
Shakeel, M., Sharatchandra, B., Javed, A., Harkin, J., & Finlay, D. (2025). Toward TinyDPFL systems for real-time cardiac healthcare: Trends, challenges, and system-level perspectives on AI algorithms, hardware, and edge intelligence. Journal of Systems Architecture, 168, 103587. https://doi.org/10.1016/j.sysarc.2025.103587
Varghese, B., Wang, N., Bermbach, D., Hong, C., De Lara, E., Shi, W., & Stewart, C. (2021). A Survey on Edge Performance Benchmarking. ACM Computing Surveys, 54(3), 1-33. https://doi.org/10.1145/3444692
Vasilev, V., Shterev, V., & Nenova, M. (2025). Optimizing Activation Function for Parameter Reduction in CNNs on CIFAR-10 and CINIC-10. Applied Sciences, 15, 4292. https:// doi.org/10.3390/app15084292
Villota, J. (2025). Diseño e implementación de solución de Deep Learning sobre un sistema embebido, para la selección automática de mango “Tommy Atkins”. Tesis de Maestría, Escuela Colombiana de Ingeniería. https://repositorio.escuelaing.edu.co/bitstreams/14018709-5511-4932-8f6e-49d0e427f8f0/download
Wang, T., Guo, J., Zhang, B., Yang, G., & Li, D. (2025). Deploying AI on Edge: Advancement and Challenges in Edge Intelligence. Mathematics, 13, 1878. https://doi.org/10.3390/ math13111878
Xu, D., Li, T., Li, Y., Su, X., Tarkoma, S., Jiang, T., Crowcroft, J., & Hui, P. (2021). Edge Intelligence: Empowering Intelligence to the Edge of Network. Proceedings of the IEEE, 109, (11), 1778-1837. DOI: 10.1109/JPROC.2021.3119950
Yan, Z., Zhang, B., & Wang, D. (2024). An FPGA-Based YOLOv5 Accelerator for Real-Time Industrial Vision Applications. Micromachines, 15, 1164. https://doi.org/10.3390/ mi15091164



