EDGE-AI IN EMBEDDED SYSTEMS: ENERGY-COMPUTATIONAL MODELS AND METRICS. SYSTEMATIC REVIEW

Main Article Content

Fernando Ochoa Paredes

Abstract

Edge AI integrates AI, edge computing, and mobile edge computing to process data near the source with low latency, low power consumption, and greater privacy. It addresses the need to run local inference on resource-constrained devices (sensors, MCUs, SBCs like the Jetson Nano or Raspberry Pi, FPGAs, and accelerators like the Edge TPU) without relying on the cloud for real-time processing. This systematic review focuses on hardware-software co-optimization: compact models (quantized and pruned CNNs, lightweight YOLO-lite variants, SNNs) and toolchains (TensorFlow Lite Micro, CMSIS-NN, TVM/microTVM) that balance accuracy, latency, and power while minimizing RAM/Flash footprint. This approach is key in healthcare, transportation, industrial security, and home automation. Although there is a history of this field, it has grown rapidly in the last five years. Articles published between 2020 and 2025 were reviewed using the Google Scholar and Scopus search engines, with Boolean operators applied. Twenty-four articles were included based on computational models, edge hardware, and energy metrics. Edge AI in embedded systems has matured in the development process, but it still relies heavily on prototype development platforms. Similarly, energy metrics need to be standardized to compare realistic performance between solutions, considering external factors that may affect them.

Downloads

Download data is not yet available.

Article Details

Section

Artículos

How to Cite

EDGE-AI IN EMBEDDED SYSTEMS: ENERGY-COMPUTATIONAL MODELS AND METRICS. SYSTEMATIC REVIEW. (2025). Revista De Investigación Intercultural ASAMPITAKOYETE, 1(2), 60-69. https://doi.org/10.58719/es01mt94

References

Blanco, G. (2025). Diseño de un modelo de inferencia energéticamente eficiente de un Vision Transformer implementado en FPGA para su aplicación en sistemas embebidos. Tesis de Pregrado, Instituto Tecnológico de Costa Rica. https://repositoriotec.tec.ac.cr/bitstream/handle/2238/16382/TF10069_BIB314353_Gabriel_Eduardo_Blanco-Mora.pdf?sequence=1&isAllowed=y

Burbano, J., & Estévez, M. (2025). Implementación de arquitecturas de despliegue remoto de firmware para optimizar la operatividad de redes de sensores inalámbricos. Tesis de Pregrado, Universidad del Azuay. http://dspace.uazuay.edu.ec/handle/datos/15723

Cabrera, L., & Orozco, K. Caracterización de rendimiento computacional en plataformas embebidas para aplicaciones de Edge AI en modelos de detección de personas. Tecnología en Marcha, 38 (4), 191-201. https://doi.org/10.18845/tm.v38i4.7754

Calandín, A. (2023). Recuento de personas mediante cámaras de vídeo y ML en el Edge [Tesis de Maestría, Universitat Politècnica de València]. https://riunet.upv.es/handle/10251/199177

Cantos, A., & Loor, J. (2025). Implementación de un sistema de clasificación de banano basado en el estado de maduración. Tesis de Pregrado, Universidad Politécnica Salesiana. http://dspace.ups.edu.ec/handle/123456789/30353

de Prado, M., Rusci, M., Capotondi, A., Donze, R., Benini, L., & Pazos, N. (2021). Robustifying the Deployment of TinyML Models for Autonomous Mini-Vehicles. Sensors, 21, 1339. https://doi.org/ 10.3390/s21041339

Fanariotis, A., Orphanoudakis, T., Kotrotsios, K., Fotopoulos, V., Keramidas, G., & Karkazis, P. (2025). Power Efficient Machine Learning Models Deployment on Edge IoT Devices. Sensors, 23(3), 1595; https://doi.org/10.3390/s23031595

Flores, L., & Sandoval, J. (2025). Ciberseguridad con IA y métricas energéticas. Azcatl, 4, 32-37. doi: 10.24275/aZC2025a006

Giannakopoulos, P., van Knippenberg, B., Chandra, K., Calabretta, N., & Exarchakos, G. (2025). Key metrics for monitoring performance variability in edge computing applications. Journal on Wireless Communications and Networking, 2025 (38). https://doi.org/10.1186/s13638-025-02469-6

Haro, A. (2025). Detección de defectos en objetos en movimiento mediante redes neuronales convolucionales con optimizaciones específicas para hardware NVIDIA. Tesis de Pregrado, Universitat Politècnica de València. https://riunet.upv.es/handle/10251/198954

Heydari, S., & Mahmoud, Q. (2025). Tiny Machine Learning and On-Device Inference: A Survey of Applications, Challenges, and Future Directions. Sensors, 25(10), 3191; https://doi.org/10.3390/s25103191

Josphineleela, R., Sam, G., Ramesh, T., & Balamurugan, K. (2025). Optimized multiple object tracking with conformalized graph neural network and narwhal optimizer for embedded system IoT and mobile edge computing. Ain Shams Engineering Journal, 16, 103581. https://doi.org/10.1016/j.asej.2025.103581

Kang, M., Lee, Y., & Park, M. (2020). Energy Efficiency of Machine Learning in Embedded Systems Using Neuromorphic Hardware. Electronics, 9, 1069. doi:10.3390/electronics9071069

Karim, M., Goni, M., Nahiduzzaman, M., Ahsan, M., Haider, J., & Kowalski, M. (2024). Enhancing agriculture through real-time grape leaf disease classification via an edge device with a lightweight CNN architecture and Grad-CAM. Science Reports, 14(1), 16022. doi: 10.1038/s41598-024-66989-9

Lacalle, I. (2022). Diseño y desarrollo de una arquitectura de Internet de las Cosas de nueva generación orientada al cálculo y predicción de índices compuestos aplicada en entornos reales. [Tesis de Doctorado, Universitat Politècnica de València]. Doi: 10.4995/Thesis/10251/190634

López, D. (2025). Estudio e implementación de redes neuronales de bajo consumo sobre RISC-V para aplicaciones espaciales. Tesis de Pregrado, Universidad de Complutense de Madrid. https://hdl.handle.net/20.500.14352/124200

Page, M., McKenzie, J., Bossuyt, P., Boutron, I., Hoffmann, T., Mulrow, C., ShamseerI, L., Tetzlaff, J., Akl, E., Brennan, S., Chou, R., Glanville, J., Grimshaw, J., Hro´bjartsson, A., Lalu, M., Li, T., Loder, E., Mayo, E., McDonald, S.,… Moher, D. (2021) The PRISMA 2020 statement: An updated guideline for reporting systematic reviews. PLOS Medicine 18(3): e1003583. https://doi.org/10.1371/journal.pmed.1003583

Perticari, J. (2025). Implementación de los modelos de redes neuronales convolucionales Yolo en un dispositivo AVNET ULTRA 96 V2 mediante VITIS-AI. Universidad Miguel Hernández de Elche. http://dspace.umh.es/bitstream/11000/36047/1/TFG-Perticari%20Ventura%2C%20Joaqu%C3%ADn.pdf

Pozo, D., Monge, C., & Recalde, P. (2025). Optimización de modelos de lenguaje grande: Una aproximación con Quantization, ONNX y Pruning para aplicaciones en tiempo real. Revista Ingeniería e Innovación del Futuro, 4(2), 130–146. https://doi.org/10.62465/riif.v4n2.2025.177

Puerta, G. (2025). Rendimiento y costo de modelos de aprendizaje automático para la detección de crisis epilépticas en una plataforma adaptativa de salud electrónica basada en IoT sobre nodos Edge y Fog. Revista Colombiana de Computación, 26(1). https://doi.org/10.29375/25392115.5480

Ramírez, M. (2025). Prototipo de órtesis con estimulación muscular controlado por comandos de voz. Tesis de Maestría, Instituto Tecnológico de Chilpancingo. https://rinacional.tecnm.mx/bitstream/TecNM/10923/1/TESIS%20MARIA%20ISABEL.pdf

Romero, L. (2025). Ejecución de Algoritmos de Inteligencia Artificial en Sistemas de Tiempo Real.Tesis de Maestría, Universitat Politècnica de Catalunya. https://upcommons.upc.edu/server/api/core/bitstreams/c8652cd2-6aad-4375-a907-0cf3cf63eb37/content

Saha, S., Sandha, S., & Srivastava, M. (2022). Machine Learning for Microcontroller-Class Hardware: A Review. Institute of Electrical and Electronics Engineers Sensors Journal, 22(22):21362-21390. doi: 10.1109/jsen.2022.3210773.

Sánchez, J. (2024). Comparativas de plataformas software para TinyML Tesis de Maestría, Universitat Politècnica de València. https://riunet.upv.es/server/api/core/bitstreams/cbac7ab1-a167-48bb-8467-a7b9c8287701/content

Senoo, E., Anggraini, L., Kumi, J., Karolina, L, Akansah, E., Sulyman, H., Mendonça, I., & Aritsugi, M. (2024). IoT Solutions with Artificial Intelligence Technologies for Precision Agriculture: Definitions, Applications, Challenges, and Opportunities. Electronics, 13, 1894. https://doi.org/10.3390/ electronics13101894

Shakeel, M., Sharatchandra, B., Javed, A., Harkin, J., & Finlay, D. (2025). Toward TinyDPFL systems for real-time cardiac healthcare: Trends, challenges, and system-level perspectives on AI algorithms, hardware, and edge intelligence. Journal of Systems Architecture, 168, 103587. https://doi.org/10.1016/j.sysarc.2025.103587

Varghese, B., Wang, N., Bermbach, D., Hong, C., De Lara, E., Shi, W., & Stewart, C. (2021). A Survey on Edge Performance Benchmarking. ACM Computing Surveys, 54(3), 1-33. https://doi.org/10.1145/3444692

Vasilev, V., Shterev, V., & Nenova, M. (2025). Optimizing Activation Function for Parameter Reduction in CNNs on CIFAR-10 and CINIC-10. Applied Sciences, 15, 4292. https:// doi.org/10.3390/app15084292

Villota, J. (2025). Diseño e implementación de solución de Deep Learning sobre un sistema embebido, para la selección automática de mango “Tommy Atkins”. Tesis de Maestría, Escuela Colombiana de Ingeniería. https://repositorio.escuelaing.edu.co/bitstreams/14018709-5511-4932-8f6e-49d0e427f8f0/download

Wang, T., Guo, J., Zhang, B., Yang, G., & Li, D. (2025). Deploying AI on Edge: Advancement and Challenges in Edge Intelligence. Mathematics, 13, 1878. https://doi.org/10.3390/ math13111878

Xu, D., Li, T., Li, Y., Su, X., Tarkoma, S., Jiang, T., Crowcroft, J., & Hui, P. (2021). Edge Intelligence: Empowering Intelligence to the Edge of Network. Proceedings of the IEEE, 109, (11), 1778-1837. DOI: 10.1109/JPROC.2021.3119950

Yan, Z., Zhang, B., & Wang, D. (2024). An FPGA-Based YOLOv5 Accelerator for Real-Time Industrial Vision Applications. Micromachines, 15, 1164. https://doi.org/10.3390/ mi15091164