Verificación Humano en el Ciclo (HITL)

Verificación Humano en el Ciclo (HITL) en la Inspección Automatizada

Definición y Fundamentos

Humano en el ciclo (HITL) es un paradigma arquitectónico para sistemas semiautomatizados en el que un modelo de aprendizaje automático realiza un procesamiento inicial sobre los datos, y un operador humano posteriormente revisa, valida o corrige los resultados del modelo antes de que sean aceptados como definitivos. En el contexto de la inspección de infraestructuras, HITL se refiere específicamente a flujos de trabajo donde un algoritmo de detección de defectos basado en IA procesa imágenes de alta resolución de puentes, pavimentos, pistas de aterrizaje o instalaciones aeroportuarias, asigna puntuaciones de confianza a cada anomalía detectada y luego deriva las detecciones de baja confianza o ambiguas a un inspector calificado para su adjudicación manual.

El fundamento principal de HITL en la inspección surge de las limitaciones inherentes de los modelos actuales de visión artificial cuando se despliegan en entornos críticos para la seguridad. Los modelos de aprendizaje profundo, incluyendo las redes neuronales convolucionales (CNN) y los transformadores de visión, alcanzan una alta precisión en conjuntos de datos de referencia, pero pueden fallar de manera impredecible en casos límite — condiciones de iluminación inusuales, morfologías de grietas novedosas, contaminantes superficiales que imitan patrones de defectos, u oclusiones por vegetación o escombros. Un estudio de 2024 de la Universidad Estatal de Míchigan que evaluó siete modelos de lenguaje grandes multimodales para la evaluación del estado de pavimentos encontró que, si bien modelos como GPT-4o lograron un rendimiento sólido en la identificación estándar de deterioros, todos los modelos mostraron variabilidad en tareas de reconocimiento de patrones espaciales y evaluación de severidad que requieren comprensión contextual. La arquitectura HITL reconoce que, para activos de infraestructura donde una falla puede tener consecuencias catastróficas, la eficiencia de la máquina debe subordinarse al juicio humano en el punto de decisión final.

Inspector revisando defectos detectados por IA en una tableta durante la inspección de un puente

El enfoque HITL también aborda la brecha de responsabilidad que surge cuando las decisiones son tomadas enteramente por algoritmos. En industrias reguladas — aviación, infraestructura vial, instalaciones nucleares — los informes de inspección deben llevar la firma de un profesional certificado que asume la responsabilidad legal por los hallazgos. La Agencia Europea de Seguridad Aérea (EASA) ha emitido directrices en el marco de su Hoja de Ruta de IA que establecen que las aplicaciones de IA de alto riesgo en el mantenimiento de la aviación deben incluir “una supervisión humana significativa” con “la capacidad de anular o revertir decisiones”. De manera similar, los Estándares Nacionales de Inspección de Puentes (NBIS) de la Administración Federal de Carreteras (FHWA) de EE. UU. exigen que las calificaciones del estado de los puentes sean asignadas por un líder de equipo que cumpla con criterios de calificación específicos, un requisito que no puede delegarse al software.

Un informe de 2024 de las Academias Nacionales sobre aplicaciones de IA para la evaluación automática del estado de pavimentos enfatizó que “la verificación humana de los resultados de detección automatizada de deterioros es esencial para mantener la calidad de los datos y garantizar que las decisiones de mantenimiento se basen en evaluaciones confiables”. El informe documentó que las agencias que implementaron evaluación de pavimentos totalmente automatizada sin revisión humana experimentaron tasas de error del 15-25% en grietas de severidad moderada, en comparación con el 3-8% cuando un humano revisaba los resultados de la IA.

Arquitectura HITL: De la Detección por IA al Informe Final

La arquitectura HITL estándar para la inspección de infraestructuras sigue un proceso estructurado de cinco etapas que transforma los datos brutos de los sensores en una evaluación de estado verificada. Cada etapa tiene requisitos técnicos específicos y puntos de control de calidad.

Etapa 1: Adquisición de Datos

Las imágenes de alta resolución se capturan utilizando vehículos aéreos no tripulados (UAV), vehículos de inspección equipados con cámaras de barrido lineal o cámaras de posición fija montadas en pórticos. Para inspecciones de puentes, una misión típica de UAV recoge entre 5,000 y 10,000 imágenes a resoluciones de 20 a 50 megapíxeles, con distancias de muestreo sobre el terreno (GSD) de 0.5 a 2 mm por píxel. Para estudios de pavimentos, vehículos especializados capturan imágenes continuas a velocidades de autopista utilizando múltiples cámaras sincronizadas que cubren un ancho de carril de 4 metros. La fase de adquisición de datos debe incluir un control de calidad riguroso — detección de desenfoque, validación de exposición y verificación de georreferenciación — porque el rendimiento posterior de la IA está limitado por la calidad de la entrada.

Etapa 2: Motor de Inferencia de IA

Las imágenes adquiridas son procesadas por un motor de inferencia de aprendizaje profundo, típicamente basado en una arquitectura CNN como YOLOv8, Faster R-CNN o una variante de U-Net para segmentación semántica. El modelo realiza detección a nivel de píxel o mediante cuadros delimitadores de clases de defectos predefinidas. Para la inspección de puentes, estas clases incluyen típicamente grietas (transversales, longitudinales, diagonales, mapificadas), descascaramientos, delaminaciones, manchas de corrosión, armadura expuesta y daños en juntas. Para la inspección de pavimentos, las clases incluyen fatiga, agrietamiento en bloque, agrietamiento de borde, ahuellamiento, desprendimiento, baches y parcheos.

Cada detección va acompañada de una puntuación de confianza que varía de 0.0 a 1.0, que representa la estimación del modelo de la probabilidad de que la detección sea un verdadero positivo. El motor de inferencia también produce metadatos que incluyen coordenadas de detección en el espacio de la imagen, dimensiones del defecto en píxeles (o en unidades físicas si hay datos de calibración disponibles) y la etiqueta de clasificación.

Etapa 3: Enrutamiento Basado en Confianza

Los resultados de la IA son procesados por un módulo de enrutamiento que aplica umbrales de confianza configurables para clasificar las detecciones. La lógica de enrutamiento utiliza típicamente un sistema de dos umbrales:

Rango de ConfianzaDecisión de EnrutamientoJustificación
0.95 – 1.00AutoaceptarVerdaderos positivos de alta confianza; riesgo mínimo de falsos positivos
0.50 – 0.95Derivar a revisión humanaDetecciones ambiguas que requieren juicio experto
0.00 – 0.50AutorechazarFalsos positivos de alta confianza; filtrados como ruido

Los valores de umbral son específicos del sitio y ajustables. Una inspección de puente en un miembro crítico para fractura (FCM) puede reducir el umbral de revisión a 0.70 para garantizar que todos los defectos potencialmente significativos sean revisados por humanos. Un estudio de pavimento en una carretera rural de bajo volumen puede elevar el umbral a 0.90, aceptando una tasa ligeramente mayor de falsos negativos a cambio de una carga de revisión reducida.

Etapa 4: Interfaz de Revisión Humana

Las detecciones señaladas se presentan a un inspector calificado a través de una interfaz de revisión especializada. La interfaz muestra típicamente el defecto detectado con el cuadro delimitador generado por IA o la superposición de segmentación, la puntuación de confianza, la clasificación del defecto e información contextual como el identificador del activo (número de puente, sección de pavimento), coordenadas de ubicación y datos históricos de inspección si están disponibles.

El inspector tiene tres acciones posibles para cada detección señalada:

  • Confirmar — Aceptar la predicción de la IA como correcta; la detección pasa a formar parte del informe final
  • Rechazar — Descartar la detección como un falso positivo
  • Corregir — Modificar la predicción de la IA ajustando el cuadro delimitador, cambiando la clasificación o actualizando la calificación de severidad

Las interfaces de revisión modernas incorporan atajos de teclado y operaciones por lotes para acelerar el proceso de revisión. Un inspector experimentado puede revisar entre 200 y 500 defectos señalados por hora, dependiendo de la densidad de defectos y la complejidad de la imagen. La sesión de revisión produce un registro de auditoría que documenta cada acción del inspector, lo cual es fundamental para el aseguramiento de la calidad y el cumplimiento normativo.

Etapa 5: Generación del Informe Final

El informe final de estado integra las detecciones de alta confianza autoaceptadas con las detecciones señaladas verificadas por humanos. El informe calcula métricas agregadas como la densidad de defectos (porcentaje de superficie afectada por cada tipo de defecto), el Índice de Condición de Pavimento (PCI) para campos de aviación o carreteras, o calificaciones de estado a nivel de elementos para puentes siguiendo el marco de inspección a nivel de elementos de la AASHTO.

Interfaz de detección de defectos por IA que muestra puntuaciones de confianza en el análisis de grietas de pavimento

Umbrales de Confianza para la Señalización

Los umbrales de confianza son los parámetros de ajuste críticos que determinan la eficiencia operativa y el margen de seguridad de cualquier sistema de inspección HITL. Establecer umbrales demasiado agresivos (aceptar predicciones de baja confianza) aumenta el riesgo de falsos negativos — defectos pasados por alto que podrían comprometer la integridad estructural. Establecer umbrales demasiado conservadores (derivar todo a revisión humana) anula el propósito de eficiencia de la automatización.

La curva de característica operativa del receptor (ROC) del modelo de IA proporciona la base analítica para la selección del umbral. La curva ROC representa la tasa de verdaderos positivos (sensibilidad) frente a la tasa de falsos positivos para cada valor de umbral posible. El área bajo la curva ROC (AUC) resume la capacidad discriminatoria general del modelo. Un modelo con un AUC de 0.95 o superior en datos de prueba representativos se considera generalmente adecuado para el despliegue HITL.

Las mejores prácticas de la industria recomiendan calibrar los umbrales utilizando una matriz de costos que asigne ponderaciones monetarias o basadas en riesgo a cada tipo de error:

Tipo de ErrorConsecuenciaCosto Relativo
Falso negativo (grieta crítica pasada por alto)Posible fallo estructural, peligro para la seguridadMuy alto
Falso negativo (defecto cosmético pasado por alto)Mantenimiento retrasado, mayor costo de ciclo de vidaMedio
Falso positivo (señalización de no defecto)Tiempo de revisión del inspector desperdiciadoBajo
Clasificación errónea (cuadro correcto, clase incorrecta)Calificación de estado incorrectaMedio

El proceso de calibración del umbral implica típicamente ejecutar el modelo de IA contra un conjunto de datos de validación de al menos 5,000 a 10,000 imágenes que hayan sido etiquetadas de forma independiente por inspectores certificados. Las detecciones del modelo se comparan con las etiquetas de referencia, y el umbral se ajusta para lograr una tasa objetivo de falsos negativos — comúnmente del 1-2% para elementos de puentes críticos para fractura y del 5-8% para estudios generales de pavimentos.

El umbral dinámico es una práctica emergente donde los umbrales se ajustan en tiempo real según las condiciones ambientales, las métricas de calidad de imagen o la criticidad del activo. Por ejemplo, si el vehículo de inspección encuentra lluvia intensa o condiciones de baja luminosidad que degradan la calidad de la imagen, el sistema reduce automáticamente su umbral de confianza para derivar más detecciones a revisión humana, compensando la mayor incertidumbre en las predicciones del modelo.

Interfaces de Revisión y Flujos de Trabajo

La interfaz de revisión humana es el centro operativo de un sistema de inspección HITL. Su diseño impacta directamente tanto en la velocidad como en la precisión del proceso de verificación. Las interfaces mal diseñadas inducen fatiga en el operador, aumentan las tasas de error y crean cuellos de botella que anulan las ganancias de productividad de la automatización con IA.

Las interfaces de revisión efectivas incorporan varios principios clave de diseño:

Visualización paralela del resultado de la IA y la imagen de origen. La interfaz debe superponer la detección de la IA (cuadro delimitador, máscara de segmentación o mapa de calor) sobre la imagen original, con controles para activar y desactivar la superposición. Esto permite al inspector ver exactamente lo que el modelo detectó, manteniendo al mismo tiempo la capacidad de inspeccionar la imagen en bruto en busca de defectos no detectados.

Ayudas de navegación contextual. La interfaz debe proporcionar un sistema de navegación a nivel de defecto (avanzar/retroceder entre detecciones señaladas) integrado con navegación a nivel de activo (p. ej., selector de elementos de puente o mapa de secciones de pavimento). La plataforma Twinsity Twinspect, demostrada en una prueba de concepto de 2025 con Die Autobahn GmbH en puentes de autopistas alemanas, implementó una vista consolidada donde los daños que aparecen en múltiples imágenes se fusionan en registros de defectos únicos, reduciendo la redundancia y acelerando la revisión por parte del inspector de más de 600 anomalías detectadas por IA.

Visualización de la puntuación de confianza. Cada detección debe mostrar su puntuación de confianza numérica y visualmente — típicamente como una etiqueta codificada por colores (verde para alta confianza, amarillo para media, rojo para baja). Esto ayuda al inspector a priorizar la atención en las detecciones más inciertas primero, un flujo de trabajo conocido como revisión guiada por incertidumbre.

Registro de pista de auditoría. Cada acción realizada por el inspector — confirmar, rechazar, corregir, saltar — debe tener marca de tiempo, identificación de usuario y registrarse en una pista de auditoría inmutable. Esto no es opcional; es un requisito normativo para cualquier dato de inspección que alimente sistemas de gestión de seguridad o informes de cumplimiento.

Confirmación por lotes para revisiones de alto volumen. Para inspecciones con miles de detecciones señaladas, la interfaz debe admitir la selección por lotes y la confirmación masiva de detecciones similares de bajo riesgo. Un inspector que revisa grietas de pavimento en un tramo de autopista de 10 km puede encontrar cientos de grietas transversales idénticas; agruparlas en una sola acción de confirmación reduce drásticamente el tiempo de revisión.

La secuencia del flujo de trabajo de revisión sigue típicamente este orden:

  1. El inspector inicia sesión en la plataforma HITL y carga la asignación de inspección
  2. El sistema muestra un panel con el total de detecciones señaladas para revisión, desglosadas por tipo de defecto y banda de confianza
  3. El inspector comienza a revisar las detecciones, empezando por los elementos de menor confianza primero
  4. Para cada detección, el inspector examina la superposición de IA sobre la imagen original y toma una decisión de confirmar/rechazar/corregir
  5. El sistema avanza automáticamente a la siguiente detección
  6. Al finalizar, el sistema genera un resumen de verificación que muestra la proporción de detecciones confirmadas, rechazadas y corregidas
  7. Las detecciones verificadas se fusionan con las detecciones autoaceptadas en el informe final

Corrección Humana de Predicciones de IA

La corrección humana de las predicciones de la IA es una de las funciones más valiosas en un sistema HITL. Cuando un inspector corrige un resultado de la IA — ajustando un cuadro delimitador mal colocado, reclasificando un tipo de defecto mal identificado o actualizando una calificación de severidad — el sistema captura no solo el resultado corregido, sino también la diferencia entre la predicción de la IA y la verdad de referencia humana. Esta diferencia es la señal que impulsa la mejora del modelo a través del aprendizaje activo.

Los tipos comunes de corrección en la inspección de infraestructuras incluyen:

Ajuste del cuadro delimitador. La IA puede identificar correctamente que existe un defecto, pero colocar el cuadro delimitador de manera imprecisa — demasiado ajustado (cortando parte de la grieta) o demasiado holgado (incluyendo superficie no defectuosa). El inspector ajusta el cuadro para que encierre precisamente el defecto, y el sistema registra el IoU (Intersección sobre Unión) entre la predicción de la IA y la corrección humana. Puntuaciones IoU bajas repetidas en clases de defectos específicas indican la necesidad de reentrenar el modelo con mejores ejemplos de localización.

Corrección de clasificación. La IA puede detectar una grieta pero clasificarla como “transversal” cuando en realidad es “longitudinal”. Esta clasificación errónea tiene consecuencias para la calificación de estado, porque diferentes tipos de grietas se corresponden con diferentes matrices de severidad en los sistemas de gestión de pavimentos (p. ej., ASTM D6433 para el cálculo del PCI). El inspector corrige la etiqueta, y el sistema registra la entrada de la matriz de confusión, creando un conjunto de datos de casos de clasificación difíciles.

Reevaluación de severidad. Muchos protocolos de evaluación de estado requieren calificaciones de severidad (baja, media, alta, o una escala numérica) basadas en las dimensiones del defecto. La IA puede identificar y localizar correctamente una grieta, pero estimar mal su ancho o largo, lo que lleva a una asignación incorrecta de severidad. El inspector corrige la severidad, y el sistema registra la discrepancia de medición.

Descarte de falsos positivos. La acción más común del inspector para detecciones de baja confianza es el rechazo — la IA señaló una característica superficial (mancha de aceite, sombra, marca de neumático, junta) que no es un defecto. Cada rechazo es un ejemplo de falso positivo etiquetado que mejora la capacidad de discriminación del modelo.

Un estudio de prueba de concepto de 2025 realizado por Twinsity en cooperación con Die Autobahn GmbH demostró el impacto práctico de la corrección humana. El modelo de IA detectó inicialmente 600 anomalías en un puente de autopista alemán, de las cuales 176 eran grietas confirmadas por ingenieros estructurales. A través del proceso de revisión HITL, los inspectores corrigieron las clasificaciones de la IA, refinaron los cuadros delimitadores y rechazaron falsos positivos. El recuento final verificado de 156 grietas confirmadas arrojó una tasa de precisión del 88.6%, que aumentó a más del 95% después de que los datos de corrección se utilizaran para el ajuste fino del modelo.

Aprendizaje Activo a partir de la Retroalimentación Humana

La integración de HITL con el aprendizaje activo crea un ciclo de mejora continua que reduce progresivamente la carga de revisión humana con el tiempo. El aprendizaje activo es una estrategia de aprendizaje automático donde el algoritmo identifica qué puntos de datos no etiquetados serían más informativos para mejorar el rendimiento del modelo y solicita etiquetas para esos puntos específicos a un anotador humano.

En el contexto de la inspección HITL, el aprendizaje activo funciona de la siguiente manera:

  1. El modelo de IA procesa nuevas imágenes de inspección y genera predicciones con puntuaciones de confianza
  2. El sistema identifica las detecciones con mayor incertidumbre — aquellas más cercanas al límite de decisión entre verdadero positivo y falso positivo
  3. Estas detecciones inciertas se derivan al inspector humano para su verificación
  4. Las etiquetas confirmadas o corregidas por el inspector se convierten en datos de entrenamiento para la próxima actualización del modelo
  5. El modelo se reentrena o ajusta en el conjunto de datos ampliado, mejorando su precisión en los casos previamente inciertos
  6. A lo largo de ciclos de inspección sucesivos, el número de detecciones que requieren revisión humana disminuye

La estrategia de consulta para seleccionar qué detecciones derivar para etiquetado humano es crítica. Las estrategias comunes incluyen:

  • Muestreo de menor confianza: Derivar detecciones con puntuaciones de confianza más cercanas al umbral de decisión (p. ej., 0.45–0.55)
  • Muestreo de margen: Derivar detecciones donde la diferencia entre las dos probabilidades de clase más altas es menor
  • Muestreo de entropía: Derivar detecciones con la mayor entropía de predicción, indicando que el modelo está más inseguro sobre la clasificación

Un estudio publicado en Automation in Construction que evaluó sistemas HITL habilitados por automatización para la inspección visual de infraestructuras encontró que el aprendizaje activo redujo la carga de trabajo de etiquetado humano en un 60-75% en comparación con el muestreo aleatorio, manteniendo una precisión de modelo equivalente. El estudio documentó que después de cinco ciclos de aprendizaje activo en un conjunto de datos de detección de grietas, el modelo alcanzó un 94.7% de precisión con solo el 30% de los datos de entrenamiento requiriendo revisión humana.

La implementación del aprendizaje activo en sistemas HITL de producción requiere gestión de modelos versionados. Cada ciclo de reentrenamiento produce una nueva versión del modelo que debe ser validada contra un conjunto de prueba reservado antes del despliegue. El sistema también debe admitir pruebas A/B — ejecutar el nuevo modelo en modo oculto junto al modelo de producción actual para verificar que las mejoras de rendimiento se generalizan a nuevos datos de inspección antes de comprometerse con la actualización.

HITL para la Inspección de Puentes

La inspección de puentes es la aplicación más crítica para la seguridad de la tecnología HITL en infraestructuras. Estados Unidos tiene más de 617,000 puentes, de los cuales aproximadamente el 42% tienen más de 50 años y el 7.5% están clasificados como estructuralmente deficientes según el Boletín de Calificaciones de Infraestructura 2024 de la Sociedad Estadounidense de Ingenieros Civiles (ASCE). Los Estándares Nacionales de Inspección de Puentes (NBIS) codificados en 23 CFR 650 exigen que todos los puentes en vías públicas sean inspeccionados en intervalos no superiores a 24 meses por líderes de equipo calificados.

La documentación de la FHWA enfatiza que la verificación humana no es negociable para las calificaciones de estado asignadas bajo el marco NBIS. Las escalas de calificación de estado para elementos de puente (0–9 para tablero, superestructura y subestructura según la guía de codificación del Inventario Nacional de Puentes) requieren que el inspector sintetice múltiples condiciones observables en una sola calificación numérica — una tarea que los sistemas de IA actuales no pueden realizar de manera confiable porque requiere comprensión de las rutas de carga estructural, el comportamiento de los materiales y los mecanismos de deterioro.

El flujo de trabajo de inspección HITL de puentes integra múltiples fuentes de datos:

Dron capturando imágenes de alta resolución de un puente de autopista para inspección basada en IA

Imágenes de UAV proporcionan datos visuales de alta resolución de todas las superficies accesibles del puente — tablero, trasdós, vigas, pilares, estribos, apoyos y juntas. Una inspección típica de puente con UAV recoge entre 3,000 y 8,000 imágenes por estructura, dependiendo del tamaño y la complejidad del puente. El motor de inferencia de IA procesa estas imágenes para detectar grietas, descascaramientos, corrosión y otros defectos visibles.

Datos de radar de penetración terrestre (GPR) se utilizan junto con imágenes visuales para la detección de delaminación del tablero y la evaluación de corrosión de la armadura. Si bien la interpretación de la señal GPR requiere experiencia especializada, los modelos de IA pueden señalar patrones de señal anómalos para revisión humana.

El papel del inspector en el sistema HITL no es meramente confirmar o rechazar predicciones de la IA, sino añadir juicio de ingeniería estructural que la IA no puede proporcionar. El inspector revisa las detecciones señaladas en el contexto de la capacidad de carga conocida del puente, el volumen de tráfico, la exposición ambiental y el historial de inspección. Una grieta capilar en el alma de una viga de hormigón pretensado puede ser señalada inmediatamente para reparación urgente, mientras que una grieta idéntica en un miembro secundario de diafragma puede calificarse como una observación menor — una distinción que depende del conocimiento de ingeniería estructural, no del reconocimiento de patrones a nivel de píxel.

El marco recomendado por la FHWA para un programa de GC/AC de inspección de puentes, actualizado en 2024, aborda explícitamente la integración de tecnologías de inspección automatizada. El marco exige que cualquier sistema automatizado de detección de grietas sea validado contra la inspección manual en al menos el 10% de los elementos del puente, con los resultados de validación documentados y revisados por el líder del equipo de inspección. Este enfoque de doble validación es un proceso HITL formalizado que garantiza que la automatización sirva como una herramienta de apoyo a la decisión, no como un reemplazo del juicio profesional.

HITL para la Inspección de Pavimentos

La evaluación del estado de pavimentos ha sido una de las primeras en adoptar tecnología de inspección automatizada debido a los altos volúmenes de datos involucrados — una sola agencia de carreteras puede gestionar entre 10,000 y 50,000 km-carril de pavimento, con intervalos de inspección de 1 a 3 años. Los estudios visuales manuales a esta escala son prohibitivamente costosos, requiriendo de 30 a 50 días-persona por cada 100 km-carril. Los métodos asistidos por IA pueden procesar la misma red en 5 a 10 horas de tiempo de cómputo, pero los resultados deben ser verificados por inspectores humanos antes de que puedan utilizarse para decisiones de programación de mantenimiento.

El flujo de trabajo HITL para la inspección de pavimentos utiliza típicamente cámaras de barrido lineal montadas en vehículos de estudio que viajan a velocidades de autopista (80–100 km/h), capturando imágenes continuas de 360 grados de la superficie del pavimento. Las imágenes se georreferencian utilizando sistemas GPS/IMU con precisión de 10 a 50 cm. El modelo de IA segmenta la superficie del pavimento en categorías de defectos y calcula métricas de densidad de deterioro.

Las directrices de la Asociación Estadounidense de Funcionarios de Carreteras y Transporte Estatales (AASHTO) para la recopilación de datos de condición de pavimentos reconocen el papel de los sistemas automatizados, manteniendo al mismo tiempo los requisitos de verificación humana. El estándar AASHTO PP 89-21 para la recopilación automatizada de datos de deterioro de pavimentos especifica procedimientos de aseguramiento de calidad que incluyen:

  • Verificación de campo: Al menos el 5% de las secciones de estudio deben ser verificadas mediante inspección manual dentro de los 30 días posteriores al estudio automatizado
  • Pruebas de repetibilidad: El sistema automatizado debe demostrar una repetibilidad de ±5% en las cantidades de deterioro al reevaluar la misma sección dentro de 24 horas
  • Revisión humana de casos límite: Todas las secciones con cantidades de deterioro que superen los umbrales predefinidos (p. ej., >20% de área agrietada) deben ser revisadas manualmente

La interfaz de revisión HITL para la inspección de pavimentos presenta típicamente una vista de gráfico de tira que muestra la superficie del pavimento con defectos detectados por IA codificados por colores según tipo y severidad. El inspector se desplaza por las imágenes continuas del pavimento, revisando las secciones señaladas y verificando la evaluación de estado de la IA. Para las agencias que utilizan la metodología del Índice de Condición de Pavimento (PCI) según ASTM D6433, el sistema HITL calcula los valores de PCI a partir de los datos de defectos verificados, y el inspector acepta o anula el valor calculado en función de su conocimiento de campo.

Un estudio de 2025 de las Academias Nacionales sobre aplicaciones de IA para la evaluación automática del estado de pavimentos encontró que los sistemas HITL alcanzaron un 92-96% de concordancia con la inspección manual en la identificación de deterioros, en comparación con el 78-85% de los sistemas totalmente automatizados sin revisión humana. El estudio también encontró que HITL redujo el tiempo de inspección en un 55-70% en comparación con los métodos puramente manuales, manteniendo al mismo tiempo el cumplimiento de los estándares de calidad de datos de la AASHTO.

Aceptación Normativa de HITL

El panorama normativo para la IA en la inspección de infraestructuras está evolucionando rápidamente, pero el tema consistente en todos los marcos principales es que la supervisión humana es obligatoria para las decisiones relacionadas con la seguridad.

Organización de Aviación Civil Internacional (OACI) — Según el Anexo 14 de la OACI, Volumen I (Diseño y Operaciones de Aeródromos), el operador del aeródromo es responsable de garantizar que las pistas, calles de rodaje y superficies de plataforma se mantengan en condiciones aceptables para las operaciones de aeronaves. Si bien la OACI no prohíbe explícitamente la inspección automatizada, el requisito de que el “operador del aeródromo establecerá un programa de inspección” que sea “aceptable para el Estado” implica implícitamente que las evaluaciones de estado deben ser realizadas o verificadas por personal competente. El Documento 9157 de la OACI (Manual de Diseño de Aeródromos) hace referencia a la metodología del Índice de Condición de Pavimento (PCI), que requiere inspección visual por evaluadores capacitados a menos que el Estado apruebe un procedimiento alternativo.

Agencia Europea de Seguridad Aérea (EASA) — La Hoja de Ruta de IA 2.0 de la EASA, publicada en 2024, establece un enfoque gradual para la IA en la aviación. Bajo el Nivel 2 (“Colaboración Humano-IA”), que cubre la inspección asistida por IA, la agencia exige: (a) que el humano conserve la autoridad final de decisión, (b) que el sistema de IA proporcione explicaciones de sus resultados, y (c) que el sistema pueda ser anulado o desactivado en cualquier momento por el operador humano. Estos requisitos se corresponden directamente con la arquitectura HITL.

Administración Federal de Aviación (FAA) — La Circular de Asesoramiento AC 150/5380-6C de la FAA sobre “Directrices para Programas de Gestión de Pavimentos” establece que los métodos automatizados de recopilación de datos son aceptables siempre que “el equipo de recopilación de datos esté certificado y los datos sean validados por un ingeniero con experiencia en evaluación de pavimentos”. Este doble requisito — certificación del equipo más validación humana — es un mandato HITL formal.

Administración Federal de Carreteras (FHWA) — Los NBIS de la FHWA (23 CFR 650 Subparte C) exigen que todas las inspecciones de puentes sean realizadas por o bajo la dirección de un líder de equipo que cumpla con requisitos de calificación específicos (Ingeniero Profesional o inspector de puentes certificado con umbrales mínimos de experiencia). Si bien se permite la recopilación automatizada de datos, la calificación del estado debe ser determinada por el líder del equipo. La guía del proceso de revisión NBIS 2024 de la FHWA confirma que “las tecnologías de inspección automatizada complementan, pero no reemplazan, el juicio profesional del líder del equipo”.

ISO 55001 (Gestión de Activos) — El estándar internacional para la gestión de activos exige que los datos de condición utilizados para la toma de decisiones sean confiables, repetibles y verificables. Los flujos de trabajo HITL satisfacen estos requisitos al mantener la verificación humana como el control de calidad final.

La implicación práctica de este entorno normativo es que HITL no es meramente una preferencia técnica para la inspección de infraestructuras — es un requisito de cumplimiento. Cualquier organización que implemente IA para la inspección de activos de aviación, carreteras o estructurales debe implementar un proceso de revisión humana para satisfacer las obligaciones normativas. La arquitectura exacta puede variar — algunas agencias exigen una revisión humana del 100% de todas las detecciones, mientras que otras aceptan un muestreo estadístico — pero el principio de verificación humana es universal.

Totalmente Automatizado vs. HITL

La distinción entre la inspección totalmente automatizada y la inspección humano en el ciclo es fundamental para comprender las decisiones de implementación en la gestión de activos de infraestructura. Cada enfoque tiene características, beneficios y limitaciones distintos:

DimensiónTotalmente AutomatizadoHumano en el Ciclo
Autoridad de decisiónModelo de IAInspector humano
RendimientoMuy alto (100,000+ imágenes/hora)Moderado (200–500 elementos señalados/hora)
Manejo de casos límiteDeficiente — el modelo falla en patrones novedososBueno — el humano se adapta a situaciones novedosas
ResponsabilidadDifusa — sin una sola entidad responsableClara — el inspector certificado asume la responsabilidad
Cumplimiento normativoLimitado — la mayoría de las normas exigen aprobación humanaEstablecido — satisface los marcos normativos existentes
Mejora continuaRequiere canalización de datos separadaIncorporada mediante aprendizaje activo
Costo por inspecciónBajo después del despliegue inicialMás alto debido a la mano de obra humana
Tasa de falsos negativos10–25% en defectos ambiguos2–5% después de revisión humana
Adecuado paraActivos de bajo riesgo, cribado inicial, alto volumenActivos críticos para la seguridad, evaluación final de estado, regulados

La decisión entre el despliegue totalmente automatizado y HITL depende de la categoría de riesgo del activo que se inspecciona. Los activos de bajo riesgo — como carreteras secundarias, elementos estructurales no portantes y condiciones cosméticas superficiales — pueden ser candidatos para inspección totalmente automatizada donde el costo de los falsos negativos es aceptable. Los activos críticos para la seguridad — puentes, pistas de aterrizaje, túneles, presas y carreteras de alto tráfico — requieren HITL porque la consecuencia de pasar por alto un defecto crítico es inaceptable.

Una encuesta de 2024 a 47 Departamentos de Transporte estatales de EE. UU. encontró que el 93% de las agencias que utilizan recopilación automatizada de datos de pavimentos emplean alguna forma de verificación humana, que va desde el muestreo aleatorio (10% de las secciones) hasta la revisión exhaustiva de todas las secciones señaladas como deficientes. Solo el 7% aceptó datos automatizados sin verificación humana, y esas agencias limitaron la aceptación exclusivamente automatizada a carreteras locales de bajo volumen y en buen estado. Para la inspección de puentes, la misma encuesta encontró que el 100% de las agencias mantenían requisitos de verificación humana, siendo el enfoque más común la revisión humana de todas las anomalías detectadas por IA combinada con verificaciones aleatorias por muestreo del 15-20% de las imágenes clasificadas como libres de defectos.

La tendencia operativa se dirige hacia modelos híbridos que ajustan el grado de automatización según el estado del activo. Un puente en buen estado (calificación NBI 7–9) puede procesarse con umbrales de autoaceptación de alta confianza y una revisión humana mínima, mientras que un puente en mal estado (calificación NBI 3–4) puede tener todas las detecciones derivadas para revisión humana, independientemente de la puntuación de confianza. Este enfoque HITL adaptativo al riesgo optimiza el esfuerzo del inspector al asignar atención a los activos donde proporciona el mayor beneficio de seguridad.

Conclusión

La verificación humano en el ciclo representa el estado del arte actual en la inspección automatizada de infraestructuras. La arquitectura HITL — que combina la detección inicial basada en IA con el enrutamiento basado en confianza y la revisión humana obligatoria — ofrece los beneficios de productividad de la automatización, manteniendo al mismo tiempo la responsabilidad de seguridad y el juicio profesional que exigen las normas regulatorias. La calibración de umbrales, el diseño de la interfaz de revisión, los flujos de trabajo de corrección humana y la integración del aprendizaje activo son los elementos técnicos que determinan si un sistema HITL opera de manera efectiva en la práctica.

Para la inspección de puentes, la evaluación del estado de pavimentos, la evaluación de pistas de aeropuertos y el cumplimiento del mantenimiento de aeródromos, HITL no es un enfoque transitorio hacia la autonomía total — es la mejor práctica demostrada que equilibra las fortalezas complementarias de las máquinas y los humanos. A medida que la precisión de los modelos de IA continúe mejorando, la carga de revisión humana disminuirá mediante el aprendizaje activo, pero el principio de verificación humana para decisiones críticas para la seguridad seguirá siendo un requisito normativo y ético.

Preguntas Frecuentes

Mejore sus Flujos de Trabajo de Inspección con HITL

Implemente procesos de verificación humano en el ciclo que combinen la velocidad de la detección de defectos impulsada por IA con la responsabilidad de la revisión de un inspector certificado. Contáctenos para saber cómo nuestras soluciones se integran en los flujos de trabajo HITL para inspecciones de puentes, pavimentos y campos de aviación.

Saber más

Detección de Grietas Basada en IA para Inspección de Infraestructura

Detección de Grietas Basada en IA para Inspección de Infraestructura

La detección de grietas basada en IA utiliza visión por computadora — redes neuronales convolucionales, transformadores de visión y modelos de segmentación semá...

45 min de lectura
Computer Vision Deep Learning +8
Inspección automatizada de infraestructura con drones

Inspección automatizada de infraestructura con drones

La inspección automatizada con drones utiliza rutas de vuelo preprogramadas, visión artificial y análisis de IA para inspeccionar activos de infraestructura, in...

42 min de lectura
Drone Inspection Automation +6
Detección de Objetos para Defectos y Elementos de Infraestructura

Detección de Objetos para Defectos y Elementos de Infraestructura

La detección de objetos localiza y clasifica objetos en imágenes mediante cajas delimitadoras — para la inspección de infraestructura, esto incluye baches, parc...

41 min de lectura
technology machine-learning +6