Human-in-the-Loop (HITL)

Human-in-the-Loop (HITL) verifikácia v automatizovanej inšpekcii

Definícia a zdôvodnenie

Human-in-the-loop (HITL) je architektonický paradigmatický model pre poloautomatizované systémy, v ktorom model strojového učenia vykonáva počiatočné spracovanie dát a ľudský operátor následne preskúmava, overuje alebo opravuje výstupy modelu predtým, než sú akceptované ako konečné. V kontexte inšpekcie infraštruktúry sa HITL vzťahuje konkrétne na pracovné postupy, kde algoritmus detekcie chýb založený na AI spracúva vysokorozlíšené snímky mostov, vozoviek, pristávacích dráh alebo letiskových zariadení, priraďuje skóre spoľahlivosti každej detekovanej anomálii a potom smeruje detekcie s nízkou spoľahlivosťou alebo nejednoznačné detekcie kvalifikovanému inšpektorovi na manuálne posúdenie.

Základné zdôvodnenie HITL v inšpekcii vyplýva z inherentných obmedzení súčasných modelov počítačového videnia pri nasadení v bezpečnostne kritických prostrediach. Hlboké učenie modely, vrátane konvolučných neurónových sietí (CNN) a vision transformerov, dosahujú vysokú presnosť na referenčných datasetoch, ale môžu zlyhať nepredvídateľne pri okrajových prípadoch — nezvyčajných svetelných podmienkach, nových morfológiách trhlín, povrchových kontaminantoch napodobňujúcich vzory chýb alebo prekážkach spôsobených vegetáciou či sutinami. Štúdia z roku 2024 z Michiganskej štátnej univerzity, ktorá hodnotila sedem multimodálnych veľkých jazykových modelov na hodnotenie stavu vozoviek, zistila, že zatiaľ čo modely ako GPT-4o dosiahli silný výkon pri štandardnej identifikácii poškodení, všetky modely vykazovali variabilitu v rozpoznávaní priestorových vzorov a úlohách hodnotenia závažnosti, ktoré vyžadujú kontextuálne porozumenie. HITL architektúra uznáva, že pri infraštruktúrnych aktívach, kde zlyhanie môže viesť k katastrofálnym následkom, musí byť strojová efektivita podriadená ľudskému úsudku v bode konečného rozhodnutia.

Inšpektor kontroluje AI detegované chyby na tablete počas inšpekcie mosta

HITL prístup tiež rieši nedostatok zodpovednosti, ktorý vzniká, keď sú rozhodnutia prijímané výhradne algoritmami. V regulovaných odvetviach — letectve, diaľničnej infraštruktúre, jadrových zariadeniach — musia inšpekčné správy niesť podpis certifikovaného odborníka, ktorý nesie právnu zodpovednosť za nálezy. Európska agentúra pre bezpečnosť letectva (EASA) vydala usmernenie v rámci svojho AI Roadmap, ktoré uvádza, že vysoko rizikové AI aplikácie v leteckej údržbe musia zahŕňať „zmysluplný ľudský dohľad" s „možnosťou prehlasovať alebo zvrátiť rozhodnutia". Podobne americký Federálny úrad pre diaľnice (FHWA) Národné štandardy pre inšpekciu mostov (NBIS) vyžadujú, aby hodnotenia stavu mostov prideľoval vedúci tímu spĺňajúci špecifické kvalifikačné kritériá, čo je požiadavka, ktorú nemožno delegovať na softvér.

Správa Národných akadémií z roku 2024 o AI aplikáciách na automatické hodnotenie stavu vozoviek zdôraznila, že „ľudské overenie výstupov automatizovanej detekcie poškodení je nevyhnutné na udržanie kvality dát a zabezpečenie, že rozhodnutia o údržbe sú založené na spoľahlivých hodnoteniach". Správa zdokumentovala, že agentúry nasadzujúce plne automatizované hodnotenie vozoviek bez ľudského preskúmania zaznamenali mieru chybovosti 15–25 % pri trhlinách strednej závažnosti v porovnaní s 3–8 %, keď človek preskúmal výstupy AI.

HITL architektúra: Od AI detekcie po finálnu správu

Štandardná HITL architektúra pre inšpekciu infraštruktúry nasleduje štruktúrovaný päťstupňový pipeline, ktorý transformuje surové senzorové dáta na overené hodnotenie stavu. Každá fáza má špecifické technické požiadavky a kontrolné body kvality.

Fáza 1: Zber údajov

Vysokorozlíšené snímky sa zachytávajú pomocou bezpilotných lietajúcich prostriedkov (UAV), inšpekčných vozidiel vybavených riadkovými skenovacími kamerami alebo stacionárnych kamier namontovaných na portálových konštrukciách. Pri inšpekciách mostov typická misia UAV zhromažďuje 5 000 – 10 000 snímok v rozlíšení 20–50 megapixelov s veľkosťou pixelu na zemi (GSD) 0,5–2 mm na pixel. Pri prieskumoch vozoviek špecializované vozidlá zachytávajú kontinuálne snímky pri diaľničných rýchlostiach pomocou viacerých synchronizovaných kamier pokrývajúcich 4-metrovú šírku jazdného pruhu. Fáza zberu údajov musí zahŕňať dôslednú kontrolu kvality — detekciu rozmazania, overenie expozície a overenie geopriestorového označenia — pretože výkonnosť downstream AI je ohraničená kvalitou vstupov.

Fáza 2: AI inferenčný engine

Získané snímky sú spracované inferenčným enginom hlbokého učenia, typicky založeným na CNN architektúre ako YOLOv8, Faster R-CNN alebo variante U-Net pre sémantickú segmentáciu. Model vykonáva detekciu na úrovni pixelov alebo ohraničujúcich boxov vopred definovaných tried chýb. Pri inšpekcii mostov tieto triedy typicky zahŕňajú trhliny (priečne, pozdĺžne, diagonálne, mapovité), vypukliny, delamináciu, korózne škvrny, odkrytú výstuž a poškodenie spojov. Pri inšpekcii vozoviek triedy zahŕňajú únavové trhliny, blokové trhliny, okrajové trhliny, vyjazdené koľaje, drobenie, výtlky a záplaty.

Každá detekcia je sprevádzaná skóre spoľahlivosti v rozsahu 0,0 až 1,0, ktoré predstavuje odhad modelu pravdepodobnosti, že detekcia je skutočne pozitívna. Inferenčný engine tiež poskytuje metadáta vrátane súradníc detekcie v obraze, rozmerov chyby v pixeloch (alebo vo fyzických jednotkách, ak sú dostupné kalibračné údaje) a klasifikačného štítku.

Fáza 3: Smerovanie na základe spoľahlivosti

Výstupy AI sú spracované smerovacím modulom, ktorý aplikuje konfigurovateľné prahy spoľahlivosti na triedenie detekcií. Logika smerovania typicky používa systém dvoch prahov:

Rozsah spoľahlivostiRozhodnutie o smerovaníZdôvodnenie
0,95 – 1,00Auto-prijatieVysoko spoľahlivé skutočne pozitívne; minimálne riziko falošne pozitívnych
0,50 – 0,95Smerovať na ľudské preskúmanieNejednoznačné detekcie vyžadujúce odborný úsudok
0,00 – 0,50Auto-zamietnutieVysoko spoľahlivé falošne pozitívne; odfiltrované ako šum

Hodnoty prahov sú špecifické pre dané miesto a nastaviteľné. Inšpekcia mosta na prvku kritickom z hľadiska lomu (FCM) môže znížiť prah preskúmania na 0,70, aby sa zabezpečilo, že všetky potenciálne významné chyby sú preskúmané človekom. Prieskum vozovky na málo frekventovanej vidieckej ceste môže zvýšiť prah na 0,90, čím akceptuje mierne vyššiu mieru falošne negatívnych výmenou za znížené pracovné zaťaženie preskúmania.

Fáza 4: Rozhranie na ľudské preskúmanie

Označené detekcie sú prezentované kvalifikovanému inšpektorovi prostredníctvom špecializovaného rozhrania na preskúmanie. Rozhranie typicky zobrazuje detekovanú chybu s ohraničujúcim boxom alebo segmentačným prekrytím generovaným AI, skóre spoľahlivosti, klasifikáciu chyby a kontextové informácie ako identifikátor majetku (číslo mosta, úsek vozovky), súradnice polohy a historické inšpekčné údaje, ak sú k dispozícii.

Inšpektor má tri možné akcie pre každú označenú detekciu:

  • Potvrdiť — Prijať AI predikciu ako správnu; detekcia sa stáva súčasťou finálnej správy
  • Zamietnuť — Zamietnuť detekciu ako falošne pozitívnu
  • Opraviť — Upraviť AI predikciu úpravou ohraničujúceho boxu, zmenou klasifikácie alebo aktualizáciou hodnotenia závažnosti

Moderné rozhrania na preskúmanie zahŕňajú klávesové skratky a dávkové operácie na urýchlenie procesu preskúmania. Skúsený inšpektor dokáže preskúmať 200–500 označených chýb za hodinu v závislosti od hustoty chýb a zložitosti snímky. Relácia preskúmania vytvára auditnú stopu dokumentujúcu každú akciu inšpektora, čo je kritické pre zabezpečenie kvality a regulačnú súladnosť.

Fáza 5: Generovanie finálnej správy

Finálna správa o stave integruje automaticky prijaté vysoko spoľahlivé detekcie s človekom overenými označenými detekciami. Správa vypočítava agregované metriky ako hustotu chýb (percento plochy povrchu ovplyvnené každým typom chyby), Index stavu vozovky (PCI) pre letiská alebo cesty, alebo hodnotenia stavu na úrovni prvkov pre mosty podľa rámca AASHTO pre inšpekciu na úrovni prvkov.

Rozhranie AI detekcie chýb zobrazujúce skóre spoľahlivosti pri analýze trhlín vozovky

Prahy spoľahlivosti pre označovanie

Prahové hodnoty spoľahlivosti sú kritické ladiace parametre, ktoré určujú prevádzkovú efektivitu a bezpečnostnú rezervu každého HITL inšpekčného systému. Nastavenie prahov príliš agresívne (akceptovanie málo spoľahlivých predikcií) zvyšuje riziko falošne negatívnych výsledkov — nezistených chýb, ktoré by mohli ohroziť konštrukčnú integritu. Nastavenie prahov príliš konzervatívne (smerovanie všetkého na ľudské preskúmanie) maří účel efektivity automatizácie.

ROC krivka (Receiver Operating Characteristic) AI modelu poskytuje analytický základ pre výber prahu. ROC krivka zobrazuje mieru skutočne pozitívnych (senzitivitu) oproti miere falošne pozitívnych pre každú možnú hodnotu prahu. Plocha pod ROC krivkou (AUC) sumarizuje celkovú diskriminačnú schopnosť modelu. Model s AUC 0,95 alebo vyššou na reprezentatívnych testovacích dátech sa všeobecne považuje za vhodný pre HITL nasadenie.

Odborné najlepšie postupy odporúčajú kalibrovať prahy pomocou maticy nákladov, ktorá priraďuje peňažné alebo rizikové váhy každému typu chyby:

Typ chybyDôsledokRelatívne náklady
Falošne negatívny (zmeškaná kritická trhlina)Potenciálne konštrukčné zlyhanie, bezpečnostné rizikoVeľmi vysoké
Falošne negatívny (zmeškaná kozmetická chyba)Odložená údržba, zvýšené náklady počas životného cykluStredné
Falošne pozitívny (označenie ne-chyby)Stratený čas inšpektora pri preskúmaníNízke
Nesprávna klasifikácia (správny box, nesprávna trieda)Nesprávne hodnotenie stavuStredné

Proces kalibrácie prahov typicky zahŕňa spustenie AI modelu na validačnom datasete najmenej 5 000 – 10 000 snímok, ktoré boli nezávisle označené certifikovanými inšpektormi. Detekcie modelu sa porovnávajú so základnou pravdivými označeniami a prah sa upraví na dosiahnutie cieľovej miery falošne negatívnych — zvyčajne 1–2 % pre mostné prvky kritické z hľadiska lomu a 5–8 % pre bežné prieskumy vozoviek.

Dynamické prahovanie je vznikajúca prax, kde sa prahy upravujú v reálnom čase na základe environmentálnych podmienok, metrík kvality obrazu alebo kritickosti majetku. Napríklad, ak inšpekčné vozidlo narazí na silný dážď alebo podmienky so slabým osvetlením, ktoré zhoršujú kvalitu obrazu, systém automaticky zníži svoj prah spoľahlivosti, aby smeroval viac detekcií na ľudské preskúmanie, čím kompenzuje vyššiu neistotu v predikciách modelu.

Rozhrania na preskúmanie a pracovné postupy

Rozhranie na ľudské preskúmanie je prevádzkovým ústredným prvkom HITL inšpekčného systému. Jeho dizajn priamo ovplyvňuje rýchlosť aj presnosť procesu verifikácie. Zle navrhnuté rozhrania spôsobujú únavu operátora, zvyšujú mieru chybovosti a vytvárajú úzke miesta, ktoré negujú prínosy produktivity z AI automatizácie.

Efektívne rozhrania na preskúmanie zahŕňajú niekoľko kľúčových princípov dizajnu:

Paralelné zobrazenie AI výstupu a zdrojovej snímky. Rozhranie by malo prekrývať AI detekciu (ohraničujúci box, segmentačnú masku alebo heatmapu) na pôvodnom obrázku s ovládacími prvkami na zapnutie a vypnutie prekrytia. To umožňuje inšpektorovi vidieť presne to, čo model detegoval, pričom si zachováva schopnosť skúmať surové snímky na zmeškané chyby.

Kontextové navigačné pomôcky. Rozhranie by malo poskytovať navigačný systém na úrovni chýb (dopredu/dozadu cez označené detekcie) integrovaný s navigáciou na úrovni majetku (napr. výber prvku mosta alebo mapa úseku vozovky). Platforma Twinsight Twinspect, demonštrovaná v roku 2025 v proof of concept s Die Autobahn GmbH na nemeckých diaľničných mostoch, implementovala konsolidované zobrazenie, kde sú poškodenia objavujúce sa na viacerých snímkach zlúčené do jedinečných záznamov o chybách, čím sa znižuje redundancia a urýchľuje preskúmanie viac ako 600 AI detekovaných anomálií inšpektorom.

Vizualizácia skóre spoľahlivosti. Každá detekcia by mala zobrazovať svoje skóre spoľahlivosti numericky aj vizuálne — typicky ako farebne odlíšený odznak (zelená pre vysokú spoľahlivosť, žltá pre strednú, červená pre nízku). To pomáha inšpektorovi prioritne venovať pozornosť najneistejším detekciám, čo je pracovný postup známy ako preskúmanie riadené neistotou.

Záznam auditnej stopy. Každá akcia vykonaná inšpektorom — potvrdenie, zamietnutie, oprava, preskočenie — musí byť označená časovou pečiatkou, identifikovaná používateľom a zaznamenaná v nezmeniteľnej auditnej stope. Toto nie je voliteľné; je to regulačná požiadavka pre všetky inšpekčné dáta, ktoré vstupujú do systémov riadenia bezpečnosti alebo vykazovania zhody.

Dávkové potvrdenie pre vysokovýkonné preskúmanie. Pri inšpekciách s tisíckami označených detekcií by rozhranie malo podporovať dávkový výber a hromadné potvrdenie podobných nízkorizikových detekcií. Inšpektor preskúmavajúci trhliny vozovky na 10 km diaľničnom úseku môže naraziť na stovky identických priečnych trhlín; zoskupenie týchto do jednej potvrdzovacej akcie dramaticky skracuje čas preskúmania.

Postupnosť pracovného postupu preskúmania typicky nasleduje tento porad:

  1. Inšpektor sa prihlási do HITL platformy a načíta inšpekčné zadanie
  2. Systém zobrazí dashboard s celkovým počtom detekcií označených na preskúmanie, rozdelených podľa typu chyby a pásma spoľahlivosti
  3. Inšpektor začne preskúmavať detekcie, pričom začína s položkami s najnižšou spoľahlivosťou
  4. Pri každej detekcii inšpektor skúma AI prekrytie oproti surovému obrázku a urobí rozhodnutie o potvrdení/zamietnutí/oprave
  5. Systém automaticky prejde na ďalšiu detekciu
  6. Po dokončení systém vygeneruje súhrn verifikácie zobrazujúci pomer potvrdených, zamietnutých a opravených detekcií
  7. Overené detekcie sú zlúčené s automaticky prijatými detekciami do finálnej správy

Ľudská korekcia AI predikcií

Ľudská korekcia AI predikcií je jednou z najcennejších funkcií v HITL systéme. Keď inšpektor opraví AI výstup — úpravou nevhodne umiestneného ohraničujúceho boxu, preklasifikovaním nesprávne identifikovaného typu chyby alebo aktualizáciou hodnotenia závažnosti — systém zachytí nielen opravený výstup, ale aj rozdiel medzi AI predikciou a ľudskou základnou pravdou. Tento rozdiel je signálom, ktorý poháňa zlepšovanie modelu prostredníctvom aktívneho učenia.

Bežné typy korekcií v inšpekcii infraštruktúry zahŕňajú:

Úprava ohraničujúceho boxu. AI môže správne identifikovať, že chyba existuje, ale umiestniť ohraničujúci box nepresne — buď príliš tesne (odrezanie časti trhliny) alebo príliš voľne (zahrnutie plochy bez chyby). Inšpektor upraví box tak, aby presne ohraničil chybu, a systém zaznamená IoU (Intersection over Union) medzi AI predikciou a ľudskou korekciou. Opakované nízke skóre IoU pri špecifických triedach chýb signalizujú potrebu preškolenia modelu s lepšími príkladmi lokalizácie.

Korekcia klasifikácie. AI môže detegovať trhlinu, ale klasifikovať ju ako „priečnu", hoci je v skutočnosti „pozdĺžna". Táto nesprávna klasifikácia má dôsledky pre hodnotenie stavu, pretože rôzne typy trhlín sa mapujú do rôznych matíc závažnosti v systémoch riadenia vozoviek (napr. ASTM D6433 pre výpočet PCI). Inšpektor opraví označenie a systém zaznamená položku matice zámen, čím vytvára dataset náročných klasifikačných prípadov.

Prehodnotenie závažnosti. Mnohé protokoly hodnotenia stavu vyžadujú hodnotenia závažnosti (nízka, stredná, vysoká alebo numerická škála) založené na rozmeroch chyby. AI môže správne identifikovať a lokalizovať trhlinu, ale nesprávne odhadnúť jej šírku alebo dĺžku, čo vedie k nesprávnemu priradeniu závažnosti. Inšpektor opraví závažnosť a systém zaznamená rozdiel v meraní.

Zamietnutie falošne pozitívneho. Najbežnejšou akciou inšpektora pri detekciách s nízkou spoľahlivosťou je zamietnutie — AI označila povrchovú vlastnosť (olejovú škvrnu, tieň, stopu po pneumatike, škáru), ktorá nie je chybou. Každé zamietnutie je označený príklad falošne pozitívneho výsledku, ktorý zlepšuje diskriminačnú schopnosť modelu.

Štúdia proof of concept z roku 2025 vykonaná spoločnosťou Twinsity v spolupráci s Die Autobahn GmbH demonštrovala praktický dopad ľudskej korekcie. AI model pôvodne detegoval 600 anomálií na nemeckom diaľničnom moste, z ktorých 176 bolo trhlín potvrdených stavebnými inžiniermi. Prostredníctvom HITL procesu preskúmania inšpektori opravili klasifikácie AI, spresnili ohraničujúce boxy a zamietli falošne pozitívne výsledky. Konečný overený počet 156 potvrdených trhlín dosiahol 88,6% mieru presnosti, ktorá sa po použití korekčných dát na dolaadenie modelu zvýšila na viac ako 95 %.

Aktívne učenie z ľudskej spätnej väzby

Integrácia HITL s aktívnym učením vytvára cyklus neustáleho zlepšovania, ktorý postupne znižuje zaťaženie ľudského preskúmania v priebehu času. Aktívne učenie je stratégia strojového učenia, pri ktorej algoritmus identifikuje, ktoré neoznačené dátové body by boli najinformatívnejšie pre zlepšenie výkonu modelu, a požaduje označenia pre tieto konkrétne body od ľudského anotátora.

V kontexte HITL inšpekcie aktívne učenie funguje nasledovne:

  1. AI model spracúva nové inšpekčné snímky a generuje predikcie so skóre spoľahlivosti
  2. Systém identifikuje detekcie s najvyššou neistotou — tie najbližšie k rozhodovacej hranici medzi skutočne pozitívnym a falošne pozitívnym
  3. Tieto neisté detekcie sú smerované ľudskému inšpektorovi na overenie
  4. Inšpektorom potvrdené alebo opravené označenia sa stávajú tréningovými dátami pre ďalšiu aktualizáciu modelu
  5. Model je preškolený alebo dolaadený na rozšírenom datasete, čím sa zlepšuje jeho presnosť na predtým neistých prípadoch
  6. Počas nasledujúcich inšpekčných cyklov počet detekcií vyžadujúcich ľudské preskúmanie klesá

Dotazovacia stratégia pre výber detekcií na smerovanie na ľudské označenie je kritická. Bežné stratégie zahŕňajú:

  • Vzorkovanie najnižšej spoľahlivosti: Smerovať detekcie so skóre spoľahlivosti najbližšie k rozhodovaciemu prahu (napr. 0,45–0,55)
  • Vzorkovanie rozpätia: Smerovať detekcie, kde je rozdiel medzi dvoma najvyššími pravdepodobnosťami tried najmenší
  • Entropické vzorkovanie: Smerovať detekcie s najvyššou predikčnou entropiou, indikujúcou, že model je najneistejší o klasifikácii

Štúdia publikovaná v Automation in Construction hodnotiaca HITL systémy s podporou automatizácie pre vizuálnu inšpekciu infraštruktúry zistila, že aktívne učenie znížilo pracovné zaťaženie ľudského označovania o 60–75 % v porovnaní s náhodným vzorkovaním pri zachovaní rovnakej presnosti modelu. Štúdia zdokumentovala, že po piatich cykloch aktívneho učenia na datasete detekcie trhlín model dosiahol 94,7 % presnosť s iba 30 % tréningových dát vyžadujúcich ľudské preskúmanie.

Implementácia aktívneho učenia v produkčných HITL systémoch vyžaduje verzované riadenie modelov. Každý cyklus preškolovania produkuje novú verziu modelu, ktorá musí byť validovaná na vyčlenenej testovacej sade pred nasadením. Systém musí tiež podporovať A/B testovanie — spúšťanie nového modelu v tichom režime popri súčasnom produkčnom modeli na overenie, že zlepšenia výkonu sa zovšeobecňujú na nové inšpekčné dáta pred potvrdením aktualizácie.

HITL pre inšpekciu mostov

Inšpekcia mostov je najbezpečnostne kritickejšou aplikáciou HITL technológie v infraštruktúre. Spojené štáty majú viac ako 617 000 mostov, z ktorých približne 42 % je starších ako 50 rokov a 7,5 % je klasifikovaných ako konštrukčne deficientných podľa Správy o stave infraštruktúry Americkej spoločnosti stavebných inžinierov (ASCE) z roku 2024. Národné štandardy pre inšpekciu mostov (NBIS) kodifikované v 23 CFR 650 vyžadujú, aby všetky mosty na verejných cestách boli kontrolované v intervaloch nepresahujúcich 24 mesiacov kvalifikovanými vedúcimi tímov.

Dokumentácia FHWA zdôrazňuje, že ľudské overenie je nevyhnutné pre hodnotenia stavu prideľované v rámci NBIS rámca. Škály hodnotenia stavu pre mostné prvky (0–9 pre mostovku, zvršok a spodok podľa kódovacieho manuálu Národného mostného registra) vyžadujú, aby inšpektor syntetizoval viacero pozorovateľných stavov do jedného numerického hodnotenia — úloha, ktorú súčasné AI systémy nedokážu spoľahlivo vykonávať, pretože vyžaduje pochopenie konštrukčných zaťažovacích ciest, správania materiálov a mechanizmov degradácie.

HITL pracovný postup inšpekcie mostov integruje viacero zdrojov údajov:

Dron zachytávajúci vysokorozlíšené snímky diaľničného mosta na AI inšpekciu

UAV snímky poskytujú vysokorozlíšené vizuálne dáta všetkých prístupných povrchov mosta — mostovky, spodnej časti mostovky, nosníkov, pilierov, opôr, ložísk a spojov. Typická UAV inšpekcia mosta zhromažďuje 3 000 – 8 000 snímok na jednu konštrukciu v závislosti od veľkosti a zložitosti mosta. AI inferenčný engine spracúva tieto snímky na detekciu trhlín, vypuklín, korózie a iných viditeľných chýb.

Dáta z georadarov (GPR) sa používajú popri vizuálnych snímkach na detekciu delaminácie mostovky a posúdenie korózie výstuže. Zatiaľ čo interpretácia GPR signálu vyžaduje špecializované odborné znalosti, AI modely môžu označovať anomálne vzory signálu na ľudské preskúmanie.

Úloha inšpektora v HITL systéme nie je len potvrdzovať alebo zamietať AI predikcie, ale pridať konštrukčno-inžiniersky úsudok, ktorý AI nevie poskytnúť. Inšpektor preskúmava označené detekcie v kontexte známej nosnosti mosta, intenzity dopravy, environmentálnej expozície a histórie inšpekcií. Vlasová trhlina v stene predpätého betónového nosníka môže byť okamžite označená na urgentnú opravu, zatiaľ čo identická trhlina v sekundárnom diafragmovom prvku môže byť hodnotená ako menšie pozorovanie — rozdiel, ktorý závisí od konštrukčno-inžinierskych znalostí, nie od rozpoznávania vzorov na úrovni pixelov.

Odporúčaný rámec FHWA pre program QC/QA inšpekcie mostov, aktualizovaný v roku 2024, explicitne rieši integráciu automatizovaných inšpekčných technológií. Rámec vyžaduje, aby každý automatizovaný systém detekcie trhlín bol validovaný oproti manuálnej inšpekcii na najmenej 10 % mostných prvkov, pričom výsledky validácie musia byť zdokumentované a preskúmané vedúcim inšpekčného tímu. Tento duálny validačný prístup je formalizovaný HITL proces, ktorý zaručuje, že automatizácia slúži ako nástroj na podporu rozhodovania a nie ako náhrada za odborný úsudok.

HITL pre inšpekciu vozoviek

Hodnotenie stavu vozoviek bolo skorým osvojiteľom automatizovanej inšpekčnej technológie kvôli vysokým objemom údajov — jedna diaľničná agentúra môže spravovať 10 000 – 50 000 km jazdných pruhov vozoviek s intervalmi inšpekcií 1–3 roky. Manuálne vizuálne prieskumy v tomto rozsahu sú prohibitívne drahé, vyžadujúc 30–50 osobodní na 100 km jazdných pruhov. AI asistované metódy dokážu spracovať rovnakú sieť za 5–10 hodín výpočtového času, ale výsledky musia byť overené ľudskými inšpektormi predtým, než môžu byť použité na rozhodnutia o programovaní údržby.

HITL pracovný postup pre inšpekciu vozoviek typicky používa riadkové skenovacie kamery namontované na prieskumných vozidlách pohybujúcich sa diaľničnými rýchlosťami (80–100 km/h), zachytávajúcich kontinuálne 360-stupňové snímky povrchu vozovky. Snímky sú georeferencované pomocou GPS/IMU systémov s presnosťou 10–50 cm. AI model segmentuje povrch vozovky do kategórií chýb a vypočítava metriky hustoty poškodenia.

Usmernenia Americkej asociácie štátnych úradov pre diaľnice a dopravu (AASHTO) pre zber údajov o stave vozoviek uznávajú úlohu automatizovaných systémov, pričom zachovávajú požiadavky na ľudské overenie. Štandard AASHTO PP 89-21 pre automatizovaný zber údajov o poškodení vozoviek špecifikuje postupy zabezpečenia kvality vrátane:

  • Overenie v teréne: Minimálne 5 % prieskumných úsekov musí byť overených manuálnou inšpekciou do 30 dní od automatizovaného prieskumu
  • Testovanie opakovateľnosti: Automatizovaný systém musí preukázať opakovateľnosť ±5 % pri množstvách poškodení pri opätovnom prieskume toho istého úseku do 24 hodín
  • Ľudské preskúmanie okrajových prípadov: Všetky úseky s množstvami poškodení presahujúcimi vopred definované prahy (napr. >20 % plochy s trhlinami) musia byť manuálne preskúmané

Rozhranie HITL preskúmania pre inšpekciu vozoviek typicky zobrazuje pásový graf ukazujúci povrch vozovky s AI detekovanými chybami farebne odlíšenými podľa typu a závažnosti. Inšpektor prechádza kontinuálnymi snímkami vozovky, preskúmava označené úseky a overuje hodnotenie stavu AI. Pre agentúry používajúce metodiku Indexu stavu vozovky (PCI) podľa ASTM D6433, HITL systém vypočítava hodnoty PCI z overených údajov o chybách, pričom inšpektor akceptuje alebo prehlasuje vypočítanú hodnotu na základe svojich terénnych znalostí.

Štúdia Národných akadémií z roku 2025 o AI aplikáciách na automatické hodnotenie stavu vozoviek zistila, že HITL systémy dosiahli 92–96 % zhodu s manuálnou inšpekciou pri identifikácii poškodení v porovnaní so 78–85 % pre plne automatizované systémy bez ľudského preskúmania. Štúdia tiež zistila, že HITL skrátil čas inšpekcie o 55–70 % v porovnaní s čisto manuálnymi metódami pri zachovaní súladu so štandardmi kvality údajov AASHTO.

Regulačné prijatie HITL

Regulačné prostredie pre AI v inšpekcii infraštruktúry sa rýchlo vyvíja, ale konzistentnou témou vo všetkých hlavných rámcoch je, že ľudský dohľad je povinný pre rozhodnutia súvisiace s bezpečnosťou.

Medzinárodná organizácia civilného letectva (ICAO) — Podľa ICAO Annex 14, Volume I (Navrhovanie a prevádzka letísk), je prevádzkovateľ letiska zodpovedný za zabezpečenie toho, aby boli pristávacie dráhy, rolovacie dráhy a plochy odbavovacích plôch udržiavané v stave prijateľnom pre prevádzku lietadiel. Zatiaľ čo ICAO výslovne nezakazuje automatizovanú inšpekciu, požiadavka, aby „prevádzkovateľ letiska zaviedol inšpekčný program", ktorý je „prijateľný pre štát", implicitne vyžaduje, aby hodnotenia stavu vykonával alebo overoval kompetentný personál. Dokument ICAO 9157 (Príručka pre navrhovanie letísk) odkazuje na metodiku Indexu stavu vozovky (PCI), ktorá vyžaduje vizuálnu inšpekciu vyškolenými hodnotiteľmi, pokiaľ štát neschváli alternatívny postup.

Európska agentúra pre bezpečnosť letectva (EASA) — EASA AI Roadmap 2.0, publikovaná v roku 2024, zavádza stupňovitý prístup k AI v letectve. Pod úrovňou 2 („Spolupráca človeka a AI"), ktorá pokrýva AI asistovanú inšpekciu, agentúra vyžaduje: (a) človek si zachováva konečnú rozhodovaciu právomoc, (b) AI systém poskytuje vysvetlenia svojich výstupov a (c) systém môže byť kedykoľvek prehlasovaný alebo vypnutý ľudským operátorom. Tieto požiadavky sa priamo mapujú na HITL architektúru.

Federálny úrad pre letectvo (FAA) — FAA Advisory Circular AC 150/5380-6C o „Usmerneniach pre programy riadenia vozoviek" uvádza, že automatizované metódy zberu údajov sú prijateľné za predpokladu, že „zariadenie na zber údajov je certifikované a údaje sú validované inžinierom so skúsenosťami v hodnotení vozoviek". Táto duálna požiadavka — certifikácia zariadenia plus ľudská validácia — je formálny HITL mandát.

Federálny úrad pre diaľnice (FHWA) — FHWA NBIS (23 CFR 650 Subpart C) vyžaduje, aby všetky inšpekcie mostov vykonával alebo riadil vedúci tímu, ktorý spĺňa špecifické kvalifikačné požiadavky (profesionálny inžinier alebo certifikovaný mostný inšpektor s minimálnymi prahovými hodnotami skúseností). Zatiaľ čo automatizovaný zber údajov je povolený, hodnotenie stavu musí určiť vedúci tímu. Usmernenie FHWA k procesu preskúmania NBIS z roku 2024 potvrdzuje, že „automatizované inšpekčné technológie dopĺňajú, ale nenahrádzajú odborný úsudok vedúceho tímu".

ISO 55001 (Manažment majetku) — Medzinárodný štandard pre manažment majetku vyžaduje, aby údaje o stave používané na rozhodovanie boli spoľahlivé, opakovateľné a overiteľné. HITL pracovné postupy spĺňajú tieto požiadavky tým, že zachovávajú ľudské overenie ako konečnú bránu kvality.

Praktickým dôsledkom tohto regulačného prostredia je, že HITL nie je len technickou preferenciou pre inšpekciu infraštruktúry — je to požiadavka na súlad s predpismi. Každá organizácia nasadzujúca AI na inšpekciu leteckých, diaľničných alebo konštrukčných aktív musí implementovať proces ľudského preskúmania, aby splnila regulačné povinnosti. Presná architektúra sa môže líšiť — niektoré agentúry vyžadujú 100 % ľudské preskúmanie všetkých detekcií, zatiaľ čo iné akceptujú štatistické vzorkovanie — ale princíp ľudského overenia je univerzálny.

Plne automatizované vs. HITL

Rozdiel medzi plne automatizovanou inšpekciou a inšpekciou typu human-in-the-loop je zásadný pre pochopenie rozhodnutí o nasadení v manažmente infraštruktúrnych aktív. Každý prístup má odlišné charakteristiky, výhody a obmedzenia:

DimenziaPlne automatizovanéHuman-in-the-Loop
Rozhodovacia právomocAI modelĽudský inšpektor
PriepustnosťVeľmi vysoká (100 000+ snímok/hodinu)Mierna (200–500 označených položiek/hodinu)
Riešenie okrajových prípadovSlabé — model zlyháva na nových vzorochDobré — človek sa prispôsobuje novým situáciám
ZodpovednosťRozptýlená — žiadna jediná zodpovedná entitaJasná — certifikovaný inšpektor nesie zodpovednosť
Regulačný súladObmedzený — väčšina štandardov vyžaduje podpisZavedený — spĺňa existujúce regulačné rámce
Neustále zlepšovanieVyžaduje samostatný dátový pipelineZabudované prostredníctvom aktívneho učenia
Náklady na inšpekciuNízke po počiatočnom nasadeníVyššie kvôli ľudskej práci
Miera falošne negatívnych10–25 % pri nejednoznačných chybách2–5 % po ľudskom preskúmaní
Vhodné preNízkorizikové aktíva, počiatočný skríning, vysoký objemBezpečnostne kritické aktíva, konečné hodnotenie stavu, regulované

Rozhodnutie medzi plne automatizovaným a HITL nasadením závisí od rizikovej kategórie kontrolovaného majetku. Nízkorizikové aktíva — ako vedľajšie cesty, nekonštrukčné stavebné prvky a kozmetické povrchové stavy — môžu byť kandidátmi na plne automatizovanú inšpekciu, kde sú náklady na falošne negatívne výsledky akceptovateľné. Bezpečnostne kritické aktíva — mosty, pristávacie dráhy, tunely, priehrady a vysoko frekventované diaľnice — vyžadujú HITL, pretože dôsledok zmeškanej kritickej chyby je neprijateľný.

Prieskum z roku 2024 medzi 47 americkými štátnymi ministerstvami dopravy zistil, že 93 % agentúr používajúcich automatizovaný zber údajov o vozovkách využíva nejakú formu ľudského overenia, od náhodného vzorkovania (10 % úsekov) až po komplexné preskúmanie všetkých úsekov označených ako deficientné. Iba 7 % akceptovalo automatizované údaje bez akéhokoľvek ľudského overenia a tieto agentúry obmedzili výhradne automatické prijatie na málo frekventované miestne cesty v dobrom stave. Pri inšpekcii mostov rovnaký prieskum zistil, že 100 % agentúr zachovalo požiadavky na ľudské overenie, pričom najbežnejším prístupom bolo ľudské preskúmanie všetkých AI detegovaných anomálií v kombinácii s náhodnými kontrolami 15–20 % snímok klasifikovaných ako bez chýb.

Prevádzkový trend smeruje k hybridným modelom, ktoré upravujú stupeň automatizácie na základe stavu majetku. Most v dobrom stave (NBI hodnotenie 7–9) môže byť spracovaný s vysoko spoľahlivými prahmi auto-prijatia a minimálnym ľudským preskúmaním, zatiaľ čo most v zlom stave (NBI hodnotenie 3–4) môže mať všetky detekcie smerované na ľudské preskúmanie bez ohľadu na skóre spoľahlivosti. Tento rizikovo-adaptívny HITL prístup optimalizuje úsilie inšpektora alokovaním pozornosti na aktíva, kde prináša najväčší bezpečnostný prínos.

Záver

Verifikácia typu human-in-the-loop predstavuje súčasný stav techniky v automatizovanej inšpekcii infraštruktúry. HITL architektúra — kombinujúca AI počiatočnú detekciu so smerovaním na základe spoľahlivosti a povinným ľudským preskúmaním — prináša prínosy produktivity automatizácie pri zachovaní bezpečnostnej zodpovednosti a odborného úsudku, ktoré vyžadujú regulačné štandardy. Kalibrácia prahov, dizajn rozhrania na preskúmanie, pracovné postupy ľudskej korekcie a integrácia aktívneho učenia sú technické prvky, ktoré určujú, či HITL systém funguje efektívne v praxi.

Pre inšpekciu mostov, hodnotenie stavu vozoviek, hodnotenie letiskových pristávacích dráh a kontrolu údržby letísk nie je HITL prechodným prístupom na ceste k plnej automatizácii — je to preukázaná najlepšia prax, ktorá vyvažuje komplementárne silné stránky strojov a ľudí. Keďže presnosť AI modelov sa bude naďalej zlepšovať, zaťaženie ľudského preskúmania sa bude znižovať prostredníctvom aktívneho učenia, ale princíp ľudského overenia pre bezpečnostne kritické rozhodnutia zostane regulačnou a etickou požiadavkou.

Často kladené otázky

Vylepšite svoje inšpekčné pracovné postupy pomocou HITL

Implementujte procesy verifikácie typu human-in-the-loop, ktoré kombinujú rýchlosť detekcie chýb pomocou AI so zodpovednosťou preskúmania certifikovaným inšpektorom. Kontaktujte nás a zistite, ako naše riešenia integrujú HITL pracovné postupy pre inšpekcie mostov, vozoviek a letísk.

Zistiť viac

Detekcia trhlín pomocou AI pre kontrolu infraštruktúry

Detekcia trhlín pomocou AI pre kontrolu infraštruktúry

Detekcia trhlín pomocou AI využíva počítačové videnie — konvolučné neurónové siete, vision transformery a modely sémantickej segmentácie — na automatickú identi...

36 min čítania
Computer Vision Deep Learning +8
Vysoko intenzívne osvetlenie dráhy (HIRL)

Vysoko intenzívne osvetlenie dráhy (HIRL)

Vysoko intenzívne osvetlenie dráhy (HIRL) označuje robustné, vysoko výkonné osvetľovacie systémy inštalované pozdĺž okrajov a prahov dráh, ktoré poskytujú maxim...

5 min čítania
Airport lighting Runway lights +4
Vyhodnotenie hlavy defektov a smoke testovanie

Vyhodnotenie hlavy defektov a smoke testovanie

Smoke test hlavy defektov overuje, že pipeline detekcie štrukturálnych defektov TarmacView — backbone DINOv3 + 5-labelová MLP hlava pre praskliny/odlupovanie/ef...

33 min čítania
testing defect +4