Svet autonómnych vozidiel a inteligentnej mestskej infraštruktúry sa posúva vpred míľovými krokmi, no vývojári neustále narážajú na rovnakú technologickú bariéru. Tou sú slepé uhly a neschopnosť kamier spoľahlivo detegovať malé či vzdialené objekty.

Ako však informoval technologický portál Tech Xplore, tím japonských vedcov z technologického inštitútu Shibaura pod vedením profesora Chinthaka Premachandru priniesol prelomové riešenie. Vyvinuli totiž vylepšenú verziu populárneho algoritmu YOLO, ktorá posúva presnosť rozpoznávania drobných objektov v 360-stupňovom zobrazení na fantastických 90 percent.

Panoramatické a všesmerové kamery sú dnes mimoriadne populárne, najmä v oblasti mestského kamerového dohľadu a autonómnych vozidiel. Ponúkajú kompletný 360-stupňový výhľad na okolie, čo je ich najväčšou výhodou. Tento širokouhlý záber však so sebou prináša aj vážny fyzikálny problém, ktorým je skreslenie obrazu na okrajoch a rýchly pokles rozlíšenia s rastúcou vzdialenosťou.

Pre bežné systémy počítačového videnia je preto mimoriadne náročné rozpoznať chodcov či cyklistov, ktorí sa nachádzajú ďalej od objektívu. Na križovatkách, kde sa mieša doprava z viacerých smerov, môže aj mŕtvy uhol a zaváhanie umelej inteligencie viesť k tragickým nehodám. Tradičné algoritmy často nedokážu včas identifikovať človeka vystupujúceho z tieňa alebo vzdialeného cyklistu.

Práve tu nastupuje algoritmus YOLO (You Only Look Once), ktorý je v technologickom svete uznávaný pre svoju neuveriteľnú rýchlosť a efektivitu. Tento systém však funguje tak, že obraz rozdelí do mriežky, čo sa mu pri drobných objektoch stáva osudným. Ak sa v jednej malej bunke mriežky ocitne viacero miniatúrnych objektov, systém ich detaily jednoducho stratí.

Japonskí inžinieri sa preto rozhodli tento nedostatok odstrániť pomocou pokročilej metódy prenosu učenia (transfer learning). Vytvorili úplne nový špecializovaný dataset, ktorý obsahoval približne 4 000 precízne anotovaných obrázkov. Tieto dáta zahŕňali štyri kľúčové kategórie pohybujúcich sa objektov na cestách: ľudí, autá, bicykle a motocykle.

Výskumníci nepostupovali bežným spôsobom, ale pre každú kategóriu definovali špecifické anatomické a štrukturálne pravidlá. Aby systém uznal objekt za človeka, musela byť na zábere viditeľná aspoň jedna ruka alebo noha. Pri autách museli byť rozpoznateľné minimálne dve pneumatiky a pri bicykloch či motocykloch predné aj zadné koleso súčasne.

Tento prísny prístup k označovaniu dát priniesol pri testovaní ohromujúce výsledky, ktoré prekvapili aj samotných autorov štúdie. Nový model dosiahol celkovú úspešnosť detekcie na úrovni 90 %, zatiaľ čo štandardný model YOLOv5 dosiahol len 46 % a novší YOLOv8 len 53 %. Tieto staršie systémy doslova pohoreli pri objektoch menších ako 8 × 8 pixelov.

Ešte výraznejší rozdiel sa ukázal pri meraní úspešnosti detekcie miniaturnych pohybujúcich sa objektov s veľkosťou od 8 × 8 do 32 × 32 pixelov. V tejto kategórii dosiahlo japonské riešenie presnosť 0,81, kým staršie modely dosahovali žalostné hodnoty 0,39 a 0,42. Novinka navyše dokáže spoľahlivo fungovať až do vzdialenosti 50 metrov od kamery, pričom bežné modely strácajú dych už po prekročení 40 metrov.

Technologický prelom má obrovský potenciál pre celú Európsku úniu vrátane Slovenska, kde bezpečnosť na cestách patrí k dlhodobým prioritám. Zavedenie takéhoto inteligentného monitorovania by mohlo dramaticky znížiť nehodovosť na našich frekventovaných križovatkách. Predstavte si inteligentné mestské kamery, ktoré dokážu v zlomku sekundy upozorniť autonómne vozidlo na cyklistu prichádzajúceho z mŕtveho uhla.

Táto technológia by mohla nájsť okamžité uplatnenie v autonómnych autách a modernej robotike. Profesor Premachandra verí, že ich práca pomôže zachrániť tisíce životov po celom svete. Výskumný tím už teraz plánuje model ďalej vylepšovať, aby zvládal detekciu objektov menších než 8 × 8 pixelov.

Čítajte viac z kategórie: Umelá inteligencia / AI

Pošli nám TIP na článok



Teraz čítajú

NAJČÍTANEJŠIE ZO STARTITUP