Predplatné PREMIUM na mesiac ZDARMA.

banner-mi-notebook-air-13Divízia Google Al pod názvom DeepMind a slávna britská univerzita Oxford využili umelú inteligenciu pre vývoj najpresnejšieho softvéru pre čítanie z pier.

Pomocou tisícok hodín televíznych záberov z BBC trénovali vedci neurónovú sieť pre anotáciu video záberov so 46,8 % presnosťou. Toto číslo možno na prvý pohľad nevyzerá nijak pôsobivo, no zaujímavo začne znieť vtedy, keď sa dozviete, že profesionálnemu človeku venujúcemu sa čítaniu z pier sa podarilo správne prečítať iba 12,4 % slov.

google-deepmind-2

Podobnej práci sa venovala aj ďalšia samostatná skupina práve z Oxfordskej univerzity. Pomocou podobných techník vytvorili program pod menom LipNet, ktorý dosiahol 93,4 % presnosť v testoch. Pre porovnanie, človek bol úspešný len na 52,3 % zo všetkých pokusov. LipNet však pracoval so špeciálne natočenými zábermi. Pre tréning programu od DeepMind bolo potrebných až 5 000 hodín záberov z TV programov, ako sú Newsnight, Question Time a World Today a prebiehal na princípe „Pozeraj, počúvaj, pozoruj a hláskuj“.

google-deepmind-1

TIP: Google vyvíja softvér na vylepšenie fotografií v nízkom rozlíšení

Videá zahŕňali 118 000 odlišných viet a 17 500 unikátnych slov, kým databáza LipNetu iba 51 unikátnych slov. A aké využitie by vlastne mohli mať takéto programy? Podľa vedcov z DeepMind by mohli ľuďom so sluchovým postihnutím pomôcť pochopiť konverzácie. Ďalej by mohli byť využité napríklad k anotácii nemých filmov alebo na ovládanie hlasových asistentov.

Pošli nám TIP na článok



Teraz čítajú