Společnost Toshiba Corporation vyvinula umělou inteligenci s 3D rozpoznáváním, která dokáže měřit vzdálenost s přesností stereokamery pomocí obrazu pořízeného komerční kamerou a analyzováním rozmazání obrazu způsobeného objektivem fotoaparátu pomocí hlubokého učení. Tato technologie eliminuje použití stereokamer, což nakonec snižuje náklady a prostor. Společnost Toshiba představí tento úspěch na mezinárodní konferenci o počítačovém vidění (ICCV2019), která se bude konat v Jižní Koreji 30. října 2019 od 10:00.
Snímání obrazu se stává stále důležitějším a aplikace, jako jsou roboti pohybující se objekty, autonomní bezpilotní vozidla, dálkově ovládané drony kontrolující infrastrukturu atd., Vyžadují více než jen obrazy subjektů, potřebují malé zařízení k analýze 3D dat, která zahrnují tvar a vzdálenost. Byly proto zvýšeny výzkumy s cílem vyvinout měřicí technologii s monokulárními kamerami (lze je snadno miniaturizovat) pomocí hlubokého učení pro lepší učení tvaru, pozadí a dalších dat scenérie zobrazovaného objektu.
Tato metoda má nevýhodu; přesnost vzdálenosti se odhaduje pomocí monokulárního fotoaparátu v závislosti na naučených datech scenérie, což způsobí pokles přesnosti v důsledku snímků pořízených v různých krajinách. K překonání tohoto problému společnost Toshiba vyvinula barevnou clonovou fotografii, ve které jsou k objektivu připojeny dva barevné filtry a podle vzdálenosti od objektu jsou analyzovány barvy a velikost výsledného rozmazání obrazu. Ačkoli to řeší problém závislosti na datech, úpravy stávajících čoček stojí čas a peníze.
Společnost Toshiba tento problém překonala vývojem AI s technologií rozpoznávání 3D, která pomocí hlubokého učení analyzuje, jak je obraz rozmazaný podle jeho polohy na objektivu, aby bylo možné dosáhnout měření vzdálenosti se stejnou vysokou přesností jako stereofonní kamerový systém, s běžnou monokulární kamerou, ale bez potřeby údajů o scenérii. Doposud se považovalo za teoreticky nemožné měřit vzdálenost na základě tvaru rozostření, který je stejný pro objekty se vzdáleností i vzdáleností, pokud jsou ve stejné vzdálenosti od ohniska. Analytické výsledky však ukázaly podstatný rozdíl mezi tvary rozostření blízko a daleko od objektů, i když jsou ve stejné vzdálenosti od ohniska. Díky tomu společnost Toshiba úspěšně analyzovala data rozmazání ze zachycených obrázků pomocí modulu hlubokého učení trénovaného s modelem hluboké neurální sítě.
Když světlo prochází čočkou, je známo, že tvar vytvořeného rozostření se mění v závislosti na vlnové délce světla a jeho poloze v čočce. Ve vyvinuté síti se poloha a barva zpracovávají odděleně, aby správně vnímaly změny tvaru rozostření, a poté, po průchodu mechanismem vážené pozornosti, kontrolují, kam na gradientu jasu zaostřit, aby bylo možné správně měřit vzdálenost. Prostřednictvím učení se síť poté aktualizuje, aby se snížila chyba mezi měřenou vzdáleností a skutečnou vzdáleností. Pomocí tohoto modulu AI společnost Toshiba potvrdila, že jediný snímek pořízený komerčně dostupnou kamerou dosahuje stejné přesnosti měření vzdálenosti zajištěné stereokamerami. Další informace najdete na této oficiální stránce společnosti Toshiba.
Společnost Toshiba potvrdí všestrannost systému komerčně dostupnými fotoaparáty a objektivy a urychlí zpracování obrazu s cílem veřejné implementace ve fiskálním roce 2020.