Toshiba Corporation je razvila umetno inteligenco s 3D-prepoznavanjem, ki lahko z natančnostjo stereo kamere meri razdaljo z uporabo slike, posnete s komercialno kamero, in z globokim učenjem analizira zamegljenost slike, ki jo povzroča objektiv kamere. Ta tehnologija bo odpravila uporabo stereo kamer, kar sčasoma zmanjša stroške in prostor. Toshiba bo ta dosežek predstavila na mednarodni konferenci o računalniškem vidu (ICCV2019), ki bo 30. oktobra 2019 od 10. ure zjutraj v Južni Koreji.
Zaznavanje slik postaja vse pomembnejše in aplikacije, kot so roboti, ki premikajo predmete, avtonomna brezpilotna vozila, daljinsko vodeni droni, ki pregledujejo infrastrukturo itd., Zahtevajo več kot le slike subjektov, potrebujejo majhno napravo za analizo 3D-podatkov, ki vključuje obliko in razdaljo. Zato so se povečale raziskave, da bi razvili merilno tehnologijo z monokularnimi kamerami (enostavno jih je miniaturizirati) z globokim učenjem za boljše učenje oblike, ozadja in drugih podatkov o pokrajini posnetega predmeta.
Ta metoda ima pomanjkljivost; natančnost razdalje se oceni s pomočjo monokularne kamere, odvisno od naučenih podatkov o pokrajini, kar povzroči upad natančnosti zaradi posnetkov v različnih pokrajinah. Da bi to premagali, je Toshiba razvila fotografiranje zaslonke s filtriranim barvnim filtrom, pri katerem sta na lečo pritrjena dva barvna filtra, barva in velikost nastale zamegljenosti slike pa se analizirata glede na oddaljenost od motiva. Čeprav to rešuje vprašanje odvisnosti od podatkov, spreminjanje obstoječih leč stane čas in denar.
Toshiba je to težavo odpravila z razvojem umetne inteligence s tehnologijo 3D prepoznavanja, ki s pomočjo globokega učenja analizira, kako je slika zamegljena glede na njen položaj na leči, da bi dosegla merjenje razdalje z enako visoko natančnostjo kot sistem stereo kamer, z običajno monokularno kamero, vendar brez potrebe po podatkih o pokrajini. Do zdaj se je štelo, da je teoretično nemogoče izmeriti razdaljo glede na obliko zameglitve, ki je enaka za predmete z razdaljo in daleč, ko so enako oddaljeni od goriščne točke. Toda analitični rezultati so pokazali znatno razliko med zamegljenimi oblikami blizu in oddaljenih predmetov, tudi če so enako oddaljeni od goriščne točke. S tem je Toshiba uspešno analizirala zamegljene podatke iz zajetih slik z modulom za globoko učenje, usposobljenim z modelom globoke nevronske mreže.
Ko svetloba prehaja skozi lečo, je znano, da se oblika nastale zamegljenosti spreminja glede na valovno dolžino svetlobe in njen položaj v leči. V razviti mreži se položaj in barva obdelata ločeno, da pravilno zaznamo spremembe v obliki zameglitve, nato pa po prehodu skozi tehtani mehanizem pozornosti nadzorujemo, kje na gradientu svetlosti naj se izostrijo, da pravilno izmerimo razdaljo. Z učenjem se mreža nato posodobi, da se zmanjša napaka med izmerjeno razdaljo in dejansko razdaljo. Z uporabo tega modula AI je Toshiba potrdila, da ena slika, posneta s komercialno dostopno kamero, doseže enako natančnost merjenja razdalje, ki je zagotovljena s stereo kamerami. Več informacij najdete na tej uradni strani Toshibe.
Toshiba bo potrdila vsestranskost sistema s komercialno razpoložljivimi kamerami in objektivi ter pospešila obdelavo slik in si prizadevala za javno uporabo v proračunskem letu 2020.