Our AI-software is beter than I ever imagined
In ‘Ontdek de groeikansen van AI’, Remy Gieling (Editor of MT/Sprout) takes you on a journey allong algorhitms and self regulating systems. The article, in Dutch only, can be found below. The book can be purchased here.
Who: Harro Stokman
Function: Oprichter Kepler Vision Technologies
Technology: Computer Vision
Funding: € 3,9 million
De ouderenzorg dreigt te bezwijken onder vergrijzing, stijgende zorgkosten, gebrek aan gekwalificeerd personeel en inefficiëntie. In verzorgingstehuizen moeten medewerkers drie keer per nacht een ronde lopen om te controleren of bewoners hulp behoeven. Vervelend voor de verzorger en voor de bejaarden. De technologie van het Amsterdamse bedrijf Kepler Vision biedt uitkomst. Dankzij ‘computer vision’-technologie houdt een onbemande camera middels een algoritme een oogje in het zeil: zit een bewoner te lang in de badkamer, ligt hij of zij op de grond, of komt iemand met veel moeite zijn bed uit? Dan wordt direct een hulpverzoek per sms naar de zorgverlener van dienst gestuurd. Voor oprichter Harro Stokman is de technologie niet nieuw. In de jaren negentig studeerde hij af op het onderwerp. Zijn eerste bedrijf Euvision – dat objecten kon herkennen op foto’s – werd in 2014 door de Amerikaanse chipmaker Qualcomm overgenomen.
Wat is computer vision?
‘De technologie waarbij je de computer wilt laten begrijpen wat er op beeld te zien is.’
Hoe verschilt de huidige technologie van vijfentwintig jaar geleden?
‘Destijds konden we vrij weinig. De gedachtegang was destijds in de academische wereld dat wanneer je de computer een stoel wilde laten herkennen, je een ideaal 3D-model van een stoel moest maken. Als je dan een foto had, moest je proberen om het model van die stoel zo te roteren en te schalen dat het met de foto matchte. Ze hebben daar tientallen jaren aan gewerkt, maar in de praktijk bleek dit een onmogelijke opgave. Stoelen verschillen nu eenmaal in de praktijk teveel van elkaar. Rond 2000 kwam het idee om sets van gelijksoortige foto’s te verzamelen, bijvoorbeeld met stoelen erop. Je zette de computer aan het rekenen: wat is de kleur, welke lijnen zijn te herkennen in verschillende pixel-combinaties? Je hoopte dat het machine learningmodel in de set met stoelen unieke eigenschappen zou herkennen die in andere foto’s zonder stoelen niet voorkwamen, om zo tot de uitkomst ‘stoel’ of ‘geen stoel’ te komen.’
En werkte dat goed?
‘Destijds werkte dat nét iets beter dan wanneer je een aap pijltjes zou laten gooien om uit te kiezen op welke foto een stoel te zien was. Het was wel de basis voor de techniek die nog steeds wordt gebruikt. Bovendien gaat de ontwikkeling inmiddels razendsnel. Ik vind onze software nu al beter dan ik ooit voor mogelijk had gehouden.’
Wat is het probleem dat Kepler Vision probeert op te lossen?
‘We geven enerzijds hulpbehoevende ouderen een stuk privacy terug, het is immers geen prettige gedachte dat er drie keer per nacht iemand je slaapkamer komt binnenlopen. Bovendien zijn er weinig mensen die het leuk vinden om ‘s nachts te werken. We ontzorgen hiermee voor een groot deel de zorg.’
Vinden mensen dat niet vervelend, een camera die je door het huis heen volgt?
‘Je moet goed uitleggen dat de beelden nooit door mensen te zien zijn. Je kunt het zien als een rookmelder voor hulpbehoevenden. Alleen als de software detecteert dat iemand gevallen is, te lang in de badkamer blijft of niet uit bed komt, gaat er een signaal naar de hulpverlener.’
Hoe verschilt de technologie van Kepler van je vorige bedrijf?
‘We zijn nu in staat om beweging van een of meerdere personen in real time te verwerken. Ons vorige bedrijf kon objecten herkennen op statische afbeeldingen: honden, katten, zonsondergangen, vlaggen, boten, creditcards en logo’s. Tegenwoordig doet Google dat in een handomdraai, maar destijds was onze oplossing state of the art. Het lastige was om er betalende klanten voor te vinden. Iedereen was vol lof, maar niemand zag het praktisch nut. Die markt kwam per toeval, toen een grote datingsite ons vroeg of we ongewenste afbeeldingen van bepaalde lichaamsdelen konden filteren.’
Je moest het algoritme eerst trainen om deze ‘objecten’ te herkennen…
‘Klopt, objectherkenning werkt als volgt: je laat een computer heel veel foto’s zien van een object die hij moet leren kennen – zeg een zaklamp – en laat hem heel veel foto’s zien waar geen zaklamp op te zien is. Bij beide groepen vertel je expliciet: bij deze groep is een zaklamp te zien en bij deze groep niet. De computer gaat vervolgens zelf in de pixels op zoek naar overeenkomstigheden. De foto’s voor de trainingsset moet je handmatig selecteren en labelen. Voor de datingsite betekende dat met een team heel veel foto’s van lichaamsdelen bekijken. Dat was even vreemd, maar na een dag kijkt niemand er meer van op. We moesten alleen opletten dat er niet plotseling bezoek over de vloer kwam, dat had ongetwijfeld vreemde blikken opgeleverd.’
Hoeveel foto’s zijn er nodig om zoiets te trainen?
‘Voor een goed resultaat kunnen honderdduizenden foto’s nodig zijn. Dat vergt handwerk en is dus enorm arbeidsintensief.’
Er zijn veel publieke datasets beschikbaar, ook met afbeeldingen, kunnen jullie daar gebruik van maken?
‘We hebben daar inderdaad mee gewerkt, maar er zit een groot nadeel aan. Veel data zijn in deze datasets verkeerd gelabeld. Zo hadden we een model gemaakt dat mannen en vrouwen moest kunnen herkennen op basis van zo’n openbare dataset. De mannen gingen feilloos, maar bij het herkennen van vrouwen traden er keer op keer fouten op. We snapten in eerste instantie niet hoe dat kon, totdat we de dataset gingen onderzoeken. Wat bleek, allemaal objecten, van een moskee tot een snelweg had iemand als ‘vrouw’ gelabeld. Dan snapt een algoritme er logischerwijs niks meer van. Mocht je gebruik maken van openbare data, vergeet dan niet de trainingsdata nog een keer handmatig door te lopen.’
Jullie steken veel tijd en geld in het ontwikkelen van jullie software, hoe zorgen jullie dat een ander bedrijf er niet met jullie idee vandoor gaat?
‘Net als bij Euvision patenteren we bij Kepler veel van onze innovaties. Kepler bestaat nu drie jaar en we hebben net ons tiende patent ingediend. We hebben bijvoorbeeld software ontwikkeld waardoor een camera onderscheid kan maken tussen een persoon en een foto waar die persoon op staat in dezelfde ruimte. Wij denken dat meer bedrijven deze techniek in de toekomst willen gebruiken en creëren zo aanvullende bedrijfswaarde. ’
Jullie software werkt momenteel in de cloud, je wilt de software graag op hardware die in de camera’s geïntegreerd is laten draaien, waarom is dat?
‘Het draaien van modellen op hardware van bijvoorbeeld camera’s in plaats van op een server in de cloud wordt Edge AI genoemd. Sommigen zijn van mening dat dit veiliger is, omdat de beelden niet via het internet verzonden worden. Dat vind ik niet zo’n sterk argument omdat je die verbinding goed kan beveiligen. De belangrijkste reden voor ons om de software op de camera’s zelf te installeren, is dat het de installatie van onze oplossing vereenvoudigd: Je hebt veel minder bandbreedte nodig. Ook is het analyseren van de beelden op de camera goedkoper dan wanneer elk frame naar de servers van Amazon of Microsoft moet sturen om daar de berekeningen uit te voeren.’
Tegen welke uitdaging loop je aan?
‘Het product kosteneffectief krijgen. Anderhalf jaar geleden hadden we een prototype dat 24 uur rekentijd nodig had om een filmpje van 30 seconden te analyseren. Inmiddels is het gelukt om de berekening nagenoeg in real time plaats te laten vinden.’