Spraakherkenning: meer dan spraak alleen

De techniek van spraakherkenning is enorm verbeterd zo vertelt Godie Vierbergen (directeur Cedere).

BAM. De medewerker sluit de deur achter zich….

Maar daarmee wordt onbedoeld ook het röntgenverslag waaraan nog gewerkt wordt, doorgestuurd naar de huisarts. Grote consternatie!
Slaande deur
Als enige vrouw van haar studiejaar volgt Godie Vierbergen tot 1977 de hts opleiding elektrotechniek. Zij gaat aan de slag als röntgenlaborante, maar wil eigenlijk machinist op de wilde vaart worden. Bij de introductie van spraaktechnologie (MBT) op de röntgenafdeling van het toenmalige Lucasziekenhuis in Apeldoorn is zij er als de kippen bij om hierin een rol te spelen. De röntgenafdeling vormt een dankbaar proefterrein voor spraaktechnologie omdat de te dicteren röntgenverslagen heel vaak vaste elementen (sjablonen) bevatten. Destijds kon bijvoorbeeld worden volstaan met de standaard uitslag “thoraxfoto geen bijzonderheden”. Vandaag de dag zou dat overigens niet meer voldoen en moet er een uitvoerige beschrijving komen. Om kort te gaan: het Lucasziekenhuis had de landelijke primeur. Maar het systeem kende beperkingen. Voordat bepaalde woorden werden herkend moesten deze vijfmaal worden herhaald. En dat nog eens door elk van de drie radiologen afzonderlijk. Ieder een eigen profiel. Die radiologen waren bepaald ‘not amused’ .Het systeem was in die zin wel weer geavanceerd dat de (voorlopige) uitslag meteen versleuteld werd verzonden naar de huisarts. Uiteraard met de voetnoot dat deze nog officieel moest worden geaccordeerd. Maar helaas reageerde het systeem ook op signalen als het dichtslaan van de deur. Want dat dichtslaan was ook door het systeem geregistreerd na de afsluitende opdracht ‘klaar’ door een röntgenoloog die een woord 5x had moeten inspreken (dan pas herkende het systeem de spreker). De aardigheid raakte er toen wel gauw van af.

Dictation Anywhere
Maar Godie Vierbergen was definitief gegrepen door deze technologie. Zij zag perspectief in de spraakherkenning. De ups en downs heeft zij allemaal meegemaakt. Zij richtte in 2000 in Deventer Cedere (=overdracht) op. Inmiddels een bloeiend bedrijf met drie doelgroepen namelijk de medici, advocatuur en arbeidsbeperkten. Het bedrijf is innovatief. De laatste ontwikkeling is het werken in de beveiligde cloud. Een abonnee kan vanaf de mobiele telefoon, ipad, computer of laptop een dictaat of bericht inspreken via een app. Dat bestand wordt in de cloud omgezet in tekst en geretourneerd naar de abonnee respectievelijk de secretaresse. De tekst kan dan verder worden opgemaakt, eventueel aan de hand van de audioversie van de ingesproken tekst. Het unieke zelflerende systemen (met ook contextherkenning, dus geen last van slaande deuren) wordt steeds beter en bijna foutloos in de loop der tijd. Vooral de snelheid is een enorm sterk punt bij deze technologie. Advocaten zijn veel onderweg en moeten bijvoorbeeld soms binnen enkele uren reageren op een dreigende uitwijzing van een asielzoeker. Je ziet dat ook op ongewone tijden wordt gedicteerd. Soms moet er vanwege een zieke secretaresse geïmproviseerd worden en dat lukt naar tevredenheid. Het systeem is volledige gecertificeerd (NEN 7510). Dit is de toekomst. De dienstverlening is beslist ook interessant voor het buitenland. Het systeem heeft nog aan kracht gewonnen door een recente uitbreiding met Dictation Anywhere. De techniek van (storend) geluidsonderdrukking of noise cancelling. Een Vxi Blueparrot headset vangt omgevingsgeluid weg, dat via een aparte microfoon wordt opgenomen, Het resultaat is dat zelfs in een lawaaierige vrachtauto communicatie mogelijk is met de buitenwereld. Uw auteur heeft deze headset aangeschaft en is nu al zeer geïmponeerd..

Letselschadebureau
Een van de partijen die ruime ervaring heeft opgedaan en een whitepaper heeft samengesteld over de ervaringen, is letselschadebureau Bosch & Berg. In de cloud staan de spraakprofielen van de auteurs. In een beveiligde app wordt een dictaat ingesproken, eventueel worden foto’s toegevoegd en versleuteld verzonden naar de server. De Dictation Anywhere server vertaalt het dictaat naar tekst. 99% herkenbaarheid is goed haalbaar. Het secretariaat leest de geschreven tekst, corrigeert en plaats deze in het dossier. Dit geeft een tijdsreductie van meer dan 50%. In deze sector wordt het instaptarief en abonnement vlot terugverdiend De toekomst ziet er zonnig uit voor Cedere, dat overigens ook actief is met andere systemen zoals standalone Nuance spraaksystemen. Maar ook Spika, een voice output systeem dat teksten voorleest. Ik kan mij voorstellen dat Dictation Anywhere ook kansrijk zou kunnen zijn in de journalistiek, zeker als daar meer fondsen ter beschikking komen.

EPD (elektronisch patiënten dossier)
Godie houdt een pleidooi voor inzet van systemen in de gezondheidszorg, die ongestructureerde tekst van de medicus structureren. Een voorbeeld: als er een te dikke dame van de trap valt, komt tegenwoordig in het sterk gestructureerde EPD (elektronisch patiënten dossier) slechts te staan dat de linker enkel is gebroken en wat er aan onderzoek aan behandeling heeft plaats gevonden. Daarmee gaat de context verloren. ‘Ik denk dat je daarmee veel data verliest’. Zoals belangrijke aspecten als obesitas. Vooralsnog stuit deze stellingname op weerstand vanuit de ICT-wereld, maar Godie Vierbergen is niet iemand die zich snel gewonnen zal geven. Volgens mij verdient deze benadering tenminste een pilot. Wie reageert?

Mijn gekozen waardering € -