Image Deze week is het de Week van de Ondertiteling. Steeds meer Nederlandse televisieprogramma’s moeten ondertiteld gaan worden, een arbeidsintensieve klus. Het NEON-project gaat verschillende mogelijkheden onderzoeken om met behulp van spraak- en taaltechnologie de ondertiteling zoveel mogelijk geautomatiseerd te verzorgen. In het voorjaar van 2004 heeft het kabinet, na veel aandringen van verschillende belangenverenigingen

voor doven en slechthorenden, besloten dat de publieke en commerciële omroepen meer programma’s moeten ondertitelen. In het verleden werd van de programma’s op de publieke zenders zo’n 60% ondertiteld, bij de commerciële en regionale omroepen bijna niets. Vanaf 1 januari 2008 moet dit echter zijn opgeschroefd tot 80% bij de publieke omroepen en 15% bij de commerciële, en in 2011 moeten deze percentages zelfs liggen op 95% en 50%. Het ondertitelen van programma’s is momenteel een arbeidsintensieve taak. Met een programma van een half uur is een titelredacteur bijna een hele dag bezig. Bij live-programma’s werken 2 titelredacteuren samen: de één luistert en vat snel samen wat er gezegd wordt en de ander typt dat razendsnel in op een speciaal toetsenbord. Wanneer bijna alle programma’s op deze manier ondertiteld zouden worden, wordt dat voor de publieke omroepen een onbetaalbare klus. Daarom wordt er nu onderzoek gedaan naar mogelijkheden om met behulp van spraak- en taaltechnologie Nederlands gesproken programma’s sneller, beter en goedkoper van ondertiteling te voorzien.

NEON

Tijdens de Week van de Ondertiteling (7 t/m 13 april) is het NEON-project (NEderlandse ONdertiteling) gepresenteerd, waarin verschillende mogelijkheden om automatische ondertiteling te verzorgen onderzocht gaan worden. Het Enschedese bedrijf Telecats gaat hiervoor samenwerken met de Nederlandse Taalunie, drie Vlaamse universiteiten en de Nederlandse en Vlaamse publieke omroepen.
De publieke omroepen maken al een paar jaar gebruik van speciale dicteersoftware: deze sprekerafhankelijke software is speciaal getraind op de spreekstijl van de titelredacteur zodat wanneer deze nazegt wat er in het programma gezegd wordt, er vanzelf een vrij goede ondertiteling gegenereerd wordt. De spraaktechnologie is helaas nog niet zo ver ontwikkeld dat de transcriptie (de uitgeschreven spraak) direct kan worden gemaakt vanaf de opname (sprekeronafhankelijk). Wel kan de spraakherkenner ingezet gaan worden bij programma’s waar al teksten voor op papier staan (bijvoorbeeld scripts of autocues). Deze teksten kunnen automatisch gesynchroniseerd worden met de spraak op de opname, zodat een vorm van ondertiteling ontstaat. Zelfs als sprekers afwijken van het script kan deze oplijning erg snel en nauwkeurig gebeuren.

Volledig automatische ondertiteling

NEON zal de mogelijkheden onderzoeken om met behulp van spraak- en taaltechnologie ondertiteling zo snel, goed en goedkoop mogelijk te genereren. Bij automatische spraakherkenning van de originele opname moet worden berekend welke woorden gesproken worden. Dit gaat het beste als de spraakherkenner een goed taalmodel heeft: een groot aantal relevante documenten, zodat geschat kan worden welke woorden waarschijnlijk wel gezegd worden en welke juist niet.
De spraakherkenner werkt het beste als hij alleen spraak hoeft te analyseren; dit vraagt dus om een pre-processor die de spraak kan scheiden van de niet-spraak in een opname. Naast de spraakherkenner zal ook een systeem nodig zijn dat de verschillende sprekers van elkaar onderscheidt en aparte kleuren toekent aan de verschillende sprekers, zodat doven en slechthorenden precies weten wie welke zin heeft gezegd.

Tenslotte zal NEON ook een tool ontwikkelen om de ondertiteling samen te vatten. Vaak wordt er tijdens een programma veel meer gezegd dan past in de twee regels onder in het scherm. Momenteel wordt dit nog door de titelredacteur samengevat, maar het zal ook mogelijk worden deze condensering automatisch te laten plaatsvinden. Uit onderzoek van de Universiteit van Antwerpen voor het Engels blijkt dat dit mogelijk is.

Bron: Kennislink.nl (auteur: Erica Renckens)  / DovenNieuws.eu