Big data in voedselveiligheid
Bij Wageningen University & Research doet RIKILT onderzoek naar voedselveiligheid. Big data wordt in verschillende applicaties gebruikt, maar op het gebied van voedselveiligheid is het nog niet volledig geïmplementeerd. RIKILT is stapsgewijs big data elementen aan het testen en implementeren binnen hun onderzoek naar voedselveiligheid. In 2015 is hiermee begonnen door deze ontwikkelingen in overweging te nemen.
Wat is big data?
De definitie van big data zoals omschreven door de Europese Commissie:
Big data refereert naar grote hoeveelheden verschillende typen data, op hoge snelheid geproduceerd door een groot aantal verschillende typen bronnen.
Europese Commissie (2014)
Vier verschillende eigenschappen zijn in big data te herkennen:
• Volume: refereert naar de enorme hoeveelheden data die elke seconde gegenereerd worden.
• Velocity: refereert naar de toenemende snelheid waarin data wordt gegenereerd en de snelheid waarmee het kan worden opgeslagen, verwerkt en geanalyseerd.
• Variety: refereert naar de verschillende typen data, o.a. gestructureerde data, half-gestructureerde data en ongestructureerde data.
• Veracity: refereert naar de betrouwbaarheid en accuraatheid van data.
Uit een literatuurstudie is gebleken dat Volume en Velocity over het algemeen geen probleem vormen in big data applicaties binnen voedselveiligheid, voor Variety en Veracity zijn echter wel toepassingen gevonden. Toekomstige trends zijn onder andere smartphone en social media applicaties, maar ook het beschikbaar stellen van data uit publieke onderzoeksprojecten. Deze trends zullen de big data aanpak stimuleren en nieuwe kansen openstellen. Er zullen echter infrastructuren moeten bestaan en zal kennis van big data applicaties nodig zijn.
Big data bij RIKILT
RIKILT richtte zich aanvankelijk op de analysefase, wat resulteerde in de ontwikkeling van een voorafgaand Bayesian network model voor het voorspellen van verschillende soorten voedselfraude op wereldwijde schaal, waarbij 36 databronnen met elkaar verbonden werden. De Bayesian network methode is boven andere systemen en netwerken gekozen wegens de meest consistente en correcte resultaten. Bayesian networks zijn nieuw op het gebied van voedselveiligheid en de voorspellingen binnen verschillende toepassingen zijn >90% gebleken bij het gebruik van deze methode. Voorspellingen zijn ook mogelijk, wat bijvoorbeeld interessante toekomstige veranderingen laat zien in de soort voedselfraude voor landen zoals China, waar wordt verwacht dat de food safety index zal verbeteren door beleid dat ingevoerd wordt.
Europese ontwikkeling: DEMETER project
Het DEMETER project is een initiatief op Europees niveau, wat het delen van data, kennis en methoden tussen EFSA en EU deelstaat autoriteiten over opkomende problemen op een snelle en effectieve manier wil ondersteunen.
Het project is bedoeld om geautomatiseerde pijplijnen te creëren ten behoeve van data vergaring, data validatie en data mining, om opkomende problemen te identificeren. Deze producten zullen beschikbaar worden gesteld op het Risk Knowledge Exchange Platform (ERKEP), wat ook door DEMETER zal worden ontwikkeld.
Bron: www.wur.nl