Big Data Expo is een platform waar mensen en kennis samenkomen. Tijdens de 5de editie van de Big Data Expo op 18 en 19 september komen specialisten uit verschillende big data-disciplines en domeinen, samen in Jaarbeurs Utrecht. Met 5000 bezoekers, 120 lezingen en meer dan 85 exposanten is de Big Data Expo hét event als het gaat om data en analytics.
De thema’s die aankomende editie aanbod komen zijn; Analytics, AI, BI, Data Science, Digital Innovation, Ethiek, GDPR, IoT of Text Mining. In dit artikel besteden we aandacht aan de thema’s Text Mining en Data Science.
Voor het eerst een opzichzelfstaand thema tijdens de Big Data Expo. Zelfs relatief kleine organisaties genereren dagelijks grote hoeveelheden tekst die waarde creëren. Maar het is niet eenvoudig om die waarde eruit te halen gezien de enorme diversiteit en het volume van de gemaakte documenten. Het opkomende gebied van text mining is in staat om nieuw inzicht te verwerven, voorspellingen te maken en data om te zetten in bruikbare resultaten.
Tekst komt voor in een enorme variëteit aan systemen en documenten, ieder met een eigen structuur. Nog altijd is het zo dat het merendeel van alle data niet geanalyseerd wordt. En van alle nieuwe data die gecreëerd wordt is naar schatting 80% ongestructureerd. Dit gegeven, gecombineerd met de omvang en complexiteit vereist een aanzienlijke verwerkingskracht om inzicht en waarde op te leveren.
De uitdagingen met tekst, in tegenstelling tot meer gestructureerde gegevensbronnen is bijvoorbeeld het ontbreken van een consistente structuur. Het vakgebied text mining richt zich op het ontwikkelen van diverse geavanceerde wiskundige-, statistische-, taalkundige- en patroonherkenning technieken waarmee het mogelijk is om ongestructureerde informatie automatisch te analyseren alsmede om hoge kwaliteit en relevante gegevens te extraheren en de tekst in zijn geheel beter doorzoekbaar te maken.
Data Science, letterlijk ook wel data wetenschappen genoemd, is de wetenschap die zich bezig houdt om kennis en inzichten te vergaren op basis van gestructureerde en ongestructureerde data middels verschillende methoden, processen en systemen. Deze inzichten kunnen descriptief zijn (wat is er gebeurd), verklarend (waarom is dat gebeurd), voorspellend (wat gaat er gebeuren) of actie georiënteerd zijn (wat kan ik doen). Hier komen Domeinkennis, Computer Science en Wiskunde & Statistiek samen. Maar wat betekenen deze begrippen eigenlijk, wat is de relatie daartussen en welke specialisten heb je hier voor nodig?
Domein gaat om de kennis van het vakgebied of project waar je data science gaat toepassen. Wanneer je bijvoorbeeld gaat werken voor een reisorganisatie is het belangrijk om kennis te hebben van het domein toerisme en de dynamiek in deze markt en business goed begrijpt. Pas wanneer je de materie goed begrijpt wordt het waardevol om data science in te zetten om de processen en besluitvorming te optimaliseren.
Specialist; data translator, dit is degene die zowel kennis heeft van de business als van de statistiek en kan de koppeling maken om deze op waardevolle wijze aan elkaar te koppelen.
Programmeren, het cleanen en prepareren van de ongestructureerde en gestructureerde data (data die klaar is om het model in te gaan) en het bouwen van een solide infrastructuur. Op het moment dat je weet welke data wel en niet het model in mag gaan kan je dit gaan automatiseren.
Specialist; data engineer, deze zorgt voor een goede infrastructuur om de modellen op te laten draaien.
Om waarde uit je data te halen heb je kennis nodig van statistiek en wiskunde. Op basis van statistische modellen kunnen verbanden worden gelegd in grote hoeveelheden data. Door het herkennen van verbanden en patronen in het verleden kunnen voorspellingen worden gedaan over de toekomst en kan op basis hiervan de besluitvorming worden geoptimaliseerd.
Specialist; data scientist, dit is degene die met zijn uitgebreide kennis van wiskunde en statistiek de voorspellende modellen maakt.
Het inzichtelijk maken van data kan helpen bij het maken van beslissingen die waardevol zijn voor het bedrijf. Daarnaast kunnen deze inzichten ook nieuwe kansen creëren zoals bijvoorbeeld het optimaliseren van de customer journey.
Benieuwd naar meer? Kom dan op 18 en/of 19 september naar Big Data Expo waar onze experts je graag meer vertellen. Meld je gratis aan!
[Fotocredits © monsitj – Adobe Stock]