Tekst en association rule mining voor detecteren van workarounds in vrije tekst die gestructureerde data-invoer omzeilen

  • J. (Jan) van Rouwendal

Student thesis: Master's Thesis

Abstract

Veel informatiesystemen hebben functionele beperkingen om structurele data in te voeren en gebruikers kunnen dit omzeilen door vrije tekst in het informatiesysteem te gebruiken als workaround. Deze workarounds zijn een onderdeel van shadow-IT en gebruikers passen dit toe zonder bewustwording, acceptatie of ondersteuning van de organisatie. Detectie van dit fenomeen is daarom lastig, terwijl het juist inzicht geeft hoe we de functionaliteiten of processen van het systeem kunnen verbeteren en daarmee de weerbaarheid en veerkracht (resilient) verhogen. De toename in data science technologie biedt nieuwe mogelijkheden voor deze detectie door met tekstmining (TM) kenmerken te extraheren uit de teksten en met association rule mining (ARM) algoritmes de relaties te leggen naar omzeilde data. In deze thesis onderzoeken we de detectiekwaliteit van TM en de Apriori, FPGrowth en Tertius ARM-algoritmes gecombineerd met de voorspellingswaarde van potentieel omzeilde data. We dragen bij aan het literatuuronderzoek van workarounds door te constateren dat TM significante referentiewoorden van de workaround in tekst lokaliseert en ARM deze relateert aan de omzeilde gestructureerde data-invoer. Met verdiepende tekstmanipulatie- en aggregatietechnieken zijn de workarounds betrouwbaar te detecteren in combinatie met taalkundige analyse. Voor de praktijk hebben we een stappenplan voor detectie opgesteld en geven we aanbevelingen voor extern validatie met verbreding in tekstmanipulatie- en aggregatietechnieken om het automatische proces te verbeteren.
Date of Award26 Jan 2020
Original languageDutch
SupervisorLloyd Rutledge (Examinator) & Guy Janssens (Co-assessor)

Keywords

  • shadow-IT
  • workarounds
  • tekstmining
  • text mining
  • association rule mining
  • resilience mining

Cite this

'