Business Intelligence blog - laatste entry 10-01-2012 - Programmeren anno 2012
Oude mensen, zoals ik, herinneren zich nog hoe je in de zeventiger jaren moest programmeren.We kwame ...
Business Intelligence activiteiten
22 mei 2012, Integratieoplossingen voor Applicaties, Gegevens en Processen
22 mei 2012, Moderne Databasetechnologie
5 juni 2012, BPMN 2.0 syntax, methodieken en positionering
6 juni 2012, BPMN 2.0 in de praktijk
7 juni 2012, Data Virtualization voor Agile Business Intelligence Systemen
14 juni 2012, Trends in BPM 2012

Business Intelligence poll
BI-poll Intelligente search-technologie zal van grote invloed zijn op traditionele BI.
 
74%
 
22%
 
5%
Business Intelligence vacatures - Array Jobs
Lees meer

Detail
Rick van der Lans 
Rick van der Lans Rick F. van der Lans is onafhankelijk adviseur, docent, auteur en spreker over datawarehousing, business intelligence, applicatie-integratie en databasetechnologie. Hij heeft hij vele grote (inter)nationale bedrijven geadviseerd inzake datawarehouse-architectuur en toolkeuze. Hij is voorzitter van het Independent Analyst Platform en auteur van diverse artikelen in toonaangevende vakbladen en verscheidene boeken, waaronder het populaire SQL Leerboek.

13 december 2010 - Datawarehouses en olifanten: over omkeerbare definities

Veelvuldig bekritiseren we de gebruikers dat ze slechte of zelfs geen definities voor hun begrippen hebben. We vinden het helemaal bespottelijk als gebruikers verschillende definities hanteren voor hetzelfde begrip. Maar doen wij het zelf wel zo goed? Ik denk het niet. In de wereld van business intelligence en datawarehousing zijn de definities van bekende begrippen matig gedefinieerd, zelfs van diegene die we dagelijks hanteren. Uiteraard leidt dit altijd tot verwarrende discussies.
 
Een goede definitie van een begrip voldoet aan bepaalde eisen, onder andere aan omkeerbaarheid. Stel dat we de volgende abstracte definitie hebben “A is tekst”. Omkeerbaarheid betekent dat alles wat voldoet aan de tekst ook tevens een A is. Neem als voorbeeld het begrip Afrikaanse olifant (Loxodonta). De definitie hiervan is zoiets als “een grote herbivoor met een slurf, slagtanden, grote oren en dikke poten”. Elk zoogdier dat aan deze eisen voldoet is dus per definitie een olifant. Het hebben van een slurf alleen is niet voldoende, je moet ook nog slagtanden, grote oren en dikke poten hebben.
 
Met een goede definitie willen we de goede begrippen insluiten en de verkeerde uitsluiten. Bijvoorbeeld, uit de bovenstaande definitie van Afrikaanse olifant is af te leiden dat de savanneolifant wel een Afrikaanse olifant is, maar door grote oren als eis op te nemen, sluiten we de Indische olifant terecht uit. Door te eisen dat een definitie omkeerbaar is, zorgen we dat we de goede zaken insluiten en de verkeerde terecht uitsluiten.
 
In onze wereld zijn de definities niet altijd omkeerbaar. Laten we als voorbeeld Bill Inmon’s bekende en veel gebruikte definitie van datawarehouse nemen. Zijn definitie luidt als volgt  “A data warehouse is a subject oriented, integrated, non volatile, time variant collection of data for management’s decision making”. Deze definitie is helaas niet omkeerbaar. Als een gebruiker een spreadsheet maakt die klantgegevens bevat (subject-oriented), die vanuit diverse systemen bij elkaar gebracht zijn (integrated), die de gehele tijd onveranderd blijven (non-volatile) en die historische gegevens bevatten (time variant) en als deze spreadsheet gemaakt is ter ondersteuning van beslissingen, dan voldoet deze spreadsheet aan alle eisen die in de definitie staan. Ergo, deze spreadsheet is een datawarehouse. Maar ik denk niet dat dit Inmon’s idee was. Kortom, de definitie is veel te ruim gedefinieerd. Dit geldt overigens voor diverse andere definities die we hanteren.
 
Trouwens, ik ga maar even voorbij aan het feit dat we voor bepaalde concepten geheel geen definitie hebben.
 
Wordt het niet eens tijd dat we met een kam door al deze definities heengaan? In vakgebieden als scheikunde, natuurkunde en economie krijgen ze het toch ook voor elkaar om sluitende definities op papier te zetten, dan moet het ons toch ook lukken.



Permalink | Trackback | Print | E-mail

Reacties op deze blog
Hennie de Nooijer, 14-12-2010 13:59:50
Dat klinkt als :"Bij de loodgieter lekken de leidingen ook". Ik ken (ook uit de wiskunde) de begrippen Inductie en deductie (http://nl.wikipedia.org/wiki/Deductie_versus_inductie). Bij deductie is een algemene regel toepasbaar op een specifiek geval. Bij deductie wordt gestelddat als je basis juist is, moet je conclusie ook juist zijn. Is je conclusie onzin, dan is je basis niet juist (Datawarehouse is…). En bij inductie is dat andersom: afleiden van zo algemeen mogelijke regels uit een verzameling specifieke gevallen (het is subject oriented, het is non volatile, etc dan zal het wel een datawarehouse zijn). Het laatste is zeker lastig omdat er maar eentje hoeft te zijn (neem Kimball) en het klopt niet. Wellicht moeten we definitie opstellen voor een DWH met EN EN EN (Inmon) OF EN EN EN (Kimball)….
Reageer
Wilt U een reactie plaatsen op dit bericht? Log dan in op deze website. Heeft U dat nog niet eerder gedaan? Registreer U dan eerst.
Business Intelligence nieuws || alle items 14-02-2012 - Information Builders opnieuw in leiderskwadrant Business Intelligence Platforms
De evaluatie is gebaseerd op ‘Ability to Execute’ en ‘Completeness of Vision’.
Lees meer
Business Intelligence video || alle items
Data Vault

Tijdens het BI-event 2011 vertelt Hans Hultgren , zakenpartner van Dan Linstedt en directeur van de Genesee Academy, over het succes van Data Vault in Nederland.
 
Database Magazine artikelen || alle items || zoeken
Geen leesweergave beschikbaar27-09-2011 - Bezoekerservaringen op maat

E-commercebedrijven leggen de vaak nadruk op het realiseren van een hoog transactievolume. Volgens Chris Hoogendoorn zijn er ook spelers die hun concurrenten consequent achter zich laten door voort te bouwen op inzicht in de klant. Expedia bijvoo ... Lees meer

Geen leesweergave beschikbaarCertificaat van Onvermogen
Geen leesweergave beschikbaarIdentificeren, Stimuleren en Organiseren
Geen leesweergave beschikbaarWeb Analytics: een ondergeschoven kind?
Geen leesweergave beschikbaarTom Davenport on Analytics
Geen leesweergave beschikbaarPlaatjes halen waarde uit data
Geen leesweergave beschikbaarHet datawarehouse geen database meer?
Geen leesweergave beschikbaarTrends en ontwikkelingen in Business Analytics
Geen leesweergave beschikbaarResultaten Business Analytics Survey
BI-Matrix
Categorieën
Organisaties

U kunt ook het selectietraject doorlopen.
Klik hier om het selectietraject te starten.
AnalyticsDB-Matrix
Kenmerken
Producten

U kunt ook het selectietraject doorlopen.
Klik hier om het selectietraject te starten.
ETL-Matrix
Selectiecriteria
Producten

U kunt ook het selectietraject doorlopen.
Klik hier om het selectietraject te starten.
Business Intelligence vacatures - Array Jobs
Lees meer
BI-blogs categorieënGeen categorieën gevonden.
Business Intelligence agenda
22 mei 2012, Integratieoplossingen voor Applicaties, Gegevens en Processen
22 mei 2012, Moderne Databasetechnologie
5 juni 2012, BPMN 2.0 syntax, methodieken en positionering
6 juni 2012, BPMN 2.0 in de praktijk
7 juni 2012, Data Virtualization voor Agile Business Intelligence Systemen
Lees meer

Klik hier om een evenement op te voeren.
Business Intelligence sponsors
BI in de nieuwste DB/MIn Database Magazine 4 
  • Het Gouden Record
  • Datakwaliteit heeft baat bij government-model
  • Implementatie datakwaliteit met Six Sigma
  • Dataflux pakt probleem bij de bron aan
  • Met Scrum meer grip op BI-projecten
  • Karien Verhagen reageert op artikel van Fons Pieters 
  • Asymmetrische links in Data Vault (slot)
BI opleidingenGeen opleidingen gevonden.

Klik hier om een opleiding te plaatsen.
Business Intelligence foto
Foto's Bi-Event 2010
Op 17 mei 2011 vond in Intres Hoevelaken het
BI-Event 2011 plaats.

Klik hier voor een korte foto-impressie.