Tamura Jones heeft de laatste weken op zijn Engelstalige website Modern Software Experiencediverse artikels geplaatst over de consistentie van genealogische data. Elke stamboomprogramma moet een functie hebben om de kwaliteit van de genealogische data op consistentie te controleren, maar nog belangrijker: elke stamboomonderzoeker moet deze functie gebruiken!
Een viertal artikels in deze reeks raad ik u zeker aan:
In dit laatste artikel roept hij websites die genealogische data presenteren, zoals Genealogie Online, GeneaNet, Ancestry, StamboomNederland enz., om geen inconsistente data toe te laten op hun website. Om Tamura te citeren: "Operators of online genealogy hosting may not be able to guarantee that all data is correct, but they can guarantee that the genealogies they show to visitors are consistent."
Hoe denkt u hierover?
Bob Coret - 16 nov 2012 - 21:49
@Bob,
Stuur deze informatie maar met spoed door naar wiewaswie.
Als er één site niet goed met gegevens omgaat dan zijn zij het wel.
Www neemt alle fouten van GenLias zonder meer over.
Zoek maar eens naar geboorten in de periode 1913 t/m 2011; geeft toch nog 3.281 hits.
Het is niet veel, maar wel TEVEEL.
Een beetje programmeur kan deze fouten zo filteren.
Jack de Mol - 16 nov 2012 - 22:15
Veel genealogen hebben duizenden personen in hun bestanden staan, met daaraan gekoppeld vele duizenden gegevens. Het is haast onontkoombaar dat daar "inconsistencies" in sluipen. Ongehuwde moeders van 85 die nog een kind krijgen, u kent ze wel. Sommige programma's hebben de mogelijkheid om op basis van (zelf in te stellen) criteria, checks uit te voeren. Maar dat moet dan af en toe wel eens gedaan worden. Daarom kan het geen kwaad dat dit bij uploaden naar een publieke site sowieso gebeurt. Vervolgens moet de "uploader" e.e.a. natuurlijk wel bekijken en zo nodig corrigeren.Het is dan wel prettig indien de gehanteerde criteria gepubliceerd worden. De bonafide genealoog zal deze extra controle alleen maar op prijs stellen.
Overigens Bob, heet Tamuro Jones Tamura, maar dit geheel terzijde.
Peter Miebies - 16 nov 2012 - 22:33
@Jack,
Ik zal een link naar WieWasWie doorsturen
. Je hebt zeker een punt, WieWasWie kan ook best controle uitvoeren voordat ze overgaan tot publiceren! Maar eerlijkheid gebied te zeggen: zij zullen weer wijzen naar de deelnemende archieven, want daar krijgt WieWasWie z'n data van. En archieven kunnen net als stamboomonderzoeker consistentie checks uitvoeren!
@Peter,
Voor Genealogie Online staan de controles op http://www.genealogieonline.nl/help/item.php/222 Zou ik op Genealogie Online een stap verder moeten zetten om dergelijke inconsistente gegevens niet te publiceren?
Bob Coret - 16 nov 2012 - 22:49
Peter Miebies - 16 nov 2012 - 22:57
Ben bezig voor een paar archieven de ingeklopte gegevens uit de DTB-boeken aan het controleren. Deels daarvan zijn afkomstig uit een oud programma die overgezet zijn naar het nieuwe programma. Ook bij het overzetten komen ook wat fouten voort. Die verbeter ik aan de hand van originele stukken en voeg de daarbij ontbrekende gegevens bij. Maar ook mensen die de gegevens inkloppen maken fouten, vaak doordat ze het oude schrift niet zo machtig zijn. Deze worden ook gecorrigeerd. Nadat deze zijn gecorrigeerd worden ze gelinkt aan de scans en vervolgens op internet geplaatst. Dat gebeurd ook met BS en BR.
En deze gegevens gaan voorlopig nog niet naar WieWasWie, omdat de betreffende archieven en vrijwilligers sceptisch tegenover WWW zijn. Ze zijn gewoon amateuristisch bezig, dat al vele miljoenen euro's heeft gekost. Bij WWW zouden ze 10 jaar nodig hebben om alle fouten te herstellen.
mvg, Masje II
Masje II - 16 nov 2012 - 23:27
@Masje II
Om de discussie niet al te warrig te maken, denk ik dat er een onderscheid is tussen fouten en inconsistente zaken. Een (tik)fout kan resulteren in een inconsistentie bv 1990 i.p.v. 1790, maar het hoeft niet 1791 ipv 1790. En Bob doelt op de eerste categorie.
Peter Miebies - 16 nov 2012 - 23:35
Zowel stamboomonderzoekers als vrijwilligers maken fouten. De meerderheid doet dit niet moedwillig en ik denk dat een ieder de fouten wil verbeteren.
Vraag is of - als je dit geautomatiseerd kunt detecteren - je de inconsistente gegevens nog steeds moet publiceren (met of zonder waarschuwing of foutmelding)? En dat geldt dan voor zowel archieven als websites die genealogische gegevens publiceren.
Bob Coret - 16 nov 2012 - 23:39
@Bob,
Het is niet "www kan ook best controle uitvoeren", maar "www moet ook controles uitvoeren".
Elke schakel in de keten heeft zijn of haar verantwoordelijkheden. Afschuiven naar de vorige schakel is niet bepaald professioneel.
Het begint bij de controle tijdens en na het invoeren bij de archiefdienst. Als zij de gegevens doorgeven naar bijvoorbeeld GenLias of www dan horen weer controles uitgevoerd te worden.
Een voorbeeld in www, dat er niet om liegt:
voornaam = 'doodgeboren' en plaatsnaam = 'Rockanje'
221 hits, maar bij alle doodgeboren kinderen wordt verwezen naar een geboorteakte.
Idem bij Oostvoorne geeft 257 hits met het documenttype 'BS geboorte'.
Dit komt overigens bij meerdere plaatsen op Voorne-Putten voor.
Het regionaal archief VPR heeft hier duidelijk niets gecontroleerd toen de gegevens in GenLias werden opgenomen. Www neemt alles nogmaals klakkeloos over.
Zie ook http://www.genver.nl/zh/0598MAN.HTM en http://www.genver.nl/zh/0581MAN.HTM
Om op je laatste vraag terug te komen:
"Vraag is of - als je dit geautomatiseerd kunt detecteren - je de inconsistente gegevens nog steeds moet publiceren (met of zonder waarschuwing of foutmelding)?"
Fouten, die ontstaan zijn in de akten zelf moet je zeker (ongecorrigeerd) publiceren, maar als dit technisch mogelijk is ook een melding doen met wat er aan schort. De historie moet immers intact blijven.
Een goed voorbeeld: http://www.genlias.nl/nl/searchDetail.jsp?val=0&xtr=24241593
Inconsistente gegevens, die wel gecorrigeerd moeten worden:
De volgende persoon kan nooit overleden zijn http://www.genlias.nl/nl/searchDetail.jsp?val=0&xtr=24185580 31 april heeft immers nooit bestaan.
En het volgende huwelijk zou formeel nooit hebben plaatsgevonden: http://www.genlias.nl/nl/searchDetail.jsp?val=0&xtr=14666822 als ik de gegevens mag geloven, maar daar hebben we www.genver.nl voor.
Duidelijke voorbeelden, die bij het inlezen van data vragen om syntax-controles op datums.
Invoerfouten corrigeren of als het niet anders kan, melden wat er fout is.
Jack de Mol - 17 nov 2012 - 13:55
Ik zou voorstander zijn van het zeer expliciet vermelden van de waarschuwing op de pagina waarin het getoonde gegeven wordt weergegeven. Op deze manier is het niet alleen voor de auteur, maar ook voor de overige gebruiker duidelijk dat extra aandacht vereist is.
Daarbij zouden zelfs twee typen waarschuwingen gemaakt kunnen worden: onwaarschijnlijkheden (oranje) en inconsistenties (rood). Iemand die overlijdt voordat hij/zij geboren wordt, is inconsistent. Iemand die een kind krijgt voor het 16e levensjaar (zoals nu in genealogieonline gehanteerd wordt) is onwaarschijnlijk maar niet onmogelijk.
Voor "onwaarschijnlijkheden" zou de auteur de mogelijkheid moeten krijgen de waarschuwing, na verificatie, niet langer te tonen. Voor inconsistenties zou de waarschuwing altijd moeten blijven gelden totdat de aangeleverde Gedcom verbeterd is.
Daarnaast zou GenealogieOnline aggressiever kunnen zijn in "fout detectie". Leeftijden boven de 110 worden nu niet als onwaarschijnlijk aangemerkt. Ook zit er bij mijn weten geen check op het feit dat kinderen binnen 9 maanden na het vorige kind uit dezelfde ouders geboren worden.
Frederik - 17 nov 2012 - 18:26
@Frederik,
Ik heb eens kritisch naar de huidige controles gekeken (zie ook http://www.genealogieonline.nl/help/item.php/222) en kan deze goed opdelen in fouten en "onwaarschijnlijkheden". Met twee type ikoontjes werken kan dus goed. Ga ik mee een de slag.
De huidige controles kijken naar de persoon zelf en z'n ouders. Nog niet omgekeerd, ouders en hun kinderen, waardoor de minimale 9 maanden check (voor de moeder) er inderdaad nog niet is. Ga ik eens naar kijken.
Als er nog meer suggesties zijn voor controles dan hoor ik die graag!
mvg,
Bob Coret
Bob Coret - 17 nov 2012 - 20:25
Genealogie Online maakt vanaf nu onderscheid tussen fouten en onwaarschijnlijkheden (waarschuwingen).
Tevens worden de meldingen meer prominenter weergegeven. Waar er eerst alleen een ikoontje werd getoond waar je met de muis over moest "hangen" om de melding te zien, wordt er nu de complete melding getoond.
Het maakt Genealogie Online echter nog geen Inconsistent Genealogy Free Zone....
Bob Coret - 17 nov 2012 - 21:36
Peter Miebies - 17 nov 2012 - 22:10
Beste Bob,
Dat is erg snel in elkaar gezet. Klasse.
In plaats van GenealogieOnline een inconsistent genealogy free zone te maken, kun je natuurlijk ook per gebruiker aangeven of zijn/haar genealogie vrij van inconsistenties is. Nu met de split tussen waarschuwingen en fouten is dat een stuk makkelijker. Op de openingspagina van een consistente genealogie zou dan een soort icoon kunnen komen (wimpel/vlaggetje/lintje) en op de openingspagina van een inconsistente genealogie een ander symbool. Kortom, goede gebruikers in het zonnetje, gebruikers met onopgeloste fouten in de hoek.
Eventuele uitbreiding van de checks op genealogie online zou kunnen zijn:
groeten,
Frederik - 17 nov 2012 - 22:34
@Frederik,
De "niet bestaande datum" controle heb ik gelijk toegevoegd, zie bijv. http://www.genealogieonline.nl/stamboom-balhuizen/I3517.php
Bob Coret - 17 nov 2012 - 23:19
@Bob Coret
ik zie bij mijn publicaties idd een aantal waarschuwingsdriehoekjes
en toch zijn die gegevens correct
hoe geef ik nu aan dat het gecontroleerd en goed is?
grtn
Jan K. - 18 nov 2012 - 12:50
Jan,
Kun je de pagina's noemen waar de waarschuwingen worden getoond en die je 'weg' wilt hebben?
De functionaliteit om dit soort waarschuwingen als 'bekeken maar het klopt echt' te markeren is er nog niet. Maar daar heb je dus wel behoefte aan?
mvg,
Bob Coret
Bob Coret - 18 nov 2012 - 12:55
Hi Bob,
als jij iets markeert o.b.v. algemene regels, moet ik toch kunnen aangeven dat het in dit geval niet aan de algemene regel voldoet
"da's logisch, toch"
de dames in mijn stamboom zijn in 1700-en-nog-wat inderdaad jonger gehuwd dan je verwacht,
het zij zo
(overigens zag ik ergens dat je uitgaat van 9 maanden tussen geboortes .... medisch-technisch gezien kan dat ook minder zijn)
grtn
Jan
Jan K. - 18 nov 2012 - 13:45
@ Bob
In mijn stamboom heb ik een paar vaders die op oudere leeftijd nog kinderen krijgen. Misschien is er een controle uit te voeren op latere huwelijken met jongere vrouwen?
https://www.genealogieonline.nl/mijn/beheer/checks/
Bij Hendrina Willems heb ik in GDP staan: geboren ca. 1751 en overleden tussen 15-09-1825 en 12-04-1855, daar gaat Genealogie Online uit van de tweede datum. Dat komt vaker voor. Misschien is ook dit aan te passen?
De doop van Teunis Nieuwpoort op 29 feb 1705 staat echt zo in het doopboek.
Ook het begraven van Agatha Will(e)ms op 29-02-1789 staat zo in de transcripties op FS, ik heb dat nog niet kunnen controleren in het archief. Op Gendalim 7 komt dit begraafboek niet voor.
Bij de vier personen met leeftijden boven de 100, heb ik gegevens van andere websites die nog niet openbaar zijn, die ik dus niet kan controleren.De bron staat dan wel vermeld in mijn opmerkingenvelden.
In de laatste drie gevallen misschien een optie: zie opmerkingen?
Ria Hendriks - 18 nov 2012 - 17:26
Om reacties (en nieuwe onderwerpen) te plaatsen op het Stamboom Forum dient u eerst in te loggen! Nog geen lid? Registratie is gratis en snel!
Bedankt, uw melding is verstuurd aan de moderators.