Betreft Genealogie Online (via Edge browser) op adres https://www.genealogieonline.nl/genealogie-scholl/I2.php
Op https://www.genealogieonline.nl/genealogie-scholl/I2.php staat 2 keer de plaatsnaam Mülheim an der Ruhr. De eerste keer bij de geboortedatum, de tweede keer onderaan bij de "Notities over ...".
De tweede keer gaat het goed, de eerste keer zie ik i.p.v. de ü een A-tilde + een 1/4 karakter. Dat krijg je als je de letter ü converteert naar UTF-8 (HEX C3 BC) en vervolgens interpreteert als 2 Ansi karakters.
Ik heb mijn gedcom aangeboden als Ansi en als UTF-8. Beide keren met hetzelfde resultaat, bij de geboortedatum fout en bij de Notitie goed.
Een paar jaar geleden heb ik dezelfde fout gemeld. Dat is toen opgelost, maar nu gaat het dus weer fout.
Er zijn andere letters die ook fout gaan maar ik neem nu even aan dat de oorzaak daarvan dezelfde is als in dit geval.
Mvg, Gerrit Scholl
Gerrit Scholl - 23 jan 2022 - 18:45 (laatst bijgewerkt 29 jan 2022 — 14:38 door auteur)
Hallo Gerrit, je verwijst o.a. naar de volgende forum-items neem ik aan:
https://www.stamboomforum.nl/subfora/4/2/65473/0
https://www.stamboomforum.nl/subfora/45/2/56606/1
Ergens las ik dat de export vanuit GensDataPro fout ging en dat dat opgelost zou zijn. Heb je dat programma?
Volgens mij accepteert GO ANSEL en UTF-8. Kun je a.j.b. de eerste 10 regels delen van je meest recente GEDCOM van maandag 24 januari 2022? Daar staat o.a. de tekenset in.
Pauline Berens EBBI - 26 jan 2022 - 16:02
Dag Pauline, de verwijzingen kloppen. De eerste regels van de ANSI versie gedcom zijn:
0 HEAD
1 GEDC
2 VERS 5.5.1
2 FORM LINEAGE-LINKED
1 SOUR GensDataPro
2 VERS 3.0.4.2
1 DATE 24 JAN 2022
1 CHAR ANSI
De voorlaatste versie die ik op 21 Jan. uitgeprobeerd heb was een UTF-8 versie met als laatste 2 regels van dit deel:
1 DATE 21 JAN 2022
1 CHAR UTF-8
Zoals gezegd ging het in beide gevallen op dezelfde manier fout/goed. Fout bij de geboorteplaats en goed in de notitie.
De regels van de GEDCOM daarvoor verantwoordelijk zijn: voor de geboortedatum:
1 BIRT
...
2 PLAC Mülheim an der Ruhr (Dld),NW,DEU
en voor de notitie:
1 NOTE Gerda werd in 1921 geboren in Mülheim an der Ruhr. ...
In beide gevallen staat er voor de letter ü in de ANSI gedcom een enkel byte HEX FC en dat is de correcte ANSI codering van de letter ü. Voor de UTF-8 versie van de gedcom zijn dat 2 bytes (HEX C3 BC) hetgeen de correcte codering in UTF-8 is. Het ligt dus volgens mij niet aan de gedcom.
Waarom ze dan toch verschillend op dezelfde web pagina staan kan ik alleen verklaren doordat GenealogieOnline dat veroorzaakt. Die codeert de ü in de geboortedatum naar UTF-8 (2 bytes, HEX C3 BC) en de ü in de Notitie blijft staan als ANSI (HEX FC). De webbrowser interpreteert de hele pagina als ANSI met het bekende gevolg.
Ik denk niet dat een webbrowser in twee delen van dezelfde pagina ineens een andere interpretatie gebruikt.
Mvg, Gerrit
Gerrit Scholl - 26 jan 2022 - 20:02
Bedankt voor je reactie. Wil je nu 'ns je Gedcom opnieuw genereren met UTF-8 als tekenset en uploaden? Dan kunnen we tenminste meekijken naar het effect. Graag wederom na upload de eerste 10 regels delen.
Ik vroeg ook nog of je misschien GensDataPro gebruikt, daar was iets mee volgens 1 vd forum-items, hoe zit dat?
Pauline Berens EBBI - 26 jan 2022 - 20:10 (laatst bijgewerkt 26 jan 2022 — 20:55 door auteur)
Ik heb net mijn stamboom ververst met een UTF-8 gedcom, eerste 10regels:
0 HEAD
1 GEDC
2 VERS 5.5.1
2 FORM LINEAGE-LINKED
1 SOUR GensDataPro
2 VERS 3.0.4.2
1 DATE 26 JAN 2022
1 CHAR UTF-8
1 FILE D:\GDP_stambomen\aa.gedcomBestanden\GDP_scholljansen_20220125a_Utf8_GOnoVT.ged
1 NOTE remarks:
De stamboom is verder identiek, behalve dus de gedcom codering UTF-8 ipv ANSI, codering ü overal HEX C3 BC ipv FC.
Ik ben nogal nieuwsgierig van aard :) .Wat betekend EBBI achter je naam ?
Mvg, Gerrit
Gerrit Scholl - 26 jan 2022 - 21:24
EemslandBoekweitBoerenImmigratie😃 de voormalige naam van 1 van m'n publicaties.
Morgenmiddag heb ik weer tijd om naar je probleem te kijken.
Pauline Berens EBBI - 26 jan 2022 - 21:39
Dag Pauline. Nog even een toevoeging om dat ik denk dat je daar misschien iets aan hebt.
Er zijn nog veel meer speciale tekens in mijn gedcom. Daar heb ik er een aantal van nagetrokken op leesbaarheid bij GO. De meesten gaan goed. De enigen die fout gaan staan in een gedcom PLAC statement. Ik heb het vermoeden dat die in een plaatsnamen tabel opgenomen worden en daarbij mogelijk naar UTF-8 geconverteerd worden.
Misschien worden die namen uit de tabel bij het opmaken van de uiteindelijke web pagina tekst weer ingevoegd en wordt daarbij over het hoofd gezien dat ze een andere codering hebben dan de overige tekst.
Mvg, Gerrit
Gerrit Scholl - 27 jan 2022 - 09:00
Je vermoedens over wat GO precies doet met je GEDCOM kan ik niet bevestigen, wel de manier checken waarop je de GEDCOM genereert. Vandaar de vraag, kun je in je stamboomprogramma UTF-8 kiezen bij de export OF open je je GEDCOM in Kladblok, wijzig je de tekenset in UTF-8 en slaat 't bestand op als UTF-8? Zie schermafdruk.
Pauline Berens EBBI - 27 jan 2022 - 09:17 (laatst bijgewerkt 27 jan 2022 — 12:14 door auteur)
Die laatste mogelijkheid in kladblok kende ik niet. Zal eens testen wat dat precies doet. GensDataPro heeft bij het aanmaken van de gedcom een aantal vinkjes, waaronder Ansi en Utf-8. Die gebruik ik. Ik heb zelf tot mijn pensioen in de ICT gewerkt en weet dus wat ik doe. Voordat ik dit probleem aangekaart heb bij GOnline heb ik de gedcom versies grondig getest. Ze zijn correct, anders had ik eerst contact gezocht met de GDP helpdesk. Ik gebruik daarbij een tool Beyond Compare, waarmee ik zowel textueel als binaire (op byte niveau) vergelijkingen tussen twee bestanden kan maken. Ik neem aan dat het GO ontwikkel team ook over een dergelijk tool beschikt. Anders raad ik ze aan om eens te kijken op:
https://www.scootersoftware.com/
Vroeg me ook nog af of GO een voorkeur heeft voor een bepaalde gedcom codering. Zelf geef ik de voorkeur aan Ansi.
Mvg, Gerrit
Gerrit Scholl - 27 jan 2022 - 13:22 (laatst bijgewerkt 27 jan 2022 — 16:14 door auteur)
Dus toch GensDataPro. Daar was iets mee volgens 'n eerder forum-item, even opzoeken... hebbes, op 30 mei 2018 — 17:35 schreef je op
https://www.stamboomforum.nl/subfora/4/2/65473/0
dat diakrieten op
https://www.genealogieonline.nl/genealogie-scholl/I3.php
oké zouden zijn, maarre... ik zie daar helemaal geen diakrieten. Al is de boodschap duidelijk, Bob Coret heeft toen iets gedaan om GEDCOM's gegenereerd in GDP beter te kunnen inlezen. Misschien dat Bob zelf even kan reageren?
GO ondersteunt alleen ANSEL en UTF-8 voor speciale tekens volgens mij, vanaf GEDCOM 7 wordt UTF-8 zelfs verplicht meen ik.
Wil je de link naar https://www.scootersoftware.com a.j.b. even corrigeren? Dus met https:// ervoor, anders plakt de browser de actieve domeinnaam er aan vast. Misschien ook meteen maar Mühleim wijzigen in Mülheim in de titel van dit forum-item, handig als mensen iets willen terugzoeken:-)
Pauline Berens EBBI - 27 jan 2022 - 14:32 (laatst bijgewerkt 27 jan 2022 — 16:17 door auteur)
Dag Pauline. Ik heb de gevraagde aanpassingen gedaan. Zou jij dan misschien in een paar van jouw bijdragen ANSEL kunnen veranderen in ANSI zodat daarover ook geen verwarring ontstaat. Ik had je al eerder gewezen op soortgelijke problemen in het verleden. Sindsdien zijn er wat veranderingen in mijn stamboom geweest waardoor persoon @I3@ van toen nu persoon @I2@ is geworden, dus nog het gaat nog steeds om dezelfde persoon. Ook toen zat het probleem niet in de GensDataPro gedcom, maar heeft Bob Coret iets in de GOnline software aangepast. Toen was het voor mij opgelost, maar een andere gebruiker, waarschijnlijk met een andere browser klaagde dat het voor hem niet opgelost was. Hoe dat verder gegaan is weet ik niet. Als je aangeeft dat het om een GDP gedcom gaat wordt er wat al te gemakkelijk gedacht dat het aan GDP ligt.
Inmiddels gebruik ik de nieuwste versie van GensDataPro 3, toen GDP 2. Die had een Gedcom 5.5, GDP 3 een GDP 5.5.1, zoals GOnline graag wilde. Kortom, de situatie van toen en nu is niet te vergelijken, ook al omdat het probleem bij mij in een iets andere vorm weer terug komt, terwijl het toen opgelost was.
Hieronder even een Beyond Compare 3 screendump van de binaire vergelijking tussen de UTF-8 en ANSI versie van mijn laatste gedcom:
Het is de sectie met het probleem statement: 2 PLAC Mülheim an der Ruhr. Links staat de UTF8 versie, rechts de ANSI versie.
NB: De tekst die naast de vergeleken bytes staat is in beide gevallen een ANSI interpretatie van de bytes. Zo werk Beyond Compare 3 nu eenmaal in dit geval. Dat geeft direkt een inkijk in hoe de tekst er uitziet als je de UTF-8 versie interpreteert als ANSI, inderdaad links met de A-tilde + 1/4 (precies zo als GOnline nu bij de geboorteplaaats laat zien) ipv de ü die het zou moeten zijn, en rechts het correcte Mülheim. In de kolom helemaal links zie je allemaal rode streepjes. Die geven aan waar in het bestand nog meer verschillen zitten, allemaal diakrieten. Die kan ik gemakkelijk vinden en daarmee ook de persoon waar ze optreden. Als het probleem opgelost is zal ik op die manier zo veel mogelijk andere gevallen testen en ik verwacht dat die dan ook allemaal ok zijn.
Hoop dat jullie hiermee verder kunnen.
Mvg, Gerrit Scholl
Gerrit Scholl - 27 jan 2022 - 16:46
Nogmaals Pauline. Uit je reactie "Dus toch GensDataPro" maak ik op dat je daarover verbaasd was. Als eerste heb je me gevraagd de header van de GEDCOM te geven. Dat heb ik toen gedaan en daarin staat:
1 SOUR GensDataPro
2 VERS 3.0.4.2
Vandaar dat ik nu een beetje verbaasd ben van jouw reactie :).
Mvg, Gerrit
Gerrit Scholl - 27 jan 2022 - 17:08
Hallo Gerrit, waarop baseer je dat ANSI speciale tekens goed zou weergeven op GO?
Klopt, 1 SOUR GensDataPro over 't hoofd gezien, zocht alleen 1 CHAR UTF-8:-)
Pauline Berens EBBI - 27 jan 2022 - 17:27
Op het feit dat bij de probleempagina het alleen fout gaat bij de geboorteplaats en dat het niet fout gaat bij de 'Notities over Gerta Wilhelmine "Gerda" Jansen' lager op dezelfde pagina.
Ik heb nog iets ontdekt. Ik nodig je uit om in het zoekvenster van dit Forum eens te zoeken op mijn naam "Gerrit Scholl".
De Titels van dit probleem worden dan op dezelfde manier allemaal fout aangegeven. Het ultieme bewijs dat dit niet aan GensDataPro ligt.
Mvg, Gerrit.
Gerrit Scholl - 27 jan 2022 - 17:40 (laatst bijgewerkt 29 jan 2022 — 16:25 door auteur)
Toch maar even wachten op Yolanda Lippens of Bob Coret stel ik voor.
Pauline Berens EBBI - 28 jan 2022 - 13:41
Dag Pauline.
inderdaad. Hoe lang denk je dat dat duurt? Of leest niemand van het GOnline ontwikkelteam mee met het helpdesk forum ?
Ik was al blij dat er iemand reageerde, want ik heb ook wel eens precies 0 reacties gehad.
Daarom toch nog even deze vraag.
Heb ik al die tijd gecommuniceerd met een GOnline helpdesk medewerkster/vrijwilligster of met een welwillende geinteresseerde mede GOnline gebruikster, of geen van tweeën?
Mvg, Gerrit Scholl
Gerrit Scholl - 28 jan 2022 - 15:38
Hallo Gerrit, tegenwoordig overleggen Yolanda Lippens en Bob Coret eens per 2 a 3 weken begreep ik. Even geduld dus a.j.b.
Of allebei:-) Iedereen op dit forum mag overal op reageren. Ik probeer wat voorwerk te doen hier en daar, dat scheelt hen tijd:-)
Pauline Berens EBBI - 28 jan 2022 - 16:01
Ok, bedankt. Ik ben al blij als ze het onder ogen krijgen en er hopelijk t.z.t. iets aan doen.
Ik heb nog 2 items die ik onder de aandacht wil brengen.
Mvg, Gerrit
Gerrit Scholl - 28 jan 2022 - 16:06
Oké, wel graag aparte forum-items aanmaken a.j.b.
Pauline Berens EBBI - 28 jan 2022 - 16:18
We hebben het gezien, volgende week weer Helpdesk overleg.
@Pauline, thanks!
Yolanda Lippens - 4 feb 2022 - 10:19
De auteur van het eerste bijdrage in dit bericht heeft aangegeven dat de vraag is beantwoord of het probleem is opgelost.
Om reacties (en nieuwe onderwerpen) te plaatsen op het Stamboom Forum dient u eerst in te loggen! Nog geen lid? Registratie is gratis en snel!
Bedankt, uw melding is verstuurd aan de moderators.