Norme Gedcom
Un article de GeneaWiki.
GEDCOM (pour abréviation de GEnealogical Data COMmunication) est une norme élaborée par l'Eglise de Jésus-Christ des Saints des Derniers Jours (les Mormons), qui permet les échanges de données informatisées entre les différents logiciels de généalogie, quels que soient les systèmes d'exploitation ou le matériel.Les fichiers GEDCOM sont des fichiers séquentiels en format texte. La plupart des logiciels de généalogie intègrent les fonctions permettant d'exporter ou d'importer des fichiers enregistrés sous ce format.
Sommaire |
Comment ça marche et à quoi ça sert ?
Un fichier GEDCOM est rédigé en texte seul. Il contient des enregistrements concernant :
- chaque personne d'un arbre généalogique,
- chaque famille,
- chaque événement,
- tous ces enregistrements étant liés entre eux selon certaines conventions.
La spécification GEDCOM, également appelée la norme GEDCOM, a été développée par l'Église de Jésus-Christ des Saints des Derniers Jours (les Mormons), initialement dans un but strictement religieux lié aux croyances de cette Église. Puis est venue la collaboration avec les différents éditeurs de logiciels, américains ou autres, qui a conduit à l'ajout de paramètres non réservés aux fins religieuses de l'Église.
L'immense majorité des logiciels de généalogie sont compatibles avec la norme GEDCOM, bien que très peu de logiciels de généalogies, même celui des Mormons, ne la respectent dans toute son étendue. Toutefois, les fonctionnalités les plus importantes sont généralement respectées, permettant ainsi l'importation ou l'exportation des données « principales ». De nombreux outils de visualisation et de conversion d'un fichier GEDCOM, ainsi que d'outils permettant la transformation d'un fichier GEDCOM en une généalogie « clefs en mains » pour le Web.
Même s'il est théoriquement possible d'écrire au clavier un fichier GEDCOM, le format a été imaginé en premier lieu pour servir aux échanges entre logiciels, et la lecture et l'écriture d'un fichier GEDCOM ne sont pas particulièrement aisées pour les néophytes (et même pour les plus aguerris d'ailleurs).
Les imports et exports au format GEDCOM permettent de pratiquer des échanges entre généalogistes sur des branches dites de Cousinage. Cela permet aussi de changer de logiciel (attention : les fabriquants possèdent des petits plus qui n'existent pas chez d'autres ou qui ne sont pas reconnus de la même façon). Le format GEDCOM permet aussi dans l'expression des résultats de se servir d'autres logiciels : Visuged, publication sur Geneanet, listes éclairs, pages HTML prêtes à mettre sur un site, etc.
Structure d'un fichier Gedcom
Un fichier GEDCOM est divisé en :
- une section d'en-tête (HEAD)
- divers enregistrements de diverses natures :
- enregistrement « personne » (INDI = individual)
- enregistrement « famille » (FAM = family)
- enregistrement « note » (NOTE = note)
- enregistrement « source » (SOUR = source)
- enregistrement « dépôt d'archives » (REPO = repository)
- enregistrement « objet multimédia » (OBJE = object)
- marqueur de fin de ficher (TRLR = trailer)
Chacune de ces sections débute par 0, marque du niveau supérieur de l'arborescence, et est subdivisable de façon quasi-infinie, en fonction des besoins, à l'aide de marqueurs de niveaux inférieurs, permettant par exemple la saisie des « événements » (EVEN, BIRT, DEAT, MARR et un certain nombre d'autres), des « attributs » (nombre de mariages ou d'enfants, nationalité, décorations, etc.).
Chaque enregistrement, mais aussi chaque subdivision, peut généralement être relié, en fonction des besoins, à un enregistrement d'un autre type. Par exemple, la rubrique BIRT (naissance) de l'individu X sera reliée par des pointeurs : à un enregistrement NOTE ou à un enregistrement SOUR. Le même individu X pourra être relié par des pointeurs : à la famille (couple) dont il est issu, à la famille dont il est co-fondateur, à des notes ou à des sources liées à sa personne...
Il existe depuis plusieurs années une évolution notable de la spécification, intitulée GEDCOM XML 6.0, censée permettre une plus grande souplesse dans l'échange des données, ainsi que la prise en compte de toutes les éventualités possibles (la norme actuelle ne prévoit pas la saisie de témoins d'un événement autrement que dans un champ NOTE). À l'heure actuelle, toutefois, aucun programme de généalogie « grand public » n'a intégré la compatibilité avec la version 6.0.
Exemple succinct
Pour plus de lisibilité sur cet exemple, les informations sont présentées de façon indentée (en "escalier") : habituellement tout le texte est cadré à gauche, sans tabulation.
0 HEAD
0 @I1@ INDI
1 NAME Robert Eugene/MARTIN/
1 SEX M
1 BIRT
2 DATE 02 OCT 1822
2 PLAC PARIS,Seine,FRANCE
1 DEAT
2 DATE 14 APR 1905
2 PLAC ROUEN,Seine Maritime,FRANCE
1 BURI
2 PLAC TOULON,Var,FRANCE
1 FAMS @4@
0 @I2@ INDI
1 NAME Marie Anne/DURAND/
1 SEX F
1 BIRT
2 DATE BEF 1828
2 PLAC EVREUX,Eure,FRANCE
1 FAMS @4@
0 @I3@ INDI
1 NAME Joseph/MARTIN/
1 SEX M
1 BIRT
2 DATE 11 JUN 1861
2 PLAC ROUEN,Seine Maritime,FRANCE
1 FAMC @4@
0 @4@ FAM
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
1 MARR
2 DATE DEC 1859
2 PLAC ROUEN,Seine Maritime,FRANCE
0 TRLR
Entre 0 HEAD et 0 @I1@ INDI, il y a bien souvent 20 à 30 lignes qui donnent des précisions sur le programme qui a généré le fichier, la version du gedcom, le codage des caractères, l'identité du "propriétaire" des données, etc. Ces données variant d'un gedcom à l'autre elles ont été ici négligées.
Les individus sont identifiés par un enregistrement INDI ils sont affectés d'un numéro entre deux @ @ @I3@ INDI généralement le numéro d'Individu est précédé d'un I
Les événements 1 BIRT CHR DEAT BURI ( naissance baptême mort enterrement) peuvent être suivis d'enregistrements 2 PLAC endroit 2 DATE
Ensuite nous avonc généralement un seul enregistrement FAMC signifiant FAMily Children avec un Numéro de Famille entre deux @ @ qu'on peut mémoriser comme FAMille de Conception de l'Individu. Dans la famille FAMC l'Individu est enfant de la Famille. De nombreux logiciels ne le gèrent pas mais il est possible d'avoir plusieurs FAMC pour gérer une filiation adoptive ou d'autres filiations biologiques moins probables que la première.
et (un ou plusieurs) FAMS = FAMily Spouse ==> Famille d'epouSe dans la famille FAMS l'Individu est conjoint.
dans cet exemple nous avons le père Robert Eugène MARTIN numéro 1 la mère Marie Anne DURAND N° 2 et l'enfant Joseph MARTIN N° 3
1 et 2 appartiennent à la FAMille Spouse N° 4 comme HUSB (mari) et WIFE (femme) 3 appartient à cette même famille 4 qui est pour lui sa FAMille de Conception
L'enregistrement FAM et le N° de famille donne le détail des membres généralement le numéro de FAMille est précédé d'un F HUSB mari N° 1 WIFE femme N° 2 CHILD enfant N° 3
et la DATE et ou la PLACe de mariage
La mise en oeuvre de la norme GEDCOM
La mise en oeuvre de la norme peut faire apparaître plusieurs problèmes.
Lors de l'importation des données, les programmes de généalogie ne détectent pas, en général, les informations erronées ou inconnues qu'ils ne prennent pas en compte.
L'encodage du fichier
Le fichier peut être encodé de plusieurs façons : ANSEL, ANSI (Windows), Macintosh, UTF-8, MS/DOS... Les programmes prennent une certaine liberté pour étendre les jeux autorisés par la norme. Celle-ci n'a pas évolué depuis 1995 et recommande l'utilisation d'ANSEL (une norme bibliographique nord-américaine obsolète) pour l'échange de Gedcoms accentués. La tendance actuelle est de permettre l'utilisation d'Unicode UTF-8 pour pouvoir utiliser tous les caractères existants.
Si certains logiciels sont en mesure de décoder ces encodages, d'autres sont incapables de décoder convenablement les caractères spéciaux tel que à, ï, etc. Pensez à demander de l'aide sur les forums appropriés avant que d'essayer de nettoyer manuellement le code.
Les utilitaires GEDCOM
Tout logiciel de généalogie digne de ce nom dispose d'un import / export au format Gedcom. Néanmoins il est parfois nécessaire de faire appel a un utilitaire spécialisé dans la comparaison de gedcom, vous pouvez retrouver la liste de ces outils dans la rubrique dédiée de GeneaWiki.
Un logiciel de traitement de texte tel que Word, Notepad ou TextEdit peut être fort utile pour nettoyer le code du fichier Gedcom créé par un logiciel et revenir au standard.
Liens utiles (externes)
- http://www.robert-weinland.org/gedc.php Site de Robert Weinland
- mailto:gedcompratique-request@ml.free.fr?subject=subscribe Liste de discusion sur la norme Gedcom
- http://homepages.rootsweb.com/~pmcbride/gedcom/55gctoc.htm Le document de référence en anglais
- http://www.gentech.org
- http://perso.club-internet.fr/sypey/ Testez votre logiciel
- http://www.francegenweb.org/~standard/index.php Normes et standards en généalogie
- http://www.cyndislist.com/gedcom.htm/ Cyndi's list (en anglais)
- Etude comparative sur les différences de gestion du format GEDCom entre les logiciels de généalogie
- http://www.francegenweb.org/~standard/index.php?page=gedcom
| | |







