|
GEDCOM est l'abréviation de GEnealogical Data COMmunication
(Communication de Données Généalogiques). C'est un format de fichier défini initialement par l'Eglise des Mormons pour permettre les échanges de données généalogiques informatisées au sein de leur communauté.
Ce format est devenu aujourd'hui le standard international des échanges
d'informations entre la quasi-totalité des logiciels de généalogie.
Un fichier au format GEDCOM est une base relationnelle d'informations
généalogiques mise en forme de fichier séquentiel. Une base relationnelle
est un fichier dont la structure permet de gérer des informations
liées entre elles par une relation. Deux individus, par
exemple, peuvent être liés par une relation de type
'mariage' ou 'parent-enfant'. Dans un fichier séquentiel,
les informations sont stockées les unes à la suite
des autres. Les informations généalogiques que l'on
trouve dans un fichier GEDCOM (fichier séquentiel) sont
toujours associées à un identificateur qui les caractérise
et qui permet de relier une information à une autre.
Depuis sa création, la norme GEDCOM a évolué et aujourd'hui
sa version courante est la version 5.5. De version en version, de nouveaux identificateurs
ont été ajoutés pour gérer des informations
supplémentaires, et certains identificateurs ont été
supprimés.Tous les programmes de généalogie
ne sont pas compatibles avec la plus récente version de
la norme GEDCOM. Lors de l'import d'un fichier GEDCOM, un programme
ignorera généralement les informations associées
aux identificateurs qu'il ne reconnait pas.
Le langage GEDCOM version 5.5
Le format d'une ligne d'informations GEDCOM
On peut rencontrer dans un fichier GEDCOM quatre formats de ligne
différents.
Pour décrire les informations qui sont regroupées
dans une structure et n'ont pas de relations avec d'autres informations
du fichier, on trouvera des lignes dont la syntaxe sera:
- Format 1
{niveau} espace {identificateur}
ou
- Format 2
{niveau} espace {identificateur} espace {informations}
... et pour les informations qui doivent être mises en relation avec d'autres qui
sont placées à un autre endroit dans le fichier, on trouvera:
- Format 3
{niveau} espace @{référence}@ espace {identificateur}
ou
- Format 4
{niveau} espace {identificateur} espace @{référence}@
Légende:
- {niveau} : c'est une valeur numérique de 0 à n qui
permet de structurer les informations. Les informations
du niveau n sont toujours associées au niveau
n-1 qui précéde. Il est très
important de respecter l'ordre dans lequel les informations
d'un fichier GEDCOM doivent être classées.
- {identificateur} : les identificateurs sont des mots-clés de 3 ou
4 caractères du langage GEDCOM qui caractérisent
les informations fournies, comme INDI pour individu, MARR
pour mariage, FAM pour famille, etc (voir la liste
des identificateurs ci-dessous)
- @{référence}@ : les références sont les étiquettes
qui permettent d'établir des relations entre des
informations. Ces références sont des suites
de chiffres et/ou de lettres quelconques toujours délimitées
par un caractère @ au début et à
la fin. Sur une ligne d'un fichier GEDCOM, une référence
citée avant un identificateur marque l'emplacement
d'une information (c'est une adresse). Une référence
citée après un identificateur permet d'établir
une relation avec une information définie par l'adresse
correspondante (c'est un pointeur). C'est l'existence
d'une ligne comportant une adresse et d'une ou de plusieurs
lignes qui contiennent un pointeur sur cette adresse qui
matérialise une(des) relation(s). Dans un fichier
GEDCOM, la référence utilisée dans
chaque "ligne adresse" doit être unique: on ne peut
pas retrouver la même référence utilisée
comme adresse dans deux lignes différentes, mais
plusieurs pointeurs (donc plusieurs "lignes pointeurs")
peuvent renvoyer à cette "ligne adresse".
- {informations} : ce sont les données généalogiques
qui peuvent être codées dans un format spécifique
(dates), sous forme de texte libre (notes) ou qui sont
des constantes pré-définies dans le langage
(M ou F pour indiquer le sexe, par exemple).
Décoder les informations d'un fichier GEDCOM
Tout fichier GEDCOM débute obligatoirement par un entête
(identificateur HEAD) et se termine obligatoirement par une marque
de fin (identificateur TRLR). Entre l'entête
et la marque de fin, on trouvera principalement les types d'informations
suivants:
- les informations relatives
aux individus (identificateur INDI)
- les informations relatives
aux familles (identificateur FAM)
- les notes (identificateur NOTE)
- les sources (identificateur
SOUR)
La norme GEDCOM comprend beaucoup d'autres identificateurs dont
vous trouverez la description plus loin dans cette page. Un bon
nombre d'entre eux n'ont d'utilité que pour les membres
de l'Eglise des Mormons. Certains programmes utilisent des identificateurs
spécifiques supplémentaires. Les informations associées
à ces identificateurs spéciaux ne pourront pas être
transférées entre différents logiciels par
Export/Import d'un fichier GEDCOM.
Exemple d'analyse d'un fichier
L'entête
0 HEAD entête du fichier
1 SOUR Legacy système créateur du fichier
2 VERS 2.0 version
2 NAME Legacy for Windows nom du programme/système
2 CORP Millennia Corp. nom de l'organisme, société, entreprise
3 ADDR PO Box 1800 adresse
4 CONT Duvall, WA 98019 suite de l'adresse
1 DEST Legacy système destinataire du fichier
1 DATE 10 Sep 1998 date de création du fichier
1 CHAR ANSI jeu de caractères utilisé
1 SUBM @S0@ auteur (pointeur vers l'auteur @S0@)
1 FILE ancetres.ged nom du fichier GEDCOM
1 GEDC identification GEDCOM
2 VERS 5.5 version utilisée
2 FORM LINEAGE_LINKED format utilisé
L'auteur du fichier
0 @S0@ SUBM définition de l'auteur @S0@
1 NAME Louis JEANPIERRE nom de l'auteur
Un individu de la généalogie
0 @I1@ INDI définition de l'individu @I1@
1 NAME Jules Albert /Leprince/ prénoms/nom
1 SEX M sexe masculin
1 BIRT naissance
2 DATE 19 Aug 1875 date
2 PLAC Metz, 57, F lieu
2 SOUR @S1@ source (pointeur vers la source @S1@)
3 PAGE pg 56 numéro de la page
1 DEAT décès
2 DATE 21 Feb 1947 date
2 PLAC Nancy, 54, F lieu
1 CHAN dernière modification
2 DATE 10 Sep 1996 date
3 TIME 09:07 et heure
1 FAMS @F3@ famille de son couple (pointeur vers famille @F3@)
1 FAMC @F1@ famille de ses parents (pointeur vers famille @F1@)
1 OCCU mécanicien profession
1 NOTE @NI1@ note associée à l'individu (pointeur vers note @NI1@)
Une famille
0 @F1@ FAM définition de la famille @F1@
1 HUSB @I3@ le mari (pointeur vers l'individu @I3@)
1 WIFE @I4@ l'épouse (pointeur vers l'individu @I4@)
1 MARR mariage
2 DATE 5 Mar 1874 date
2 PLAC Sarcey, 69, F lieu
2 NOTE @NF1@ note associée au mariage (pointeur vers note @NF1@)
1 CHIL @I1@ 1er enfant de la famille (pointeur vers @I1@)
1 CHIL @I2@ 2ème enfant de la famille (pointeur vers @I2@)
1 CHAN dernière modification
2 DATE 30 May 1998 date
3 TIME 15:24 et heure
Une note
0 @NI1@ NOTE blablabla... début du texte de la note @NI1@
1 CONT etc... suite du texte de la note
1 CONT etc... suite du texte
Autre format possible, la note est directement incluse dans une structure (INDIvidu, FAMille...):
0 @I19@ INDI définition de l'individu @I19@
1 NAME Alphonse /Leprince/ prénoms/nom
...
1 NOTE blablabla... début du texte de la note
2 CONT etc suite du texte
Une source
0 @S1@ SOUR
1 ABBR Les familles de Pontaudouce, par David Koskoff.
1 TITL Les familles de Pontaudouce, par David Koskoff.
Un individu sans lien de parenté
(ami, voisin, parrain...)
O @I9@ INDI
1 NAME René/LAMORCE/
1 ASSO @I4@
2 RELA parrain
La marque de fin de fichier
0 TRLR marqueur de fin de fichier
La liste complète des identificateurs GEDCOM 5.5 et leur définition
Le nom complet en anglais de l'identificateur
est donné entre {crochets} pour une meilleure compréhension,
mais c'est toujours le nom abrégé en 3 ou 4 caractères
qui est utilisé dans les fichiers GEDCOM.
- ABBR {abbreviation} : titre abrégé, description abrégée ou
nom abrégé.
- ADDR {address} : adresse postale
d'un individu, de l'auteur d'un fichier, d'une entreprise,
d'une école, etc
- ADR1 {address1} : première ligne d'une adresse
- ADR2 {address2} : deuxième ligne d'une adresse
- ADOP {adoption} : création
du lien enfant-parent quand il n'existe pas de lien biologique.
- AFN {AFN} : numéro unique et permanent du fichier Ancestral File
qui contient les informations relatives à l'individu
- AGE {age} : âge de l'individu au moment de l'événement
ou âge qui figure dans le document.
- AGNC {agency} : institution
ou individu responsable ou décisionnaire
- ALIA {alias} : indicateur qui associe des informations différentes sur une personne.
- ANCE {ancestors} : ancêtres d'un individu
- ANCI {ances_interest} : indique un intérêt à rechercher des informations
complémentaires sur les ancêtres d'un individu
(voir DESI)
- ANUL {annulment} : déclaration
de nullité d'un mariage (comme s'il n'avait pas eu lieu)
- ASSO {associates} : indicateur
qui relie des amis, des voisins, des parents ou d'autres personnes
à un individu
- AUTH {author} : nom de la personne
qui a relevé les informations ou qui a constitué
le fichier
- BAPL {baptism-LDS} : baptême
de l'Eglise des Mormons (à partir de l'âge de huit ans)
- BAPM {baptism}: baptême
(non Mormon, voir aussi BAPL et CHR)
- BARM {bar_mitzvah} : cérémonie
juive qui a lieu pour les garçons à l'âge de
13 ans
- BASM {bas_mitzvah}: cérémonie
juive qui a lieu pour les filles à l'âge de 13
ans, aussi appelée "Bat Mitzvah."
- BIRT {birth} : naissance
- BLES {blessing} : bénédiction
religieuse
- BLOB {binary_object} : ensemble
de données utilisé par un système multimédia
qui gére des données binaires qui représentent
des images, du son et de la vidéo.
- BURI {burial} : sépulture
- CALN {call_number} : numéro
dans un répertoire qui sert à identifier une
pièce dans une collection.
- CAST {caste} : rang ou statut
d'un individu dans une société, selon des critères
raciaux ou religieux, des critères de richesse ou autres
- CAUS {cause} : description
de la cause de l'événement ou du fait associé,
cause du décès par exemple.
- CENS {census} : recensement
de population
- CHAN {change} : correction
ou modification; en relation avec une DATE qui indique quand
le changement est survenu.
- CHAR {character} : indique
le jeu de caractères utilisé pour l'écriture
des informations dans le fichier.
- CHIL {child} : enfant naturel
ou adopté
- CHR {christening} : baptême
religieux (non Mormon) d'un enfant.
- CHRA {adult_christening} :
baptême religieux (non Mormon) d'une personne adulte.
- CITY {city} : ville ou village
- CONC {concatenation} : indicateur
de continuation des informations qui précédent.
Ces informations doivent être mises à la suite
de celles qui précédent sans espace ni retour
au début de ligne. La coupure avec les informations
précédentes doit être faite au milieu
d'un champ et non pas sur un espace (l'espace est un délimiteur
GEDCOM).
- CONF {confirmation} : confirmation - cérémonie
religieuse (non Mormon) par laquelle un individu acquiert
la qualité de membre à part entière de
son Eglise.
- CONL {confirmation_l} : confirmation (cérémonie
religieuse par laquelle un individu devient membre de l'Eglise
des Mormons)
- CONT {continued} : indicateur
de continuation des informations qui précédent,
après un retour à la ligne.
- COPR {copyright} : protection
des informations contre la reproduction et la diffusion.
- CORP {corporate} : nom d'une
entreprise, d'une institution ou autre.
- CREM {cremation} : incinération
du corps d'un individu décédé.
- CTRY {country} : nom ou code
du pays
- DATA {data} : informations
stockées automatiquement.
- DATE {date} : date d'un événement
au format prévu pour les dates
- DEAT {death} : décès
- DESC {descendants} : descendance
d'un individu
- DESI {descendant_int} : indique
un intérêt à rechercher des descendants
de l'individu (voir aussi ANCI)
- DEST {destination} : système
ou programme destinataire des données.
- DIV {divorce} : dissolution
du mariage
- DIVF {divorce_filed} : dossier
de divorce d'un époux
- DSCR {phy_description} : caractères
physiques de description d'une personne, d'un lieu ou d'une
chose
- EDUC {education} : niveau d'instruction
- EMIG {emigration} : départ
de son pays avec l'intention de résider ailleurs.
- ENDL {endowment} : dotation (sacrement de l'Eglise des Mormons reçu
par un individu dans un temple).
- ENGA {engagement} : fiancailles
- EVEN {event} : événement
intéressant à propos d'un individu, d'un groupe
ou d'une organisation
- FAM {family} : association
d'un homme, d'une femme et de leurs enfants selon la loi ou
les coutumes, ou famille créée par la naissance
d'un enfant d'un père et d'une mère biologiques.
- FAMC {family_child} : indique
la famille à laquelle un enfant appartient
- FAMF {family_file} : nom d'un
fichier de familles de l'Eglise des Mormons
- FAMS {family_spouse} : indique
la famille dans laquelle l'individu est l'un des conjoints
- FCOM {first_communion} : cérémonie
religieuse de première communion
- FILE {file} : unité
de conservation d'informations classées pouvant être
référencées.
- FORM {format} : nom donné
à un format dans lequel des informations peuvent être
transcrites
- GEDC {gedcom} : information
sur l'utilisation de la norme GEDCOM dans un fichier.
- GIVN {given_name} : prénom
- GRAD {graduation} : diplôme
ou certificat
- HEAD {header} : identification
des informations du fichier GEDCOM
- HUSB {husband} : individu marié
ou père
- IDNO {ident_number} : numéro
d'identification d'une personne dans un fichier, une source
ou un système externe
- IMMI {immigration} : arrivée
dans un nouveau lieu avec intention d'y résider
- INDI {individual} : une personne
- LANG {language} : langage utilisé
dans le fichier
- LEGA {legatee} : légataire
- MARB {marriage_bann} : publication
des bans de mariage
- MARC {marr_contract} : contrat
de mariage
- MARL {marr_license} : autorisation
légale de mariage
- MARR {marriage} : création
d'une famille
- MARS {marr_settlement} : convention,
contrat avant mariage
- MEDI {media} : information
sur le support des données stockées
- NAME {name} : mot ou ensemble
de mots utilisés pour l'identification d'un individu,
d'un titre, etc. Il faut utiliser plusieurs lignes NAME pour
les personnes qui ont des noms multiples.
- NATI {nationality} : nationalité
d'une personne
- NATU {naturalization} : obtention
de la nationalité
- NCHI {children_count} : nombre
d'enfants du parent (tous mariages confondus) s'il s'agit
d'un individu ou de la famille s'il s'agit d'une famille.
- NICK {nickname} : surnom
- NMR {marriage_count} : nombre
de mariages de la personne
- NOTE {note} : informations
complémentaires ajoutées pour la compréhension
des données
- NPFX {name_prefix} : texte
ou titre qui apparait avant le nom d'une personne (Docteur,
Général, Monseigneur...)
- NSFX {name_suffix} : texte
qui apparait après le nom (Junior ou fils, par exemple)
- OBJE {object} : référence
aux données utilisées comme description (généralement
un enregistrement audio, une photo ou une vidéo)
- OCCU {occupation} : profession
- ORDI {ordinance} : sacrement religieux en général
- ORDN {ordination} : ordination
religieuse
- PAGE {page} : numéro
ou description de l'endroit où l'information se trouve
dans un ouvrage référencé
- PEDI {pedigree} : Information
relative à l'individu dans un tableau d'ascendance.
- PHON {phone} : numéro
de téléphone
- PLAC {place} : lieu de l'événement
- POST {postal_code} : code postal
- PROB {probate} : validation
d'un testament
- PROP {property} : biens et
possessions
- PUBL {publication} : date et
lieu de publication d'un ouvrage
- QUAY {quality_of-data} : degré
de confiance à accorder à une information
- REFN {reference} : description
ou numéro d'identification d'un fichier ou de tout
autre objet pouvant être référencé
- RELA {relationship} : valeur
du lien dans le contexte
- RELI {religion} : religion
- REPO {repository} : établissement
ou personne dépositaire de l'information
- RESI {residence} : domicile
- RESN {restriction} : indicateur
d'accès restreint ou interdit à une information
- RETI {retirement} : retraite
- RFN {rec_file_number} : numéro
permanent affecté à un enregistrement pour l'identifier
de manière unique dans un fichier
- RIN {rec_id_number} : numéro
affecté à un enregistrement automatiquement
par un système émetteur qui est utilisé
pour identifier cet enregistrement dans les résultats
produits par un système récepteur
- ROLE {role} : rôle joué
par un individu dans un événement
- SEX {sex} : sexe
- SLGC {sealing_child} : scellement d'un enfant à ses parents (cérémonie
de l'Eglise des Mormons)
- SLGS {sealing_spouse} : scellement d'un mari et d'une femme (cérémonie
de l'Eglise des Mormons)
- SOUR {source} : document d'origine
ou source initiale de l'information
- SPFX {surn_prefix} : partie
d'un nom de famille qui n'est pas indexée
- SSN {soc_sec_number} : numéro
de sécurité sociale
- STAE {state} : état
(division géographique ou juridictionnelle)
- STAT {status} : état
(condition)
- SUBM {submitter} : individu
ou organisation qui fournit les données généalogiques
- SUBN {submission} : ensemble
de données à traiter
- SURN {surname} : nom de famille
- TEMP {temple} : nom ou code
d'identification d'un temple de l'Eglise des Mormons
- TEXT {text} : texte exact provenant
d'un document original
- TIME {time} : heures (entre
0 et 24), minutes et secondes séparées par les
deux points (:). Secondes et centièmes de secondes
sont optionnels.
- TITL {title} : description
d'un ouvrage, comme le titre d'un livre; titre de noblesse
ou titre honorifique pour un individu
- TRLR {trailer} : marque de
fin d'un fichier GEDCOM
- TYPE {type} : définition
complémentaire de l'identificateur précédent.
- VERS {version} : indique la
version d'un produit, d'un composant ou d'un ouvrage utilisé
ou référencé
- WIFE {wife} : épouse
- WILL {will} : testament (voir
aussi PROB)
Pour
toute information complémentaire sur le format GEDCOM,
consultez le document de référence de la version
5.5. (en anglais).
Ceux qui veulent en savoir plus sur l'évolution de la norme
GEDCOM peuvent consulter le Gedcom
File Information Web site ou le site Gentech.
Programmes utilitaires pour
travailler sur des fichiers GEDCOM
On trouve sur le site américain
de l'Université de l'Etat de Pennsylvanie un grand nombre
de programmes utilitaires qui manipulent des données GEDCOM.
Ces utilitaires vous permettront de:
- comparer des fichiers GEDCOM,
- créer des arbres ou
des tableaux à partir de fichiers GEDCOM,
- visualiser, manipuler et imprimer
des données GEDCOM,
- créer vos pages web
à partir de vos données GEDCOM,
- convertir des données
GEDCOM au format MS EXCEL ou MS ACCESS,
- faire des statistiques sur
des fichiers GEDCOM.
Pour consulter la liste de ces utilitaires,
allez sur ftp://ftp.cac.psu.edu/pub/genealogy/gedcom/
Les versions de démonstration de plusieurs logiciels de généalogie
sont également disponibles sur ce site. Pour en consulter
la liste, allez sur ftp://ftp.cac.psu.edu/pub/genealogy/programs/
Sur les sites suivants, vous
trouverez aussi des programmes utilitaires qui vous serviront
à diverses manipulations de vos données généalogiques
:
- PAF
Review Home Page [en anglais]
La page à consulter pour tout savoir sur ce programme
utilisé par l'Eglise des Saints du Dernier Jour et
sur les utilitaires complémentaires.
- GenBox2
[en anglais]
Pour faire des arbres et tableaux d'ancêtres à
partir d'un fichier GEDCOM.
- GEDSplit
[en anglais]
Pour éclater des fichiers GEDCOM.
- GEDPlace
[en anglais]
Pour éditer les noms de lieux dans des fichiers GEDCOM.
- WWW
Genealogical Tools [en anglais]
Exemples de pages Web produites à partir de fichiers
GEDCOM par les outils Ged2html, Ged2htm, Gedpage, Ged2www,
Webged.
- VisuGed
[en français]
Programme de visualisation, de comparaison, de contrôle,
d'impression et de conversion de fichiers GEDCOM.
Créer des pages web à
partir de fichiers GEDCOM (conversion au format HTML)
Vous trouverez sur le site http://help.surnameweb.org/knight/
une sélection d'outils de conversion GEDCOM-HTML.
Supprimer dans un fichier GEDCOM
les renseignements qui concernent les personnes non décédées
Convertir les caractères
ANSEL en caractères ASCII, MSDOS ou Windows
Les
fichiers GEDCOM qui contiennent des caractères accentués
utilisent souvent le jeu de caractères ANSEL, le plus
couramment utilisé dans les catalogues de bibliothèques.
Lorsqu'un fichier GEDCOM contient la ligne :
1 CHAR ANSEL
au début du fichier, beaucoup d'éditeurs de texte
n'afficheront pas tous les caractères correctement. Barney
Tyrwhitt-Drake a créé un convertisseur ANSEL-texte.
|