Je ne crois pas à la possibilité de réaliser un programme de fusion aussi efficace qu'infaillible, tellement on trouve de cas dans l'écriture des patronymes et des prénoms, des conjoints, des enfants, des dates, des sources, des notes, et de tout ce qu'il faudrait regrouper en une seule fiche.
Regardez déjà la recherche des doublons. Ou les critères de comparaison sont trop stricts et vous en ratez beaucoup, ou ils sont trop lâches et vous avez une liste interminable et injustifiée. Tant que cette question n'est pas résolue, et je pense qu'elle ne le sera jamais, il est inutile d'essayer d'aller plus loin.
Ayant fait la plus grande partie de ma vie professionnelle dans la vente par correspondance, je peux dire que le dédoublonage du fichier client est un problème majeur. Ce n'est pas un seul programme qui le fait, mais toute une suite de programmes s'enchainant les uns les autres. Le tout dure des heures. Et pourtant, on ne compare que des noms et adresses, lesquelles sont de plus normalisées. En fin de compte, il y a toujours une liste de cas douteux qu'il faut retravailler par la suite. On fait souvent deux passages en modifiant les critères de comparaison.
En matière de généalogie, je n'ai pas encore trouvé mieux que le travail à la main. C'est long et délicat, mais je sais ce que j'obtiens.