Genealogie Hilfsmittel Soundex Familienname


Genealogie Ahnenforschung Stammbaum

Eine besondere Klasse von Problemen findet sich häufig in der Arbeit des genealogisch Interessierten - die Abänderung von Familiennamen

Dies ist einerseits die Lesbarkeit von alten Schriften, und andererseits die Veränderung von Namen und Bezeichnungen im Laufe der Zeit. Speziell bei Familiennamen findet man Veränderungen in der Schreibweise oft im Zeitraum von wenigen Jahren. Sowohl schlechte Lesbarkeit sowie Veränderungen der Schreibweise führen dazu dass ein und der selbe Eigenname zwar ähnlich gesprochen wurde, aber unterschiedlich geschrieben wurde- letztlich war aber der ein und derselbe Familienname gemeint. Besonders in der Zeit vor der allgemeinen Schulpflicht konnten nur wenige Personen Lesen und Schreiben, was dazu führte, dass die Familiennamen oft nur mündlich von Generation zu Generation weitergegeben wurden. Schreibkundig hingegen waren die Pfarrer, die die Kirchenbücher führten, die wechselten aber manchmal, und orientierten sich bei Ihren Aufzeichnungen an dem gesprochen Wort, also an der Aussprache des Familiennamens – und schrieben den Namen nach dem was sie akustisch verstanden hatten nieder –und das war manchmal unterschiedlich.

Eine interessante Möglichkeit zur Bestimmung der Ähnlichkeit von Wörtern bietet ein Algorithmus der Anfang des 20. Jahrhunderts in Amerika zur Identifkation von Namen und Personen in Datenbanken – geschrieben wurde. Der Algorithmus arbeitet nach dem Muster der Lautähnlichkeit – also Worte die sehr ähnlich klingen werden in ähnliche Zahlenkombinationen umgewandelt. Damit können Schreibfehler von Namen rechnerisch gewissen ähnlichen Zahlengruppen zugeordnet werden – ähnliche Zahlen weisen auf ähnlich gesprochene Wörter hin (also auch auf Familiennamen die zwar unterschiedlich geschrieben wurden, aber weiterhin ähnlich gesprochen worden waren)

Hier geht's zum online soundex online Konverter Programm

 

Die Erklärung zu soundex liefert wikipedia (Quelle: Wikipedia-Soundex)


Soundex ist ein phonetischer Algorithmus zur Indizierung von Wörtern und Phrasen nach ihrem Klang in der englischen Sprache. Gleichklingende Wörter sollen dabei zu einer identischen Zeichenfolge kodiert werden.

Der Soundex-Algorithmus erbringt aber häufig auch für die Deutsche Sprache gute Ergebnisse.

Soundex wurde von Robert Russell und Margaret Odell für die Indizierung der Familiennamen der Volkszählung (Census) in den USA entwickelt und 1918 patentiert (US-Patent 1,261,167). Der Soundex-Code für ein Wort besteht aus seinem ersten Buchstaben, gefolgt von drei Ziffern, die die nach dem Anfangsbuchstaben folgenden Konsonanten des Wortes repräsentieren. Ähnliche Laute besitzen den gleichen Code (B, F, P und V werden z. B. alle mit der Ziffer „1“ codiert).

Grundregeln

Jeder Soundex-Code besteht aus einem Buchstaben gefolgt von drei Ziffern, z. B. W-213 für Wikipedia. Hat das zu codierende Wort so viele Buchstaben, dass man mehr Ziffern erzeugen könnte, bricht man nach der dritten Ziffer ab. Hat das Wort zu wenige Buchstaben, füllt man die letzten Ziffern mit Nullen auf. Der asiatische Name Lee wird also als L-000 codiert.

Die Vokale A, E, I, O und U und die Konsonanten H, W und Y sind ausser beim ersten Zeichen zu ignorieren. Erweiternd für die deutsche Sprache kann definiert werden: Die Umlaute Ä, Ö und Ü sind zu ignorieren, das „scharfe S“ ß wird wie das einfache S codiert.

Haben mehrere im originalen String aufeinanderfolgende Buchstaben den gleichen Soundex-Code, erscheint dieser im Ergebnis nur einmal, aus abfx wird also etwa A120 (a bleibt, weil erster Buchstabe, b und f ergeben beide den gleichen code 1, x ergibt 2, am Ende wird eine Null angehängt, um vier Zeichen zu erhalten).

Bei der praktischen Anwendung des Soundex-Verfahrens werden hauptsächlich zwei Punkte kritisiert: Zum einen ist es sehr auf die englische Sprache ausgerichtet, zum anderen bietet es nur eine sehr grobe Analyse.

Dennoch ist festzuhalten, dass es sich bei dem dargestellten Algorithmus wohl um den am häufigsten angewendeten zur phonetischen Suche handelt. Mit dazu beigetragen hat sicherlich, dass für die Datenbank Oracle bereits sehr früh ein entsprechender PL/SQL-Standardbefehl implementiert wurde.

Es wurden später verschiedene Varianten speziell für andere Sprachen entwickelt. So ist beispielsweise unter SAP neben dem Standard-soundex-Verfahren auch das sogenannte „Kölner Verfahren“ (oder auch „Kölner Phonetik“) für deutsche Belange implementiert.

Anwendung


Man gibt im online Prüfprogramm (link siehe oben) den aktuellen Familiennamen ein und bekommt eine code - dann gibt man den vermuteten geänderten Familiennamen ein - und bekommt wieder einen code - wenn der code gleich (oder sehr nahe beieinander) ist dann sind die Namen ähnlich.

Urbare und Grundbücher in der Ahnenforschung

Tipps


Gratis Genealogie Suchanzeigen
Genealogische Datenbank
Genealogische Bibliothek online Genealogische Bibliothek online
Genealogische Bibliothek online Fraktur und Kurrentschrift lesen lernen
Genealogische Bibliothek online Hier gehts zur genealogischen Linkübersicht - hier klicken !
mehr zum Thema Leben heute Genealogische Hilfsmittel - soundex - Familiennamen Namensähnlichkeiten
mehr zum Thema Leben heute Genealogische Hilfsmittel

Weiterführende Artikel



Wie liest man Kirchenbücher ?
Kirchenbücher online
Was sind Urbare ?
Genealogielexikon
Familienforschung anhand von Militärquellen
Genealogische Adressenliste
Ahnenforschung und Genealogie Quellen
online Bibliothek für Geschichte und Familienkunde
Gratis Genealogie Suchanzeigen
Genealogische Datenbank - kostenlos
Genelogische Hilfsmittel

 

Helenes Garten - alte Sorten historische Rezepte

 

Das Projekt

Ziel dieser Webseiten ist es eine Materialsammlung zu bieten, die beim Erforschen ihrer Familiengeschichte behilflich ist.