29.07.1999 - Karsten Flemming über Software für Adress-Dublettenbereinigung
Business-to-Business-Mailings sind ein typischer Bestandteil des Dialogmarketing. Aufwendige Broschüren und hohe Portokosten summieren sich schnell zu einem Stückpreis zwischen 7 und 10 Mark. Erst recht kostentreibend und dazu noch imageschädigend ist ein hoher Dublettenanteil. Die Dublettenidentifikation bei Business-Adressen ist aber weitaus schwieriger als bei Privatpersonen.
Innerhalb eines durchschnittlich gepflegten Bestandes beträgt der Anteil an Dubletten circa 5 bis 10 Prozent. Bei gut unterhaltenen Business-to-Business-Beständen ist mit einem Dublettenanteil von etwa 3 bis 4 Prozent zu rechnen. Bei einem Bestand von 100.000 Adressen, einem Dublettenanteil von 5 Prozent und jährlich zwei Mailings für 7 Mark entsteht ein Verlust von 70.000 Mark. Der Imageschaden ist nur schwer zu beziffern, darf bei einem heftig umkämpften Markt aber nicht unterschätzt werden. Die bekannten, ausschließlich mathematisch-statistischen Techniken wie mathematische Algorithmen, phonologische Verfahren oder Fuzzy Logic erzielen bei Privatpersonen gute Ergebnisse, bei Firmenadressen versagen sie jedoch häufig. Daten über Firmen unterscheiden sich deutlich von Privatkundendaten. Diese Adressen kennen keine Regelmäßigkeiten, deshalb sind relativ hohe Dublettenquoten in solchen Beständen keine Seltenheit. Wissen ist nötig, um diese mögliche Dublette zu erkennen:
Frankf. Zentr. f. techn. Ber. Mayer
z. Hd. B. Mayer
Bürgerm.-Schmidt-str. 16
45884 Gelsenkirchen
Meier technisches Berufszentrum Frankfurt KG
Herrn Bernd Meier
Bürgermeister-Smitt-Straße 1b
45884 Schalke
Daß Frankf., techn., Zentr. und Ber. Abkürzungen sind, wissen Sie, und weil Sie sich in Deutschland oder aber im Fußball auskennen, wissen Sie, daß Schalke ein Ortsteil von Gelsenkirchen ist. Menschen erkennen Bedeutungen und nutzen sie zur Identifizierung. Wie aber sieht es bei Software aus? Eher schlecht - jedenfalls bei herkömmlicher, nichtwissensbasierter Software. Sie weiß nämlich nichts und kennt sich nicht aus: nicht in Deutschland und auch nirgendwo sonst.
Die eingangs erwähnten Verfahren können eben nicht identifizieren und interpretieren. Bestenfalls erkennen sie Zeichenketten, mit deren Hilfe sie Vergleiche anstellen. Für sie ist es in der Tat schwierig, die beiden Firmenadressen als mögliche Dublette zu erkennen.
Glücklicherweise gibt es seit einigen Jahren intelligente, wissensbasierte Software. Die Abbildung zeigt, daß diese Software beim Vergleichen zweier Firmenadressen ähnlich vorgeht, wie es ein Mensch tut. Sie ist in der Lage, Bedeutungen zu erkennen und damit aus angebotenen Daten Informationen zu machen. Zentr., techn. und Ber. sind natürlich Abkürzungen, und Schalke ist ein Ortsteil von Gelsenkirchen, was sonst. Schwierig? Nicht, wenn die Software über Wissen verfügt. Die Integration von Wissen, kombiniert mit Schlußfolgerungsmechanismen, macht aus einer solchen Software ein zuverlässiges Mittel zur Dublettenerkennung - gerade in B-to-B-Beständen.
Karsten Flemming ist Leiter Sales & Marketing bei dem Softwareunternehmen Human Inference in Stolberg.
Mischenrieder Weg 18
82234 Weßling
Tel.: +49 (0) 89-57 83 87-0
Fax: +49 (0) 89-57 83 87-99
E-Mail: info@onetoone.de
Web: www.hightext.de