UDFs


Für dieses Projekt schien das Verwenden von bereits existierenden Data-Mining-Tool zu aufwendig. Darum wurden Data-Mining-Techniken zur Schreibererkennung mit Hilfe einer UDFs umgesetzt, die in die DB2 Datenbank integriert wurde. UDFs werden anhand ihres Rückgabewertes unterschieden, die können entweder eine skalare Funktion, eine Spaltenfunktion oder eine Tabellenfunktion sein. Es wurde eine UDF A_FV als Tabellenfunktion geschrieben. A_FV berechnet zu einem Anfrage-Vektor die nächsten Feature-Vektoren, deren Distanz unter einem gewissen Schwellwert liegt und gibt sie als Liste mit den dazugehörigen Schreibern zurück.

Dabei wird die Klasse UDFs von der Datenbank verwendet, während die Klasse UDFapp von der Kommandozeile aus gestartet (instanziiert) wird. Beide Klassen haben die UDF-Methode A_FV, welche die gleiche Funtionalität besitzt. Zur Implementierung der Algorithmen und Strukturen wurde Java 1.4 verwendet. Die Java-Klassen befinden sich in der JAR-Datei enh im Package de.enotehistory. Zur Anbindung an die Datenbank wurde die JDBC-Schnittstelle verwendet.

Die folgende Grafik zeigt ein UML-Diagramm, welches die genauen Programmschritte in der UDF darstellt.