5.12 Zum Weiterlesen
Das erweiterte Insel-Buch »Java SE 9 Standard-Bibliothek« vertieft die Zeichenkettenverarbeitung und geht insbesondere auf reguläre Ausdrücke detailliert ein, die in Java an unterschiedlichen Stellen zutage treten. Dabei wird auch noch einmal ein Blick auf Scanner geworfen.
Wenn bei der Zeichenkettenverarbeitung sehr große Datenmengen verarbeitet werden, ist die Frage der Optimierung interessant. Die Standardimplementierung des JDK arbeitet nur mit einem einfachen Suchalgorithmus, der bei großen Mustern und Such-Strings sehr ineffizient ist. Im Bereich der Suchalgorithmen hat die Informatik in den letzten Jahrzehnten jedoch sehr interessante Ansätze hervorgebracht, zum Beispiel den Optimal-Mismatch-Algorithmus. Ein gewisses Problem stellt aber der komplette Unicode-Standard dar, insbesondere seit Unicode 4 mit 32 Bit. Enterprise-Bibliotheken, zum Beispiel zum Parsen von XML oder JSON, unterstützen Unicode 4 in der Regel nicht.