2.7 Atomare Operationen und frische Werte mit volatile *
Die JVM arbeitet bei den Ganzzahl-Datentypen kleiner gleich int intern nur mit einem int. Doch obwohl es auch für die 64-Bit-Datentypen long und double einzelne Bytecode-Befehle gibt, ist nicht gesichert, dass die Operationen auf diesen Datentypen unteilbar sind, da etwa eine 64-Bit-Zuweisung sich aus zwei 32-Bit-Zuweisungen zusammensetzen lässt. Es kann also passieren, dass ein Thread mitten in einer long- oder double-Operation von einem anderen Thread verdrängt wird. Greifen zwei Threads auf die gleiche 64-Bit-Variable zu, so könnte möglicherweise der eine Thread eine Hälfte schreiben und der andere Thread die andere.
Beispiel |
Zwei Threads versuchen gleichzeitig, die Variable l vom Typ long zu ändern (aus Gründen der Übersichtlichkeit ist ein Leerzeichen nach dem ersten 32-Bit-Block in der hexadezimalen Notation eingefügt): l = 0x00000000 00000000 l = 0xFFFFFFFF FFFFFFFF Schreibt der erste Thread den ersten Teil der long-Variablen mit 00000000, und findet dann ein Kontextwechsel statt, sodass der zweite Thread die Variable komplett mit FFFFFFFF FFFFFFFF initialisiert, gibt es nach dem erneuten Umschalten ein Problem, weil dann der erste Thread seine zweite Hälfte schreiben wird und die Belegung der Variablen FFFFFFFF 00000000 ist. Insgesamt gibt es vier denkbare Belegungen durch das Scheduling beim Kontextwechsel: l = 0x00000000 00000000 |
2.7.1 Der Modifizierer volatile bei Objekt-/Klassenvariablen
Um dies zu vermeiden, können die Objekt- und Klassenvariablen mit dem Modifizierer volatile deklariert werden. Die Zugriffsoperationen werden auf diesen Variablen dann atomar ausgeführt. Der Modifizierer ist bei lokalen Variablen nicht gestattet, da sie auf dem Stapel liegen und für andere Threads nicht zugänglich sind. Achtung: Auch mit volatile sind Operationen wie i++ natürlich noch nicht atomar, da i++ aus Grundoperationen besteht: Lesen von i, Erhöhen um eins und Schreiben von i; Abschnitt 2.4.9, »Mit synchronized synchronisierte Blöcke«, nannte die Teile schon.
Zwischenspeicherung untersagen
volatile beugt zusätzlich einem anderen Problem vor: Während der Berechnung könnte die Laufzeitumgebung Inhalte von Variablen im Prozessorspeicher (zum Beispiel Register) zwischengespeichert haben. Das passiert etwa, wenn in einer Schleife ein Wert immer hochgezählt wird, der in einer Objektvariablen gespeichert wird.
Eine Laufzeitumgebung könnte den (teureren) Zugriff auf Objektvariablen optimieren, indem sie zuerst den Variableninhalt in eine (schnelle) interne lokale Variable kopiert und anschließend, nach einer Berechnung, das Ergebnis zurückgespeichert. Nehmen wir eine Objektvariable cnt und folgende Schleife an:
for ( int cnt = 0; cnt < 1000000; cnt++ )
cnt++;
Eine optimierende Laufzeitumgebung könnte nun auf die Idee kommen, nicht bei jedem Schleifendurchlauf den Speicher der Objektvariable cnt auszulesen und zu beschreiben, sondern nur am Ende. Etwa so:
int i = cnt;
for ( int i = 0; i < 1000000; i++ )
i++;
cnt = i;
Wenn die Umgebung cnt zuerst in eine interne lokale Variable kopiert, dann die gesamte Schleife ausführt und erst anschließend den internen Wert nach cnt zurückkopiert, hätten wir viel Zeit gespart, denn der Zugriff auf eine lokale Variable, die sich im Register des Prozessors aufhalten kann, ist wesentlich schneller als der Zugriff auf eine Objektvariable. Dies ist im Übrigen eine beliebte Strategie, um die Performance eines Programms zu steigern. Mit dieser internen Optimierung kommt es jedoch zu schwer kontrollierbaren Nebeneffekten, und Änderungen am Wert von cnt sind nicht sofort für andere Threads sichtbar, denen damit die Information über die einzelnen Inkrementschritte fehlt.
Oder ein anderes Beispiel:
int i = cnt;
Thread.sleep( 10000 );
int j = cnt;
Verändert ein anderer Thread während des Wartens die Variable cnt, könnte j = i sein, wenn die Laufzeitumgebung die Variable j nicht frisch mit dem Wert aus cnt initialisiert. Nebenläufige Programmierung und Programmoptimierung passen schwer zusammen!
Auch hier hilft wieder das ungewöhnliche Schlüsselwort. Ist die Variable mit volatile gekennzeichnet, wird das Ergebnis nicht im Zwischenspeicher belassen, sondern ständig aktualisiert. Die parallelen Threads sehen somit immer den korrekten Variablenwert, da er vor jeder Benutzung aus dem Speicher gelesen und nach einer Änderung sofort wieder zurückgeschrieben wird. Sehr gut ist das für boolean-Werte, die Flags anzeigen, die andere Threads zur Synchronisation beobachten. Ein Array, das mit volatile markiert ist, hat alle Zugriffe auf die Elemente volatile, denn auch hier könnte die JVM die Elemente aus Performance-Gründen zwischenspeichern. Wohlgemerkt bleiben nur die Werte aktuell; nicht-atomare Operationen wie cnt++ sind damit immer noch nicht atomar.
2.7.2 Das Paket java.util.concurrent.atomic
Während volatile das Lesen und Schreiben auf den 64-Bit-Datentypen atomar macht, ist eine Operation wie cnt++ oder cnt > 12 nicht atomar. Kurz vor dem Erhöhen oder dem Vergleich kann ein Thread-Wechsel stattfinden und cnt geändert werden, sodass der Vergleich einen anderen Ausgang findet. Die Rettung ist ein synchronisierter Block, wobei jedoch eine Synchronisationsvariable nötig ist.
Seit Java 5 helfen hier die Klassen des Pakets java.util.concurrent.atomic. Ein Beispiel für einen veränderbaren Behälter ist AtomicInteger, der Operationen wie getAndIncrement() anbietet, die den Wert des Behälters atomar erhöhen.
Beispiel |
Eine öffentliche Klasse bietet über eine statische Methode eine ID (im Bereich long) an. Listing 2.36: com/tutego/insel/thread/atomic/Id.java public class Id |
Insgesamt befinden sich im Paket java.util.concurrent.atomic folgende Klassen für elementare Datentypen: AtomicBoolean, AtomicInteger, AtomicLong – es gibt weder AtomicShort noch AtomicByte. Da diese Objekte alle veränderbar sind, eignen sie sich nicht unbedingt als Ersatz für immutable Wrapper-Objekte wie Integer, insbesondere nicht in allgemeinen Assoziativspeichern oder Mengen; sie deklarieren auch gar kein eigenes equals() und hashCode().
Für Felder stehen bereit: AtomicIntegerArray, AtomicLongArray. Die Klassen AtomicIntegerFieldUpdater<T> und AtomicLongFieldUpdater<T> gehen über Reflection an Attribute heran, die volatile sind, und ermöglichen atomare Operationen. Dazu kommen noch einige Klassen zum atomaren Arbeiten mit Referenzen: AtomicReference, AtomicReferenceArray<E>, AtomicReferenceFieldUpdater<T,V>, AtomicMarkableReference<V> (assoziiert ein Objekt mit einem Flag, das atomar geändert werden kann) und AtomicStampedReference<V> (assoziiert ein Objekt mit einer Ganzzahl).
Ihr Kommentar
Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.