Java ist auch eine Insel – 11.8 Mengen (Sets)

Java ist auch eine Insel von Christian Ullenboom
Programmieren für die Java 2-Plattform in der Version 5 (Tiger-Release)

Kapitel 11 Datenstrukturen und Algorithmen
	11.1 Mit einem Iterator durch die Daten wandern
		11.1.1 Die Schnittstellen Enumeration und Iterator
	11.2 Datenstrukturen und die Collection-API
		11.2.1 Die Schnittstelle Collection
		11.2.2 Das erste Programm mit Container-Klassen
		11.2.3 Generische Datentypen in der Collection-API
		11.2.4 Der Iterator, die Schnittstelle Iterable und das erweiterte for
		11.2.5 Schnittstellen, die Collection erweitern, und Map
		11.2.6 Konkrete Container-Klassen
	11.3 Listen
		11.3.1 AbstractList
		11.3.2 Beispiel mit List-Methoden
		11.3.3 ArrayList
		11.3.4 asList() und die »echten« Listen
		11.3.5 toArray() von Collection verstehen – die Gefahr einer Falle erkennen
		11.3.6 Die interne Arbeitsweise von ArrayList und Vector
		11.3.7 LinkedList
	11.4 Stack (Kellerspeicher, Stapel)
		11.4.1 Die Methoden von Stack
		11.4.2 Ein Stack ist ein Vector – aha!
	11.5 Queues (Schlangen)
		11.5.1 Blockierende Queues und Prioritätswarteschlangen
	11.6 Assoziative Speicher und die Klasse HashMap
		11.6.1 Ein Objekt der Klasse HashMap erzeugen
		11.6.2 Einfügen und Abfragen der Datenstruktur
		11.6.3 Wichtige Eigenschaften von Assoziativspeichern
		11.6.4 Elemente im Assoziativspeicher müssen unveränderbar bleiben
		11.6.5 Die Arbeitsweise einer Hash-Tabelle
		11.6.6 Aufzählen der Elemente
		11.6.7 Der Gleichheitstest und der Hash-Wert einer Hash-Tabelle
		11.6.8 Klonen
	11.7 Die Properties-Klasse
		11.7.1 Properties setzen und lesen
		11.7.2 Properties verketten
		11.7.3 Eigenschaften ausgeben
		11.7.4 Hierarchische Eigenschaften
		11.7.5 Properties speichern
		11.7.6 Über die Beziehung Properties und Hashtable
	11.8 Mengen (Sets)
		11.8.1 HashSet
		11.8.2 TreeSet – die Menge durch Bäume
	11.9 Algorithmen in Collections
		11.9.1 Datenmanipulation: Umdrehen, Füllen, Kopieren
		11.9.2 Vergleichen von Objekten mit Comparator und Comparable
		11.9.3 Größten und kleinsten Wert einer Collection finden
		11.9.4 Sortieren
		11.9.5 nCopies()
		11.9.6 Singletons
		11.9.7 Elemente in der Collection suchen
	11.10 Synchronisation der Datenstrukturen
	11.11 Die abstrakten Basisklassen für Container
		11.11.1 Optionale Methoden
	11.12 Die Klasse BitSet für Bitmengen
		11.12.1 Ein BitSet anlegen und füllen
		11.12.2 Mengenorientierte Operationen
		11.12.3 Funktionsübersicht
		11.12.4 Primzahlen in einem BitSet verwalten
	11.13 Ein Design-Pattern durch Beobachten von Änderungen
		11.13.1 Design-Pattern
		11.13.2 Das Beobachter-Pattern (Observer/Observable)

11.8 Mengen (Sets)

Eine Menge ist eine (erste einmal) ungeordnete Sammlung von Elementen. Jedes Element darf nur einmal vorkommen. Für Mengen sieht die Java-Bibliothek die Schnittstelle java.util.Set vor. Sie definiert neben Operationen für Anfrage und Einfügen von Elementen auch Funktionen für Schnitt und Vereinigung von Mengen.

interface java.util.Set<E>
extends Collection<E>

boolean add( E o )
Setzt o in die Menge, falls es dort noch nicht vorliegt. Liefert true bei erfolgreichem Einfügen.

boolean addAll( Collection c )
Fügt alle Elemente von c in das Set ein und liefert true bei erfolgreichem Einfügen. Ist c ein anderes Set, so steht addAll() für die Mengenvereinigung.

void clear()
Löscht das Set.

boolean contains( Object o )
Ist das Element o in der Menge?

boolean containsAll( Collection c )
Ist c Teilmenge von Set?

boolean isEmpty()
Ist das Set leer?

Iterator<E> iterator()
Gibt einen Iterator für das Set zurück.

boolean remove( Object o )
Löscht o aus dem Set, liefert true bei erfolgreichem Löschen.

boolean removeAll( Collection<?> c )
Löscht alle Elemente der Collection aus dem Set und liefert true bei erfolgreichem Löschen.

boolean retainAll( Collection c )
Bildet die Schnittmenge mit c.

int size()
Gibt die Anzahl der Elemente in der Menge zurück.

Object[] toArray()
Erzeugt zunächst ein neues Feld, wo alle Elemente der Menge Platz finden, und kopiert anschließend die Elemente in das Feld.

<T> T[] ziel toArray( T[] a )
Ist das übergebene Feld groß genug, dann werden alle Elemente der Menge in das Feld kopiert. Ist das Feld zu klein, wird ein neues Feld vom Typ T angelegt, alle Elemente vom Set in der Array kopiert und zurückgegeben.

Aus Object werden equals() und hashCode() korrekt implementiert.

Obacht muss der Eigenschaft geschenkt werden, dass die Elemente immutable bleiben. Zum einen sind sie nach einer Änderung vielleicht nicht wieder zu finden, und zum Zweiten können so Elemente doppelt in der Menge vorkommen, was der Philosophie der Schnittstelle widerspricht.

11.8.1 HashSet

Ein java.util.HashSet verwaltet die Elemente in einer schneller Hash-basierten Datenstruktur. Dadurch sind die Elemente schnell einsortiert und schnell zu finden. Falls eine Sortierung nötig ist, müssen die Elemente nachträglich sortiert werden.

class java.util.HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, Serializable

HashSet()
Erzeugt ein neues HashSet-Objekt mit 16 freien Plätzen und einem Füllfaktor von 0.75.

HashSet( Collection<? extends E> c )
Erzeugt ein neues Set aus der Menge gegebener Elemente.

HashSet( int initialCapacity )
Erzeugt ein neues HashSet mit einer gegebenen Anzahl freier Plätze und dem Füllfaktor von 0.75.

HashSet(int initialCapacity, float loadFactor)
Erzeugt ein neues leeres HashSet mit einer Startkapazität und einem gegebenen Füllfaktor.

Die Startgröße ist für die Performanz wichtig. Ist die Größe zu klein gewählt, so muss die Datenstruktur bei neu hinzugefügten Elementen vergrößern – hier unterscheidet sich die HashSet nicht von der HashMap. Im Übrigen basiert HashSet auf HashMap.

11.8.2 TreeSet – die Menge durch Bäume

Die Klasse java.util.TreeSet implementiert ebenfalls wie HashSet die Set-Schnittstelle, verfolgt aber eine andere Implementierungs-Strategie. Ein TreeSet verwaltet die Elemente immer sortiert. (Intern werden die Elemente in einem balancierten Binärbaum gehalten). Speichert TreeSet ein neues Element, so fügt TreeSet das Element automatisch sortiert in die Datenstruktur ein. Das kostet zwar etwas mehr Zeit als ein HashSet, doch diese Sortierung ist dauerhaft. Daher ist es auch nicht zeitaufwändig, alle Elemente geordnet auszugeben. Die Suche nach einem einzigen Element ist aber etwas langsamer als im HashSet. Der Begriff »langsamer« muss jedoch relativiert werden. Die Suche ist logarithmisch und daher nicht wirklich »langsam«. Beim Einfügen muss bei bestimmten Konstellationen eine Reorganisation des Baumes in Kauf genommen werden, was die Einfügezeit verschlechtert. Doch auch beim Re-Hashing gibt es diese Kosten, die dort jedoch durch die passende Startgröße vermieden werden kann.

class java.util.TreeSet<E>
extends AbstractSet<E>
implements SortedSet<E>, Cloneable, Serializable

TreeSet()
Erzeugt ein neues leeres TreeSet.

TreeSet( Collection<? extends E> c )
Erzeugt ein neues TreeSet aus der gegebenen Collection.

TreeSet( Comparator<? super E> c )
Erzeugt ein leeres TreeSet mit einem gegebenen Comparator, der für die Sortierung der internen Datenstruktur die Vergleiche übernimmt.

TreeSet( SortedSet<E> s )
Erzeugt ein neues TreeSet und übernimmt alle Elemente von s und auch die Sortierung von s.

TreeSet implementiert SortedSet und damit die folgenden Funktionen

public interface java.util.SortedSet<E>
extends Set<E>

E first()
Liefert das erste Element in der Liste.

E last()
Liefert das größte Element.

Comparator<? super E> comparator()
Liefert den mit dem Set verbundenen Comparator. Die Rückgabe kann null sein, wenn die Objekte sich mit Comparable selbst vergleichen können.

SortedSet<E> headSet( E toElement )
Liefert eine Teilmenge von Elementen, die echt kleiner als toElement ist.

SortedSet<E> tailSet(E fromElement)
Liefert eine Teilmenge mit Elementen, die größer oder gleich fromElement sind.

SortedSet<E> subSet(E fromElement, E toElement)
Liefert eine Teilmenge im gewünschten Bereich.

Anders als HashSet liefert der Iterator die Elemente aufsteigend sortiert. Davon profitieren auch die beiden Funktionen toArray() – implementiert in AbstractCollection –, denn sie nutzen den Iterator, um ein sortiertes Feld zurückzugeben.

Durch die interne sortierte Speicherung gibt es zwei ganz wichtige Bedingungen:

Die Elemente müssen sich vergleichen lassen. Kommt ein Kirchen-Objekt in das TreeSet und implementiert dieser nicht die Schnittstelle Comparable, löst TreeSet eine Ausnahme aus.

Die Elemente müssen vom gleichen Typ sein. Wie sollte sich ein Kirchen-Objekt mit einem Staubsauger-Objekt vergleichen lassen?

<< zurück

<top>

vor >>