Statistische Daten für Kartendarstellungen aufbereiten

Wenn du dir Daten von der Statistik Austria heruntergeladen hast, musst du sie für eine Darstellung als Karte noch aufbereiten. In einem Tabellenkalkulationsprogramm wie Microsoft Excel oder LibreOffice Calc geht das mit den folgenden Tipps relativ rasch. Vielleicht kann dir bei den ersten Schritten eine Lehrkraft behilflich sein.

Crashkurs Datenaufbereitung

Für die Aufbereitung von Flächenkarten mit MyMap benötigst du die Daten in einem Excel-File in folgender Form:

  • Eine Spalte mit den NUTS3-, Bezirks- oder Gemeindenamen bzw. mit den Codes entsprechend den offiziellen Kennziffern der Statistik Austria.
  • Für jede Karte eine vollständige Spalte mit den Werten die dargestellt werden sollen.
  • Die Daten müssen nach den Codes sortiert sein.

Wenn du Karten zu den Anteilen an PflichtschulabsolventInnen nach Alter und Geschlecht erstellen willst – so wie du sie für den Anteil an AkademikerInnen im Beitrag Hochqualifizierte vorfindest – dann solltest du dir ein Excel-File erstellen, das für alle Bezirke folgende Spalten enthält:

Bezirksname (inklusive Bezirkskode)
Anteil Männer 2014 mit Pflichtschulabschluss im Alter 25 bis 34 Jahre
Anteil Männer 2014 mit Pflichtschulabschluss im Alter 35 bis 54 Jahre
Anteil Männer 2014 mit Pflichtschulabschluss im Alter 55 bis 64 Jahre
Anteil Frauen 2014 mit Pflichtschulabschluss im Alter 25 bis 34 Jahre
Anteil Frauen 2014 mit Pflichtschulabschluss im Alter 35 bis 54 Jahre
Anteil Frauen 2014 mit Pflichtschulabschluss im Alter 55 bis 64 Jahre

Den Anteil der Personen mit Pflichtschulabschluss kannst du berechnen, indem du die Zahl an Personen mit Pflichtschulabschluss durch die Wohnbevölkerung insgesamt dividierst – jeweils für das Geschlecht und die Altersgruppe, die du gerade betrachtest. Die Grunddaten die du für die Berechnung der Anteile benötigst (Wohnbevölkerung nach Alter und Geschlecht sowie Personen mit Pflichtschulabschluss nach Alter und Geschlecht), kannst du dir aus STATcube herunterladen.

Wenn du noch nicht so viel Erfahrung mit Excel hast, findest du im Folgenden eine schrittweise Anleitung wie du die Daten aus STATcube so aufbereitest, dass du sie anschließend für die Erstellung von Karten nutzen kannst.

Schrittweise Anleitung zur Aufbereitung der Daten in Excel

Unser Ausgangspunkt für die Datenaufbereitung ist folgender:

  • Du hast dir aus STATcube Daten für das Jahr 2014 zur Wohnbevölkerung zwischen 25 und 64 Jahren (nach 5-jährigen Altersgruppen und Geschlecht) für alle Bezirke heruntergeladen und als Excel-File mit dem Namen „Wohnbev2014Gesamt.xlsx“ abgespeichert.
  • Zusätzlich hast du dir diese Daten auch für die Subgruppe heruntergeladen, die als höchsten Schulabschluss nur Pflichtschulabschluss hat. Diese Daten hast du als Excel-File mit dem Namen „Wohnbev2014Pflichtschule.xlsx“ abgespeichert.
  • Du willst mit den Daten zu den PflichtschulabsolventInnen die gleichen Karten erstellen wie sie im Beitrag Hochqualifizierte für die AkademikerInnen erstellt wurden.
  • Die Daten sollen so aufbereitet werden, dass du sie anschließend für die Erstellung von Flächenkarten in MyMap verwenden kannst.

Folgende Schritte musst du bei der Aufbereitung der Daten durchführen:

  1. Öffne zuerst das Datenfile „Wohnbev2014Gesamt.xlsx“. In diesem File findest du Daten zur Wohnbevölkerung zwischen 25 und 64 Jahren in den Bezirken Österreichs, nach 5-jährigen Altersgruppen und getrennt für Männer und Frauen.
  2. Speichere das Datenfile unter dem neuen Namen „AnteilPSAbsolv2014.xlsx“.
  3. Notiere dir in deinem Projekt/VWA-Heft die Herkunft der Daten die du bearbeitest. Das musst du als Quelle deiner Daten später in deiner Karte angeben:

    Quelle: STATcube – statistische Datenbank von STATISTIK AUSTRIA, Abgestimmte Erwerbsstatistik 2014.

  4. Lösche dann die obersten Zeilen zu diesen Quellenangaben aus dem File.
  5. Ganz am Ende des Datenfiles stehen noch einige Zeilen, in denen die Daten, die die du dir heruntergeladen hast, genau definiert werden. Schaue dir das an und schreibe dir die genauen Datendefinitionen ebenfalls heraus. Lösche dann auch die Zeilen unterhalb der Tabelle.
  6. Gehe wieder an den Anfang der Tabelle. Du kannst nun auch die ganze erste Spalte löschen, da in dieser nur ganz oben die Namen für die Spaltenvariable „Geschlecht“ und „Alter in Jahren (Ebene +2)“ stehen. Das erkennst du aber auch an den Spaltenüberschriften selbst.
  7. In der ersten Spalte deines Datenfiles stehen die Bezirksnamen sortiert nach dem Bezirkscode, die entsprechenden Bezirkscodes sind jeweils in angeführt.

    Hinweise: Die 1. Ziffer des Bezirkscodes steht für das Bundesland: 1 für das Burgenland, 2 für Kärnten, ... alphabetisch sortiert bis ..., 8 für Vorarlberg und 9 für Wien. Die 2. und 3. Ziffer steht für den Bezirk im Bundesland. 01, 02 ... erhalten die Statutarstädte in den Bezirken, danach sind die Bezirke ebenfalls wieder alphabetisch gereiht. Du kannst nun auch die 3. Zeile aus deinem Datenfile löschen, da in dieser nur der Variablenname für deine 1. Spalte „Wohnort (Ebene+1)“ = Bezirk steht.

  8. Der Datensatz den du dir aus STATcube heruntergeladen hast, enthält die Wohnbevölkerung (getrennt nach Männern und Frauen) im Alter von 25 bis 64 Jahren in 5-Jahresaltersklassen. Für deine Analysen benötigst du die männliche und weibliche Wohnbevölkerung in den Altersklassen 25 bis 34 Jahre, 35 bis 54 Jahre sowie 55 bis 64 Jahre. Du musst die Daten der 5-jährigen Altersklassen daher entsprechend zusammenfassen.
  9. Füge bei den Daten der Männer eine Spalte nach dem Alter „30 bis 34 Jahre“ ein, eine Spalte nach dem Alter „50 bis 54 Jahre“ und eine Spalte nach „60 bis 64 Jahre“. Benenne diese Spalten mit „25 bis 34 Jahre“, „35 bis 54 Jahre“ und „55 bis 64 Jahre“. Addiere dann die entsprechenden Werte zeilenweise. Das geht mittels Formeln ganz schnell. Lasse dir das von einer Lehrkraft zeigen.
  10. Füge auch bei den Daten der Frauen entsprechende Spalten ein und addiere dann die Werte wieder zeilenweise.
  11. Markiere anschließend alle Daten in deinem File. Kopiere die Daten und verwende dann „Einfügen“ plus „Werte einfügen“. Es stehen nun nur mehr Werte und keine Formeln mehr im Datensatz. Achtung: Das ist wichtig, bevor du nun die nicht mehr benötigten Datenspalten aus dem File löschst.
  12. Lösche nun alle Spalten, die du für deine weiteren Analysen nicht mehr benötigst. Belasse in deinem Datensatz nur folgende Spalten:

    Männer 25 bis 34 Jahre
    Männer 35 bis 54 Jahre
    Männer 55 bis 64 Jahre
    Frauen 25 bis 34 Jahre
    Frauen 35 bis 54 Jahre
    Frauen 55 bis 64 Jahre

  13. Wahrscheinlich musst du die Spaltenüberschriften für „Männer“ und „Frauen“ nun nochmals hinzufügen. Mache das, damit du auch später noch weißt, welche Daten du in deinem Datensatz hast. Wir würden dir auch vorschlagen, die Daten einheitlich zu formatieren – lösche alle Rahmen um die Zellen, eventuell auch die Farbunterlegung von Zeilen und Spalten. Wenn es für dich übersichtlicher ist, kannst du natürlich auch Rahmen und/oder Farbschattierungen von Zeilen oder Spalten verwenden.
  14. Speichere das File ab!
  15. Öffne nun das Datenfile „Wohnbev2014Pflichtschule.xlsx“. In diesem File findest du Daten zur Wohnbevölkerung zwischen 25 und 64 Jahren in den Bezirken Österreichs die nur über einen Pflichtschulabschluss verfügen (!), nach 5-jährigen Altersgruppen und getrennt nach Männern und Frauen.
  16. Bereite diese Daten analog zu jenen der Gesamtbevölkerung auf. Überlege dir selbst einen Namen unter dem du dieses aufbereitete Datenfile zu den PflichtschulabsolventInnen abspeicherst. Benennen die Spalten für die Männer nun „Pflichtschule Männer“, jene für Frauen „Pflichtschule Frauen“. Dann weißt du auch später noch, dass das die Daten für eine ausgewählte Bildungsgruppe sind.
  17. Öffne nun wieder die Datei „AnteilPSAbsolv2014.xlsx“.
  18. Kopiere die Werte aus der Datei der PflichtschulabsolventInnen neben die Werte für die Gesamtbevölkerung in der Datei „AnteilPSAbsolv2014.xlsx“. Die Spalte mit den Bezirksnamen brauchst du nicht mitkopieren. Speichere die Datei wieder ab.
  19. Du musst dir nun nur noch die Anteile der PflichtschulabsolventInnen in den jeweiligen Altersklassen berechnen. Hierbei sollte dir eventuell eine Lehrkraft helfen.
  20. Das File „AnteilPSAbsolv2014.xlsx“, das du als Grundlage für die Erstellung von Karten – etwa in MyMap – verwenden kannst, sollte schließlich folgende Spalten enthalten:

    Bezirksname (inklusive Bezirkscode)
    Anteil Männer 2014 mit Pflichtschulabschluss im Alter 25 bis 34 Jahre
    Anteil Männer 2014 mit Pflichtschulabschluss im Alter 35 bis 54 Jahre
    Anteil Männer 2014 mit Pflichtschulabschluss im Alter 55 bis 64 Jahre
    Anteil Frauen 2014 mit Pflichtschulabschluss im Alter 25 bis 34 Jahre
    Anteil Frauen 2014 mit Pflichtschulabschluss im Alter 35 bis 54 Jahre
    Anteil Frauen 2014 mit Pflichtschulabschluss im Alter 55 bis 64 Jahre

    Wer besonders ambitioniert ist, kann auch noch folgende Werte berechnen:
    Genderindex 2014 Pflichtschulabschluss Alter 25 bis 34 Jahre
    Genderindex 2014 Pflichtschulabschluss Alter 35 bis 54 Jahre
    Genderindex 2014 Pflichtschulabschluss Alter 55 bis 64 Jahre

Achtung: Da STATcube dir die Bezirkskennzahlen nicht als eigene Spalte liefert, solltest du die Reihenfolge der Bezirke so belassen wie sie von STATcube geliefert werden. Dann kannst du die Daten direkt in das Datenfile für das Kartenprogramm MyMap kopieren. Wenn irgendetwas bei der Datenabfrage oder der Datenaufbereitung passiert ist und die Bezirke nicht nach dem Bezirkscode sortiert sind: Füge eine eigene Spalte Bezirkscode hinzu und tippe die Bezirkscodes händisch in die Spalte ein – das dauert bei 95 Bezirken nicht so lang. Sortiere das File anschließend nach dem Bezirkscode.

 

Beitrag: Elisabeth Aufhauser