Alter gleich metrisch

Während Programmiersprachen, Datenbanken und Tabellenkalkulationsprogramme bisweilen über mehr als ein Dutzend Datentypen verfügen, kennen die Statistiker im wesentlichen nur drei Arten von Daten, aber auch die machen Lehrgangsteilnehmern und Klausurkandidaten bisweilen große Probleme. Diese kleine Artikel klärt auf.

Als Merkmal bezeichnet man in der Statistik, was in einer statistischen Forschungsmaßnahme erhoben wird, und als Merkmalsausprägung das, was bei der Erhebung im konkreten Einzelfall tatsächlich gefunden wird. Beispielsweise ist das Alter einer Person das Merkmal, und die Zahl, die ein bestimmter, einzelner Befragter als Antwort nennt, ist die Merkmalsausprägung. Diese wird durch rechnerische Verfahren ausgewertet, um Aussagen über die Grundgesamtheit, also letztlich über die Wirklichkeit zu gewinnen.

Hierbei unterteilt die Statistik die möglichen Merkmalsausprägungen in drei Kategorien, die als Skalenniveaus bezeichnet werden. Diese Datentypen bestimmen die mit den gefundenen Merkmalsausprägungen möglichen Rechenverfahren. Der Versuch, unanwendbare Methoden zu nutzen, führt zu unbrauchbaren Ergebnissen. Man muß also wissen, womit man es zu tun hat, bevor man mit der numerischen Auswertung beginnt.

Datentyp Definition Beispiele
Nominal Rein qualitative Merkmalsausprägungen ohne natürliche Ordnung Geschlecht, Berufsstatus, dichotome Antwort vom Typ „ja/nein“
Ordinal Qualitative Merkmalsausprägungen mit natürlicher Ordnung Qualitätseinschätzung („sehr gut“, „gut“, „mittel“, „schlecht“, „sehr schlecht“)
Metrisch (auch: rational) Merkmalsausprägungen, die in einer Zahl besteht und eine Dimension und einen Nullpunkt besitzt Einkommen (in Euro), Alter (in Jahren), Leistung (in Stück pro Stunde, in km/h)

Übersicht über die drei grundlegenden Skalenniveaus (Datentypen) der Statistik

Da sich nominale Daten nur durch „gleich“ oder „ungleich“ abgrenzen lassen, sind hier nur Angaben über Häufigkeiten und Anteile möglich. Bekanntestes Beispiel hierfür sind die Auswertungen von Wahlen.

Ordinale Merkmale haben zudem eine natürliche Ordnung. Logische Operatoren wie „größer als“ oder „kleiner als“ sind daher anwendbar. Eine Qualitätseinschätzung kann nur besser oder schlechter als eine andere Bewertung sein, aber nicht doppelt oder halb so gut. Wird einer ordinalen Merkmalsausprägung aber eine Zahl als Ergebniswert (willkürlich) zugewiesen, so spricht man von einer Rating-Skala. Dann werden Berechnungen von Durchschnitten, Standardabweichungen und der Normalverteilung doch möglich, ohne daß es sich aber auch um eine metrische Skala handele: die Schulnote ist das beste Beispiel. Diese besteht eben nicht wirklich in einem numerischen Wert: die Zahl ist nur nachträglich zugewiesen. Eine „1“ ist eben nicht genau doppelt oder halb so viel wie eine „2“, sondern nur „besser als“ die „2“ und diese „besser als“ die „3“ usw. Durchschnittsnoten sind daher keine „echten“ Durchschnitte, gleichwohl aber aussagekräftig. Man spricht hier von „pseudometrischer“ Skalierung.

Nur mit genuin metrischen Merkmalen lassen sich alle Rechenoperationen wirklich aussagekräftig durchführen – und etwa Mittelwerte, Korrelationen oder Regressionen berechnen. Sie sind daher auch die Grundlage für die Anwendung der Normalverteilung.

Diese drei Definitionen, von denen bisweilen noch Sonderfälle unterschieden werden, sind das elementare Handwerkszeug der Marktforschung ebenso wie der Qualitätsanalyse. Sie sollten also Klausurkandidaten ebenso wie Praktikern, die solche Methoden anwenden, bewußt sein. Statistische Auswertungssysteme wie SPSS legen sie zugrunde und in elektronischen Systemen müssen sie umgesetzt werden, denn Datentypfehler führen zu unbrauchbaren oder zu gar keinen Ergebnissen.

Gauß ohne Schrecken: so funktioniert das Rechnen mit der Normalverteilung (Teil 1-3) | Teil 2-3 | Teil 3-3
Formelsammlung der Betriebswirtschaft

Alter gleich metrisch

Skalen in der Statistik

Merkmalsausprägungen bilden eine Skala ab. Eine Skala ist ein Maßstab zur Messung der Merkmalsausprägungen bei den Untersuchungseinheiten. Dabei unterscheidet man zwischen den folgenden vier Skalen:

  • Nominalskala (nicht metrisch)
  • Ordinalskala (nicht metrisch)
    • Quasi-metrische Ordinalskala
  • Intervallskala (metrisch)
  • Verhältnisskala (metrisch)

Zu beachten ist bei der oberen Auflistung, dass diese hierarchisch erfolgt ist, wobei die Nominalskala in der Hierarchie ganz unten steht und die Verhältnisskala ganz oben. Relevant ist dies, da ein höheres Messniveau jeweils die Eigenschaften der niedrigeren Messniveaus mit einschließt. Je nach Merkmal und Ausprägung kommt eine andere Skala zur Geltung.

Nominalskala

Die Nominalskala findet bei qualitative Merkmale Anwendung, also bei Merkmalen, deren Ausprägungen keine natürliche Reihenfolge bilden, sondern gleichberechtigt nebeneinanderstehen. Dies wäre beispielsweise bei der Religion oder dem Geschlecht der Fall. Ordnet man in der Nominalskala den einzelnen Merkmalsausprägungen Ziffern zu, dann verschlüsselt man diese. Diese Verschlüsselung dient aber lediglich zur Identifikation. Generell stellt diese Skala die geringste Anforderungen an die Merkmalsausprägungen, bietet aber dementsprechend auch nur die geringste Möglichkeiten bei der statistischen Auswertung.

Lageparameter: Modus

Ordinalskala

Bei der Ordinalskala besteht zwischen den Merkmalsausprägungen eine Rangordnung. So lässt sich zwischen den Merkmalsausprägungen eine „größer als“-Relation aufstellen. Besteht eine Ordinalskala lediglich aus ganzzahligen Ordnungsziffern die mit 1 beginnt und eine ununterbrochene Reihenfolge bildet, dann spricht man auch von einer Rangskala. So wäre die Bundesliga-Tabelle beispielsweise eine Rangskala.

Wichtig ist zu verinnerlichen, dass zwar eine Rangordnung mit der Ordinalskala abgebildet werden kann, eine Angabe der Distanz zwischen den einzelnen Rangstufen aber nicht möglich ist.

Lageparameter: Modus, Median

Quasi-metrische Ordinalskala

In der Wissenschaft wird man bei der Durchführung von Studien bzw. Experimenten häufig auf die sogenannte Likert-Skala stoßen. Diese ist offiziell eine Ordinalskala. Die Antwortmöglichkeiten reichen bei der Likertskala von häufig von „stimmt gar nicht zu“ bis „stimmt voll zu“, wobei es insgesamt meist fünf Skalenpunkte gibt. Generell kann man nicht davon ausgehen, dass der Befragte die Abstände der einzelnen Antwortmöglichkeiten als gleich weit entfernt wahrnimmt (äquidistant). Um bei der späteren Auswertung die erhobenen Daten aber dennoch wie intervallskalierte Daten behandeln zu können, greift man zu einem kleinen Trick, in dem man die Skalenpunkte optisch in gleich weiten Abständen anordnet und über die Skalenpunkte eine gleichbleibende Nummerierung durchführt.

Die metrische Skala findet bei quantitativen Merkmalen Anwendung. Die Abstände zwischen den Ausprägungen können also gemessen werden, da es sich bei den Ausprägungen um reelle Zahlen handelt. Dies ist z.B. bei Kinderzahl oder Temperatur der Fall. Die metrische Skala kann man in die Intervallskala und in die Verhältnisskala (auch Ratioskala genannt) differenzieren.

Intervallskala

Bei der Intervallskala ist der Nullpunkt willkürlich festgelegt (z.B. Temperatur: Celsius – Fahrenheit). Daraus folgt, dass man bei der Intervallskala keine Verhältnisse der Merkmalswerte bilden darf. Sprich man darf nicht sagen, dass die eine Merkmalsausprägung ein Vielfaches einer anderen Merkmalsausprägung ist. Eine Messung erfolgt in konstanten Maßeinheiten, Distanzangaben sind damit im Gegensatz zur Ordinalskala möglich.

Lageparameter: Modus, Median Arithmetisches Mittel

Verhältnisskala/Ratioskala

Bei der Verhältnisskala ist der Nullpunkt hingegen fest auf natürliche Weise oder durch Konventionen vorgegeben. Wie auch die Intervallskala sind bei der Verhältnisskala Distanzangaben möglich. Darüber hinaus kann man, wie der Name schon sagt, im Gegensatz zur Intervallskala auch Verhältnisse der Merkmalswerte damit ausdrücken. Die Multiplikation und Division ist also bei diesem Skaleinnievau erlaubt und auch nur bei diesem! Damit besitzt die Verhältnisskala das höchste Skalenniveau. Dennoch ist eine Transformation in niedrige Skalenniveaus jederzeit möglich. Ein Beispiel für eine Verhältnisskala ist die Nennung des Alters, des Nettoeinkommens, des Gewinns ...

Lageparameter: Modus, Median Arithmetisches Mittel, Geometrisches Mittel

Transformation von Skalen

Je nach Skala können unterschiedliche Transformationen angewandt werden. Dabei dürfen die in den Skalenwerten enthaltenen Informationen nicht verändert werden. Nachfolgend eine Auflistung bei welcher Art von Skala welche Transformation möglich ist:

Nominalskala

Es sind symmetrische Transformationen zulässig, bei denen sich lediglich die Klassenbezeichnung ändert (Verschlüsselung). Es sind also alle bijektiven Abbildungen möglich.

Ordinalskala

Es sind streng monotone Transformationen zulässig. D.H. Neben der Bijektivität muss die Ordnung erhalten bleiben, sodass die Abbildung entweder streng monoton steigend oder streng monoton fallend sein muss.

Intervallskala

Es sind lineare Transformationen der folgenden Art zulässig: y = ax + b (a>0) Beispiel: Umrechnung von Fahrenheit in Celsius.

Verhältnisskala

Es sind Ähnlichkeitstransformationen der folgenden Art zulässig: y=ax (x>0). Eine Verschiebung des Nullpunkts ist nicht möglich, da fest vorgegeben! Beispiel: Umrechnung von m in cm

Quelle

  • http://mars.wiwi.hu-berlin.de/mediawiki/teachwiki/index.php/Skalenniveau

Ist Alter metrisch skaliert?

Skala . Eine Variable kann als metrisch (stetig) behandelt werden, wenn ihre Werte geordnete Kategorien mit einer sinnvollen Metrik darstellen, sodass man sinnvolle Aussagen über die Abstände zwischen den Werten machen kann. Metrische Variablen sind beispielsweise Alter (in Jahren) oder Einkommen (in Geldeinheiten).

Welches Skalenniveau ist das Alter?

Beim metrischen Skalenniveau können die Merkmalsausprägungen verglichen und sortiert werden und es können Abstände zwischen den Ausprägungen berechnet werden. Beispiele wären hierfür das Gewicht und das Alter von Untersuchungspersonen.

Ist das Geburtsjahr metrisch?

Intervallskala. Daten, die der Intervallskala zugeordnet sind, sind Daten die man ordnen kann. Der Abstand zwischen den Ziffern ist gleich und messbar. Beispiel: Geburtsjahr.

Wie ist das Alter skaliert?

Mehr noch, man erkennt, dass Person 1 älter ist als Person 2. Wird die Differenz gebildet (60-20), so kann man zudem sagen, dass Person 1 um 40 Jahre älter ist als Person 2. Wird das Verhältnis berechnet (60/20) so erkennt man, dass Person 1 dreimal so alt ist wie Person 2.