Statistik ist kein Hexenwerk!

Ich glaube nur der Statistik, die ich selbst gefälscht habe …

Sir Winston Churchill

An dieser Aussage erkennt man die allgemeine Skepsis gegenüber solchen Datenanalysen. Die Ursache für Churchills Kritik liegt aber weniger in der mathematischen Behandlung als vielmehr bereits in der Art der Erhebung der Grunddaten begründet. So kann durch z.B. die Auswahl der Stichprobe bei einer Befragung absichtlich oder unabsichtlich eine Beinflussung des Ergebnisses erfolgen.

Bei der folgenden Auswertung der gesammelten Daten besteht eine Quelle an Unsicherheit hauptsächlich bei nichtmetrischen Merkmalen. Bei sogenannten variablen Grössen wird normalerweise bereits bei der Messung*** und Aufzeichnung nur ein geringer Manipulationsspielraum zugelassen.

Bei attributiven (nichtmetrischen, beschreibenden) Grössen, die man zuerst kategorisieren muss, um sie in eine Zählstatistik, zu wandeln, damit man daraus eine Verteilungsfunktion ableiten kann, stellt sich dieses Problem u.U. gleich zweimal: Einmal bei der Erfassung und dann bei der Einteilung in Kategorien (z.B. Klassenbreiten).

Es gibt zwar Anwendungs-Regeln für solche Verfahren, aber ähnlich wie bei Messverfahren, die von Personen*** durchgeführt werden, der Einfluss des Analysten ist trotzdem nicht auszuschliessen. Daher mus hier besondere Achtsamkeit herrschen, um nicht Artefakten aufzusitzen.

Für Interessierte:

Ich biete Statistik-Kurse besonders für Ingenieure und Techniker in der Produktion und natürlich im Qualitätsmanagement an.

***normalerweise: d.h. bei durch Messmaschinen und vom Prüfer unabhängig gewonnene Daten. Hier reicht ein Nachweis der Kalibrierung und Maschinenfähigkeit der Messapparatur. Anderfalls muss die Unsicherheit der Messgrösse durch eine geeignete MessSystemAnalyse (MSA), nach z.B. GRR, zuvor überprüft und immer wieder verifiziert werden.

Mathemagie:
Sieb des Eratosthenes

erathostene1s Primzahlsieb oder Lambdoma ?
Sierpinski Enigma ©scrano 2014

Grundprinzip

Das Sieb des Eratosthenes basiert auf der Eigenschaft, dass jede natürliche Zahl entweder eine Primzahl oder das Vielfache einer solchen ist. Zunächst werden alle Natürlichen Zahlen des gewünschten Intervalls in einer Liste aufgeschrieben:

Nun werden, bei 2 beginnend, alle Vielfachen der jeweils niedrigsten Zahl aus der Liste gestrichen (Diese können ja keine Primzahlen sein, da sie Vielfache der niedrigsten Zahl sind): Hat man dieses Verfahren oft genug durchgeführt, so bleiben am Ende nur noch die Primzahlen übrig (diese werden niemals gestrichen, da sie nicht vielfache irgendeiner kleineren Zahl sind):

zzzz Prinzip des Primzahl-Siebs.

Optimierung des Prinzips

Dieses Verfahren lässt sich jedoch noch deutlich optimieren, beachtet man folgende zwei Regeln:

  • Die kleinste Zahl, die als Vielfaches einer Primzahl gestrichen wird ist ihr Quadrat. Alle niedrigeren Vielfache sind bereits gestrichen, da sie auch Vielfache einer kleineren Primzahl sind. Die größte Zahl deren Vielfache noch gestrichen werden müssen ist die Wurzel der höchsten Zahl des Intervalls, in unserem Beispiel:
  • Damit sind wir in diesem Beispiel, dem Intervall von 2 bis 50 bereits nach 4 Schritten fertig! Es sind nur die Vielfachen von 2, 3, 5 und 7 zu streichen.

Einen Artikel über die Verwendung des Pythagoräischen Lambdoma, das eine Verwandtschaft mit diesem Verfahren aufweist als Primzahlsieb, werde ich demnächst einstellen. Hierzu fand ich einen interessanten Beitrag auf der Seite „tetraktys.de„, welcher diese Idee verfolgt. Auch Tetraktys und Lambdoma allgemein, ihr Bezug zur Musiktheorie und Harmonik, werden noch Gegenstand einiger Posts sein.