Buch unterm Kopfkissen ist ja auch Hirnlos.
Du musst info-CDs laufen lassen.
Ich bin keine Signatur, ich fälsche nur die Geldscheine.
Ich bin noch am überlegen, wie ich dieses Experiment am besten aufziehe. Ich muss ja irgendwie messen, ob der Schlaf beeinflusst wurde - also sollte ich den Stoff vorher nicht kennen und auch nicht vor dem Einschlafen anhören.
Praktisch wären z.B. Vokabeln einer Sprache, die ich nicht kenne und die zeitgesteuert um 03:00 nachts oder so leise aufgesagt werden
Es gibt viele Situationen, in denen man wissen will, welchen Einfluss manche Faktoren auf eine zu untersuchende Größe haben (und ob sie überhaupt einen haben). Beispielsweise könnte man fragen "Ist die Anzahl der Beiträge, die ein User im Forum hat gleich viermal die Anzahl an Tagen, die man im Forum ist + zweimal die Anzahl Freunde, die der User hat?".
Unplausibel scheint das nicht: je länger ein User angemeldet ist, desto mehr Zeit hat er, Beiträge zu schreiben. Wer keine Freunde hat, hat niemanden, mit dem er sich im Forum austauschen will.
Wenn man so etwas weiß, kann man auch Prognosen wagen: schaut man sich einen neuen User an, von dem man nur weiß, wie lange er schon im Forum angemeldet ist und wie viele Freunde er hat, kann man schätzen, wie viele Beiträge er schon haben wird.
Solche Fragestellungen untersucht man oft mit sogenannten Regressionsmodellen. Man versucht, eine Zielgröße [math]y[/math] ("Anzahl Posts") durch Regressoren [math]x_1, x_2, ...[/math] (z.B. "Anzahl Freunde", "Zeit seit Anmeldung") zu erklären und zwar - wie oben beschrieben - linear. Man modelliert das Problem also (bei zwei Regressoren) als
[math]y = b_0 + b_1x_1 + b_2x_2 [/math]
und nicht etwa als [math]y = b_1e^(xb_2)[/math] . Eher wie bei einem Kuchenrezept: 1 Kuchen = 0,5x Salz + 2x Mehl + 4x Eier etc.
Wenn man jetzt [math]n[/math] mal die Zielgröße beobachtet (also im Beispiel [math]n[/math] zufällige User anschaut), kann man versuchen, die [math]b[/math] 's zu schätzen. Ein häufiges Vorgehen, das ich wegen der komischen Mathe-Notation im Forum nicht mathematisch notiere, sondern nur versuche, zu motivieren, ist folgendes:
Man weiß ja, was man beobachtet hat. Man versucht nun die [math]b[/math] 's so zu wählen, dass die Schätzung möglichst gut zu den Beobachtungen passt - oder anders gesagt: dass das, was man schätzen würde, möglichst wenig von dem abweicht, was man tatsächlich hat.
Bei nur einem Regressor kann man das gut graphisch darstellen:
Man würde [math]b[/math] so wählen, dass die Summe über die Abstände (die dünnen roten bzw. blauen Linien) über alle Datenpunkte möglichst klein wird, also die dicke Gerade möglichst gut zwischen den Punkten liegt. Man kann sich das - im graphisch darstellbaren Fall - vorstellen, als ob jede Beobachtung (jeder Punkt) ein Magnet ist und man eine Metallstange dazwischenlegt, die angezogen wird.
Normalerweise betrachtet man die Abstands-Quadrate (daher auch der Name "Kleinste-Quadrate-Schätzer"), weil das zu einem besseren Schätzer führt; die Idee ist aber die gleiche. In gewissen Fällen und, wenn ein linearer Zusammenhang besteht, ist das auch das beste, was man tun kann.
Im Beispiel mit den Forenbeiträgen sieht das bei zehn zufälligen Usern so aus:
Die Hypothese, dass die Anzahl der Freunde einen Einfluss auf den PC hat, würde man übrigens verwerfen
Man kann nun ausgehend vom Modell verschiedene Fragestellungen untersuchen (wie gut passt das Modell? Welche Regressoren erklären es am besten? etc.). Man sollte dabei aber einige Dinge nie vergessen:
- Man stellt nur ein Modell auf. Wie alles in Wirklichkeit zusammenhängt, bildet man nicht zwangsläufig ab.
- Man sollte repräsentative Daten verwenden. Prinzipiell gilt: je mehr und je unterschiedlicher die Daten, desto besser - es bringt nichts, wenn man 5 User anschaut, die alle keine Freunde haben und dann Aussagen darüber zu treffen, ob die Anzahl der Freunde mit der Anzahl der Beiträge korreliert.
- Insbesondere, wenn man sehr viele Einflussgrößen einbauen will, braucht man viele Daten. Will man die Anzahl der Beiträge anhand der Dauer, der Freundeszahl, dem Geschlecht, ob man ein Profilbild hat,... erklären, kommt man mit 5 Usern nicht weit. Deshalb sind Daten heutzutage auch so wertvoll für Unternehmen wie Google etc.
- Die Regressoren sollten möglichst "unabhängig" voneinander sein. Wenn ich z.B. als Regressor 1 "Wie lange ist der User schon dabei?" und als Regressor 2 "Ist der User schon länger als 10 Monate dabei?" nehme, dann hängen die selbst wieder voneinander ab.
- Mit Regressionsmodellen weist man nur Korrelation, nicht zwingend Kausalität nach. Oder, mit böser Zunge formuliert: die Mathematik, die bei Neuronalen Netzen zum Einsatz kommt, ist die gleiche, die sich sicher ist, dass mehr Menschen in den USA sterben, wenn mehr Eis verkauft wird.
Das eigene Nachdenken ersetzen Regressionsmodelle also nicht. Sie verleiten nur allzu gerne dazu, einen "statistisch signifikanten" Zusammenhang nachzuweisen und das dann als Erklärung herzunehmen. Aber das geht dann schon fast wieder in die Philosophie, ob man Dinge lieber verstanden haben möchte oder nicht.
Könntest du diese Zufälligen User nennen?
Ich bin keine Signatur, ich fälsche nur die Geldscheine.
Eventuell versuchen ein Gedicht auswendig zu lernen? Das müsste dann sehr schnell gehen, sollte sich die Theorie vom lernen im Schlaf bestätigen. Ich vermute mal es geht drum Infos aus dem Unterbewusstsein hervorzuholen.
Andererseits kannst du dir auch erotische Geschichten vorlesen lesen und gleich nach dem Aufwachen deine Träume notieren.
Ich bin keine Signatur, ich fälsche nur die Geldscheine.
Monkes Profil ist komisch.
Es werden keine Freunde und auch kein Profilbild angezeigt.
Nicht mal der Platzhalter für beidiges.
Ich bin keine Signatur, ich fälsche nur die Geldscheine.
Doch
Bei mir nicht…
Ich bin keine Signatur, ich fälsche nur die Geldscheine.