Einträge über Science

I am a physicist, so naturally I also have things to share in this area. Here you can find articles about physics, but also about mathematics and statistics. Sometimes I also look at financial matters, these sometimes end up in this category.


Graph of Game of Life States

Conway's Game of Life is a mathematical toy which describes a transition of a grid-world over time. As one can read on the Wikipedia article, there are certain structures which are either stable or form short cycles. I wanted to see whether these structures could be found in a systematic way.

So I have just tried a brute-force way to generate states, and see how they evolve. This builds a graph, and that graph can be decomposed into subgraphs. The subgraph that is connected to the empty world is the not very interesting. So I show some of the ones which are not connected to the empty world.

The simplest subgraph is one with only a single node, which is stable:

Weiterlesen…

Data Science mit Wahl-o-Mat

Als ich mal den Wahl-o-Mat ausprobiert hatte und mir danach die Stellungnahmen der einzelnen Parteien angeschaut habe, so wirkten einige Parteien ziemlich redundant. So fragte ich mich, ob man anhand der Fragen wirklich alle Parteien ausdifferenzieren kann, oder ob die teilweise fast das gleiche geantwortet hatten. Also habe ich die Positionen der Parteien vom Wahl-o-Mat genommen und mit $-1$, $0$ und $+1$ kodiert als Tabelle gespeichert.

Im weiteren habe ich dann die Korrelation zwischen Parteien und den Fragen untersucht. Mit Hilfe einer Hauptkomponentenanalyse kann man dann auch noch Richtungen finden, anhand derer sich die Parteien möglichst prägnant einsortieren lassen können. Ich suche noch nach Clustern und untersuche auch die Fragen noch ein bisschen. Die Ergebnisse sind in interaktiven Grafiken dargestellt.

Weiterlesen…

Graphentheorie in On Tour

Die Tage habe ich das Spiel On Tour gespielt. Man soll eine Band-Tournee durch die USA planen. Dabei hat man als Spielbrett diese Landkarte. In die einzelnen Staaten trägt man dann gewürfelte Zahlen ein. Man würfelt mit zwei W10 und setzt die beiden Ziffern in beiden Kombinationen zusammen. Würfelt man 1 und 5, so muss man die 15 und 51 eintragen. Es ist noch ein wenig eingeschränkt, wohin man diese eintragen darf.

Sind alle Felder mit Zahlen voll, so muss man die Städte verbinden. Dabei darf man jeden Staat nur maximal einmal besuchen, und man darf nur Zahlen verbinden, die nicht absteigend sind (gleich ist okay). In meinem Kopf verschwindet die Landkarte, und es bleibt nur noch ein ungerichteter Graph übrig, der so aussieht:

Weiterlesen…

Nachbarn bei Tridom

Tridom ist ein klassisches Spiel, bei dem man letztlich Domino mit Dreiecken spielt. Man hat eine gewisse Anzahl Steine auf der Hand, die man anlegen muss. Der erste Spieler, der keine Steine mehr auf der Hand hat, beendet das Spiel. Man bekommt beim Legen des Steines die Summe der Ziffern als Punkte gutgeschrieben; der Spieler mit den meisten Punkten gewinnt.

Es gibt alle Kombinationen der Zahlen von 0 bis 5 auf den Ecken. Es gibt 6 Steine, die überall die gleichen Zahlen haben. Dann gibt es 6 × 5 = 30 Steine, die zweimal die gleiche Zahl haben. Und dann gibt es noch 6 × 5 × 4 / 3 = 40 Steine, die drei unterschiedliche Zahlen haben, insgesamt also 76.

Weiterlesen…

Faktor-V-Mutation und SARS-CoV-2-Impfung

Es gab viel Wirbel um die Sinusvenenthrombosen (SVT), die durch die SARS-CoV-2-Impfungen ausgelöst worden sind. Dabei war der Impfstoff von AstraZeneca besonders auffällig. Da die jüngeren Leute ein eher geringes Risiko haben, mit COVID-19 in die Intensivstation zu müssen, hatte man daher den Impfstoff von AstraZeneca eher für die älteren Leute vorgesehen, weil dort die Risikoabwägung (Thrombose gegen Intensivstation) wieder aufging. Die jüngeren Leute sollten lieber auf einen mRNA-Impfstoff warten.

Nun wollten dann die älteren Leute auch lieber mRNA-Impfstoffe und haben die Vektor-Impfstoffe abgelehnt. Mir war das eigentlich egal, ich hätte jeden zugelassenen Impfstoff gerne genommen. Aber das war gar nicht so einfach. Ich hatte eine Hausarztpraxis in Niederkassel gefunden, die auch für externe Impfungen mit AstraZeneca-Impfstoff angeboten haben. Mir wollten sie das jedoch nicht geben, aufgrund meiner heterozygoten Faktor-V-Leiden-Mutation.

Weiterlesen…

Counting Passing Cars

Using an audio recording of the cars passing by my window, I try to extract the number of cars that have passed by. I introduce the waveform and spectrum, construct a filter bank, find peaks. In a second part I play around with dimensionality reduction algorithms.

I have a street in front of my condo, and cars regularly drive by. I was wondering how much traffic that street has. Sometimes I read something like “street with 10.000 cars per day” and wonder how much that really is. To get a sense of proportional I wanted to count the cars on my street.

Just taking a flipchart, pencil, lawn chair and counting them would be possible, but totally labor intensive. And I would lack the exact timing of each car, I couldn't see whether it is Poisson distributed. So there are a lot of bad reasons to do this. I somehow have to make a computer count this. For this I would need a data stream.

Weiterlesen…

Reinforcement Learning with Frozen Lake

I have tried out reinforcement learning with the frozen lake example. In this post I will introduce the concept of Q-learning, the TensorFlow Agents library, the Frozen Lake game environment and how I put it all together.

When I play board games, I cannot stop myself from seeing the abstract rules, building a decision tree in my head and wondering how one could play an optimal round. This has led me to write a couple articles about board games. The one about Scythe features an implementation of parts of the game and the attempt to find a good game using just beam search. That was a first step, but I want to do better.

Weiterlesen…

Hysterese mit Inzidenz

Wir hangeln uns ja aktuell von einem »Lockdown« zum nächsten. Dazwischen dann mit Lockerungen und dann wieder einem »Lockdown«. Auf Twitter habe ich was schönes gesehen, das wollte ich hier einmal reproduzieren. Wenn man eine feste Grenze für die Inzidenz hat, so wie aktuell die 100, dann führt das nicht zu einem Ende vom Lockdown.

In einem ganz einfachen Modell habe ich bei einer Inzidenz von 90 gestartet und eine Steigerung von 10 % jeden Tag angenommen, die es keinen »Lockdown« gibt. Und sobald das Mittel der letzten drei Tage über 100 ist, kommt der »Lockdown« und die Inzidenz nimmt jeden Tag um 10 % ab. Damit erhält man für die nächsten 30 Tage dann diesen Verlauf:

Wir gehen also zwischen »Lockdown« und Lockerungen hin und her, und es kommt alles zyklisch. Mit dieser Regelung alleine wird man die Pandemie nicht regulieren können.

Weiterlesen…

Lacking Uncertainty Estimations in Natural Language Processing Papers

My university background is physics, which is an empirical science. All measurements or derived quantities must be quoted with an error estimate. This should ideally include both a statistical and a systematic error. If you take a look at the paper from my thesis, you will find this table:

It contains the comparison of a certain quantity (pion scattering length) from various other publications and our result. There are uncertainties given, either as a combined value or as separate statistical and systematic ones. One result by the ETMC even has asymmetric systematic errors quotes. You can look at these numbers and figure out whether the result from that work lies within the error budget of the other works. The raw table isn't as meaningful as a plot, but you could create a plot from the table. And one can see that our result has a one standard deviation confidence interval of $[-0.0567, -0.0395]$, so it easily encompasses all previous work. Also it has the largest error of all results, so it is the least precise addition to the field. This is okay as it was just an auxiliary result and we weren't aiming for precision there.

In my new field, natural language processing (NLP), I cannot say the same thing. There are no error estimates whatsoever! And it really annoys me, you cannot really derive any conclusion from the data. Take for instance the paper on BERT. They show a table where they compare two variants of the BERT model with other language models in various tasks:

Weiterlesen…

Energieeffizienz-Label

In Deutschland gibt es jetzt ein neues Energielabel (siehe tagesschau.de). Das löst das alte Label ab, hat aber letztlich die gleichen Kategorien wie vorher.

Als die damals das Label eingeführt hatten, fand ich das wirklich großartig. So können Verbraucher recht einfach sehen, wie effizient das Gerät mit Ressourcen umgeht. Zugleich sind die Hersteller dann im Zugzwang ihre Geräte effizienter als die der Konkurrenz zu machen, wenn sie weiter verkaufen wollen.

In der Implementierung haben sie dann allerdings sehr kurzfristig agiert, genauso wie die Grafikkartenhersteller. Jenen fällt nämlich immer nach 10 Generationen auf, dass ihr Nummernschema zu Ende ist. So habe ich bei NVIDIA erlebt, wie sie 8x00 und dann 9x00 hatten. Sie haben ja vier Ziffern, aber nutzen nur die erste für die Generation, und die zweite für die Abstufung. Die restlichen zwei danach sind sinnlose Nullen. Und danach haben sie dann die 1x0 rausgebracht, die 2x0 bis zur 9x0. Ja, da war es dann wieder zuende. Und dann haben sie die 10x0 rausgebracht. Naiv hoffte ich auf zweistellige Generationen, aber sie haben die 20x0 rausgebracht. Aktuell sind wir bei 30x0, also in ein paar Jahren haben wir dann 90x0 und NVIDIA wird wieder überrascht sein.

Weiterlesen…