Besucherstatistik (November 2021)

Ich werde immer mal wieder gefragt, wie viele Besucher ich auf dieser Webseite habe. Ich weiß es nicht so recht. Mir ist die Privatsphäre meiner Besucher*innen wichtig. Also nicht so wie das immer in den Cookie-Bannern steht, direkt bevor man abnicken soll, dass man alle Cookies von Drittanbietern akzeptiert. Ich habe hier auf der Webseite weder Google Analytics, noch Matomo. Von daher bleibt mir nur das Log des Webhosters, und dort sind die IP-Adressen auch alle durch einen Standardwert ersetzt. Ich kann also maximal eine Höchstgrenze für die Seitenaufrufe abschätzen.

Vom Hoster bekomme ich die Logs auch nur für grob zwei Wochen, mehr liegt dort nicht auf dem FTP-Server. Diese Logs habe ich:

Datei Von Bis
web.log-20211107.gz 31.10.2021 07.11.2021
web.log-20211114.gz 07.11.2021 14.11.2021
web.log 14.11.2021 16.11.2021

Lesen kann man die zum Beispiel mit GoAccess einlesen und sich dann anschauen.

zcat web.log-*.gz | goaccess --log-format=COMBINED

Ich betrachte den Zeitraum von zwei Wochen vom 31.10.2021 bis 14.11.2021. Dabei gab es 68898 Anfragen, die auf 3571 eindeutige Benutzer zurückgeführt werden.

Pro Tag sind das zwischen 3500 und 8000 Zugriffen auf die Seite:

Zugriffe     h% Bes.     v%   Tx. Menge Daten
 -------- ------ ---- ------ ----------- ----
      299  0.43%   38  1.06%   52.77 MiB 14/Nov/2021 ||
     5948  8.63%  335  9.38%    2.40 GiB 13/Nov/2021 ||||||||||||||||||||||||||||||||||||||||||||||
     3517  5.10%  195  5.46%    1.07 GiB 12/Nov/2021 |||||||||||||||||||||||||||
     4404  6.39%  260  7.28%    1.60 GiB 11/Nov/2021 ||||||||||||||||||||||||||||||||||
     4683  6.80%  215  6.02%    1.98 GiB 10/Nov/2021 ||||||||||||||||||||||||||||||||||||
     4874  7.07%  255  7.14%    2.18 GiB 09/Nov/2021 ||||||||||||||||||||||||||||||||||||||
     8255 11.98%  340  9.52%    2.90 GiB 08/Nov/2021 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
     5893  8.55%  317  8.88%    2.19 GiB 07/Nov/2021 ||||||||||||||||||||||||||||||||||||||||||||||
     4530  6.57%  248  6.94%    2.00 GiB 06/Nov/2021 |||||||||||||||||||||||||||||||||||
     4165  6.05%  359 10.05%    1.31 GiB 05/Nov/2021 ||||||||||||||||||||||||||||||||
     5804  8.42%  239  6.69%    2.18 GiB 04/Nov/2021 |||||||||||||||||||||||||||||||||||||||||||||
     4217  6.12%  206  5.77%    1.69 GiB 03/Nov/2021 |||||||||||||||||||||||||||||||||
     4815  6.99%  195  5.46%    1.46 GiB 02/Nov/2021 |||||||||||||||||||||||||||||||||||||
     4314  6.26%  204  5.71%    1.93 GiB 01/Nov/2021 |||||||||||||||||||||||||||||||||
     3180  4.62%  165  4.62% 1017.05 MiB 31/Okt/2021 |||||||||||||||||||||||||

Interessant ist, welche Dateien wie häufig angefragt werden. Hier die am häufigsten angefragten Pfade:

Zugriffe     h% Bes.     v%   Tx. Menge Meth Prot     Daten
 -------- ------ ---- ------ ----------- ---- -------- ----
     2425  3.52%  804 22.51%   41.24 MiB GET  HTTP/1.1 /
     2090  3.03%  238  6.66%   99.77 MiB GET  HTTP/1.1 /rss.xml
      952  1.38%  397 11.12%    6.07 MiB GET  HTTP/1.1 /pages/studies/
      436  0.63%  251  7.03%    3.66 MiB GET  HTTP/1.1 /posts/radweg-mit-treppe-in-bendorf/
      392  0.57%   80  2.24%   10.65 MiB GET  HTTP/1.1 /categories/cat_computer.html
      368  0.53%   19  0.53%    6.14 MiB GET  HTTP/1.1 /categories/
      362  0.53%  186  5.21%    2.54 MiB GET  HTTP/1.1 /pages/physik311/
      347  0.50%  189  5.29%    5.24 MiB GET  HTTP/1.1 /posts/anlagezeitraum-beim-msci-world/
      297  0.43%  177  4.96%    2.78 MiB GET  HTTP/1.1 /posts/clean-architecture-and-social-networks/
      289  0.42%  149  4.17%    1.62 MiB GET  HTTP/1.1 /pages/physik212/
      274  0.40%  221  6.19%    2.69 MiB GET  HTTP/1.1 /posts/der-wahnsinn-mit-einem-dhl-paket/
      179  0.26%  115  3.22%    4.72 MiB GET  HTTP/1.1 /categories/cat_traffic.html
      175  0.25%  120  3.36%    3.95 MiB GET  HTTP/1.1 /categories/cat_science.html
      158  0.23%   85  2.38%    6.22 MiB GET  HTTP/1.1 /posts/clean-architecture-for-vigilant-crypto-snatch/
      128  0.19%   93  2.60%    1.39 MiB GET  HTTP/1.1 /posts/garmin-virb-elite/
      116  0.17%   70  1.96%  901.64 KiB GET  HTTP/1.1 /pages/physik321/
      115  0.17%   88  2.46%    1.23 MiB GET  HTTP/1.1 /posts/vergleich-der-vbl-modelle/
      115  0.17%   87  2.44%    1.19 MiB GET  HTTP/1.1 /posts/fachaufsichtsbeschwerde-nach-dienstaufsichtsbeschwerde/
      107  0.16%   47  1.32%  989.09 KiB GET  HTTP/1.1 /posts/autozwang-im-alter/
      102  0.15%   72  2.02%  619.52 KiB GET  HTTP/1.1 /pages/physik412/
       99  0.14%   67  1.88%    8.27 MiB GET  HTTP/1.1 /posts/c-anti-patterns/
       98  0.14%   61  1.71%  685.78 KiB GET  HTTP/1.1 /pages/physics606/
       97  0.14%   67  1.88%  847.51 KiB GET  HTTP/1.1 /posts/fehlendes-radwegszeichen-in-bulgenauel/
       95  0.14%   67  1.88%  741.17 KiB GET  HTTP/1.1 /posts/fahrrad-umleitung-plotzlich-einbahnstrasse/
       94  0.14%   75  2.10%  672.57 KiB GET  HTTP/1.1 /posts/doppelte-radwegsfuhrung-in-lohmar/
       90  0.13%   73  2.04%    2.76 MiB GET  HTTP/1.1 /pages/portfolio/
       90  0.13%   34  0.95%  879.43 KiB GET  HTTP/1.1 /posts/busse-und-fahrbahnparken/

Man kann sehen, dass der RSS-Feed so häufig aufgerufen wird, wie die Startseite selbst. Wahrscheinlich holen die meisten Browser den automatisch ab.

Die Seite mit den Studiumsunterlagen ist auch Jahre nach meinem Studium noch sehr beliebt, die wurde 950 Mal in 14 Tagen aufgerufen. Weiter unten sieht man, dass die Module 311 (Experimentalphysik 3), 212 (Laborpraktikum 2), 321 (Theorie 2) und 412 (Laborpraktikum 4) und 606 (Advanced Quantum Theory) die beliebtesten sind. Das sind alles Module aus dem Wintersemester, das jetzt seit Oktober läuft. Das ist plausibel.

Dann sind dort Artikel, die ich erst recht kürzlich veröffentlicht hatte. Der Artikel bendorf-radweg-mit-treppe ist seit 2021-11-07 online, also ungefähr 6 Tage innerhalb der Analyse. Der hat 436 Aufrufe bekommen, darunter auch die Crawler der Suchmaschinen.

Interessant sind aber auch Artikel, die schon deutlich älter sind. Zum Beispiel ist dhl-paket-wahnsinn schon grob ein Jahr alt. Den findet man wahrscheinlich per Suchmaschine, wenn man sich über DHL ärgert. Der Artikel vergleich-vbl-modelle ist schon vier Jahre alt, jedoch relevant für Doktorand*innen, die jetzt im Wintersemester mit ihrer Promotion angefangen haben und sich über die Zusatzversorgung informieren wollen. Und cpp-antipatterns ist fünf Jahre alt, aber anscheinend noch ziemlich relevant. Das freut mich.

Dann sieht man dort noch GET-Parameter, die wahrscheinlich von Twitter hinzugefügt worden sind: /posts/kurzer-test-der-cyclic-fly12-ce/?pk_campaign=feed&pk_kwd=kurzer-test-der-cyclic-fly12-ce. Da ich keine Analytics nutze, bringt mir das nichts. Aber das waren auch immerhin 12 Nutzer, und der Artikel war im betrachteten Bereich keinen ganzen Tag online.

Im Bereich der nicht gefundenen URLs sieht man einige klare Tests auf Sicherheitslücken. So wird regelmäßig /wp-login.php oder /vendor/phpunit/phpunit/src/Util/PHP/eval-stdin.php angefragt. Merkwürdig sind aber Anfragen auf alte URLs, die ich damals noch mit Sphinx als HTML-Generator hatte. So etwas wie /_downloads/Bachelorarbeit.pdf, mit alten Versionen von Sphinx. Später kam noch eine ID dazu, auch diese URLs werden weiterhin probiert, zum Beispiel /_downloads/d996e5c01dedeaca173154a49358187b/geometry-12-handed_in.pdf. Andere Kategorien werden anscheinend komplett vermisst, wie /tanzen/index.html. Manche sind aber auch Hinweise auf Fehler in der Webseite: /posts/data-science-mit-wahl-o-mat/altair-viz.github.io/, da fehlte das https://. Das habe ich ausgebessert.

Bei den Betriebssystemen hat Linux einen erstaunlich großen Anteil. Aber gut, bei der Zielgruppe auch wenig verwunderlich. Diese Information wird mit freiwillig geschickt, im User-Agent.

Zugriffe     h% Bes.     v%  Tx. Menge Daten
 -------- ------ ---- ------ ---------- ----
    23873 34.65%  782 21.90%  11.10 GiB Windows   ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
     9761 14.17%  729 20.41%   4.49 GiB Android   |||||||||||||||||||||||||||
     9629 13.98%  405 11.34%   3.41 GiB Linux     |||||||||||||||||||||||||||
     9474 13.75%  673 18.85%   1.22 GiB Unknown   ||||||||||||||||||||||||||
     7440 10.80%  645 18.06%   3.18 GiB Macintosh |||||||||||||||||||||
     4218  6.12%   68  1.90% 624.13 MiB Unix-like ||||||||||||
     4116  5.97%  202  5.66%   1.84 GiB iOS       |||||||||||

Das kann man noch nach Versionen aufteilen. Man sieht, dass nur Windows 10 wirklich relevant ist. Die anderen Versionen kommen nicht mehr vor. Das bedeutet, dass die Besucher keine Altlasten mehr haben, was gut ist. Bei Linux ist wenig überraschend Ubuntu recht groß, dann kommt Fedora. Besorgniserregend sind die wenigen Besuche von Ubuntu/7.10 oder Ubuntu/dapper-security. Das sind uralte Versionen, das erste ist ursprünglich von 2007.

In den verweisenden Seiten findet man hauptsächlich meine eigene Seite. Das bedeutet, dass die Nutzer viele Bilder und PDF-Dokumente von der Seite laden, und sie nicht direkt nach außen verlinkt werden. Dann kommt Google. Twitter ist auch nicht ganz ohne. Es ist jedoch etwas schwer herauszufinden, woher die Leute exakt kommen, da die Verweise inzwischen auch schon unterdrückt werden. Besonders lustig war ein Forumsbeitrag über GPS-App, wo jemand auf meinem Blog verlinkt hat. Dort habe ich mich einmal angemeldet und noch etwas mehr geschrieben.

Insgesamt habe ich schon den Eindruck, dass die Artikel häufig gelesen werden. Ich bekomme auch immer wieder E-Mails mit Rückmeldungen. So macht das Bloggen jedenfalls viel Spaß. Danke dafür!