Beiträge mit tag "Internet

Not so weekly rant: Falsche Videovorschläge bei Youtube

0

Wann immer man sich bei Youtube ein Video ansieht, empfiehlt ein ausgeklügelter Algorithmus in der Seitenleiste rechts themenverwandte Videos. Das ist wirklich sehr nützlich, vor allem dann, wenn es zu einem Video mehrere Teile gibt, die man hintereinander anschauen sollte. So braucht man in den wirklich seltensten Fällen die Suchfunktion. Man kann sich wunderbar von Video zu Video klicken. So ein Algorithmus muss aus vielen einzelnen Faktoren berechnen, welche Videos denn eigentlich für einen Vorschlag in Frage kommen, schließlich will ich nichts über Rennwagen sehen, wenn ich gerade Tieraufnahmen von Eisbären betrachte. Wichtig sind Faktoren, anhand derer man eine Themenverwandtschaft feststellen kann.

Welche Faktoren würden hier Sinn ergeben? Erstens könnte Youtube schauen, ob es Videos mit möglichst vielen gleichen Tags oder zumindest themenverwandten Tags gibt. Zweitens könnte man prüfen, ob es in der Beschreibung Ähnlichkeiten gibt, bestimmte Stichwörter könnte man herauspicken und eine Übereinstimmung feststellen. Drittens und ebenfalls naheliegend ist das Vergleichen der Titel der Videos. Möglicherweise gibts ja zu diesem Video mehrere Teile, die man im System gruppieren sollte. Viertens wäre es außerdem logisch, nachzuschauen, ob derselbe Uploader vielleicht noch andere Videos hochgeladen hat, die dasselbe Thema haben. Soll ja in der Tat recht häufig vorkommen.

Ein Beispiel: Wenn ich mir also ein Video über Basketball anschaue, das „Basketball-Crap 2008“ heißt, es in der Beschreibung um Basketball und Crap geht, und auch die Tags alle irgendwas mit Basketball und Crap zu tun haben, dann wäre es doch eigentlich nur sinnvoll, wenn Youtube mir daneben andere Basketball-Videos empfiehlt, im Idealfall z.B. ganz oben auch die Videos „Basketball-Crap 2009“ und „Basketball-Crap 2010“ vom Youtube-Benutzer „basketballheinz0815“.

Geht Youtube so vor? Irgendwie nicht so wirklich. Youtube geht nämlich als allererstes danach, ob das Video viele Aufrufe hat. Wie wir alle wissen, ist natürlich allein die Zahl der Clicks ein brauchbares Maß für die Qualität eines Videos. Folglich muss ein Video mit sehr wenigen Aufrufen ziemlich scheiße sein, und so behandelt Youtube das Video auch: Es wird nämlich erst gar nicht empfohlen. Solange ein Video nicht beliebt genug ist, ist dem System völlig egal, ob die Tags, die Beschreibung und sogar der Titel weitestgehend identisch sind.

So verwundert es also nicht, dass ich bei jedem der inzwischen zehn hochgeladenen Videos über alte Songs der Gruppe „Gigas“ daneben meistens kein einziges anderes Gigas-Video empfohlen bekomme. Empfohlen werden mir Videos über Leguane, Final Fantasy, MegaMan Battle Network, Digimon, Resident Evil und viele weitere lustige Dinge, die weder was mit Gigas, noch mit Trance, noch überhaupt irgendwas mit Musik zu tun haben. Die Tags sind zu 99% identisch, die Beschreibung ist zu 99% identisch, der Titel ist zur Hälfte der gleiche. Wieso zeigt Youtube mir diese Videos nicht in der Seitenleiste an, obwohl sie ganz offensichtlich dazugehören? Wieso meint Youtube, mir irgendeinen Müll empfehlen zu dürfen, nur weil dieser Müll beliebter ist als die wirklich passenden Videos?

Bei der Suchfunktion derselbe Mist. Videos mit wenigen Clicks werden extrem stiefmütterlich behandelt und vom System so lange wie möglich versteckt. Sucht man nach „Gigas“ und „Trance“, bekommt man alle Ergebnisse, die mit „Giga“ (ohne S) und „Trance“ zu tun haben. Erst das neunte(!) Suchergebnis beinhaltet überhaupt beide Suchbegriffe. Ist nicht das wichtigste Kriterium für einen Treffer, dass die gesuchten Begriffe im Zusammenhang mit dem Video genannt werden? Nicht bei Youtube!

Zurück in die Vergangenheit mit Portal 2

2

Vor nicht allzu langer Zeit bei einem Youtube-Besuch aufgefallen. Wer findet den Fehler?

Auge um Auge mit GEMA & Co

2

Dieses Video ist in deinem Land nicht verfügbar. Das tut uns leid.“ – Alder, deine Mudder ist in deinem Land nicht verfügbar. Was soll der Mist? Wieso darf ich das Video nicht sehen, während andere es dürfen?

Ich bin es leid, immer diese lächerliche geheuchelte Entschuldigung zu lesen, wenn ich mal ein bestimmtes Musikvideo bei Youtube sehen will, wo die Kollegen aus Österreich und der Schweiz aber keine Schwierigkeiten haben. Am Ende bleibt mir nur die Nutzung eines Proxys oder eines anderen Videoportals. Mal im Ernst, das ist doch kein Zustand. Wo soll denn das hinführen?

Auf der Seite bustallmajors.com wird jetzt auf spaßige Art und Weise mit dem Problem umgegangen: Wenn die mir den Zugriff auf ihre Musikvideos sperren, dann sperre ich denen ab sofort den Zugriff auf meine Webseite. Ein kleines Skript macht das möglich, das bereits fertig aus der Dose kommt und nur noch eingebunden werden muss. Ich habe das Skript jetzt auch auf SuccessDenied.com integriert, kann es aber natürlich leider nicht testen. Die Aktion wird sowieso umso witziger, je mehr Leute sich daran beteiligen. Dass sich dadurch etwas ändert, ist zwar sehr zweifelhaft, aber ich finde die Idee trotzdem gut.

Also wenn ihr die Idee unterstützenswert findet, denkt doch kurz darüber nach, das Skript vielleicht auch bei euch einzubinden. Der Quellcode ist leicht verständlich und schadet nicht. Geblockt werden dadurch große Plattenfirmen wie Warner, Sony Music Entertainment, EMI und Universal, sowie natürlich die GEMA.

Ich erkläre den Video-Blockern jedenfalls mal den Krieg. Achja, wenn ihr die gesperrten Youtube-Videos trotzdem anschauen wollt, probierts mal damit: HideMyAss und GoFB

Nachtrag vom 10.03.: Offenbar ist das Skript nicht besonders ausgereift und es empfiehlt sich derzeit nicht, dieses zu verwenden. Da mit jedem Webseitenbesuch durch das Bustallmajors-Skript eine WHOIS-Anfrage gestartet wird, kann das nicht nur die eigene Serverlast erhöhen, sondern auch die WHOIS-Server mit Anfragen überschwemmen. Irgendwie dachte ich mir sowas gestern beim Betrachten des Quellcodes noch.

Nachtrag zum Deppenleerzeichen

2

Eigentlich wollte ich heute einen kurzen Artikel über ein von mir favorisiertes Programm schreiben, aber nachdem ich mir die deutschen Texte der Webseite durchgelesen habe, überkam mich ein spontaner Brechreiz, ausgelöst durch minderwertige Rechtschreibung. Ich möchte keine Namen nennen, da das Problem dort wirklich so zahlreich vertreten ist, dass ich alle Hoffnung aufgegeben habe. Der Autor dieser deutschen Texte möge bitte erst einmal Deutsch lernen, bevor er anfängt Texte in dieser Sprache zu veröffentlichen.

Einigen Zuschriften und Kommentaren aus dem Freundeskreis nach zu urteilen, gibt es scheinbar Verwirrung was das sogenannte Deppenleerzeichen betrifft, die ich hiermit aus der Welt schaffen möchte. Ich bin nicht Bastian Sick und ich reite auch auf der deutschen Sprache bei weitem nicht so elitär herum wie er, aber es gibt doch einige Dinge, die mir tatsächlich furchtbaren Augenkrebs verpassen. Sprachen unterliegen ja bekanntlich einem ständigen Wandel, hauptsächlich weil der Duden irgendwann einknickt, wenn z.B. Millionen Deutsche das Wort „Spontaneität“ nicht richtig schreiben können (Tatsache!). Dadurch wird dann eben das theoretisch falsche „Spontanität“ nachträglich als zulässig definiert, damit es nicht aussieht als liefen in Deutschland nur Analphabeten herum. Case closed.

Um zum Deppenleerzeichen zurückzukommen, möchte ich ein Beispiel anbringen: „I left my car keys on the kitchen table.“ – Ein englischer Satz mit den beiden Substantiven „car keys“ und „kitchen table„. Im Englischen ist das so. Das schreibt man so. „carkeys“ und „kitchentable“ würde zwar verstanden werden, sieht aber scheiße aus und ist vermutlich falsch, ich weiß es aber nicht genau. Was ich allerdings genau weiß, ist, dass deutsche Wörter exakt so gebildet werden. Bei uns funktioniert das eben so. Bei uns heißen diese Dinge „Autoschlüssel“ und „Küchentisch„, nicht aber „Auto Schlüssel“ und „Küchen Tisch„. Kommt damit klar.

Es gibt keine „Premium Netzwerke„, keine „Hardware Anforderungen„, keine „Online Zeiten„, keine „Savegame Funktion“ und schon gar keinen „Internet Anbieter„. Alle diese Dinge schreibt man entweder zusammen, oder – falls es keine so starke Bindung zwischen den einzelnen Wörtern gibt (lies: es dämlich aussieht) – zumindest mit einem Bindestrich. Auch wenn das resultierende Wort viel zu lang wäre, würde ich wohl einen Bindestrich einsetzen. „Premium-Netzwerke“ würde ich beispielsweise schreiben und dafür „Hardwareanforderungen„, aber keinesfalls irgendeines davon getrennt. Das kann nicht so schwer zu verstehen sein.

Gegen einen Wandel der Sprache hab ich ja nichts einzuwenden, aber doch bitte nicht so dämlich. An manchen Stellen sollte man doch zumindest versuchen, sich der Sprache anzupassen, bevor man die Sprache zugunsten der eigenen Dummheit anpasst. Es gibt so einige Webseiten, da wimmelt es nur so von Deppenleerzeichen, entweder weil dort das Durchschnittsalter der Besucher etwa bei 14, oder der durchschnittliche IQ bei unter 70 liegt. Nennt mich Weltverbesserer, aber ich finds zum Kotzen. Schreib dich nicht ab, lern lesen und schreiben.

Success Denied Symbol

Mitgezwitschert

0

Wer das hier liest, hat es vermutlich schon entdeckt: Ich habe seit gestern einen eigenen Account bei Twitter. Das widerspricht zwar irgendwie allem was ich bislang so über Microblogging propagiert habe, aber offenbar kann man sich als Einzelner diesem Web 2.0-Zwang kaum widersetzen. Als Blogger schon dreimal nicht. Facebook, Twitter, Flattr, Flickr, Tumblr, Social Bookmarks, Steam, Myspace … überall muss man heute dabei sein, sonst hat man keinen Namen. Keine Ahnung ob ich das gut finden soll, aber ich gehe langsam Kompromisse ein.

Noch bin ich mir nicht wirklich sicher, was ich über Twitter so im Einzelnen verkünden soll, aber das wird sich vermutlich ergeben. Viel Interessantes gibts derzeit nicht zu berichten, aber ich habe sowieso noch keine „Follower“. Für den Anfang habe ich Twitter jetzt jedenfalls mal in die Seite integriert, so dass meine Tweets in der Leiste rechts auftauchen.

Damit einhergehend habe ich auch wieder ein wenig am Layout des Blogs herumgeschraubt. Rechts oberhalb der Menüleiste hab ich den Twitter-Account und den SuccessDenied-RSS-Feed verlinkt, so dass sie immer gut sichtbar sind. Die Elemente in der Leiste rechts habe ich erneut umsortiert, so dass die meiner Meinung nach wichtigeren Dinge weiter oben auftauchen, die unwichtigen dagegen eher weiter unten. Das Widget für die zufällig ausgewählten Artikel habe ich etwas modifiziert, so dass es nun einheitlich zum Rest passt. Außerdem habe ich eine ganze Menge Links aus der Blogroll rausgeschmissen, da das doch eindeutig zuviel des Guten war.

Wenn euch an den Änderungen was nicht passt, bin ich für Hinweise offen.

nach oben