Kein Softwaresprachsynthesizer wurde musikalisch so oft verwurstet wie STSpeech. Alex Christensen machte den typischen Sound der Software mit seinem U96-Hit „Das Boot“ 1992 weltberühmt, die deutsche 90er-Jahre Technoformation Das Modul nutzte ihn gleich mehrfach, und auch heute noch kommt er hin und wieder zum Einsatz, jüngst im Spencer & Hill -Track „Young Love“ von 2010. Aber selbstverständlich bedienen sich vor allem ST-Chiptune-Produktionen der Szene (siehe Dubmood) gerne daran. Inzwischen ist das 28 KByte kleine Atari ST-Programm 25 Jahre alt geworden.

Entwickelt wurde STSpeech im Jahr 1986 von den beiden britischen Programmierern Andy D. Beveridge und Martin N. Day. Beide haben sich seit Mitte der 80er Jahre auch eine zeitlang an der Spieleprogrammierung versucht, z.B. mit „Don’t Buy This“ von 1985 oder mit „Cybercon III“ von 1991. Bereits 1988 haben sie jedoch ihre eigene Firma SN Systems gegründet, wo sie sich mit der Entwicklung von Dev-Tools für Spielesoftware befassen, heute speziell für Sony.

STSpeech konnte man als Standalone-Programm starten und einfach Text eingeben, den die Software Zeile für Zeile über die Lautsprecher zum Besten gab. Mit einer entsprechenden Modifikation konnte man die Software allerdings auch mit vorgegebenen Parametern starten oder einfach direkt eine Textdatei einlesen lassen, die STSpeech dann vorlesen sollte. Dadurch war es möglich, es in eigene Softwareprojekte einzubinden. So gab es z.B. das PD-Textadventure „Das Schloß“ von Detlef Pleiß, welches STSpeech-Sprachausgabe für Soundeffekte und für Gesprochenes, wie Zaubersprüche einsetzte. Daneben gab es noch das Farbspiel Fuzzball von Methodic Solutions aus dem Jahr 1987 und ein Programm von Budgie UK (glaube ich), das versuchte die Sprachausgabe lippensynchron mit der (gruseligen) Animation eines Gesichtes zu verbinden.

STSpeech braucht keine Anleitung, dennoch ist es hilfreich zu wissen, dass das Programm zwei Modi hat. Einen English Text Mode und einen Phoneme Mode. Im English Text Mode gibt man einfach englischen (oder spaßeshalber deutschen) Text ein und STSpeech übersetzt dies in seine spezielle Lautschrift und spricht die Eingabe aus. Im Phoneme Mode kann man die Lautschrift direkt eingeben und dabei zusätzlich die Tonhöhe vorgeben und so die Aussprache bestimmter Worte korrigieren. Den Modus wechselt man durch Eingabe des Punkt-Zeichens.

Außer der Version 2.0 gibt es offenbar keine andere, jedenfalls ist mir nie eine über den Weg gelaufen, wenn man von unterschiedlichen Begrüßungstexten im Header absieht. Vor ein paar Jahren hat der Synthesizer-Experte und Programmierer Stefan Stenzel eine Win32-Portierung entwickelt. Wie er beschreibt, habe er den Sound des Programms beim Portieren auch gleich weicher und professioneller machen wollen. Im direkten Vergleich klingt es meiner Meinung nach aber eher zahnlos und es hat leider nicht mehr den ursprünglichen unvergleichlichen Charakter. Außerdem wurde der Phoneme Mode wohl leider verworfen. Darauf basierend gibt es neuerdings sogar eine Version für den Nintendo DS (DSSpeech Speech Synthesizer v1.5).

Jeder der STSpeech heute hört, dem wird selbstverständlich auffallen, dass es kein besonders realistisch klingender oder außerordentlich guter Sprachsynthesizer ist, jedoch hat der künstlich roboterhafte typische Sound gerade in der Technomusik großen Anklang gefunden. Ich habe vor mehr als 20 Jahren mit STSpeech auf Englisch Zählen gelernt und die Aussprache vieler englischer Wörter ausprobiert (auch wenn STSpeech mit der Aussprache oft daneben liegt). Wie man an den Portierungen für moderne Systeme außerdem sehen kann, gibt es auch heute noch Fans, die sich mit dem Kultprogramm beschäftigen und es für die Nachwelt erhalten wollen.

Leider geht mein Verständnis von Sprachsynthese nicht weit genug, um mehr ins Detail zu gehen. Jedoch habe ich ein interessantes Dokument finden können, das sich ein klein wenig genauer mit der Technik hinter STSpeech beschäftigt: The Microwave Speech Robot

Ein zeitgenössischer Artikel zu STSpeech: „ST-Speech nennt sich ein ca. 25Kb langes Programm, mit dessen Unterstützung der User auf einfachste Weise Sprache aus seinem Atari ST hervorzaubern kann. Das Prinzip ist eigentlich recht einfach, doch auch genauso genial: Die einzelnen Phoneme werden aneinander gehängt (z.B. Tohrstehn = Torsten), und der Computer gibt diese Töne dann mit Hilfe des Soundchips aus. Bei der Eingabe muss natürlich darauf geachtet werden, dass nach jedem Selbstlaut ein „H“ eingegeben wird, denn sonst weiß der Computer nicht, was gemeint ist. Da das Programm aus den Vereinigten Staaten stammt, wurde als ganz besonderer Clou ein English-Text-Mode integriert. In diesem brauchen Sie einfach nur die englischen Worte eingeben (z.B. This is my Computer), und der ST spricht diese sogleich verständlich aus. Natürlich ist nicht zu überhören, dass die Sprache mittels Computer ausgegeben wird. Doch weil dieses über den Soundchip geschieht, kostet es kaum Arbeitsspeicher. Eine bessere Qualität erreicht man zwar, wenn die Worte digitalisiert werden, doch diese Methode kostet mindestens zehnman soviel Speicher, wie die bei ST-Speech genutzte!“

Bekannte Musikstücke mit STSpeech-Samples:

Das Modul – Computerliebe (Dee-Lay Remix)
Das Modul – Joystick
U96 – Das Boot
U96 – I Wanna Be A Kennedy
U96 – Boot II
Spencer & Hill – Young Love (Radio Edit)
Snap – The Ex-Terminator
Nexus Project – Funky Drummer
The Scientist – Spiral Symphony
The Prodigy – Mindfields (Paza Rahm ReMix)
Obsidia – Electronik
Falco – Cyberlove
General Base – Base Of Love
General Base – Base Of Love Rebased
Casseopaya – Overdose
Yves Deruyter – Feel Free (Original Mix)
Yves Deruyter – Feel Free (Sean Dexter Remix)
P.W.M. – Are You Ready To Move

Über Hinweise bezüglich toter Links oder weiterer passender Songs und anderen Informationen bin ich selbstverständlich dankbar.