Commodore Magic Voice Speech Module für C64

Kurzbeschreibung

Sprachausgabe auf Computern hat eine lange Tradition. Bevor die Rechner leistungsstark für eine Software-Lösung waren, und gute Audio-Wiedergabe boten, waren es Hardware-Erweiterungen, die Sprachausgabe ermöglichten. Hervorzuheben ist die Entwicklung von Texas Instruments. 1976 begannen Paul Breedlove, Richard Wiggins, Larry Brantingham und Gene Frantz mit einem Budget von 25.000 USD zu testen, in wie weit sich menschliche Sprache kompakt aufzeichnen lässt. Das Projekt zeigte Erfolge und mündete in der Entwicklung vom elektronischen Spielzeug Speak & Spell, das Texas Instruments 1978 auf den Markt brachte. Neben der Eigenschaft, dass Speak & Spell eines der ersten Spiele mit einem Display und auswechselbaren Modulen war, verdient der Voice-Synthesizer besondere Beachtung. TI forschte in der Richtung weiter und entwickelte aufbauend auch Zubehör für den eigenen TI-99/4A-Heimcomputer.

Commodore war an dieser Sprachausgabe interessiert und warb Richard Wiggins von TI ab und machte ihm zum Kopf einer Entwicklungsmannschaft der neu gegründeten „Speech Technology Division“ in Texas. Dort arbeitete das Team an einem Steckmodul mit Sprachausgabe, das im Magic Voice Speech Module mündete. Das Resultat war für die Zeit beeindruckend. Über das Verfahren des Linear Predictive Coding (LPC) brachte das Modul auf 128 KiB ein Vokabular von 235 Wörtern unter. Worte zu speichern war eher ungewöhnlich, denn oftmals setzen Sprachausgabesysteme aufgezeichnete Phoneme hintereinander, die Wörter formen. Doch Commodore wollte das System in der Lehre einsetzen und das ging nicht ohne exzellente Sprachausgabe: „Education is one of the major uses we forsee for the Magic Voice“. So wähle das Team häufig verwendete Wörter der englischen Sprache – angereichert mit IT-Begriffen wie „cursor“ oder „disk“ – aus, und ließ alles zusammen mit Buchstaben und Zahlen von einer professionellen Sprecherin vorlesen. Eine Frau wurde bewusst als Sprecherin gewähnt, da Kognitions-Studien zeigen, dass Vorschüler mit einer weiblichen Stimme besser Stoff aufnehmen. Nach der Aufnahme wurde die Audio-Aufzeichung digitalisiert, analysiert, verarbeitet, komprimiert und auf ROM gebrannt.

Physikalisch wird das Modul in den Commodore 64 Cartridge Port gesteckt und die Leitungen durchgereicht, sodass ein anderes Modul „piggyback“ von oben eingesetzt werden kann. Für die Stereoanlage bieten sich Anschlüsse, dass die C64-Audio-Ausgabe in das Modul umgeleitet wird, und von dort mit der Sprache zusammengemischt und weitergeleitet wird. Zugänglich ist das Sprachmodul über Maschinensprache und BASIC. Die neuen BASIC-Kommandos reduzieren nicht den Speicher für die BASIC-Programme, Maschinenprogrammierer müssen aber mit 1 KiB weniger auskommen, da das Modul den Speicher von $C000-$C3FF reserviert. Im Fall von BASIC ist der zentrale neue Befehl „SAY“, genutzt etwa so: SAY „YES“:SAY „HELLO“. Da jedem Wort ein Index zugeordnet ist, ist SAY 157 mit SAY „YES“ identisch – das spart Speicherplatz. In der Anleitung gibt es eine Wortliste und die Positionen der Wörter abzulesen, gibt es das Wort nicht im Sprachschatz, folgt eine „?ILLEGAL QUANTITY ERROR“ Nachricht. Die Routine nimmt die Zeichenketten nicht auseinander, und Sätze wie „GOOD MORNING AMERICA“ lasen sich nicht sprechen, die Wörter müssen nacheinander über drei SAY-Aufrufe zum Synthesizer gesendet werden. Der arbeitet sie parallel zum BASIC-Programm ab und die Variable RDY sagt, ob gerade eine Sprachausgabe verarbeitet wird. RATE ist ein weiter BASIC-Befehl, der die Geschwindigkeit kontrolliert, von RATE #1 langsamer über RATE #4 normal, bis und RATE #10 am schnellsten. Die Stimme wird auch beim schnelleren abspielen nicht zur hohen Mickey-Mouse Stimme.

Commodore hatte große Ambitionen mit dem Sprachmodul, doch schnell schlief das Interesse ein. Das lag auch an Commodore selbst, die angekündigte Erweiterungen wie Extra-Vokabular versprachen, oder Zuätze wie eine Männer-/Kinderstimme, die nie kam. Auf einer Diskette sollte ein Wortschatz mit 10.000 ausgeliefert werden. Bescheidene drei Produkte unterstützen, das Modul: „Gorf“ und „Wizard of Wor“ sind Spiele und „A Bee C's“, ein Lernprogramm für Kinder. In Gorf kommen zum Beispiel Sprüche wie „Survival is impossible“ und bei Wor „I'm the Wizard, not you!“ vor. Alles in allem nur eine optionale Spielergänzung, die weit hinter den Möglichkeiten des Moduls zurückbleiben – das Lernprogramm funktioniert aber nur mit dem Sprachmodul. Alle drei Produkte stammen von Commodore selbst, keine unabhängigen Entwickler sprangen auf die Erweiterung an.

Eigene Erweiterungen waren nicht einfach, denn reichen die 235 Wörter nicht, gibt es ein Problem; eine Phoneme-Sammlung ist nicht im ROM integriert. Hier bleibt nur die Buchstabierung, aber das Ergebnis ist natürlich unschön. Zum Teil lassen sich mehr Wörter einbringen, indem berücksichtigt wird, das etwa „sea“ und „see“ gleich ausgesprochen werden, also Homonyme sind. Das ist gut, denn „see“ ist im Wortschatz vorhanden, „sea“ aber nicht. Das gleiche gilt für „gray“ (nicht vorhanden), was durch „grey“ ersetzt werden kann. Weitere Ideen, die ein Austauschprogramm lösen kann: „bee“ mithilfe von „b“, „eye“ durch „i“, „knot“ durch „not“, „pea“ durch „p“, „queue“ durch „q“, „tea“ durch „t“, und auch die Ziffern und ein paar mathematische Sonderzeichen können so gesprochen werden.

Commodore war nicht die einzige Firma, die Sprach-Synthesizer im Programm hatten, Adman Electronics, Ltd. in Großbritannien ist mit dem VIC-20 Speech Synthesizer an den Start gegangen (arbeitet mir Phonemen), die Alien Group bot die Voice Box für den VC-20 und C64 und der Covox Voice Master Speech Synthesizer war ein weiteres Produkt.

Objektbeschreibung

  • Hersteller: Commodore
  • Typ/Modell:
  • Seriennummer: (folgt)
  • Zubehör: OVP, komplett
  • Objektzustand: gut
  • Veröffentlichung: 1984
  • Neupreis: ?

Technische Daten

  • Toshiba T6721A Sprach-Synthesizer
  • 128 KiB ROM