Ihre Anwendung mit Spracherkennung auszustatten. Zunächst werden wir uns darauf konzentrieren, Ihr Spracherkennungsmodul funktionsfähig auf- zubauen. Später werden wir Tipps und Tricks diskutieren und weitere Informationen über Spracherkennungstechnologie von Sensory kennenlernen. Wenn Sie an detaillierten, technischen Informationen über V ™ 364...
3. Aufbau einer einfachen Anwendung Es gibt einige Punkte, die beachtet werden müssen, bevor wir mit dem Aufbau beginnen: AUFBAU Überlegen Sie sich, wie Sie das Modul einbauen wollen. Ob Sie das Modul z.B. in einem Gehäuse montieren wollen, hängt davon ab, wie viel zusätzliche Elektronik Sie noch für Ihre Anwendung hinzufügen müssen, und wie trans- portabel das Gerät sein muss.
Das V ™ 364 Modul kann im Stand-alone Modus 15 Wörter erken- OICE IRECT nen, hat aber nur acht Ausgänge. Deshalb ist für Anwendungen, wo mehr als acht Wörter erkannt werden müssen, ein zusätzlicher Decoder an den Ausgängen erforderlich. Das Format der Ausgänge ist beschrieben in Kapitel 6 „Erkennung von Wörtern”.
MODUSAUSWAHL Es gibt zwei Hauptkonfigurationen für das V ™ 364 Modul, die in OICE IRECT Abhängigkeit davon ausgewählt werden können, wie die Spracherkennung mit Ihrer Anwendung zusammenarbeitet. Das ist zum einen der sprecherabhängi- ge Modus und zweitens der Continuous-Listening Modus. Es gibt zwei Typen des Continuous-Listening Modus: Einzelwort und Multiwort.
2. Continuous-Listening (CL) Modus Konfiguration Es gibt 2 verschiedene Konfigurationen für der CL Modus: Einzelwort CL Konfiguration Bild 2 ™ 364 OICE IRECT JP-1 JP-4 JP-3 Aufsicht auf das V OICE IRECT ™ 364 Modul (Bestückungsseite, gegenüberliegend zu Steckverbinderseite) JP-2 -Reset Mikrofon -TRAIN...
Mikrofon Eingang MIC BIAS Mikrofon Bias (Electret-Mikrofon) MIC RETURN Analog GND. Um elektronisch bedingtes Rauschen zu minimieren,sollen analoge und digitale Masse nur direkt am Voice Direct 364 Modul verbunden werden. 5 Volt (+) Versorgungsspannung Masseanschluß SPEAKER (+) Lautsprecheranschuß (positiv) SPEAKER (-) Lautsprecheranschluß...
TRAININGS- AND ERKENNUNGS-SELEKTIVITÄT Die -TRAIN, -CL TRAIN und -RECOG Pins kontrollieren die Selektivität und akti- vieren das V ™ 364 Modul. Die Trainings- and Erkennungs- OICE IRECT Selektivität werden bei jedem Einschalten des V ™ 364 Moduls und OICE IRECT bei jedem Reset festgelegt.
TECHNISCHE DATEN Absolute Maximalwerte: Arbeitsbedingungen: Jeder Pin nach GND: -0,1V bis +6,5V = 4,5 - 5,25V Leistungsaufnahme: = 0V Lagertemperatur (T -20°C bis +70°C Betriebstemperatur (T ): -20°C bis +70°C Achtung: Eine Beanspruchung des V ™ außerhalb der absoluten OICE IRECT Maximalwerte kann dauerhafte Schäden verursachen.
Seite 11
5. V ™ 364 Training OICE IRECT SPRECHERABHÄNGIGER MODUS Konfigurieren Sie das Modul für den sprecherabhängigen Modus (Bild 1). Wenn der -TRAIN Pin für mindestens 100 ms mit GND verbunden wird (z.B. durch Drücken des Tasters, der im Schaltplan mit „-TRAIN” gekennzeichnet ist), beginnt das Training.
BEISPIEL (SD): Aktion: Drücke -TRAIN Taster Start Training Voice Direct 364: „Sagen Sie Wort eins” Training erstes SD Wort („Start”) Benutzer: „Start” Voice Direct 364: „Wiederholen Sie” Benutzer: „Start” Voice Direct 364: „Akzeptiert” Voice Direct 364: „Sagen Sie Wort zwei”...
Voice Direct 364: „Wiederholen Sie” Benutzer: „Start” Voice Direct 364: „Akzeptiert” Aktion: Drücke -TRAIN Taster Fortfahren mit SD Training Voice Direct 364: „Sagen Sie Wort eins - zwei” Training zweites SD Wort im Set („Ausschalten”) Benutzer: „Ausschalten” Voice Direct 364: „Wiederholen Sie” Benutzer: „Ausschalten”...
Voice Direct 364: „Akzeptiert” Aktion: Drücke -TRAIN Taster Fortfahren mit SD Training für Benutzer 1 Voice Direct 364: „Sagen Sie Wort eins - zwei” Training zweites SD Wort im ersten Set („Ausschalten”) Benutzer 1: „Ausschalten” Voice Direct 364: „Wiederholen Sie”...
BEISPIEL (MULTI-WORT CL) FORTSETZUNG: Aktion: Drücke -TRAIN Taster Start SD Training für Benutzer 2 Voice Direct 364: „Sagen Sie Wort zwei - eins” Training erstes SD Wort im zweiten Set („Start”) Benutzer: „Start” Voice Direct 364: „Wiederholen Sie” Benutzer: „Start”...
Seite 16
Bei einem Fehler während der Erkennung (außer für „Wort nicht erkannt”) wird eine Fehlermeldung „Sie haben zu früh gesprochen”, „Bitte sprechen Sie lau- ter” usw. ausgegeben, und der Error-Pin wird für 1 Sekunde auf High gehen. Wird ein Wort aus irgendeinem Grund nicht erkannt, wird keiner der Pins akti- viert, und das entsprechende Sprachprompt wird ausgegeben.
EINZELWORT CONTINUOUS-LISTENING MODUS Nach dem Einschalten oder nach einem Reset prüft V ™ 364, ob es OICE IRECT für den Continuous-Listening Modus konfiguriert wurde. Wenn Wörter trainiert wurden, fängt V ™ 364 sofort an, nach Continuous-Listening OICE IRECT Wörtern zu hören. Durch Drücken des -RECOG Tasters nach dem Training gelangt man ebenfalls in diesen Modus.
Seite 18
MULTIWORT CONTINUOUS-LISTENING MODUS Der Multiwort Continuous-Listening Modus arbeitet in gleicher Weise wie der Einzelwort Continuous-Listening Modus mit dem Unterschied, dass das Modul gleichzeitig nach bis zu drei verschiedenen Wörtern hören kann. Das sprecherabhängige Wort, das auf ein Continuous-Listening Wort folgt, wird nur mit den Sprachmustern im zugehörigen Set verglichen.
Ergebnisse zu erzielen, ist es meistens notwendig, mit der Position und der Empfindlichkeit des Mikrofons und mit der Selektivität des Moduls zu experi- mentieren, bis die Erkennungsrate eine akzeptable Genauigkeit erreicht hat. Informationen zur Mikrofonbeschaltung des V ™ 364 sind auf OICE IRECT Sensory’s Webseite zu finden: www.VoiceActivation.com.
SCHLÜSSELPUNKTE FÜR EINE ERFOLGREICHE SPRACHERKENNUNG • Der Aufbau, der für das Training der Sprachaufnahmen benutzt wird, soll der gleiche sein, der später zur Erkennung benutzt wird. Unterschiedliche Mikrofone, Mikrofongehäuse usw. werden die Erkennung nachteilig beein- flussen. • Die Umgebungsbedingungen, in der die Aufnahmen gemacht werden, sollten den Bedingungen entsprechen, in denen das Endprodukt später benutzt wird.
9. Über Spracherkennung ™ 364 führt sprecherabhängige Erkennung diskreter Wörter OICE IRECT durch Mustervergleich mit vorher trainierten Sprachmustern in Echtzeit durch. Die von V ™ 364 erzeugten Muster basieren auf einer digitalen OICE IRECT Rekonstruktion der Sprachkommandos. Jedes Wort muß vorher trainiert wer- den, damit es erkannt werden kann.
Seite 22
Die Schritte 1 bis 3 werden für jedes Wort während des Trainings wiederholt. ™ 364 speichert einen Durchschnitt von zwei trainierten OICE IRECT Sprachmustern für jedes Wort ab, um die Genauigkeit zu erhöhen. Bevor ein Sprachmuster in den Speicher übernommen wird, wird es mit bereits beste- henden Einträgen innerhalb des Sets verglichen.
* Alternative Bestückung: Das VoiceDirect 364 IC „German” bzw. „English” beinhaltet den EPROM Code im internen MASK-ROM. Bei Modulen, die mit einem RSC300 und einem EPROM Voice Direct 364 bestückt sind, entfallen R7 und R10. Bei Modulen, die mit einem VoiceDirect 364 IC bestückt sind, entfallen U2, R5 und R6.
Die-Chip verfügbar. Das komplette Datenbuch, das ausführliche, tech- nische Spezifikationen einschließlich Informationen zur Programmierung und zum Einsatz des V ™ 364 als Spracherkennungsprozessor im Slave- OICE IRECT Modus enthält, finden sie auf Sensory’s Webseite: www.VoiceActivation.com. 13. ANDERE SENSORY PRODUKTE DIE „I ™” PRODUKT LINIE NTERACTIVE PEECH Die „Interactive Speech”...
Verbindungen sollen zweimal auf ordentliche Lötstellen, Sauberkeit und Sicherheit geprüft werden, bevor die Versorgungsspannung angeschlossen wird. GARANTIE Sensory übernimmt keine Gewährleistung dafür, in welcher Form auch immer, dass das V ™ 364 für einen bestimmten Einsatzzweck geeignet ist. OICE IRECT Die Eignung für einen geplanten Einsatz unterliegt der Beurteilung des...
90 days from the date of product purchase. Sensory, Inc. will, at its option, either repair or replace a product that proves to be defective either upon receipt or through normal usage. If a Sensory...
IMPORTANT NOTICES Sensory reserves the right to make changes to or to discontinue any product or service identified in this publication at any time without notice in order to improve design and supply the best possible product. Sensory does not assu- me responsibility for use of any circuitry other than circuitry entirely embodied in a Sensory product.