Wie CueProof Ihre Kommandos bewertet

Transparenter Blick auf CueProofs phonetische Bewertung — 10 gewichtete Metriken, 7 Degradierungstests und die Hundegehörforschung dahinter.

Philosophie

Hunde hören keine Phoneme – sie hören akustische Merkmale. Vokalformantmuster, Silbenrhythmus, Anlautenergie und Konsonantenform erreichen das Ohr eines Hundes als gemischtes akustisches Signal, nicht als die diskreten Lautsegmente, die menschliche Linguisten beschreiben.

Die Bewertungsmaschine von CueProof modelliert die Perspektive des Hundes, nicht des Menschen. Statt IPA-Transkriptionen zu vergleichen, arbeitet sie mit ASCII-gefalteten akustischen Proxys: Konsonantenskelette, Vokalsequenzen, Anlautklassen und Silbenzahlen. Diese Merkmale approximieren, was übrig bleibt, wenn ein Kommando über ein lautes Feld schallt oder in einer Halle hallt.

Dieser Ansatz hat Grenzen – er kann Tonhöhenkontur, individuellen Sprechtimbre oder die genaue Spektralform eines Vokals nicht erfassen. Für den Vergleich von Kommandopaaren innerhalb eines Trainings-Vokabulars sind diese Proxys jedoch robust, sprachunabhängig und in der begutachteten Literatur zur auditiven Wahrnehmung von Hunden verankert.

Bewertungs-Pipeline

Rohtext Kleinschreibung Diakritika entfernen ASCII-Faltung Merkmalsextraktion Paarweiser Vergleich Gewichtete Mischung Risikobewertung

Ähnlichkeitsmetriken

Editierdistanz

20%

Damerau-Levenshtein-Distanz normalisiert auf [0, 1]. Misst die minimale Anzahl von Einfügungen, Löschungen, Substitutionen und Transpositionen, um ein Kommando in ein anderes umzuwandeln.

Vokalähnlichkeit

15%

Vergleicht die extrahierten Vokalsequenzen beider Kommandos. Hunde unterscheiden Wörter vor allem anhand von Vokalformantmustern über verschiedene Sprecher hinweg.

Root-Gutteridge 2019

Konsonantenskelett

15%

Entfernt alle Vokale, um ein reines Konsonantenskelett zu erzeugen, und vergleicht es dann. Erfasst die strukturelle Form eines Worts, die unter Lärm stabil bleibt.

N-Gramm-Überlappung

13%

Jaccard-Ähnlichkeit von Zeichen-Bigrammen und -Trigrammen. Erkennt partielle phonetische Überlappungen, auch wenn die Gesamtstruktur unterschiedlich ist.

Jaro-Winkler

10%

Transpositionssensitive Zeichenkettenähnlichkeit mit Präfixbonus. Nützlich zum Erkennen von Kommandos mit ähnlichen, aber umgeordneten Lauten.

Suffix-Übereinstimmung

Vergleicht die letzten 3 Zeichen jedes Kommandos. Gemeinsame Endungen erzeugen reimähnliche Ähnlichkeit, die Hunde verwechseln können.

Präfix-Übereinstimmung

Vergleicht die ersten 3 Zeichen. Hunde orientieren sich stark am Wortanfang – gemeinsame Präfixe sind ein starkes Verwechslungssignal.

Andics 2016

Silbenrhythmus

Vergleicht Silbenzahl und prosodisches Muster. Hunde nutzen Rhythmus als grobes Klassifikationsmerkmal für Kommandos.

Anlautklasse

Gruppiert den ersten Konsonanten nach Artikulationsort. Kommandos, die mit derselben Klasse beginnen, teilen ähnliche Formantübergänge.

Liberman 1954

Degradierte Formen

Wendet 7 realistische Degradierungstransformationen an und prüft, ob degradierte Paare konvergieren. Niedriges Basisgewicht, durch Booster verstärkt.

Miller & Nicely 1955

Degradierungstests

Jedes Kommandopaar wird unter 7 simulierten Realbedingungen getestet. Wenn eine degradierte Form von Kommando A einer degradierten Form von Kommando B entspricht, erhält das Paar einen Booster-Malus.

Wegfall des Endkonsonanten

Schnelles oder gerufenes Sprechen schneidet oft den letzten Konsonanten ab. "Sit" und "Sip" werden beide zu "Si-".

Vokalverdichtung

Schnelles Sprechen komprimiert benachbarte Vokale und verringert den akustischen Abstand zwischen Kommandos mit ähnlichen Vokalmustern.

Schwacher /h/-Wegfall

In der Ferne oder bei Lärm verschwindet der schwache /h/-Anlaut. "Heel" und "Eel" werden ununterscheidbar.

Wegfall unbetonter Silben

Schnelles Sprechen lässt unbetonte Silben fallen. Mehrsilbige Kommandos können auf ihren betonten Kern zusammenfallen.

Verwechslung hochfrequenter Konsonanten

Lärm und Abstand maskieren zuerst hochfrequente Konsonanten: s, sch, f und th verschmelzen ineinander.

Formantverschiebung beim Rufen

Unter Erregung verschieben sich Vokale zu offeneren Lauten: i verschiebt sich zu e, e zu a, o zu a.

Verschleierung durch Raumhall

In hallenden Innenräumen werden Plosive zwischen Vokalen maskiert. VPlosivV-Sequenzen kollabieren zu VV.

Booster-Strafen

Nach der gewichteten Mischung werden additive Booster-Strafen für spezifische Strukturmuster angewendet, die das Verwechslungsrisiko in der Praxis erhöhen. Diese addieren sich, und das Endergebnis wird auf [0, 1.0] begrenzt.

+0.10

Beide Kommandos haben 4 oder weniger Zeichen. Weniger akustische Merkmale, die ein Hund unterscheiden kann.

+0.10

Anlautprimat: Hunde gewichten die ersten Laute am stärksten. Identische erste 3 Zeichen sind ein starkes Verwechslungssignal.

+0.06

Gemeinsame Endungen erzeugen einen reimähnlichen akustischen Abschluss, der aus der Ferne identisch klingen kann.

+0.10

Gleiche Silbenzahl UND identisches Vokalmuster. Die schwierigste Kombination für einen Hund zu unterscheiden.

+0.15

Ein Kommando ist eine Teilmenge des anderen. Eine unvollständige Aussprache des längeren Kommandos ist eine gültige Aussprache des kürzeren.

+0.12

Jede degradierte Form eines Kommandos wird identisch mit einer degradierten Form des anderen.

+0.08

Beide beginnen mit sibilanten (s/sch) oder frikativen (f/th) Anlauten, die aus der Ferne verschmelzen.

+0.05

Beide beginnen mit sonoranten Konsonanten (l/r/m/n/w/j) – unter 2 kHz, außerhalb der Spitzenempfindlichkeit von Hunden.

+0.08x

Unter hohem Antrieb wird die degraded_max-Komponente durch Wettbewerbsdruck verstärkt.

Schweregradgrenzwerte

Endrisiko = gewichtete Mischung + Booster, begrenzt auf [0, 1.0]

Hohes Risiko: Endpunktzahl über 0,65

Moderat: Endpunktzahl zwischen 0,35 und 0,65

Sicher: Endpunktzahl unter 0,35 – keine Kollisionskarte angezeigt

Forschungsreferenzen

Die Gewichte, Degradierungsmodelle und Booster-Schwellenwerte der Bewertungsmaschine werden durch die folgenden begutachteten Studien zur auditiven Wahrnehmung von Hunden informiert.

1 Root-Gutteridge, Ratcliffe, Korzeniowska & Reby (2019). Dogs perceive and spontaneously normalize formant-related speaker and vowel differences in human speech sounds. Biology Letters 15(12), 20190555. DOI
2 Higaki, Farago, Pogany, Miklosi & Fugazza (2025). Sound quality impacts dogs' ability to recognize and respond to playback words. Scientific Reports 15, 14175. DOI
3 Andics, Gabor, Gacsi, Farago, Szabo & Miklosi (2016). Neural mechanisms for lexical processing in dogs. Science 353(6303), 1030-1032. DOI
4 Heffner (1983). Hearing in large and small dogs: Absolute thresholds and size of the tympanic membrane. Behavioral Neuroscience 97(2), 310-318. DOI
5 Barber, Wilkinson, Montealegre-Z, Ratcliffe, Guo & Mills (2020). A comparison of hearing and auditory functioning between dogs and humans. Comparative Cognition & Behavior Reviews 15, 45-94. DOI
6 Liberman, Delattre, Cooper & Gerstman (1954). The role of consonant-vowel transitions in the perception of the stop and nasal consonants. Psychological Monographs 68(8), 1-13. DOI
7 Mallikarjun, Shroads & Newman (2019). The cocktail party effect in the domestic dog (Canis familiaris). Animal Cognition 22(3), 423-432. DOI
8 Nabelek & Pickett (1974). Monaural and binaural speech perception through hearing aids under noise and reverberation. Journal of Speech and Hearing Research 17(4), 724-739. DOI
9 Miller & Nicely (1955). An analysis of perceptual confusions among some English consonants. Journal of the Acoustical Society of America 27(2), 338-352. DOI
10 Summers, Pisoni, Bernacki, Pedlow & Stokes (1988). Effects of noise on speech production: Acoustic and perceptual analyses. Journal of the Acoustical Society of America 84(3), 917-928. DOI

Bereit, deine Kommandos zu prüfen?

Kostenlos 3 Kommandos auf Kollisionen prüfen