Kako CueProof ocenjuje tvoja povelja
Pregleden pogled na fonetični ocenjevalni mehanizem za CueProof — 10 uteženih metrik, 7 testov degradacije in raziskave o sluhu psov, ki so ga oblikovale.
Filozofija
Psi ne slišijo fonemov – slišijo akustične lastnosti. Vzorci vokalnih formantov, zlogovni ritem, energija začetnega soglasnika in oblika soglasnikov dosežejo pasje uho kot mešan akustični signal, ne kot diskretne zvočne segmente, ki jih opisujejo človeški jezikoslovci.
Ocenjevalni mehanizem CueProof modelira pasjo perspektivo, ne človeško. Namesto primerjanja IPA-transkripcij deluje z akustičnimi posredniki, kodiranimi v ASCII: skeleti soglasnikov, zaporedja samoglasnikov, razredi začetnih soglasnikov in število zlogov. Te lastnosti aproksimirajo, kar ostane, ko povelje potuje čez hrupno polje ali odmeva skozi dvorano.
Ta pristop ima omejitve – ne more zajeti konture tona, posameznega tembra govorca ali natančne spektralne oblike samoglasnika. Toda za primerjavo parov povelj znotraj treninškega besedišča so ti posredniki robustni, jezikovno neodvisni in utemeljeni v recenziranih raziskavah o avditivnem zaznavanju psov.
Ocenjevalni cevovod
Metrike podobnosti
Razdalja urejanja
20%Damerau-Levenshteinova razdalja, normalizirana na [0, 1]. Meri minimalno število vstavitev, brisanj, zamenjav in transpozicij za pretvorbo enega povelja v drugo.
Podobnost samoglasnikov
15%Primerja ekstrahirana zaporedja samoglasnikov obeh povelj. Psi razlikujejo besede predvsem po vzorcih vokalnih formantov pri različnih govorcih.
Root-Gutteridge 2019Skelet soglasnikov
15%Odstrani vse samoglasnike za pridobitev skeleta samo s soglasniki, nato primerja. Zajame strukturno obliko besede, ki ostane stabilna v hrupu.
Prekrivanje n-gramov
13%Jaccardova podobnost znakovnih bigramov in trigramov. Zazna delno fonetično prekrivanje, tudi ko se celotna struktura razlikuje.
Jaro-Winkler
10%Podobnost nizov, občutljiva na transpozicije, z bonusom za predpono. Koristno za zaznavanje povelj s podobnimi, a preurejenimi zvoki.
Ujemanje pripone
8%Primerja zadnje 3 znake vsakega povelja. Skupne končnice ustvarjajo podobnost, ki jo psi morda zamešajo.
Ujemanje predpone
7%Primerja prve 3 znake. Psi so nagnjeni k začetku besede – skupne predpone so močan signal zmede.
Andics 2016Zlogovni ritem
5%Primerja število zlogov in prozodični vzorec. Psi uporabljajo ritem kot grobo klasifikacijsko oznako identitete povelja.
Razred začetnega soglasnika
5%Razvršča prvi soglasnik po mestu artikulacije. Povelja, ki se začnejo z istim razredom, delijo podobne formantne prehode.
Liberman 1954Degradirane oblike
2%Uporabi 7 transformacij degradacije v realnem svetu in preveri, ali katerikoli degradirani par konvergira. Nizka osnovna utež, ojačana z ojačevalci.
Miller & Nicely 1955Testi degradacije
Vsak par povelj je testiran v 7 simuliranih realnih pogojih. Če katera koli degradirana oblika povelja A ustreza degradirani obliki povelja B, par prejme kazen ojačevalca.
Izpad končnega soglasnika
Hiter ali kričan govor pogosto odreže zadnji soglasnik. "Sit" in "Sip" postaneta "Si-".
Stiskanje samoglasnikov
Hiter izgovor stisne sosednje samoglasnike in zmanjša akustično razdaljo med povelji s podobnimi vzorci samoglasnikov.
Izpad šibkega /h/
Na razdalji ali v hrupu šibki /h/ izgine. "Heel" in "Eel" postaneta nerazločljiva.
Izpad nenaglašenih zlogov
Hiter govor izpusti nenaglašene zloge. Večzložna povelja se lahko strnejo v naglašeno jedro.
Zmeda visokofrekvenčnih soglasnikov
Hrup in razdalja najprej prikrijeta visokofrekvenčne soglasnike: s, š, f in th se zlijejo drug v drugega.
Formantni premik pri kričanju
Pod vzburjenjem se samoglasniki premaknejo k bolj odprtim zvokom: i se premakne k e, e k a, o k a.
Maskiranje z odmevom
V odmevnih notranjih prostorih so zaporni soglasniki med samoglasniki prikriti. Zaporedja VSoglasnikV se strnejo v VV.
Kazni ojačevalcev
Po uteženi mešanici se za specifične strukturne vzorce, ki povečujejo tveganje zmede v resničnem svetu, uporabijo aditivne kazni ojačevalcev. Te se seštevajo, končni rezultat pa je omejen na [0, 1.0].
Obe povelji imata 4 ali manj znakov. Manj akustičnih lastnosti za razlikovanje.
Prednost začetka: psi dajejo največjo težo prvim zvokom. Enaki prvi 3 znaki so močan signal zmede.
Skupne končnice ustvarjajo akustičen rep, podoben rimu, ki je lahko na razdalji identičen.
Enako število zlogov IN enak vzorec samoglasnikov. Najtežja kombinacija za razlikovanje.
Eno povelje je podmnožica drugega. Delni izgovor daljšega povelja je veljavna izgovorjava krajšega.
Katera koli degradirana oblika enega povelja postane enaka degradirani obliki drugega.
Oba se začneta s sibilantnimi (s/š) ali frikativnimi (f/th) začetki, ki se na razdalji zlijejo.
Oba se začneta s sonorantnimi soglasniki (l/r/m/n/w/j) – pod 2 kHz, zunaj vrhunske občutljivosti psov.
V pogojih visokega drive-a je komponenta degraded_max ojačana s tekmovalnim pritiskom.
Pragovi resnosti
Končno tveganje = utežena mešanica + ojačevalci, omejeno na [0, 1.0]
Raziskovalne reference
Uteži, modeli degradacije in pragovi ojačevalcev ocenjevalnega mehanizma so utemeljeni v naslednjih recenziranih študijah o avditivnem zaznavanju psov.
- 1 Root-Gutteridge, Ratcliffe, Korzeniowska & Reby (2019). Dogs perceive and spontaneously normalize formant-related speaker and vowel differences in human speech sounds. Biology Letters 15(12), 20190555. DOI
- 2 Higaki, Farago, Pogany, Miklosi & Fugazza (2025). Sound quality impacts dogs' ability to recognize and respond to playback words. Scientific Reports 15, 14175. DOI
- 3 Andics, Gabor, Gacsi, Farago, Szabo & Miklosi (2016). Neural mechanisms for lexical processing in dogs. Science 353(6303), 1030-1032. DOI
- 4 Heffner (1983). Hearing in large and small dogs: Absolute thresholds and size of the tympanic membrane. Behavioral Neuroscience 97(2), 310-318. DOI
- 5 Barber, Wilkinson, Montealegre-Z, Ratcliffe, Guo & Mills (2020). A comparison of hearing and auditory functioning between dogs and humans. Comparative Cognition & Behavior Reviews 15, 45-94. DOI
- 6 Liberman, Delattre, Cooper & Gerstman (1954). The role of consonant-vowel transitions in the perception of the stop and nasal consonants. Psychological Monographs 68(8), 1-13. DOI
- 7 Mallikarjun, Shroads & Newman (2019). The cocktail party effect in the domestic dog (Canis familiaris). Animal Cognition 22(3), 423-432. DOI
- 8 Nabelek & Pickett (1974). Monaural and binaural speech perception through hearing aids under noise and reverberation. Journal of Speech and Hearing Research 17(4), 724-739. DOI
- 9 Miller & Nicely (1955). An analysis of perceptual confusions among some English consonants. Journal of the Acoustical Society of America 27(2), 338-352. DOI
- 10 Summers, Pisoni, Bernacki, Pedlow & Stokes (1988). Effects of noise on speech production: Acoustic and perceptual analyses. Journal of the Acoustical Society of America 84(3), 917-928. DOI
Si pripravljen/-a preveriti svoja povelja?