Kako CueProof ocenjuje tvoja povelja

Pregleden pogled na fonetični ocenjevalni mehanizem za CueProof — 10 uteženih metrik, 7 testov degradacije in raziskave o sluhu psov, ki so ga oblikovale.

Filozofija

Psi ne slišijo fonemov – slišijo akustične lastnosti. Vzorci vokalnih formantov, zlogovni ritem, energija začetnega soglasnika in oblika soglasnikov dosežejo pasje uho kot mešan akustični signal, ne kot diskretne zvočne segmente, ki jih opisujejo človeški jezikoslovci.

Ocenjevalni mehanizem CueProof modelira pasjo perspektivo, ne človeško. Namesto primerjanja IPA-transkripcij deluje z akustičnimi posredniki, kodiranimi v ASCII: skeleti soglasnikov, zaporedja samoglasnikov, razredi začetnih soglasnikov in število zlogov. Te lastnosti aproksimirajo, kar ostane, ko povelje potuje čez hrupno polje ali odmeva skozi dvorano.

Ta pristop ima omejitve – ne more zajeti konture tona, posameznega tembra govorca ali natančne spektralne oblike samoglasnika. Toda za primerjavo parov povelj znotraj treninškega besedišča so ti posredniki robustni, jezikovno neodvisni in utemeljeni v recenziranih raziskavah o avditivnem zaznavanju psov.

Ocenjevalni cevovod

Surovo besedilo Male črke Odstrani diakritike Kodiranje ASCII Ekstrakcija lastnosti Parno primerjanje Utežena mešanica Ocena tveganja

Metrike podobnosti

Razdalja urejanja

20%

Damerau-Levenshteinova razdalja, normalizirana na [0, 1]. Meri minimalno število vstavitev, brisanj, zamenjav in transpozicij za pretvorbo enega povelja v drugo.

Podobnost samoglasnikov

15%

Primerja ekstrahirana zaporedja samoglasnikov obeh povelj. Psi razlikujejo besede predvsem po vzorcih vokalnih formantov pri različnih govorcih.

Root-Gutteridge 2019

Skelet soglasnikov

15%

Odstrani vse samoglasnike za pridobitev skeleta samo s soglasniki, nato primerja. Zajame strukturno obliko besede, ki ostane stabilna v hrupu.

Prekrivanje n-gramov

13%

Jaccardova podobnost znakovnih bigramov in trigramov. Zazna delno fonetično prekrivanje, tudi ko se celotna struktura razlikuje.

Jaro-Winkler

10%

Podobnost nizov, občutljiva na transpozicije, z bonusom za predpono. Koristno za zaznavanje povelj s podobnimi, a preurejenimi zvoki.

Ujemanje pripone

8%

Primerja zadnje 3 znake vsakega povelja. Skupne končnice ustvarjajo podobnost, ki jo psi morda zamešajo.

Ujemanje predpone

7%

Primerja prve 3 znake. Psi so nagnjeni k začetku besede – skupne predpone so močan signal zmede.

Andics 2016

Zlogovni ritem

5%

Primerja število zlogov in prozodični vzorec. Psi uporabljajo ritem kot grobo klasifikacijsko oznako identitete povelja.

Razred začetnega soglasnika

5%

Razvršča prvi soglasnik po mestu artikulacije. Povelja, ki se začnejo z istim razredom, delijo podobne formantne prehode.

Liberman 1954

Degradirane oblike

2%

Uporabi 7 transformacij degradacije v realnem svetu in preveri, ali katerikoli degradirani par konvergira. Nizka osnovna utež, ojačana z ojačevalci.

Miller & Nicely 1955

Testi degradacije

Vsak par povelj je testiran v 7 simuliranih realnih pogojih. Če katera koli degradirana oblika povelja A ustreza degradirani obliki povelja B, par prejme kazen ojačevalca.

Izpad končnega soglasnika

Hiter ali kričan govor pogosto odreže zadnji soglasnik. "Sit" in "Sip" postaneta "Si-".

Stiskanje samoglasnikov

Hiter izgovor stisne sosednje samoglasnike in zmanjša akustično razdaljo med povelji s podobnimi vzorci samoglasnikov.

Izpad šibkega /h/

Na razdalji ali v hrupu šibki /h/ izgine. "Heel" in "Eel" postaneta nerazločljiva.

Izpad nenaglašenih zlogov

Hiter govor izpusti nenaglašene zloge. Večzložna povelja se lahko strnejo v naglašeno jedro.

Zmeda visokofrekvenčnih soglasnikov

Hrup in razdalja najprej prikrijeta visokofrekvenčne soglasnike: s, š, f in th se zlijejo drug v drugega.

Formantni premik pri kričanju

Pod vzburjenjem se samoglasniki premaknejo k bolj odprtim zvokom: i se premakne k e, e k a, o k a.

Maskiranje z odmevom

V odmevnih notranjih prostorih so zaporni soglasniki med samoglasniki prikriti. Zaporedja VSoglasnikV se strnejo v VV.

Kazni ojačevalcev

Po uteženi mešanici se za specifične strukturne vzorce, ki povečujejo tveganje zmede v resničnem svetu, uporabijo aditivne kazni ojačevalcev. Te se seštevajo, končni rezultat pa je omejen na [0, 1.0].

+0.10

Obe povelji imata 4 ali manj znakov. Manj akustičnih lastnosti za razlikovanje.

+0.10

Prednost začetka: psi dajejo največjo težo prvim zvokom. Enaki prvi 3 znaki so močan signal zmede.

+0.06

Skupne končnice ustvarjajo akustičen rep, podoben rimu, ki je lahko na razdalji identičen.

+0.10

Enako število zlogov IN enak vzorec samoglasnikov. Najtežja kombinacija za razlikovanje.

+0.15

Eno povelje je podmnožica drugega. Delni izgovor daljšega povelja je veljavna izgovorjava krajšega.

+0.12

Katera koli degradirana oblika enega povelja postane enaka degradirani obliki drugega.

+0.08

Oba se začneta s sibilantnimi (s/š) ali frikativnimi (f/th) začetki, ki se na razdalji zlijejo.

+0.05

Oba se začneta s sonorantnimi soglasniki (l/r/m/n/w/j) – pod 2 kHz, zunaj vrhunske občutljivosti psov.

+0.08x

V pogojih visokega drive-a je komponenta degraded_max ojačana s tekmovalnim pritiskom.

Pragovi resnosti

Končno tveganje = utežena mešanica + ojačevalci, omejeno na [0, 1.0]

Visoko tveganje: končni rezultat nad 0,65
Zmerno: končni rezultat med 0,35 in 0,65
Varno: končni rezultat pod 0,35 – ni prikazana nobena karta trka

Raziskovalne reference

Uteži, modeli degradacije in pragovi ojačevalcev ocenjevalnega mehanizma so utemeljeni v naslednjih recenziranih študijah o avditivnem zaznavanju psov.

  1. 1 Root-Gutteridge, Ratcliffe, Korzeniowska & Reby (2019). Dogs perceive and spontaneously normalize formant-related speaker and vowel differences in human speech sounds. Biology Letters 15(12), 20190555. DOI
  2. 2 Higaki, Farago, Pogany, Miklosi & Fugazza (2025). Sound quality impacts dogs' ability to recognize and respond to playback words. Scientific Reports 15, 14175. DOI
  3. 3 Andics, Gabor, Gacsi, Farago, Szabo & Miklosi (2016). Neural mechanisms for lexical processing in dogs. Science 353(6303), 1030-1032. DOI
  4. 4 Heffner (1983). Hearing in large and small dogs: Absolute thresholds and size of the tympanic membrane. Behavioral Neuroscience 97(2), 310-318. DOI
  5. 5 Barber, Wilkinson, Montealegre-Z, Ratcliffe, Guo & Mills (2020). A comparison of hearing and auditory functioning between dogs and humans. Comparative Cognition & Behavior Reviews 15, 45-94. DOI
  6. 6 Liberman, Delattre, Cooper & Gerstman (1954). The role of consonant-vowel transitions in the perception of the stop and nasal consonants. Psychological Monographs 68(8), 1-13. DOI
  7. 7 Mallikarjun, Shroads & Newman (2019). The cocktail party effect in the domestic dog (Canis familiaris). Animal Cognition 22(3), 423-432. DOI
  8. 8 Nabelek & Pickett (1974). Monaural and binaural speech perception through hearing aids under noise and reverberation. Journal of Speech and Hearing Research 17(4), 724-739. DOI
  9. 9 Miller & Nicely (1955). An analysis of perceptual confusions among some English consonants. Journal of the Acoustical Society of America 27(2), 338-352. DOI
  10. 10 Summers, Pisoni, Bernacki, Pedlow & Stokes (1988). Effects of noise on speech production: Acoustic and perceptual analyses. Journal of the Acoustical Society of America 84(3), 917-928. DOI

Si pripravljen/-a preveriti svoja povelja?

Preizkusi brezplačno preverjanje 3 povelj