myIO magyar nyelvű hangvezérlés beállítása

A következőkben a myIO szerverhez készített szövegértelmező beállításait részletezzük.

Az applikáció a Google Play áruházból tölthető le myIO Home néven. Bárki számára ingyenesen elérhető.

Screenshot_20220819-152203

Az applikáció

Az applikáció Android operáció rendszer alatt fut. Az android beszédfelismerő funkcióját használja. Hozzáférést kell adni a mikrofonhoz, hogy működjön.

Amennyiben eléri az adott myIO szerveren a /dict könyvtárban található szótár file-okat, úgy megjelenik egy mikrofon ikonnal jelzett gomb a bal felső sarokban. Ez nem azonnal történik meg, hanem az applikáció elindítását követően a második frissítési periódusban (alapbeállítás 5 másodperc). A szótár file-ok bármikor frissíthetőek manuálisan, a jobb felső sarokban található menüben a ‘Szótárak betöltése’ menüpont használatával, ilyenkor azonnal megjelenik a mikrofon gomb, amint betöltötte a szótár file-okat.

Ennek a gombnak a megnyomásával indul, vagy megáll a hallgatózás. A beszédfelismerés indításával a telefon csengőhangja némításra kerül. A felismert szöveg a fenti zöld csíkban kiírásra kerül.

Amennyiben a felismert szöveg tartalmazza a megszólítási nevet, úgy a felismert szöveg elemzésre kerül, amint véget ér a felismerés, vagy a ‘vége’ szó el nem hangzik.

Ha a felismerés eredményes volt, tehát talált egy megfelelő igét és tárgyat esetleg helyszínt a szövegelemző, úgy végrahajtja az adott parancsot és hangjelzéssel jelzi, hogy sikeres volt a bevitel. Amennyiben elhangzott a megszólítás, de nem értelmezhető a parancs, azt is egy méllyebb hangjelzéssel jelzi.

Szótárak

Az applikáció működéséhez szülség van a szótár file-okra. Ezeknek a myIO szerver SD kártyáján a /dict könyvtárban kell lenniük.

Amennyiben myIO valet 3.6, vagy nagyobb verziószámú szoftvert használ, úgy ezeket a fie-okat a webes felületen található szótár szerkesztő létre fogja hozni a mentés gomb megnyomásával.

Amennyiben korábbi szoftvert használ manuálisan kell szerkeszteni és kiírni az SD kártyára őket. A file-ok erről a linkről letölthetőek tömörítve. Kitömörítve, könnyedén szerkeszthetőek bármely JSON szerkesztővel, például ezzel az online webes szerkesztővel is : https://jsoneditoronline.org
Ha az online JSON szerkesztőt használja, az Open menüpont ‘Open from disk’- alpontja segítségével lehet betölteni a gépünktön máár kitömörített jsn filet. Az átláthatóság kedvéért célszerű a bal oldalt található ‘tree’ menüpont választása ‘text’ helyett. A jobb gomb megnyomásával a szerkesztő felületen megjelennek különböző lehetőségek, melyek segítésgével könnyedén szerkeszthetjük az állományt. Majd a szerkesztés végeztével a Save menüpont alatt, a ‘Save to Disk’ alponttal menthetjük.
Fontos, hogy ne használjunk nagy betüket.

Figyelő

Kell egy, vagy több né, amire a szövegfelismerő felkapja a fejét, amiből tudni fogja  hogy megszólítottuk, mint például az ‘Alexa’, a ‘Siri’, vagy a ‘Hey Google’….

A mellékelt képeken ‘computer’, ‘majom’, ‘mário’, ‘mario’, szavak vannak beállítva…

Ez a speech.jsn file-ban található ‘listener’ nevü kulcs alatt.

Vége

Szükség van egy (vagy több) szóra, amivel véget vethetünk a hallgatózásnak és azonnali szövegelemzésre kényszeríthetjük az elemző algoritmust. Erre akkor van szükség, ha folymatosan beszéd van, vagy háttérzaj (rádió, vagy TV…) és nem tudja a beszédfelismerő eldönteni, hogy beszélünk-e még hozzá, vagy már befejeztük.

Csak akkor van értelme, ha korábban meg lett szólítva.

Ez a speech.jsn file-ban található ‘end’ nevü kulcs alatt.

 

Igék

Különböző igék vannak megadva (TURN,OPEN,CLOSE,STOP,START,SET), Az igékhez tartoznak szavak (‘words’), itt lehet felsorolni az értelmezni kívánt szótöveket. Továbbá tartoznak határozó szavak (‘conjunctions’), melyek tartalmazhatnak különböző funkciókhoz tartozó szavakat, illetve alap (‘DEFAULT’) szavakat.
 
Például a ‘TURN’ igéhez tartozik a ‘kapcsol’ szótő, ami aktivizálódik, ha a felismert szövegben megjelenik, függetlenül attól, hogy a szó elején, vagy a végén volt. Ha csak a szótő van jelen, akkor ‘TURN DEFAULT’ lesz az ige, ami értelmezve lesz, de ha a szó elején vagy a szó után megjelenik egy határozó szó, az módosíthatja a ‘TURN DEFAULT’ igét például “Kapcsold fel” esetén ‘TURN ON’-ra.
 
Egy szövegfelismerés alkalmával egyszerre csak egy ige használható, egyébként ‘Multi Verb Errort’ kapunk.
 
Ez a speech.jsn file-ban található ‘verbs’ nevü kulcs alatt.

 

Screen-Shot-2022-08-19-at-16.41.09

Helyiségek

Szükség van helyiségekre is, hogy meg tudjuk különböztetni az azonos nevü eszközeinket. Például van ‘lámpa’ a nappaliban és van ‘lámpa’ a konyhában is, ilynekor mondhatjuk, hogy “-kapcsold fel a lámpákat!”, ilyenkor felkapcsolja az összes lámpa nevü eszközt, de ha csak a  nappaliban szeretnénk lekapcsolni a lámpá(ka)t, akkor azt kell mondanunk, hogy “- kapcsold fel a lámpát a nappaliban!”.
Ezért létre kell hoznunk különböző számokkal jelölt helyiségeket, a hozzájuk tartozó szinonímák szótöveivel.
 
A szótövek lehetnek több szavasok is, például ha van ‘háló’  és van ‘vendég háló’ is, akkor az algoritmus, mindig a leghosszabb szótővel való egyezést fogja figyelembe venni.
 
Ez a places.jsn file-ban található ‘places’ nevü kulcs alatt.
 
 
 

 

Tárgyak

Ez a subject.jsn file-ban találhatóak.
 
Az egyes kimeneteink különböző eszközöket vezérelnek. Ez a file tartalmazza, hogy melyik kimenet, milyen névre hallgat (‘words’), hol található (‘place’) és milyen igék tudják irányítani (‘verbs’).
 
A myIO szervernek alapvetően van digitális (PCF) , szabályzott (PWM) és 3.0 verzió felett univerzális (PCA) kimenete. Ezek a kimenetek külön kulcs alatt találhatóak a JSN file-ban, a webes felületen az ablakuk fejlécében olvashatóak (pl.: PCF tárgyak).
 
A webes felületen történő beállítás egyszerű, segítségként minden kimenet fejlécében jelezve van a központ által már nyílvántartott elnevezés, így könnyen hozzáadhatóak a szinonímák, legördülő menüből kiválaszthatóak az aktuális kimenet által érintett helyszínek, valamint a vezérlő igék.
 
JSON szerkesztővel kicsit bonyolultabb a helyzet, mert manuálisan kell megadni mindent, figyelemmel kell kísérni, hogy az adott számú PCF kimenetre mi van kötve, ehez fel kell venni a szinonímákat, meg kell adni a ‘place’ kulcshoz, a korábban már a places.jsn file-ban megadott helyiség számát, valamint a ‘verbs’ kulcshoz a szükséges vezérlő igéket a mellékelt ábra és a minta file-ok alapján.
 

 

Screenshot-2022-08-20-at-20.32.01

Végezetül

Ha a myIO Valet szoftverünk rendelkezik szótárszekesztővel, nyomjuk meg a mentés gombot a jobb felső sarokban, ekkor feltölti a módosított  file-okat az SD kártyára.

Sajnos, ha a szoftverünk verziószáma 2.7.1 alati, akkor be kell még írnunk pár sort a JSN file-aink elejére:

HTTP/1.1 200 OK
Content-Type: application/json

A fenti 2 sor után egy üres sort is be kell iktatnunk, ahogy a mellékelt ábra mutatja.

Ha ezekkel kész vagyunk fel kell tölteni a file-okat az SD kártyára és újraindítani.

Indítsuk el az applikációt. Várjuk meg, amíg megjelenik a mikrofon ikon, vagy töltsük be manuálisan a szótár file-okat a jobb felső sarokban található menü ikon alatt található ‘szótárak betöltése’ opcióval.

Nyomjuk meg a mikrofon ikont és próbáljuk ki a hangvezérlést!

Feliratkozás myIO SmartHome tartalomért.

Nincs levélszemét küldés!