AIY VOICE
A Google AIY hangbeállításának szíve a Voice Hat, a Raspberry Pi Zero kiegészítő kártyája. A Voice Hat valójában nem rendelkezik fedélzeti beszédfeldolgozással. Ezt kezeli a Google felhője (vagy más szolgáltatás, mint az Amazon Alexa). A Hat elsősorban tisztességes hangszóróerősítőt és sztereó mikrofonnal rendelkező másodlagos kártyát biztosít.
Az eredeti Voice Hat, amely teljes méretű Pi-t használ, számos bemeneti-kimeneti csapot húzott ki, amelyekkel könnyedén hozzá lehetett adni a szervókat, valamint néhány nagyobb terhelést (akár 500mA) is. Ez megkönnyíti a hangvezérelt eszköz mozgásának vagy más fizikai interfészének biztosítását. Az újabb kiadás a Pi Zero-t használja, így ez egy kicsit korlátozottabb, de nem a Pi Zero-val jön, hanem a saját szolgáltatásaival.
AIY VISION
A Voice-készlethez hasonlóan az AIY Vision kit tartalmaz egy kiegészítő kártyát a Raspberry Pi Zero-hoz, egy kartondobozhoz és egy arcade gombhoz. De ez a fórum, a VisionBonnet, valódi hatalommal rendelkezik a felhő nélküli képelemzésre. Az Intel Movidius MA2450-es látás chipet használja a Raspberry Pi kamera modul mellett.
Az MA2450 kis energiaigényű környezetekhez, például mobiltelefonokhoz van tervezve, és segíti a Pi foglalkozását a kamera élő videó streamje által generált nagy mennyiségű adattal, így ez a kis eszköz képes feldolgozni a bemenetet és gyorsan felismerni az arcokat és egyéb tárgyakat.
A Google példakódja előre képzett modelleket kínál az arcok, kifejezések és objektumok, mint a macskák és kutyák számára. Még a saját modelljeit is kiképezheti, bár nem maga a készülék. Ehhez olyan mély tanulási környezetbe kell merülnie, mint a Google TensorFlow. Az, hogy egy objektumot több ezer képből osztályozunk, túl intenzív ahhoz, hogy egy ilyen kis eszköz ésszerű időn belül elvégezhesse. Azonban a készülék nyers képfeldolgozása még mindig erőteljes és nagyon hasznos, ha egy érzékeny látásalapú felületet szeretne költséges számítógép és grafikus kártya nélkül csatlakoztatni.
A Pi Zero formakijelzője nem teszi lehetővé, hogy a Voice Hat-on megtalálható további kitörések, mint a tranzisztorok, hogy nagy terheléseket vezessenek be, de a Pi I / O-pins, power és ground négy darabját kitörik, így csatlakoztasson további bemeneteket és kimeneteket. Előfordulhat, hogy végül is egy erősebb házat szeretne létrehozni, mivel a mellékelt kartonkészlet néhány újbóli összeszerelés után elhasználódhat.
MATRIX VOICE
A Matrix Voice a legmegfelelőbb a három táblára egy 8-csatornás mikrofon-tömb és egy chip számára az audio-feldolgozáshoz. Ez a második tábla a Matrix Labs-tól, melyet a drágább, de teljesebb mátrix-alkotó előz meg.
A mátrix táblák egy Field Programmable Gate Array-t (FPGA) használnak, hogy feldolgozzák a nyolccsatornás mikrofon tömb nyers audio bemenetét olyan feladatok végrehajtásával, mint a zajszűrés és a sugárformálás. A Matrix programozta az FPGA-t sok szükséges audió algoritmussal, de szabadon bánik velük. Az AIY Voice készlethez hasonlóan a beszédfelismerés és a természetes nyelvfeldolgozás, amely a felhasználók beszédét használható parancsokká alakítja, a Google vagy az Amazon felhőszolgáltatásait kezeli.
A Matrix Voice néhány további funkciót támogat, mint az AIY Voice, mind a hangszóró kimenetével, mind a fejhallgató-csatlakozóval, a LED-gyűrűvel és a további I / O-csapokkal. Ha megkapja az ESP32 chipet, akkor a táblát Raspberry Pi-val vagy anélkül is működtetheti.
A Matrix Labs az IoT eszközök és alkalmazások platformjának részeként látja el a tábláikat, és még tárolót is biztosított, így könnyedén hozzáadhat más emberek alkalmazásait a Matrix-kompatibilis Pi-hez.
• • •
Olyan hang-asszisztens használata, mint a Google Assistant vagy az Amazon Alexa az AIY Voice vagy a Matrix Voice használatával, jelentős szolgáltatásokat igényel. Válaszolnia kell a létrehozott alkalmazással kapcsolatos kérdésekre, valamint olyan eszközökre és hitelesítő adatokra, amelyek csatlakoztatják az eszközt, az alkalmazást és a különböző felhőszolgáltatásokat. Ez a folyamat dokumentált, de nem különösebben egyszerű.
Ezen túlmenően, a Pi-nál bizonyos beállításokra van szükség a hardver konfigurálásához és a fejlesztési környezetek és példák telepítéséhez. Hasznos, ha a Linux és / vagy a Raspberry Pi környezetben tapasztalat van, ha az építés nem megy teljesen zökkenőmentesen.
Ezeknek a tábláknak a nagy előnye, hogy az előfeldolgozás a nyers audió és videó bemenettel történik. Az audio kártyákkal a felhőszolgáltatások számos olyan funkciója, mint a Google Assistant és az Amazon Alexa, egyszerű Raspberry Pi számítógépről érhető el. Akkor miért ne adjon okot a következő projektnek?