半米內(nèi)識(shí)別率 90%以上
可以通過語(yǔ)音指令控制輸出
可以通過單片機(jī)串口控制播放指定語(yǔ)音
三種輸出模式:串口輸出、IO 輸出、喇叭播放
PWM 輸出可直接推動(dòng) 0.5W/8Ω 或 1W/8Ω 揚(yáng)聲器
具有差分放大電路,安靜環(huán)境下語(yǔ)音識(shí)別距離可達(dá)到 2-3 米
外掛 SPI Flash,增加存儲(chǔ)容量
可以存儲(chǔ)多組詞條,但是同一時(shí)刻只能出現(xiàn)一組詞條
非特定人語(yǔ)音識(shí)別
語(yǔ)音可支持 32 種語(yǔ)言,目前中文識(shí)別度較好
MX9016B語(yǔ)音識(shí)別模塊是一款小巧語(yǔ)音識(shí)別模塊,安靜環(huán)境下語(yǔ)音識(shí)別距離可達(dá)到 2-3 米;外掛 SPI Flash,增加存儲(chǔ)容量;主要功能如下:
識(shí)別功能:可識(shí)別預(yù)設(shè)的語(yǔ)音詞條,同時(shí)通過串口,IO 輸出以及識(shí)別結(jié)果。
播放功能:通過單片機(jī)指令播放指定的語(yǔ)音,同時(shí)通過 BUSY 腳標(biāo)志是否正在播放語(yǔ)音。
玩具類:智能機(jī)器人、智能故事機(jī)、智能玩具車機(jī)等
家電類:智能茶壺、智能電飯鍋、智能音箱、智能插排、智能晾衣架,智能空氣凈化器等
理療類:眼部按摩儀、按摩椅、頭部按摩儀、足浴按摩器
語(yǔ)音導(dǎo)航類:醫(yī)院、商場(chǎng)等地方內(nèi)指路器
結(jié)構(gòu)組成:MX9016B-24QS 語(yǔ)音識(shí)別芯片外掛SPI-flash;可搭配麥克風(fēng)、喇叭、單片機(jī)等外設(shè)一起使用。不過,在虛線框中的串口和 IO 都是用于檢測(cè) MX9016B是否能正確識(shí)別,所以在連接 MCU(客戶的)時(shí)可連接其 IO 口或串口,二選一即可。
芯片管腳圖,引腳按照上圖排列順序
引腳 | 引腳標(biāo)號(hào) | 功能描述 |
1 | PWMP | 數(shù)字PWM輸出(+),跟PWMP組合使用可直接驅(qū)動(dòng)揚(yáng)聲器 |
2 | VPS | PWM電源輸出腳 |
3 | VIO | PortA IO 電源輸入腳 |
4 | SPI_SO | SPI_SO腳 |
5 | SPI_SI | SPI_SI腳 |
6 | SPI_SCLK | SPI_SI腳 |
7 | SPI_CS | SPI_CS腳 |
8 | RESTINB | 復(fù)位腳(燒錄時(shí)需用到) |
9 | PC4 | MIC麥克風(fēng)口 |
10 | PC3 | MIC麥克風(fēng)口 |
11 | PC2 | MIC麥克風(fēng)口 |
12 | AVSS | 模擬地 |
13 | BUSY | BUSY輸出腳 |
14 | OUTD | IO口/32K的晶體輸出腳 |
15 | V33O | 內(nèi)部LDO3.3V/1.8V 電壓輸出 |
16 | VCC | 電源輸入腳 |
17 | VSS | 數(shù)字地 |
18 | TX | 串口發(fā)送腳 |
19 | RX | 串口接收腳 |
20 | OUTC | IO口/AD口 |
21 | OUTB | 燒錄引腳,閑置時(shí)可當(dāng)IO口使用 |
22 | OUTA | 燒錄引腳,閑置時(shí)可當(dāng)IO口使用 |
23 | PWMN | 數(shù)字PWM輸出(-),跟PWMP組合使用可直接驅(qū)動(dòng)揚(yáng)聲器 |
24 | VPD | PWM 電源輸入腳 |
Symbol | Parameter | Min | Max | Type | Uint |
VCC | 工作電壓 | 1.8 | 5.5 | 3.3 | V |
Iop | 無負(fù)載電流 | -- | -- | 7 | mA |
Ta | 工作溫度 | -20 | 75 | -- | ℃ |
Io | 輸出電流 | -16 | 16 | -- | mA |
1)RXD/TXD 標(biāo)準(zhǔn)串口通信、波特率 9600,配置見下圖
2)13腳為播放狀態(tài) BUSY 指示,播放時(shí)為 H,不播放時(shí)為 L
3)MIC 麥克風(fēng)正極輸入端,可接常用的麥克風(fēng)型號(hào)
4)PWMP/PWMN pwm 輸出、可直接驅(qū)動(dòng) 0.5W/8Ω 或 1W/8Ω 揚(yáng)聲器
串口指令格式采用:起始碼+參數(shù)+反碼,設(shè)置如下表。
起始碼 | 參數(shù) | 反碼 |
AA/BB | 見下文 | 見下文 |
注:①參數(shù)+反碼 = FF,例如 TX 輸出的指令 “AA 01 FE” ,起始碼為 AA ,參數(shù)為 01 ,反碼為 FE,01+FE=FF,其他數(shù)據(jù)依此類推
②TX 輸出指令起始碼為 AA(見表 4),RX 輸入指令起始碼為 BB(見表5)
MX9016B語(yǔ)音識(shí)別模塊可以實(shí)現(xiàn)固定詞匯,非特定人的語(yǔ)音識(shí)別。
固定詞匯并非指詞條永遠(yuǎn)無法改變,而是用戶不可以自行更改,但開發(fā)者可以根據(jù)需求更換詞條,之后將詞條存儲(chǔ)到 MX9016B-24QS 語(yǔ)音芯片里或是外掛的 SPI Flash 里,待識(shí)別時(shí)將會(huì)拿輸入的語(yǔ)音與存儲(chǔ)起來的詞條語(yǔ)音作對(duì)比,若是兩者相似度達(dá)到標(biāo)準(zhǔn)就認(rèn)為是輸入的語(yǔ)音與存儲(chǔ)中的詞條一致,即識(shí)別成功。
存儲(chǔ)詞條的地方有兩處:語(yǔ)音芯片的內(nèi)部、SPI Flash;兩者本身的容量不同,所能存儲(chǔ)的詞條數(shù)量自然也不同。下面進(jìn)行四字詞條(即是每個(gè)詞條四個(gè)字)的存儲(chǔ)容量的對(duì)比
存儲(chǔ)位置 | 存儲(chǔ)詞條數(shù)量 |
MX9016B-24S 語(yǔ)音芯片 | 12 條 |
SPI Flash | 根據(jù) Flash 自身容量決定 |
雖說 MX9016B-24QS 語(yǔ)音芯片內(nèi)部可以存儲(chǔ) 12 條左右的詞條,但是存儲(chǔ)的數(shù)量越多,運(yùn)算的速率越低,識(shí)別的效果也會(huì)相對(duì)的差一點(diǎn)。
詞條的存儲(chǔ)方式主要有兩種:
①一組存儲(chǔ)
在詞條的數(shù)量較少,并且都是同一類型,如都是表示顏色的詞條,那可以選擇放在同一組中,不用進(jìn)行切換,更省時(shí)間。
②分組存儲(chǔ)
若是詞條的數(shù)量多,并且分類不一樣,那可以選擇分組存儲(chǔ),例如現(xiàn)在有三組不同類型的詞條,分別是故事類,古詩(shī)類以及音樂類
故事類 | 古詩(shī)類 | 音樂類 |
拔苗助長(zhǎng) | 望天門山 | 愛我中華 |
后羿射日 | 游山西村 | 光輝歲月 |
亡羊補(bǔ)牢 | 使至塞上 | 好久不見 |
守株待兔 | 過零丁洋 | 心如刀割 |
將詞條分組存儲(chǔ),待需要進(jìn)行古詩(shī)類詞條時(shí),則需先進(jìn)入古詩(shī)類詞組,那么我們需要一個(gè)入口。
詞條的識(shí)別過程實(shí)際就是波形的識(shí)別。實(shí)際上,聲音會(huì)產(chǎn)生波形,可見如下聲音波形圖。無論是人聲,還是風(fēng)扇的聲音,都有波形,但是不同的人說同一句話,聲音的波形都會(huì)有一點(diǎn)點(diǎn)的差別,就算是同一個(gè)人說同一句話,聲音的波形也會(huì)有差別,因?yàn)橐粽{(diào),語(yǔ)速等等都可能發(fā)生細(xì)小的變化,從而影響聲音波形。
因此,在設(shè)計(jì)的過程中,會(huì)設(shè)置一個(gè)門檻,若輸入語(yǔ)音的波形與存儲(chǔ)好的詞條波形相似度高于這個(gè)門檻,則識(shí)別成功。而這個(gè)門檻的高低可以改動(dòng)的(用戶無法更改),門檻調(diào)高了,即相似度要更高,會(huì)更難識(shí)別,識(shí)別率降低;若門檻調(diào)低了,更容易識(shí)別,識(shí)別率增加,但是這也帶來了一個(gè)問題-----誤識(shí)別。
在吵雜的環(huán)境中,多種聲音的波形疊加在一起,剛好與存儲(chǔ)中的某一個(gè)詞條的波形相似度超過門檻值,那么就會(huì)認(rèn)為是存儲(chǔ)中的詞條,從而語(yǔ)音識(shí)別成功,這就引起了誤識(shí)別,若設(shè)置的門檻越低,誤識(shí)別率就越高。
所以說,識(shí)別率和誤識(shí)別率是一致的,識(shí)別率升高,誤識(shí)別率也會(huì)升高,這就需要根據(jù)場(chǎng)合,根據(jù)需求來設(shè)計(jì)識(shí)別率。當(dāng)然,減低誤識(shí)別率是有辦法的,如在不需要識(shí)別的時(shí)候,讓模塊處于休眠狀態(tài),既可以省電,又可以降低誤識(shí)別率。
識(shí)別率,除了與識(shí)別的門檻有關(guān),還與詞條的長(zhǎng)短等有關(guān),其關(guān)系見表 6。
詞條與識(shí)別效果表
詞條 | 識(shí)別效果 |
開 | 太短了,不好識(shí)別 |
開燈 | 識(shí)別效果一般 |
關(guān)燈 | 與其他詞條相似,識(shí)別效果一般 |
小智,開燈 | 長(zhǎng)度適中、相似度低,識(shí)別效果佳 |
我困了,請(qǐng)關(guān)燈 | 長(zhǎng)度適中、相似度低,識(shí)別效果佳 |
因此,在更換詞條時(shí),應(yīng)考慮詞條的長(zhǎng)度,各個(gè)詞條間的相識(shí)度,盡量做到長(zhǎng)度適中、相似度低。
由于頁(yè)面限制,完整內(nèi)容請(qǐng)點(diǎn)擊文章右上下載按鈕下載文件查看……
聯(lián)系人:李曙光
手 機(jī):17266260250
郵 箱:Lur@yxin18.com
公 司:廣州悅欣電子科技有限公司
地 址:廣州市花都區(qū)商業(yè)大道334號(hào)