Mis on kõne tuvastamine?

Teie hääle kasutamine sisendmeetodina

Kõnetuvastus on tehnoloogia, mis võimaldab suulist sisendit süsteemidesse. Räägite oma arvuti, telefoni või seadmega ja mõne toimingu käivitamiseks kasutab see seda, mida te ütlesite sisendina. Seda tehnoloogiat kasutatakse muude sisendmeetodite asendamiseks, näiteks kirjutades, klõpsates või muul viisil valides. See on vahend, mis muudab seadmete ja tarkvara kasutajasõbralikumaks ja suurendab tootlikkust.

Robootika vallas on palju rakendusi ja valdkondi, kus kasutatakse kõnetuvastust, sealhulgas sõjaväeteenistust, abivajajatena (kujutlege inimesele, kellel on viletsus või käte ega sõrmedeta käsi), meditsiinis, robootika vallas jne. peaaegu kõigile puutub kõne tuvastamine selle levimise tõttu levinumaid seadmeid, nagu arvutid ja mobiiltelefonid.

Teatavad nutitelefonid muudavad kõnetuvastuse huvitavaks. IPhone ja Android-seadmed näitavad seda. Nende kaudu saate algatada kontaktile helistamise, saades lihtsalt hääljuhiseid, nagu näiteks "Call office". Samuti võidakse käituda ka teisi käske, näiteks "Bluetoothi ​​sisselülitamine".

Probleemid kõne tuvastamisega

Rääkimise tunnustamist oma versioonina, mida nimetatakse teksti kõneks (STT), on ka pikka aega kasutatud suuliste tekstide tõlkimiseks tekstis. "Sa räägid, seda tüüpi", nagu ViaVoice ütleks oma kastis. Kuid STT-l on üks probleem, nagu me seda teame. Enam kui kümme aastat tagasi proovisin ViaVoice't ja see ei kestis minu arvuti nädalas. Miks? See oli äärmiselt ebatäpne ja lõpuks kulutasin rohkem aega ja energiat rääkides ja parandades kui kirjutades kõike. ViaVoice on tööstuses üks parimaid, nii et kujutlege ülejäänud. Tehnoloogia on küpsenud ja paranenud, kuid sõnavabadus ikkagi paneb inimesi küsimusi esitama. Üks selle peamistest raskustest on inimeste suured erinevused sõnade väljendamisel.

Kõigis keeltes ei tohiks kõnetuvastust pidada ning sageli ei toeta neid ka inglise keelt. Selle tulemusel toimib enamik seadmeid, mis käitavad kõnetuvastustarkvara, mõistlikult ainult inglise keeles.

Riistvara nõuete komplekt muudab teatud juhtudel kõnetuvastus keerukaks. Teil on vaja mikrofoni, mis on piisavalt intelligentne, et filtreerida taustamüra, kuid samal ajal piisavalt võimsalt, et loomulikult häält võtta.

Taustmüra rääkimine võib põhjustada kogu süsteemi ebaõnnestumise. Selle tulemusena kõne tuvastamine paljudel juhtudel ebaõnnestub mürast, mis kasutajakontrollist välja jääb.

Kõne tuvastamine osutub paremaks kui uute telefonide ja kommunikatsioonitehnoloogiate, näiteks VoIP, sisendmeetodiks kui massi sisestamiseks kasutatavaks tööriistaribaks.

Kõnetuvastuse rakendused

Tehnoloogia on populaarne paljudes valdkondades ja on olnud edukas järgmistes valdkondades:

- Seadme juhtimine. Just öeldes "OK Google" Android-telefonile käivitub süsteem, mis kõik on teie häälkäskluste kõrv.

- auto Bluetooth-süsteemid. Paljud autod on varustatud süsteemiga, mis ühendab oma raadioseadme mehhanismi teie nutitelefoni Bluetoothi ​​kaudu. Seejärel saate helistada ja kõnesid vastu võtta, puutumata oma nutitelefoni ja isegi helistada numbritega, öeldes neid lihtsalt.

- Häältõlke transkriptsioon. Valdkondades, kus inimesed peavad palju kirjutama, laseb mõni intelligentne tarkvara oma kõneldavat sõna ja kirjutab tekstis. See kehtib mõnes tekstitöötlusprogrammis. Voice transkriptsioon toimib ka visuaalse kõnepostiga .