Жасанды зерде көзілдірігі камераны пайдаланбай-ақ адамның не дегенін ерін қимылынан аңғарады (видео)
Жасанды зерде көзілдірігі камераны пайдаланбай-ақ адамның не дегенін ерін қимылынан аңғарады (видео)
2 жыл бұрын 1223 Материалды көшіріп басқан жағдайда islam.kz порталына сілтеме берілуі міндетті. Кескін: Ruidong Zhang et al

Инженерлер минисонар (сонар) сияқты жұмыс істейтін бет қимылдарына негізделген сөйлеуді (сөзді) тану жүйесін жасады. Саңыраулар мен мылқауларға көмегі көп бұл құрылғыны Германияда өткен халықаралық CHI конференциясында жұртшылық назарына ұсынылды. Бұл жайында islam.kz порталы ruidongzhang.com ақпарат көзіне сілтеме жасай отырып мәлім етеді. Корнел университетінің ғалымдары дыбыссыз сөйлеген адамның сөзін тану үшін EchoSpeech интерфейсін әзірледі, ол ерін мен ауыз қозғалысына негізделген 31 дауыссыз пәрменді ұдайы тану үшін акустикалық қабылдау мен жасанды зерде мүмкіндіктерін пайдаланады. Ақпаратты өңдеу процесі өз смартфоныңызда жүзеге асырылады, осылайша деректердің құпиялылығын қамтамасыз етеді, яғни, сырт көзден жасырады, бөгде біреулердің мәліметті оқуына жол бермейді. EchoSpeech көзілдірігі қарындаштың ұшындағы өшіргіштен кішірек және камераны пайдаланбайтын жұп микрофондармен және динамиктермен жабдықталған. Құрылғы бет бұлшықеттері мен ауыздың динамикасындағы өзгерістерді көрсететін акустикалық толқындарды жібереді және қабылдайды. Терең оқыту алгоритмі осы жаңғырық профильдерін нақты уақыт режимінде шамамен 95% дәлдікпен талдай алады. Алынған деректер Bluetooth арқылы нақты уақыт режимінде смартфонға беріледі, құрылғыда жергілікті түрде өңделеді және сақталады. Әзірлеушілер EchoSpeech белгілі бір пайдаланушыны оқытуға бірнеше минут кететінін алға тартып отыр. Сөйлей алмайтын адамдар үшін бұл дыбыссыз сөйлеу технологиясы дауыс синтезаторы болуы мүмкін. Яғни, оларға тілдесуге мүмкін беретін технология. Аталмыш технологияның осы тараптағы ұқсас, өзге жүйелерден айырмашлыығы мен артықшылығына тоқсалсақ, дыбыссыз, яғни, мылқау сөзді тану жүйелірінің дені командаларының жиынтығы шектеулі келеді, мәселен, сөйлеуші адам камераға қарап отыруы керек және құрылғыны өзімен бірге алып жүруі тиіс, т.б. Мұндай технологияның осындай қолайсыздығынан бұрын құпиялықты бұзады, яғни, мылқаудың не деп отырғанын үшінші тұлғаның байқап қою қатері жоғары. Қазіргі түрінде EchoSpeech шуы көп мейрамхана немесе тыныштықтың сақталуы талап етілетін кітапхана сияқты сөйлеуге ыңғайсыз немесе орынсыз жерлерде смартфон арқылы басқалармен байланысу үшін пайдаланылуы мүмкін. Дыбыссыз сөйлеу интерфейсін стилуспен және CAD сияқты дизайн бағдарламалық құралымен жұптастыруға болады, бұл жайт өз кезегінде пернетақта мен тінтуірге қажеттілікті болдырмайды.

 

0 пікір
Мұрағат